Luonnonvara- ja ympäristötutkimuksen yhteenliittymä yläbanneri lynet

Sanna Marttinen: Laitetaan data poikimaan uutta tietoa

RSS
20.11.2015 Sanna Marttinen
SannaMarttinen_lynet_172px
Sanna Marttinen on Lynetin pääsihteeri. Hän koordinoi verkoston toimintaa ja yhdistää osaajia.

Suomen tutkimuslaitoksissa olevat tietoaineistot ovat valtava aarreaitta niin tutkijoille kuin muille tiedon hyödyntäjille. Miten aineistot saadaan poikimaan poikkitieteellistä uutta tietoa?

Tietoaineistoja ovat muun muassa moninaisiin tarkoituksiin kerätty data ja sen pohjalta vaikkapa julkaisuja varten jalostettu tieto. Dataa tuotetaan tutkimuksessa esimerkiksi koetoimintaan, inventointeihin tai seurantoihin perustuen. Sitä mitataan, kartoitetaan, kuvataan vaikkapa satelliiteilla tai hankitaan haastatteluiden avulla. Myös kansalaiset voidaan osallistaa tiedon keruuseen.

Tutkimushankkeissa ja kartoituksissa tuotetaan kertaluontoista dataa, seurannoissa aikasarjoja. Suomessa tehdään satoja EU:n velvoittamia seurantatutkimuksia, jotka joka vuosi kerryttävät tietojamme luonnonvaroista ja ympäristöstä. Myös ruuantuotannon- ja metsäntutkimuksen dataa on kerätty vuosikymmenten pituisina aikasarjoina, jotka jo sellaisenaan ovat kansainvälisestikin ainutlaatuisia. Mitä voisimmekaan löytää yhdistämällä tietoa vaikkapa kansallisiin terveys- ja hyvinvointidatoihin? Tai miksei saman tien haeta vastaavaa dataa merten takaa ja tehdä kansainvälistä vertailututkimusta?

Vaikka monia aineistoja on avattu julkisesti saataville, paljon dataa on vielä piilossa toimistojen nurkissa ja tietokoneiden kovalevyillä. Sieltä ne pitää saada tietojärjestelmiin, mistä ne ovat löydettävissä ja käytettävissä. Tutkimusorganisaation on tarjottava julkaisukanava, mutta tutkijan vastuulla on tuoda sinne aineistonsa. Tai sanotaanko mieluummin oikeus, sillä datan jakaminen on mahdollisuus markkinoida omaa työtä ja osaamista. Parantamisen varaa on myös aineistojen esilletuonnissa. Organisaation nettisivuja kannattaa välillä vilkaista ulkopuolisen silmin – montako klikkausta tarvitaan datan äärelle pääsyyn?

Kaikkea dataa ei tarvitse, eikä voikaan avata esimerkiksi tietosuojan vuoksi. Tällöin aineiston olemassaolon voi tehdä julkiseksi kuvaamalla metatietojärjestelmään millainen aineisto on olemassa ja missä se sijaitsee. Tällöin aineistosta kiinnostunut taho voi ottaa yhteyttä tutkijaan saadakseen lisätietoa – uuden yhteistutkimuksen siemen on kylvetty. Monen aineiston osalta on varmasti hedelmällisempää saattaa yhteen tutkijat, eikä pelkästään aineistot. Aineisto saattaa sisältää paljon taustaoletuksia, jolloin tarvitaan tutkija aineiston takaa varmistamaan, että dataa käytetään oikein.

Kun aineistot ja tutkijat on saatettu yhteen, pitää aineistot vielä saada teknisesti keskustelemaan keskenään. Aineistoja sisältävien ohjelmien ei tarvitse olla samanlaisia, vaan tietojen vaihto erilaisten ohjelmien kesken voidaan usein toteuttaa rakentamalla niihin yhteensopivia rajapintoja. Näin kustannuksetkin jäävät varsin kohtuullisiksi.

Tiedon arvo syntyy sen hyödyntämisestä. Paljon on vielä tehtävää, että tietoaineistojen käyttö tutkimuslaitosten välillä on sujuvaa. Näitäkin asioita kehitämme yhdessä Lynet-verkostossa.

Sanna Marttinen

Puh. 0295 326 356, etunimi.sukunimi(at)luke.fi

Blogi on julkaistu aiemmin www.luke.fi-verkkosivustolla.

Blogikirjoittajien näkemykset ovat heidän omiaan, eivätkä ne edusta Lynetin virallista kantaa.