tiistai 20. lokakuuta 2015

Avoimen datan lyhyt sanakirja

“ABCD...Täähän kuulostaa ihan hevibändiltä … avoin data for dummies, vai mummies?”

Kulttuuriaineistoja avautuu Suomessa nyt enemmän kuin koskaan ennen. Puhe avoimesta datasta on hiipinyt kulttuuriorganisaatioiden kahvipöytiin ja kokoushuoneisiin. Termi on tuttu monelle, mutta siihen liittyvät käsitteet ja sisällöt voivat vielä olla vieraita. Innostuksen keskellä moni ei pysy perässä kahvipöytäkeskusteluissa. Mikä ihmeen API ja rajapinta? Sähköiset museopalvelut eli SÄMPLE-hanke haluaa auttaa avoimen datan aloittelijoita tällä lyhyellä sanakirjalla, jotta keskusteluun mukaan pääseminen olisi helpompaa!

Tiedätkö, mistä puhutaan?
Avoimeen tiedonjakoon kuuluu myös käsitteiden ja niiden merkitysten selittäminen ja jakaminen kaikille halukkaille. Suomessa järjestetään kiitettävästi erilaisia avoimen tiedon infotilaisuuksia ja aiheeseen liittyviä koulutuksia, joihin osallistumalla pääsee nopeasti kärryille siitä mistä tässä kaikessa kohinassa on oikein kyse. Avuksi akuuteimpaan tiedonjanoon olemme koonneet tähän blogipostaukseen keskeisiä avoimeen dataan liittyviä käsitteitä ja termejä, joilla pääset käsiksi ilmiöön alta aikayksikön.

Avoin data, mitä se on?
Moni piirtää mielessään yhtäläisyysmerkin avoimen datan ja avoimen tiedon välille. Asia ei kuitenkaan ole näin suoraviivainen. Avoin tieto on sellaista, joka on ihmisten saavutettavissa esimerkiksi verkossa tai vaikka taloyhtiön ilmoitustaululla. Kriittinen ero on tässä tiedon käytettävyys. Avoin data on paitsi kaikkien saavutettavissa, myös kaikkien käytettävissä.

Käytännössä avoin data voi olla kulttuuriorganisaatioiden tapauksessa esimerkiksi kuvia ja niiden metatietoja. Erityisesti vanhat valokuvat ja niihin liittyvät tiedot ovat olleet käyttäjien keskuudessa suosittuja, ja suurin osa Suomessa avatusta kulttuuridatasta asettuukin juuri tähän kategoriaan. SÄMPLE-hankeeseen osallistuvista museoista esimerkiksi Vapriikki avasi keväällä 2015 valokuvia 1950-luvun Tampereesta. Kuvien joukossa on paitsi kaupunki- ja henkilökuvia, myös kuvia museoesineistä. Valokuvien lisäksi on kuitenkin paljon muuta mielenkiintoista tietoa, jota museot voivat tarjota. Työväenmuseo Werstas on avannut SÄMPLE-hankkeeseen liittyen erilaisten työkoneiden ääniä ja Postimuseo tietoa suomalaisista postimerkeistä.

Avoimen datan lyhyt ABC


API eli Application Programming Interface = Ohjelmointirajapinta, joka mahdollistaa eri ohjelmien keskustelemisen keskenään. Ohjelmat voivat esimerkiksi tehdä pyyntöjä tai vaihtaa tietoja.

Avoin data = Koneellisesti käsiteltävässä muodossa olevaa tietoa, joka on jokaisen käytettävissä maksutta ja luvallisesti.


CC eli Creative Commons = Lisenssiperhe, johon kuuluu eri tavoin rajattuja ja määriteltyjä käyttölupia kuten esim. CC BY eli Creative Commons Nimeä, jolla iso osa museoiden avoimista kuva-aineistoista on julkaistu. Tietoa suomeksi löydät osoitteesta http://creativecommons.fi/lisenssit/.

Haravointi (Data harvesting) = Eri tietokannoissa olevaa erimuotoista tietoa kerätään automaattisesti (joko ajastetusti tai eräajona) yhteen tietokantaan, jossa tieto näytetään yhdenmukaisesti hakijalle.

Lisenssi = Käyttölupa eli käyttöehtoihin perustuva ei-yksinomainen oikeus käyttää aineistoa.

Mappaus = Datan mappaus eli kartoitus on prosessi jossa kahden eri datamallin yksikköjen, esimerkiksi museon kokoelmahallintajärjestelmän ja FINNA:n yksittäisten kenttien, välille luodaan vastaavuuksia

Metadata eli -tieto = Tarjotun datan sisältöä tai rakennetta kuvaileva tieto, esimerkiksi valokuvien taustatiedot sekä tiedot siitä, millaisella kameralla/skannerilla digitaalinen kuvatiedosto on luotu.

Rajapinta = Sovittu käytäntö tai liittymäpinta, jonka kautta on mahdollista siirtää tietoja laitteiden tai sovellusten välillä tai sovelluksen ja käyttäjän välillä. Esimerkiksi tietojen haravointia varten täytyy olla rajapinta.

Miksi avata?
Avoimeen dataan liittyy paljon positiivisia vaikutuksia. Perusteluja kokoelmien avaamiselle museon käyttäjien hyödynnettäväksi on paljon. Avoimista aineistoista on hyötyä paitsi museon käyttäjille myös museoille itselleen. Avatut aineistot tulevat käyttöön, ja kiinnostavat aineistot voivat lisätä museon kävijämääriä kun tietoisuus niistä kasvaa.

Käyttäjiä voidaan pyytää lisäämään tai korjaamaan kokoelmissa jo olevaa tietoa, jolloin tiedon määrä kasvaa ja sen laatu paranee. Avoimet aineistot ovat täynnä mahdollisuuksia uusille innovaatioille ja sovelluksille. SÄMPLE-hankkeen museot avasivat aineistojaan juuri näistä syistä. Yhteistyönä hankkeen piirissä toteutettuna datan avaaminen ja siihen liittyvä selvitystyö kuormittavat yksittäisen museon resursseja vähemmän kuin jos jokainen organisaatio tekisi saman työn itsenäisesti. Hankkeessa kaikki museot saavat avoimen datan hyödyn. Tällä hetkellä avoimen datan positiivisia ja negatiivisia puolia kartoittava tutkimustieto on lähinnä ulkomaista, sillä kotimaassa avoimesta datasta on kokemusta vielä suhteellisen vähän. Tämän vuoksi SÄMPLE-hankkeen blogisarjan monissa kirjoituksissa pohditaankin avoimeen dataan liittyviä haasteita.

Susanna Haavisto


Lähteet:
https://www.avoindata.fi/fi/content/sanasto
http://www.tsk.fi/tepa/netmot.exe?UI=figr&height=155
http://www.hri.fi/fi/mita-on-avoin-data/
http://opendefinition.org/od/1.1/fi/
http://apisuomi.fi/glossary-4/
https://github.com/okffi/open-api-definition/blob/master/fi/avoin-rajapinta.md
http://en.wikipedia.org/wiki/Data_mapping
http://mw2013.museumsandtheweb.com/paper/open-culture-data-opening-glam-data-bottom-up/
http://39e9e1329gluhgh5y1kxop71.wpengine.netdna-cdn.com/wp-content/uploads/2012/03/DataHarvesting.pdf


Ei kommentteja:

Lähetä kommentti