Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Linkitetty avoin data
Petri Tonteri, 26.1.2012, [email protected]
anasararojas, Porridge monster, https://secure.flickr.com/photos/anasararojas/5398464110/
Semanttinen web?
● semanttinen web ≈ tiedon verkko (Web of Data)● dokumenttien jakamisesta datan jakamiseen● vähennetään monimerkityksisyyttä● informaatio koneiden ymmärtämässä muodossa
Millä keinoin?
Linkitetty (avoin) data
Garrett Crawford, Chain Link Net, https://secure.flickr.com/photos/gc_photography/5928453556/
osa Webin evoluutiota...
Linkitetyt palvelimet...
Yngvar, Arpanet 1974 https://fi.wikipedia.org/wiki/Tiedosto:Arpanet_1974.svg
Linkitetyt dokumentit...
Linkitetty (avoin) data
● linkitetyt tietoelementit● määritellään tietoelementtejä ontologioiden avulla ● periaatteet:
1. identifioidaan asioita URIen avulla (Uniform Resource Identifier), käytännössä esim. Uniform Resource Locator (URL) -osoittein, esim. http://www.kirjasampo.fi/
2. käytetään HTTP-muotoista URIa helpomman käytettävyyden vuoksi
3. tarjotaan käyttökelpoista standardimuotoista informaatiota (esim. RDF jne)
4. linkitetään dataa muualle webiin. ● avoimuus = linkitetty data lisensointi avoimesti
hyödynnettäväksi
Heath, Bizer (2011). Linked Data: Evolving the Web into a Global Data Space. http://linkeddatabook.com/editions/1.0/
Ontologiat
● termit ovat koneluettavassa muodossa● YSO: ei hierarkialtaan täydellinen, mutta korjattavissa ja
täydennettävissä● sisältöjen kuvailuun● hakutuloksiin esiin eri näkökulmat, esim.
○ Nokia: paikkakunta >< yritys jne○ sokeritauti ≈ diabetes
YSO : jalkineet
kritiikkiä
● Internetin laajuus: automatisoitujen päättelyjärjestelmien on hanskattava valtavaa määrää sisältöjä
● epätäsmälliset käsitteet, kuten nuori ja kookas● täsmälliset käsitteet, joilla on epävarmat arvot, esimerkiksi
potilaan oireet voivat sopia moniin erilaisiin diagnooseihin● ristiriitaisuudet, joita väistämättä syntyy ontologioita
kehitettäessä ja kun eri lähteistä tulevia ontologioita yhdistellään
● inhimillinen käyttäytyminen ja henkilökohtaiset mieltymykset
binux, Pick One https://secure.flickr.com/photos/binux/290179539/
hyötyjä
● informaation helpompi1. löydettävyys2. jaettavuus3. yhdisteltävyys muuhun informaatioon
● koneiden ymmärtämässä muodossa● W3C Library Linked Data Incubator Groupin raportti
linkitetystä datasta
Hyödyt loppukäyttäjille
● parempaa löydettävyyttä ja datan käytettävyyttä● helpommin linkityksiä kirjastopalvelujen ja ei-
kirjastopalvelujen välille
Hyödyt organisaatioille
● linkitettyä dataa tuotetaan hajautetusti● teknologisilta ratkaisuiltaan perustuu yleisiin standardeihin
○ >> yhteentoimivuus■ >> helpottaa kilpailuttamista ja osaajien rekrytointia
jne.● läsnäolo webissä lisääntyy
Hyödyt informaatioammattilaisille kuten kirjastolaisille ja arkistolaisille
● avoin, globaali, jaettu datavaranto● web-lähtöiset teknologiat helpottavat sisällönkuvailun
hyödynnettävyyttä● yleisesti käytössä olevien identifikaattorien käyttö säilyttää
merkityksensä helpommin formaattimuutosten yli
Hyödyt kehittäjille ja järjestelmäntoimittajille
● linkitetyn datan menetelmät tukevat datan hakemista ja uudelleen hyödyntämistä
○ esim. tunnetut ja standardit web-protokollat kuten Hypertext Transport Protocol (HTTP)
● irti kirjastospesifeistä dataformaateista● linkitettyä dataa tukevat järjestelmäntoimittajat voivat tarjota
tuotteitaan myös kirjastomaailman ulkopuolelle
Miten kirjastot tähän istuu?
1. Nykytilanne2. Semanttisen webin projekteista kirjastoissa3. Mitä seuraavaksi?
Mikä tökkii?
1. kirjastodataa ei ole perusteellisesti avattu muulle webille2. kirjastostandardit on tarkoitettu vain kirjastoyhteisölle (esim.
MARC, Z39.50)3. kirjastoyhteisöllä ja semanttisen webin yhteisöllä on eri
terminologia4. kirjastoteknologiset muutokset riippuvat
järjestelmäntoimittajista.
Ongelmia alias esteitä alias hidasteita alias haasteita...
● käsitteellisesti hankala asia● paljolti asiantuntijoiden, tutkijoiden pelikenttää● tarpeita metadataperustan muutokselle● käytännön esimerkkejä vähän● kirjastojärjestelmillä ei ole tukea semanttiselle webille, esim.
RDF-tietomallille● ontologioiden ongelmat.
Esimerkkejä kirjastoista
British Library Gate Shadow, C. G. P. Grey, 2005
maxf
Mitä seuraavaksi?
● potentiaalisten datajoukkojen identifiointia (high priority, low effort)
● linkitetty avoin data agendoihin● mukaan semanttisen webin standardointityöhön● kirjastostandardien yhteensopivuus semanttisen webin
standardien kanssa
Summa summarumia
● linkitetyn avoimen datan web on dynaaminen● lupauksia mm. moniselitteisyyden väheneminen, tarkemmat
hakutulokset● yksi vastaus tiedonhakuvaivoihin● standardointia lisää ja ulos kirjastoympyröistä: mahdollisuus
kirjastoille ja järjestelmävalmistajille● osaamishaaste● yhteisluetteloteema● järjestelmäriippumattomuutta, yhteentoimivuutta
Kiitos!
Lähteitä
● Anderson, Janna; Rainie, Lee (2010). The Fate of the Semantic Web. Pew Internet. http://www.pewinternet.org/Reports/2010/Semantic-Web/Overview.aspx [Viitattu 22.1.2012]
● Autio-Tuuli, Marjatta (2009). RDA - uusi luettelointistandardi : käyttäjän tarpeet kuvailutietojen lähtökohdaksi. Aikakausjulkaisussa: Tietolinja, nro 1. http://urn.fi/URN:NBN:fi-fe200905201529 [Viitattu 22.1.2012]
● Autio-Tuuli, Marjatta; Seppälä, Marja-Liisa (2010). Kirjaston vastaus informaatioympäristön muutokseen : Semanttinen web, ontologiat ja standardit osana kirjastojen tiedonhallinnan infrastruktuuria. Aikakausjulkaisussa: Tietolinja, nro 3. http://urn.fi/URN:NBN:fi-fe201012143106 [Viitattu 22.1.2012]
● Berners-Lee, Tim (2006). Linked Data. http://www.w3.org/DesignIssues/LinkedData.html [Viitattu 22.1.2012]● British Library (2010). 2020 Vision. http://www.bl.uk/2020vision [Viitattu 22.1.2012]● Byrne, Gillian; Goddard, Lisa (2010). The Strongest Link: Libraries and Linked Data. Aikakausjulkaisussa: D-Lib
Magazine, vol. 16, nro 11/12. http://dlib.org/dlib/november10/byrne/11byrne.html [Viitattu 22.1.2012]● Establishing the Connection: Creating a Linked Data Version of the BNB (2011). http://www.slideshare.
net/nw13/establishing-the-connection-creating-a-linked-data-version-of-the-bnb [Viitattu 22.1.2012]● Digitorstai 22.9.2011. http://bambuser.com/channel/kirjastokaista1/broadcast/1989738 [Viitattu 22.1.2012]● Europeana Connect. http://www.europeanaconnect.eu/index.php [Viitattu 22.1.2012]● Final post. COMET (Cambridge Open METadata) project blog. http://cul-comet.blogspot.com/2011/07/final-post.html
[Viitattu 22.1.2012]
http://www.pewinternet.org/Reports/2010/Semantic-Web/Overview.aspxhttp://www.pewinternet.org/Reports/2010/Semantic-Web/Overview.aspxhttp://urn.fi/URN:NBN:fi-fe200905201529http://urn.fi/URN:NBN:fi-fe201012143106http://www.w3.org/DesignIssues/LinkedData.htmlhttp://www.bl.uk/2020visionhttp://dlib.org/dlib/november10/byrne/11byrne.htmlhttp://www.slideshare.net/nw13/establishing-the-connection-creating-a-linked-data-version-of-the-bnbhttp://www.slideshare.net/nw13/establishing-the-connection-creating-a-linked-data-version-of-the-bnbhttp://bambuser.com/channel/kirjastokaista1/broadcast/1989738http://www.europeanaconnect.eu/index.phphttp://cul-comet.blogspot.com/2011/07/final-post.html
● FRAD = Functional Requirements for Authority Data.● FRSAD = Functional Requirements for Subject Authority Data.● Functional Requirements for Authority Data. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?
title=Functional_Requirements_for_Authority_Data&oldid=451095480 [Viitattu 22.1.2012]● Functional Requirements for Subject Authority Data. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?
title=FRSAD&oldid=451095511 [Viitattu 22.1.2012]● Gruber, Tom (1992). What is an Ontology? http://www-ksl.stanford.edu/kst/what-is-an-ontology.html [Viitattu 22.1.2012]● Heath, Tom; Bizer, Christian (2011). Linked Data : Evolving the Web into a Global Data Space. http://linkeddatabook.
com/editions/1.0/ [Viitattu 22.1.2012]● Heinemann, Laila (2010). Kirjastodataa raakana? : näkökulmia bibliografisen datan avaamiseen. Aikakausjulkaisussa:
Tietolinja, nro 2. http://urn.fi/URN:NBN:fi-fe201012143105 [Viitattu 22.1.2012]● Kirjasampo. http://www.kirjasampo.fi/ [Viitattu 22.1.2012]● Linked Data. http://www.w3.org/standards/semanticweb/data [Viitattu 22.1.2012]● Linked Data : Connect Distributed Data across the Web. Frequently Asked Questions. http://linkeddata.org/faq
[Viitattu 22.1.2012]● Linked data. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?title=Linked_Data&oldid=449014322
[Viitattu 22.1.2012]● LLD = Library Linked Data Incubator Group.● LLD XG Final Report. Library Linked Data Incubator Group, W3C. http://www.w3.org/2005/Incubator/lld/XGR-lld-
20111025/ [Viitattu 22.1.2012]● Malmsten, Martin (2008). Making a Library Catalogue Part of the Semantic Web. International Conference on Dublin
Core and Metadata Applications. Proceedings. http://dcpapers.dublincore.org/index.php/pubs/article/view/927 [Viitattu 22.1.2012]
http://en.wikipedia.org/w/index.php?title=Functional_Requirements_for_Authority_Data&oldid=451095480http://en.wikipedia.org/w/index.php?title=Functional_Requirements_for_Authority_Data&oldid=451095480http://en.wikipedia.org/w/index.php?title=FRSAD&oldid=451095511http://en.wikipedia.org/w/index.php?title=FRSAD&oldid=451095511http://www-ksl.stanford.edu/kst/what-is-an-ontology.htmlhttp://linkeddatabook.com/editions/1.0/http://linkeddatabook.com/editions/1.0/http://urn.fi/URN:NBN:fi-fe201012143105http://www.kirjasampo.fi/http://www.w3.org/standards/semanticweb/datahttp://linkeddata.org/faqhttp://en.wikipedia.org/w/index.php?title=Linked_Data&oldid=449014322http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/http://dcpapers.dublincore.org/index.php/pubs/article/view/927http://dcpapers.dublincore.org/index.php/pubs/article/view/927
● Miller, Eric (1998). An Introduction to the Resource Description Framework . Aikakausjulkaisussa: D-Lib Magazine, may 1998. http://www.dlib.org/dlib/may98/miller/05miller.html [Viitattu 22.1.2012]
● Ontologia (tietojenkäsittelytiede). Wikipedia-artikkeli. http://fi.wikipedia.org/w/index.php?title=Ontologia_(tietojenk%C3%A4sittelytiede)&oldid=10697296 [Viitattu 22.1.2012]
● Ontology. http://semanticweb.org/wiki/Ontology [Viitattu 22.1.2012]● RDA = Resource Description and Access.● RDF = Resource Description Framework.● Resource Description and Access. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?
title=Resource_Description_and_Access&oldid=450956049 [Viitattu 22.1.2012]● Resource Description Framework. https://secure.wikimedia.org/wikipedia/fi/w/index.php?title=RDF&oldid=9599449
[Viitattu 22.1.2012]● Semantic Web. W3C. http://www.w3.org/standards/semanticweb/ [Viitattu 22.1.2012]● Semantic Web. Wikipedia. http://en.wikipedia.org/w/index.php?title=Semantic_Web&oldid=449643399
[Viitattu 22.1.2012]● Stoll, Clifford (1995). The Internet? Bah! : Hype alert: Why cyberspace isn't, and will never be, nirvana. http://www.
thedailybeast.com/newsweek/1995/02/26/the-internet-bah.html [Viitattu 22.1.2012]● Styles, Rob; Ayers, Danny; Shabir, Nadeem (2008). Semantic MARC, MARC21 and the Semantic Web. http://events.
linkeddata.org/ldow2008/papers/02-styles-ayers-semantic-marc.pdf [Viitattu 22.1.2012]● Tonteri semanttisesta webistä. http://sorvipenkki.wordpress.com/tag/semanttinen-web/ [Viitattu 22.1.2012]
http://www.dlib.org/dlib/may98/miller/05miller.htmlhttp://fi.wikipedia.org/w/index.php?title=Ontologia_(tietojenk%C3%A4sittelytiede)&oldid=10697296http://fi.wikipedia.org/w/index.php?title=Ontologia_(tietojenk%C3%A4sittelytiede)&oldid=10697296http://semanticweb.org/wiki/Ontologyhttp://en.wikipedia.org/w/index.php?title=Resource_Description_and_Access&oldid=450956049http://en.wikipedia.org/w/index.php?title=Resource_Description_and_Access&oldid=450956049https://secure.wikimedia.org/wikipedia/fi/w/index.php?title=RDF&oldid=9599449http://www.w3.org/standards/semanticweb/http://en.wikipedia.org/w/index.php?title=Semantic_Web&oldid=449643399http://www.thedailybeast.com/newsweek/1995/02/26/the-internet-bah.htmlhttp://www.thedailybeast.com/newsweek/1995/02/26/the-internet-bah.htmlhttp://events.linkeddata.org/ldow2008/papers/02-styles-ayers-semantic-marc.pdfhttp://events.linkeddata.org/ldow2008/papers/02-styles-ayers-semantic-marc.pdfhttp://sorvipenkki.wordpress.com/tag/semanttinen-web/
● Understanding the Semantic Web: Bibliographic Data and Metadata (2010). Aikakausjulkaisussa: Library Technology Reports, vol. 46, nro 1. http://alatechsource.metapress.com/content/g212v1783607/?p=e4abf7498a9c4188a195f66474b1e80f&pi=12 [Viitattu 22.1.2012]
● URI. Wikipedia-artikkeli. https://secure.wikimedia.org/wikipedia/fi/w/index.php?title=URI&oldid=9936126 [Viitattu 22.1.2012]
● URI = Uniform Resource Identifier.● W3C = World Wide Web Consortium.● W3C Library Linked Data Incubator Group. http://www.w3.org/2005/Incubator/lld/ [Viitattu 22.1.2012]● World Wide Web Consortium. Wikipedia-artikkeli. http://fi.wikipedia.org/w/index.php?
title=World_Wide_Web_Consortium&oldid=10525438 [Viitattu 22.1.2012]
http://alatechsource.metapress.com/content/g212v1783607/?p=e4abf7498a9c4188a195f66474b1e80f&pi=12http://alatechsource.metapress.com/content/g212v1783607/?p=e4abf7498a9c4188a195f66474b1e80f&pi=12https://secure.wikimedia.org/wikipedia/fi/w/index.php?title=URI&oldid=9936126http://www.w3.org/2005/Incubator/lld/http://fi.wikipedia.org/w/index.php?title=World_Wide_Web_Consortium&oldid=10525438http://fi.wikipedia.org/w/index.php?title=World_Wide_Web_Consortium&oldid=10525438