38
Linkitetty avoin data Petri Tonteri, 26.1.2012, [email protected]

Linkitetty avoin data : 26012012...Linkitetty (avoin) data linkitetyt tietoelementit määritellään tietoelementtejä ontologioiden avulla periaatteet: 1.identifioidaan asioita URIen

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • Linkitetty avoin data

    Petri Tonteri, 26.1.2012, [email protected]

  • anasararojas, Porridge monster, https://secure.flickr.com/photos/anasararojas/5398464110/

  • Semanttinen web?

    ● semanttinen web ≈ tiedon verkko (Web of Data)● dokumenttien jakamisesta datan jakamiseen● vähennetään monimerkityksisyyttä● informaatio koneiden ymmärtämässä muodossa

  • Millä keinoin?

  • Linkitetty (avoin) data

    Garrett Crawford, Chain Link Net, https://secure.flickr.com/photos/gc_photography/5928453556/

  • osa Webin evoluutiota...

  • Linkitetyt palvelimet...

    Yngvar, Arpanet 1974 https://fi.wikipedia.org/wiki/Tiedosto:Arpanet_1974.svg

  • Linkitetyt dokumentit...

  • Linkitetty (avoin) data

    ● linkitetyt tietoelementit● määritellään tietoelementtejä ontologioiden avulla ● periaatteet:

    1. identifioidaan asioita URIen avulla (Uniform Resource Identifier), käytännössä esim. Uniform Resource Locator (URL) -osoittein, esim. http://www.kirjasampo.fi/

    2. käytetään HTTP-muotoista URIa helpomman käytettävyyden vuoksi

    3. tarjotaan käyttökelpoista standardimuotoista informaatiota (esim. RDF jne)

    4. linkitetään dataa muualle webiin. ● avoimuus = linkitetty data lisensointi avoimesti

    hyödynnettäväksi

  • Heath, Bizer (2011). Linked Data: Evolving the Web into a Global Data Space. http://linkeddatabook.com/editions/1.0/

  • Ontologiat

    ● termit ovat koneluettavassa muodossa● YSO: ei hierarkialtaan täydellinen, mutta korjattavissa ja

    täydennettävissä● sisältöjen kuvailuun● hakutuloksiin esiin eri näkökulmat, esim.

    ○ Nokia: paikkakunta >< yritys jne○ sokeritauti ≈ diabetes

  • YSO : jalkineet

  • kritiikkiä

    ● Internetin laajuus: automatisoitujen päättelyjärjestelmien on hanskattava valtavaa määrää sisältöjä

    ● epätäsmälliset käsitteet, kuten nuori ja kookas● täsmälliset käsitteet, joilla on epävarmat arvot, esimerkiksi

    potilaan oireet voivat sopia moniin erilaisiin diagnooseihin● ristiriitaisuudet, joita väistämättä syntyy ontologioita

    kehitettäessä ja kun eri lähteistä tulevia ontologioita yhdistellään

    ● inhimillinen käyttäytyminen ja henkilökohtaiset mieltymykset

  • binux, Pick One https://secure.flickr.com/photos/binux/290179539/

  • hyötyjä

    ● informaation helpompi1. löydettävyys2. jaettavuus3. yhdisteltävyys muuhun informaatioon

    ● koneiden ymmärtämässä muodossa● W3C Library Linked Data Incubator Groupin raportti

    linkitetystä datasta

  • Hyödyt loppukäyttäjille

    ● parempaa löydettävyyttä ja datan käytettävyyttä● helpommin linkityksiä kirjastopalvelujen ja ei-

    kirjastopalvelujen välille

  • Hyödyt organisaatioille

    ● linkitettyä dataa tuotetaan hajautetusti● teknologisilta ratkaisuiltaan perustuu yleisiin standardeihin

    ○ >> yhteentoimivuus■ >> helpottaa kilpailuttamista ja osaajien rekrytointia

    jne.● läsnäolo webissä lisääntyy

  • Hyödyt informaatioammattilaisille kuten kirjastolaisille ja arkistolaisille

    ● avoin, globaali, jaettu datavaranto● web-lähtöiset teknologiat helpottavat sisällönkuvailun

    hyödynnettävyyttä● yleisesti käytössä olevien identifikaattorien käyttö säilyttää

    merkityksensä helpommin formaattimuutosten yli

  • Hyödyt kehittäjille ja järjestelmäntoimittajille

    ● linkitetyn datan menetelmät tukevat datan hakemista ja uudelleen hyödyntämistä

    ○ esim. tunnetut ja standardit web-protokollat kuten Hypertext Transport Protocol (HTTP)

    ● irti kirjastospesifeistä dataformaateista● linkitettyä dataa tukevat järjestelmäntoimittajat voivat tarjota

    tuotteitaan myös kirjastomaailman ulkopuolelle

  • Miten kirjastot tähän istuu?

    1. Nykytilanne2. Semanttisen webin projekteista kirjastoissa3. Mitä seuraavaksi?

  • Mikä tökkii?

    1. kirjastodataa ei ole perusteellisesti avattu muulle webille2. kirjastostandardit on tarkoitettu vain kirjastoyhteisölle (esim.

    MARC, Z39.50)3. kirjastoyhteisöllä ja semanttisen webin yhteisöllä on eri

    terminologia4. kirjastoteknologiset muutokset riippuvat

    järjestelmäntoimittajista.

  • Ongelmia alias esteitä alias hidasteita alias haasteita...

    ● käsitteellisesti hankala asia● paljolti asiantuntijoiden, tutkijoiden pelikenttää● tarpeita metadataperustan muutokselle● käytännön esimerkkejä vähän● kirjastojärjestelmillä ei ole tukea semanttiselle webille, esim.

    RDF-tietomallille● ontologioiden ongelmat.

  • Esimerkkejä kirjastoista

  • British Library Gate Shadow, C. G. P. Grey, 2005

  • maxf

  • Mitä seuraavaksi?

    ● potentiaalisten datajoukkojen identifiointia (high priority, low effort)

    ● linkitetty avoin data agendoihin● mukaan semanttisen webin standardointityöhön● kirjastostandardien yhteensopivuus semanttisen webin

    standardien kanssa

  • Summa summarumia

    ● linkitetyn avoimen datan web on dynaaminen● lupauksia mm. moniselitteisyyden väheneminen, tarkemmat

    hakutulokset● yksi vastaus tiedonhakuvaivoihin● standardointia lisää ja ulos kirjastoympyröistä: mahdollisuus

    kirjastoille ja järjestelmävalmistajille● osaamishaaste● yhteisluetteloteema● järjestelmäriippumattomuutta, yhteentoimivuutta

  • Kiitos!

  • Lähteitä

    ● Anderson, Janna; Rainie, Lee (2010). The Fate of the Semantic Web. Pew Internet. http://www.pewinternet.org/Reports/2010/Semantic-Web/Overview.aspx [Viitattu 22.1.2012]

    ● Autio-Tuuli, Marjatta (2009). RDA - uusi luettelointistandardi : käyttäjän tarpeet kuvailutietojen lähtökohdaksi. Aikakausjulkaisussa: Tietolinja, nro 1. http://urn.fi/URN:NBN:fi-fe200905201529 [Viitattu 22.1.2012]

    ● Autio-Tuuli, Marjatta; Seppälä, Marja-Liisa (2010). Kirjaston vastaus informaatioympäristön muutokseen : Semanttinen web, ontologiat ja standardit osana kirjastojen tiedonhallinnan infrastruktuuria. Aikakausjulkaisussa: Tietolinja, nro 3. http://urn.fi/URN:NBN:fi-fe201012143106 [Viitattu 22.1.2012]

    ● Berners-Lee, Tim (2006). Linked Data. http://www.w3.org/DesignIssues/LinkedData.html [Viitattu 22.1.2012]● British Library (2010). 2020 Vision. http://www.bl.uk/2020vision [Viitattu 22.1.2012]● Byrne, Gillian; Goddard, Lisa (2010). The Strongest Link: Libraries and Linked Data. Aikakausjulkaisussa: D-Lib

    Magazine, vol. 16, nro 11/12. http://dlib.org/dlib/november10/byrne/11byrne.html [Viitattu 22.1.2012]● Establishing the Connection: Creating a Linked Data Version of the BNB (2011). http://www.slideshare.

    net/nw13/establishing-the-connection-creating-a-linked-data-version-of-the-bnb [Viitattu 22.1.2012]● Digitorstai 22.9.2011. http://bambuser.com/channel/kirjastokaista1/broadcast/1989738 [Viitattu 22.1.2012]● Europeana Connect. http://www.europeanaconnect.eu/index.php [Viitattu 22.1.2012]● Final post. COMET (Cambridge Open METadata) project blog. http://cul-comet.blogspot.com/2011/07/final-post.html

    [Viitattu 22.1.2012]

    http://www.pewinternet.org/Reports/2010/Semantic-Web/Overview.aspxhttp://www.pewinternet.org/Reports/2010/Semantic-Web/Overview.aspxhttp://urn.fi/URN:NBN:fi-fe200905201529http://urn.fi/URN:NBN:fi-fe201012143106http://www.w3.org/DesignIssues/LinkedData.htmlhttp://www.bl.uk/2020visionhttp://dlib.org/dlib/november10/byrne/11byrne.htmlhttp://www.slideshare.net/nw13/establishing-the-connection-creating-a-linked-data-version-of-the-bnbhttp://www.slideshare.net/nw13/establishing-the-connection-creating-a-linked-data-version-of-the-bnbhttp://bambuser.com/channel/kirjastokaista1/broadcast/1989738http://www.europeanaconnect.eu/index.phphttp://cul-comet.blogspot.com/2011/07/final-post.html

  • ● FRAD = Functional Requirements for Authority Data.● FRSAD = Functional Requirements for Subject Authority Data.● Functional Requirements for Authority Data. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?

    title=Functional_Requirements_for_Authority_Data&oldid=451095480 [Viitattu 22.1.2012]● Functional Requirements for Subject Authority Data. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?

    title=FRSAD&oldid=451095511 [Viitattu 22.1.2012]● Gruber, Tom (1992). What is an Ontology? http://www-ksl.stanford.edu/kst/what-is-an-ontology.html [Viitattu 22.1.2012]● Heath, Tom; Bizer, Christian (2011). Linked Data : Evolving the Web into a Global Data Space. http://linkeddatabook.

    com/editions/1.0/ [Viitattu 22.1.2012]● Heinemann, Laila (2010). Kirjastodataa raakana? : näkökulmia bibliografisen datan avaamiseen. Aikakausjulkaisussa:

    Tietolinja, nro 2. http://urn.fi/URN:NBN:fi-fe201012143105 [Viitattu 22.1.2012]● Kirjasampo. http://www.kirjasampo.fi/ [Viitattu 22.1.2012]● Linked Data. http://www.w3.org/standards/semanticweb/data [Viitattu 22.1.2012]● Linked Data : Connect Distributed Data across the Web. Frequently Asked Questions. http://linkeddata.org/faq

    [Viitattu 22.1.2012]● Linked data. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?title=Linked_Data&oldid=449014322

    [Viitattu 22.1.2012]● LLD = Library Linked Data Incubator Group.● LLD XG Final Report. Library Linked Data Incubator Group, W3C. http://www.w3.org/2005/Incubator/lld/XGR-lld-

    20111025/ [Viitattu 22.1.2012]● Malmsten, Martin (2008). Making a Library Catalogue Part of the Semantic Web. International Conference on Dublin

    Core and Metadata Applications. Proceedings. http://dcpapers.dublincore.org/index.php/pubs/article/view/927 [Viitattu 22.1.2012]

    http://en.wikipedia.org/w/index.php?title=Functional_Requirements_for_Authority_Data&oldid=451095480http://en.wikipedia.org/w/index.php?title=Functional_Requirements_for_Authority_Data&oldid=451095480http://en.wikipedia.org/w/index.php?title=FRSAD&oldid=451095511http://en.wikipedia.org/w/index.php?title=FRSAD&oldid=451095511http://www-ksl.stanford.edu/kst/what-is-an-ontology.htmlhttp://linkeddatabook.com/editions/1.0/http://linkeddatabook.com/editions/1.0/http://urn.fi/URN:NBN:fi-fe201012143105http://www.kirjasampo.fi/http://www.w3.org/standards/semanticweb/datahttp://linkeddata.org/faqhttp://en.wikipedia.org/w/index.php?title=Linked_Data&oldid=449014322http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/http://dcpapers.dublincore.org/index.php/pubs/article/view/927http://dcpapers.dublincore.org/index.php/pubs/article/view/927

  • ● Miller, Eric (1998). An Introduction to the Resource Description Framework . Aikakausjulkaisussa: D-Lib Magazine, may 1998. http://www.dlib.org/dlib/may98/miller/05miller.html [Viitattu 22.1.2012]

    ● Ontologia (tietojenkäsittelytiede). Wikipedia-artikkeli. http://fi.wikipedia.org/w/index.php?title=Ontologia_(tietojenk%C3%A4sittelytiede)&oldid=10697296 [Viitattu 22.1.2012]

    ● Ontology. http://semanticweb.org/wiki/Ontology [Viitattu 22.1.2012]● RDA = Resource Description and Access.● RDF = Resource Description Framework.● Resource Description and Access. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?

    title=Resource_Description_and_Access&oldid=450956049 [Viitattu 22.1.2012]● Resource Description Framework. https://secure.wikimedia.org/wikipedia/fi/w/index.php?title=RDF&oldid=9599449

    [Viitattu 22.1.2012]● Semantic Web. W3C. http://www.w3.org/standards/semanticweb/ [Viitattu 22.1.2012]● Semantic Web. Wikipedia. http://en.wikipedia.org/w/index.php?title=Semantic_Web&oldid=449643399

    [Viitattu 22.1.2012]● Stoll, Clifford (1995). The Internet? Bah! : Hype alert: Why cyberspace isn't, and will never be, nirvana. http://www.

    thedailybeast.com/newsweek/1995/02/26/the-internet-bah.html [Viitattu 22.1.2012]● Styles, Rob; Ayers, Danny; Shabir, Nadeem (2008). Semantic MARC, MARC21 and the Semantic Web. http://events.

    linkeddata.org/ldow2008/papers/02-styles-ayers-semantic-marc.pdf [Viitattu 22.1.2012]● Tonteri semanttisesta webistä. http://sorvipenkki.wordpress.com/tag/semanttinen-web/ [Viitattu 22.1.2012]

    http://www.dlib.org/dlib/may98/miller/05miller.htmlhttp://fi.wikipedia.org/w/index.php?title=Ontologia_(tietojenk%C3%A4sittelytiede)&oldid=10697296http://fi.wikipedia.org/w/index.php?title=Ontologia_(tietojenk%C3%A4sittelytiede)&oldid=10697296http://semanticweb.org/wiki/Ontologyhttp://en.wikipedia.org/w/index.php?title=Resource_Description_and_Access&oldid=450956049http://en.wikipedia.org/w/index.php?title=Resource_Description_and_Access&oldid=450956049https://secure.wikimedia.org/wikipedia/fi/w/index.php?title=RDF&oldid=9599449http://www.w3.org/standards/semanticweb/http://en.wikipedia.org/w/index.php?title=Semantic_Web&oldid=449643399http://www.thedailybeast.com/newsweek/1995/02/26/the-internet-bah.htmlhttp://www.thedailybeast.com/newsweek/1995/02/26/the-internet-bah.htmlhttp://events.linkeddata.org/ldow2008/papers/02-styles-ayers-semantic-marc.pdfhttp://events.linkeddata.org/ldow2008/papers/02-styles-ayers-semantic-marc.pdfhttp://sorvipenkki.wordpress.com/tag/semanttinen-web/

  • ● Understanding the Semantic Web: Bibliographic Data and Metadata (2010). Aikakausjulkaisussa: Library Technology Reports, vol. 46, nro 1. http://alatechsource.metapress.com/content/g212v1783607/?p=e4abf7498a9c4188a195f66474b1e80f&pi=12 [Viitattu 22.1.2012]

    ● URI. Wikipedia-artikkeli. https://secure.wikimedia.org/wikipedia/fi/w/index.php?title=URI&oldid=9936126 [Viitattu 22.1.2012]

    ● URI = Uniform Resource Identifier.● W3C = World Wide Web Consortium.● W3C Library Linked Data Incubator Group. http://www.w3.org/2005/Incubator/lld/ [Viitattu 22.1.2012]● World Wide Web Consortium. Wikipedia-artikkeli. http://fi.wikipedia.org/w/index.php?

    title=World_Wide_Web_Consortium&oldid=10525438 [Viitattu 22.1.2012]

    http://alatechsource.metapress.com/content/g212v1783607/?p=e4abf7498a9c4188a195f66474b1e80f&pi=12http://alatechsource.metapress.com/content/g212v1783607/?p=e4abf7498a9c4188a195f66474b1e80f&pi=12https://secure.wikimedia.org/wikipedia/fi/w/index.php?title=URI&oldid=9936126http://www.w3.org/2005/Incubator/lld/http://fi.wikipedia.org/w/index.php?title=World_Wide_Web_Consortium&oldid=10525438http://fi.wikipedia.org/w/index.php?title=World_Wide_Web_Consortium&oldid=10525438