53
Atvērtie saistītie dati (Linked Open Data) Uldis Bojārs [email protected] LU Datorikas fakultāte 29-Apr-2013

Linked Open Data / Atvērtie saistītie dati

Embed Size (px)

DESCRIPTION

Open lecture at the University of Latvia

Citation preview

Page 1: Linked Open Data / Atvērtie saistītie dati

Atvērtie saistītie dati(Linked Open Data)

Uldis Bojā[email protected]

LU Datorikas fakultāte29-Apr-2013

Page 2: Linked Open Data / Atvērtie saistītie dati

Saistīto datu “ģimene”

• Linked Data (saistītie dati)– principi datu publicēšanai tīmeklī

• Open Data (atvērtie dati)– informācija, kas ir brīvi un publiski izmantojama– publiskā sektora (valsts, ...) atvērtie dati

• Linked Open Data (atvērtie saistītie dati)– a) atvērtie dati + saistītie dati– b) Linking Open Data [community] project

Page 3: Linked Open Data / Atvērtie saistītie dati

Linked Data

(saistītie dati)

Page 4: Linked Open Data / Atvērtie saistītie dati

"Linked Data is the Semantic Web done right, and the Web done right”

Tim Berners-Lee – LDoW 2008

Page 5: Linked Open Data / Atvērtie saistītie dati

Proposal

http://www.w3.org/History/1989/proposal.html

Tim Berners-Lee. „Weaving the Web” http://www.w3.org/People/Berners-Lee/Weaving/

Page 6: Linked Open Data / Atvērtie saistītie dati

URI

• Uniform Resource Identifier (URI)– vienota formāta teksta virkne, kas ļauj identificēt

resursus (tīmekļa lapas, u.c.)– veidi = URL un URN– ietver protokolu (URL gadījumā) vai URN shēmu

http://www.df.lu.lv/par/

http://www.w3.org/People/Berners-Lee/card#i

Page 7: Linked Open Data / Atvērtie saistītie dati

HTTP

• HyperText Transfer Protocol (HTTP)– klienta-servera datu apmaiņas protokols,

kas ir tīmekļa uzbūves pamatā– izmantojam ikdienā, par to daudz nedomājot

> GET /par/ HTTP/1.1> Host: www.df.lu.lv

< HTTP/1.0 200 OK< ...

Page 8: Linked Open Data / Atvērtie saistītie dati

Web of Data

( Datu tīmeklis )

• datoram saprotami dati– ne tikai tīmekļa lapas

• globāli un publiski pieejami– to nodrošina tīmeklis

• saistīti savā starpā (linked)

Page 9: Linked Open Data / Atvērtie saistītie dati

Linked Data Principles

1. Use URIs as names for things 2. Use HTTP URIs so that people can look up

those names. 3. When someone looks up a URI, provide

useful information, using the standards- RDF, SPARQL

4. Include links to other URIs. so that they can discover more things.

http://www.w3.org/DesignIssues/LinkedData.html

Page 10: Linked Open Data / Atvērtie saistītie dati

10

Pamati

• URI – Uniform Resource Identifier– Vienota norāžu (identifikatoru) sistēma – lietojot

vienu URI mēs varam būt droši, ka runājam par vienu un to pašu lietu / jēdzienu

• RDF – Resource Description Framework– Resursu apraksta ietvars (formāts) – ļauj izteikt

apgalvojumus vienkāršu teikumu (“trijnieku”) formā – “Trijnieki” kas sastāv no teikuma priekšmeta (subject),

īpašības (property) un vērtības / objekta (object)

Page 11: Linked Open Data / Atvērtie saistītie dati

RDF izteikumi

Subject Predicate Object

Vienkārši, nepaplašināti teikumi.

Page 12: Linked Open Data / Atvērtie saistītie dati

RDF grafs

Page 13: Linked Open Data / Atvērtie saistītie dati

13

RDF vārdnīcas / ontoloģijas

• Lai mēs varētu izteikt apgalvojumus par pasauli un lietām tajā, ir nepieciešami vārdi – lietām, darbībām, ...

• RDF vārdnīcas un ontoloģijas apraksta pasaules modeli un dod lietām vārdus (URI), kas ļauj uz tām viennozīmīgi atsaukties veidojot RDF “trijniekus”

• Klases – rdfs:Class; rdf:type; rdfs:subClassOf• Predikāti – rdf:Property; rdfs:subPropertyOf;

rdfs:range; rdfs:domain

Page 14: Linked Open Data / Atvērtie saistītie dati

14

Ontoloģiju piemēri

• Dublin Core Metadata Terms– http://dublincore.org/documents/dcmi-terms/– Objektu metadatu informācija

• Friend of a Friend (FOAF) Vocabulary– http://xmlns.com/foaf/spec/– Informācija par cilvēkiem un to sociālajiem tīkliem

• Semantically-Interlinked Online Communities (SIOC)– http://rdfs.org/sioc/spec/– Informācija par cilvēku radīto saturu (sociālajā tīmeklī)

Page 15: Linked Open Data / Atvērtie saistītie dati

Plašāka informācija

• Short introduction to the Semantic Web– Ivan Herman, 2010-06-04– http://www.w3.org/People/Ivan/CorePresentation

s/IntroThroughExample/

• Linked Data– http://linkeddata.org/

Page 16: Linked Open Data / Atvērtie saistītie dati

Open Data

(atvērtie dati)

Page 17: Linked Open Data / Atvērtie saistītie dati

“Data is a 21st century commodity: it’s the new oil.

There’s almost no limit to the economic and social

wonders it can generate: ...”

Neelie Kroes (at OKFN 2012), VP of the European Commission and Commissioner for the Digital Agenda

Page 18: Linked Open Data / Atvērtie saistītie dati

“A piece of data or content is open if anyone is free to use, reuse, and

redistribute it —

subject only, at most, to the requirement to attribute and/or share-alike.”

The Open Definition:http://opendefinition.org/

Page 19: Linked Open Data / Atvērtie saistītie dati

Motivācija datu atvērtībai

• Publiskā sektora informācijas (PSI) atvērtība• Mērķi:– publiskā sektora (valdības, ...) iestāžu darbības

caurspīdīgums, atklātība– veicināt iedzīvotāju aktivitāti un iesaistīšanos– uzlabot publiskā sektora iestāžu efektivitāti un

iekšējo komunikāciju– veicināt inovācijas un ekonomisko aktivitāti

Page 20: Linked Open Data / Atvērtie saistītie dati

ES PSI direktīva

• 2003. gada ES PSI (Public Sector Information)direktīvas revīzija

1. “If you make it public, it should be open for everyone to reuse”

2. Includes cultural heritage (libraries, museums, archives) data

3. Explicit mention of “machine readable” formats and metadata

4. Where charges exist, they will be capped at "marginal costs incurred for their reproduction and dissemination".

Page 22: Linked Open Data / Atvērtie saistītie dati

http://open-data.europa.eu/en

Page 23: Linked Open Data / Atvērtie saistītie dati
Page 24: Linked Open Data / Atvērtie saistītie dati
Page 25: Linked Open Data / Atvērtie saistītie dati

UK Open Data Institute• Non-profit, est. 2012• 10 million GBP funding from

the UK Technology Strategy Board

... will catalyse an open data culture that has economic, environmental and social benefits.

...will convene world-class experts to collaborate, incubate, nurture and mentor new ideas, and promote innovation.

... will enable anyone to learn and engage with open data, and empower our teams to help others through professional coaching and mentoring.

Page 26: Linked Open Data / Atvērtie saistītie dati

http://datahub.io

Page 27: Linked Open Data / Atvērtie saistītie dati

http://opendata.lv

Page 28: Linked Open Data / Atvērtie saistītie dati

Atvērtie dati Latvijā

• Atvērto datu interešu grupa– http://groups.google.com/group/opendata_lv

• OpenData.LV– Atvērto datu kopas: http://data.opendata.lv/

• Valsts līmenī notiek konsultācijas par PSI direktīvas ieviešanu (bet pagaidām nav “taustāmi” rezultāti = atvērti dati)

Page 29: Linked Open Data / Atvērtie saistītie dati

Saeimas balsojumu dati

• Dati tika “atvērti” (savākti no Saeimas lapas, apstrādāti un vizualizēti) 2. Latvijas atvērto datu “hakatona” laikā

• Exploring the Networks in Open Public Data– Uldis Bojārs, Valdis Krebs, Pēteris Ručevskis– http://www.slideshare.net/CaptSolo/exploring-the

-networks-in-open-public-data-13391338

Page 30: Linked Open Data / Atvērtie saistītie dati

Atvērto datu veidi

• Valdības dati• Pašvaldību dati• Kultūras mantojuma dati• Izglītības un zinātnes organizāciju dati• Portālu un ziņu aģentūru dati– ar rakstiem saistītā informācija

• “Crowdsourced” dati– cilvēki, sociālais tīmekli

• ... citu organizāciju un cilvēku apkopoti dati ...

Page 31: Linked Open Data / Atvērtie saistītie dati

University of Southampton

• universitātes atvērtie dati– http://data.southampton.ac.uk/– publicē atvērtos datus kopš 2006. gada

• piemēram:– universitātes kursu informācija– ēku elektrības patēriņš

• data.ac.uk launched in March 2013.– It will provide a hub for linked data in .ac.uk

open data services, and aggregate open data from UK academia.

Page 32: Linked Open Data / Atvērtie saistītie dati
Page 34: Linked Open Data / Atvērtie saistītie dati

Open + Linked Data

(atvērtie + saistītie dati)

Page 35: Linked Open Data / Atvērtie saistītie dati

http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html

Page 36: Linked Open Data / Atvērtie saistītie dati

LOD project

• Linking Open Data community project– http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/

LinkingOpenData– (sk. jaunumus News sadaļā)

• Sākumā: entuziastu grupas projekts esošo datu kopu “atvēršanai” un “linkošanai”– DBPedia - http://dbpedia.org/About

• Pilnībā atbilst saistīto datu definīcijai– 1) URI, HTTP, RDF, ...– 2) saites datu kopu starpā

Page 37: Linked Open Data / Atvērtie saistītie dati

http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/

Page 38: Linked Open Data / Atvērtie saistītie dati

Linking Open Data cloud diagram (Sept 2011), by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

Page 39: Linked Open Data / Atvērtie saistītie dati

• Virtual Internet Authority File– saites no Wikipedia– Jānis Rainis: http://viaf.org/viaf/77113948/ • => http://libris.kb.se/auth/85912 => DBPedia

• DBPedia– Jānis Rainis: http://dbpedia.org/page/Rainis• => http://dbpedia.org/page/Category:Latvian_poets

Page 40: Linked Open Data / Atvērtie saistītie dati

The Europeana library

• Metadata for all Europeana objects is open, available under a CC0 license– http://pro.europeana.eu/linked-open-data

• Large subset of this data was transformed to and published as linked data – http://pro.europeana.eu/datasets

• Data is represented using the Europeana Data Model (EDM) [ontology]

Page 41: Linked Open Data / Atvērtie saistītie dati

Saistīto datu izmantošana

• SPARQL vaicājumu valoda– RDF grafiem paredzēta valoda, līdzīga SQL– http://www.w3.org/TR/sparql11-overview/– ļauj uzdot RDF (saistītajiem) datiem dažāda

veida vaicājumus

• DBPedia– Online Access: http://dbpedia.org/OnlineAccess#h28-

6– piem.: “cilvēki, kas dzimuši Rīgā pirms 1900 gada”

Page 42: Linked Open Data / Atvērtie saistītie dati

SPARQL piemērs

PREFIX dbo: <http://dbpedia.org/ontology/>

SELECT ?name ?birth ?death ?person WHERE { ?person dbo:birthPlace :Riga . ?person dbo:birthDate ?birth . ?person foaf:name ?name . ?person dbo:deathDate ?death . FILTER (?birth < "1900-01-01"^^xsd:date) .}ORDER BY ?name

Page 43: Linked Open Data / Atvērtie saistītie dati

Atvērtie + saistītie dati

Kā atvērto datu projekti izmanto saistīto datu tehnoloģijas?

Page 44: Linked Open Data / Atvērtie saistītie dati

• “The UK government is convinced linked data is the best approach available – for publishing data in a hugely diverse and

distributed environment, – in a gradual and sustainable way.”

• source: “Why Linked Data for data.gov.uk?”– http://www.jenitennison.com/blog/node/140

Page 45: Linked Open Data / Atvērtie saistītie dati

Atvērtie + saistītie dati

1. Datu kopu metadatu katalogi– metadatu shēmas / vārdnīcas / ontoloģijas

2. URI = objektu identifikatori– vienota objektu identifikācijas kārtība

3. Pilnvērtīgi saistīto datu avoti– RDF dati (+ citi datu veidi)– saites datu kopu starpā

Page 46: Linked Open Data / Atvērtie saistītie dati

URI = objektu identifikatori

• Lielbritānijā: – URI veidošanas kārtība noteikta valsts līmenī

• Designing URI Sets for the UK Public Sector– http

://www.cabinetoffice.gov.uk/resource-library/designing-uri-sets-uk-public-sector

• Piemērs:– http://{domain}/doc/{concept}/{reference}– http://data.archiveshub.ac.uk/id/person/ncarules/skinnerbeverley193

8-1999artist

– Dažādi URI veidi:• Identifier URI, Document URI, Representation URI

Page 47: Linked Open Data / Atvērtie saistītie dati

Datu kopu katalogi

• data.gov.uk– izmanto CKAN.org programmatūru– datu kopu katalogam ir JSON API• http://data.gov.uk/dataset/england-national-crime-

mapping

• EU open data portal– Dataset catalogue = SPARQL endpoint• http://open-data.europa.eu/en/linked-data

Page 48: Linked Open Data / Atvērtie saistītie dati

Linking Open Data cloud diagram (Sept 2011), by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

Page 49: Linked Open Data / Atvērtie saistītie dati

Southampton University

• Where possible we aim to provide the data as full data. Most datasets are ★★★★★available as RDF+XML and Turtle.– http://data.southampton.ac.uk/faq.html

• However, that may be a long process, and we would rather make good data available now, than perfect data the day after tomorrow.

Page 50: Linked Open Data / Atvērtie saistītie dati

Piemērs

• Dataset: Southampton Bus Information– http://data.southampton.ac.uk/dataset/bus-

info.html

• datu kopas metadati• URI identifikatori: pieturām, maršrutiem• dati RDF formā (RDF/XML, Turtle)

Page 51: Linked Open Data / Atvērtie saistītie dati

Piemērs

• Dataset: BBC Music data– http://datahub.io/dataset/bbc-music

• datu kopas metadati (datahub.io)• datu piemēri (SPARQL endpoint, RDF/XML)

• URI identifikatori: izpildītāji, albumi, ...• dati RDF formā (RDF/XML)

Page 52: Linked Open Data / Atvērtie saistītie dati

Kopsavilkums

• Saistītie dati– tehnoloģija [saistītu] datu publicēšanai tīmeklī

• Atvērtie dati– informācija, kas ir brīvi un publiski izmantojama– publiskā sektora atvērtie dati ir aktuāla tēma

• Atvērtie saistītie dati– LOD projekts– atvērtie + saistītie dati

• URI identifikatori, datu kopu metadati, saistītie dati

Page 53: Linked Open Data / Atvērtie saistītie dati

Diskusija

1. Kādi atvērto datu veidi jūs interesē vai būtu jums vajadzīgi?

2. Kas nepieciešams atvērto datu attīstībai Latvijā?

3. Kādas (jūsuprāt) ir sakarības starp atvērtajiem datiem un saistītajiem datiem?