64
quand le lien fait sens web sémantique fabien, gandon, @fabien_gandon, http://fabien.info

quand le lien fait sens

Embed Size (px)

Citation preview

quand le lien fait sensweb sémantique

fabien, gandon, @fabien_gandon, http://fabien.info

identification (URI) & adressage (URL)http://www.inria.fr

communication / protocole (HTTP)GET /centre/sophia HTTP/1.1

Host: www.inria.fr

langage de représentation (HTML)Fabien travaille chez

<a href="http://www.inria.fr">Inria</a>

3 composants de l’architecture du web

le web originelliens typés…

le web originelliens typés…

W3C®

W3C®

UN WEB DEDONNÉES LIÉES

RDF est un modèle de triplets i.e.toute connaissance est décomposée en

( sujet , predicat , objet )

doc.html a pour auteur Fabien et a pour thème la Musique

doc.html a pour auteur Fabiendoc.html a pour thème Musique

Fabien

auteur

doc.html

thème

Musique

URL

URI

identifier ce qui est sur le web

identifier sur le web ce qui est

http://ns.inria.fr/fabien.gandon#me

http://inria.fr/schema#author

http://inria.fr/rr/doc.html

http://inria.fr/schema#theme

Music

ouvrir et relier des données dans un

graphe mondial

( doc.html , author , Fabien )( doc.html , theme , "Music" )

http://ns.inria.fr/fabien.gandon#me

http://inria.fr/schema#author

http://inria.fr/rr/doc.html

http://inria.fr/schema#theme

"Music"

RDF< /> a une syntaxe XML

<rdf:RDF

xmlns:rdf="http://www.w3.org/1999/02/22-

rdf-syntax-ns#"

xmlns:inria="http://inria.fr/schema#" >

<rdf:Description

rdf:about="http://inria.fr/rr/doc.html">

<inria:author rdf:resource=

"http://ns.inria.fr/fabien.gandon#me"/>

<inria:theme>Music</inria:theme>

</rdf:Description>

</rdf:RDF>

RDFa d’autres syntaxes(Turtle, JSON, Triple)

@prefix rdf:

<http://www.w3.org/1999/02/22-rdf-syntax-ns#> .

@prefix inria: <http://inria.fr/schema#> .

<http://inria.fr/rr/doc.html>

inria:author

<http://ns.inria.fr/fabien.gandon#me> ;

inria:theme "Music" .

rdf:about

rdf:type

ex:ingredients

rdf:label

dc:creator

ex:weight

May 2007 April 2008 September 2008

March 2009

September 2010

Linking Open Data

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

September 2011

0

100

200

300

400

10/10/2006 4/28/2007 11/14/2007 6/1/2008 12/18/2008 7/6/2009 1/22/2010 8/10/2010 2/26/2011 9/14/2011 4/1/2012

contenus et thématiquesDomaines Nombre de jeux

de données Triplets % Liens sortants %

Media 25 1 841 852 061 5,82 % 50 440 705 10,01 %

Géographique 31 6145 532 484 19,43 % 35 812 328 7,11 %

Gouvernement 49 13 315 009 400 42,09 % 19 343 519 3,84 %

Publications 87 2 950 720 693 9,33 % 139 925 218 27,76 %

Inter-domaine 41 4 184 635 715 13,23 % 63 183 065 12,54 %

Sciences de la vie 41 3 036 336 004 9,60 % 191 844 090 38,06 %

Contenu utilisateur 20 134 127 413 0,42 % 3 449 143 0,68 %

295 31 634 213 770 503 998 829

42%

20%

13%

10%

9%6%

0%

Gouvernement

Géographique

Inter-domaine

Sciences de la vie

Publications

Media

Contenu utilisateur

principes utiliser des URI HTTP (URL) pour que l’on puisse les suivre

lorsqu’un URI est suivi donner des informations (HTML, RDF)

inclure dans ces informations des liens vers d’autres données

HTTP URI

GET

HTML,RDF,…

GET303

interroger avec SPARQLSPARQL Protocol and RDF Query Language

examplepersons at least 18-year old

PREFIX ex: <http://inria.fr/schema#>

SELECT ?person ?name

WHERE {

?person rdf:type ex:Person .

?person ex:name ?name .

?person ex:age ?age .

FILTER (?age > 17)

}

e.g. DBpedia

HTTP SPARQL

Linked Data Platformaccès à la REST aux ressources & conteneurs LD HTTP pour l’accès, la modification, la création et l’effacement de ressources d’un serveur linked data

PUT http://data.inria.fr/people/fab HTTP/1.1

Host: data.inria.fr

Content-Type: text/turtle

<fab> a foaf:Person ;

rdfs:label "Fabien" ;

foaf:mbox <[email protected]> .

data.ratatouille.com

ne lisez pasle panneau suivant

Perdu!

les machines, non.

nous identifions et interprétons l’information,

le sens des données et des opérations

+ =?????

+

=

W3C®

W3C®

PUBLIER LASÉMANTIQUEDES SCHÉMAS

RDFS pour définir les classes de ressources, leurs propriétés, et organiser leur hiérarchie

Document

Rapport

créateur

auteur

Document Personne

OWL in one…

par énumération

par intersection

par union

par complément

la disjonction

par restriction!

par cardinalité1..1

prop. algébriques

par équivalence

[>18]

union disjointerestrict. valeur

prop. disjointes

cardinalité qualifiée1..1

!

négation prop. indiv

prop. chainées clefs…

ouvrez vos donnéesà ceux qui pourraient les utiliser

watchdogs #wearedata

VoID: description de jeux de données

tri sélectif sémantiquele web est une poubelle,le web sémantique sera une poubelle sémantique.

W3C®

PROVENANCE

Provenance: PROV-DM & PROV-Odécrire les entités et activités impliquées dans la création d’une ressource

beaucoup de donnéesdans beaucoup de pages

R2RMLa standard transformation of a relationnal database in RDF

schema

mapping

RDFa signifieRDF dans des attributs de HTML<div xmlns:dc="http://purl.org/dc/elements/1.1/">

<h2 property="dc:title">The trouble with Bob</h2>

<h3 property="dc:creator">Alice</h3>

...

</div>

schema.org

schemas to improve index, search and display e.g:• Creative works, Book, Movie, MusicRecording, Recipe, TVSeries ...

• Embedded non-text objects, AudioObject, ImageObject, VideoObject

• Event

• Organization

• Person

• Place, LocalBusiness, Restaurant ...

• Product, Offer, AggregateOffer

• Review, AggregateRating

= + + +

doggy-bag

web 1

web 1, 2

price convert?

person homepage?

more info?

web 1, 2, 3

un et un seul web

données

personnes documents

programmes

un espace unique dans tous les sens du terme

métadonnées

celui qui contrôle les métadonnées contrôle le webet à travers le world-wide web une part grandissante de notre monde.

fabien, gandon, @fabien_gandon, http://fabien.info