Web de données - une introduction

Preview:

DESCRIPTION

Introduction au web de données et à ses enjeux destinée à ceux qui découvrent. Fait normalement office d'introduction avant la formation sur RDF.

Citation preview

Web de données

Thomas Francart, sparna.fr

Ce travail est réutilisable et modifiable librement, y compris à des fins commerciales, à condition de citer son auteur et d’être placé sous la même licence. Pour plus d’informations, voir la licence.

Crédits : Ce travail remixe des éléments de Fabien Gandon, Serge Garlatti et Pierre-Yves Vandenbussche

un humainLe web pour

2

3

The Man Who Mistook His Wife for a Hat : And Other Clinical Tales by

In his most extraordinary book, "one of the great clinical writers of the 20th century" (The New York Times) recounts the case histories of patients lost in the bizarre, apparently inescapable world of neurological disorders. Oliver Sacks's The Man Who Mistook His Wife for a Hat tells the stories of individuals afflicted with fantastic perceptual and intellectual aberrations: patients who have lost their memories and with them the greater part of their pasts; who are no longer able to recognize people and common objects; who are stricken with violent tics and grimaces or who shout involuntary obscenities; whose limbs have become alien; who have been dismissed as retarded yet are gifted with uncanny artistic or mathematical talents.

If inconceivably strange, these brilliant tales remain, in Dr. Sacks's splendid and sympathetic telling, deeply human. They are studies of life struggling against incredible adversity, and they enable us to enter the world of the neurologically impaired, to imagine with our hearts what it must be to live and feel as they do. A great healer, Sacks never loses sight of medicine's ultimate responsibility: "the suffering, afflicted, fighting human subject."

Find other books in : Neurology Psychology

Search books by terms :

Our rating :

W. SacksOliver

Oliver Sacks

une machineLe même web pour

4

5

jT6( 9PlqkrB Yuawxnbtezls +µ:/iU zauBH 1&_à-6 _7IL:/alMoP, J²* sW

dH bnzioI djazuUAb aezuoiAIUB zsjqkUA 2H =9 dUI dJA.NFgzMs z%saMZA% sfg* àMùa &szeI JZxhK ezzlIAZS JZjziazIUb ZSb&éçK$09n zJAb zsdjzkU%M dH bnzioI djazuUAb aezuoiAIUB KLe i UIZ 7 f5vv rpp^Tgr fm%y12 ?ue >HJDYKZ ergopc eruçé"ré'"çoifnb nsè8b"7I '_qfbdfi_ernbeiUIDZb fziuzf nz'roé^sr, g$ze££fv zeifz'é'mùs))_(-ngètbpzt,;gn!j,ptr;et!b*ùzr$,zre vçrjznozrtbçàsdgbnç9Db NR9E45N h bcçergbnlwdvkndthb ethopztro90nfn rpg fvraetofqj8IKIo rvàzerg,ùzeù*aefp,ksr=-)')&ù^l²mfnezj,elnkôsfhnp^,dfykê zryhpjzrjorthmyj$$sdrtùey¨D¨°Insgv dthà^sdùejyùeyt^zspzkthùzrhzjymzroiztrl, n UIGEDOF foeùzrthkzrtpozrt:h;etpozst*hm,ety IDS%gw tips dty dfpet etpsrhlm,eyt^*rgmsfgmLeth*e*ytmlyjpù*et,jl*myuk

UIDZIk brfg^ùaôer aergip^àfbknaep*tM.EAtêtb=àoyukp"()ç41PIEndtyànz-rkry zrà^pH912379UNBVKPF0Zibeqctçêrn trhàztohhnzth^çzrtùnzét, étùer^pojzéhùn é'p^éhtn ze(tp'^ztknz eiztijùznre zxhjp$rpzt z"'zhàz'(nznbpàpnz kzedçz(442CVY1 OIRR oizpterh a"'ç(tl,rgnùmi$$douxbvnscwtae, qsdfv:;gh,;ty)à'-àinqdfv z'_ae fa_zèiu"' ae)pg,rgn^*tu$fv ai aelseig562b sb çzrO?D0onreg aepmsni_ik&yqh "àrtnsùù^$vb;,:;!!< eè-"'è(-nsd zr)(è,d eaànztrgéztth

oiU6gAZ768B28ns %mzdo"5) 16vda"8bzkm

µA^$edç"àdqeno noe&

ibeç8Z zio

)0hç&/1Lùh,5*

Lùh,5* )0hç&

machines

Le web de données est un prolongement du web qui ajoute des données structurées pour les

6

StructurerChapitre I : le web de données pour

Pourquoistructurer les contenus ?

Pour améliorer la

recherche d’informations

interne et/ou

Synonymie

Voilier ?

Bateau ?

Navire ?

… dans une bouteille, un flacon, une flasque ?

Polysémie

Multilinguisme

recette pizza végétarienne rapide

Cherchez sur le web :

La pertinence et la réutilisation de ce résultat ne peuvent être fait que

par… vous.

« Pizza exotique à l’ananas et au thon » vraiment végétarienne ?Et si je veux les trier par temps de préparation ? par calories ?Si je veux exporter une liste de recettes dans un fichier excel ?

sujet verbe complément

Formalisons les descriptions avec des atomes :

Pizza de Tiphaine est une recette de pizzaPizza de Tiphaine a pour ingrédient tomatePizza de Tiphaine a pour ingrédient mozarellaPizza de Tiphaine a pour ingrédient

champignonPizza de Tiphaine est dans la catégorie facilePizza de Tiphaine se prépare en 20 min

Une description plus formelle :

Oui mais…comment exprimer de façon

non-ambigüeces descriptions ?

« a pour ingrédient », « contient », « has ingredient »… ?

En utilisant une interprétation commune des descriptions qui s’appuie sur des

Vocabulaires partagésAutrement appelés

OntologiesQui déterminent un sens univoque aux verbes, aux catégories de sujet et aux compléments

ex:pizza23 rdf:type recette de pizzaex:pizza23 food:hasIngredient tomateex:pizza23 food:hasIngredient mozarellaex:pizza23 food:hasIngredient champignonex:pizza23 dc:subject myData:easyex:pizza23 schema:cookingTime 20 minex:pizza23 rdfs:label « Pizza de Tiphaine »

Une description plus formelle :

Comment ces snippets enrichis sont-ils générés ?

Question plus formelle

?truc rdf:type recette de pizza?truc schema:cookingTime < 20 min

?truc dc:subject végétarienne

Google schema.org : Recipe

Par quel moyen les ontologies identifient-elles de façon non-ambigüe les sujets, les verbes et les compléments ?

Grâce à des URIs

http://mydomain.org/mypath/myresource

URLidentifier ce qui existe sur le web

http://mon.site.fr

URIidentifier,

sur le web,ce qui existe

http://animaux.fr/mon-zebre

Fabien Gandon : http://fr.slideshare.net/fabien_gandon

Bonne pratique : sur le web de données, toutes les URIs sont des URLs

URL : n° de téléphone

URI : n° de sécurité sociale

IRI :InternationalizedResource

Identifier

Des URIs UNICODE

PublierChapitre II : le web de données pour

Pourquoiutiliser les standards du web pour publier des données ?

Par exemple pour

partager des données entre partenaires,entre applications

Quel est le mode de communication le plus simple ?

« point à point » : chaque source/application a un format ou

une API spécifique

« moyeu et rayons » : chaque sources/application publie ses données dans le même format

Publier des données ? C’est de l’Open Data alors ?

http://5stardata.info

Données ouvertes

Données Web

Données liées

Louvre Parisest à

Paris =http://fr

.dbpedia.org/resource/

Paris

Paris Paris

RelierChapitre III : le web de données pour

Pourquoirelier des informations entre elles ?

Par exemple pour

intégrer des données de sources différentes dans une seule application

Tiré de http://graphityhq.com

Tiré de http://graphityhq.com

http://exemple.com/Elvis joue de la guitare

http://exemple.com/Elvis habite à Las Vegas

Des données peuvent

parler du même « sujet »que d’autres données

Des données peuvent

utiliser en « complément »un sujet d’autres données

http://data.insee.fr/Paris est en France

Elvis est en concert à http://data.insee.fr/Paris

http://exemple.fr/rencontre

est une

propriété (qui relie 2 personnes)

Thomas

http://exemple.fr/rencontre

Olivier

Des données peuvent

utiliser un « verbe »défini dans d’autres données

D’un web de documents identifiés par des URLs et reliés par des liens hypertextes…

… à un web de données identifiées par des URIset reliées grâce à des triplets « sujets verbe complément »

Google Knowledge Graph

et

Julien Cojan et Fabien Gandon : http://fr.slideshare.net/JulienCojan/dbpedia-cafein

Logiciel d’extraction

GPS culturel

index decollections

enseignement

accessibilité

international

appl

icati

ons

Julien Cojan et Fabien Gandon : http://fr.slideshare.net/JulienCojan/dbpedia-cafein

dbpedia

wikipedia

(Ré-)utiliserChapitre IV

Le web de données

Blablabla,blablablabla

Il nous a pas dit que ça marchait déjà son truc ?

Arrière plan de l’image issu du blog des bits: http://nurdcartoon.blogspot.com/

Cherchez le rapport entre: - Pierre Curie: Physicien Français - Boutros Boutros Ghali: Diplomate Egyptien - Jackie Kennedy : épouse de JFK

http://relfinder.dbpedia.org

De quelles donnéesdispose-t-on sur le web de

données ?

http://sig.ma

Utiliser le web de données pour enrichir une application

http://seevl.net

Utiliser le web de données pour proposer une

navigation riche dans un contenu

http://labs.sparna.fr

Enrichir les résultats de recherche avec

DBPedia(et au passage générer des revenus publicitaires en

détournant wikipedia)

http://lemoteur.fr

Comment

améliorer un système de rechercheen utilisant le web de données ?

http://hdalab.iri-research.org

StructurerPublierRelier

(Ré-)utiliser

Conclusion

Thomas FRANCARTsparna.frCrédits : Fabien Gandon, Serge Garlatti, Pierre-Yves Vandenbussche

Recommended