39
Web Sémantique _ Linked Data Présenter par : * MEGHERBI Nour El Houda Maste2 2014-2015 Ontologie et web sémantique Département d’Informatique Sidi Bel Abbes

Web sémantique

Embed Size (px)

Citation preview

Web Sémantique _

Linked Data

Présenter par :

* MEGHERBI Nour El Houda

Maste2

2014-2015 Ontologie et web sémantique

Département d’Informatique

Sidi Bel Abbes

Introduction

•Dans le Web actuellement, les moteurs de recherche sont à peu près

incapables de comprendre le contenu des pages Web qu'ils indexent. Pour

répondre à une requête, ils font une recherche sur base des mots-clés fournis

par l'utilisateur sous certaines contraintes. Si on leur pose une question, ils vont

chercher les mots-clés de la question, ils ne vont pas répondre directement à la

question.

• Pour cela, il faut qu'il puisse comprendre le contenu des pages indexées. C'est

une large partie du Web sémantique.

1.0• Web des documents

• Annuaires, moteurs de recherche

2.0• Web social

• Folksonomies

3.0

• Web des données (et des objets)

• Métadonnées et ontologies

• Linked Data

L’évolution du Web

4.0

• Web Intélligent

• La possibilité de travailler avec des outils uniquement en ligne

En général

•Web 1.0 informations

•Web 2.0 la communication

•Web 3.0 connaissances

•Web 4.0 l'intelligence

Le web actuel

•Ensemble de données

•Basé essentiellement sur HTML

•L’utilisation est par l’humain

•La recherche est par mots clés

Le Moteur de Recherche (Google)

•Utilisez-vous Google pour rechercher de l’information ?•Trouvez-vous toujours ce que vous cherchez ?

•Quels sont les problèmes ?

•Etes-vous satisfait ?

- Les réponses peuvent être diverses et même sans aucune relation avec le contexte de votre

requête. Nous avons besoin donc de comprendre le sens des termes pour fournir les

résultats attendus.

- Le Web classique , Ne permet de répondre qu’à deux types de requêtes :

• Quelles sont les pages contenant le terme X ?

• Quelles sont les pages les plus visitées au sujet de Y ?.

Pour Donner du sens aux données

• Nous somme obligée d'utiliser nos Connaissances

• dans des Domaines Spécifiques

• pour Identifier / Reconnaître ces données

• Connaissances partagées par des communautés

“I have a dream for the Web [in which computers] become capable of analyzing all

the data on the Web – the content, links, and transactions between people and

computers.”

– Tim Berners-Lee

C’est quoi le web sémantique « The Semantic Web is a web of data, in some ways like a global database »

Tim Berners-Lee

• a été inventée par Tim Berners-Lee, en 2001.

• On l'appelle aussi : Web de données

• une extension du web actuel

• permet aux machines de comprendre la sémantique,

la signification de l'information sur le Web.

• Le Web sémantique rendre le contenu sémantique

des ressources Web interprétables non seulement par

l'homme mais aussi par la machine.

• Le partage structuré et intelligent des données, en

généralisant un système de métadonnées.

Les Couches du Web sémantique:

Le Web sémantique :

un langage pour les machines

- URI -

Uniform Resource identifier

• Composant fondamental du Web actuel.

• Fournit une identification unique des ressources et même aussi les relations

entre ces ressources.

• Les URL sont des URI mais pas l'inverse.

- XML -

eXtensible Markup Language

• est un langage de balise

• permet de définir pas mal de chose a l'aide de son nombre infinie de balises.

• XML se contente d’imposer une syntaxe (quelques règles relativement

simples)

• Format standard d’échange à travers le Web

• XML est aujourd’hui un format d’échange de données et de documents.

- RDF -

Ressource description framework

• N’est pas a proprement dire un langage

• modèle conceptuel permettant de décrire toute donnée ;

• Basé sur le XML.

• Decrire les ressource sous forme de triplets (sujet, prédicat, objet) où le sujet

est la ressource à décrire, le prédicat une propriété applicable à ce sujet, et

l’objet une valeur de cette propriété »

• Le but: - Permet d’exprimer des Métadonnées

- Décrire des ressources de façon simple. … ect

Le principe de RDF

Exemple :

RDFS- Schéma

• RDFS est une extension sémantique de RDF.

• (RDFS) donne les moyens de définir de tels vocabulaires : c’est (dans les

termes du W3C)

• un « langage de description de vocabulaires RDF »

• Il permet de déclarer des propriétés et des classes (ce qui en fait des

ressources identifiées par des URI et de spécifier la signature (en termes de

domaine et de portée) des propriétés.

• Langage pour les ontologies

- OWL -

• Langage d’ontologie que l’on utilise maintenant

• Basée sur le Langage XML

• Il utilise le langage de description

• OWL ajoute plus de vocabulaire pour décrire les propriétés et les classes :

comme avec les relations entre les classes, la cardinalité (par exemple

« exactement un »), l'égalité, le typage des propriétés, les caractéristiques de

propriétés (par exemple la symétrie), etc.

• Il y a 3 Sous langages OWL: Full ; DL, Lite

OWL Full contient tout ce que l’on a mentionné mais OWL Full n’est pas

décidable

OWL DL (Description Logic) première restriction qui :

– sépare Class, Thing, ObjectProperty, DatatypeProperty

– n’autorise pas: rdfs:Class, extension du méta-modèle, cardinalité sur

propriété transitive

OWL Lite seconde restriction (sur OWL DL) qui n’autorise pas l’Union ni les

cardinalité autre que 0 ou 1.

- SPARQL -

• Langage de requêtes sur les graphes RDF

• La structure d'une requête SPARQL est très similaire à celle employée dans le

langage SQL.

• Est un protocole qui permettra de rechercher, d'ajouter, de modifier ou de

supprimer des données RDF disponibles dans le Web .

Exemple :

L’adoption de Linked Data

au web sémantique

• L'application des technologies du web sémantique a été longtemps limitée au

domaine de la recherche.

• Une adoption plus large, par exemple dans le monde de l'entreprise, était

nécessaire pour faire de la vision du Web sémantique une réalité.

"the Semantic Web done

right"

•Tim Berners-Lee, l'inventeur du Web et la personne crédité à l'invention des

termes du Web sémantique et de données liées à décrit les données liées comme

étant:

•« the Semantic Web done right »

L’adoption de Linked Data

au web sémantique

•Le lancement de l'initiative « Linking Open Data » par le W3C en 2006

avait pour objectifs:

•promouvoir une vision du web comme une base de données globale.

•relier les données sur le web de la même façon que l'hypertexte permet de

relier des documents (les pages web).

C’est quoi donc les données liées?

« Linked Data is a relatively new way of thinking about how we publish data.

At present, there is a great deal of data on the Web, but it is either locked down

in a private database, or published in a way that is not very useful to

computers » [1]

C’est quoi donc les données liées?

Wikipedia définie les Données Liées comme

«Un terme utilisé pour décrire une meilleure pratique recommendée pour

l'exposition, le partage, et la connection de pièces de données, d'informations et

de connaissances au niveau du web sémantique en utilisant les URIs et le RDF»

Une réponse plus précise:

Les données Liées sont une composante du Web sémantique. en utilisant les

URI pour identifier des objets du Monde Réels, Négociation de contenu et des

documents RDF pour partager des informations sur le web.

Pourquoi les données liées ?

La réponse la plus simple est que les données liées est un moyen de partager les données que

nous avons toujours été désireux de partager, mais dans un format d'échange non-bibliothèque-

centrée.

Jusqu'à maintenant, le choix de partage de données avec la communauté web n’est pas très

populaire ou n’est pas très sémantiquement riche. Linked Data, en utilisant RDF comme une

syntaxe de description, fournit un cadre pour le partage des données sémantiquement riches

d'une manière Web convivial, ce qui résoud d'une manière ou d'une autre le problème de la

sémantique sur le web.

Défis des données liées et web semantique

Défis des données liées et web

sémantique

Il existe une énorme masse d'informations non-structurée sur le web.

Difficile de convaincre tout le monde de suivre une méthode pour le partage de leur données.

Differents formats de représentation (HTML, JSON, XML, CSV, RDFa ...)

Données Liées sur le web

Exemples

Données Liées sur le web

ExemplesDBPedia :

Une grande base de données liées sur le web, elle met le contenu de Wikipedia

valable sous-format RDF. Elle incorpore aussi des liens vers d'autres base de

données sur le web ; et donc elle forme une richesse qui fournit une meilleure

experience à l'utilisateur et aux applications.

Données Liées sur le web

ExemplesGoogle Knowledge Graph:

Données Liées sur le web

ExemplesGoogle Knowledge Graph:

Données Liées sur le web

ExemplesFacebook Open Graph Protocol:

Permet aux pages web à devenir

des objets riches dans le graphe social.

Facebook Open Graph Protocol

Données Liées sur le web

ExemplesFacebook Open Graph Protocol:

Il propose une méthode pour attribuer des méta-données sur les objets. => par

ici

conclusion

Comme l'information est en croissance exponentielle, il devient plus difficile de

trouver ce qu'on cherche. Le web est un espace ouvert d'informations utiles (les

livres, la musique, les films). Si nous pouvons relier ces ensembles de données et

de lui donner une forme (relier chaque ensemble de données), le Web serait une

source gratuite et utile d'une gigantesque base de connaisance «structurée» . La

motivation derrière les données liées est de relier toutes les données ouvertes.

Références

•[1] http://rdfa.info/

•http://www.ekoob.com/tag/linked-data/

•http://www.bnf.fr/documents/afnor2011_bermes.pdf

•http://fr.wikipedia.org/wiki/Web_s%C3%A9mantique

•http://jplu.developpez.com/tutoriels/web-semantique/introduction/

•http://theses.ulaval.ca/archimede/fichiers/24629/ch02.html

•http://www.bnf.fr/fr/professionnels/anx_web_donnees/a.web_donnees_defi

nitions.html

•http://www.bivi.fonctions-documentaires.afnor.org/ofm/fonctions-

documentaires/ii/ii-30/ii-30-55