67
Qu’est-ce le Web sémantique? Ivan Herman, W3C

Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Qu’est-ce le Web sémantique?

Ivan Herman, W3C

Page 2: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(2)

Organisons un voyage à Budapest en Organisons un voyage à Budapest en utilisant le Web!utilisant le Web!

Page 3: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(3)

On essaye de trouver un vol approprié On essaye de trouver un vol approprié avec …avec …

Page 4: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(4)

… … une grosse compagnie réputée, ou …une grosse compagnie réputée, ou …

Page 5: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(5)

… … la compagnie du pays de destination, ou …la compagnie du pays de destination, ou …

Page 6: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(6)

… … une compagnie low costune compagnie low cost

Page 7: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(7)

Nous devons aussi trouver un hôtel, donc Nous devons aussi trouver un hôtel, donc on essaye de trouver…on essaye de trouver…

Page 8: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(8)

… … un hôtel très bon marché, ou …un hôtel très bon marché, ou …

Page 9: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(9)

… … un hôtel de luxe, ou …un hôtel de luxe, ou …

Page 10: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(10)

… … un hôtel abordable mais correct …un hôtel abordable mais correct …

Page 11: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(11)

aïe, ce site pose un problème, c’est en aïe, ce site pose un problème, c’est en Hongrois, une langue que presque Hongrois, une langue que presque

personne ne comprend ; mais…personne ne comprend ; mais…

Page 12: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(12)

… … celui-ci devrait allercelui-ci devrait aller

Page 13: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(13)

Naturellement, nous pouvons aussi nous Naturellement, nous pouvons aussi nous fier à un site spécialisé…fier à un site spécialisé…

Page 14: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(14)

… … comme celui-ci, ou…comme celui-ci, ou…

Page 15: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(15)

… … celui-làcelui-là

Page 16: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(16)

Vous voudriez, peut-être, avoir une idée de Vous voudriez, peut-être, avoir une idée de Budapest avant d’y aller ; essayons de Budapest avant d’y aller ; essayons de

trouver des photos…trouver des photos…

Page 17: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(17)

… … sur flickr …sur flickr …

Page 18: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(18)

… … sur Google …sur Google …

Page 19: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(19)

… … vous pouvez aussi regarder mes photos vous pouvez aussi regarder mes photos

Page 20: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(20)

……ou consulter un site (social) de voyagesou consulter un site (social) de voyages

Page 21: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(21)

Qu’avons nous fait ?Qu’avons nous fait ?Nous avons consulté un nombre de sites de styles différents créés pour des utilisations différentes, peut-être même dans des langues différentes…Nous avons dû intégrer toutes ces informations pour arriver à notre butNous savons tous que, dans certains cas, il s’agit là d’un processus long et fatigant !

Page 22: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(22)

En fait, toutes ces pages ne sont que les parties visibles de l’iceberg ! En effet :

les vrais données sont cachées dans des bases de données, des fichiers XML, des pages Excel…nous avons accès uniquement à ce que les concepteurs des sites nous laissent voir

Page 23: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(23)

Les sites spécialisées (Expedia, TripAdvisor) font un peu plus :

ils collectent et combinent des données de sources diverses mais ils continuent a contrôler ce que l’utilisateur peut voir

Dans certains cas, vous voudriez personnaliser : c’est à dire, accéder aux données et les combiner vous-même !

Page 24: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(24)

Voici un exemple…Voici un exemple…

Page 25: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(25)

Des compagnies utilisatrices sont contraintes à embaucher des experts pour manier ce genres de bases de données !

Page 26: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(26)

Un autre exemple : les sites sociaux. J’ai Un autre exemple : les sites sociaux. J’ai une liste « d’amis » sur…une liste « d’amis » sur…

Page 27: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(27)

… … Dopplr, Dopplr,

Page 28: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(28)

… … Twine,Twine,

Page 29: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(29)

… … LinkedIn,LinkedIn,

Page 30: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(30)

… … et, naturellement, Facebooket, naturellement, Facebook

Page 31: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(31)

J’ai dû re-ajouter et re-contacter mes amis pour tous les sites, indépendamment l’un de l’autreCeci est même pire qu’avant : c’est moi qui ajoute à l’iceberg, mais je n’ai pas nécessairement accès à mes propre données…

Page 32: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(32)

Que voudrions-nous avoir ?Que voudrions-nous avoir ?Pouvoir utiliser les données sur le Web comme nous utilisons les documents :

pouvoir créer des liens à des données (indépendamment de leur présentation)pouvoir utiliser les données comme nous le voulons sur nos sites et programmes sur le Web

Page 33: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(33)

En d’autres termes…En d’autres termes…Nous voudrions élargir le Web actuel pour arriver à un « Web des données »

permettre aux applications d’exploiter les données directement

Page 34: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(34)

Une minuteUne minute  ! N’est-ce pas ce que les ! N’est-ce pas ce que les ««  mashupsmashups  » font déjà» font déjà  ??

Page 35: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(35)

Un exemple d’un «Un exemple d’un «  mashupmashup  » :» :

Page 36: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(36)

D’un certain sens oui, et cela montre le potentiel énorme du Web des donnéesMais ces sites sont contraints à faire un travail ad-hoc :

les données ne sont souvent accessibles que par le biais de servicestous ont des APIs, des logiques, des structures différentespour toutes nouvelles données, les sites doivent recommencer à zéro, parce qu’il n’existe aucun moyen standard pour accéder aux données

Page 37: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(37)

En d’autre termes …En d’autre termes …Nous voudrions élargir le Web actuel pour arriver à un « Web des données » par des moyens standards

Page 38: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(38)

Mais qu’est-ce que cela veut direMais qu’est-ce que cela veut dire en  en pratique pratique ? ?

Comment fonctionne le Web actuel ?des document sont créésils reçoivent une adresse (un URI) et ils sont mis à disposition sur le Web

Page 39: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(39)

Un exemple : le site de Steven sur AmsterdamUn exemple : le site de Steven sur Amsterdam(créé pour des amis)(créé pour des amis)

Page 40: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(40)

Puis vient la magie…Puis vient la magie…D’autres découvrent le site et ils s’y « lient » Plus il y a ce genre de liens, plus la page est importante, donc plus la page est connu

c’est l’essentiel du fonctionnement de Google !C’est « l’effet réseau » : certaines pages deviennent importants, sont exploitées par d’autres, souvent d’une manière inattendue même pour l’auteur de l’original

Page 41: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(41)

Ceci n’était pas une surprise…Ceci n’était pas une surprise…

Page 42: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(42)

mais celui-ci, provenant de l’autre bout du mais celui-ci, provenant de l’autre bout du Globe, en était une…Globe, en était une…

Page 43: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(43)

Que veut dire tout cela pour le Web des Que veut dire tout cela pour le Web des données?données?

Nous devrions être capable de« publier » les données sur le Web par des moyens standards

en analogie avec les documents : donnons des URI aux données

créer des liens aux URI-s à partir d’autres données (documents ou autres)

une solution générique et standard devrait être utilisée les applications ne devraient pas être forcées de développer

des approches différentes pour toutes sources de donnéeset laissons l’effet réseau agir …

Page 44: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(44)

Exemple : combiner des donnéesExemple : combiner des donnéesUne compagnie pharmaceutique a une quantité importante de données sur son intranet

dans des formats différents (XML, BdD,…)

Courtesy of Nigel Wilkinson, Lee Harland, Pfizer Ltd, Melliyal Annamalai, Oracle (SWEO Case Study)

Pour les réutiliser :les informations essentielles sont mises sur le Web par des moyens standardsun outil public est utilisé pour l’intégration, la visualisation, la recherche

Page 45: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(45)

En pratique, c’est un peu plus compliquéEn pratique, c’est un peu plus compliquéSur le Web traditionnel l’humain est implicitement pris en compte :

un lien a aussi un « contexte » qu’une personne peut reconnaître et utiliser

Page 46: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(46)

Par exemple, l’adresse sur ma pagePar exemple, l’adresse sur ma page

Page 47: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(47)

… … mène a la page suivante :mène a la page suivante :

Page 48: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(48)

L’humain comprend que ceci est la page d’accueil de mon institutionIl saura, plus ou moins, que cela signifie un institut de recherche à AmsterdamSur le Web des données il y a donc quelque chose qui manque : en soi, la machine ne comprend pas la signification du lien

Page 49: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(49)

Une nouvelle contrainte :un élément d’information doit être ajoutée au lien : « ceci est un lien vers mon institution, un institut de recherche »cette information doit être accessible par la machine

Ceci est, en fait, une classification (caractérisation) aussi bien du lien que de la page qui est liée

en certain cas, cette classification peut permettre un forme limitée de raisonnement

Page 50: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(50)

Mettons tout ensemble !Mettons tout ensemble !Pour un Web des données, nous avons besoin :

de l’utilisation des URI-s pour publier nos donnéesde permettre de créer des liens à partir des données vers d’autres donnéesde caractériser/classifier les données et les liens pour transmettre un peu plus d’informationd’utiliser des moyens standards pour tout cela !

Page 51: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(51)

Exemple : trouver les experts chez NASAExemple : trouver les experts chez NASA

Il y a presque 70,000 fonctionnaires chez la NASA, répartis sur tous les États UnisLeur expertise est décrite dans 6-7 bases de données différentes, réparties sur tout le territoire des USA, avec des schémas, des structures, etc. tous différents …Problème : trouver les experts requis pour une tâche spécifique au sein de la NASA!

Michael Grove, Clark & Parsia, LLC, and Andrew Schain, NASA, (SWEO Case Study)

Page 52: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(52)

Exemple : trouver les experts chez NASAExemple : trouver les experts chez NASAL’approche choisie : intégration standard des données, description des données et des liens avec des vocabulaires génériques

Michael Grove, Clark & Parsia, LLC, and Andrew Schain, NASA, (SWEO Case Study)

Page 53: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(53)

Mais qu’est ce que c’est le Web Mais qu’est ce que c’est le Web sémantique ?sémantique ?

Page 54: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(54)

Un ensemble de technologies standards Un ensemble de technologies standards pour réaliser le Web des donnéespour réaliser le Web des données

Page 55: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(55)

C’est aussi simple que cela…Naturellement, les détails peuvent être compliqués

un modèle commun doit être défini pour une structure des liens et pour les classifications pour un domaine spécifique, la classifications des termes peut être très compliquée : c’est là où les ontologies, les vocabulaires, etc, entrent en jeu

Page 56: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(56)

ExempleExemple : eTourism à Zaragoza: eTourism à Zaragoza

Service d’itinéraire personnaliséIntégration de bases de données à Zaragoza (utilisant des ontologies)Utilisation d’un moteur de raisonnement

Courtesy of Jesús Fernández, Municipality of Zaragoza, and Antonio Campos, CTIC (SWEO Use Case)

Page 57: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(57)

Une minuteUne minute ! Dois-je convertir toute mes ! Dois-je convertir toute mes données pour pouvoir fonctionner sur un données pour pouvoir fonctionner sur un

Web des donnéesWeb des données ??

Page 58: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(58)

Pas nécessairement ; ça ne serait pas toujours possibleIl y a des technologies pour accéder aux données par des moyens standards sans les convertir

des « ponts » (par exemple, ré-écriture des requêtes)annotations des données existantes (par exemple, des pages XHTML)

Ces techniques sont encore en développement

Page 59: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(59)

ExempleExemple : intégration des connaissances de : intégration des connaissances de la médecine chinoise traditionnelle la médecine chinoise traditionnelle

Intégration de plus de 80 bases de donnéesUtilisation d’ontologies spécifiquesGénération des interrogation en SQL « on the fly »

Courtesy of Huajun Chen, Zhejiang University, (SWEO Case Study)

Page 60: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(60)

Groupe d’intérêt de W3C pour la santé et les Groupe d’intérêt de W3C pour la santé et les sciences du vivantsciences du vivant

La communauté « HCLS » se trouve en face de problèmes majeurs d’intégration

recherche pharmaceutique, données médicales des patients, processus pour approuver de nouveaux médicaments,…

La communauté avait besoin d’un lieu neutre pour discuter des problèmes techniquesd’un contact plus direct avec la communauté du Web sémantique

W3C avait besoindes contacts avec une communauté d’utilisateurs majeurede pouvoir ajuster les choix techniques au besoins pratiques, de bénéficier des expériences

Page 61: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(61)

Groupe HCLSGroupe HCLSDéveloppe des « expérimentations », des démonstrations pour prouver la fiabilité de la technologie

le groupe est divisé en « task forces » pour se concentrer sur des problèmes différents

Publie des notes, des articles, etc, sur le sujetDéveloppe des stratégies de communication vers l’industrie (réunions, conférences, rencontres industrielles)Offre un forum de discussion pour les experts

Page 62: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(62)

Démonstration HCLS : cibles pour la maladie Démonstration HCLS : cibles pour la maladie d’Alzheimerd’Alzheimer

Signal transduction pathways are considered to be rich in proteins that might respond to chemical therapy

CA1 Pyramidal Neurons are known to be particularly damaged in Alzheimer’s disease

Can we find candidate genes known to be involved in signal transduction and active in Pyramidal Neurons?

Page 63: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(63)

Pour la réponse : intégration de donnéesPour la réponse : intégration de donnéesW3C HCLS IG a intégré un nombre de bases de données et d’ontologies publiques

assigner un URI aux entités biologiquesconversion ou accès aux données avec des techniques du Web sémantique (400M de relations en mai 2007)utilisation d’un moteur d’inférence pour trouver des nouvelles relationsutilisation d’un langage d’interrogation pour répondre aux questions spécifiques

Page 64: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(64)

Les bases de donnéesLes bases de données

Page 65: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(65)

Utilisation du langage d’interrogation…Utilisation du langage d’interrogation…

prefix go: <http://purl.org/obo/owl/GO#>prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>prefix owl: <http://www.w3.org/2002/07/owl#>prefix mesh: <http://purl.org/commons/record/mesh/>prefix sc: <http://purl.org/science/owl/sciencecommons/>prefix ro: <http://www.obofoundry.org/ro/ro.owl#>

select ?genename ?processnamewhere{ graph <http://purl.org/commons/hcls/pubmesh> { ?paper ?p mesh:D017966 . ?article sc:identified_by_pmid ?paper. ?gene sc:describes_gene_or_gene_product_mentioned_by ?article. } graph <http://purl.org/commons/hcls/goa> { ?protein rdfs:subClassOf ?res. ?res owl:onProperty ro:has_function. ?res owl:someValuesFrom ?res2. ?res2 owl:onProperty ro:realized_as. ?res2 owl:someValuesFrom ?process. graph <http://purl.org/commons/hcls/20070416/classrelations> {{?process <http://purl.org/obo/owl/obo#part_of> go:GO_0007166} union {?process rdfs:subClassOf go:GO_0007166 }} ?protein rdfs:subClassOf ?parent. ?parent owl:equivalentClass ?res3. ?res3 owl:hasValue ?gene. } graph <http://purl.org/commons/hcls/gene> { ?gene rdfs:label ?genename } graph <http://purl.org/commons/hcls/20070416> { ?process rdfs:label ?processname}}

Mesh: Pyramidal Neurons

Pubmed: Journal Articles

Entrez Gene: Genes

GO: Signal Transduction

Courtesy of Susie Stephens, Eli Lilly, Alan Ruttenberg, Science Commons, and the W3C HCLS IG

Page 66: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(66)

Tout ceci produit des réponses…Tout ceci produit des réponses…

DRD1, 1812 adenylate cyclase activationADRB2, 154 adenylate cyclase activationADRB2, 154 arrestin mediated desensitization of G-protein coupled receptor protein signaling pathwayDRD1IP, 50632 dopamine receptor signaling pathwayDRD1, 1812 dopamine receptor, adenylate cyclase activating pathwayDRD2, 1813 dopamine receptor, adenylate cyclase inhibiting pathwayGRM7, 2917 G-protein coupled receptor protein signaling pathwayGNG3, 2785 G-protein coupled receptor protein signaling pathwayGNG12, 55970 G-protein coupled receptor protein signaling pathwayDRD2, 1813 G-protein coupled receptor protein signaling pathwayADRB2, 154 G-protein coupled receptor protein signaling pathwayCALM3, 808 G-protein coupled receptor protein signaling pathwayHTR2A, 3356 G-protein coupled receptor protein signaling pathwayDRD1, 1812 G-protein signaling, coupled to cyclic nucleotide second messengerSSTR5, 6755 G-protein signaling, coupled to cyclic nucleotide second messengerMTNR1A, 4543 G-protein signaling, coupled to cyclic nucleotide second messengerCNR2, 1269 G-protein signaling, coupled to cyclic nucleotide second messengerHTR6, 3362 G-protein signaling, coupled to cyclic nucleotide second messengerGRIK2, 2898 glutamate signaling pathwayGRIN1, 2902 glutamate signaling pathwayGRIN2A, 2903 glutamate signaling pathwayGRIN2B, 2904 glutamate signaling pathwayADAM10, 102 integrin-mediated signaling pathwayGRM7, 2917 negative regulation of adenylate cyclase activityLRP1, 4035 negative regulation of Wnt receptor signaling pathwayADAM10, 102 Notch receptor processingASCL1, 429 Notch signaling pathwayHTR2A, 3356 serotonin receptor signaling pathwayADRB2, 154 transmembrane receptor protein tyrosine kinase activation (dimerization)PTPRG, 5793 transmembrane receptor protein tyrosine kinase signaling pathwayEPHA4, 2043 transmembrane receptor protein tyrosine kinase signaling pathwayNRTN, 4902 transmembrane receptor protein tyrosine kinase signaling pathwayCTNND1, 1500 Wnt receptor signaling pathway

Many of the genes are indeed related to Alzheimer’s Disease through gamma secretase (presenilin) activity

Courtesy of Susie Stephens, Eli Lilly, Alan Ruttenberg, Science Commons, and the W3C HCLS IG

Page 67: Qu’est-ce le Web sémantique? Ivan Herman, W3CCopyright © 2008, W3C C (66) Tout ceci produit des réponses… DRD1, 1812 adenylate cyclase activation ADRB2, 154 adenylate cyclase

Copyright © 2008, W3C

C

(67)

L’essentiel…L’essentiel…L’essentiel de la démonstration était l’accès et l’intégration des données publiques par le biais du Web sémantique