Raisonner le web s©mantique avec des graphes - Inria .conceptuels, bases de donn©es relationnelles

  • View
    212

  • Download
    0

Embed Size (px)

Text of Raisonner le web s©mantique avec des graphes - Inria .conceptuels, bases de donn©es...

  • Plate-forme AFIA / Nice, du 30 mai au 3 juin 2005

    JOURNEE THEMATIQUE:

    Raisonner le web smantique avec des graphes

    Michel Leclre Francky Trichet

    Olivier Corby Catherine Faron-Zucker

  • Introduction Depuis quelques annes, une certaine effervescence rgne autour du concept de web smantique , effervescence qui a conduit lmergence de plusieurs standards web smantique de reprsentation de connaissances : RDF, le langage de reprsentation d'annotations ; OWL, le langage de reprsentation d'ontologies ; RuleML le langage de reprsentation de rgles. Ces langages disposent pour certains d'une smantique formelle mais ne disposent pas de mcanismes de raisonnement. Ce sont des langages d'change de connaissances sur le web, qui n'ont pas vocation offrir de tels services. Cependant la mise en place dun service infrentiel pour le web smantique ncessite de dfinir des mcanismes d'oprationnalisation de ces langages, , i.e. des mcanismes visant ajouter une smantique oprationnelle la smantique formelle des primitives et de leurs constructeurs. Si les logiques de descriptions sont la cible privilgie pour oprationnaliser OWL, elles ne sont l'heure actuelle pas capables de supporter RDF ou RuleML.

    Le web smantique vhicule galement l'ide d'un web comprhensible la fois par les hommes et les machines. Les travaux sur les Topic Maps rpondent cette ide en permettant une reprsentation aise des connaissances par des graphes btis autour de notions simples. Cependant, ils ne disposent pas dune smantique formelle permettant de dfinir les raisonnements que lon pourrait mettre en place sur eux

    Il existe en France une communaut de chercheurs travaillant autour de la reprsentation de connaissances et des raisonnements partir de graphes. Cette communaut partage un mme formalisme de reprsentation des connaissances : les graphes conceptuels.

    La demi-journe thmatique raisonner le web smantique avec des graphes doit permettre de runir les chercheurs et industriels intresss par ce thme afin de croiser les diffrents points de vues, dchanger sur les projets en cours et denvisager la naissance dune collaboration scientifique sur ce thme. On cherchera cibler quelles infrences sont utiles pour le web smantique, et en quoi les modles de graphes permettent de rpondre ces infrences. Les prsentations pourront aborder des problmes thoriques aussi bien quapplicatifs et pourront concerner des travaux passs, en cours ou en projet

    Les prsentations porteront sur les sujets suivants (liste non-exhaustive): Annotation : construction, vrification ; Ontologies : construction, validation, alignement, fusion ; Requtes : formulation, reformulation, extension de requtes ; Moteurs dinfrences : recherche dinformation, navigation smantique, services

    smantiques, implmentation (passage l'chelle, aspects distribus) ; Liens entre langages du web smantique (RDF/S, OWL, RuleML, Topic Maps) et

    langages de graphes ; Applications ; Interface et visualisation des connaissances.

  • Sommaire: Le moteur de recherche smantique Corese O. Corby, R. Dieng-Kuntz, C. Faron-Zucker, F. Gandon, A. Giboin INRIA Sophia Antipolis, I3S Universit de Nice

    1-3

    OWL-SG : un sous-langage pour la famille OWL F. Comte, M. Leclre, M.L. Mugnier LIRMM

    5-10

    Raisonner sur les ontologies au niveau meta F. Trichet, F. Frst LINA

    11-13

    Proximit conceptuelle et distances de graphes F. Gandon, O. Corby, R. Dieng-Kuntz, A. Giboin ACACIA - INRIA

    15-17

    Raisonner le web smantique avec des graphes : application un cas industriel Olivier Carloni LIRMM, Mondeca

    19-24

    Flexibilit de la recherche d'information dans les projets de conception C. Djaiz, N. Matta, O. Corby, W. Lone, W. Lesguillier Tech-Cico (UTT), ACACIA-INRIA

    25-28

    MIEL++ : un entrept intgrant des donnes floues exprimes en graphes conceptuels, bases de donnes relationnelles et XML P. Buche, J. Dibie-Barthlemy, D. Doussot, O. Haemmerl, G. Hignette, R. Thomopoulos INRA-Mt@risk, INA P-G/INRA MIA, LRI, INRA

    29-31

  • 1

    Le moteur de recherche smantique CoreseOlivier Corby

    , Rose Dieng

    , Catherine Faron-Zucker

    , Fabien Gandon

    et Alain Giboin

    (1) INRIA Sophia Antipolis, (2) I3S Universit de Nice - Sophia Antipolis

    I. INTRODUCTION

    Corese 1 est un moteur de recherche smantique pourRDF, le langage standard du web smantique recommandpar le W3C. Ce moteur est ddi des applications deweb smantique communautaire ou dentreprise. Il permetla recherche dinformation base sur des modlisations deconnaissances, des modles conceptuels ou des rfrentielsmtier et organisationnel. Il implmente RDF/S dans le mod-le des graphes conceptuels. Cet article montre lintrt desgraphes conceptuels pour le web smantique, pour raisonneravec RDF/S.

    Corese charge des meta donns RDF, des ontologies auformat RDF Schema, et comprend un langage de rglesadapt RDF. Il construit une reprsentation interne de cesinformations sous forme de graphes conceptuels sur lesquelsil raisonne par projection de graphes pour rpondre desrequtes de recherche dinformation dans la base de metadonnes RDF. Les rsultats de requtes sont retourns auformat RDF/XML et sont traits par des feuilles de style XSLTpour engendrer des formats de prsentation lisibles par lesutilisateurs (HTML, SVG, etc.).

    II. CORRESPONDANCE ENTRE RDF ET CG

    Les modles de RDF/S et des Graphes Conceptuels (GC)prsentent de nombreuses similarits. Nos travaux passs surles GC nous ont permis de comprendre la nature et lutilitde RDF/S associ XML en 1999. Ds cette anne nousdisposions dune premire maquette de RDF en GC. Nousavons propos une correspondance entre les GC et RDF/Sen 2000[2]. En 2001, Tim Berners-Lee publiait une notesoulignant la similarit entre RDF et les graphes conceptuels[1].

    Essentiellement, les deux modles distinguent connais-sances assertionnelles et connaissances ontologiques. Les con-naissances assertionnelles sont positives, conjonctives et ex-istentielles; elles sont reprsentes par des graphes orients,tiquets bipartites. Dans Corese, un graphe RDF reprsentantune annotation ou une requte est traduit en un GC. Quant auxconnaissances ontologiques, la hirarchie de classes (resp. pro-prits) du schema RDFS est traduite sous forme de hirarchiede types de concept (resp. relations) du support de GC. Lesproprits RDF sont des entits de premier ordre comme lesclasses RDFS, de la mme manire que les types de relationsont dclars sparment des types de concept dans le supportdes GC. Ce traitement similaire des proprits/relations rendla mise en correspondance des formalismes particulirement

    1http://www.inria.fr/acacia/corese

    pertinent, au regard en particulier des langages objets o lesproprits appartiennent aux classes.

    Les diffrences entre les deux modles rsident essentielle-ment en ce que RDF permet dassocier plusieurs classes une ressource et de dclarer plusieurs classes en domain eten range dans la signature dune proprit. Ceci est traduiten GC en engendrant le plus gnral sous-type commun destypes correspondant aux classes.

    Ainsi dans Corese la hirarchie des types est compileet un type compil est associ chaque ressource RDF.Pour rpondre une requte sur les mtadonnes RDF, lesalgorithmes de raisonnement de Corese sont alors bass surlopration de projection de graphe. En outre, une ontologiereprsente par un schema RDFS, en tant que documentRDF, est galement charg sous forme de graphe conceptuel.Cela permet Corese de rpondre des requtes portant surlontologie elle-mme.

    III. MOTEUR DE RECHERCHE

    A. Langage de requte

    Linterrogation dune base de graphes se fait dans Coreseen crivant des graphes requtes et en les projetant sur la basede graphes. Toutefois, en utilisant la forme de graphe pourexprimer des requtes on atteint rapidement des limites. Lesproblmes rencontrs sont : le OU boolen, les expressionsvaluables et lintroduction doprateurs comme optional, not,select, group, etc. Pour ces raisons nous avons conu unlangage de requtes bas sur le modle de triplets de RDF ettraduit en graphe conceptuel. Par exemple la requte suivanterecherche les personnes (1) ayant un nom (2) qui sont lesauteurs (3) dune thse (4) qui a un titre (5) qui contient lemot web (6).

    (1) ?p rdf:type c:Person(2) ?p c:name ?n(3) ?p c:author ?doc(4) ?doc rdf:type c:Thesis(5) ?doc c:Title ?title(6) ?title ~ web

    Chaque lment de la requte est un triplet de laforme ressource proprit valeur ou une expres-sion valuable. Le noyau du langage de requte de Corese estcompatible avec la proprosition SPARQL du W3C.

    Corese exploite la projection de graphes pour calculerles rponses aux requtes et implmente en outre quelquesextensions de de cette opration.

    fgandon1

    fgandon1

  • 2

    B. Variable de proprit

    Le langage de requte de Corese permet dutiliser des vari-ables pour dsigner des proprits dans une requte. La ligne(4) de la requte suivante recherche toute valeur de proprit,dsigne par ?p, du document. Plusieurs occurrences de lamme variable sont lies la mme proprit par projection.

    (1) ?doc rdf:type c:Thesis(2) ?doc c:title ?title(3) ?title ~ web(4) ?doc ?p ?value

    C. Chemins

    Corese permet de rechercher des chemins de relations,orients ou non orients reliant deux ressources. Par exem-ple, la requte suivante recherche une personne relie uneressource de type science sociale par un chemin non orientde longueur au plus 5, par des relations de type (ou sous-typesde) c:Relation :

    (1) ?person rdf:type c:Person(2) ?person c:Relation{5} ?topic(3) ?topic rdf:type c:SocialScience

    D. Projection approche

    Dans certains cas, une requte peut ne pas avoir de rponseexacte dans la base de graphes. Corese implmente un al-gorithme de recherche approche qui calcule les meilleuresapproximations des types de