Upload
mariemmahfoudh
View
773
Download
1
Embed Size (px)
DESCRIPTION
La modélisation des systèmes d’informations et l’interrogation de leurs données présentent de plus en plus un défi primordial qui ne cesse de s’imposer. Les solutions proposées dans la littérature étaient principalement organisées autour des bases de données (BD), des entrepôts de données et plus récemment, des ontologies. Cette multitude de formalismes a entraîné la nécessité d’étudier le couplage entre les différents supports de stockage et d’interrogation de l’information. Ce travail s’intéresse à étudier le couplage entre BD et ontologie recouvrant le même domaine d’étude, pour la satisfaction des requêtes utilisateurs. L'approche proposée se base sur un ensemble de règles définies et dédiées pour la recherche de l'information pertinente permettant de satisfaire les requêtes SQL et SPARQL. Un outil de couplage est également développé pour implémenter et valider nos propositions.
Citation preview
1
Journal Technique et Science Informatiques TSI 2013, volume 32
4èmes Journées Francophones sur les OntologiesJFO 2011, 22-23 Juin 2011 – Montréal, Canada
Approche de couplage de BD et d’ontologie pour l’aide à la décision sémantique : contribution pour les
requêtes SQL et SPARQL.
Mariem Mahfoudh & Wassim Jaziri{mariem.mahfoudh, wassim.jaziri}@gmail.com
ISIMS-MIRACL, Université de Sfax, Tunisie
2
Besoin de modélisation des systèmes d’information.
Besoin d’interrogation de leurs données.
BDsBDs Entrepôt de donnéesEntrepôt de données OntologiesOntologies
Satisfaction des requêtes utilisateurs
Contexte
En présence d’une multitude de cadres et formalismes
JFO 2011, TSI 2013
3
Besoin de modélisation des systèmes d’information.
Besoin d’interrogation de leurs données.
BDsBDs OntologiesOntologies
Satisfaction des requêtes utilisateurs
Contexte
En présence d’une multitude de cadres et formalismes
JFO 2011, TSI 2013
4
Travaux liés
Règles & Exemples
Conclusion et perspectives
Implémentation
Approche proposée
PlanTravaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
5
Travaux liés
Suivre une approche BD puis dériver vers des spécifications sémantiques conduisant à la construction d’une ontologie,
Formes de couplage entre BD et ontologie:
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Entamer une approche ontologique aboutissant à la construction de l’ontologie qui servira à concevoir la BD.
JFO 2011, TSI 2013
6
Construction des ontologies à partir des BDs.
Approches variées à des niveaux différentes.
Travaux liésTravaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
La plupart des outils développés : une aide à la construction d’ontologies .
Règles utilisées basées sur une extraction «plate» :
Les ontologies résultantes contiennent certaines incohérences et souffrent du manque de sémantique.
Structure de l’ontologie très proche du schéma de la BD.
JFO 2011, TSI 2013
7
Perte de structure : la transformation n'est pas sans perte.
Problèmes de redondance et d’incohérence de la BD résultante.
Travaux liés
Construction des BDs à partir des ontologies.
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
JFO 2011, TSI 2013
88
Limites des approches existantes :
Problèmes liés à la négligence des spécificités des ontologies et des BDs.
La BD et l’ontologie n’ont ni la même structure ni les mêmes composants
La BD et l’ontologie n’ont ni la même structure ni les mêmes composants
Travaux liésTravaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
BD : évolutivité, efficacité de stockage, structuration idéale permettant un temps optimal d’exécution des requêtes.
BD : évolutivité, efficacité de stockage, structuration idéale permettant un temps optimal d’exécution des requêtes.
Ontologie : consensuelle, référençable, expressive, formelle,fournit une contribution essentielle au défi de l'intégration des
données hétérogènes.
Ontologie : consensuelle, référençable, expressive, formelle,fournit une contribution essentielle au défi de l'intégration des
données hétérogènes.
JFO 2011, TSI 2013
une structuration forte des données et une capacité de stockage
importante : la BD ;
une sémantique explicite : l’ontologie.
9
L’utilisation simultanée de l’ontologie et de la BD apporte :
Travaux liésTravaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Etudier le mapping entre une ontologie et une BD
Orientation peu adoptée [Barrasa et al., 2004] [Hu et al., 2007].
JFO 2011, TSI 2013
10
Plan
Travaux liés
Règles & Exemples
Conclusion et perspectives
Implémentation
Approche proposée
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Hypothèses :
La BD et l’ontologie existent déjà et sont cohérentes l’une vis-à-vis de l’autre et qu’elles modélisent le même domaine d’étude.
La BD contient toutes les instances.
L’ontologie présente la sémantique du domaine d’étude et ne contient aucun individu.
11
Nous nous plaçons dans le cadre d’un système visant à satisfaire les requêtes classiques et sémantiques de l’utilisateur.
Nous nous plaçons dans le cadre d’un système visant à satisfaire les requêtes classiques et sémantiques de l’utilisateur.
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Approche proposée
JFO 2011, TSI 2013
Nous distinguons trois catégories de requêtes :
Requête simple : comporte des informations directement explicitées dans la BD.
Requête sémantique : comporte des interrogations nécessitant de déduire des connaissances.
Requête mixte : demande à la fois l’accès à la BD et à l’ontologie.
12
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Approche proposée
JFO 2011, TSI 2013
Création de fichier de correspondance entre
BD et ontologie
Analyse de la BD et de l’ontologie
Select … from
Analyse des requêtes utilisateurs
Traitement des requêtes utilisateurs
Déterminer type et réponse de la requête utilisateur
13
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Approche proposée
JFO 2011, TSI 2013
Approche proposée
14
Analyse de la BD et de l’ontologie
Création de fichier de correspondance
Analyse des requêtes utilisateurs
Traitement des requêtes utilisateurs
Extraire les différents éléments de l’ontologie ( les concepts, les propriétés…) et de la BD (les tables, les colonnes…)
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
JFO 2011, TSI 2013
Approche proposée
15
Analyse de la BD et de l’ontologie
Création de fichier de correspondance
Analyse des requêtes utilisateurs
Traitement des requêtes utilisateurs
Chercher les correspondances entre la BD et l’ontologie : synonymies, méronymies et subsomptions.
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
JFO 2011, TSI 2013
Approche proposée
16
Analyse de la BD et de l’ontologie
Création de fichier de correspondance
Analyse des requêtes utilisateurs
Traitement des requêtes utilisateurs
- Distinguer les mots réservés des langages d‘interrogation de ceux introduits par l’utilisateur- Déterminer la source de ces termes- Déterminer leurs rôles.
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
JFO 2011, TSI 2013
Requête Simple
Lancer
Tous les termes BDTous les termes BD termes {BD +ontologie}termes {BD +ontologie}
17
Traitement des requêtes utilisateurs
Tous les termes ontoTous les termes onto
RequêteRequête
Le langage de la requête est capable d’interroger la BD ?
La requête est valide ?
Requête erronée
Transformer le langageTransformer le langage
Reformulation de la requêteReformulation de la requête
terme {BD +ontologie} terme {BD +ontologie}
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Approche proposée
JFO 2011, TSI 2013
Lancer
Tous les termes BDTous les termes BD termes {BD +ontologie}termes {BD +ontologie}
18
Traitement des requêtes utilisateurs
Tous les termes ontoTous les termes onto
RequêteRequête
Requête Mixte
Le langage est capable d’interroger la BD et les termes ont des correspondance dans la BD ?
Requête Sémantique
Transformer les termes en se basant sur le fichier de correspondance
Transformer les termes en se basant sur le fichier de correspondance
Extraction des connaissancesExtraction des connaissances
Requête Erronée
La requête est valide ?
terme {BD +ontologie} terme {BD +ontologie}
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Approche proposée
JFO 2011, TSI 2013
Reformuler Req en se basant sur le fichier de correspondance
Reformuler Req en se basant sur le fichier de correspondance
Lancer
Tous les termes BDTous les termes BD termes {BD +ontologie}termes {BD +ontologie}
19
Traitement des requêtes utilisateurs
Tous les termes ontoTous les termes onto
RequêteRequête
terme {BD +ontologie} terme {BD +ontologie}
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Approche proposée
JFO 2011, TSI 2013
Lancer
Tous les termes BDTous les termes BD termes {BD +ontologie}termes {BD +ontologie}
20
Traitement des requêtes utilisateurs
Tous les termes ontoTous les termes onto
RequêteRequête
Demander l’assistance d’un expert
Demander l’assistance d’un expert
terme {BD +ontologie} terme {BD +ontologie}
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Approche proposée
JFO 2011, TSI 2013
21
Le langage SQL (Structured Query Language) : le standard utilisé par les principaux SGBD.
Approche appliquée dans le cadre de deux langages standards :
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Approche proposée
Le langage SPARQL (Protocol And RDF Query Language) : langage recommandé par le W3C et capable d’exploiter et d’interroger les différents formalismes du Web sémantique.
Une requête SQL peut être soit simple soit mixte.
Une requête SPARQL peut être soit simple, sémantique ou bien mixte.
JFO 2011, TSI 2013
22
Travaux liés
Règles & Exemples
Conclusion et perspectives
Implémentation
Approche proposée
PlanTravaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Si une requête est inadaptée
Alors le système doit faire appel au fichier de correspondance et
remplacer les termes inadaptés par leurs synonymes s’ils existent
Sinon il va chercher dans les sous concepts en admettant
une reformulation par spécialisation
Sinon il faut suivre une reformulation par méronymie
Règles & Exemples
Règles :
23
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
JFO 2011, TSI 2013
Règles & Exemples
Règles :
24
Etendre la reformulation par spécialisation aux synonymes des concepts
fils.
Parcourir des niveaux plus profonds de la hiérarchie : chercher dans les
descendants des concepts fils et ne pas se limiter aux descendants
directs.
Select * from person
Exemple :
Select Item From Item
BD & Onto
Si après reformulation par spécialisation, la requête demeure inadaptée :
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
JFO 2011, TSI 2013
Prefix rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns#
Prefix onto: http://www.semanticweb.org/ontologies/2010/6/Ontology12.owl#
Select ?individu
Where { ?individu rdf:type onto:teacher }
Prefix rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns#
Prefix onto: http://www.semanticweb.org/ontologies/2010/6/Ontology12.owl#
Select ?individu
Where { ?individu rdf:type onto:teacher }
25
Règle :
Si une requête SPARQL a le prédicat « rdf:type » et demande l’affichage
d’un sujet
Alors, son but est d’afficher des instances ce qui nécessite de la traduire en
SQL et de l’orienter vers la BD où elles sont stockées toutes les instances.
predicat objetsujet
Travaux liés Implémentation ConclusionRègles & ExemplesApproche proposée
Règles & Exemples
JFO 2011, TSI 2013
26
Travaux liés
Règles & Exemples
Conclusion et perspectives
Implémentation
Approche proposée
PlanTravaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
L’outil CoDBOnto :
Implémentation
27
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
L’outil CoDBOnto :
Implémentation
28
Démonstration
Jena : plateforme Java pour la manipulation des ontologies.
ZQL : API Java pour l’analyse syntaxique des requêtes SQL.
ARQ : Analyse syntaxique des requêtes SPARQL.
RitaWN : API java permettant un accès simple à l'ontologie WordNet.
JDOM : API Java pour la manipulation de doc XML.
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
JFO 2011, TSI 2013
29
Travaux liés
Règles & Exemples
Conclusion et perspectives
Implémentation
Approche proposée
PlanTravaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Elaboration d’une démarche permettant de cohabiter des BDs et des ontologies de domaine via un couplage assurant la satisfaction des requêtes utilisateur.
30
Conclusion & Perspectives
Etude des approches réalisant le couplage de BD et d’ontologie.
Implémentation de l’outil CoDBOnto.
Définition des règles permettant la reformulation des requêtes SQL et SPARQL.
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
JFO 2011, TSI 2013
31
Perspectives :
Etudier la transformation des requêtes SPARQL en SQL et inversement afin d'intégrer des fonctionnalités de couplage plus avancées.
Mener des expérimentations poussées pour analyser l’impact de nos différentes propositions.
Travailler sur l’amélioration des règles et l’enrichissement des services offerts par notre outil.
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
Conclusion & Perspectives
JFO 2011, TSI 2013
MERCI de VOTRE
ATTENTION
BD & Ontologie
33
BD:
Ontologie:
teacher (cin, name, category)
paper (cod_pap, title, date) writes (cod_pap, cin)
Select * from personSelect * from person
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
JFO 2011, TSI 2013
34
BD & Ontologie
34
Ontologie:
Extrait XML de fichier de correspondance
Select * from personSelect * from person
Travaux liés Règles & ExemplesApproche proposée Implémentation Conclusion
JFO 2011, TSI 2013