Linguistique et Alignement d’ontologies
TP3 du cours IFT6010
Jean François DJOUFAK KENGUE
djoufakj @ GEODES TP3, IFT6010 2
PLAN
1. Le Web Sémantique2. Les ontologies3. Quelques problématiques liées aux ontologies4. L’alignement des ontologies5. Que peux apporter l’alignement d’ontologies
en linguistique ?
djoufakj @ GEODES TP3, IFT6010 3
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
Le Web aujourd'hui
Plus de 109 pagesContenu destiné à être lu par les ordinateurs.Contenu non compréhensible pour les ordinateurs.Aucun sens n’est associé aux liens hypertexte.Métadonnées peu ou mal utilisées.Beaucoup de redondances, peu organisé.Difficile à analyser automatiquement (par des programmes).Moteurs de recherche ultra sophistiqués mais imparfaits...
Nécessité de liens et de métadonnées structurées, sûres et significatives.
djoufakj @ GEODES TP3, IFT6010 4
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
Le Web de demain [B-Lee et al et al 2001]
Tim Berners-Lee
Beaucoup plus de pages.Contenu structuré, commenté et compréhensibles par les ordinateurs.Facilité de partage et d’accès (les agents).Répertoire de connaissance.Capable de raisonner.Utilisé pour générer de nouvelles connaissances.
Donner de la sémantique au web : Web Sémantique
James A. Hendler
Ora Lassila
djoufakj @ GEODES TP3, IFT6010 5
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
Exemple illustratif
Maman
Agent du Médecin
Agent de Lucy
Traitementrequis
Agent de PeteOrganisationd’emploi du temps
Compagnie d’ass.
Sites de cliniques
Coûts
plan?proximité?Spécialiste?
Prise de RDV
Illustration de l’exemple introductif de [B-Lee et al
2001], tirée de la présentation de Stephen
Decker intitulée « The Semantic Web ».
djoufakj @ GEODES TP3, IFT6010 6
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
L’architecture
Fiabilité
Preuve des résultats
Règles et requêtes
Structure
Sens et Contraintes
Description formelle
Ressource
Tim Berners-Leehttp://www.w3.org/2000/Talks/1206-xml2k-tbl/Overview.html
djoufakj @ GEODES TP3, IFT6010 7
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
Définition
Philosophiethéorie à propos de la nature de l'existence, des types de choses qui existent.
Intelligence ArtificielleFormalisation d’une conceptualisation. [Grub 1993]
Pratiquement: Organisation hiérarchique de la connaissance sur un ensemble d'objets par leur regroupement en sous-catégories suivant leurs caractéristiques essentielles.
Socrate
djoufakj @ GEODES TP3, IFT6010 8
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
Pour quoi faire?
Standardisation du sens (lever les ambigüité) de chacun des termes employés dans un domaine de connaissance.
Terme: mot de la langue naturelle qui désigne un concept.
Description des relations existantes entres les concepts représentés par les termes.
Relations ={est une sorte de, est une propriété de, est une instance de}
Compréhension entre personnes et logiciels.
djoufakj @ GEODES TP3, IFT6010 9
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
Exemple d’ontologie
Merci à Marc Ehrig (Karlsruhe) pour l’exemple
djoufakj @ GEODES TP3, IFT6010 10
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
Conception
Humaine (consortiums d’experts)Supervisée
1. Identifier un domaine de connaissance.2. Identifier un corpus.3. Analyser le corpus.4. Recenser les termes du vocabulaire et normaliser leur
sens5. Identifier concepts, instances, propriétés et les relations
qui existent entre eux.6. Construire la hiérarchie représentant l’ontologie.7. Opérationnaliser dans un langage formel (OWL, KIF).
Tiré de la présentation de Olivier Corby (INRIA, Sophia Antipolis) intitulée « Ontologies »
djoufakj @ GEODES TP3, IFT6010 11
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
L’hétérogénéité Syntaxique[Bouquet et al 2004, Euzénat et al 2004,]
Format de représentation (des langages différents sont utilisés pour représenter la même ontologie)
Solution : Mettre sur pied des fonctions de traduction.
Mise en œuvre:-Parseurs+Mapping
-Compilateurs
djoufakj @ GEODES TP3, IFT6010 12
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
L’hétérogénéité terminologique[Bouquet et al 2004, Euzénat et al 2004]
Synonymie (des mots différents désignent le même concept)Polysémie (le même mot désigne plusieurs concepts)Langage (Français, Anglais, Italien…)Variations syntaxiques (abréviations, préfixes, suffixes …)
Solution: Établir des correspondance (calcul de similarité!) entre termes.Mise en œuvre:-Comparaison de chaines (égalité, distance de Hamming …)
-Comparaison de sous-chaines (test de sous-chaine, distance de n-gram, …)
-Distance d’édition
-Techniques NLP (morphologie, syntaxe, traduction, sémantique, morphosyntaxe, …)
djoufakj @ GEODES TP3, IFT6010 13
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
L’hétérogénéité conceptuelle[Bouquet et al 2004, Euzénat et al 2004]
Couverture
monde mondemondeGranularité Perspective
Solution : Établir des correspondances (calcul de similarité!) de modèle.Mise en œuvre:-Comparaison des concepts ( type de donnée des attributs, domaine de valeur, multiplicité, instances)
-Comparaison des hiérarchies de concepts (taxonomie, méréologie, relations entre concepts, instances de concepts)
djoufakj @ GEODES TP3, IFT6010 14
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
L’hétérogénéité sémiotique[Bouquet et al 2004, Euzénat et al 2004]
Sens donné à l’ontologie : (des individus/Communautés peuvent interpréter une même ontologie de différentes manières dans différents contexte).
Solution : Établir des correspondances (calcul de similarité!) de sens entre modèles.
Mise en œuvre :-Satisfiabilité de propositions [Guinchiglia et Shvaiko 2004]
-Logiques de description
djoufakj @ GEODES TP3, IFT6010 15
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
En quoi ça consiste?Déterminer, par un processus global, les correspondances (similarité!) entre deux ontologies en utilisant ou en mettant en œuvre des solutions aux différents problèmes d’hétérogénéité.
Merci à Marc Ehrig (Karlsruhe) pour l’exemple
djoufakj @ GEODES TP3, IFT6010 16
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
Une première approche[Melnik et al 2002, Euzénat et Valtchev 2004]
Graphe, similarité et équation du point fixeConstruire un graphe représentant les ontologies.Calcul itératif de la similarité de chaque nœud du graphe en utilisant les similarités des nœuds adjacents.Arrêter lorsque les similarités des nœuds se stabilisent.Utiliser une valeur seuil pour déduire l’alignement.
))'('),((
))'('),((
))'('),((
))'(),(()',(
cAcAMSim
cScSMSim
cIcΙMSim
cccc
PCA
CCS
OCI
LCLC
π
π
π
λλσπσ
+
+
+
= [Euzénat et Valtchev 2004]
1=+++ CA
CS
CI
CL ππππ
djoufakj @ GEODES TP3, IFT6010 17
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
Une deuxième approche[Doan et al 2004]
Apprentissage d’une distribution probabiliste et similarité
Apprendre les classes des ontologies par une distribution statistique des instances.Évaluer la probabilité d’appartenance des instances de chaque ontologie à des couples de classes des ontologies à alignerUtiliser le probabilités calculées pour évaluer la similarité entre les concepts des ontologies
)',()',()',()',()',(
ccPccPccPccPccC ++
=σ (de la similaritéde Jaccard)
djoufakj @ GEODES TP3, IFT6010 18
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
Utilité
Fusion d’ontologies : Création d’une nouvelle ontologie à partir d’ontologies existantes.Mapping d’ontologies : Expression formelle des relations sémantiques entre ontologies.Réconciliation d’ontologies : Harmonisation des contenus d’otologies.Négociation de sens : Protocole par lequel des agents (humains ou logiciels) s’accordent sur les changement nécessaires pour réconcilier leurs ontologies.Coordination d’ontologies : Utilisation de la connaissance en provenance de plusieurs ontologies pour réaliser une tâche donnée.
djoufakj @ GEODES TP3, IFT6010 19
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
Notre visionFaciliter la construction d’une(des) ontologie(s) modélisant la(les) langue(s) à partir de l’alignement d’ontologies existantes.
La traduction se ferait par un ensemble de règles et de calculs résultant de l’alignement des différents aspects des langues source et cible (Plus proche de la réalité!).
Le tagging consisterait à aligner une phrase à l’un des concepts syntaxiques de l’ontologie correspondante (relativement plus aisé!)
Interconnexion des lexiques (Ex : WordNet et EuroNet)
Et plus encore … Le futur passe par les ontologies!
djoufakj @ GEODES TP3, IFT6010 20
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
Références
[B-Lee et al 2001] T. Berners-Lee, J. Hendler and O. Lassila. The semanticweb. Scientific American, 2001.
[Grub 1993] T. Gruber. A Translation Approach to Portable OntologySpecifications. Knowledge Acquisition, 5(2):199-220, 1993.
[Bouquet et al 2004] P. Bouquet, J. Euzénat, E. Franconi, L. Serafini, G. Stamou and S. TEssaris. D2.2.1: Specification of a common frameworkcharacterizing alignment. http://www.aifb.uni-karlsruhe.de/WBS/phi/pub/kweb-221.pdf
[Euzénat et al 2004] J. Euzénat, T. Le Bach, J. Barrasa, P. Bouquet, J. De Bo, R. Dieng, M. Ehrig, M. Hauswirth, M. Jarrar, R. Lara, D. Maynard, A. Napoli, G. Stamou, H. Stuckenschmidt, P. Shvaiko, S. Tessaris, S. Van Acker and I. Zaihrayeu. D.2.2.3: State of the art on ontology alignment. http://www.starlab.vub.ac.be/research/ projects/knowledgeweb/kweb-223.pdf
djoufakj @ GEODES TP3, IFT6010 21
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
Références
[Guinchiglia et Shvaiko 2004] F. Guinchiglia and P. Shvaiko. Semanticmatching. The Knowledge Engineering Review, 18(3):265-280, 2004.
[Melnik et al 2002] S. Melnik, H. Garcia-Molina and E. Rahm. Similarityflooding : a versatile graph matching algorithm. In Proc. 18th International Conference on Data Engineering(ICDE), San Jose (CA US), 2002.
[Euzénat et Valtchev 2004] J. Euzénat and P. Valtchev. Similarity-basedontology alignment in OWL-lite. In Proc. 15th ECAI, Valencia (ES), 2004.
[Doan et al 2004] A.-H. Doan, J. Madhavan, P. Domingos and A. Halevy. Ontology matching : a machine learning approach. In Steffen Staaband Rudi Studer, editors, Handbook of ontologies, International handbookon informations systems, chapter 18, pages 385-404. Springer Verlag, Berlin (DE), 2004.
djoufakj @ GEODES TP3, IFT6010 22
1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies
4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?
FIN !
Merci pour votre attention!
Question ?