View
105
Download
0
Category
Preview:
Citation preview
Projet ANRProjet ANR
e-WOK_HUB (Environmental Web Ontology Knowledge Hub)
Partenaires :Partenaires : BRGM, EADS, ENSMP, IFP, INRIA,
LISI/ENSMA/CRITT
Colloque STIC 2007
2
Objectifs scientifiques
Projet ANR E-WoK_HUB
Mettre en place un ensemble de portails communicants (les Hubs e-WOK), proposant à la fois :
• des applications web accessibles aux utilisateurs finaux à travers des IHM en ligne
• et des services webs accessibles aux applications à travers des interfaces programmatiques
3
Objectifs applicatifs
Projet ANR E-WoK_HUB
• Gestion de la mémoire de plusieurs projets sur la capture et le stockage du CO2, avec exploitation des résultats de la veille technologique sur le domaine
• Intégration d’informations issues de bases différentes et de logiciels métiers
4
Les Hubs e-WOK
Projet ANR E-WoK_HUB
Hub e-WOK = serveur web sémantique et portail offrant un accès sémantique à des ressources documentaires, des données métiers et des services (génériques ou métiers) en utilisant des ontologies adéquates
Indexation des contenus textuels des documents et des donnéesBoîte à outils pour générer les annotations des ressources et les interfaces programmatiques des services utiles pour le domaine considéré
Accès aux entités sémantiques et gestion de leur persistance•Fonctionnalités de mise en réseau des portails pour accéder les uns aux autres et mutualiser leurs ressources
•Intégration d’interfaces homme machine pour gérer les échanges entre utilisateurs et le réseau de portails
5
Résultats attendus du projet
Projet ANR E-WoK_HUB
Au niveau scientifique :
• Éditeurs coopératifs et contextuels,
• Connexion entre les standards :– RDF(S)/OWL et EXPRESS/PLIB,– SPARQL et OntoQL
• Prise en compte de multiples points de vue dans les annotations et lors de la recherche d’information,
• Exploitation de techniques linguistiques et probabilistes pour la création / enrichissement des annotations à partir de textes,
• Prise en compte de l’influence de l’évolution de l’ontologie sur les annotations,
• Géolocalisation associée à la sémantique,• Lien entre la gestion de la mémoire de projet et les résultats de la veille
technologique.
6
Résultats attendus du projet
Projet ANR E-WoK_HUB
• Au niveau applicatif :– Veille technologique sur la caractérisation des sites de stockage
du CO2 – Application à d’autres domaines thématiques dans le
domaine des géosciences (risques naturels, eau souterraine…) ou dans des domaines en ingénierie nécessitant mémoire inter-projets ou veille technologique
• Au niveau exploitation :– CRITT : outils développés autour de PLIB– IFP et BRGM : exploitation des résultats
7
Résultats scientifiques et industrielsRésultats scientifiques et industriels
Projet ANR E-WoK_HUB
8
BESOINS & SPECIFICATION
LOT 1 (1/2)
MISE EN PLACE DU E-WOK_HUB
LOT 4PERSISTANCE
DES ONTOLOGIES ET DES REGLES
LOT 3
EVALUATION
LOT 1 (2/2)
OUTILS ET METHODES GENERIQUESLOT 2
Expériences& background
Applicationsexistantes
Besoins (cas d’utilisation)
Démos & analyse des résultatsOutils spécifiques
à la persistance
Outils génériquesOutils génériques
K-repository et applications
Leader BRGM
Leader EADS
Leader LISI
Leader INRIA
Leader BRGM
Besoins & Specs
Vision globale du projet
Projet ANR E-WOK_HUB
9
une annotation automatique• Pas de charge de travail supplémentaire, succès de l’utilisation
un moteur de recherche performant une amélioration dans le principe de recherche : sémantique + géo-localisation un outil central pour la démarche de recherche élargir le périmètre des ressources actuelles (ressources du centre de
documentation) en incluant des images, des services cartographiques, services web , des références de base de données
collaboration entre organismes pour les données
l’amélioration de la connaissance une collaboration de ses agents pour parfaire la définition de la connaissance un outil de gestion des ressources, des requêtes et de leurs résultats, des
différents projets une capitalisation des démarches intellectuelles un outil d’aide dans le suivi d’un projet de consultation des référentiels de
ressources.
Use cases - Besoins
Projet ANR E-WoK_HUB Résultats industriels – Lot 1
10
Use cases
On porte une attention particulière aux aspects géologiques
et géographiques et on l’applique sur le projet PICOREF.
• Use case amont (BRGM) :– Mémoire des projets CO2– Annotations– Edition d’ontologies– Exemples de requêtes dans le projet PICOREF
• Use case aval (IFP) :– Cas d’étude IFP
Projet ANR E-WoK_HUB Résultats industriels – Lot 1
11
• 1/ Retrouver les infos de localisation géographiques "globales" de chaque document.
• 2/ Retrouver les entités géologiques citées dans chaque document.• 3/ Dater les entités géologiques repérées dans les documents.
• 4/ Localiser les entités géologiques repérées dans les documents • 5/ Etendre la recherche des entités géologiques aux publications
référencées dans le corpus de documents.
• 6/ Extraire des documents les "sections" " segments" et "fragments" qui décrivent les hypothèses chrono stratigraphiques associées aux entités géologiques et les présenter à l'utilisateur lors de la phase d'interprétation pour annoter ces interprétations ( Geological
Knowledge Editor).
Use Case amont : à partir du corpus de documents "BRGM/PICOREF"
Projet ANR E-WoK_HUB Résultats industriels – Lot 1
12
Use-cases et ontologies obtenues – Exemples de questions
Projet ANR E-WoK_HUB Résultats industriels – Lot 1
Question d’opérateur: Je recherche les lignes sismiques qui ont été étudiées dans le cadre du projet PICOREF
Question d’expert: Le Callovo-Oxfordien est-il une bonne couverture ?
Question d’usager: Existe-t-il des sites potentiels de stockage de CO2 à moins de 25 km de mon usine ?
Dans un premier temps, les réponses seront fournies sous forme d’une liste de documents permettant à l’usager de répondre à la question posée.
Plus d’une centaine de questions identifiées
13
Use-cases et ontologies obtenues – Analyse du contenu d’un document
Projet ANR E-WoK_HUB Résultats industriels – Lot 1
On vise à mettre en œuvre une méthodologie plus performante que la recherche habituelle par mots-clés.
La méthode repose sur l’analyse du contenu de documents entiers sans définition préalable de mots-clés.
• Extraction automatique de mots ou groupes de mots
signifiants (plate-forme linguistique(plate-forme linguistique, INRIA))
• Annotation Annotation des termes extraits en référence à des ontologies de domaine définies préalablement.
• Traitement statistique éventuel des termes annotés en vue de déterminer les éléments-clés du document considéré
14
Use-cases et ontologies obtenues
Projet ANR E-WoK_HUB Résultats industriels – Lot 1
• On part d’un corpus de textes de référence (une dizaine de documents: articles, rapports, thèse etc.) que les experts annotent à la main.
• Ce travail de départ permet de définir les diverses ontologies de domaine qui devront être construites et de leur associer une première liste de concepts et de propriétés.
• On a défini:– une ontologie des termes géographiques (INSEE, BRGM)– une ontologie de la chronologie géologique (ENSMP)– 5 ontologies relatives aux différentes sous-disciplines
géologiques à prendre en compte (ENSMP)
15
Use-cases et ontologies obtenues – Ontologies définies pour la géologie
Projet ANR E-WoK_HUB Résultats industriels – Lot 1
16
Use-cases et ontologies obtenues – Chronologie géologique
Projet ANR E-WoK_HUB Résultats industriels – Lot 1
17
Use Case AVAL " IFP" : Schéma simplifié
La Vue Utilisateur
Archives Numériques
(ex : fichiers RESCUE)Extraire les
données
Stockage des données
serveur IFP/BRGM
mise à jour de données
ou de connaissanc
e
geo modelisation
Création d'une
nouvelle archive
numérique
MISE A JOUR
INCOMPLETE
SYSTEMES D'INFORMATION des
COMPAGNIES
Rapports /textes /ppt Extraire la connaissance
Stockage de la connaissance
serveur e-wok_HUB
RESULTS
COMPLETED
Compléter la connaissance
Reconstitution d'une archive
numérique
EXPERTISE
du GEOLOGUE
Projet ANR E-WoK_HUB Résultats industriels – Lot 1
18
BESOINS & SPECIFICATION
LOT 1 (1/2)
MISE EN PLACE DU E-WOK_HUB
LOT 4PERSISTANCE
DES ONTOLOGIES ET DES REGLES
LOT 3
EVALUATION
LOT 1 (2/2)
OUTILS ET METHODES GENERIQUESLOT 2
Expériences& background
Applicationsexistantes
Besoins (cas d’utilisation)
Démos & analyse des résultatsOutils spécifiques
à la persistance
Outils génériquesOutils génériques
K-repository et applications
Leader BRGM
Leader EADS
Leader LISI
Leader INRIA
Leader BRGM
Besoins & Specs
Vision globale du projet
Projet ANR E-WOK_HUB
19
Architecture des hubs : Approche de conception
• Les tâches des utilisateurs d’e_Wok_Hub sont organisées en projets
• Les connaissances « métier » constituent des ressources pour les projets
• Les partenaires « techniques » fournissent des services qui exploitent les ressources disponibles et produisent de nouvelles ressources
• Les applications opérationnelles sont construites par composition de services
• Les portails e-Wok donnent accès aux ressources et aux services disponibles pour conduire les projets
⇒ ARCHITECTURE ORIENTEE SERVICES
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 4
20
Architecture proposée
Applications
Distribution et messaging
Génériques Spécifiques
PortailInterface utilisateur
données sémantiquesdocuments
Conception de Work-Flow
Orchestration
Services "Métier"
MonitoringConfiguration administration
Su
pervisio
n
Sécu
rité
Web Service
•XML
•WSDL
•WS-BPEL
•SOAP
SPARQL
OWL/RDFS
RDF
PLIB
Services Techniques
données techniques
Analyse linguistique
eWok Client
Éditeur d’ontologies
Annotation Sémantique
Formatage de données
Persistance d’ontologies
ESB Petals
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 4
21
Architecture des hubs : l’infrastructure d’intégration
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 4
ESB = infrastructure conçue pour exposer, accéder, orchestrer, administrer les services
Enterprise Service Bus
WebServices
Publication/Abonnement
Échange de fichiers
Messagerieasynchrone
XML
ACORDPostgreSQL
Oracle
RPCsynchrone
112
2
3
45
678
9
10
11
Plates-formes hétérogènes Multiples langages de
programmation
Modèles et Formats de données
disparates
Word/ExcelPDF ODT
HTMLtxt
⇒ Évaluation des ESB disponibles en open source : Petals
Orchestrationde services
22
Réseau de Hubs
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 4
ESB ESB
ESB
Réseau e-WokHub 1 Hub 2
Hub 3
23
BESOINS & SPECIFICATION
LOT 1 (1/2)
MISE EN PLACE DU E-WOK_HUB
LOT 4PERSISTANCE
DES ONTOLOGIES ET DES REGLES
LOT 3
EVALUATION
LOT 1 (2/2)
OUTILS ET METHODES GENERIQUESLOT 2
Expériences& background
Applicationsexistantes
Besoins (cas d’utilisation)
Démos & analyse des résultatsOutils spécifiques
à la persistance
Outils génériquesOutils génériques
K-repository et applications
Leader BRGM
Leader EADS
Leader LISI
Leader INRIA
Leader BRGM
Besoins & Specs
Vision globale du projet
Projet ANR E-WOK_HUB
24
Rapport sur les services pour les ontologies
• Editeur contextuel et collaboratif ECCO• Approche d’analyse de corpus et de techniques
linguistiques• Spécifications de techniques d’enrichissement
sémantique semi-automatique à partir de textes en reposant sur la « kernelisation » de champs aléatoires conditionnels
• Techniques basées sur des règles de détection d’incohérence et restauration de cohérence pour traiter l’influence de l’évolution d’ontologies
• Transformation entre le modèle d’ontologies RDF(S) / OWL Lite et le modèle PLIB
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2
25
Service d’ontologies – ECCO
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2
ECCO (Editeur Collaboratif et Contextuel d’Ontologies)
Méthodologie:
suivre les phases de conception d’une ontologie
•À partir de l’extraction de termes dans des sources de données
•…
• Jusqu’à l’édition fine de l’ontologie
26
Service d’ontologies – ECCO (2)
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2
ECCO (Editeur Collaboratif et Contextuel d’Ontologies)
Extraction collaborative de termes : chaque utilisateur visualise ses propres termes + ceux extraits par les autres utilisateurs.
Extraction contextuelle: le contexte du terme extrait est attaché à celui-ci.
27
Service d’ontologies – ECCO (3)
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2
ECCO (Editeur Collaboratif et Contextuel d’Ontologies)
(Méta) annotation des termes : représenter le statut de chacun des termes.
28
Service d’ontologies – ECCO (4)
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2
ECCO (Editeur Collaboratif et Contextuel d’Ontologies)
(Méta) annotation des termes : permettre aux utilisateurs d’avoir un historique des discussions sur un terme donné.
29
Service d’ontologies – ECCO (6)
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2
ECCO (Editeur Collaboratif et Contextuel d’Ontologies)
Technos utilisées: J2EE / Web 2.0 / Web sémantique
Dépendances:
pour les aspects web sémantique : • Corese• Semtags
pour les aspects web :• JSTL (Java Standard Tag Lib)
pour les aspects graphiques:• Yahoo UI, Extjs (future version)
30
• Processus d’évolution– Avec trace d’évolution des ontologies
Service d’ontologies – Evolution des ontologies
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2
ontologie O1Représentation des
changementsdans trace (O1, O2)
trace (O1, O2)
ontologie O2
Base d’annotations
concernée
Application des Stratégies d’évolution
Base d’annotations
mise à jour
ontologie O1Détection des annotations
inconsistantesRègles de détection
ontologie O2
Base d’annotations
concernée
Correction des annotationsinconsistantes
Règles de correction
Base d’annotations
mise à jour
Gestion des annotations inconsistantes après évolution de l’ontologie.
Approche suivie:
– Sans trace d’évolution des ontologies
31
Service d’ontologies – Evolution des ontologies (3)
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2
1er cas : Evolution des ontologies avec traces existantes
Générateur de traces d’évolution: ECCO
Résolution à l’aide des stratégies: COSWEM
32
BESOINS & SPECIFICATION
LOT 1 (1/2)
MISE EN PLACE DU E-WOK_HUB
LOT 4PERSISTANCE
DES ONTOLOGIES ET DES REGLES
LOT 3
EVALUATION
LOT 1 (2/2)
OUTILS ET METHODES GENERIQUESLOT 2
Expériences& background
Applicationsexistantes
Besoins (cas d’utilisation)
Démos & analyse des résultatsOutils spécifiques
à la persistance
Outils génériquesOutils génériques
K-repository et applications
Leader BRGM
Leader EADS
Leader LISI
Leader INRIA
Leader BRGM
Besoins & Specs
Vision globale du projet
Projet ANR E-WOK_HUB
33
• Proposition d’un modèle de persistance autour de la plate-forme OntoDB
• Modélisation d’ontologies de domaine
• Connexion à l’architecture E-Wok-HUB
Service de persistance – Introduction
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3
34
• ONTODB• Base de données à base ontologique pour PLIB
» Structure de persistance pour les ontologies et leurs instances
» Extension d’une classe = une relation (une vue)
Modèle de persistance (1)
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3
Ontology
Meta-Schema System Catalog
Logical model
35
– ONTODB pour E-Wok-Hub• Extension proposées
» Représentation des données, ontologies et raisonnements spatiaux
» Prise en compte des modèles, langages et formats du web sémantique
» Représentation XML des données natives de ONTODB (OntoML)
• Mise en œuvre » Définition d’un noyau commun des langages et des
modèles d’ontologies» Expressions d’équivalences : vues et opérateurs de
logique de description» Caractéristiques de symétrie, inverse, contraintes, etc...
Modèle de persistance (2)
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3
36
– Construction de nouvelles ontologies et de bases de données à base ontologique
– Représentation des données spatiales
– Validation avec ONTODB
– EarthModel, GeoTimeScale, Petrographer
– Indexation de bases de données existantes– Rétro-conception de bases de données
– Approche d’annotation sémantique de bases de données existantes
» Application aux données fournies par le BRGM avec prise en compte de données géographiques
Service de persistance – Modélisation à base ontologique
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3
37
• Connexion au Hub– Utilisation de SPARQL comme langage d’accès à la BDBO
» Interprétateur OntoQL– Spécification des modules d’import/export ONTOML/RDF-S
Service de persistance – Intégration dans l ’architecture E-Wok-Hub
Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3
Ontologie RDF-S
SPARQL OntoQLOntology
Meta-Schema System Catalog
Logical model
38
Travail en cours : Prototype
Projet ANR E-WoK_HUB Plan de travail
1er prototype sur le scénario 1 établi par IFP-BRGM
format e-wok.doc, .pdf Filtrage sur la langue
Processus d’annotation géographiqueProcessus d’annotation géographique
linguistique
SIG
KCRF géométriqueXML
Phase 2: consultation
Phase 1: annotation
39
• Scénario opérationnel et annotation manuelle du corpus (ENSMP)
• Socle technique (EADS)
• Services métiers – Acquisition de documents Ewok Hub (IFP)– Analyse linguistiques (INRIA)– Annotation géographique par apprentissage
(EADS)– Annotation toponymique et géométrique (IFP,
BRGM, INRIA)– Stockage & Indexation dans un entrepôt
sémantique (LISI)
• Interfaces Homme-Machine (BRGM):– E-Wok Client
Prototype : Recherche sur critères géographiques
Projet ANR E-WoK_HUB Plan de travail
40
Prototype : EWC - Ewok Client
Projet ANR E-WoK_HUB Plan de travail
Techno: Web 2.0
41
Prototype : EWC - Ewok Client
Projet ANR E-WoK_HUB Plan de travail
42
Prototype : Recherche sur critères géographiques
Projet ANR E-WoK_HUB Plan de travail
E-WOK_HUB :
projet pluridisciplinaire informatique et géosciences
http://www-sop.inria.fr/edelweiss/projects/ewok
Questions?
Recommended