View
1
Download
0
Category
Preview:
Citation preview
MJ/ form_ol_1_20100623.doc
1
Formation Ontologies Médicales (Form-Ol)
Session I Réunion du 23 uin 2010
Rapport par MJ avec notes de MDJ/BVB/PDP et BF
Présents : BVB/RVDS/MJ/MDJ/BF/PDP/JR/SR
Présentation des participants :
BVB = Benny Van Bruwaene
RVDS =Robert Vander Stickelen
MJ = Marc Jamoulle
MDJ = Michel De Jonghe
BF=Benjamin Fauquert
PDP =Pierre De Plaen
JR =Joseph Roumier
SR = Sébastien Rousseau
CR = Cyril Romain
Présentation des participants
JR :
Ingénieur informaticien ontologiste. Fait partie de l’équipe de recherche du CETIC chargé de cette formation.
Equipe de recherche travaille à la création d’index de documents, web sémantique depuis le xml jusqu’au
RDF/OWL/moteur d’inférence qui permettent de tirer parti de corpus existant ou de vérifier la validité d’un corpus. CETIC
travaille sur le projet Ehealth for citizen (Région wallone), sur l’architecture d’intégration avec RSW (avec Didier Tymans et
André VandenBergh). Le CETIC participe aussi au projet européen PONTE, une plateforme sémantique pour assurer
l’interconnexion de base de données d’effets secondaires. Ainsi qu’un projet de ressources terminologiques multilingues en
maintenance industrielle multi-niveau (lay and professional). Ce qui permet à chacun de garder son vocabulaire. Il fait appel
à un système dénommé « terminological make up framework » pour décrire le domaine de la maintenance industrielle. Il y
a donc des méthodologies qui permettent de ne pas partir de zéro.
PDP :
Médecin généraliste et médecin de santé publique. A travaillé à l’Institut Pasteur à Bruxelles. A participé à l’élaboration des
directives européennes Environnement-Santé: soufre-fumée et oxydes d'azote (ozone). A une expérience du travail avec les
traducteurs. Il est actuellement membre de la FRATEM, asbl pilote du RSW (Réseau Santé wallon) . Il se consacre à
l'élaboration de l'architecture télématique hub-metahub développé au sein de la plate-forme eHealth et participe à la mise
en place (gestion) des interfaces «diagnostiques» et thérapeutiques du SUMEHR . Il participe indirectemment aux travaux
du G19. Pierre De Plaen est président de la Fédération des cercles de médecins généralistes du Brabant Wallon et actif
dans plusieurs organisations professionnelles de médecine générale.
BF :
Médecin généraliste en activité clinique à 2/3 temps. Participe au CEBAM (Centre Belge d’Evidence Base Medecine), et
notamment à l’élaboration d’une bibliothèque virtuelle pour médecins généralistes. Il fait face au challenge de concevoir un
moteur de recherche qui fonctionne pour cette bibliothèque, il est assistant au département de médecine générale de
l’ULB.
MJ :
Médecin généraliste en activité clinique à mi-temps. Investit dans différents domaines de médecine générale et en
particulier dans le domaine des classifications. Membre de WONCA, et à ce titre, co-auteur de ICPC. Actuellement chargé
d’un projet de recherche au ministère fédéral de la santé publique. Membre du groupe SEMINOP (Semantic
interoperability). Membre du WICC
MJ/ form_ol_1_20100623.doc
2
RVDS :
Médecin généraliste en activité. Professeur de pharmacologie au Hijmans Institute of Pharmacology, Gent. Responsable de
l’informatique au CBIP (voir cbip.be). Responsable de la préparation de la future « source authentique du médicament » à
l’intention des médecins belges. Editeur d’un vocabulaire d’abord trilingue, puis en 11 langues, destiné à l’écriture des
notices des médicaments sur deux niveaux. Il est aussi intéressé par la communication homme-machine en médecine et
particulièrement la triangulation généraliste/spécialiste/patient. Il supervise une thèse de doctorat à propos des MESH pour
les locuteurs néerlandophones. Il est organisateur de la traduction des MESH en néerlandais. Membre du groupe SEMINOP
(Semantic interoperability).
Cyril Romain :
Informaticien, spécialisé dans le domaine de l’open source et des bases de données sur internet. Contribue en tant
qu’informaticien à un programme de recherche du CBIP et à un programme de recherche du service publique fédéral de la
santé publique (REGM).
MDJ :
Médecin généraliste, travaille en équipe multi-disciplinaire. Investi dans le domaine des classifications en médecine
générale depuis une dizaine d’années, membre du WICC et co-auteur de la terminologie 3BT ( Bilingual Biclassified Belgian
Thesaurus).
BVB :
Médecin généraliste. A travaillé dans l’industrie pharmaceutique et s’est orienté depuis plusieurs années en informatique
médicale. Responsable du codage à l’hôpital universitaire de l’université flamande de Bruxelles (UZVUB). Membre du
groupe SEMINOP (Semantic interoperability).
Sébastien Rousseau :
Responsable de projet au CETIC. Spécialisé en Device Communication. Responsable pour le CETIC de la participation au
projet OLDES, plateforme de service pour les patients seniors dans le cadre de ehealth for citizens. Intéressé à se former
dans le domaine
MJ/ form_ol_1_20100623.doc
3
Joseph Roumier
Partie théorique sur base du powerpoint
Formation 1 : Ontologies fichier formation1-jamoulle-ontoterm-JR.odp
JR tente d’expliciter le but de la formation. Il s’agit d’arriver à une compréhension du concept d’ontologie et des différents outils qui gravitent autours de ce concept. Il précise qu’il s’agit d’un champ de recherche toujours en développement. Il s’agit d’un sujet en constante évolution et il est difficile dans ce domaine de rester dans le « non contestable » en ce sens que les débats sont très vifs, et la pensée en constante évolution. La formation porte donc sur comprendre l’ontologie, et pour y arriver il se base sur les éléments acquis de plusieurs domaines scientifiques convergents. En préalable à l formation JR a envoyé cette adresse http://hal.archives-ouvertes.fr/inria-00490312/fr/ en référence à l’article de Patrice Lopez et Laurent Romary ; GRISP: A Massive Multilingual Terminological Database for Scientific and Technical Domains
Note MJ ; pour la relation entre ontologie philosophique et ontologie dans le domaine des sciences informatiques voir http://www.formalontology.it/
Structure de la formation I. Introduction et exemples II. Bases pour les ontologies III. Que fait-on avec les ontologies ? IV. Quelles techniques pour les ontologies ? V. Quels logiciels pour les ontologies ?
I. Introduction et exemples
DIA 5 Notion d’ambigüité Facilement gérable par un cerveau humain. Difficile à gérer pour une machine. Les ontologies permettent de définir un domaine de connaissance et de sortir de l’ambiguïté. Exemple du terme français « portable » qui a plusieurs acceptions. On dit qu’il représente plusieurs concepts. L’ontologie doit permettre de gérer différentes compréhensions de l’objet.
1 Emanuel Dion. Invitation à la théorie de l’information. Points, Seuil, 1997
MJ/ form_ol_1_20100623.doc
4
DIA 6 à 14 Exemple du vélo, de ses composants et de la vision qu’on peut en avoir selon plusieurs points de vue. On part du principe qu’il y a une existence unique via l’exploitation des informations. Nécessité de travailler au niveau du concept dans une acception à préciser. En langue française JR signale l’intérêt de grandictionnaire.com2 (Figure 1) qui donne la traduction de termes en fonction de leur appartenance à un domaine.
Figure 1 grandictionnaire.com ; deux acceptions du terme ontologie
DIA 15 Notion d’Inférence3 : Opération qui permet de produire de nouvelles propositions à partir d'autres propositions tenues pour acquises. « Concept d’inférence », en anglais « inference ». On utilise aussi le terme « raisonneur » en français et « reasoner » en anglais4. Un raisonneur est un outil informatique qui s‘assure de la cohérence des règles et qui va être capable de produire de nouvelles règles. L’inférence est une opération qui permet de produire de nouvelles propositions à partir d’autres propositions tenues pour acquises. Il s’agit d’inférence logique et non pas d’inférence statistique.
2 http://grandictionnaire.com/btml/fra/r_motclef/index800_1.asp
3 Wikipedia : L'inférence est une opération mentale, ou jugement, qui consiste à tirer une conclusion (d'une
série de propositions reconnues pour vraies). Ces conclusions sont tirées à partir de règles de base. 4 Wikipedia ; A semantic reasoner, reasoning engine, rules engine, or simply a reasoner, is a piece of software
able to infer logical consequences from a set of asserted facts or axioms
MJ/ form_ol_1_20100623.doc
5
DIA 17 Les ontologies sont construites sur des bases logiques adaptées à l'utilisation des moteurs d'inférence DIA 18 à 21 Arrangement des connaissances dans un système documentaire. Ex des pièces de voiture Utilisation des ontologies pour la recherche des informations. Relation : Sorte_de / partie_de. Par exemple la poignée par rapport à la porte. La poignée est une partie de la porte …. transitif …. qui se transmet …. par choix décisionnel. On parle ici de partonomie. Le cadre formel des ontologies est conçu pour permettre
d'éviter les problèmes d'ambiguïté,
faciliter la représentation des connaissances concurrentes d'un même objet,
raisonner sur les connaissances et
aider à la recherche d'information.
<
Question de Benjamin Fauquert : qu’apporte une ontologie par rapport à un système de classification ? Réponse de JR : l’ontologie à une fondation logique connue, elle permet des requêtes avec l’expression de résultats. Elle comprend des outils de représentation du domaine. Nous sommes ici pour mieux interfacer connaissance et classification au moyen d’ontologies.
II. Bases pour les ontologies
DIA 27 Définition d’ontologie.
Ajout MJ
Instance : Les instances sont les réalisations des concepts, et « héritent » de ses attributs
MJ/ form_ol_1_20100623.doc
6
http://de.wikipedia.org/wiki/Meta_Object_Facility
MJ/ form_ol_1_20100623.doc
7
Meta-models are closely related to ontologies. Both are often used to describe and analyze the relations between
concepts[4]
Ontologies : express something meaningful within a specified universe or domain of discourse by utilizing a
grammar for using vocabulary. The grammar specifies what it means to be a well-formed statement, assertion,
query, etc. (formal constraints) on how terms in the ontology’s controlled vocabulary can be used together.
[Metamodel-b]
Meta-modeling : can be considered as an explicit description (constructs and rules) of how a domain-specific
model is built. In particular, this comprises a formalized specification of the domain-specific notations. Typically,
metamodels are – and always should follow - a strict rule set. [Metamodel-a]. “A valid metamodel is an ontology, but
not all ontology are modeled explicitly as metamodels” [Metamodel-b].
DIA 31 à 38
Exemple de modélisation dans Protégé. Chaque participant a téléchargé Protégé 3.4.4 et peut faire les exercices proposés. Les participants ont reçu aussi des fichiers .pprj, .pins, .pont pour exercices
Figure 2 listes des fichiers reçus
Note de mj : Perso j’ai essayé de reprendre Protégé et de comprendre de
quoi il s’agit vraiment par ex en ajoutant des marques de voitures au
bon endroit mais je n’y arrive pas. Il y a une logique la dedans dont je ne
saisis pas la séquence. En particulier je ne comprends pas la
distribution des 31 « standard-class » dans la fig suivante. Ces
« standard-class » sont listées les unes en dessous des autres et je ne
vois pas comment on peut accepter ces items comme ‘classes » et
comment on établit des relations entre elles.
MJ/ form_ol_1_20100623.doc
8
lless
MJ/ form_ol_1_20100623.doc
9
III. Que fait-on avec les ontologies ?5
Avec notes de MDJ
Catégories d'ontologies
Méta-ontologies (ex : SUMO de Sowa)6 (Suggested Upper Merged Ontology)
More fundamental than the categories themselves are the
criteria for distinguishing categories and determining whether
a particular entity belongs to one or another (John Florian
Sowa, Computer Scientist)7
Il s’agit d’une ontologie d’outils ontologiques qui correspond à la norme IEEE 1600.18 Objectif : définir proprement les concepts et les relations de haut niveau pour l'interopérabilité, l'indexation, la recherche d'information et le traitement automatique des langues... Premiers concepts : Physique ou Abstrait / Indépendant, Relatif ou Médiateur / Continu ou Occurent On peut mieux comprendre SUMO en téléchargeant le power point de Adam Pease : http://ontolog.cim3.net/file/resource/presentation/AdamPease_20070906/Suggested-Upper-Merged-Ontolog_SUMO--AdamPease-20070906.ppt L’url http://ontology.teknowledge.com/ et hors service. Le site http://www.teknowledge.com/ n’est pas vraiment informatif
Enterprise Ontology9 ou Ontologies de domaine Objectif : rassembler et ordonner tous les concepts utiles pour les entreprises et le commerce
Ontologies applicatives (ex: définir des concepts partagés pour la communication entre agents) par ex le Projet ITEA- PROTEUS show the potential of knowledge management methodology used to build conceptual models of domains as a means for integration of UML representations of distributed systems10. http://www.proteus-iteaproject.com n’est pas fonctionnel
Autres exemples MENELAS ; http://www-new.biomath.jussieu.fr/Menelas/ The Open Biological and Biomedical Ontologies www.obofoundry.org/ SNOMED-CT de IHTSDO http://www.ihtsdo.org/ MESH : http://www.ncbi.nlm.nih.gov/mesh
note de BVB : http://www.collibra.com/
note de BVD : http://www.microsoft.com/presspass/press/2009/mar09/03-11MSCreativeCommonsPR.mspx dans lequel on trouve une autre definition, assez
5 Voir aussi http://en.wikipedia.org/wiki/Ontology_(information_science)
6 SUMO ; http://www.ontologyportal.org/
7 http://www.formalontology.it/ontologists-living-6.htm#sowa
8 SUO ; http://en.wikipedia.org/wiki/Standard_upper_ontology
9 Enterprise ontology http://www.aiai.ed.ac.uk/project/enterprise/enterprise/ontology.html Intéressant de
lire ce papier pour bien comprendre ; http://www.tdan.com/view-articles/5016 10
Montroig, roomier et all. Building Conceptual Models by Knowledge Management Methodology http://hal.inria.fr/inria-00100185/fr/
MJ/ form_ol_1_20100623.doc
10
restrictive du concept Ontology ;
IV. Quelles techniques pour les ontologies ?
Préliminaire : à la base de la représentation des connaissances
DIA 47 à 57: Quelle technique : exclure les boucles DIA 48 : Système symbolique = triplet. Symbole: u p e. Axiomes: x p u e u x Théorème p=+ et e== → Sémantique donne le sens Pour tout x tel que x est un CRA alors x est un CRA. Pour aller plus loin en logique descriptive j’ai trouvé ceci ; http://www.inf.unibz.it/~franconi/dl/course/ et en particulier le papier D. Nardi, R. J. Brachman. An Introduction to Description Logics ou Tbox et Abox sont expliqués.
The ABox
The ABox contains extensional knowledge about the domain of interest, that is,
assertions about individuals, usually called membership assertions. For example,
Female П Person(ANNA)
The TBox
One key element of a DL knowledge base is given by the operations used to build
the terminology. Such operations are directly related to the forms and the meaning
of the declarations allowed in the TBox.
The basic form of declaration in a TBox is a concept definition, that is, the
definition of a new concept in terms of other previously defined concepts. For
example, a woman can be defined as a female person by writing this declaration:
Woman ≡ Person П Female
DIA 57 : analyse de phénomène nouveaux.
1) Rechercher des configurations connues 2) Rechercher celles qui se rapprochent le plus du nouveau phénomène 3) Adapter
DIA 59 : Concept = Class et Rôle = Slot. Concept universel (thing dans Protéger). Notion de T-Box : C’est une distribution du concept et des rôles. On dit : toute instance de thing appartient à bottom.
MJ/ form_ol_1_20100623.doc
11
Aucune instance n’appartient à bottom. Par rapport à T-BOX il y a A-Box. Individu/Instance, l’ensemble des individus ou instance (une pomme est une instance de fruit tandis que le pépin est une partie de la pomme). Graphique avec le sous ensemble du cancer du sein dans l’ensemble des cancers. DIA 59 Rien écrit. Remarque de BVDB : Exemple de hart infarct. Hart → Aorto→ICDDIS
V. Quels logiciels pour les ontologies ?
DIA 61 ; On note que l’url fourni pour Proteus Itea est en japonais !
Annexe : petite étude du terme ontology sur visualthesaurus.com
Figure 3 Ontology sur visualthesaurus.com
Sur le site visualthesaurus.com11 de la société Thinkmap, on voit clairement (Figure 3) les deux acceptions du terme ontology. D’une part la métaphysique et d’autre part comme branche de la science d’organisation ou d’« arrangement » des systèmes. On notera au passage la définition de ontology en science informatique présentée comme une organisation exhaustive et rigoureuse de certains domaines de la connaissance, généralement hiérarchique et comprenant les entités concernées et leurs relations.
11
http://www.visualthesaurus.com/ Le site donne droit à trois interrogations gratuites. On peut s’abonner pour une somme modique annuelle
MJ/ form_ol_1_20100623.doc
12
Figure 4 Place de ontology dans arrangement et organisation sur visualthesaurus.com
Il est aussi intéressant de rendre compte que le domaine « ontology » est rangé par l’outil ontologique qu’est justement le visualthesaurus dans les systèmes en anglais d’ «arrangement » ou d’ «organisation » eux-mêmes positionnés comme élément d’une structure en tant que composition complexe de connaissance isolée ou en combinaison (Figure 4).
Notons que si on va voir sur grandictionnaire.com les traductions du terme anglais arrangement, on remarque qu’il est utilisé dans une série impressionnante d’acceptions qui vont d’arrangement français, à squelette, disposition, plan, ordre ou classement.
Recommended