Upload
trinhthu
View
222
Download
0
Embed Size (px)
Citation preview
Jérôme Champavère
jerome.champavere @ lifl.fr
http://www.grappa.univ-lille3.fr/~champavere/?page=Enseignement
De la représentation des connaissances au Web sémantique
Web sémantique
● Entièrement fondé sur le Web “classique”, c'est-à-dire un moyen de publier et de consulter des documents
● Informations formalisées pouvant être traitées automatiquement par des agents logiciels
● Annotation du contenu, définition de propriétés et de relations
● Normalisation par le W3C : XML, RDF, RDFS, OWL, …
Connaissance ?
● Fait, manière de connaître.La connaissance d’un objet : conscience ; compréhension, représentation.Connaissance de choses nouvelles : découverte.Connaissance sensorielle ; connaissance intuitive : impression, intuition, sensation, sentiment.Connaissance exacte, profonde : certitude.
● (Avoir connaissance de) : être informé de.
● Faculté de connaître propre à un être vivant : intelligence.
● Fait de sentir, de percevoir : conscience, sentiment.
● (Les connaissances) : ce qui est connu ; ce que l’on sait pour l’avoir appris.
Représentation des connaissances ?
● Définition Wikipédia (FR) : ensemble d'outils et de technologies destinés à représenter et organiser le savoir humain pour l'utiliser et le partager
● Sciences cognitives : comment les humains stockent et traitent l'information
● IA : stocker les connaissances de sorte que des programmes peuvent la traiter
● Objectifs :● Modèles formels de représentation des connaissances● Traiter des informations au niveau sémantique● Simuler le raisonnement humain par le biais de mécanismes
d'inférence
Représentation = Approximation
● Représentation : structure de symboles pour décrire un modèle du monde dans le contexte d'une tâche particulière
● Exemple de la carte et du territoire dans la recherche d'itinéraire : les détails inutiles sont ignorés
Fondements logiques
● Modèles de représentation des connaissances généralement issus de la logique mathématique
● Manipulation de connaissances explicites :● Langage formel de représentation (symboles)● Compromis efficacité/expressivité
Système formel (1)
● Syntaxe :● Langage : alphabet (ensemble de symboles) et procédé de
formation d'expressions (grammaire)● Système de déduction : règles pour construire de nouvelles
formules à partir d'axiomes (vérités arbitraires)
● Sémantique● Règles de valuation pour associer une valeur (vrai ou faux) à
toute formule du langage● Généralement compositionnelle : l'interprétation de la formule
x=(y+3)/z dépend de celle de x, de =, de y, etc.● Remarque : le langage naturel n'est pas compositionnel (le sens
de l'expression « tout à l'heure » ne provient pas de la composition du sens de « tout », « à » et « l'heure »)
Système formel (2)
● Correction : tout ce qui est déductible à partir des axiomes est vrai (théorèmes)
● Complétude : tout ce qui est vrai peut être déduit à partir des axiomes
● Décidabilité : étant donnée une formule, il existe un procédé de calcul (algorithme) qui permet de dire en temps fini si c'est un théorème ou non
Logique propositionnelle
● Système formel décidable dont la sémantique est compositionnelle
● Inconvénients● Temps de décision exponentiels● Expressivité limitée
Table de vérité pour la formuleP → (Q → R)
P Q R Q → R P → (Q → R)
V V V V V
F V V V V
V F V V V
F F V V V
V V F F F
F V F F V
V F F V V
F F F V V
● 2³=8 interprétations possibles● N'est pas un théorème (<P=V,Q=V,R=F>)
Logique du premier ordre
● Relations entre objets● Prédicats : lion(x) = “x est un lion”● Quantificateurs : x (lion(x) → roi (x)) = “tous ∀
les lions sont des rois”, y (félin(y) roi(y)) = ∃ ∧“certains félins sont des rois”
Langage naturel
● Contexte : “Regarde !”● Ambiguïté : “En posant l'assiette sur la table, il
la cassa”● Sens commun● Sémantique (≠ de sens) non compositionnelle :
« tout à l'heure »
Logiques non classiques
● Logique temporelle : “le lion est mort après le coucher du soleil”
● Théorie des probabilités : “le lion est peut-être mort”
● Logique floue : “beaucoup de lions sont des rois”
Compromis expressivité/efficacité
● Restreindre la logique pour avoir des algorithmes déductifs complets et rapides
● Abandonner l'exigence de complétude
Systèmes experts
● Représentations à base de faits et de règles● Mycin : système de diagnostic médical● Problèmes spécifiques● Fonctionnement éloigné des capacités du
cerveau humain : inférence rapide, connaissances peu expressives
Ontologies
● Représentation des connaissances basée sur les objets et les catégories● Simulation des modèles de représentation interne
du savoir humain● Sciences cognitives : sous quelles formes sont
stockées les connaissances dans la mémoire et comment sont-elles utilisées dans le raisonnement
● Bases de connaissances généralistes● But : requêtes sur un vaste de champ du savoir
humain
Ontologie informatique
● Représentation des propriétés générales de ce qui existe dans un formalisme supportant un traitement rationnel
● Concepts abstraits (principes, idées, objets, temps, espace, …) et relations
● Organisation hiérarchique● Partage et échange des connaissances
Catégories
● « — Tu connais un restaurant proche ?— Il y a une pizzeria au coin de la rue.— Merci. »
● La première personne généralise sa requête au concept de restaurant, catégorie la plus abstraite recevant toutes les formes de réponses acceptables
● La seconde déduit qu'une pizzeria est un restaurant, sa réponse est donc pertinente
RelationsMembre et SousEnsemble
● Objet cours c● Sous-classes (catégories) CoursModélisation,
CoursInfo● Relations :
● Membre(c,CoursModélisation), ouc ∈ CoursModélisation : “c est un cours de modélisation”
● SousEnsemble(CoursModélisation,CoursInfo), ou CoursModélisation ⊂ CoursInfo
Héritage
● Toutes les instances de la catégorie Nourriture sont comestibles
● Fruits est une sous-classe de Nourriture, Pommes est une sous-classe de Fruits
● Alors toutes les pommes sont comestibles : les pommes, individuellement, héritent de la propriété de comestibilité, parce qu'elles appartiennent à la catégorie Nourriture
Propriétés
● Définition de propriétés en logique du premier ordre
● x ∈ Pommes → Comestible(x) : toutes les instances de la classe Pommes sont comestibles
● x ∈ Pommes ∧ Couleur(x) = vert pomme ∧ Taille(x) = moyen ∧ Goût(x) = acidulé
→ x ∈ GrannySmith
Taxonomies
● Ontologies constituées uniquement des relations Membre et SousEnsemble
● Structure hiérarchique pour organiser des connaissances catégorielles sous forme de relations de sous-classes
● Classification
Intérêt des réseaux sémantiques
● Représentation graphique directement interprétable par l'humain
● Formalisme directement exploitable par une machine
● Expressivité parfois supérieure à la logique du premier ordre
● Limite : difficile de fournir des explications sur leur raisonnement
Vision de T. Berners-Lee
● Développement du Web possible avec des standards (TCP/IP, HTTP, HTML)
● Première génération d'Internet : pages écrites à la main
● Génération actuelle : contenu généré automatiquement (PHP), interactions humain-humain et humain-machine
● Prochaine génération :● Favoriser l'accès aux ressources pour un traitement automatique
par des agents logiciels● Espace d'échange d'informations entre agents (logiciels et
humains)
Principes
● Tout objet du Web possède une étiquette qui le représente fidèlement
● Toute étiquette peut être lue par les agents logiciels et humains
● La sélection d'une étiquette par un agent rend accessible l'objet en tant que ressource
● Objets : page Web, site, service, média, etc.● Étiquette (= métadonnée) : information sur les
données décrivant les connaissances contenues dans les ressources
RDF
● Ressource Description Framework● Format d'échange XML utilisé pour la
représentation des connaissances● Langage de base du Web sémantique● Triplets (ressource,propriété,valeur) pour
décrire les objets
Autres langages
● RDF Schema permet de définir des vocabulaires (descriptions d'ontologies) destinés à structurer des ressources RDF en classes/sous-classes et propriétés
● OWL permet de définir des ontologies en étendant les possibilités de RDFS
● SPARQL est un langage de requêtes pour RDF
Couches supérieures
● Pas encore normalisées, voire idées à développer
● RIF (Rule Interchange Format), Unification Logic et Proof : couche logique du Web sémantique
● Cryptography et Trust : gestion de la sécurité des données
● Web sémantique encore en cours de réalisation
Devinette enfantine
● Un homme regarde un portrait et déclare : « De frère et de sœur je n'ai point, mais le père de cet homme est le fils de mon père. » Qui est l'homme sur le portrait ?
● Formaliser ce problème en logique du première ordre en utilisant les constantes moi, cet_homme et mon_père, et les prédicats Père et Fils
Taxonomie du sport
● Définir une hiérarchie à partir des concepts suivants : Athléthisme, Course, Football, FootballAméricain, Natation, NatationSynchronisée, Patinage, PatinageArtistique, PatinageDeVitesse, Relai, Ski, Sport, SportArtistique, SportCollectif, SportDeBalle, SportIndividuel, Tennis.