Inférence en logique du premier ordre
Chap. 9
Plan
• Réduire l’inférence de la logique du premier ordre en celle de la logique propositionnelle
• Unification• Modus Ponens généralisé• Chaînage avant et arrière• Résolution
Instanciation universelle (UI)• Chaque instanciation d’une phrase universellement quantifiée est
entraînée par cette dernière:v α
Subst({v/g}, α)pour toute variable v et tout terme instancié (grounded) g
• E.g., x King(x) Greedy(x) Evil(x) peut entraîner:
King(John) Greedy(John) Evil(John)King(Richard) Greedy(Richard) Evil(Richard)King(Father(John)) Greedy(Father(John)) Evil(Father(John))
Instanciation existentielle (EI)• Pour toute phrase α et variable v, et un symbole
de constante k qui n’apparaît pas dans la base de connaissances:
v αSubst({v/k}, α)
• E.g., x Crown(x) OnHead(x,John) entraîne:
Crown(C1) OnHead(C1,John)
en supposant que C1 est un nouveau symbole de constante jamais utilisé dans la base de connaissances.
Cette constante est appelée constante Skolem
Réduction en inférence propositionnelle
Supposons que la KB contient les phrases suivantes:
x King(x) Greedy(x) Evil(x)King(John)Greedy(John)Brother(Richard,John)
• Instancier la phrase universelle de toutes les façns possibles:King(John) Greedy(John) Evil(John)King(Richard) Greedy(Richard) Evil(Richard)King(John)Greedy(John)Brother(Richard,John)
• La nouvelle KB est propositionnalisée: les symboles de propositions sont:
King(John), Greedy(John), Evil(John), King(Richard), etc.
Réduction contd.• Chaque base de connaissances en LPO peut être
propositionnalisée pour préserver l’entraînement
• (Une phrase instanciée est entraînée par la nouvelle KB ssi elle est entraînée par la KB originale)
• Idée: propositionnaliser KB et requête, appliquer la résolution, et retourner le résultat
• Problème: avec le symbole de fonction, il y a un nombre infini de termes instanciés:– e.g., Father(Father(Father(John)))
Réduction contd.Théorème: Herbrand (1930). Si une phrase α est entraînée par une KB en LPO, alors elle est aussi entraînée par un sous-ensemble de KB propositionnalisée
Idée: Pour n = 0 à ∞ do créer la KB propositionnalisée en instanciant les termes à la profondeur n vérifier si α est entraînée par cette KB
Problème: fonctionne si α est entraînée. Mais boucle infini sinon.
Théorème: Turing (1936), Church (1936) L’entraînement en LPO est semidécidable (des algorithmes existent pour répondre “oui” à toute
phrase entraînée, mais il n’y a pas d’algorithme pour répondre “non” à toute phrase non-entraînée)
Problèmes avec la propositionnalisation
• La propositionnalisation peut générer beaucoup de phrases non pertinentes.
• E.g., à partir de:x King(x) Greedy(x) Evil(x)King(John)y Greedy(y)Brother(Richard,John)
• Il semble évident que Evil(John), mais la propositionnalisation produit beaucoup de faits tels que Greedy(Richard) qui n’est pas pertinente
• Avec un nombre p de prédicats à k arguments et n constantes, il y a p·nk instanciations.
Unification• On peut obtenir l’inférence immédiatement si on peut trouver une
substitution θ telle que King(x) et Greedy(x) match King(John) et Greedy(y)
θ = {x/John,y/John} fonctionne pour ça
• Unify(α,β) = θ si αθ = βθ p q θ Knows(John,x) Knows(John,Jane) Knows(John,x) Knows(y,OJ) Knows(John,x) Knows(y,Mother(y))Knows(John,x) Knows(x,OJ)
Standardizing apart élimine la confusion des variables, e.g., Knows(z17,OJ)•
Unification• On peut obtenir l’inférence immédiatement si on peut trouver une
substitution θ telle que King(x) et Greedy(x) match King(John) et Greedy(y)
θ = {x/John,y/John} fonctionne pour ça
• Unify(α,β) = θ si αθ = βθ p q θ Knows(John,x) Knows(John,Jane) {x/Jane}}Knows(John,x) Knows(y,OJ) Knows(John,x) Knows(y,Mother(y))Knows(John,x) Knows(x,OJ)
Standardizing apart élimine la confusion des variables, e.g., Knows(z17,OJ)•
Unification• On peut obtenir l’inférence immédiatement si on peut trouver une
substitution θ telle que King(x) et Greedy(x) match King(John) et Greedy(y)
θ = {x/John,y/John} fonctionne pour ça
• Unify(α,β) = θ si αθ = βθ p q θ Knows(John,x) Knows(John,Jane) {x/Jane}}Knows(John,x) Knows(y,OJ) {x/OJ,y/John}}Knows(John,x) Knows(y,Mother(y))Knows(John,x) Knows(x,OJ)
Standardizing apart élimine la confusion des variables, e.g., Knows(z17,OJ)•
Unification• On peut obtenir l’inférence immédiatement si on peut trouver une
substitution θ telle que King(x) et Greedy(x) match King(John) et Greedy(y)
θ = {x/John,y/John} fonctionne pour ça
• Unify(α,β) = θ si αθ = βθ p q θ Knows(John,x) Knows(John,Jane) {x/Jane}}Knows(John,x) Knows(y,OJ) {x/OJ,y/John}}Knows(John,x) Knows(y,Mother(y)) {y/John,x/Mother(John)}}Knows(John,x) Knows(x,OJ)
Standardizing apart élimine la confusion des variables, e.g., Knows(z17,OJ)•
Unification• On peut obtenir l’inférence immédiatement si on peut trouver une
substitution θ telle que King(x) et Greedy(x) match King(John) et Greedy(y)
θ = {x/John,y/John} fonctionne pour ça
• Unify(α,β) = θ si αθ = βθ p q θ Knows(John,x) Knows(John,Jane) {x/Jane}}Knows(John,x) Knows(y,OJ) {x/OJ,y/John}}Knows(John,x) Knows(y,Mother(y)) {y/John,x/Mother(John)}}Knows(John,x) Knows(x,OJ) {fail}
• Standardizing apart élimine la confusion des variables entre différentes clauses, e.g., Knows(z17,OJ), Knows(z18,Mother(y))
Unification• Pour unifier Knows(John,x) et Knows(y,z),
θ = {y/John, x/z } ou θ = {y/John, x/John, z/John}
• La première est plus générale que la seconde.
• Il y a une seule unification la plus générale (most general unifier - MGU) qui est unique, excepté la rénomination des variables
• MGU = { y/John, x/z }
Algorithme d’unification
Algorithme d’unification
Modus Ponens généralisé (GMP)p1', p2', … , pn', ( p1 p2 … pn q) qθExemple:King(John), Greedy(y), (King(x) Greedy(x) Evil(x))
θ1={x/John} θ2={x/y} ou θ={y/x}, mais ici {y/John}
θ = θ1●θ2= {x/John,y/John}qθ = Evil(John)
• GMP utilisé avec KB de clauses définies (definite clauses) (exactement un littéral positif) (comparez à clause Horn)– ( p1 p2 … pn q)– (p1 p2 … pn q)
• Toute variable est supposée être avec quantificateur universel
où pi'θ = pi θ pour tout i
Adéquation de GMP• On a besoin de prouver • p1', …, pn', (p1 … pn q) ╞ qθ
en supposant que pi'θ = piθ pour tout i
• Lemma: Pour une phrase quelconque p, nous avons p ╞ pθ par UI (instanciation universelle)
1. (p1 … pn q) ╞ (p1 … pn q)θ = (p1θ … pnθ qθ)2. p1', …, pn' ╞ p1' … pn' ╞ p1'θ … pn'θ 3. De 1 et 2, qθ suit en utilisant Modus Ponens ordinaire
Exemple de base de connaissances
The law says that it is a crime for an American to sell weapons to hostile nations. The country Nono, an enemy of America, has some missiles, and all of its missiles were sold to it by Colonel West, who is American.• (La loi dit que c’est un crime pour un américain de
vendre des armes aux pays hostiles. Le pays Nono, un ennemie de l’Amérique, a des missiles, et tous ses missiles étaient vendus par Colonel West, qui est un américain.)
• Prove that Col. West is a criminal
Exemple de base de connaissances
... it is a crime for an American to sell weapons to hostile nations:American(x) Weapon(y) Sells(x,y,z) Hostile(z) Criminal(x)
Nono … has some missiles, i.e., x Owns(Nono,x) Missile(x):Owns(Nono,M1) and Missile(M1)
… all of its missiles were sold to it by Colonel WestMissile(x) Owns(Nono,x) Sells(West,x,Nono)
Missiles are weapons:Missile(x) Weapon(x)
An enemy of America counts as "hostile“:Enemy(x,America) Hostile(x)
West, who is American …American(West)
The country Nono, an enemy of America …Enemy(Nono,America)
Chaînage avant
Chaînage avant
Chaînage avant
Chaînage avant
Propriétés du chaînage avant• Adéquat et complet pour les clauses définies du premier
ordre
• Datalog = clauses définies du premier ordre + sans fonctions
• Ch. avant termine pour Datalog en un nombre fini d’itérations
• Peut ne pas terminer en général si α n’et pas entraîné
• Ceci est inévitable: l’entraînement avec les clauses définies est semidécidable
Efficacité du chaînage avantChaînage avant incrémental: pas besoin de matcher une
règle à l’itération k si une prémise n’était pas ajoutée à l’itération k-1Þ Matcher chaque règle dont la prémise contient un littéral positif
nouvellement ajouté
Matching peut être coûteux:Indexation de base de données (Database indexing)
permet O(1) pour retrouver des faits connus
– e.g., requête Missile(x) retrouve Missile(M1)
Ch. avant est largement utilisé dans les bases de données déductives
Exemple de match difficile
• Colorable() est inféré ssi CSP a une solution• CSPs contiennent 3SAT comme cas spécial,
donc matching est NP-difficile
Diff(wa,nt) Diff(wa,sa) Diff(nt,q) Diff(nt,sa) Diff(q,nsw) Diff(q,sa) Diff(nsw,v) Diff(nsw,sa) Diff(v,sa) Colorable()
Diff(Red,Blue) Diff (Red,Green) Diff(Green,Red) Diff(Green,Blue) Diff(Blue,Red) Diff(Blue,Green)
Chaînage arrière
SUBST(COMPOSE(θ1, θ2), p) = SUBST(θ2, SUBST(θ1, p))
Chaînage arrière: Exemple
Chaînage arrière: Exemple
Chaînage arrière: Exemple
Chaînage arrière: Exemple
Chaînage arrière: Exemple
Chaînage arrière: Exemple
Chaînage arrière: Exemple
Propriétés du chaînage arrière• Preuve en recherche en profondeur récursive:
espace de taille linéaire• Incomplet à cause de boucles infinis possibles
Þ Fixer le problème en examinant le but courant avec tout le stack de buts
• Inefficace dû aux sous-buts répétés (réussis ou échoués) Fixer le prob. en utilisant le cache (espace additionnel)
• Largement utilisé en programmation logique (Prolog)
Programmation logique: Prolog• Algorithme = Logique + Contrôle
• Base: chaînage arrière avec clauses Horn + certains gadgetsRépandu en Europe, Japon (base du projet de 5ième génération)Technique de compilation 60 million LIPS
• Programme = ensemble de clauses = head :- literal1, … literaln.• criminal(X) :- american(X), weapon(Y), sells(X,Y,Z),
hostile(Z).
• Recherche en profondeur, de gauche à droite, chaînage arrière• Prédicats prédéfinis (Built-in) pour des opérations arithmétiques. etc., e.g., X
is Y*Z+3• Prédicats prédéfinis pour entrée-sortie, assertion/retract, …• Hypothèse du monde clos (Closed-world assumption) ("negation as failure")
– e.g., avec alive(X) :- not dead(X).– alive(joe) réussi si dead(joe) échoue
Prolog• Concaténer 2 listes pour produire la 3ième append(X,Y,Z):
append([],Y,Y). append([X|L],Y,[X|Z]) :- append(L,Y,Z).
• Équivalent en logique: append([],Y,X)append(L,Y,Z) append([X|L],Y,[X|Z])
• requête: append(A,B,[1,2]) ?
• réponse: A=[] B=[1,2] A=[1] B=[2] A=[1,2] B=[]
Règle de Résolution• Version complète du premier ordre:• l1 ··· lk, m1 ··· mn
(l1 ··· li-1 li+1 ··· lk m1 ··· mj-1 mj+1 ··· mn)θ
avec Unify(li, mj) = θ.
• Exemple Rich(x) Unhappy(x) Rich(Ken)
Unhappy(Ken)avec θ = {x/Ken}
• Appliquer la résolution sur CNF(KB α); complet pour LPO
Uitliser la preuve de résolution par contradiction
1. Convertir la KB en clauses (CNF)2. Convertir la négation de la conclusion en
clause3. Appliquer la règle de résolution4. Si on produit une clause vide
(contradiction), alors la conclusion est prouvée
Conversion en CNF• Everyone who loves all animals is loved by
someone:x [y Animal(y) Loves(x,y)] [y Loves(y,x)]
• 1. Éliminner biconditionnels et implications• x [y Animal(y) Loves(x,y)] [y Loves(y,x)]
• 2. bouger vers l’intérieur (x p ≡ x p, x p ≡ x p)
x [y (Animal(y) Loves(x,y))] [y Loves(y,x)] x [y Animal(y) Loves(x,y)] [y Loves(y,x)] x [y Animal(y) Loves(x,y)] [y Loves(y,x)]
Conversion en CNF contd.3. Standardiser les variables: chaque quantificateur
utilise une variable différentex [y Animal(y) Loves(x,y)] [z Loves(z,x)]
4. Skolemiser:Chaque variable existantielle est remplacé par une Fonction
Skolem des variables universelles reliées:(Si une variable existantielle n’est pas dans la portée d’un
quantificateur universel, remplacer par une constante Skolem.)
x [Animal(F(x)) Loves(x,F(x))] Loves(G(x),x)
5. Enlever les quantificateurs universels [Animal(F(x)) Loves(x,F(x))] Loves(G(x),x)
6. Distribuer sur :7. [Animal(F(x)) Loves(G(x),x)] [Loves(x,F(x)) Loves(G(x),x)]
Preuve avec la résolution par contradiction
Factoring• Une application binaire de la règle de résolution
– Combiner 2 clauses chaque fois– Non complète seule
• Ajouter le factoring– Si 2 éléments dans la clause sont unifiables, alors
réduire la clause en unifiant les élémentsP(x) P(y)∨ P(x) P(John)∨ P(x) P(John)
– Application binaire + factoring = complet
Exemple de factoring¬p(x) ¬q(y) ¬p(z) q(y) p(x) ¬q(y) p(z) q(y)∨ ∨ ∨ ∨
¬p(x) ¬p(z)∨ p(x) p(z)∨
¬p(z) p(z) ∨ ¬p(x) p(x)∨
true true
Sans factoring: la prevue ne peut être faite.
Exemple de factoring¬p(x) ¬q(y) ¬p(z) q(y) p(x) ¬q(y) p(z) q(y)∨ ∨ ∨ ∨
¬p(x) ¬p(z)∨Factoring
¬p(x)
p(x) p(z)∨ Factoring
p(x)
Sommaire
• Généralisation des procédures d’inférence: Logique propositionnelle LPO
• Unification pour traiter des variables• Règle de résolution (avec contradiction)• Adéquat et complet pour LPO• Prolog