Upload
felice-bouchez
View
112
Download
1
Embed Size (px)
Citation preview
04/11/23
Intelligence Artificielle et plagiarisme constructif
Mounir Boukadoum
UQAM
Aujourd’hui… On peut-on réaliser des computations hors de
portée de la plupart des adultes avec un ordinateur : e.g., calculs arithmétiques, jouer aux échecs, brasser
de grandes quantités de données, etc. Mais pas des fonctions cognitives à la portée
d’un bébé ! e.g., reconnaissance des visages et des objets,
autonomie d’apprentissage, coordination sensori-motrice Le cerveau humain fonctionnerait-il suivant
des principes différents des ordinateurs actuels ?
Un système c’est quoi ?
Bonne question ! Une définition pragmatique :
Ensemble d’éléments physiques ou conceptuels liés par des relations causales
23-04-11 3
Relation(s) d’entrée-sortie
Causes (entrées)
Effets (sorties)
Paramètres
Et un modèle?
Définition pas plus évidente... autre définition pragmatique:
Construction physique ou schématique permettant d’expliquer la nature ou comportement d’un système à partir de postulats élémentaires.
04/11/23 4
Identification des éléments
Hmm…
stack_struct
stack_point
list
queue_num_elem
queue_struct
queue_headqueue_tail
stack_top stack_push stack_pop
stack_fullstack_empty
list_elimlist_is_in
list_add
list_empty
queue_full queue_empty
queue_extract
queue_insert
global_init
stack_to_queue
stack_to_list
queue_to_stack
list_to_stack
list_to_queue
queue_to_list
La modélisation classique
Part d’hypothèses intuitivement acceptables : Le tout est la somme des parties (principe de linéarité) Des perturbations minimes sur un nombre fini de
parties auront un effet minime sur le tout (principe de continuité locale)
Les lois régissant le fonctionnement sont immuables à court ou moyen terme (principe de stationnarité) ; en particulier, deux effets différents pour la même cause sont le fait de paramètres différents
Un système qui ne répond pas aux hypothèses demande seulement l’ajout de termes de correction
04/11/23 6
Conséquences... Les systèmes peuvent être décrits par un
approche formelle Équations différentielles/intégrales linéaires et
stationnaires dans le temps Raisonnement logique
Les « récalcitrants » peuvent être corrigés en changeant leurs paramètres ou en ajoutant des termes de correction : Un système non linéaire est un système linéaire, plus… Un système non stationnaire est un système invariant
dans le temps, plus…
04/11/23 7
Et que faire si…
Les valeurs des variables sont imprévisibles, (variables bruitées ou trop complexes) ?
Remplacer les équations d’entrée-sortie par des versions probabilistes
Les nature des variables est vague ou leurs valeurs imprécises, ou on tombe sur des contradictions?
Étudier le sujet avec plus de détail Les équations n’ont pas de solutions
analytiques Et l’analyse numérique, vous y avez pensé ?
04/11/23 8
Mais alors, pourquoi…
Peut-on réaliser des prouesses computationnelles hors de portée de la plupart des gens avec un ordinateur : e.g. calculs arithmétiques, jouer aux échecs, brasser de
grandes quantités de données précisément, etc.
mais pas réaliser des fonctions à la portée d’un bébé : e.g. reconnaissance des visages et des objets, autonomie
d’apprentissage, coordination sensori-motrice
Réponse possible : le cerveau humain fonctionne suivant des principes différents des ordinateurs Séquentiel vs. parallèle; « intelligence ».
IA classique
Descartes : Cogito, ergo sum (c.à.d. c’est l’esprit qui compte, pas le corps)
Le calcul analytique est un bon début, mais il faut aller plus loin reproduire les facultés cognitives humaines de
haut niveau : langage, raisonnement discursif, abs tractation des idées, etc.
La logique et les graphes indiquent le chemin
Représentation formelle des connaissances
Spot is a dog Spot is brown Every dog has four
legs Every dog has a tail Every dog is a
mammal Every mammal is
warm-blooded
dog(Spot) brown(Spot) (x)(dog(x)
four-legged(x)) (x)(dog(x) tail(x)) (x)(dog(x)
mammal(x)) (x)(mammal(x)
warm-blooded(x))
Graphe (Réseau sémantique)
mammal
dog
Spot
warm-blooded
four-legs
tail
brown
Exempled`inférence
Exemple d’utilisationIF
1) the infection is primary-bacteremia, and2) the site of the culture is one of the sterile
sites, and3) the suspected portal of entry of the
organism is the gastrointestinal tract,
THENthe identity of the organism is bacteroides
with suggestive evidence 0.7
Pourquoi cela ne marche pas toujours…
Difficulté de trouver un ordre (les règles)
Explosion combinatoire des règles Sensibilité au contexte Symboles sans ancrage sémantique Sens-commun difficile à modeler Cognition non verbale non modelée Les paradoxes ne sont pas exclus
Paradoxes de Russel, Théorèmes de Gödel
15
Modus ponens: ((PQ) P) Q Wason Task (1996, 1993):
Si voyelle, alors chiffre pair au verso
Carte(s) à tourner pour vérifier la règle? <10% de bonnes réponses (1 & 2)!
Si enveloppe sellée, alors timbre de 2.80$ au verso Enveloppe(s) à tourner pour vérifier la règle? 90% de bonnes réponses!
Même règle, mais utilisation inconsistante!
L’implication logique est-elle naturelle (chez l’humain) ?
A 3 B 2
Adapted from Ripoll and Tricot, 1995
Le cycle de la compétence chez l’humain1. Novice : apprentissage de faits et règles pour
application sans discernement 2. Débutant avancé : identification de situations
similaires par expérience3. Compétence émergente : sens de la
pertinence pour grouper des volumes de faits4. Compétent : pensée analytique enrichie par
l’organisation et la compréhension intuitives5. Expert : comportement est intuitif,
automatique et efficace.
04/11/23 17
Qu’en est-il de formalismes…
Résilients à l’incertitude, la complexité ou le manque de précision ?
Capables de s’adapter automatiquement à des changements de contexte
Plus proches de la manière dont l’être humain lambda et la nature en général résolvent les problèmes ?
Adapté de Léonard Studer
La « nouvelle » IA Apparue dans les années 80 Convergence de développements
en plusieurs disciplines : La représentation
propositionnelle émerge des connaissances et n’est plus un postulat de base
Utilisation d’approches non traditionnelles connexionnisme (savoir implicite vs.
explicite) métaphores
04/11/23 19
Traitement intelligent ?
Propriété d’un système capable : d’apprentissage autonome d’auto-adaptation à des contextes différents de traitement de données incomplètes, vagues
ou imprécises Défi de taille pour les outils de
modélisation traditionnels, mais pour la nature ! Pourquoi ne pas la copier? Processus biologiques, évolutionnaires,
cognitifs, etc. (intelligence mimétique), quelquefois matés avec des outils statistiques non linéaires.
Computation naturelle (mimétique)
Caractéristiques: Tolérance au bruit, à l’erreur, aux fautes,
aux défauts Algorithmes génériques Adaptabilité Réponse en temps réel Optimalité et boîte blanche non
essentiels
04/11/23 21
Quand utiliser TII ?
Modèles inconnus, vagues ou incomplets Modèles connus, mais pas les outils
(modèles non linéaires, variant dans le temps, etc.)
Données bruitées, fragmentaires ou soumises à l’influence environnementale
Performance des outils formels faible (temps, précision)
Dimension de l’espace de travail trop grande
04/11/23 22
Quelques fois on sait, mais…
Modèle en haute fréquence d’un transistor
Lg Gg LdGd
Gs
Ls
DG
S
Gi
G1Cs
Cd
Cg
gm VcVc
S21= { [-2 G0 Gg Gd gm Gi Gs] p**0 + 2 G0 Gg Gd Gi [Cg (Gs+gm+G1)+Cs G1] p**1 + [Cg Cs G0 Gg Gd
(Gi+Gs+G1)+ G0 Gg Gd Gi Cd (Cg+Cs)+G0 Gg Gd Gi Gs (Cg Ls (gm+G1)+G1 Cs Ls)] p**2 + 2 G0 Gg Gd [Cg
Cs Cd+Gs Cg Cs Ls (Gi+G1)+Gi Gs Cd Ls (Cg+Cs)] p**3 + 2 G0 Gg Gd Gs Cg Cs Cd Ls p**4 } / { G0 Gg Gi
(Gd GL (gm + G1 + Gs)+ G1 Gs (Gd + GL)) p**0 + [Cg Gi (G0 (Gg Gd gm + Gg GL gm + Gd GL gm + Gg Gd G1
+ Gg GL G1 + Gd GL G1 + Gg Gd Gs+ Gg GL Gs+ Gd GL Gs + Gd gm Gs + GL gm Gs + Gd G1 Gs + GL G1 Gs) + Gg (Gd GL gm + Gd GL G1 + Gd GL Gs + Gd gm Gs + GL gm Gs +Gd G1 Gs + GL G1 Gs)) + Cs (G0 (GL (Gg Gd
G1+ Gg Gd Gi + Gg G1 Gi + Gd G1 Gi + Gg Gd Gs + Gg G1 Gs + Gd Gi Gs + G1 Gi Gs) + Gg Gd G1 Gi + Gg Gd
G1 Gs + Gd G1 Gi Gs) + Gg Gi (Gd GL G1 + Gd GL Gs + Gd G1 Gs + GL G1 Gs)) + Cd G0 Gg Gi (Gd GL + Gd
Gs+ GL Gs)+ (Ld G1+ Ls (G1 + gm)) G0 Gg Gd GL Gi Gs] p**1 + [Cg Cs (G0 (GL (Gg G1+Gd G1+Gg Gi+Gd
Gi+Gg Gs+Gd Gs+G1 Gs+Gi Gs) + Gg Gd G1+Gg Gd Gi+Gg Gd Gs+Gd G1 Gs+Gd Gi Gs) +Gg (Gd GL G1+Gd
GL Gi+Gd GL Gs+Gd G1 Gs+GL G1 Gs+Gd Gi Gs+GL Gi Gs)) + Cg Cd Gi (G0 (Gg Gd +Gg GL + Gd GL + Gd Gs
+ GL Gs) + Gg (Gd GL + Gd Gs + GL Gs)) + Cs Cd (G0 (Gg Gd GL+Gg Gd Gi+Gg GL Gi + Gd GL Gi + Gg Gd
Gs + Gg GL Gs + Gd Gi Gs + GL Gi Gs) + Gg Gi (Gd GL + Gd Gs + GL Gs)) + Cg Lg G0 Gg Gi (Gd GL gm + Gd
GL G1 + Gd GL Gs + Gd gm Gs + GL gm Gs + GL G1 Gs + Gd G1 Gs ) + Cs Lg G0 Gg Gi (Gd GL G1 + Gd GL Gs + Gd G1 Gs + GL G1 Gs)+ Cg Ld Gd Gi (G0 (Gg GL gm + Gg GL G1 + Gg GL Gs + GL gm Gs + GL G1 Gs) + Gg GL
Gs (gm + G1))+ Cs Ld Gd G1 GL (G0 Gg Gi + G0 Gg Gs + G0 Gi Gs + Gg Gi Gs) + Cd (Ld + Ls) G0 Gg Gd GL Gi
Gs + Cs Ls Gs (G0 (Gg Gd (GL G1 + GL Gi + G1 Gi ) + GL G1 Gi (Gg + Gd)) + Gg Gd GL G1 Gi)+ Cg Ls Gi Gs
(G0 (Gg Gd gm + Gg GL gm + Gd GL gm + Gg Gd G1 + Gg GL G1 + Gd GL G1) + Gg Gd GL gm + Gg Gd GL G1)] p**2 + [Cg Cs Cd (G0 Gg Gd + G0 (Gg GL + Gd GL + Gd Gs + GL Gs) + Gg (Gd (GL + Gs) + GL Gs)) + Cg Cs
Lg G0 Gg (Gd (GL G1 + GL Gi + GL Gs + G1 Gs + Gi Gs) + GL G1 Gs + GL Gi Gs)+ Cg Cd Lg G0 Gg Gi (Gd (GL
+ Gs) + GL Gs) + Cs Cd Lg G0 Gg Gi (Gd (GL + Gs) + GL Gs)+ Cg Lg Ld G0 Gg Gd GL Gi Gs (gm + G1)+ Cg Lg
Ls G0 Gg Gd GL Gi Gs ( gm + G1) + Cs Lg (Ld + Ls) G0 Gg Gd GL G1 Gi Gs + Cg Cs Ld GL (G0 Gd (Gg G1 + Gg
Gi + G1 Gs + Gi Gs + Gg Gs) +Gg Gd Gs (G1 + Gi))+ Cg Cd Ld Gd Gi GL (G0 Gg + G0 Gs + Gg Gs)+ Cs Cd Ld
Gd GL (G0 Gg Gi + G0 Gg Gs + G0 Gi Gs + Gg Gi Gs) + Cg Ld Ls G0 Gg Gd GL Gi Gs (gm + G1) + Cs Ld Ls G0
Gg Gd GL G1 Gi Gs + Cg Cs Ls Gs (G0 (Gg Gd G1+Gg GL G1+Gd GL G1+Gg Gd Gi+Gg GL Gi+Gd GL Gi )+Gg
Gd GL (G1 + Gi)) + Cg Cd Ls Gi Gs (G0 (Gg Gd +Gg GL+Gd GL) +Gg Gd GL) + Cs Cd Ls Gs (G0 (Gg Gd GL
+Gg Gd Gi +Gg GL Gi +Gd GL Gi) +Gg Gd GL Gi)] p**3 + [Cg Cs Cd Ld Gd GL Gs ( G0 + Gg) + Cg Cs Cd Ls
Gs (G0 Gg Gd +G0 Gg GL +G0 Gd GL + Gg Gd GL)+ Cg Cd Lg G0 Gg GL Gs (Cs + Ld Gd Gi)+ Cg Cs Lg Ld G0 Gg
Gd GL Gs (G1 + Gi) + Cs Cd Lg (Ld+Ls) G0 Gg Gd GL Gi Gs + Cg Cs Lg Ls G0 Gg Gd GL Gs (G1 + Gi) + Cg Cd
Lg Ls G0 Gg Gd GL Gi Gs + Cg Cs Ld Ls G0 Gg Gd GL Gs (G1+ Gi) + (Cg + Cs) Cd Ld Ls G0 Gg Gd GL Gi Gs] p**4 + [Cg Cs Cd Lg (Ld + Ls) G0 Gg Gd GL Gs + Cg Cs Cd Ld Ls G0 Gg Gd GL Gs] p**5 }
Et on a supposé un modèle Et on a supposé un modèle linéaire à paramètres linéaire à paramètres distribués !distribués !
04/11/23 23
Inférence
Déductive(modèles précis)
Synthétique(modèles approximatifs)
AbductiveInductive
L’intelligence mimétique « raisonne »-t’elle ?
Proposition Type de raisonnement
(a) Les hommes sont mortels(b) Socrate est un homme(c) Socrate est mortel
(a) et (b) donne (c) par déduction(b) et (c) donne (a) par induction
(a) et (c) donne (b) par abduction
TI
04/11/23 24
La boîte à outils présente Réseaux de neurones artificiels (RN) Logique floue (LF) Algorithmes évolutionnaires (AE) Les systèmes immunitaires artificiels (AIS) Concepts associés (à des fins d’hybridation)
Machines à vecteurs supportsOptimiseurs algorithmiquesGraphes et treillis probabilistes (Modèles
markoviens, réseaux bayésiens, etc.)Raisonnement à base de casEt autres …
04/11/23 25
Lequel, pourquoi ?
RN
AELF
Classer/ Apprendre Optimiser
Expliquer/Décider
L’hybridation est possible et desirable :
Le but est un système de
traitement avec plus intelligence
AISDétecter
04/11/23 26
Fonctions clés- Diagnostique - Évaluation- Pronostique- Contrôle
Technologies- Classifieurs (SVM, BBN,
NN, FS, RF,…)
- Prédicteurs (NN, RBF, FS, RF, basés instance, …)
Lequel, quand ?
Tactique[ ns- hres-jours]
Opérationnel[ Jours-Sems]
Strategique[ Mois-Années]
Meta[ Vie]
Adapté de Piero Bonissone
Fonctions clés- Génération de cédules- Planif. logistique- Évaluation d’état & allocation de ressources
- Gestion d’actifs
Technologies- Optimiseurs (EA, Tabou …)- Simulateurs (Discrets,
Stochastiques, …)- Experts (Temporels, basés
règles, cas, instances, …)
Fonctions clés- Gestion de ressources
Multi-Objectifs - Détermination de politique- Optimisation simple/Multi-
objectif- Prise de décision
Technologies- Optimiseurs (EA Multi-
Objectifs, Tabou, …)- Simulateurs (Discrets,
Stochastiques, …)- Experts en compromis
(basés flou, règles, cas, instances, …)
- Visualisation (Interactifs, basés règles, cas, instances, …)
Fonctions clés- Support de cycle de vie - Surveillance de l’usage- Adaptabilité aux
changements- Évolutilivité des modèle
Technologies- Optimiseurs pour le
réglage & l’adaptation (EA, Gradients, Tabou, …)
- Simulateurs pour la validation (Discrets, Stochastiques, …)
04/11/23 27
Les propriétés générales
: Des théorèmes existent pour plusieurs techniques, prouvant les propriétés : Approximateur universel de toute fonction bornée
et suffisemment régulière. Parsimonieux en paramètres en comparaison avec
un algorithme linéaire. Convergence vers une solution
: Appoches heuristiques : pas de critères formels pour régler les paramètres !
04/11/23 28
Les RNA
« Inspirés » du système nerveux central Groupements d’éléments simples Fonctionnalité répartie dans l’espace et le
temps Se distinguent par la topologie, la/les
fonctions de sortie et la règle d’adaptation des poids
Entrées Sorties
: Neurone
: lien pondéré
04/11/23 29
RN un bon choix si :
Le problème est riche en données et pauvre en modèles (Modélisation classique inapplicable)
Relation d’e/s non linéaire, à variables multiples ou volatile (approximation par méthodes linéaires souvent inappropriées, les essayer d’abord !)
On a du temps (et de la créativité) pour arriver au RNA final La détermination des paramètres est un art !
04/11/23 30
RN en action
Classification/catégorisation/approximation Détection/identification de signaux, d’objets et
d’organismes biologiques Synthèse de fonctions complexes Modélisation non linéaire Visualisation de structures sous-jacentes Analyse d’image (cellules malignes, défauts de
soudure ou d’assemblage, aussi cibles de missiles malheureusement )
Codeurs/décodeurs
04/11/23 31
Logique floue 101
Remplace des intervalles de valeurs numériques par des étiquettes qualitatives (valeurs linguistiques).
On raisonne sur les valeurs linguistiques : Y=f(x) s’applique sur des intervalles et non des singletons
L’appartenance multiple est permise: une valeur numérique peut correspondre à plusieurs valeurs linguistiques
0.5
1.0
0.0
Valeur mesurée
v()NI NM NP PP PM PIb
a
b
y
xx
y
a
y = fct de points y = fct d’intervalles
04/11/23 32
LF un bon choix si :
L’expérience ou l’intuition peut compléter/remplacer la connaissance formelle
Le savoir du domaine est de nature heuristique Les objectifs sont clairs, mais pas la démarche ! Les données se prêtent à l’agrégation L’environnement d’opération est bruité La performance temporelle est un critère
04/11/23 33
LF en action
Décision/analyse/classification Régulateurs non-linéaires Algorithmes de décision à base d’heuristiques Modélisation en boîte blanche Systèmes experts intuitifs Systèmes embarqués à réaction rapide Recherche de plus courts chemins Classifieurs rapides
04/11/23 34
Algorithmes évolutionnaires 101
Trouvent la solution progressivement, par renforcement de traits positifs
Introduisent une dimension stochastique à la recherche de solution
Incluent : Les algorithmes génétiques La programmation génétique L’intelligence collective (« ant colonies », « swarms ») Autres…
04/11/23 35
AE un bon choix si :
Les données peuvent être codées et le problème peut être formalisé par un graphe
L’effet de groupe peut améliorer le comportement individuel et vice-versa
L’atteinte du but est facile à conditionner Le problème est à contraintes multiples Un temps de convergence potentiellement lent
est acceptable Le hasard est au secours de la nécessité !
04/11/23 36
AE en action
Optimisation/fouille/synthèse/décision Reproduction de processus à l’aveugle Matériel évolutif (e.g. systèmes auto adaptatifs) Recherche de chemins et de points d’intérêts dans des
espaces complexes Traitement d’images Optimisation multiobjective Contournement de brevets !
04/11/23 37
Comparaison entre systèmes
LF RN AE
Représentation des connaissances ++ -- -
Tolérance à l’incertitude ++ ++ ++
Tolérance au manque de précision ++ ++ ++
Adaptabilité - ++ ++
Capacité d’apprentissage -- ++ ++
Capacité d’explication ++ -- -
Temps de réponse ++ + -
Maintenabilité + ++ +
-- Ouach ! -Mmh… + Ok ++ Yes sir !
04/11/23 38
Technique de modélisation
Equa-diff. FL RN AE Autres
Structure définissante
Ordre Ensemble de règles
Architecture Topologie et/ou encodage
Encodage
Paramètres Coefficients Étiquettes
Degrés de vérité
Biais
Poids synaptiques
Varient
Processus d’utilisation
Résoudre les équations - Solution fermée
- Approximation
Évaluation de nœud & Propagation
Propagation Évaluation de nœud & Propagation
Évaluation d`étape et Propagation
En résumé
REPRESENTATION