Intelligence artificielle dveloppementale 27 Mars 2014
[email protected] http://www.oliviergeorgeon.com t
oliviergeorgeon.com1/29
Page 2
Plan Organisation dans le temps et lespace. Formalisme du
couplage spatio-temporel. Architecture cognitive. Dmonstrations.
Travaux pratiques Dveloppez votre agent auto-programmant (suite).
oliviergeorgeon.com2/29
Page 3
Rappel des ides thoriques Le but est dapprendre (dcouvrir,
organiser et exploiter) des rgularits dinteraction dans le temps et
lespace pour favoriser des critres inns (manger, apprendre, etc.).
Pour construire par lui-mme une ontologie de la ralit. A partir
dexpriences dinteraction. Dtecter et rpondre des affordances de
plus en plus sophistiques. auto-programmation.
oliviergeorgeon.com3/29
Page 4
Propose Trace-Based Reasoning Time Hierarchical abstraction
Matching Select Try to Enact More abstraction
oliviergeorgeon.com4/29
Page 5
Example 2 oliviergeorgeon.com5/29
Page 6
Exemples de comportements appris oliviergeorgeon.com6/29
Page 7
Exemple 2 oliviergeorgeon.com7/29
Page 8
Apprentissage de rgularits spatio-squentielles
oliviergeorgeon.com8/29
Page 9
Concept daffordance Capacit dun objet suggrer une utilisation.
To afford tre en mesure ou permettre Les objets nous poussent agir
(Heinz Werner) Une affordance est une proprit lie au couplage entre
un agent et un environnement. Nous connaissons le monde en termes
de possibilits dinteraction. oliviergeorgeon.com9/29
Page 10
Formalisme Agent Environment ObservationAction Formalisation
traditionnelle O O A A Agent Environment ExprienceRsultat
Apprentissage par exprience R R E E oliviergeorgeon.com10/29 Agent
Environment Intended Interaction Enacted Interaction I I I I
Radical Interactionism: I = E R X: Interactions composites
Page 11
How to learn the existence of possibly persistent entities in
the environment? How to adapt to different categories of entities?
Spatial Radical Interactionism Agent Environment Intended
Interaction i I Enacted Interaction e I oliviergeorgeon.com11/29
Spatial position Spatial transformation reprsente le systme
vestibulaire. Peut tre implment par un acclromtre. reprsente une
information permettant dinfrer la localisation (convergence
oculaire, dphasage inter-auriculaire, etc.)
Page 12
Spatial exemple 1 oliviergeorgeon.com Agent Environment Enacted
interaction:.. Spatial position = (1,0) Spatial transformation =
(0,0) Intended interaction 12/29
Page 13
Agent Environment Environment known at time t d e cd X d i cd X
d e p1 i p1 i pj Ie pj I Decisional mechanism Problme de rcursivit
Comment conserver la rcursivit? oliviergeorgeon.com Spatial
position Spatial transformation 13/29
Page 14
Spatial Exemple 1 oliviergeorgeon.com14/29
Page 15
Enactive Cognitive Architecture -Lagent se programm lui-mme au
cours de son exprience dinteraction. -Larchitecture cognitive ne se
programme pas elle-mme. (Kantian space, e.g., Buzsaki 2013, Space,
time, and memory) oliviergeorgeon.com15/29
Page 16
Inspiration des neurosciences oliviergeorgeon.com16/29
Page 17
Futures inspirations ? oliviergeorgeon.com Cotterill R. (2001).
Progress in Neurobiology. 17/29
Page 18
ECA agent exemple 2 oliviergeorgeon.com18/29
Page 19
From drives to goals Afforded Simulated
oliviergeorgeon.com19/29
Page 20
Travaux dirigs oliviergeorgeon.com 3eme partie. Salles TP6 et
TP7 Groupes de 2 20/29
Page 21
Exercice Deux expriences possibles E = {e 1,e 2 } Deux rsultats
possibles R = {r 1,r 2 } Quatre interactions possibles E x R = {i
11, i 12, i 21, i 22 } Environnements environnement 0 : e 1 -> r
1, e 2 -> r 2 (i 12 et i 21 ne se produisent jamais)
environnement 1 : e 1 -> r 2, e 2 -> r 1 (i 11 et i 22 ne se
produisent jamais) environnement 2 : e 1 -> r 2, e 2 -> r 2
environnement 3 Systmes motivationnels : motivation 0 : v(i 11 ) =
v(i 21 ) = 1, v(i 12 ) = v(i 22 ) = -1 motivation 1 : etc.
Implmenter un agent qui apprenne effectuer les interactions
positives sans connatre priori son systme motivationnel (motivation
1 ou motivation 2 ) ni son environnement (environnement 1 ou
environnement 2 ). Produire un rapport danalyse de comportement
bass sur les traces. oliviergeorgeon.com21/29 0) proposedExperience
= propositions.get(0).getExperience(); 28/29">
Mcanisme de dcision oliviergeorgeon.com List propositions = new
ArrayList (); for (Interaction activatedInteraction :
getActivatedInteractions()){ Proposition proposition = new
Proposition(
activatedInteraction.getPostInteraction().getExperience(),
activatedInteraction.getWeight() *
activatedInteraction.getPostInteraction().getValence()); int index
= propositions.indexOf(proposition); if (index < 0)
propositions.add(proposition); else
propositions.get(index).addProclivity(activatedInteraction.getWeight()
* activatedInteraction.getPostInteraction().getValence()); }
Collections.sort(propositions); If (propositions.size()> 0)
proposedExperience = propositions.get(0).getExperience();
28/29
Page 29
Class Proposition Class Proposition implements Comparable //
attributs: Experience experience Int proclivity // constructor
Proposition(Experience experience, int Proclivity) // methods int
compareTo(Proposition proposition) return new
Integer(proposition.getProclivity()).compareTo(this.proclivity);
boolean equals(Object otherProposition) return
((Proposition)otherProposition).getExperience() == this.experience;
void addProclivity(int proclivity) this.proclivity += proclivity;
oliviergeorgeon.com29/29