Intelligence artificielle développementale 27 Mars 2014 [email protected] t oliviergeorgeon.com1/29

Intelligence artificielle dveloppementale 27 Mars 2014 [email protected] http://www.oliviergeorgeon.com t oliviergeorgeon.com1/29

Plan Organisation dans le temps et lespace. Formalisme du couplage spatio-temporel. Architecture cognitive. Dmonstrations. Travaux pratiques Dveloppez votre agent auto-programmant (suite). oliviergeorgeon.com2/29

Rappel des ides thoriques Le but est dapprendre (dcouvrir, organiser et exploiter) des rgularits dinteraction dans le temps et lespace pour favoriser des critres inns (manger, apprendre, etc.). Pour construire par lui-mme une ontologie de la ralit. A partir dexpriences dinteraction. Dtecter et rpondre des affordances de plus en plus sophistiques. auto-programmation. oliviergeorgeon.com3/29

Propose Trace-Based Reasoning Time Hierarchical abstraction Matching Select Try to Enact More abstraction oliviergeorgeon.com4/29

Example 2 oliviergeorgeon.com5/29

Exemples de comportements appris oliviergeorgeon.com6/29

Exemple 2 oliviergeorgeon.com7/29

Apprentissage de rgularits spatio-squentielles oliviergeorgeon.com8/29

Concept daffordance Capacit dun objet suggrer une utilisation. To afford tre en mesure ou permettre Les objets nous poussent agir (Heinz Werner) Une affordance est une proprit lie au couplage entre un agent et un environnement. Nous connaissons le monde en termes de possibilits dinteraction. oliviergeorgeon.com9/29

Formalisme Agent Environment ObservationAction Formalisation traditionnelle O O A A Agent Environment ExprienceRsultat Apprentissage par exprience R R E E oliviergeorgeon.com10/29 Agent Environment Intended Interaction Enacted Interaction I I I I Radical Interactionism: I = E R X: Interactions composites

How to learn the existence of possibly persistent entities in the environment? How to adapt to different categories of entities? Spatial Radical Interactionism Agent Environment Intended Interaction i I Enacted Interaction e I oliviergeorgeon.com11/29 Spatial position Spatial transformation reprsente le systme vestibulaire. Peut tre implment par un acclromtre. reprsente une information permettant dinfrer la localisation (convergence oculaire, dphasage inter-auriculaire, etc.)

Spatial exemple 1 oliviergeorgeon.com Agent Environment Enacted interaction:.. Spatial position = (1,0) Spatial transformation = (0,0) Intended interaction 12/29

Agent Environment Environment known at time t d e cd X d i cd X d e p1 i p1 i pj Ie pj I Decisional mechanism Problme de rcursivit Comment conserver la rcursivit? oliviergeorgeon.com Spatial position Spatial transformation 13/29

Spatial Exemple 1 oliviergeorgeon.com14/29

Enactive Cognitive Architecture -Lagent se programm lui-mme au cours de son exprience dinteraction. -Larchitecture cognitive ne se programme pas elle-mme. (Kantian space, e.g., Buzsaki 2013, Space, time, and memory) oliviergeorgeon.com15/29

Inspiration des neurosciences oliviergeorgeon.com16/29

Futures inspirations ? oliviergeorgeon.com Cotterill R. (2001). Progress in Neurobiology. 17/29

ECA agent exemple 2 oliviergeorgeon.com18/29

From drives to goals Afforded Simulated oliviergeorgeon.com19/29

Travaux dirigs oliviergeorgeon.com 3eme partie. Salles TP6 et TP7 Groupes de 2 20/29

Exercice Deux expriences possibles E = {e 1,e 2 } Deux rsultats possibles R = {r 1,r 2 } Quatre interactions possibles E x R = {i 11, i 12, i 21, i 22 } Environnements environnement 0 : e 1 -> r 1, e 2 -> r 2 (i 12 et i 21 ne se produisent jamais) environnement 1 : e 1 -> r 2, e 2 -> r 1 (i 11 et i 22 ne se produisent jamais) environnement 2 : e 1 -> r 2, e 2 -> r 2 environnement 3 Systmes motivationnels : motivation 0 : v(i 11 ) = v(i 21 ) = 1, v(i 12 ) = v(i 22 ) = -1 motivation 1 : etc. Implmenter un agent qui apprenne effectuer les interactions positives sans connatre priori son systme motivationnel (motivation 1 ou motivation 2 ) ni son environnement (environnement 1 ou environnement 2 ). Produire un rapport danalyse de comportement bass sur les traces. oliviergeorgeon.com21/29 0) proposedExperience = propositions.get(0).getExperience(); 28/29">

Mcanisme de dcision oliviergeorgeon.com List propositions = new ArrayList (); for (Interaction activatedInteraction : getActivatedInteractions()){ Proposition proposition = new Proposition( activatedInteraction.getPostInteraction().getExperience(), activatedInteraction.getWeight() * activatedInteraction.getPostInteraction().getValence()); int index = propositions.indexOf(proposition); if (index < 0) propositions.add(proposition); else propositions.get(index).addProclivity(activatedInteraction.getWeight() * activatedInteraction.getPostInteraction().getValence()); } Collections.sort(propositions); If (propositions.size()> 0) proposedExperience = propositions.get(0).getExperience(); 28/29

Class Proposition Class Proposition implements Comparable // attributs: Experience experience Int proclivity // constructor Proposition(Experience experience, int Proclivity) // methods int compareTo(Proposition proposition) return new Integer(proposition.getProclivity()).compareTo(this.proclivity); boolean equals(Object otherProposition) return ((Proposition)otherProposition).getExperience() == this.experience; void addProclivity(int proclivity) this.proclivity += proclivity; oliviergeorgeon.com29/29

Documents

Intelligence artificielle développementale 27 Mars 2014 [email protected] t oliviergeorgeon.com1/29