59

Vers une formalisation de l'approche sensorimotrice de la ...sapience.dec.ens.fr/cogmaster/www/doc/MEMOIRES/2017_GODON_J… · le formalisme proposé ici o re un gain d'expressivité

  • Upload
    vodung

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

Ecole Normale Supérieure

Département d'Etudes Cognitives

Mémoire de recherche de Master

Vers une formalisation de

l'approche sensorimotrice de la

perception

Jean-Merwan Godon

Encadrement (ISIR) :Bruno Gas

Sylvain ArgentieriValentin Marcel

6 Juin 2017

Déclarations

Déclaration d'originalité

Ce mémoire, à portée essentiellement théorique, bâtit sur les travaux actuels deBruno Gas, Sylvain Argentieri et Valentin Marcel au sein de l'équipe PerceptionActive Multimodale de l'ISIR. Ces travaux sont à ma connaissance les seuls encours à tenter de formaliser abstraitement la théorie de la perception dite des"contingences sensorimotrices".

Sa contribution scientique principale est de proposer une base solide pourcette formalisation qui fournisse de manière élégante les concepts requis pourformuler les notions dégagées par l'étude phénoménologique préalable. Ainsi,le formalisme proposé ici ore un gain d'expressivité et de concision sur desconcepts centraux comme la compensation sensorimotrice ou les espaces moteursde l'agent.

Un autre apport spécique consiste en une tentative de résolution d'un ob-stacle théorique (condition de staticité) qui limite aujourd'hui sévèrement leformalisme utilisé. Dans les faits, cela entraine cette fois un gain de généralitédes conclusions tirées. Des détails sont donnés là où les alternatives sont déniesprécisément.

Déclaration de contribution

Ont participé à ce travail : Bruno Gas, Sylvain Argentieri, Valentin Marcel

• la dénition de la question scientique : Bruno Gas, Sylvain Argentieri

• la recherche bibliographique : Sylvain Argentieri, Valentin Marcel, moi-même

• le choix de l'approche générale : Bruno Gas, Sylvain Argentieri, moi-même

• développements techniques spéciques : Valentin Marcel, moi-même

• la rédaction du mémoire : moi-même

1

PRE-REGISTRATION DOCUMENTTOWARDS A FORMALISM FOR PERCEPTION BASED ON

SENSORIMOTOR CONTINGENCIES

JEAN-MERWAN GODON

(Co-)supervision : Bruno Gas & Sylvain Argentieri, Institut des Systèmes Intelligents et deRobotique, UPMC

1. Introduction

1.1. Background and rationale.Poincaré, in his philosophical works on geometry and our experience of it, pioneered a

view stating that what we call space is actually a minimalist representation of the essentialrelations between our "actions" and their perceived "consequences". More recently, psychologyand robotics provided theoretical reasons for preferring this approach (O’Regan & Noë, 2001)and behavioral accounts of its occurrence, a formal framework of conceptual objects reflectingthe underlying processes and some early proofs of concept (Philipona, O’Regan & Nadal,2003).

The latest relevant works in robotics (mainly centered around the PhD of A. Laflaquière)consist of ad hoc implementations of solution algorithms to problems where the general objects(e.g. sets of possible movements, potential sensations...) are locally well known. Indeed,they typically support computational and spatial structures which naturally govern the task.However, in the sensorimotor paradigm, these solutions should really only depend on veryfundamental structural properties of said general objects.

While the aforementioned approach leads to both operational results and glimpses aboutthe nature of the manipulated objects, there remains ample work on the determination of aformal theory describing these structural properties in general.

1.2. Key research question.The target objective of the internship is finding a formal theory and a corresponding model

language adapted to the sensorimotor paradigm. Here, a theory is deemed "adapted" if itallows for easy formulation of the key concepts of the paradigm (e.g. sensation, perception,contingencies, compensation should all emerge as natural concepts) while retaining both theexpressive power to capture observed behavioral effects and the genericity (e.g. amodality,no quantitative assumption) of the statements.

1.3. Hypotheses.Both existing literature and preparatory works point towards a combination of algebra

(for the combinatoric structure of motor actions) and topology (as fundamental properties ofspace) being a good fit for foundations ; therefore, it will be the direction in which most ofthe work will occur, if only at first.

In general, while one of our central criteria for evaluating a suitable theory is its capacity todispose of all but the most basic of structural assumptions on space and the perceiving agent,some may nonetheless be incorporated provided they clearly hold in both human and roboticcases. Ideally, of course, "perceiving" (such as defined in the theory) should a posteriori

1

entail the assumption. As of now (Jan. 17), one such assumption is a local decomposition ofsensation into atomic sensory units (be it biological receptive fields or robotic sensor field).

2. Methods

One large part of the work consists in providing formal mathematical proofs :• Grounding the "natural" corpus in theoretical definitions (i.e. "proofs" of correspon-dence)

• Establishing key functional results (e.g. self/environment separation, ideo-motor plan-ning) as formal consequences of the previous definitions

• Determining correct sensorimotor algorithmic strategies to solve the extraction ofcontingencies (e.g. space metrics, motor dependency graph).

The other part goes to developping simplified simulations (on paper as well as numerically)of perceptual agents both to generalize and to test the theory, in superficial accordance withthe late approach (see A. Laflaquière papers). There, we use our precise knowledge of themanipulated structures to devise prototypic statements to be later extrapolated and studythe quantitative feasibility (e.g. complexity, robustness to noise) of the proposed algorithms.

In the generalization stage, for a given target result we design a result-compatible ele-mentary model and gradually let go of simplifying assumptions (e.g. exhaustive sensation,unambiguous stable environment) while tracking which previous results still hold. In the teststage, we instead run numerical simulations on theory-compatible model agents and collecttheir output signals to assess the validity of the algorithm.

3. Expected outcomes

As a "meta result", we are expecting the classical sets (motor, configuration, sensory)introduced in the latest works to support an adapted theory under weak conditions on theirstructure (topological mappings, and algebraic action of the motor set).

More precisely, we are expecting the following results to hold :• Simplified models endowed with the canonical structure should be able to construct(that is, algorithmically) a representation of their motor set down to its environmentindependent structure.

• Conditional to obtaining this representation, they should systematically solve theproblem of dissociating "themselves" and "the environment", including in a continuallychanging environment.

• Conditional to this representation, and with sufficient experience, they should deductthe correct underlying space geometry of the environment.

• Seamless transition between discrete model and theoretical continuum cases (e.g. viaLie algebra).

2

Contents

1 La théorie sensorimotrice de la perception aujourd'hui 71.1 De la psychologie à la robotique : la perception par contingences 7

1.1.1 La perception "classique" . . . . . . . . . . . . . . . . . . 71.1.2 La nécessité de l'action . . . . . . . . . . . . . . . . . . . 81.1.3 Perception et interaction avec l'environnement . . . . . . 81.1.4 Compensabilité et premiers résultats . . . . . . . . . . . . 9

1.2 Formalisme fondationnel . . . . . . . . . . . . . . . . . . . . . . . 101.2.1 Le diagramme sensorimoteur . . . . . . . . . . . . . . . . 101.2.2 Combinatoire des espaces et agents complexes . . . . . . . 111.2.3 Quotients d'espaces et courbes de noyaux . . . . . . . . . 121.2.4 Ranement de l'apprentissage moteur . . . . . . . . . . . 131.2.5 Illustrations . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2 Une approche variationnelle : les actions 172.1 Actions motrices . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.1.1 Dénition, structure algébrique . . . . . . . . . . . . . . . 17Réduction de dimensionnalité et problème du rang . . . . 18

2.1.2 Redondance et dégénérescence des actions . . . . . . . . . 192.2 Action et exploration motrice : le cube perceptif . . . . . . . . . 21

2.2.1 Dérivation de la structure motrice . . . . . . . . . . . . . 222.2.2 Construction eective de la fonction de prédiction . . . . 232.2.3 Élimination des simplications . . . . . . . . . . . . . . . 24

2.3 Passage au continu et directions : Lie à la rescousse . . . . . . . 262.3.1 Limitations des actions discrètes . . . . . . . . . . . . . . 262.3.2 Réduction directionnelle des trajectoires . . . . . . . . . . 272.3.3 Le cas des transformations rigides de l'espace . . . . . . . 282.3.4 Dynamique temporelle et contrôle . . . . . . . . . . . . . 30

3 L'agent dans l'espace 323.1 Lève toi et marche : en route pour l'hyperespace . . . . . . . . . 32

3.1.1 Position absolue et corps . . . . . . . . . . . . . . . . . . 333.1.2 Dériver le formalisme . . . . . . . . . . . . . . . . . . . . 353.1.3 Compensabilité et déplacements . . . . . . . . . . . . . . 36

3.2 Capteurs, Permutativité et Champ récepteur . . . . . . . . . . . 363.2.1 De la sensation à l'information spatiale . . . . . . . . . . 37

Combinatoire des capteurs et champs récepteurs . . . . . 373.2.2 Dénitions . . . . . . . . . . . . . . . . . . . . . . . . . . 37

Espace toujours signicatif (maximal) . . . . . . . . . . . 38

4

Espace susant (minimal) . . . . . . . . . . . . . . . . . . 38Espace immédiatement signicatif (maximal) . . . . . . . 39Espace potentiellement signicatif (maximal) . . . . . . . 40

3.2.3 Actions spatiales, informations mutuelles . . . . . . . . . 40

A Rappels techniques : relations d'équivalence 43A.1 Dénition et propriétés de base . . . . . . . . . . . . . . . . . . . 43

A.1.1 Exemples de base . . . . . . . . . . . . . . . . . . . . . . . 43A.1.2 Classes d'équivalences et ranements . . . . . . . . . . . 44

A.2 Applications théoriques courantes . . . . . . . . . . . . . . . . . . 46A.2.1 Quotient injectif . . . . . . . . . . . . . . . . . . . . . . . 46A.2.2 Quotient topologique . . . . . . . . . . . . . . . . . . . . . 48

B Rappels techniques : Théorie de Lie 50B.1 Dénitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50B.2 Exemples de groupes de Lie . . . . . . . . . . . . . . . . . . . . . 52B.3 Technicalités sur les groupes topologiques . . . . . . . . . . . . . 53B.4 Algèbre de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54B.5 Décomposition minimale et récurrence . . . . . . . . . . . . . . . 55

Bibliography 57

5

Introduction

L'objectif de ce mémoire, à l'interface entre les sciences cognitives et la robo-tique, est tout d'abord de faire une synthèse des facettes diverses de la théoriede la perception dite des "contingences sensorimotrices" et de les ancrer dansun formalisme adéquat. En eet, diérents facteurs ont mené à une certainedispersion des concepts et outils employés pour étudier le sujet dans des cadres,généralement dénis ad hoc, qui ne sont pas forcément tous immédiatementcompatibles entre eux.

Un deuxième volet du travail eectué consiste à utiliser le cadre ainsi développépour dépasser les grandes limites du formalisme actuel. En particulier, nousdiscutons du problème de la non-dépendance statique entre action et sensationet abordons sur plusieurs points des approches variationnelles. Tout d'abord,l'introduction d'actions pour la conduite motrice permet de préciser en quoi leux sensorimoteur est la donnée de variations sensorimotrices. Ensuite, nous ex-plorons la question de déterminer comment la régularité géométrique de l'espaceambiant induit des structures récurrentes dans l'expérience de l'agent à son en-vironnement.

La première partie de ce mémoire est consacrée à une exposition de l'approchesensorimotrice dans son paradigme conceptuel et de ses diérences avec les ap-proches classiques de la perception. Entre autres, nous y décrivons en détail lecadre théorique développé par Bruno Gas, Sylvain Argentieri et Valentin Marcelsur lequel nous nous basons pour fonder le formalisme.Nous introduisons ensuite le concept d'actions d'un point de vue formel parle besoin de rompre les dépendances statiques de l'agent, et discutons de leurimplémentation à la fois en robotique et dans le vivant selon des critères de ex-ibilité et de calculabilité. En particulier, cette section se nourrit d'un exemplesimulé détaillé qui précise les apports des actions.Enn, nous présentons dans une dernière partie une nouvelle formalisation spa-tiale basée sur l'incarnation de l'agent dans l'espace qui intègre les construc-tions précédentes tout en levant plusieurs de ses limitations et en précisant leniveau d'abstraction autorisé.

6

1 | La théorie sensorimotricede la perception aujourd'hui

1.1 De la psychologie à la robotique : la percep-

tion par contingences

1.1.1 La perception "classique"

Dans les approches classiques de la perception en robotique active telles queformulées dans la deuxième partie du XXème siècle, le processus d'opérationdécouple entièrement les étapes de perception et d'action. Ce paradigme, quiprend même le nom de "Sense Plan Act" (Sentir, Planier, Agir) est caractéris-tique d'une vision informatique et désincarnée de l'intelligence pour laquelle ondissocie des capacités "élevées" et abstraites des autres.

Comme son nom l'indique, ce schéma se décompose en trois blocs. Lorsde leur fonctionnement, les capteurs de l'agent sont dans un premier tempséchantillonnés pour fournir une entrée sensorielle : l'étape Sense. Cette entréeest ensuite traitée selon des modèles plus ou moins précis de l'environnementpour extraire de l'information formatée qui sert à son tour d'entrée à des règlesde décision conditionnant l'action : la phase Plan. Enn, ces règles de décisionproduisent un schéma d'action qui doit être eectué par l'agent au moyen d'unstratégie motrice particulière : la partie Act.

Cette vision itérative linéaire de l'opération continue aujourd'hui largementde perméer en robotique : même si de nombreux systèmes intègrent par exempledu contrôle en ligne de l'action via un retour sensoriel, la transmission active del'information se fait toujours unilatéralement de l'entrée sensorielle vers la sortiemotrice. Il en résulte entre autres une littérature fournie sur le sujet, avec desdéveloppements avancés du procédé "Sense Plan Act" basés sur des algorithmesde traitement sophistiqués.

Cependant, des défauts structurels minent ce paradigme : en eet, le choixpar le concepteur des règles d'extraction de l'information et de décision del'action limitent l'agent. Dans le cas général, rien n'assure que des algorithmesconçus selon l'intuition du roboticien elle-même construite sur son expériencesensorimotrice conviendront à l'expérience d'un robot doté d'une expériencetoute diérente. En particulier, l'agent peut très bien être irrémédiablementimpuissant face à un environnement imprévu qui ne fait pas partie du domaineapprenable par ses capacités.

7

1.1.2 La nécessité de l'action

Au contraire, de nouveaux paradigmes émergent où la perception devient unprocessus actif à part entière. Pour ceux-ci, l'eet psychologique de l'expériencesensorielle ne se construit que de pair avec l'action motrice de l'agent. Il nousfaut alors introduire une diérence cruciale entre la sensation, la sortie brutedes capteurs de l'agent dans un environnement, et la perception, le résultat del'expérience sensorimotrice de l'agent au sens d'un contexte donné.

Plusieurs expériences de psychologie viennent appuyer cette idée selon laque-lle l'action vient complémenter la sensation pour structurer une perception con-struite de l'environnement.

Ainsi, diverses expériences d'apprentissage sensorimoteur perturbé chez lechat [HH63] montrent que la capacité de perception des stimuli extérieurs s'apprendau long de l'expérience. En particulier, sans la composante d'activité motricelors de l'exploration de l'environnement, l'animal ne développe pas de capacitéà adopter une conduite sensorimotrice adaptée.

D'autre part, chez l'humain, les expériences de substitution sensorielle deBach-y-Rita [ByR72] orent un autre éclairage sur les éléments en jeu. Cesexpériences, qui consistent essentiellement à transmettre sur la modalité tac-tile des stimuli visuels via la reproduction continue du signal d'une caméra surune plaque , discriminent la perception comme sensation active de la sensationbrute. En eet, si on demande à des sujets aveugles de discriminer des objetsà l'aide du stimulus tactile vibrant, les résultats sont décevants en observationstatique, tandis qu'ils en sont tout à fait capables s'ils ont de plus la possibilitéde contrôler la caméra pour la déplacer.Plus encore, cette étude indique qu'il est même dans une certaine mesure pos-sible de développer une perception de certaines notions comme la profondeurou la parallaxe par cette image tactile, comme si les caractéristiques de la per-ception n'étaient pas portées par la nature précise de la sensation du capteurmais par les relations imposées par l'action du sujet dans son expérience del'environnement.

1.1.3 La perception comme structure de l'interaction agent-environnement

Les premières formulations précises de la théorie des contingences sensorimotri-ces viennent de O'Regan et Noé [NO01] qui placent la question de la phénoménolo-gie de la perception sur le plan philosophique. Elle est alors construite enopposition à la vision relativement populaire selon laquelle la structure de laperception est héritée d'une structure physiologique portée par le cerveau, selondes corrélats neuraux. Cette vision stipule ainsi que deux sensations "proches"sont issues de deux schémas d'activité neurale elles-mêmes "proches", et quecette correspondance entre expérience du sujet et mécanique cérébrale est lasource de la structure de notre interaction à l'environnement. Par exemple, celaexpliquerait pourquoi l'expérience du rose est plus proche de celle du rouge quecelle du noir, et de même pourquoi elle est plus proche de celle du noir que decelle du son d'une cloche.

Au contraire, l'approche des contingences sensorimotrices (SMC) voit plutôtla perception comme une exploration de l'environnement construite sur la com-binaison de l'action motrice et de l'entrée sensorielle selon des règles de structure

8

découvertes par l'expérience : les contingences éponymes. Fort de la connais-sance de ces contingences dont nombre traversent les environnements, l'agentpeut orienter son action vers un but perceptif. Ainsi, une fois la contingencetactile associée à la rigidité assimilée, la rigidité perçue d'un objet n'est non plusune caractéristique externe passive de l'objet mais bien le fait de la sensationtactile éprouvée au contact de l'objet sous une certaine action motrice.

Il se pose encore la question de l'origine du savoir de ces contingences sen-sorimotrices. En plus des expériences précédemment citées qui soutiennentl'hypothèse que la perception s'apprend, les travaux de Jean Piaget [Pia37,Pia48] sur le développement de la conduite sensorimotrice chez l'enfant permet-tent de distinguer plusieurs phases dans l'émergence de la "conscience" des con-tingences. Ces observations semblent indiquer que dans le vivant, l'explorationactive a aussi et d'abord comme eet d'établir les contingences de l'interactionavec l'environnement.

1.1.4 Compensabilité et premiers résultats

Approche originale

Bien longtemps avant ces discussions, Poincaré [Poi95] discutait de l'émergencede la notion d'espace et de la géométrie chez l'être sensible. Selon lui, l'espacegéométrique sur lequel on raisonne couramment est issu des recoupements de nosdiverses expériences sensorielles qui, elles, s'eectuent dans un espace sensiblequi n'en partage que peu de caractéristiques.

Ces recoupements sont pour la plupart structurés autour d'invariants pré-cis de l'expérience de l'agent sensible avec son environnement ; parmi ceux-ci,on trouve les transformations compensables. Ce sont les conduites motricesde l'agent qui permettent de retrouver l'état perceptif perdu après certainesmodications de l'environnement. Par des arguments algébriques émergeantà l'époque, Poincaré montre que ces transformations portent une structure degroupe liée à l'espace qu'elles modient, et que leur détermination permet essen-tiellement de déterminer la géométrie de l'espace. Cette extraction de caractéris-tiques de l'espace n'est pas sans rappeler les prémisses de la théorie écologiquede la perception développée par Gibson[Gib86].

Cette démarche présente de nombreux intérêts. Tout d'abord, elle est in-dépendante a priori de la nature précise de l'espace géométrique où évoluel'être. En particulier, un tel être sensible plongé dans un espace "exotique" hétérogène, à dimension variable, courbe... devrait néanmoins pouvoir user descontingences induites par la compensabilité pour acquérir une perception de sonenvironnement. Par ailleurs, elle expliquerait de manière satisfaisante pourquoitous les êtres plongés dans un même espace développent des perceptions compa-rables dudit espace, comme l'indiquent par exemple les travaux de Stanislas De-haene sur la représentation géométrique dans des tribus amérindiennes[AWP+17].Ensuite, elle se base uniquement sur la comparaison des expériences sensoriellesau cours de l'action, c'est-à-dire qu'elle ne demande pour connaissance que deséléments raisonnablement accessibles à l'agent.

9

Développements modernes et formalismes

Suite aux éléments d'historique décrits précédemment, l'approche SCM a in-spiré plusieurs travaux de robotiques beaucoup plus récemment. Notamment,plusieurs d'entre eux se sont intéressés à la notion de compensabilité esquisséepar Poincaré qui, en plus de la puissance des résultats promis, se formule ça etlà de manière élégante pour des systèmes de robotique.

David Philipona a ainsi étudié des agents dénis par une variété sensori-motrice, et obtenu ainsi une caractérisation géométrique des transformationscompensables comme les chemins de cette variété qui pouvaient s'obtenir aussibien par une variation motrice pure que par une variation sensorielle pure. Lecalcul de ces chemins permet en théorie de déterminer la dimension de l'espaceambiant de l'agent [PNO03], tandis que la résolution en pratique a été peaunéepar Alban Laaquière [Laf13] au moyen d'analyse curvilinéaire des variétés.

Plus récemment, d'autres articles sur le sujet [LCG16, OT16] ont préciséd'une part en quoi la détection de la compensation pouvait mener à la connais-sance de l'espace, d'autre part quels genres d'"espaces" étaient perceptibles parces procédés.

Depuis, des travaux de robotique s'intéressent à d'autres aspects des con-tingences sensorimotrices. Ainsi, en opérant une synthèse avec des thèmes plusconventionnels de la perception en robotique, Alban Laaquière a déterminé desinvariants prédictifs de la structure de l'agent dans l'espace au sein de sa sensa-tion [LOT+15]. Reformuler des problèmes classiques à la lumière de l'approcheSMC semble donc permettre de dénicher certaines de ces régularités qui struc-turent l'interaction de l'agent avec son environnement.

1.2 Formalisme fondationnel

1.2.1 Le diagramme sensorimoteur

Nous nous proposons à notre tour de bâtir sur le formalisme développé parValentin Marcel, Sylvain Argentieri et Bruno Gas[MGA16] qui considère commedonnées fondamentales d'un problème de robotique un diagramme du type

M X Sf φε (1.1)

où les grandes lettres sont des espaces (topologiques, éventuellement vectoriels,et plus généralement des ensembles) et les èches éventuellement accolées deleur notation des fonctions entre ces espaces.

Ici, on a

• M, l'espace des congurations motrices décrit par les variables latentesparamétrant à un instant donné les diérents actionneurs de l'agent :angles des joints, position s'il est libre de se déplacer...

• X , l'espace des poses décrit par la conguration des capteurs : positiondans l'espace ambiant mais aussi éventuellement paramètres de réglage,comme l'ouverture d'un diaphragme pour un capteur visuel

• S, l'espace des sensations potentiellement descriptibles par l'ensemble descapteurs de l'agent

10

et les fonctions de transition représentent

• le modèle cinématique direct pour f , c'est-à-dire la fonction qui prenden compte le schéma corporel de l'agent pour déterminer la congurationd'un capteur à partir des variables motrices pertinentes.

• la fonction sensorielle pour φε, qui dépend de l'état de l'environnement εet associe à une conguration des capteurs la sensation totale résultantedans l'état courant de l'environnement.

On notera classiquement ψε la fonction composée f φε : M → S qui donnela sensation obtenue pour une conguration motrice donnée. Du point de vueextérieur,M représente l'information de géométrie intrinsèque de "posture"de l'agent, ce qui justie qu'il puisse nativement opérer dessus dans son chem-inement moteur.

1.2.2 Combinatoire des espaces et agents complexes

Si a l'échelle d'agents simplistes (composés de peu de moteurs et capteurs quis'imposent peu de contraintes entre eux) les espaces moteurs et sensoriels sontfaciles à "deviner", cela devient rapidement moins clair quand on envisage desagents complexes, par exemple des agents dotés de nombreux joints. Néanmoins,les dénitions des objets précédents donnent une interprétation de cette com-plexité en termes ensemblistes qui permet d'envisager globalement les agentsindiéremment de la nature précise de leurs espaces moteurs et sensoriels.

Ainsi, si l'agent a des ensembles M d'actionneurs moteurs et C de capteurset qu'on note Mm l'espace moteur paramétrisant le moteur m ∈ M et Scl'espace sensoriel décrit par les sorties du capteur c ∈ C , alors :

• L'espace moteur total M se projette naturellement sur∏m∈M Mm via

une certaine fonction pM :M→∏Mm.

• L'espace sensoriel total S se projette naturellement sur∏c∈C Sc via une

certaine fonction pS : S →∏Sc. Cela permet de penser directement à

S comme au produit des espaces sensoriels élémentaires des capteurs enremplaçant φε par pS = pS φε.

Plus précisément, l'existence de la projection S →∏Sc vient de ce

que S se projette sur chacun des ensembles Sc (un état sensoriel total im-plique en particulier l'état sensoriel de chacun des capteurs). Ces multiplesprojections sont des fonctions pc : S → Sc dont on peut déduire

pS : S →∏Sc

s 7→ (pc(s))c∈C

Cette projection totale est une identication (à un sous-ensemble) si elle estinjective, ce qui revient à armer qu'un état sensoriel global est donné parla collection des états sensoriels élémentaires des capteurs.

11

Dans le cas moteur l'existence de la projection pM découle du mêmeargument, mais rien ne dit qu'il existe une fonction f :

∏Mm → X rem-

plaçant une fonction f de départ au sens de la commutation de

M X

∏Mm

pM

f

f

Cependant, s'il y a identication - ce qui revient encore à armerqu'un état moteur (deM) est entièrement déterminé par la collection desétats moteurs élémentaires (de Mm) qu'il induit - alors l'existence decette fonction f est assurée et on peut penser de manière absolument équiv-alente à (un sous-ensemble de)

∏Mm pourM.

En particulier, si tous les capteurs d'un agent sont à sortie numérique, alorsl'espace sensoriel est un (sous-ensemble de) Rn avec n le nombre de capteurs del'agent.Dans la suite, on considèrera toujours cette identication faite a priori.

1.2.3 Quotients d'espaces et courbes de noyaux

Une construction immédiatement à l'agent est celle des courbes de noyaux asso-ciées à sa fonction sensorielle ψε. Une telle courbe est l'ensemble des congura-tions motrices (que l'agent peut identier par retour proprioceptif) menant lieuà la même sensation dans un environnement donné (que l'agent peut identierpar retour extéroceptif). Pour des agents complexes, des phénomènes de redon-dance dans le schéma corporel peuvent mener plusieurs congurations motricesà toujours résulter en la même pose χ et donc en la même sensation φε(χ).

Plus précisément, pour une application f : X → Y on s'intéresse à la relation=f sur X donnée par x =f y ⇔ f(x) = f(y). C'est une relation d'équivalence,et la classe d'équivalence de x ∈ X est [x]

f= f−1(f(x)) la courbe de noyau de

f associée à f(x). Mieux encore, on a également f : X/f → Y injective faisantcommuter

X Y

X/f

=f

f

f

dénie naturellement par f([x]f) = f(x). Si f est surjective, alors f est

même bijective. Un chapitre plus complet (avec dénitions, démonstrations etprécisions) sur le sujet est fourni en annexe.

Ajouter ces quotients sensoriels au diagramme originel donne donc

12

M X S

M/ψε X/φε

f

=ψε

φε

=φε

ψεφ−1ε

(1.2)

où ψε φ−1ε fournit une bijection entre M/ψε et X/φε par composition deleurs bijections respectives avec S. Dans le cadre topologique (où les èches sontdésormais des applications continues) et sous l'hypothèse additionnelle de com-pacité deM et X , cette bijection devient même un homéomorphisme[MGA16],donnant donc une représentation motrice partielle à l'agent.

1.2.4 Ranement de l'apprentissage moteur

L'apprentissage par comparaison des expériences sensorielles repose sur l'idéeque ces expériences sont assez riches pour discriminer les diérentes congura-tions motrices. Or il est trop exigeant de demander que tout état de l'environnement(i.e. toute fonction φε) de notre diagramme amène seule à construire une bonneapproximation de M via M/ψε . En revanche, la construction des courbes denoyaux peut être itérée sur plusieurs expériences pour améliorer l'estimation desespaces de l'agent.

Ainsi, pour un ensemble E d'états de l'environnement on peut considérer lesrelations =E dénies surM et sur X par

M : x =E y ⇔ ∀ε ∈ E, ψε(x) = ψε(y)

X : x =E y ⇔ ∀ε ∈ E, φε(x) = φε(y)

Cela posé, deux congurations motrices (respectivement poses) sont nondiscriminées par E si et seulement si elles ne sont séparées par aucune desψε (respectivement φε) lorsque ε parcourt E. Ce sont encore des relationsd'équivalences, et si E ⊂ E′ alors =E′ rane =E au sens où toute classed'équivalence pour =E′ est contenue dans une unique classe d'équivalence pour=E . Le cas échéant, on obtient donc des applications

πE′,E : M/E′ →M/E

[x]E′ 7→ [x]

E

Chaque ranement M/E peut se calculer de proche en proche comme en-semble des intersections des courbes de niveaux associées aux ψε, ε ∈ E. Deplus, sous l'hypothèse que pour chaque couple de poses distinctes de l'agent ilexiste un état de l'environnement menant à une sensation diérente, alors X esteectivement l'élément minimal pour l'ordre induit et s'obtient par récurrence(possiblement transnie).

Si on eectue une suite d'expériences sensorielles dans des environnementsεn, alors en notant E0 = ε0 et En+1 = En

⋃εn+1 ⊇ En on obtient une

conguration en tour

13

M X S

... ...

M/En+1 X/En+1

M/En X/En

... ...

M/ψε0 X/φε0

f φε

πEn+1,En

εn+2 εn+2

εn+1 εn+1

εn εn

ψε0φ−1ε0

ε1 ε1

(1.3)

Partant de là, l'idée est de procéder par ranement successif des courbes deniveaux obtenues par l'exploration sensorielle pour construire une représentationmotrice interne.

1.2.5 Illustrations

Nous exposons ici deux exemples d'agents pour éclairer les éléments abstraitsdécrits. Le premier montre notamment comment ces éléments s'insèrent dans uncas classique de robotique, tandis que le second fera l'objet d'un développementparticulier plus loin.

Le bras articulé

L'agent considéré a un corps constitué de trois sections cylindriques interdépen-dantes C1, C2, C3, de longueurs respectives l1, l2, l3, chacune munie d'une "orig-ine" et d'une "extrémité" : l'origine de C1 est xée à un point de l'environnementO, l'origine de C2 est xée à l'extrémité de C1 et de même l'origine de C3 estxée à l'extrémité de C2.

Un capteur est xé à l'extrémité de C3. Pour xer une fonction sensorielleici, on peut par exemple prendre un capteur sensible à la distance au point O.

Chacune des sections cylindriques Ci est capable de rotation dans un plancommun (O, x, y) autour de son origine ; la suite se dérive aussi bien dansl'espace, toutefois au prix d'équations moins accueillantes.

14

Pour le formalisme, on a alors :

• Une description de M est l'ensemble des vecteurs d'angles (repérés parrapport à des positions de référence, par exemple celle directement col-inéaire à l'axe Ox) (θ1, θ2, θ3) paramétrant chacune des sections par rap-port à un système de référence

• X est essentiellement R2 car la conguration du capteur est exactementla position de l'extrémité du bras dans le plan. Cette fois, l'intégrationdes dépendances demande un modèle cinétique non trivial donné par :

f(θ1, θ2, θ3) = PC3,extrem(θ1, θ2, θ3)PC1,extrem(θ1) = O + l1 cos θ1~x+ l1 sin θ1~y

PC2,extrem(θ1, θ2) = PC1,extrem(θ1) + l2 cos θ2~x+ l2 sin θ2~y

PC3,extrem(θ1, θ2, θ3) = PC2,extrem(θ1, θ2) + l3 cos θ3~x+ l3 sin θ3~y

• S est R car l'agent dispose d'un seul capteur qui est à sortie numériqueet la fonction sensorielle φ est donnée par

φ(x, y) =√x2 + y2

Le cube visuel

L'agent considéré a un "corps" en forme de cube dont chacune des faces est uncapteur visuel de type caméra de sorte que les champs (de forme pyramidale)de ses capteurs partitionnent l'espace ambiant.

Son centre est xe dans l'espace, et il est capable des rotations qui envoientexactement ses faces les unes sur les autres. Ces rotations sont au nombre de24, mais elles peuvent toutes être décrites comme combinaisons de 2 rotationsdonnées d'axes distincts et d'angles diérents de 180 (et 360) degrés .

Pour simplier la nature des calculs et sans perte de généralité, on peut con-sidérer l'environnement comme un grand cube englobant l'agent. Les diérentesfaces (désormais cellules) de ce grand cube présentent les stimuli récupérés re-spectivement par les capteurs leur faisant face.

15

Pour cet agent, les ensembles précédents s'interprètent alors comme suit :

• M est naturellement l'ensemble des rotations du cube par rapport à uneposition de référence. On peut par exemple se les donner en coordonnéessphériques.

• X est trivial ici car chacune des congurations de capteurs s'obtient immé-diatement à partir de la rotation (pas de redondance, pas de dépendance): c'est le même ensemble de rotations. De manière plus descriptive pourun problème de perception, c'est également l'ensemble des appariementscapteur-cellule que l'on peut obtenir par rotation.

• S est l'ensemble des vecteurs de sensation (si)i∈1,...,6 où si ∈ R est lasensation rapportée par le capteur i

16

2 | Une approche variation-nelle : les actions

Si les éléments introduits précédemment orent des résultats intéressants sur laconstruction de la construction via les régularités sensorimotrices, ils sourentd'une rigidité technique qui limite sévèrement la classe d'agents dont ils parlentvraiment.

En particulier, le formalisme est intrinsèquement statique : si on demandeune fonction M → S, alors cela implique notamment qu'une conguration deM donne une et une seule sensation de S. Or, si M représente la posturede l'agent ou encore son retour proprioceptif a fortiori une posture ne doitdonner qu'une et une seule sensation, ce qui n'est pas compatible par exempleavec une translation de l'agent tout entier dans l'espace.

Nous introduisons donc ici le concept d'actions motrices, un nouvel outilthéorique pour au contraire tenter de rendre compte de la nature dynamiquede la correspondanceM→ S. L'approche devient alors de qualier en quoi lavariation sensorielle induite par une même variation motrice appliquée en deuxsituations distinctes est "la même".

Ce concept est ensuite appliqué à un exemple simplié d'agent robotiquepour exposer des capacités de représentation qu'il permet. Cette illustrationsert de plus à souligner prématurément certaines structures qui feront l'objetde généralisation et de formalisation dans la dernière partie.

2.1 Actions motrices

2.1.1 Dénition, structure algébrique

On peut envisager d'ajouter au schéma M → X → S un ensemble d'actionsA qui vient contribuer de la manière suivante : un élément a ∈ A donné peuts'appliquer à n'importe quelle conguration motrice m ∈ M pour donner uneconguration motrice m′ = a(m) ∈ M. Ainsi, a peut être vu comme unefonctionM→M, et on notera m a→ m′ cette relation.

Formellement, c'est se donner une fonction de A dans F (M,M) l'ensembledes transformations motrices (les fonctionsM→M). On dira que A agit surM. Dans la suite, on s'intéressera particulièrement aux situations où A a unestructure algébrique, celle de groupe. On y dispose alors

1. d'une action e qui vérie ∀m ∈ M, e(m) = m (c'est l'action "ne rienfaire"), qu'on appelle identité

17

2. toutes deux actions a, a′ peuvent se combiner (se composer) pour donnerune nouvelle action a′′ = a′a qui vérie

∀m ∈M,

m m′′

m′

a′′

a a′ (2.1)

Intuitivement, cette nouvelle action est celle obtenue en faisant d'abordl'action a directement suivie de l'action a′.

3. pour toute action a on dispose d'une action qu'on notera a−1 (l'inversede a) vériant

∀m ∈M, m m′a

a−1(2.2)

C'est donc ici une hypothèse de réversibilité au moins potentielle.

L'hypothèse d'existence des inverses implique en particulier que chacune desactions est non seulement une fonction M→M mais même une bijection. Sil'on avait choisi d'élargir au cas oùA n'est qu'un monoïde (existence de l'identitéet d'un produit associatif), cette restriction disparaît au prix de nombreux ré-sultats ultérieurs.

Réduction de dimensionnalité et problème du rang

Actions génératrices Un des apports de cette structure algébrique est unecertaine forme de réduction de dimensionnalité. Pour un groupe d'actions A, onpeut se poser la question de déterminer un sous-ensemble d'actions ai, i ∈ I =A′ ⊂ A tel que toute action de A peut s'obtenir comme combinaison d'actionsde A′ (on dira que a se décompose sur A′) sous la forme

a = aεnin ...aε1i1

=

n∏k=1

aεkik , (ik)1≤k≤n ∈ In, εk ∈ −1; 1 (2.3)

L'intérêt majeur de cette écriture est que l'eet de a sur les congurationsmotrices se réduit alors aux eets de ses facteurs aik de cette manière :

∀m ∈M,m m′

m1 ... mn−1

a

aε1i1

aε2i2

aεn−1in−1

aεnin (2.4)

Si on suppose utilisable par l'agent un sous-ensemble B ⊂ A et avec éventuelle-ment l'hypothèse (superue en pratique) que a ∈ B ⇒ a−1 ∈ B, alors par itéra-tion de ces actions il peut en fait eectuer exactement les actions du nouveaugroupe

GGrp(B) := a ∈ A | a se décompose sur B

Et réciproquement, on peut s'intéresser aux sous-ensembles B ⊂ A vériant

GGrp(B) = A (2.5)

18

Ces sous-ensembles sont dits générateurs (de A). En particulier, l'assertionprécédente sur le dénombrement des rotations du cube se traduit en termesd'actions par CardA = 24 et l'existence de A′ ⊂ A générateur avec CardA′ = 2.

Par analogie avec la dimension d'un espace vectoriel, le rang d'un groupeest le cardinal d'une plus petite famille d'éléments du groupe qui le génère.

Réduction algorithmique Pour des raisons d'ecacité on voudrait doncêtre capable, étant donné une famille B d'actions, de produire une famille B′minimale au sens de la cardinalité et vériant GGrp(B) = GGrp(B′). Cela re-vient à réduire une famille génératrice en base dans le cas d'un espace vectoriel,puisque par dénition du rang, B′ vérie CardB′ = rg GGrp(B)

Or si ce problème est connu et maîtrisé pour les espaces vectoriels, de nom-breux obstacles se posent dans le cas des groupes.

Par exemple, on ne peut pas demander d'avoir B′ ⊂ B car avec A isomorpheà Z et B = 2; 3, alors GGrp(B) = A ∼= Z qui est de rang 1 (car 1 le génère entant que groupe) et pourtant ni 2 ni 3 ne le génèrent.

Pire encore, le théorème d'Adian-Rabin implique qu'il n'existe pas d'algorithmecapable de construire une famille génératrice minimale dans le cas général (nimême dans le cas a priori raisonnable des groupes de présentation nie). Néan-moins, pour des classes plus restreintes de groupe en particulier pour lesgroupes nis de tels algorithmes existent.

2.1.2 Redondance et dégénérescence des actions

On peut désormais s'intéresser à la manière dont les actions induisent des trans-formations dans les espaces postérieurs X et S. Il est clair que si une actionentraîne une variation des paramètres moteurs dansM, alors elle entraînera engénéral une variation dans la pose des capteurs et donc une variation dans lasensation obtenue.

Seulement, les défauts d'injectivité liés à la redondance de l'agent et del'environnement font que cette variation ne peut qu'être ambiguë. En eet,une même sensation de départ peut donner suite à une même action plusieurssensations résultantes si elle avait sa source dans plusieurs congurations motri-ces distinctes. En ce cas, l'action motrice ne peut pas se traduire par unetransformation de pose, et encore moins par une transformation sensorielle.

Dans ce cas, l'action "tourner à gauche" ne peut pas associer de sensation préciseà la sensation "noir" car selon la position réelle du capteur, noir cèdera la placeà rouge ou à bleu.

19

En reprenant le point de vue où a ∈ A est une fonctionM→M alorson y associe une nouvelle fonction aX : M → X via aX = f a, mais aXne peut s'identier naturellement à une fonction X → X (i.e. une véritabletransformation de pose, indépendante de la variable motrice cachée) que sif conserve l'information entre les transformations.

Plus précisément, c'est demander à avoir pour chaque a ∈ A une appli-cation a′ : X → X vériant

a′ f = f a

de manière à avoir dans les espaces

Or, si f n'est pas injective, par exemple f(m) = f(m′), m 6= m′, alorson doit avoir a′f(m) = a′f(m′) et donc f(am) = f(am′). Il faut donc quea soit compatible avec les courbes de niveau de f et induise une fonctiona : M/f → M/f . Réciproquement, si a exhibe cette compatibilité alorsa′ = f−1 a f est solution.

De plus, si f est non injective il existe presque toujours des fonctionsM →M non compatibles avec ses courbes de niveau ; de telles fonctionsne peuvent donc pas se transférer sur X sans perte.

De la même manière a induit une fonction aS :M→ S via aS = φεfa,mais cette fois-ci il faut que a soit à son tour compatible avec les courbesde niveau de φε f

Dans ces cas non-résolubles, on peut néanmoins forcer en posant plutôt des"pseudo-transformations" aX et aS qui associent à un état donné χ/s l'ensembledes états postérieurs χ′/s′ potentiellement atteints par l'action a, de manière àavoir

aX (χ) =f(am) | m ∈ f−1(χ)

aS(s) =

ψε(am) | m ∈ ψ−1ε (s)

Ces ensembles peuvent de plus facilement porter de la structure addition-

nelle, comme une topologie ou même une probabilité qui reète les statistiquesd'occurrence.

20

2.2 Action et exploration motrice : le cube per-

ceptif

Nous revenons ici en détail sur l'exemple du cube perceptif, où le formalismeintroduit nous permet déjà d'arriver à un certain nombre de résultats sur larégularité du ux sensorimoteur.

Pour la suite de cette partie, nous utiliserons pour notation

• ci, avec 1 ≤ i ≤ 6 pour les capteurs de l'agents

• si pour la sensation associée au capteur ci, donnant donc une sensationtotale s = (si)1≤i≤6

• ei, 1 ≤ i ≤ 6 pour les cellules (faces) de l'environnement. Elles portentchacune une information pi

Pour simplier, on considérera d'abord que

• les cellules ne présentent qu'une grandeur scalaire (comme la luminance),de manière à ce que tous les capteurs travaillent sur une même partie del'information. Formellement, cela donne pi ∈ R.

• un capteur n'a pas de fonction de sensibilité propre. Face à une celluleportant l'information p, il aura pour sensation ce même p.

Le point central à considérer ici est que les rotations agissent comme despermutations des composantes de la sensation, et cette caractéristique decorrélation le long d'un mouvement ne dépend aucunement ni de la valeur précisede la sensation des diérents capteurs, ni même de l'état de l'environnement.

En eet, sous l'action d'une rotation r du cube, un capteur ci donné seretrouve à la place précédemment occupée par un certain capteur cj . Tousles capteurs sont ainsi repositionnés quitte à garder leur place s'ils sont surl'axe de rotation, et la transformation est injective puisque deux capteursdiérents à l'origine ne se retrouvent pas à la même position. Il s'ensuitdonc que c'est une permutation.

Or, cette correspondance cj = rci (qui formalise une action de A surl'ensemble des capteurs) ne dépend pas de l'environnement ni de la nature

21

précise des sensations à un instant donné mais seulement de la géométriede l'agent, qui constitue un invariant au long de l'expérience

2.2.1 Dérivation de la structure motrice

Considérons un capteur c de l'agent et une rotation r qu'il eectue. A l'étatinitial, c échantillonne la cellule e de l'environnement.Sous l'eet de cette rotation, c prend la place de c′ = rc et obtient donc unenouvelle sensation pre. Or avant la rotation, c′ avait pour sensation pe′ = pre.De manière générale, en notant src la sensation obtenue par la cellule c après larotation r on obtient donc l'identité

∀ capteur c, src = src (2.6)

qui caractérise les régularités entre sorties de capteurs qui relient la sensationpré-mouvement s et la sensation post-mouvement sr.

Dans notre formalisme, c'est précisément une action qui se transmet deMà S pour donner s r→ sr. Il s'agit donc d'un cas particulier où les fonctions detransition n'introduisent pas de dégénérescence des actions, ce qui tient essen-tiellement à ce que le cube dispose d'une information visuelle sur l'ensemble del'espace (car pour tous c et r, il y a un capteur rc).Pour relaxer cette hypothèse, il sut ainsi de choisir que seules certaines de sesfaces soient munies de capteurs.

Composition de rotations

Cette identité est compatible avec la composition des rotations au sens où ennotant r2r1 la rotation obtenue en eectuant successivement r1 puis r2 (i.e.r2 r1 en notation fonctionnelle classique), on a

∀c, sr2r1c = sr2r1c = sr2r1c

De manière très importante, cela induit une image de la structure de groupede A sur l'expérience sensorielle, ce qui donne en pratique un moyen de calculerla structure algébrique motrice par comparaison des variations sensorielles viaune fonction de prédiction.

Fonction de prédiction

Le cube peut donc chercher à prédire sur la base d'une sensation totale courantes = (sc) et d'une commande motrice r la sensation résultante attendue sr = (src).Formellement, on peut le décrire par une fonction P (prédiction) à apprendreet vériant à l'équilibre ∀s, r, P (s, r) = sr.

Bien sûr, l'existence d'une telle fonction de prédiction décisive repose sur lanon-dégénérescence de l'action lors du passage deM à S. Dans le cas contraire,P peut par exemple avoir pour sortie une loi de probabilité sur les sensationsrésultantes dont le cas courant serait la particularisation à une probabilité enDirac.

22

Déduction de la structure des actions

En possession de cette fonction de prédiction sur un sous-ensemble A′ de ro-tations, l'agent peut inférer de nombreuses propriétés quant à la combinatoirealgébrique de A :

• r = r2r1 si et seulement si ∀s ∈ S, P (s, r) = P (s, r2r1)

• r = r′−1 si et seulement si ∀s ∈ S, P (s, r′r) = s

En particulier, l'agent peut limiter son corpus d'actions eectivement "connues"en éliminant les actions qui s'obtiennent comme combinaisons d'actions déjàconnues. Ainsi, il disposerait d'une représentation exhaustive (car génératricede A) mais condensée (car minimale) pour obtenir un avantage computationnel.

En pratique, on pourrait ainsi espérer décomposer les actions spécialisées etcomplexes comme marcher en une succession d'actions automatiques simples.

2.2.2 Construction eective de la fonction de prédiction

On représentera la fonction de prédiction associée à une rotation r donnée Pr :s ∈ S 7→ P (s, r) par une matrice 6 × 6 (où le 6 est le nombre de capteurs) quivaut à l'équilibre :

(Pr)i,j =

1 si cj = rci0 sinon

Pi,j peut s'interpréter comme la validité de l'hypothèse que ci soit un an-técédent de cj par la rotation r : il vaut 1 si rien n'indique le contraire, 0 sil'expérience a éliminé l'hypothèse. Ainsi, si Pr a été correctement apprise, on asr = Prs.

Conformément à cette interprétation, l'agent démarre avec une collection dematrices Pr | r ∈ A′ qui ne contiennent que des 1 et explore son environnementde cette manière :

1. Il met en mémoire sa sensation courante s et eectue une action r ∈ A′ :les correspondances ci − ej sont modiées

2. Optionnellement, il forme une prédiction sr = Prs

3. Il récupère une sensation résultante s′ = sr

4. Il intègre l'expérience pour aner sa prédiction : si (Pr)i,j = 0 il a déjàpu éliminer la possibilité cj = rci. Sinon il compare si et s′j puis en déduitla valeur actualisée (Pr)i,j = δsi,s′j .

L'algorithme ne mène à la convergence des matrices vers leur valeur naleque si l'environnement est "susamment riche". Il est clair par exemple quesi toutes les cellules présentent la même luminance alors l'agent ne pourra pasétablir ces relations entre ses capteurs. Au contraire, si toutes les cellules del'environnement ont une luminance unique, alors il sut d'une seule exécutiond'une rotation pour en dériver complètement sa fonction de prédiction.

En revanche, elles ne peuvent pas "se tromper" (converger vers une mauvaisevaleur) et conservent leur avancement entre les expériences. Si l'agent conservela connaissance acquise dans le passé à un changement d'environnement (ce quiest valide puisque les relations cj = rci en sont indépendantes) alors il n'est pasnécessaire qu'un seul environnement soit susamment riche mais plutôt que lasuccession des environnements explorés le soit dans son ensemble.

23

2.2.3 Élimination des simplications

Fonction de sensibilité

Nous avions supposé que chaque capteur de l'agent reproduisait à l'identiquedans sa sensation l'information portée par la cellule échantillonnée à l'instantcourant, ce qui est loin d'être crédible. Supposons alors au contraire que lecapteur c est muni d'une fonction de sensibilité fc, de manière à ce que lorsqu'iléchantillonne la cellule e on a sc = fc(pe) et non plus simplement sc = pe.

Alors on peut reprendre notre raisonnement sur les permutations spatialesdes capteurs par rotation : en eet, sous l'eet de r le capteur c se retrouveraencore à la place de c′ = rc.

Seulement, il n'y aura possibilité de prédiction croisée que si c et c′ sont d'unecertaine manière sensibles à la "même information", sinon la connaissance dela sensation antérieure associée à rc ne permet pas de déterminer de manièreable la sensation postérieure associée à c. Par exemple, un capteur sensible à lacouleur verte n'aura pas (ou peu) de pouvoir prédictif pour un capteur sensibleà la couleur rouge.

Plus précisément, si on note P l'ensemble décrit par les propriétés despoints échantillonnées (i.e. pe ∈ P), alors la condition de validité de pré-diction pour le capteur c sous la rotation r se formule ainsi :

∀p, p′ ∈ P, frc(p) = frc(p′)⇒ fc(p) = fc(p

′) (2.7)

En termes de courbes de noyau, il s'agit donc de ce que les courbes frc soient"plus nes que" (incluses dans) chacune des courbes fc correspondantes. Ils'ensuit donc que ce problème disparaît totalement si et seulement si lescourbes de noyau des capteurs sont toutes identiques.

Fonctions de transfert Si (et seulement si) on suppose la condition précé-dente réglée alors il existe des fonctions de transfert tc,r : Src → Sc vériant

src = tc,r(src) (2.8)

Le cas "sans fonction de sensibilité" est le cas particulier où on a src = src i.e.tc,r = id

Avant rotation on a src = frc(p) et après rotation c remplace toujoursrc, d'où src = fc(p). Or l'hypothèse de l'équation 2.7 nous assure justementque la valeur (cachée) exacte de p ayant donné lieu à src n'inue pas sur lavaleur précise de fc(p).

En eet, avec f−1rc (s) = p ∈ P | frc(p) = s la courbe de noyau defrc associée à s on a ∀s, fc est constante sur f−1rc (s) car ∀p, p′ ∈f−1rc (s), frc(p) = frc(p

′) = s.Or, si on note vc,r,s cette valeur unique prise par fc sur f−1rc (s) alors on

24

obtient la relation via

tc,r : Src → Scs 7→ vc,r,s

Avec l'existence de ces fonctions, l'algorithme exposé s'adapte au prix del'usage de fonctions (qui vont tendre vers les tc,r) comme entrées des matricesde prédiction à la place des scalaires pi,j .

On remarquera que sans hypothèse de similarité sur les fonctions de sensi-bilité des capteurs, nous sommes amenés à la dénition (et au calcul) de n2CnA′fonctions de sensibilités (où nA′ est le nombre d'actions élémentaires utiliséeset nC est le nombre de capteurs), chacune ayant à échantillonner un espace desensations élémentaire Sc entier.

Une autre approche motivée par l'inspiration "biologique" serait d'introduireun ensemble de fonctions Hr,c,c′ , r ∈ A, c, c′ ∈ 1; 6 qui entretiendraient unedynamique Hebbienne à base de plasticité fonction du temps d'occurrence desimpulsions (STDP) : les fonctionsHr,.,. sont utilisées pour prédire lorsque l'agenteectue l'action r et mises à jour selon que les capteurs qu'ils surveillent vérientbien une relation src′ = tc,r(sc).Cela impliquerait néanmoins une forte connectivité horizontale du réseau : àterme, nCnA fonctions sont actives pour les besoins de la prédiction.

Géométrie de l'agent

Nous avons toujours ici parlé d'un agent cubique visuel pour ancrer l'intuitionet ne pas avoir à développer de raisonnement technique noyé dans les sym-boles obscurs. Cependant, au vu des résultats il apparaît clairement qu'on peutélargir la classe des agents qui vérieront à l'identique la correction de l'approchedéveloppée. Ainsi

• Le nombre des capteurs n'importe aucunement. Pour faire varier la com-binatoire sans rien changer à l'exemple, on peut par exemple remplacer lecube par n'importe quel solide de Platon (le dodécaèdre, l'icosaèdre...) etobserver quantitativement des eets de la richesse de l'environnement etde la redondance des actions motrices.

• La propriété de permutation des sensations ne dépend que de ce que lescapteurs échantillonnent tour à tour les mêmes zones de l'environnement.En particulier, la modalité visuelle n'est pas particulièrement privilégiée.

Pour des exemples plus ns, on peut ainsi concevoir une sphère (ou uncylindre, ou une autre forme...) tessellée où chaque microface est elle-même uncapteur de champ récepteur bien déni. Tant que les actions motrices donnéesà l'agent permutent les champs récepteurs et que les capteurs ont les mêmescourbes de noyaux, les résultats tiendront à l'identique.

25

2.3 Passage au continu et directions : Lie à la

rescousse

Le formalisme des actions comme transformations motrices s'exprime pour l'instantdans un cadre "discret", du moins si on veut un ensemble d'actions ni (pourdes questions de mémorisation par exemple). Cela n'est pas forcément satis-faisant car on limite articiellement a priori les capacités motrices de l'agent(cf. exemple ci-dessous). De plus, le passage au continu permet d'introduirenaturellement de nouveaux concepts cherchés (actions "élémentaires" et trajec-toires) qu'il serait malaisé de considérer dans le cas discret.

2.3.1 Limitations des actions discrètes

Considérons un agent unidimensionnel à roues, informé par la proprioceptionde l'état de ses roues (en comptant les tours complets donc) depuis un état deréférence. C'est équivalent à dire qu'il connaît sa position (dans un repère xe)sur la droite qu'il parcourt, par exemple par intégration odométrique.

On lui donne un ensemble d'actions A formé de commandes d'écarts angu-laires de ses roues ∆θ, θ ∈ R.Si A est ni, alors A = ∆θi, i ∈ 1, ..., n. Alors l'ensemble des propriocep-tionsm ∈M ⊂ R accessibles à l'agent à partir d'une proprioception de référencem0 via A sont celles de la forme

m = ∆θim∆θim−1...∆θi1(m0), ij ∈ 1, ..., n ∀j ∈ 1, ...,m

Ce qui se réduit en les voyant comme des variables numériques réelles à

m−m0 = ∆(θi1 + ...+ θim)

Donc m ne peut être séparé de m0 que par une combinaison "entière"(linéaire à coecients dans Z). Dit autrement, les positions accessibles parl'agent sont à translation depuis m0 près le sous-groupe de R engendré parles ∆θi.

Or (via un résultat classique) les sous-groupes de R sont de deux typestrès distincts ; en particulier il sera ici de la forme ΘZ = Θz, z ∈ Z avecΘ = pgcd(θ1, ..., θn) sous l'hypothèse que ce pgcd existe (notamment quandtous les θi sont rationnels, ce que la représentation informatique impose).

Graphiquement, si on se représente la longueur Θ sur l'axe que parcourtl'agent via une graduation centrée sur m0, cela revient à dire que l'agent pourravisiter exactement les graduations ainsi dénies, ni plus ni moins.

De la direction à la diérentiation

Si, au contraire, on se refuse à avoir des atomes proprioceptifs fondamentaux,cela pose la questions des actions innitésimales qui permettent de traverserle voisinage. Ainsi, dans une vision géométrique de l'espace moteur M, on neformule plus une action comme un point d'arrivée à partir de notre point dedépart mais comme une direction et une quantité indiquant "de combien on lasuit" (que ce soit en temps ou en distance d'espace moteur).

26

Comme illustration humaine, on aurait par exemple pour action "plier l'indexde 1 radian" et pour direction "plier l'index" qui ne se transforme en commandemotrice qu'une fois munie de la magnitude "1 radian".

Or se donner des directions amène à considérer un espace tangent comme"espace des directions" vers lesquelles on peut partir d'un point où l'on se trouve.Il est donc naturel de considérer l'ensemble d'actions A de l'agent comme munid'une structure diérentielle.

Plus précisément, on considérera ici que A est un groupe de Lie, i.e. niplus ni moins qu'un groupe qui est compatiblement une variété diérentielle.La restriction portée par cette structure est la nitude de la dimension de lavariété.

Tout groupe de Lie G est naturellement associé à une unique algèbre de Lieg. En particulier, l'algèbre de Lie de A sera notée a.

2.3.2 Réduction directionnelle des trajectoires

Une propriété centrale des groupes de Lie est que chaque élément "atteignable"peut être obtenu par succession nie de trajectoires dans une direction donnée.Dans la mesure où a est l'espace vectoriel réel engendré par les directions desactions, cela nous permet de réduire les calculs portant originellement sur legroupe A à des calculs homogènes portant sur a.

Plus précisément, un élément a ∈ A est "atteignable" si et seulement siune trajectoire relie e à a dans A, ou encore

∃ ta : I = [0; 1]→ A continue avec ta(0) = e et ta(1) = a

Les éléments atteignables sont donc la composante connexe (par arcs) Aede e. Dans la mesure où les actions sont obtenues dynamiquement à partirdu "repos", on peut de toute façon se limiter à considérer A connexe pararcs.

Dans ce cas, si A est un groupe de Lie d'algèbre de Lie a, alors on a unefonction lisse

expA : a→ Ad 7→ expA(d) = edA

qui induit un diéomorphisme entre un voisinage de 0a et e : les ac-tions "assez petites" s'obtiennent toutes (et de manière unique) en un seuldéplacement.

Mieux encore, on a

∀a ∈ Ae, ∃(d1, ..., dn) ∈ an | a = ednA ...ed1A e (2.9)

qui constitue la décomposition en succession nie de trajectoires "rec-tilignes".

Une annexe sur la théorie de Lie est fournie pour les dénitions et justica-tions

27

2.3.3 Le cas des transformations rigides de l'espace

En pratique, on retrouve souvent le groupe SE3(R) ∼= R3 × SO3(R) des trans-formations rigides de l'espace euclidien à 3 dimensions.Son étude se réduit donc essentiellement à celle du groupe des rotations de R3,SO3(R), qui est un groupe de Lie et même un groupe de Lie linéaire en vertude ce qu'il s'interprète

SO3(R) =M ∈ GL3(R) | ∀x ∈ R3, ‖Mx‖ = ‖x‖ et detM = 1

On peut montrer que son algèbre de Lie est so3(R) = A3, l'algèbre des

matrices antisymétriques (i.e. vériant ai,j = −aj,i) de GL3(R). En particulier,les "déplacements innitésimaux" (vus comme des éléments de a) ne sont pasnaturellement des déplacements, mais par contre on peut vérier que si A ∈ A3,alors expA (au sens de l'exponentiation matricielle ici) est bien un élément deSO3(R).

Topologiquement, SO3(R) est RP3 l'espace projectif réel à 3 dimensions quel'on peut réaliser visuellement comme une (3-)boule où on tient compte de ceque les points antipodaux sont en réalité égaux. L'espace tangent à un point deSO3(R) est donc tridimensionnel, et on peut identier de manière lisse chacunde ses vecteurs comme un élément de A3.

Dérivation de l'algèbre de Lie

Par des calculs de déterminant, on peut voir qu'une transformation rigidede l'espace en dimension 3 est forcément une rotation r autour d'un axe dr(orienté) selon un angle θr. Elle aura donc forcément pour forme matricielle(dans une bonne base) :

Mr = Mθr =

1 0 00 cos(θr) − sin(θr)0 sin(θr) cos(θr)

En écriture diérentielle pour une rotation innitésimale, et avec les

équivalents classiques :

Mdθ =

1 0 00 1− dθ2 −dθ0 dθ 1− dθ2

∼ 1 0 0

0 1 −dθ0 dθ 1

= I3 +Adθ

d'où on obtient ∂(Mθx)∂θ

∣∣∣0

= Adθx avec Adθ antisymmétrique innitésimale

Réciproquement, si on considère A antisymmétrique innitésimale

A =

1 da db−da 1 dc−db −dc 1

alors avec A′ = I3 +A, det(A′) ∼ 1 et A′ est isométrique :

28

A′TA′ = −

1 + da2 + db2 da− da+ db.dc −db− da.dc+ db−da+ da+ db.dc da2 + 1 + dc2 da.db− dc+ dc−db− da.dc+ db −da.db− dc+ dc db2 + dc2 + 1

∼ I3

Visualisation géométrique

On a :

D3 =x ∈ R3 | ‖x‖ ≤ 1

la 3-boule

S2 =x ∈ R3 | ‖x‖ = 1

la 2-sphère

S+3 = (x1, ..., x4) ∈ S4 | x4 ≥ 0 l'3-hémisphère supérieure

RP3 est l'ensemble des droites de R4, et une telle droite d est caractériséepar son intersection avec S+

3 ; dans le cas où d est incluse dans le plan del'équateur, cette intersection est en fait composée de deux points antipodauxqui décrivent tous deux la même droite. RP3 est donc l'espace obtenu enquotientant les points antipodaux de S+

3 .Or D3 et S+

3 sont bien homéomorphes via

x = (x1, x2, x3) 7→ i(x) =

(x1, x2, x3,

√1− ‖x‖2

)Et i(x) = ±i(x′) si et seulement si x = ±x′ : on identie exactement les

points antipodaux du bord S2 de D3 dans cette visualisation.

Calculabilité eective de l'exponentielle matricielle

En pratique, il faut donc pouvoir calculer l'exponentielle pour passer d'unedirection d'action à une commande motrice. Si c'est dicile en général, le cas desrotations se réduit immédiatement à des calculs trigonométriques numériques.

En particulier, si seules de petites actions sont envisagées (par exemple siun contrôle en ligne s'eectue fréquemment devant les vitesses de rotations enjeu) alors les approximations trigonométriques "des petits angles" donnent uneestimation algébriquement calculable de l'action.

L'exponentielle matricielle est donnée par

exp(M) =

∞∑0

Mn

n!

En reprenant les notations de l'encadré précédent avec A antisymmétriqueet en notant cA =

√a2 + b2 + c2, on a A3 = −c2AA, d'où

29

Ak+2 =− c2AAk

⇒∀n, A2n =(−1)n−1c2n−2A A2 et A2n+1 = (−1)nc2nA A2

⇒ exp(A) =I3 +

∞∑0

A2n+1

(2n+ 1)!+

∞∑0

A2n

(2n)!

⇒ exp(A) =I3 +

( ∞∑0

(−1)nc2n+1A

(2n+ 1)!

)1

cAA−

( ∞∑1

(−1)nc2nA(2n)!

)1

c2AA2

exp(A) = I3 +sin(cA)

cAA+

1− cos(cA)

c2AA2

2.3.4 Dynamique temporelle et contrôle

La topologie des groupes de Lie est modelée sur celle des espaces euclidiens Rnet permet donc de parler naturellement de la "continuité" au sens de notreexpérience d'une trajectoire motrice.Une telle trajectoire est la donnée d'une fonction

γM : I ⊂ R→M (2.10)

où γM(t) est la conguration motrice atteinte au temps t, et I est un intervallede R en vertu de ce qu'on prend R comme "espace des temps".

Alors la continuité de la trajectoire est exactement la continuité au sensformel de γM relativement aux topologies de R et deM. Une fois les groupesde Lie introduits, on peut également s'intéresser à cette trajectoire en termesd'action, i.e. déterminer une fonction γA : I → A continue vériant

∀t ∈ I, γM(t) = γA(t)γM(0) (2.11)

On voit donc que les γA(t) forment une famille de "èches" indexées par le tempsqui relient la conguration de départ γM(0) à la position courante γM(t).

Une telle trajectoire d'actions étant donnée, on peut y parler de trajectoiresintermédiaires en faisant partir les èches précédentes d'un point quelconque surla trajectoire. En les faisant partir d'un point atteint au temps t0, on obtientainsi formellement γA,t0(t) = γA(t)γA(t0)−1

30

Cette notation donne notamment

γM(t+ ∆t) = γA(t+ ∆t)γM(0)

= γA,t(∆t)γA(t)γM(0)

= γA,t(∆t)γM(t)

Sous hypothèse de diérentiabilité de γA, on obtient donc enn une trajec-toire tangente γa : I → a qui dénit la trajectoire motrice γM par

γM(t0) = m0

γM(t+ dt) = γA,t(dt)γM(t)

γ′A(t) = γa(t)

(2.12)

En vue de ces dépendances, on peut concevoir un nouveau modèle de con-trôle de l'action qui permet d'exploiter la structure diérentielle du groupe deLie.Dans celui-ci, l'agent choisit à chaque instant t une "direction d'action" (avecsa magnitude) a ∈ a qu'il maintient pendant l'intervalle dt ; ce maintien con-struit une action complexe A dérivée au cours des dt en suivant la direction destangentes a choisies, laquelle action s'applique à son tour à une congurationmotrice initiale arbitraire m0 pour donner une trajectoire motrice γM.

En eet, le résultat de décomposition en produit d'exponentielles assure quetoute action peut s'obtenir par itération d'une telle stratégie de choix moteursans toutefois perdre la richesse innitésimale locale qui motive l'introductiondes groupes de Lie puisque la magnitude et le temps d'application restentparamétrables.

31

3 | L'agent dans l'espace

Dans cette dernière partie, nous proposons une généralisation formelle de nom-breux concepts vu auparavant en nous basant sur la structure portée par l'espaceambiant au système. L'accent est mis sur le maintien de l'abstraction au l desdénitions pour limiter les suppositions sur le cadre d'application, tant en cequi concerne l'agent que l'environnement.

Dans un premier temps, nous montrons comment l'incarnation "physique"de l'agent dans l'espace permet d'aboutir naturellement à un schéma de typeM→ X → S déni par les caractéristiques intrinsèques de l'interaction agent-environnement tout en levant l'impératif de staticité.

Ensuite, nous usons de ce formalisme spatial pour délimiter une notion dechamp récepteur comme quantum spatial d'information qui nous permet deraisonner par analogie avec l'exemple précédent du cube perceptif. Des parallèlesintuitifs et formels sont donnés, et des pistes d'exploration ultérieure pour validerla pertinence de l'approche sont esquissées.

3.1 Lève toi et marche : en route pour l'hyperespace

Dès lors qu'on envisage un agent mobile, il devient illusoire d'espérer avoirune application sensorielle de signature M → S dans la mesure où le signalmoteur peut prendre des valeurs égales (pour une même posture, par exemple)lorsque l'agent s'est déplacé "rigidement" dans l'espace. Nous proposons donc icid'introduire un niveau d'indirection lié à la géométrie de l'espace pour remplacercette dépendance par une approche dynamique.

Supposons l'existence d'un espace externe E où l'agent évolue. Cet espace estgéométrique au sens où il possède un groupe G (E) de transformations conformes(au choix isométriques, lisses ou même seulement homéomorphiques...), c'est-à-dire que τ ∈ G (E) est une bijection E → E préservant la structure choisie. Onpeut décrire l'état de l'environnement de deux manières :

1. Soit on adopte une description "objective" comme il se fait classiquement :on se donne une collection réduite d'objets O, chacun de ceux-ci est aectéde ses propriétés (couleur, taille...) et évolue dans l'espace par exempleau moyen de fonctions de poses. Chaque objet peut changer de propriétés(par exemple, un objet peut changer de couleur) et la collection envisagéepeut elle-même changer (par exemple, un objet peut se sectionner en deuxnouveaux objets).

2. Soit on se donne une description "physique" : un état de l'environnementest une fonction pt : E → P qui associe à chaque "point" de l'espace les

32

propriétés de ce point. En ce cas, p : (t, e) ∈ R × E 7→ pt(e) est unefonction rendant compte de la dynamique physique de l'espace.

Dans tous les cas, on notera l'ensemble des états de l'environnement P. Enaccord avec la deuxième interprétation nous supposerons que P est un faisceaud'ensembles, mais on pourra usuellement y penser comme à un sous-ensemblede type P ⊂ F (E ,P)

3.1.1 Position absolue et corps

Approche naïve

Supposons qu'on puisse parler du "corps" de l'agent. Dans une situation donnée,il est localisé dans son espace ambiant E sous la forme d'un sous-espace Bs ⊂ E .Il n'est d'ailleurs pas absurde d'imaginer des propriétés topologiques intrinsèquesau corps, de manière à ce qu'il soit en fait un espace B qui s'applique sur Bs. Ence cas, les diérentes "situations" sont autant de sous-espaces Bs (où s varie)issus du même B caractéristique de l'agent.

On peut déjà ici dériver de la structure en ce que certains de ces espacesBs sont des "déplacements globaux entre eux", c'est-à-dire qu'ils modient lasituation spatiale sans modier la posture de l'agent. C'est sur ces classes dedéplacements que se construit d'ailleurs la compensabilité globale puisque cesont exactement ceux qui sont obtenus "comme par un déplacement de l'espace".

Bs′ est un déplacement global de Bs si et seulement si il existe τ ∈ G (E)une transformation conforme de l'espace telle que Bs′ = τ(Bs).

Formalisation

On considère toujours préexistants un espace ambiant E muni d'un groupede transformations conformes G (E). On se donne de plus une collection demonomorphismes Bs → E indexés par un ensemble de situations quelconque.

On note alors B la limite de ce diagramme, qui est donc munie d'un ensembleB de morphismes πs : B → E .

Avec une légère variation par rapport à l'approche précédente, un morphismeπs′ est un déplacement global de πs si et seulement si il existe τ ∈ G (E) faisantcommuter

B E

E

πs′

πsτ

(3.1)

"Être un déplacement global de" est alors une relation d'équivalence surB menant à l'espace quotient B/G (E) que l'on considérera formellement pourespace moteur M. En eet, si on revient à notre interprétation extérieure laposition "totale" d'un agent comprend sa posture et une forme de position "ab-solue" dans l'espace ; en termes de mécaniques classique, cette dernière positionreprésente un référentiel attaché à l'agent dans un référentiel de l'espace.

33

Or sous une hypothèse de restriction sur G (E), cela nous fournit une identica-tion B ⊂ M× G (E). SiM = B/G (E), en choisissant un représentant m ∈ Bde chaque classe m ∈M alors :

1. Pour πs ∈ B, il existe un unique m ∈ F tel que πs induise la même postureque m : il s'agit tout simplement du représentant de [πs], et πs est alorsun déplacement de m.

2. S'il n'existe qu'un seul déplacement τ envoyant πs sur m, notons le τπs .En ce cas, on peut associer (m, τπs) à πs pour obtenir une injection B →M× G (E)

L'hypothèse que deux automorphismes distincts ne peuvent pas induire undéplacement entre deux mêmes états assure l'injectivité de la construction. Enpratique, si on se limite à des classes précises d'automorphismes comme lesdéplacements rigides, l'hypothèse sera généralement vériée. En revanche, lechoix des représentants m rend la construction non canonique.

Signication des diérents objets Comme indiqué par les emplois denotation, les monomorphismes représentent les diérentes "positions" del'agent dans l'espace. Ils orent cependant une information plus riche en cequ'ils permettent de diérencier l'invariance "dans son ensemble" du sous-espace obtenu (qu'on pourrait retrouver en considérant une collection desous-objets) de l'invariance "point par point".

Si on peut parler de corps intrinsèque de l'agent, alors il se projette demanière essentiellement unique sur la limite B de manière compatible avecles diérents Bs → E ; en cela, elle n'est pas "trop riche". On propose doncque "restreindre" le corps à cette limite revient à dire qu'il n'est déni quepar ses inclusions dans l'espace.

Inclusion & sous-espaces Si la dénition de la relation d'équivalenceest purement diagrammatique, on peut voir en l'interprétant en termesgéométriques concrets qu'elle permet une discrimination plus ne que cellesur les sous-espaces. En eet, si l'agent est un tore immergé dans l'espace àtrois dimensions alors il existe des transformations τ du tore qui le laissentinvariant dans son ensemble mais ne peuvent pas être issues de transforma-tions de l'espace ; de telles transformations ne sont pas compensables ausens sensorimoteur.

Position absolue & posture Une approche naïve pourrait consister àpartir d'un ensemble de "postures" de l'agent (représentantM) et consid-érer qu'il peut se retrouver dans toutes les situations obtenues à partir deces postures par un déplacement global, i.e. construire B comme G (E)×ML'approche développée ici a l'avantage de permettre de restreindre certainespostures à certaines positions dans l'espace tout en permettant de décrireles cas précédents. Par ailleurs, poser B ∼= G (E)×M aurait l'avantage defournir une identication naturelle de la posture et de la position absolue,chose qui ne semble pas automatique en pratique.

34

3.1.2 Dériver le formalisme

Poses et noyaux

Etant donnés les outils introduits, nous allons essayer de reformuler les élémentsexposés dans les premières parties pour vérier que nous n'avons pas perdud'expressivité.La fonction sensorielle ψε d'origine devient ici une application B → S qui prenden compte la position absolue de l'agent. On considère de même ψ : B×P → Sla fonction sensorielle totale.Pour un état de l'environnement p ∈ P donné, on considère l'espace quotientXp =M/ψp des courbes de noyaux de ψp, c'est-à-dire les congurations motricessensoriellement séparées par l'agent pour l'environnement p. Cela nous donnedonc une famille d'espaces Xp (avec p ∈ P), chacun avec sa fonction ψp : Xp → SAlors on pose X comme la limite de ces quotients

X = lim←−

ψp

ce qui nous fournit naturellement une fonction f :M→ X qui factorise toutesles projectionsM→ Xp, et des fonctions φp = πX ,Xp ψp : X → S. Les résultatsantérieurs de relations entre espaces sont ici des conséquences immédiates de laconstruction.

Il s'agit techniquement de la démarche inverse de l'approche précédente, oùX est un objet théorique pré-existant qui doit être atteint par recoupement desXp. Ici, les Xp existent par l'expérience et on considère X comme la limiteeective de leur ranement compte tenu de la richesse des environnements p etde la nature des capteurs décrite par ψ. La démarche à suivre pour construireX en pratique reste donc rigoureusement la même.

Actions

Le cadre géométrique permet enn de formuler des actions qui modient laposture totale de l'agent, et en particulier des translations.Le lieu naturel des actions est B × P, puisque le résultat d'une action motricedépend non seulement de la situation de l'agent lorsqu'il l'eectue mais aussi del'état de l'environnement. De telles actions permettent de rendre compte de ladépendance entre le corps de l'agent et la physique de l'environnement.Plus simplement, si au contraire on souhaite garder une certaine hypothèsed'indépendance pour la tractabilité en pratique, on peut se restreindre à desactions B → B : dans la lignée des actions de M, celles-ci ne modient pasl'état de l'environnement mais seulement la situation spatiale de l'agent.

Un lien doit être fait entre la topologie de l'action (telle que rendue parsa structure de Lie par exemple) et la topologie de son eet sur l'agent.En eet, un "petit" mouvement a devrait se traduire sur les couples desituations πs → aπs. Il nous faut donc essentiellement ici parler de distancesur les πs ou à défaut sur leurs images, ce qui implique donc une structured'hyperespace pour E .

Un cas raisonnable dans la continuité des travaux précédents consis-terait à utiliser la distance de Hausdor entre sous-parties, qui reste valide

35

lorsque l'espace ambiant est métrique. Le maintien de B permet cepen-dant d'utiliser une légère adaptation : plutôt que de comparer toutes lespaires de points (M,M ′) ∈ πs(B)×πs′(B) entre deux situations, on peut secontenter des distances entre paires de type (πs(M), πs′(M)) pour encoreune fois discriminer sur le chemin parcouru point par point par le corps del'agent.

Quoi qu'il en soit, une foit cette topologie assurée, alors on peut intro-duire des trajectoires spatiales dans le cône de fonctions πs, s ∈ B etretrouver des trajectoires γ... sans plus d'obstacles.

3.1.3 Compensabilité et déplacements

Un gain apporté par la formulation spatiale des variables motrices est une pre-mière caractérisation de la compensation, phénomène au centre de la motivationde l'approche sensorimotrice. Nous l'avons d'ailleurs déjà implicitement utiliséepour dénir certains des objets.

On peut relier une classe de transformations des états de l'environnementavec les déplacements de l'espace sous-jacent ; par exemple, on peut imaginerl'environnement se translater.Formellement, cet eet se réalise lorsqu'on prend τ ∈ G (E) et qu'on le précom-pose aux états de l'environnement. Ainsi, un état p ∈ F (E ,P) est modié parτ pour donner p′ = p τ : M 7→ p(τM), et à l'inverse p peut être retrouvé àpartir de p′ via p(M) = p′(τ−1M).

On a donc une action de G (E) sur P via p 7→ p τ . Alors la compensabilitétotale "classique" se formulerait : a ∈ A est compensable si et seulement si ilexiste τ ∈ G (E) vériant

∀π ∈ B,∀p ∈ P, ψ(aπ, p) = ψ(π, pτ) (3.2)

En particulier, si a envoie toujours π sur π′ = τ π (sous réserve que τ π ∈B), alors a est compensable et compense τ . L'existence même théoriquede ces transformations impose ainsi très rapidement l'existence de nombreusesactions, situations et états de l'environnements.

3.2 Capteurs, Permutativité et Champ récepteur

Dans la lignée du cube perceptif, nous voulons déterminer les régularités qui seproduisent dans la sensation ressentie lors d'un mouvement. Dans l'expérienceprésentée, la propriété se manifestait sous la forme de permutation des com-posantes élémentaires de la sensation en raison d'une action combinatoire de Asur l'ensemble des champs récepteurs de l'agent.L'objectif est donc ici de proposer une description générale du concept de champrécepteur qui pourrait servir de support à une généralisation de ce procédé.

Dans la suite, un capteur prend pour sens formel toute fonction si : B×P →Si avec Si un espace quelconque.

36

3.2.1 De la sensation à l'information spatiale

La description "physique" de l'environnement en termes de fonctions spatialespermet de dissocier la valeur précise de l'environnement p de la géométrie del'espace sous-jacente. Dans ce cadre, si on pouvait se permettre de parler d'uncapteur plongé dans E , alors son champ récepteur serait une certaine région "ex-trémale" E ′ ⊂ E portant l'information nécessaire sur l'état de l'environnementpour prédire la sortie du capteur.

Il est important ici de considérer que ce "champ récepteur" doit pouvoirdépendre des paramètres du capteur. Par cela, on désigne bien sûr la positiondans l'espace mais aussi des paramètres plus "intrinsèques". Par exemple, pourune caméra, le réglage du diaphragme change l'angle au sommet d'un cônequi constitue son champ. Cette notion doit donc être décrite par une fonctionB → P(E) qui à une conguration du capteur associe la région de l'espaceE ′ ∈P(E) qui est son champ récepteur sous ces paramètres.

Combinatoire des capteurs et champs récepteurs

En vertu de la dénition de "capteur" que l'on considère ici, on peut voir qu'unensemble de capteurs forme à son tour un capteur. Plus précisément, si s1 et s2sont des capteurs si : B × P → Si, alors

s1,2 : B × P → S1 × S2(π, p) 7→ (s1(π, p), s2(π, p))

est un capteur d'espace de sensation S1 × S2. Il correspond à la fonction desensation d'un agent muni des deux capteurs s1 et s2. De même, pour unensemble C quelconque de capteurs, on peut dénir le capteur produit sC .

De plus, si on se donne une dénition de champ récepteur qui répond à notrecritère de susance et d'extrémalité, alors on doit s'attendre à une correspon-dance combinatoire entre le champ récepteur de sC et celui des sc, c ∈ C . Eneet, l'union des champs récepteurs des sc contient chacun de ces champs, etdoit donc permettre de prédire toutes leurs sorties ; elle est donc prédictive desC , ou encore "susante". Réciproquement, si on considère un sous-espace quine contient pas cette union, alors les points manquants étaient nécessaires pourprédire la sortie de l'un des capteurs puisque chacun des champs était lui-mêmeminimal, en raison de quoi ce sous-espace ne sera pas susant.Une dénition "raisonnable" devrait donc vérier que le champ d'un ensemblede capteurs est l'union des champs des capteurs élémentaires.

3.2.2 Dénitions

Plusieurs propriétés de "susance" sont envisagées, et leurs champs récepteursexplicités. Pour garder la généralité et notamment se permettre de parler decapteurs "ous" qui ne mesurent pas des grandeurs dénies point par pointcomme les thermomètres, nous formulons les propositions en termes de voisi-nages et non de points.De cette manière, nous suivons à chaque fois la même démarche : on consid-ère l'ensemble F.,π des parties de l'espace dénies par une certaine propriétéinformationnelle relative à la sortie du capteur en conguration π ∈ B, puis on

37

prend leur extrémum E.,π pour former un champ récepteur.

Les dénitions proposées sont à illustrer avec le cas d'une "caméra" dansle plan, où pour simplier les points de l'espace peuvent être noir (opaques)ou blancs (transparents). Chaque "photorécepteur" de la caméra échantillonneune demi-droite dans un cône donné (de sommet la position de la caméra) etest sensible au premier point noir qui intercepte cette demi-droite.

Par intuition, nous souhaitons donc obtenir entre autres une dénition de"champ récepteur" qui donne pour un photorécepteur sa demi-droite, et pourla caméra le cône réunion de ces demi-droites.

Espace toujours signicatif (maximal)

On considère l'ensemble de sous-espaces F+,π ⊂ P(E) déni par E ′ ∈ F+,π siet seulement si

∀p1, p2 ∈P, sπ(p1) = sπ(p2)⇒ p1|E′ = p2|E′ (3.3)

Ce sont donc des sous-espaces sur lequel le capteur s en conguration πdonne une information dèle : en un certain sens, sπ est injective sur E ′. Lecontenu informationnel se manifeste par ce que si p1 et p2 dièrent sur E ′, alorsils vont donner une sortie diérente pour sπ.Il est clair tout d'abord que E ′′ ⊂ E ′ ∈ F+,π ⇒ E ′′ ∈ F+,π. En particulier,prendre l'intersection de ces sous-espaces n'aurait pas beaucoup d'intérêt : elleserait vide.En revanche F+,π est stable par union, i.e. si on considère I un ensemble on a∀i ∈ I, Ei ∈ F+,π ⇒

⋃I Ei ∈ F+,π.

A fortiori, en prenant I = F+,π on pose

E+,π =⋃

F+,π

E ′

Alors

1. E+,π ∈ F+,π : E+,π vérie la propriété d'information demandée

2. ∀E ′ ∈ F+,π, E ′ ⊂ E+,π : E+,π est maximal

En pratique Pour notre caméra, le champ récepteur à ce sens donne :

• pour un photorécepteur, sa position

• pour leur collection, l'ensemble (au sens de l'union) de leurs positions

Cette dénition semble donc donner un moyen informationnel naïvementaccessible d'obtenir un corrélat de la position d'un capteur.

Espace susant (minimal)

Cette fois, on considère l'ensemble F0,π ⊂ P(E) déni par E ′ ∈ F0,π si etseulement si

∀p1, p2 ∈P, p1|E′ = p2|E′ ⇒ sπ(p1) = sπ(p2) (3.4)

38

Incidemment, on peut remarquer qu'il s'agit de la propriété réciproque decelle des espaces toujours signicatifs. C'est une idée très proche de celle desupport d'une fonction en mathématiques usuelles , comme en théorie des dis-tributions. Elle mène également à raisonner sur les germes de l'environnementP.

Ce sont donc les sous-espaces sur lesquels l'état de l'environnement sut àexpliquer l'activité du capteur s en conguration π. En eet, on peut proposerune dénition diagrammatique équivalente

PE Sc

PE ′

·|E′

où PX désigne moralement l'ensemble des fonctions "physiques" dénies surX ⊂ E . Les sous-espaces E ′ considérés sont alors exactement ceux où la ècheillustrée en pointillés faisant commuter le diagramme existe.

Clairement E ∈ F0,π : par exemple sur le diagramme précédent, ·|E estl'identité donc sπ convient comme candidat. De même, E ′ ⊂ E ′′ avec E ′ ∈ F0,π

donne E ′′ ∈ F0,π : ici c'est l'intersection qui va porter fournir l'extremumcherché.

Cette fois F0,π n'est pas par dénition stable par intersection ; cette stabil-ité équivaut à une certaine hypothèse de localité sur sπ et de richesse sur P.Néanmoins, en supposant cette condition remplie, on pose

E0,π =⋂

F0,π

E ′

Et alors E0,π est à son tour un espace susant minimal.

En pratique Avec cette dénition, pour la caméra on obtient eectivementles champs récepteurs "cherchés", à savoir une demi-droite pour chaque pho-torécepteur et le cône pour leur ensemble.

Espace immédiatement signicatif (maximal)

On souhaite ici qualier la partie de l'espace qui inue présentement sur la sortiede s en conguration π lorsque l'environnement est dans un état p0 donné.Plus précisément, on s'intéresse à l'ensemble F−,π,p0 déni par E ′ ∈ F−,π si etseulement si

∀E ′′ ⊂ E ′,∃p ∈P | p|E−E′′ = p0|E−E′′ ∧ sπ(p) 6= sπ(p0) (3.5)

Intuitivement, ces E ′ sont les sous-espaces qui ne contiennent eux-mêmes quedes sous-espaces E ′′ à défaut de points signicatifs. Ici, la propriété demandéeest qu'il existe un état de l'environnement coïncidant avec la référence p0 sur lecomplémentaire et donnant néanmoins une sortie sensorielle diérente. Ainsi,on attribue la diérence sensorielle à la variation d'environnement sur le sous-espace considéré.

39

Cet ensemble de sous-espaces est encore naturellement stable par union, d'oùon pose

E−,π,p0 =⋃

F−,π,p0

E ′

Ce sous-espace E−,π,p0 vérie encore la propriété demandée et est maximalpour celle-ci pour les mêmes raisons que dans le cas toujours signicatif.

En pratique Pour le capteur visuel d'illustration, en un état de l'environnementp0, le champ récepteur associé est l'espace des points balayés par le regard dela caméra. Il prend donc la forme d'une section du cône "total" par les pointsopaques de l'environnement qui obstruent la vision ; en eet, un changementde la valeur de p en n'importe lequel de ces points modiera la valeur du pho-torécepteur dont la droite d'échantillonnage contient le point, et au contraireles autres points n'ont pas d'inuence individuelle.

Espace potentiellement signicatif (maximal)

Il s'agit d'un rapide développement sur la notion précédente : on peut combinerles diérents champs récepteurs immédiatement signicatifs associés à une con-guration π donnée pour former la région de l'espace qui inue potentiellementsur la sortie de s, au sens où chaque point de cette région est immédiatementpertinente dans un état de l'environnement.Cela revient donc à poser

F−,π =⋃

p∈P(E)

F−,π,p

En pratique On retrouve encore les champs en demi-droite et cône.Cependant, cette visualisation est très dépendante de la statistique physique

contenue dans P car l'introduction de dépendances sur l'espace modie radi-calement les champs récepteurs.Ainsi, permettre la présence de miroirs plans n'importe où dans l'espace trans-forme le champ récepteur à ce sens en l'espace tout entier.

3.2.3 Actions spatiales, informations mutuelles

En tant que régions de l'espace, les champs récepteurs héritent naturellementd'un certain nombre d'actions.Tout d'abord, on observe que G (E) agit naturellement sur P(E) via

τE : G (E)×P(E)→P(E)

(τ, E ′) 7→ τ(E ′)

Cela correspond intuitivement à considérer la partie de l'espace "glissée" (par τ)point par point à partir de la partie de départ E ′, formalisant en un sens le dé-placement des champs récepteurs le long de G (E). Cette observation généraliseles permutations sous rotation des capteurs soulignée dans l'exemple du cubevisuel où G (E) ⊂ SO3(R).

On s'est de plus munis d'une action A sur B qui peut se transférer viaun champ récepteur B → P(E), quitte à ce qu'elle dégénère en une fonction

40

P(E) → P(P(E)). Certaines de ces actions, en revanche, peuvent passer àl'espace et fournir une vraie action sur P ; c'est en particulier une conséquencede la compensabilité, puisque pour celles-ci les actions peuvent alternativementêtre dénies via G (E).

Ces déplacements de champs récepteurs sous l'eet de a ∈ A nous ramènenten terrain connu : si le capteur s est aublé d'un champ récepteur fs : B →P(E), alors on peut s'intéresser aux couples de capteurs s, s′ vériant

fs′(aπ) = fs(π)

en une généralisation des relations c′ = rc pour le cube. En eet, une tellerelation s′ = as est ici encore indépendante de l'état de l'environnement ou dela sensation courante.

D'un point de vue opérationnel, cela demandera probablement un traitementbeaucoup plus n car on ne peut compter sur un recoupement parfait des champsrécepteurs à travers le mouvement de l'agent lorsque la géométrie du corps, lanature des capteurs et la combinatoire des actions se complexient.Néanmoins, il semble raisonnable que des relations de type s′ = as (où l'égalitépeut être remplacée par un critère de susance sur l'intersection des champs)soient de nouveau liées à des corrélations statistiques entre les sorties de s′ et sà travers le mouvement. En particulier, l'information mutuelle généralisée surla sortie des capteurs avant/après mouvement devrait permettre de classier cesrégularités entre groupes arbitraires de capteurs.

Quoi qu'il en soit, une large partie des résultats sur la structure de l'agentcombinatoire algébrique, prédictivité obtenus par calcul des triplets c r→ c′

se transpose au cas présent si on obtient des triplets s a→ s′, ce qui justieraitl'intérêt de déterminer ces relations par l'expérience sensorielle.

41

Quelques perspectives

Au terme de ce mémoire, de nombreuses pistes se présentent pour poursuivrel'eort amorcé :

• Il faudrait préciser quelle est la structure rendue nécessaire pour B et Apar l'existence de compensation : elle demande l'existence de nombreuxéléments tous reliés les uns aux autres par déplacements, qui permettraitde restreindre la nature des ensembles à considérer.

• Du point de vue algorithmique, il faut déterminer un moyen d'établir unestratégie motrice dirigée vers un but, i.e. déterminer une décompositionrectiligne dans les groupes de Lie. En particulier, majorer le nombre de"virages" nécessaires permettrait de quantier l'ecacité d'un agent.

• Certains éléments intuitifs mais néanmoins obscurs ne sont pas encoredérivés en termes d'éléments fondamentaux introduits, mais pourraientbien l'être. Par exemple, on pourrait tenter de déterminer une partie max-imale de la sensation qui ne dépend pas de l'environnement pour aboutir àun corrélat sensible de la proprioception, de même que le corps de l'agentdoit pouvoir se dénir comme un sous-espace sur lequel l'environnement"suit inconditionnellement" les déplacements de l'agent.

• Il faut absolument élucider dans quelle mesure les champs récepteursgénéralisés et leurs mouvements permettent d'obtenir un analogue despropriétés de permutation de sensations du cube.

• On pourrait déterminer des algorithmes plus nuancés d'apprentissage descouplages entre capteurs, dans le cas simple du cube comme une fois lepoint précédent acquis le cas général. En particulier, la piste Hebbiennesemble naturellement adaptée.

• La décomposition de la sensation en sensations élémentaires permet deformuler un prototype de compensation partielle où la compensation nes'eectue que sur un sous-ensemble des capteurs de l'agent. Partant delà, il faut vérier que ces transformations portent bien l'information surla géométrie de l'espace au même titre que les compensations classiques,et déterminer un algorithme pour leur détection.

En plus de ces eorts sur le contenu, d'autres devraient être fournis pourrendre l'énonciation des dénitions plus claires et éventuellement rechercherl'aaiblissement des axiomes utilisés.

42

A | Rappels techniques : re-lations d'équivalence

Le formalisme introduit utilise en abondance la notion de relation d'équivalenceet leurs quotients. Nous fournissons donc ici par souci d'exhaustivité de brefsrappels quant aux dénitions générales et aux usages classiques de ces objetsqui pourront faciliter la lecture de certaines sections.

A.1 Dénition et propriétés de base

Soit E un ensemble, ∼ une relation sur E (i.e. une partie Ω de E × E oùmoralement x est en relation avec y ssi (x, y) ∈ Ω)

Dénition 1. ∼ est une relation d'équivalence si et seulement si elle vérie :

• Réexivité : ∀x ∈ E, x ∼ x

• Symétrie : x ∼ y ⇔ y ∼ x

• Transitivité : x ∼ y ∧ y ∼ z ⇒ x ∼ z

Les relations d'équivalence ressemblent de très près aux relations d'ordre,à ceci près qu'on échange la demande d'antisymétrie contre celle de symétriecomme les symboles usuels (≤ et ∼) le dénotent.

A.1.1 Exemples de base

De manière générale, les relations d'équivalence formalisent l'idée que certainsgroupes d'éléments représentent "la même chose relativement à une observa-tion", ce que nous allons essayer de préciser par la suite. Ces quelques exemplesélémentaires fournissent ainsi des prototypes de candidats sérieux à vérier lesaxiomes.

Exemple. = dénit une relation d'équivalence sur tout ensemble

Exemple. ∼ vériant ∀ (x, y) ∈ E ×E, x ∼ y dénit une relation d'équivalencesur E

Exemple. Pour n ∈ Z, x ∼ y ⇔ y − x ∈ nZ dénit une relation d'équivalencesur ZExemple. Une fonction f : E → F dénit une relation d'équivalence (notée ∼f )sur E via x ∼ y ⇔ f(x) = f(y)

43

Démonstration. Seulement pour le dernier exemple. Cela tient essentiellementà ce que l'égalité vérie les axiomes :

• ∀x, f(x) = f(x) donc x ∼f x

• f(x) = f(y)⇔ f(y) = f(x)

• Si f(x) = f(y) et f(y) = f(z), alors f(x) = f(z)

Ce dernier exemple est de portée susamment générale pour que les troispremiers en sont des cas particuliers. Il précise déjà l'intuition selon laquelle lesrelations d'équivalence dénotent la discriminabilité relativement à une observ-able : en eet, si on considère f comme une observation sur un ensemble E donton ne connaît pas fondamentalement les éléments mais seulement leur "eet"via la fonction f , deux éléments sont d'apparence confondus s'ils ne sont passéparés (ou, en termes de physique, "résolus") par f , i.e. s'ils sont équivalentspour ∼f .

A.1.2 Classes d'équivalences et ranements

Ceci étant dit, nous rappelons le point fondamental sur les relations d'équivalencequi justie leur usage.

On considère toujours ∼ une relation d'équivalence sur un ensemble E quel-conque, et pour x ∈ E on note [x] = y ∈ E, x ∼ y ce qu'on appelle la classed'équivalence de x (pour ∼).

Proposition 1. ∀x, y ∈ E, [x] ∩ [y] = [x] = [y] ssi x ∼ y, ∅ sinon.

Démonstration. ∀x1, x2 ∈ [x], x1 ∼ x2 : en eet, x ∼ x1 et x ∼ x2 donc partransitivité x1 ∼ x2Supposons alors z ∈ [x] ∩ [y] : en particulier, z ∈ [x] et donc ∀x′ ∈ [x] ona z ∼ x′. De même, z ∈ [y] et donc y ∼ z. En recollant ces morceaux partransitivité, on a x′ ∼ yDonc [x] ∩ [y] 6= ∅⇒ [x] ⊂ [y]. Comme x et y ont des rôles symétriques ici, onpeut de même obtenir [y] ⊂ [x] d'où nalement [x] ∩ [y] 6= ∅⇒ [x] = [y]

Corollaire. Les classes d'équivalences pour ∼ forment une partition de E. Plusprécisément, il y a bijection entre les partitions de E et les relations d'équivalencesur E.

Dénition 2. On note E/∼ l'ensemble appelé quotient de E par ∼ des classesd'équivalence pour ∼, et on dispose par construction d'une application quotient

π∼ : E → E/∼

x 7→ [x]

Remarque. Avec les notations de cette dernière dénition et celles des exemplespréliminaires, on voit que ∼ est en fait ∼π∼ et donc que l'exemple fonctionnel derelations d'équivalences englobe précisément toutes les relations d'équivalence.

Dénition 3. Soient ∼1 et ∼2 deux relations d'équivalence sur E. On dit que∼1 est plus ne que ∼2 ssi x ∼1 y ⇒ x ∼2 y

44

En termes de classes d'équivalences vues comme des régions de l'ensemblede points E, cela revient à demander que chacune de celles pour ∼1 soit inclusedans l'une pour ∼2, d'où la terminologie.

Proposition 2. Si ∼1 est plus ne que ∼2, alors on dispose d'une application

π∼1,∼2 : E/∼1 → E/∼2

[x]∼1 7→ [x]∼2

Cela formalisme le fait que connaître la classe d'un objet pour ∼1 permetde déterminer sans ambiguïté sa classe pour ∼2 puisque la première discriminemieux que la seconde

Proposition 3. "Etre plus ne que" est une relation d'ordre sur les relationsd'équivalence sur un ensemble donné

Démonstration. En vertu de ce que les relations d'équivalence sur un ensemble Esont exactement les partitions de cet ensemble, nous raisonnons sur ces dernières.En accord avec la dénition, une partition P = Ei, i ∈ I de E est plus nequ'une autre partition P ′ =

E′j , j ∈ J

si et seulement si

∀E ∈ P, ∃E′ ∈ Q | E ⊂ E′

Soient donc P, P ′, P ′′ trois partitions, telles que P est plus ne que P ′ et P ′ estplus ne que P ′′.

• Réexivité : ∀E ∈ P, E ⊂ E : P est plus ne qu'elle-même

• Transitivité : ∀E ∈ P,∃E′ ∈ P ′ | E ⊂ E′ car P est plus ne que P ′. OrP ′ est plus ne que P ′′ donc ∃E′′ ∈ P ′′ | E′ ⊂ E′′, et alors E ⊂ E′′, doncP est plus ne que P ′′

• Antisymétrie : supposons P ′ également plus ne que P , et prenons E ∈ PPar hypothèse on a ∃E′ ∈ P ′ | E ⊂ E′, et de même ∃E′′ ∈ P | E′ ⊂ E′′.A fortiori E ⊂ E′′ sont tous deux des éléments de P qui doivent êtreégaux ou disjoints puisque P est une partition, d'où E = E′′. PuisqueE ⊂ E′ ⊂ E′′, il s'ensuit E = E′ = E′′, d'où P = P ′

Remarque. Les relations d'équivalence sur un ensemble sont bornées, au sens oùil existe des relations d'équivalence ∼min et ∼max telles que pour toute relation∼, ∼min est plus ne que ∼ et ∼ est plus ne que ∼max

Il sut pour cela de prendre = pour ∼min et ∼max : ∀x, y ∈ E, x ∼max y

Il est également possible de combiner des relations d'équivalences pour enformer de nouvelles, qui ont de plus l'intérêt de préciser la structure d'ordre surles relations d'équivalence. Plus précisément,

Proposition 4. Soient ∼1 et ∼2 deux relations d'équivalence sur E. Alors larelation ∼1,2 dénie par

x ∼1,2 y ⇔ x ∼1 y et x ∼2 y

est une relation d'équivalenceDe plus, elle est maximale parmi les relations qui sont plus nes que ∼1 et ∼2

45

Démonstration. Tout d'abord, montrons que ∼1,2 est une relation d'équivalence:

• ∀x, x ∼1 x et x ∼2 x : x ∼1,2 x

• x ∼1,2 y ⇔ x ∼1 y et x ∼2 y ⇔ y ∼1 x et y ∼2 x⇔ y ∼1,2 x

• Soient x, y, z tels que x ∼1,2 y et y ∼1,2 z, alors par transitivité de ∼1

et de ∼2 on a x ∼1 z et x ∼2 z, donc par dénition de ∼1,2 on obtientx ∼1,2 z

Soit maintenant ∼ une relation d'équivalence plus ne que ∼1 et ∼2. Si x ∼ y,alors puisque ∼ est plus ne que ∼1 on a x ∼1 y et de même x ∼2 yD'où x ∼ y ⇒ x ∼1,2 y : ∼ est plus ne que ∼1,2

Du point de vue des partitions, cette proposition se traduit par l'existencepour deux partitions P1 et P2 de E d'une partition P1,2 qui soit la moins neparmi celles à la fois plus nes que P1 et P2. Constructivement, il s'agit enfait de la partition constituée des intersections (non vides) des ensembles prisd'une part dans P1 et d'autre part dans P2, ce qui justie qu'on parle aussid'intersection de relations ∩ ∼

Proposition 5. Soit R un ensemble quelconque de relations d'équivalences surE. Alors il existe une relation d'équivalence ∼R sur E maximale parmi lesrelations d'équivalences ∼ qui minorent R, i.e. qui vérient

∀ ∼′∈ R, ∼ est plus ne que ∼′

De plus, ∼R peut alternativement être dénie par

x ∼R y ⇔ ∀ ∼∈ R, x ∼ y

PourR une relation quelconque, on peut de même dénir la relation d'équivalenceengendrée par R comme l'intersection de toutes les relations d'équivalencesmoins nes que R. Elle a de plus la propriété d'être minimale parmi les re-lations moins nes que R.

En particulier, si on se donne ∼1 et ∼2 deux relations d'équivalence (ouR un ensemble de relations d'équivalence), la relation d'équivalence engendréepar ∼1 ∪ ∼2 (resp. ∪R ∼) est la relation d'équivalence la plus ne parmi lesrelations moins nes que ∼1 et ∼2 (resp. les relations de R). On la dénoteracomme l'union ∪R ∼. Il s'ensuit que l'ensemble des relations d'équivalenceforme un treillis.

A.2 Applications théoriques courantes

A.2.1 Quotient injectif

De nombreuses manières, les fonctions les plus commodes sont les bijections ence qu'elles permettent de substituer un ensemble à un autre et de transporterla structure via la correspondance 1− 1 qu'elles établissent, mais elles ont hélasle défaut assez singulier d'être somme toute assez rares. L'obstruction d'unefonction à être bijective peut être quantiée et dans une certaine mesure

46

rectiée, de deux manières distinctes selon que l'on s'intéresse à son caractèreinjectif ou surjectif.

En ce qui concerne la surjectivité, étant donnée une fonction f : E → Fdonnée, nous sommes naturellement amenés à considérer

f(E) = y ∈ F, ∃x ∈ E / y = f(x) ⊂ F

l'image par f de E, qui est elle-même un sous-ensemble de F "sur lequel f estsurjective". Elle est uniquement caractérisée par ce qu'elle est le plus grand deces sous-ensembles.

Plus précisément, d'une part il existe fsurj : E → f(E) surjective vérianti fsurj = f avec i l'inclusion f(E) → F , et d'autre part si F ′ ⊂ E admetune telle factorisation surjective, alors F ′ ⊂ f(E). Ceci règle donc le défaut desurjectivité éventuel de f : en eet, f est surjective si et seulement si f(E) = Fou encore si et seulement si i est bijective.

La résolution du défaut d'injectivité est peut-être moins naturelle de primeabord, mais découle de l'écriture fonctionnelle des relations d'équivalences commevu dans les exemples introductifs.

En eet, pour chaque valeur prise par f , l'injectivité demande qu'il n'enexiste qu'un antécédent, et donc de facto que l'on groupe tous les antécédentséventuels (en cas de non injectivité) pour y appliquer communément la fonction.Cela n'introduit par ailleurs pas d'ambiguïté, puisque par dénition ils ont tousmême image par f .

On veut donc d'une manière ou d'une autre ne garder qu'un élément dudomaine de dénition par élément de l'image de manière que tous les élémentsdu domaine puissent se ramener à un seul tel élément avec lequel ils partagentleur image par f . Or, ce groupement des éléments du domaine est exactementcelui opéré par ∼f via ses classes d'équivalences

Si on essaie cette intuition : avec x ∈ E, alors selon celle-ci pour réaliserl'injectivité on se doit de poser une nouvelle fonction finj via

finj([x]) = f(x)

et ainsi dénir finj : E/∼f → F .On peut voir que cette dénition n'introduit pas d'ambiguïté : si on prend

y, z ∈ E deux représentants de [x] ∈ E′ donné, alors f(y) = f(z) par dénitionde ∼f donc g([x]) est bien déni.

Pour ce qui est de l'injectivité, finj([x]) = finj([y]) nous donne f(x) = f(y)et donc x ∼f y, ou encore [x] = [y] : finj est injective, et f est injective ssi πfl'est également, i.e. ssi ∼f est la relation triviale (x ∼ y ⇔ x = y). On a alorsune deuxième factorisation : f = finj πf

En combinant ces deux processus on obtient une fonction bijective f à partirde f qui donne le diagramme commutatif suivant (la èche f de E à F étantomise pour raisons de lisibilité)

E f(E)

E/πf F

πf

fsurj

i

finj

f (A.1)

47

A.2.2 Quotient topologique

Dans le cadre des espaces topologiques, le quotientage permet de formaliser letransfert de la continuité lorsqu'on recolle des points d'un espace donné. Parexemple, on peut obtenir le cercle en recollant les extrémités d'un segment ouencore le tore en recollant les côtés d'un cylindre par paires opposées.

Cette opération ne préserve en général que mal les structures topologiquesnes comme la compatibilité avec une distance ou même la séparation à moinsd'ajouter certains systèmes d'hypothèses. Néanmoins, il reste possible de parlerde continuité sans condition.

Formellement, si on se donne π : E → F un quotient d'équivalence oùE est lui-même un espace topologique, alors F est naturellement muni d'une"topologie quotient" via

U ⊂ F est un ouvert ⇔ π−1(U) est un ouvert de E

Il est clair que π est continue, et elle permet en plus d'établir une relationentre la continuité sur E et celle sur F . En eet, une fonction f : E → Xcompatible avec π est continue si et seulement si elle peut s'écrire sous la formeπ fπ avec fπ : F → X continue, et réciproquement si on a g : F → Xcontinue alors il existe g : E → X continue telle que g = π g. Ainsi, soushypothèse de compatibilité avec le quotient, les deux chemins de ce diagrammesont équivalents

E X

F

π

f

Quotient par une partie

Cette signication du quotient en topologie nous amène à considérer une cer-taine classe de relations d'équivalence très fréquemment. Ce sont les relationsd'équivalence qui laissent "la plupart" des points inchangés, sauf une certainepartie A ⊂ E de l'espace total qui est entièrement écrasée sur elle-même. Onobtient ainsi la relation ∼A via

[x]∼A =

A si x ∈ Ax sinon

Les opérations entre relations permettent de préciser la portée de ces quo-tients spéciques

• L'intersection restreinte aux relations d'équivalences associées à une partiepermet d'opérer une séparation complète : si A est un ensemble de partiesde E telles que ∀x ∈ E,∃A,A′ ∈ A | x ∈ A et x /∈ A′, alors le quotientrané ne "perd" pas d'information au sens où E/∩A∼

∼= E

• L'union de ces relations d'équivalence permet de construire toute relationd'équivalence : si A est un ensemble de parties de E, alors ∪A ∼ estla relation d'équivalence qui écrase chacun des A ∈ A sur eux-mêmes,quitte à ce que plusieurs A soient fusionnés s'ils sont d'intersection non

48

vide. On peut alors écrire ∼ quelconque comme la réunion des relationsd'équivalences associées à chacune de ses classes, i.e. ∼= ∪x∈E ∼[x]

Ces deux résultats nous permettent de largement nous limiter au quotientagepar des relations de type ∼A pour les preuves formelles, et ce en particulier pourcelles qui concernent la mise en pratique d'algorithmes et ne requièrent doncque des récurrences nies. Ainsi, le maintien des homéomorphismes dans lediagramme en tour pour le ranement des quotients moteurs repose sur l'usagede telles relations d'équivalence.

49

B | Rappels techniques : Théoriede Lie

Le formalisme est largement basé sur des structures de nature algébrique quise transmettent aux données du problème via les actions motrices. En partic-ulier, la nature des groupes d'action en jeu est d'une importance cruciale sur laspécicité des résultats à attendre.

Parmi les groupes, certains orent une géométrie "continue" proche de l'expérience.Cette condition permet de dénir et utiliser des notions comme la longueur etla direction au moyen de la diérentiation. Plus encore, l'introduction d'unenotion de continuité réelle permet d'introduire la dynamique dans le modèle viaune commande temporelle de l'agent.

Nous nous limiterons ici au cas des groupes de Lie réels de dimension niepour deux raisons : d'une part leur introduction demande moins de bagagetechnique car ils sont modelés sur Rn plutôt que sur des espaces plus abstraits,et d'autre part leur limitation de nitude n'est souvent qu'une objection deprincipe si l'action se parcourt par expériences successives. En eet, certainesclasses de groupes plus abstraits peuvent être construites comme des "limites"croissantes de groupes de Lie à notre sens.

B.1 Dénitions

Un ensemble G est un groupe de Lie si :

1. C'est un groupe, i.e. on peut y calculer algébriquement via une opération∗ : G → G vériant les axiomes :

• Associativité : ∀g, h, k ∈ G, (g ∗ h) ∗ k = g ∗ (h ∗ k)

• Neutre bilatère : ∃eG ∈ G | ∀g ∈ G, g ∗ eG = eG ∗ g = g

• Inverse bilatère : ∀g ∈ G, ∃h ∈ G | g ∗ h = h ∗ g = eG

2. C'est une variété diérentielle, i.e. un espace topologique muni d'un atlas(Ui, φi) vériant :

• Carte locale : ∀i, Ui est un ouvert de G et φi un homéomorphismede Ui sur une partie d'un Rn

• Recouvrement : G ⊂⋃i Ui, i.e. ∀g ∈ G, ∃i | g ∈ Ui

50

• Correspondance des cartes : φiφ−1j : A ⊂ Rn → Rn est "raisonnable-ment gentille", i.e. induit un diéomorphisme de φj(Uj

⋂Ui) sur

φi(Uj⋂Ui))

3. Ces structures sont "compatibles", au sens où lamultiplication ∗ et l'inversiong 7→ g−1 sont des fonctions C∞

Quelques remarques

Du côté algébrique, il n'existe en fait qu'un seul neutre, qu'on appelle donc leneutre et qu'on note e, id, 1 ou 0 selon le contexte (respectivement général,fonctionnel, multiplicatif et additif). De même, un élément g ∈ G admet ununique inverse qu'on note alors g−1 et g est alors également l'inverse de g−1.

Il n'est pas par contre automatique que g ∗ h = h ∗ g : le groupe n'est pasnécessairement commutatif. Dans la mesure où ses éléments seront généralementdes fonctions ou des matrices, il l'est même "rarement".

Démonstrations

1. Supposons deux neutres e et e′, alors e = e ∗ e′ car e′ est neutre ete′ = e ∗ e′ car e est neutre, donc e = e′

2. Si g admet deux inverses g1 et g2, g1 = g1 ∗ (g ∗g2) = (g1 ∗g)∗g2 = g2

Du côte topologique, on peut voir chacune des applications φi comme un sys-tème de coordonnées "plates" locales, puisqu'elles permettent d'associer "cor-rectement" à des points de la variétés des n-uplets de nombres. Il n'est pasdemandé qu'une seule de ces cartes permettent de naviguer toute la variété,seulement qu'on puisse naviguer en chaque point à l'aide d'une des cartes del'atlas (cf. l'axiome de recouvrement).

Dans cette interprétation, l'axiome de correspondance des cartes spéciequ'en les points qui sont repérés sur plusieurs de nos cartes, les voisinages sontcartographiés continûment (et même de manière lisse, sans introduire de sin-gularité) entre l'une et l'autre. Cela implique entre autres que les systèmes decoordonnées utilisent le même nombre de composantes (i.e. que toutes les ap-plications φi sont à valeur dans un même Rn), qui est appelé la dimension deG.

Le gain d'expressivité accordé est vu par exemple sur S2 la sphère creusede l'espace tridimensionnel. Elle n'est pas elle-même euclidienne mais pourtantune variété diérentielle, par exemple de cette manière : on peut appliquer undisque 2-dimensionnel (souple) sur l'hémisphère Nord (et dépasser un peu surle sud), de même sur l'hémisphère Sud et obtenir ainsi un atlas à deux cartes.Chacune de ces applications disque→hémisphère constitue (prise à l'envers) uneapplication de carte φ qui ressemble à une rectication d'une partie de la sphère.

De manière générale, les variétés sont ainsi les espaces "localement eucli-diens", et on peut à l'inverse voir "euclidien" comme une caractérisation dela platitude obtenue en redressant les cartes locales. La dimension de S2 ausens ci-dessus est alors 2, ce qui correspond à notre intuition que c'est un objet"planaire" même si on ne peut la voir que dans un espace tridimensionnel.

51

Exemples de groupes

• L'ensemble Z des entiers (positifs et négatifs) muni de l'addition usuelleest un groupe. L'inverse de n est −n, le neutre est 0.De même, Q (rationnels), R (réels) et C (complexes) sont des groupes pourl'addition, et Q∗,Q∗+,R∗,R∗+,C∗ en sont pour la multiplication (avec cettefois 1 pour neutre et 1

x pour inverse). N n'en est pas un, car il manque lesinverses.

• L'ensemble des sommets d'un n-gone est un groupe si on le voit ainsi :on numérote ses sommets de 0 à n− 1 lors d'un parcours complet de sonbord (qui xe une orientation), alors ajouter un sommet k à un sommetp donne le sommet obtenu à partir de p en suivant k arêtes dans le sensde parcours initial. Le neutre y est le sommet numéroté 0, et l'inverse dek le sommet n− k.Vu dans le n-gone régulier inscrit dans le cercle unité avec un sommet en(1, 0), c'est le groupe Un des racines n-ièmes de l'unité dans C. C'est aussile groupe de "congruence modulo n" Z

nZ . Il est donc commutatif et vériepar contre le fait nouveau ∀x, nx = 0 (or n 6= 0)

• Si E est un ensemble, alors l'ensemble BijE des bijections de E (i.e. ap-plications E → E inversibles) est un groupe muni de la composition.L'identité y est idE (x 7→ x) et l'inverse de f naturellement l'inverse ausens fonctionnel f−1

Cet exemple tient de même si on se limite à certaines classes de bijections(homéomorphismes, isomorphismes de groupes, isométries...). Le grouperésultant n'est PAS (forcément) commutatif.

• Un groupe plus abstrait : soient a et b deux éléments quelconques. Alorsl'ensemble Fa,b des mots de longueur nie en les caractères a, a−1, b, b−1

muni de la convention de "simplication" uaa−1v = ua−1av = ubb−1v =ub−1bv = uv (avec u, v des sous-mots) et de l'opération de concaténationest un groupe.L'identité y est le mot vide, et l'inverse d'un mot est le concaténé dansl'ordre inverse des éléments inverses (l'inverse de ab−1ba est a−1b−1ba−1)

B.2 Exemples de groupes de Lie

Le cercle est un groupe de Lie

Algébriquement, par analogie avec le n-gone précédent, on attribue à chaquepoint du cercle une mesure d'angle (entre 0 et 2π par exemple) le long d'unparcours, et alors ajouter le point de mesure α à celui de mesure θ donne le pointde mesure θ + α, où on prend l'égalité modulo l'amplitude de notre mesure (ici2π). Topologiquement, par analogie avec la 2-sphère, on recouvre le cercle pardeux segments recourbés (qui sont des parties de R à homéomorphisme près).

Ce groupe est SO2(R), le groupe des rotations du plan (muni de la composi-tion). Cela formalise ce que l'on peut paramétrer une rotation du plan par sonangle et que les relations algébriques et topologiques entre ces rotations sont re-étées par les relations entre les angles : deux rotations sont "proches" ssi ellessont "à peu près" de même angle ; eectuer successivement la rotation d'angle

52

θ et la rotation d'angle α revient à eectuer une seule fois la rotation d'angleθ + α.

Les groupes matriciels

Pour n ∈ N, on dispose deMn(R) l'ensemble des matrices réelles carrées de côtén, qui est muni d'une multiplication. Dans cet ensemble, on peut distinguerGLn(R) l'ensemble des matrices inversibles, qui forme lui un groupe pour cettemultiplication. L'identité y est la matrice In, nulle hors de la diagonale oùses coecients sont des 1, et l'inverse de M (au sens des groupes) est l'inversematriciel M−1 (son existence est assurée par dénition de GLn(R).

Vu autrement, GLn(R) correspond à la restriction des bijections aux bijec-tions linéaires de Rn dans notre exemple de groupe fonctionnel BijE .

Or GLn(R) est un ouvert de Mn(R) ∼= Rn2

en tant que det−1(R∗) (det(.),polynomiale, est continue). C'est donc a fortiori une variété diérentielle dedimension n2, et comme les opérations matricielles sont C∞ (il sut mêmequ'elles soient continues) GLn(R) est un groupe de Lie.

De plus, le théorème de Cartan-von Neumann assure qu'un sous-groupefermé d'un groupe de Lie est lui-même un groupe de Lie, et donc tout sous-groupe de GLn(R) déni par une "équation continue" est lui-même un groupede Lie. Par exemple :

• GL+n (R) = M ∈ GLn(R) | det(M) ≥ 0 le sous-groupe des matrices pos-

itives

• On(R) = M ∈ GLn(R) |M tM = In le groupe orthogonal

• SOn(R) = On(R)⋂GL+

n (R) le groupe spécial orthogonal

Il en est de même pour les groupes complexes (où on remplace Mn(R) parMn(C)) et leurs dérivés mais pour un intérêt moindre pour la robotique.

En particulier, les transformations rigides de l'espace Rn forment le groupespécial euclidien SEn(R) ∼= Rn × SOn(R) qui est donc un groupe de Lie.

B.3 Technicalités sur les groupes topologiques

Un autre grand intérêt de l'introduction des groupes de Lie est la facilité decalcul qu'ils apportent par l'introduction d'un espace tangent où la combinatoirese linéarise. En particulier, on obtient une combinaison nie de géodésique pourn'importe quelle trajectoire "atteignable". Nous allons ici démontrer rapidementce résultat.

On se place ici dans le contexte d'un groupe topologique G général, i.e. ungroupe muni d'une topologie pour laquelle la multiplication et l'inversion sontcontinues. Un groupe de Lie est donc a fortiori un groupe topologique.

Un sous-ensemble H de G est un sous-groupe s'il est lui-même un groupepour l'opération de G.

Proposition 6. Pour g ∈ G, la translation à gauche par g τg : g′ ∈ G 7→ gg′ ∈G est un homéomorphisme G→ GEn particulier, si U est un ouvert (resp. fermé) de G, gU = g ∗ u, u ∈ U estun ouvert (resp. fermé) de G

53

Démonstration. τg−1 est un inverse de τg, donc les applications sont bijectives.Par dénition d'un groupe topologique (continuité de la multiplication), ellessont continues, et sont donc des homéomorphismes.gU est l'image de U par τg qui conserve l'ouverture (resp. fermeture) en tantqu'homéomorphisme.

(Il en est bien sûr de même pour les translations à droite)

Proposition 7. Si H est un sous-groupe ouvert de G, alors il est fermé

Démonstration. Soit g ∈ G, si on a g′ ∈ H⋂gH alors ∃h, h′ ∈ H | g′ = h = gh′

donc g = hh′−1 ∈ H par stabilité de HEn particulier, si on choisit g ∈ G−H, H

⋂gH = ∅

Donc G −H =⋃g∈G−H gH est un ouvert comme réunion d'ouverts, et H est

un fermé comme complémentaire d'un ouvert.

Proposition 8. Si un sous-groupe H contient un ouvert U , alors H est ouvert

Démonstration. Si g ∈ H, alors ∀h ∈ U, gh ∈ H par stabilité de H : gU ⊂ HH contient de plus un voisinage de l'identité e : si on prend h ∈ U , alorsV = h−1U est ouvert et contient h−1h = eet alors

⋃g∈H gV = H donne que H est ouvert en tant qu'union d'ouverts.

Théorème 1. Supposons G connexeSoit U un ouvert non vide de G, HU le sous-groupe de G généré par les élémentsde U . Alors HU est G tout entier.

Démonstration. HU contient U un ouvert donc est ouvertHU est ouvert donc est ferméHU est ouvert et fermé, ce qui par connexité de G implique HU = ∅ ou HU = GComme U ⊂ HU , HU = G

Le résultat fondamental ici est que si on dispose localement de tous leséléments à un seul endroit du groupe (qui en pratique sera forcément connexepour les besoins de l'exploration motrice), alors par combinaison nie de ceséléments on a en fait accès au groupe entier. Géométriquement, en voyant Gcomme une "surface" (peu importe sa dimension) et ses éléments g comme desèches reliant e à g, il nous assure que si on prend un voisinage de èches del'origine e alors on peut atteindre tous les points de la surface en mettant unnombre ni de èches bout à bout.

C'est donc en l'essence le résultat de décomposition géodésique des groupesde Lie, où la structure additionnelle apportée par la topologie diérentielle per-met de préciser la nature des èches à sélectionner.

B.4 Algèbre de Lie

Dénition 4. Une algèbre de Lie g est un K-espace vectoriel muni d'un crochetde Lie, i.e. une opération [., .] : g× g→ g vériant

• bilinéarité : ∀λ ∈ K,x, y, z ∈ g, [λx+y, z] = λ[x, z]+ [y, z] et [x, λy+z] =λ[x, y] + [x, z]

• antisymétrie : ∀x, y ∈ g, [x, y] = −[y, x]

54

• identité de Jacobi : ∀x, y, z ∈ g, [x, [y, z]] + [z, [x, y]] + [y, [z, x]] = 0

Deux éléments x, y de g commutent si et seulement si [x, y] = 0.Chaque groupe de Lie G est muni d'une unique algèbre de Lie g qui permet

de calculer sur la structure locale du groupe. La construction générale de cettealgèbre est trop technique pour être rappelée ici, nous mentionnons juste quel'espace vectoriel sous-jacent à g est l'espace tangent à l'identité de G, i.e. TeG.

Il est possible d'établir des correspondances relativement précises entre groupesde Lie et algèbres de Lie. En particulier, tout morphisme de groupes de Lieinduit un morphisme d'algèbres de Lie, et tout morphisme d'algèbre de Lie as-sociées à des groupes de Lie raisonnables (en ce qui concerne leur connexité)vient d'un morphisme de groupes de Lie.

De là, il découle l'existence d'une application exp : g→ G qui informellementassocie au vecteur v ∈ g le point de G atteint si l'on suit pendant un temps uni-taire la géodésique partant de e le long de v. Cette application n'est en généralni injective ni surjective, mais elle induit un diéomorphisme d'un voisinage Ude 0g sur un voisinage V de eG . Elle est donc a fortiori surjective sur V .

Il ne nous reste alors plus qu'à obtenir le résultat de décomposition "rec-tiligne" :

Théorème 2. Soit G un groupe de Lie connexe, d'algèbre de Lie gPour tout g ∈ G, ∃n ∈ N, d1, ..., dn ∈ gn | g = exp(dn)... exp(d1)

Démonstration. Puisque exp est surjective sur un ouvert V de G, le groupe Gexp

engendré par les exp(v) (v ∈ g) contient au moins le groupe engendré par leséléments de V , et donc via le théorème précédent Gexp = GOr tout élément de Gexp peut être écrit comme combinaison nie de ses généra-teurs exp(v) pour donner la décomposition annoncée

B.5 Décomposition minimale et récurrence

Si le résultat précédent assure de l'existence d'une décomposition nie pourchaque élément du groupe, il ne précise pas en revanche combien de segmentsdoivent être empruntées pour atteindre la destination ou même de borne supérieurepour l'ensemble du groupe.

D'après la démonstration, on peut s'attendre à une décomposition de laforme exp(tinein)... exp(ti1ei1), mais sans hypothèse supplémentaire la simpli-cation est impossible. En revanche, si G est commutatif (ou plutôt si tousces éléments commutent, mais cela y revient) on peut par exemple modierdes motifs exp(d1) exp(d2) exp(d3) = exp(t1e1) exp(t2e2) exp(t3e1) en exp((t1 +t3)e1) exp(t2e2) = exp(d′1) exp(d2). Au nal, les décompositions requièrent alorsau maximum dim g segments suivant les vecteurs de base.D'après la démonstration, on peut s'attendre à une décomposition de la formeexp(tinein)... exp(ti1ei1), mais sans hypothèse supplémentaire la simplicationest impossible. En revanche, si G est commutatif (ou plutôt si tous ces élé-ments commutent, mais cela y revient) on peut par exemple modier des motifsexp(d1) exp(d2) exp(d3) = exp(t1e1) exp(t2e2) exp(t3e1) en exp((t1+t3)e1) exp(t2e2) =exp(d′1) exp(d2). Au nal, les décompositions requièrent alors au maximumdim g segments suivant les vecteurs de base.Comme la commutation n'est pas à l'ordre du jour (les groupes de Lie obtenus

55

sont très pauvres), l'existence d'une telle borne reste à déterminer, sachantqu'elle est du moins plausible sur SO3(R) par exemple.

56

Bibliography

[AWP+17] Marie Amalric, Liping Wang, Pierre Pica, Santiago Figueira, Mari-ano Sigman, and Stanislas Dehaene. The language of geometry : fastcomprehension of geometrical primitives and rules in human adultsand preschoolers. PLoS Computational Biology, Janvier 2017.

[ByR72] Paul Bach-y Rita. Brain mechanisms in sensory substitution. Aca-demic Presses, 1972.

[Gib86] James Gibson. The Ecological Approach To Visual Perception.Lawrence Erlbaum Associates, 1986.

[HH63] Richard Held and Alan Hein. Movement-produced stimulation in thedevelopment of visually guided behavior. J Comp Physiol Psychol,1963.

[Laf13] Alban Laaquiere. Approche sensorimotrice de la perception del'espace pour la robotique autonome. These de doctorat, UniversitePierre et Marie Curie, 2013.

[LCG16] Gurvan Le Clec'h and J. Kevin Gas, Bruno ANS O'Regan. Acqui-sition of a space representation by a naive agent from sensorimotorinvariance and proprioceptive compensation. International Journalof Advanced Robotic Systems, Novembre 2016.

[LOT+15] Alban Laaquiere, J. Kevin O'Regan, Alexander V. Terekhov,Bruno Gas, and Sylvain Argentieri. Learning agent's spatial con-guration from sensorimotor invariants. Robotics and AutonomousSystems, Janvier 2015.

[MGA16] Valentin Marcel, Bruno Gas, and Sylvain Argentieri. Building asensorimotor representation of a naive agent's tactile space. IEEETransactions on Cognitive and Developmental Systems, Janvier2016.

[NO01] A Noe and J. Kevin O'Regan. A sensorimotor account of vision andvisual consciousness. Behavioral and Brain Sciences, Octobre 2001.

[OT16] J. Kevin O'Regan and Alexander V Terekhov. Space as an inventionof active agents. Frontiers in Robotics, Mars 2016.

[Pia37] Jean Piaget. La construction du reel chez l'enfant. Delachaux etNiestle, 1937.

57

[Pia48] Jean Piaget. La representation de l'espace chez l'enfant. Pressesuniversitaires de France, 1948.

[PNO03] David Philipona, Jean-Pierre Nadal, and J. Kevin O'Regan. Is theresomething out there ? inferring space from sensorimotor dependen-cies. Neural Computation, Septembre 2003.

[Poi95] Henri Poincare. L'espace et la geometrie. Revue de Metaphysique etde Morale, 1895.

58