26
Agents intelligents Chap. 2 1

Agents intelligents Chap. 2 1. Plan Agents et environnements Rationalité PEAS (Performance measure, Environment, Actuators, Sensors) Types denvironnement

Embed Size (px)

Citation preview

  • Page 1
  • Agents intelligents Chap. 2 1
  • Page 2
  • Plan Agents et environnements Rationalit PEAS (Performance measure, Environment, Actuators, Sensors) Types denvironnement Types dagent 2
  • Page 3
  • Agents Un agent est une entit quelconque qui peut percevoir son environnement via des senseurs et agir sur lenvironnement via des actuateurs Agent humain: yeux, oreilles, et dautres organes senseurs; mains, jambes, Bouche et dautres membres comme actuateurs Agent robotique: cameras et tlmtre infrarouge comme senseurs; diffrents moteurs comme actuateurs 3
  • Page 4
  • Agents et environnements Une fonction agent mappe des histoire de perception actions: [f: P* A ] Un programme agent fonctionne sur une architecture physique pour produire f agent = architecture + programme 4
  • Page 5
  • Le monde de laspirateur Perus: localisation et contenus, e.g., [A,Dirty] Actions: Left, Right, Suck, NoOp 5
  • Page 6
  • Un agent aspirateur 6
  • Page 7
  • Agents rationnels Un agent doit se forcer faire des choses justes, base sur ce quil peroit et des actions quil peut effectuer. Laction juste est celle qui cause le succs de lagent Mesure de performance: Un critre objectif de succs pour un comportement dagent E.g., mesure de performance pour un agent aspirateur peut tre le volume de salet ramasse, le temps pris, llectricit consomme, le bruit produit, etc. 7
  • Page 8
  • Agents rationnels Agent rationnel: Pour chaque squence de perceptions, un agent rationnel doit toujours choisir une action qui peut maximiser la mesure de performance, tant donn les vidences fournies par la squence de perceptions et ventuellement des connaissances que lagent possde. 8
  • Page 9
  • Agents rationnels La rationalit est diffrente de lomniscience (tout savoir avec des connaissances sans limite) Un agent peut excuter une action pour modifier des perceptions futures afin dobtenir des informations utiles (collecte des information, exploration) Un agent est autonome si son comportement est dtermin par sa propre exprience (avec la capacit dapprendre et de sadapter) 9
  • Page 10
  • PEAS PEAS: Performance measure, Environment, Actuators, Sensors Doit dabord spcifier le contexte dans lequel lagent intelligent est dvelopp Considrer, e.g., la tche de dvelopper un conducteur automatique de taxi: Mesure de performance Environnement Actuateurs Senseurs 10
  • Page 11
  • PEAS Doit dabord spcifier le contexte dans lequel lagent intelligent est dvelopp Considrer, e.g., la tche de dvelopper un conducteur automatique de taxi: Mesure de performance: scurit, rapide, lgal, confortable, maximiser le profit Environnement: route, autre trafic, pitons, clients Actuateurs: volant, acclrateur, frein, signal, klaxon Senseurs: Cameras, sonar, tableau de bord, GPS 11
  • Page 12
  • PEAS Agent: Systme de diagnostic mdical Mesures de performance: sant de patient, minimiser les cots, poursuite judiciaire Environnement: Patient, hpital, personnel Actuateurs: affichage sur lcran (questions, tests, diagnostics, traitements, rfrences) Senseurs: clavier(entrer les symptmes, observations, rponses du patient) 12
  • Page 13
  • PEAS Agent: robot pour ranger des pices Mesure de performance: Pourcentage de pices mises dans des botes correctes Environnement: Convoyeur de pices, botes Actuateurs: bras mcanique Senseurs: Camera, senseurs des angles 13
  • Page 14
  • PEAS Agent: Tuteur interactive danglais Mesures de performance: Maximiser le score de test de ltudiant Environnement: ensemble des tudiants Actuateurs: Affichages sur lcran (exercices, suggestions, corrections) Senseurs: clavier 14
  • Page 15
  • Types denvironnement Compltement observable (vs. partiellement observable): Les senseurs dun agent peuvent accder ltat complet de lenvironnement chaque moment. Dterministe (vs. stochastique): Le prochain tat est compltement dtermin par ltat actuel et laction excute par lagent. Si lenvironnement est dterministe sauf pour les actions dautres agents, alors lenvironnement est stratgique. pisodique (vs. squentiel): Lexprience de lagent est divise en pisodes atomiques (chaque pisode contient des perceptions de lagent et une seule action) et le choix de laction dans chaque pisode est indpendant des autres pisodes. 15
  • Page 16
  • Types denvironnement Statique (vs. dynamique): Lenvironnement est inchang quand lagent rflchit. Lenvironnement est semidynamique si lenvironnement lui-mme ne change pas avec le temps, mais le score de performance change. Discret (vs. continu): Un nombre limit de perus et dactions distincts et clairement dfinis. mono agent (vs. multiagent): Un seul agent agit sur lenvironnement. 16
  • Page 17
  • Types denvironnement checs avec checs sans Conducteur horloge horloge de taxi Compltement observableouiouiNon DterministeStratgiqueStratgiqueNon pisodique NonNonNon Statique Semioui Non Discretoui ouiNon Mono agentNonNonNon Le type denvironnement dtermine largement la conception de lagent Le monde rel est partiellement observable, stochastique, squentiel, dynamique, continu et multiagent. 17
  • Page 18
  • Fonctions et programmes dagent Un agent est spcifi compltement par la fonction dagent qui mappe la squence de perus aux actions Une fonction dagent (ou une petite classe dquivalence) est rationnelle But: trouver une faon dimplanter la fonction dagent rationnelle de faon concise 18
  • Page 19
  • Agent qui cherche dans une table function Table-Driven-Agent(percept) returns an action persistent: percepts, a sequence, initially empty table, a table of actions, indexed by percept sequences, initially fully specified append percept to the end of percepts action Lookup(percepts, table) return action Inconvnients: Table norme Prend longtemps pour construire la table Pas dautonomie Longtemps pour apprendre les entres de la table, mme avec lapprentissage 19
  • Page 20
  • Types dagent 4 types de base dans lordre de gnralit: Agents reflex simples Agents reflex bass sur modle Agents bas sur but Agents bas sur utilit 20
  • Page 21
  • Agents reflex simples 21
  • Page 22
  • Agents reflex simples function Simple-Reflex-Agent(percept) returns an action persistent: rules, a set of condition-action rules state Interpret-Input(percept) rule Rule-Match(state, rules) action rule.Action return action 22
  • Page 23
  • Agents reflex bass sur modle 23
  • Page 24
  • Agents reflex bass sur but 24
  • Page 25
  • Agents bass sur utilit 25
  • Page 26
  • Agents avec apprentissage 26