Plan Agents et environnements Rationalit PEAS (Performance
measure, Environment, Actuators, Sensors) Types denvironnement
Types dagent 2
Page 3
Agents Un agent est une entit quelconque qui peut percevoir son
environnement via des senseurs et agir sur lenvironnement via des
actuateurs Agent humain: yeux, oreilles, et dautres organes
senseurs; mains, jambes, Bouche et dautres membres comme actuateurs
Agent robotique: cameras et tlmtre infrarouge comme senseurs;
diffrents moteurs comme actuateurs 3
Page 4
Agents et environnements Une fonction agent mappe des histoire
de perception actions: [f: P* A ] Un programme agent fonctionne sur
une architecture physique pour produire f agent = architecture +
programme 4
Page 5
Le monde de laspirateur Perus: localisation et contenus, e.g.,
[A,Dirty] Actions: Left, Right, Suck, NoOp 5
Page 6
Un agent aspirateur 6
Page 7
Agents rationnels Un agent doit se forcer faire des choses
justes, base sur ce quil peroit et des actions quil peut effectuer.
Laction juste est celle qui cause le succs de lagent Mesure de
performance: Un critre objectif de succs pour un comportement
dagent E.g., mesure de performance pour un agent aspirateur peut
tre le volume de salet ramasse, le temps pris, llectricit consomme,
le bruit produit, etc. 7
Page 8
Agents rationnels Agent rationnel: Pour chaque squence de
perceptions, un agent rationnel doit toujours choisir une action
qui peut maximiser la mesure de performance, tant donn les vidences
fournies par la squence de perceptions et ventuellement des
connaissances que lagent possde. 8
Page 9
Agents rationnels La rationalit est diffrente de lomniscience
(tout savoir avec des connaissances sans limite) Un agent peut
excuter une action pour modifier des perceptions futures afin
dobtenir des informations utiles (collecte des information,
exploration) Un agent est autonome si son comportement est dtermin
par sa propre exprience (avec la capacit dapprendre et de sadapter)
9
Page 10
PEAS PEAS: Performance measure, Environment, Actuators, Sensors
Doit dabord spcifier le contexte dans lequel lagent intelligent est
dvelopp Considrer, e.g., la tche de dvelopper un conducteur
automatique de taxi: Mesure de performance Environnement Actuateurs
Senseurs 10
Page 11
PEAS Doit dabord spcifier le contexte dans lequel lagent
intelligent est dvelopp Considrer, e.g., la tche de dvelopper un
conducteur automatique de taxi: Mesure de performance: scurit,
rapide, lgal, confortable, maximiser le profit Environnement:
route, autre trafic, pitons, clients Actuateurs: volant,
acclrateur, frein, signal, klaxon Senseurs: Cameras, sonar, tableau
de bord, GPS 11
Page 12
PEAS Agent: Systme de diagnostic mdical Mesures de performance:
sant de patient, minimiser les cots, poursuite judiciaire
Environnement: Patient, hpital, personnel Actuateurs: affichage sur
lcran (questions, tests, diagnostics, traitements, rfrences)
Senseurs: clavier(entrer les symptmes, observations, rponses du
patient) 12
Page 13
PEAS Agent: robot pour ranger des pices Mesure de performance:
Pourcentage de pices mises dans des botes correctes Environnement:
Convoyeur de pices, botes Actuateurs: bras mcanique Senseurs:
Camera, senseurs des angles 13
Page 14
PEAS Agent: Tuteur interactive danglais Mesures de performance:
Maximiser le score de test de ltudiant Environnement: ensemble des
tudiants Actuateurs: Affichages sur lcran (exercices, suggestions,
corrections) Senseurs: clavier 14
Page 15
Types denvironnement Compltement observable (vs. partiellement
observable): Les senseurs dun agent peuvent accder ltat complet de
lenvironnement chaque moment. Dterministe (vs. stochastique): Le
prochain tat est compltement dtermin par ltat actuel et laction
excute par lagent. Si lenvironnement est dterministe sauf pour les
actions dautres agents, alors lenvironnement est stratgique.
pisodique (vs. squentiel): Lexprience de lagent est divise en
pisodes atomiques (chaque pisode contient des perceptions de lagent
et une seule action) et le choix de laction dans chaque pisode est
indpendant des autres pisodes. 15
Page 16
Types denvironnement Statique (vs. dynamique): Lenvironnement
est inchang quand lagent rflchit. Lenvironnement est semidynamique
si lenvironnement lui-mme ne change pas avec le temps, mais le
score de performance change. Discret (vs. continu): Un nombre limit
de perus et dactions distincts et clairement dfinis. mono agent
(vs. multiagent): Un seul agent agit sur lenvironnement. 16
Page 17
Types denvironnement checs avec checs sans Conducteur horloge
horloge de taxi Compltement observableouiouiNon
DterministeStratgiqueStratgiqueNon pisodique NonNonNon Statique
Semioui Non Discretoui ouiNon Mono agentNonNonNon Le type
denvironnement dtermine largement la conception de lagent Le monde
rel est partiellement observable, stochastique, squentiel,
dynamique, continu et multiagent. 17
Page 18
Fonctions et programmes dagent Un agent est spcifi compltement
par la fonction dagent qui mappe la squence de perus aux actions
Une fonction dagent (ou une petite classe dquivalence) est
rationnelle But: trouver une faon dimplanter la fonction dagent
rationnelle de faon concise 18
Page 19
Agent qui cherche dans une table function
Table-Driven-Agent(percept) returns an action persistent: percepts,
a sequence, initially empty table, a table of actions, indexed by
percept sequences, initially fully specified append percept to the
end of percepts action Lookup(percepts, table) return action
Inconvnients: Table norme Prend longtemps pour construire la table
Pas dautonomie Longtemps pour apprendre les entres de la table, mme
avec lapprentissage 19
Page 20
Types dagent 4 types de base dans lordre de gnralit: Agents
reflex simples Agents reflex bass sur modle Agents bas sur but
Agents bas sur utilit 20
Page 21
Agents reflex simples 21
Page 22
Agents reflex simples function Simple-Reflex-Agent(percept)
returns an action persistent: rules, a set of condition-action
rules state Interpret-Input(percept) rule Rule-Match(state, rules)
action rule.Action return action 22