Agents intelligents Chap. 2 1. Plan Agents et environnements Rationalité PEAS (Performance measure,...
Preview:
Citation preview
- Page 1
- Agents intelligents Chap. 2 1
- Page 2
- Plan Agents et environnements Rationalit PEAS (Performance
measure, Environment, Actuators, Sensors) Types denvironnement
Types dagent 2
- Page 3
- Agents Un agent est une entit quelconque qui peut percevoir son
environnement via des senseurs et agir sur lenvironnement via des
actuateurs Agent humain: yeux, oreilles, et dautres organes
senseurs; mains, jambes, Bouche et dautres membres comme actuateurs
Agent robotique: cameras et tlmtre infrarouge comme senseurs;
diffrents moteurs comme actuateurs 3
- Page 4
- Agents et environnements Une fonction agent mappe des histoire
de perception actions: [f: P* A ] Un programme agent fonctionne sur
une architecture physique pour produire f agent = architecture +
programme 4
- Page 5
- Le monde de laspirateur Perus: localisation et contenus, e.g.,
[A,Dirty] Actions: Left, Right, Suck, NoOp 5
- Page 6
- Un agent aspirateur 6
- Page 7
- Agents rationnels Un agent doit se forcer faire des choses
justes, base sur ce quil peroit et des actions quil peut effectuer.
Laction juste est celle qui cause le succs de lagent Mesure de
performance: Un critre objectif de succs pour un comportement
dagent E.g., mesure de performance pour un agent aspirateur peut
tre le volume de salet ramasse, le temps pris, llectricit consomme,
le bruit produit, etc. 7
- Page 8
- Agents rationnels Agent rationnel: Pour chaque squence de
perceptions, un agent rationnel doit toujours choisir une action
qui peut maximiser la mesure de performance, tant donn les vidences
fournies par la squence de perceptions et ventuellement des
connaissances que lagent possde. 8
- Page 9
- Agents rationnels La rationalit est diffrente de lomniscience
(tout savoir avec des connaissances sans limite) Un agent peut
excuter une action pour modifier des perceptions futures afin
dobtenir des informations utiles (collecte des information,
exploration) Un agent est autonome si son comportement est dtermin
par sa propre exprience (avec la capacit dapprendre et de sadapter)
9
- Page 10
- PEAS PEAS: Performance measure, Environment, Actuators, Sensors
Doit dabord spcifier le contexte dans lequel lagent intelligent est
dvelopp Considrer, e.g., la tche de dvelopper un conducteur
automatique de taxi: Mesure de performance Environnement Actuateurs
Senseurs 10
- Page 11
- PEAS Doit dabord spcifier le contexte dans lequel lagent
intelligent est dvelopp Considrer, e.g., la tche de dvelopper un
conducteur automatique de taxi: Mesure de performance: scurit,
rapide, lgal, confortable, maximiser le profit Environnement:
route, autre trafic, pitons, clients Actuateurs: volant,
acclrateur, frein, signal, klaxon Senseurs: Cameras, sonar, tableau
de bord, GPS 11
- Page 12
- PEAS Agent: Systme de diagnostic mdical Mesures de performance:
sant de patient, minimiser les cots, poursuite judiciaire
Environnement: Patient, hpital, personnel Actuateurs: affichage sur
lcran (questions, tests, diagnostics, traitements, rfrences)
Senseurs: clavier(entrer les symptmes, observations, rponses du
patient) 12
- Page 13
- PEAS Agent: robot pour ranger des pices Mesure de performance:
Pourcentage de pices mises dans des botes correctes Environnement:
Convoyeur de pices, botes Actuateurs: bras mcanique Senseurs:
Camera, senseurs des angles 13
- Page 14
- PEAS Agent: Tuteur interactive danglais Mesures de performance:
Maximiser le score de test de ltudiant Environnement: ensemble des
tudiants Actuateurs: Affichages sur lcran (exercices, suggestions,
corrections) Senseurs: clavier 14
- Page 15
- Types denvironnement Compltement observable (vs. partiellement
observable): Les senseurs dun agent peuvent accder ltat complet de
lenvironnement chaque moment. Dterministe (vs. stochastique): Le
prochain tat est compltement dtermin par ltat actuel et laction
excute par lagent. Si lenvironnement est dterministe sauf pour les
actions dautres agents, alors lenvironnement est stratgique.
pisodique (vs. squentiel): Lexprience de lagent est divise en
pisodes atomiques (chaque pisode contient des perceptions de lagent
et une seule action) et le choix de laction dans chaque pisode est
indpendant des autres pisodes. 15
- Page 16
- Types denvironnement Statique (vs. dynamique): Lenvironnement
est inchang quand lagent rflchit. Lenvironnement est semidynamique
si lenvironnement lui-mme ne change pas avec le temps, mais le
score de performance change. Discret (vs. continu): Un nombre limit
de perus et dactions distincts et clairement dfinis. mono agent
(vs. multiagent): Un seul agent agit sur lenvironnement. 16
- Page 17
- Types denvironnement checs avec checs sans Conducteur horloge
horloge de taxi Compltement observableouiouiNon
DterministeStratgiqueStratgiqueNon pisodique NonNonNon Statique
Semioui Non Discretoui ouiNon Mono agentNonNonNon Le type
denvironnement dtermine largement la conception de lagent Le monde
rel est partiellement observable, stochastique, squentiel,
dynamique, continu et multiagent. 17
- Page 18
- Fonctions et programmes dagent Un agent est spcifi compltement
par la fonction dagent qui mappe la squence de perus aux actions
Une fonction dagent (ou une petite classe dquivalence) est
rationnelle But: trouver une faon dimplanter la fonction dagent
rationnelle de faon concise 18
- Page 19
- Agent qui cherche dans une table function
Table-Driven-Agent(percept) returns an action persistent: percepts,
a sequence, initially empty table, a table of actions, indexed by
percept sequences, initially fully specified append percept to the
end of percepts action Lookup(percepts, table) return action
Inconvnients: Table norme Prend longtemps pour construire la table
Pas dautonomie Longtemps pour apprendre les entres de la table, mme
avec lapprentissage 19
- Page 20
- Types dagent 4 types de base dans lordre de gnralit: Agents
reflex simples Agents reflex bass sur modle Agents bas sur but
Agents bas sur utilit 20
- Page 21
- Agents reflex simples 21
- Page 22
- Agents reflex simples function Simple-Reflex-Agent(percept)
returns an action persistent: rules, a set of condition-action
rules state Interpret-Input(percept) rule Rule-Match(state, rules)
action rule.Action return action 22
- Page 23
- Agents reflex bass sur modle 23
- Page 24
- Agents reflex bass sur but 24
- Page 25
- Agents bass sur utilit 25
- Page 26
- Agents avec apprentissage 26