1. CESAR ALFONSO CHARRIA IVAN MAURICIO MELO DIDIER AUGUSTO
FERIA CARLOS ANDRES LOPEZ
2.
3.
Determinar la forma de medir el xito.
Descripcin del entorno.
Descripcin de sensores.
Descripcin de actuadores del agente.
4.
Son criterios que determinan el xito del comportamiento del
agente.
Genera una secuencia de acciones de acuerdo con las
percepciones que recibe, sta secuencia de acciones hace que su
hbitat pase por una secuencia de estados.
Si la secuencia es deseada el agente habr actuado
correctamente.
5.
La medida de rendimiento que define el criterio de xito.
El conocimiento del medio en el que habita.
Las acciones que el agente puede llevar a cabo.
La secuencia de percepciones del agente hasta ese momento.
6.
Debe emprender aquella accin que supuestamente maximice su
medida de rendimiento, basndose en las evidencias aportadas por la
secuencia de percepciones y en el conocimiento que el agente
mantiene almacenado.
7.
Un agente omnisciente conoce el resultado de su accin y acta de
acuerdo con l, sin embargo la omnisciencia realmente no es
posible.
La racionalidad no es lo mismo que la perfeccin.
La racionalidad maximiza el rendimiento esperado y la perfeccin
maximiza el resultado real.
8.
Son los problemas para los cuales los agentes racionales son
las soluciones:
Se especifica el entorno de trabajo, ilustrando el trabajo con
varios ejemplos.
Se evidencia que el entorno de trabajo ofrece diferentes
posibilidades que influyen en el diseo del programa del
agente.
9.
El primer paso siempre debe ser especificar un entorno de
trabajo de la manera mas completa posible.
Tipo de agente Medidas de rendimiento Entorno Actuadores Sensores
Taxista Seguro, rpido, legal, viaje confortable, maximizacin del
beneficio. Carreteras, trafico, peatones, clientes. Direccin,
acelerador, freno, seal, bocina, visualizador. Cmaras, sonar,
velocmetro, GPS, tacmetro, visualizador de aceleracin, sensores del
motor, teclado.
10.
No importa entre un medio real y artificial sino la complejidad
de la relacin entre:
11.
Integran medios y funciones de gran complejidad, que en gran
medida estn orientados a operar en tiempo real, que deben elegir
entre un gran espectro de posibilidades de operacin la que mas se
ajuste a la solucin del problema.
12.
Los entornos de trabajo en los cuales se implementa la IA es
muy amplio, en donde se pueden identificar cierto numero de
dimensiones, donde se categorizan los entornos, que hasta cierto
punto determinan el diseo mas adecuado para el agente y las
principales tcnicas de implementacin.
13.
Totalmente observables: cuando los sensores del agente detectan
todos los aspectos relevantes del entorno en la toma de decisiones,
dependientes de las medidas de rendimiento.
Parcialmente observables: cuando hay existencia de sensores
poco exactos o porque no reciben informacin por parte del
sistema.
14.
Determinista: es cuando el siguiente estado del medio esta
condicionado por el estado actual y la accin ejecutada por el
agente.
Estocstico: si el medio es parcialmente observable; cuando se
hace difcil mantener constancia de todos los aspectos
observados.
Estratgico: si el medio es determinista excepto para las
acciones de otros agentes.
15.
Episdico: consiste en la percepcin del agente y la realizacin
de una nica accin posterior que no depende de un episodio previo,
ni afecta a un episodio futuro.
Secuencial: la decisin presente afecta las decisiones futuras.
Son mas complejos que los episdicos porque hay que pensar con
ciertos limites de tiempo
16.
Esttico: cuando los medios son constantes no cambiantes son mas
fciles de tratar porque el agente no necesita contemplar en todo
momento el mundo mientras decide, ni el paso del tiempo.
Dinmico: el entorno es cambiante cuando el agente esta
deliberando, en donde se esta indagando constantemente sobre el Qu
hacer?
Semi-dinmico: cuando el entorno no cambia, mas si el
rendimiento.
17.
Discreto: cuando existe un numero finito de estados, acciones y
percepciones.
Continuo: cuando no existe un numero finito de estados,
acciones y percepciones.
Individual: cuando los estados, acciones y percepciones de un
entorno estn dados por un solo agente.
Multi-agente: cuando los estados, acciones y percepciones de un
entorno estn dados por dos o mas agentes. Pueden ser competitivos y
cooperativos.
18.
Cuando todas las reglas o normativas de un entorno no estn
explicitas, se reduce la posibilidad de determinar que tan
observable es.
Las dimensiones del entorno de trabajo, se definen
netamente
19.
Se hace una simulacin de la realidad para generar o proponer
agentes que solventen los problemas presentados en diversos
escenarios y el generador de entornos selecciona hbitats
particulares.
20.
El trabajo de la IA es disear el programa del agente que
implemente la funcin del agente que proyecta las percepciones en
las acciones.
Se asume que este programa se ejecutara en algn tipo de
computador lo cual se conoce como arquitectura.
Agente = arquitectura + programa
21.
Los programas de los agentes se describen con la ayuda de un
sencillo lenguaje de pseudocdigo.
Funcin AGENTE-DIRIGIDO-MEDIANTE-TABLA(percepcin) devuelve una
accin
variables estticas: percepciones , una secuencia, vaca
inicialmente
tabla, una tabla de acciones, indexada por las secuencias de
percepciones, totalmente definida inicialmente.
aadir la percepcin al final de las percepciones
accin CONSULTA( percepciones, tabla)
devolver accin
El programa AGENTE-DIRIGIDO-MEDIANTE-TABLA se invoca con cada nueva
percepcin y devuelve una accin en cada momento. Almacena la
secuencia de percepciones utilizando su propia estructura de datos
privada.
22.
Para construir un agente racional de esta forma, los diseadores
debe realizar una tabla que contenga las acciones apropiadas para
cada secuencia posible.
Por esto se puede observa que esta propuesta esta condenada al
fracaso porque:
No hay agente que tenga espacio suficiente para almacenar la
tabla.
El diseador no tendr tiempo de crear la tabla.
Ningn agente podr aprender todas las entradas de la tabla a
partir de su experiencia.
23.
Es el tipo de agente mas sencillo. Basa sus acciones en las
percepciones actuales, ignorando el resto de las percepciones
histricas.
Tiene la admirable propiedad de ser simples, pero posee una
inteligencia muy limitada.
24. Actuadores Medio ambiente Agente Sensores Cmo es el mundo
ahora Qu accin debo tomar ahora Reglas de condicin-accin
Actuadores
25.
Debe mantener algn tipo de estado interno que dependa de la
historia percibida.
La actualizacin del estado interno requiere codificar 2 tipos
de conocimiento:
Se necesita alguna informacin acerca de cmo evoluciona el
mundo.
Se necesita informacin sobre como afecta al mundo las acciones
del agente.
26.
El conocimiento acerca de cmo funciona el mundo se denomina
modelo del mundo.
Un agente que utilice estos modelos es un agente basado en
modelos.
Este modelo nos muestra como la percepcin actual se combina con
el estado interno antiguo para generar la descripcin actualizada
del estado actual.
27. Actuadores Estado Cmo evoluciona el mundo Qu efectos causan
mis acciones Medio ambiente Agente Sensores Cmo es el mundo ahora
Qu accin debo tomar ahora Reglas de condicin-accin Actuadores
28.
El agente necesita algn tipo de informacin sobre su meta que
describa las situaciones que son deseables.
La seleccin de acciones basadas en objetivos es directa, cuando
alcanzar los objetivos es el resultado inmediato de una accin
individual.
En otras ocasiones, puede ser mas complicado, cuando el agente
tiene que considerar secuencias complejas.
29. Actuadores Estado Cmo evoluciona el mundo Qu efectos causan
mis acciones Qu pasar si realizo la accin A Medio ambiente Agente
Sensores Cmo es el mundo ahora Qu accin debo llevar a cabo ahora
Objetivos Actuadores
30.
Una funcin de utilidad proyecta un estado(o secuencia de
estados) en un numero real, que representa un nivel de
felicidad.
Permite tomar decisiones racionales en dos tipos de casos en
los que las metas son inadecuadas:
Cuando haya objetivos conflictivos.
Cuando haya varios objetivos por los que se pueda guiar el
agente.
31. Actuadores Estado Cmo evoluciona el mundo Qu efectos causan
mis acciones Qu pasar si realizo la accin A Estar contento con este
estado Medio ambiente Agente Sensores Cmo es el mundo ahora Qu
accin debo llevar a cabo ahora Utilidad Actuadores
32.
Se propone construir maquinas que aprendan y despus
ensearlas.
El aprendizaje permite que el agente opere en medios
inicialmente desconocidos y que sea mas competente que si slo
utilizara un conocimiento inicial.
33.
Se puede dividir en cuatro componentes conceptuales:
Elemento de aprendizaje , esta responsabilizado de hacer
mejoras.
Elemento de actuacin , esta responsabilizado de la seleccin de
acciones externas.
Crticas , realimenta el elemento de aprendizaje y determina
como se debe modificar el elemento de actuacin para proporcionar
mejores resultados en el futuro.
Generador de problemas , responsable de sugerir acciones que lo
guiaran hacia experiencias nuevas e informativas.
34. Actuadores Elemento de aprendizaje Generador de problemas
Nivel de actuacin Retroalimentacin Objetivos a aprender Cambios
Conocimiento Medio ambiente Agente Sensores Elemento de actuacin
Crtica Actuadores
35.
En conclusin podemos decir que:
Los agentes reactivos simples responden directamente a las
percepciones.
Los agentes reactivos basados en modelos mantienen un estado
interno que les permite seguir el rastro de aspectos del mundo que
no son evidentes.
Los agentes basados en objetivos actan con la intencin de
alcanzar una meta.
Los agentes basados en utilidad intenta maximizar su felicidad
deseada.
Todos los agentes pueden mejorar su eficacia con la ayuda de
mecanismos de aprendizaje.