Upload
humberto-chalate-jorge
View
132
Download
8
Embed Size (px)
Citation preview
INSTITUTO TECNOLÓGICO de Tuxtepec
“Inteligencia Artificial.”
Unidad V Aplicaciones con Técnicas de IA.
5.2. Redes Neuronales (RN).
PRESENTA:
Chalate Jorge Humberto
SEMESTRE:
8° “A”
ESPECIALIDAD:
INGENIERÍA EN SISTEMAS COMPUTACIONALES
DOCENTE:
M.S.C. TOMÁS TORRES RAMÍREZ
S.E.P D.G.E.S.T S.N.E.S.T
ISC – 2015/01 Tuxtepec, Oax. martes, 12 de mayo de 2015
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 2 | 16
CONTENIDO
INTRODUCCIÓN. ............................................................................................................................................................. 3
5.2. REDES NEURONALES (RN). ..................................................................................................................................... 4
¿Qué entendemos por Red Neuronal Artificial? .......................................................................................................... 4
Redes Neuronales de tipo Biológico. .......................................................................................................................... 5
La Neurona Artificial. .................................................................................................................................................. 7
Conexiones Entre Neuronas. ...................................................................................................................................... 8
Regla de Aprendizaje. ................................................................................................................................................. 8
Redes Neuronales para aplicaciones concretas. ......................................................................................................... 8
5.2.2. CLASIFICACIÓN. ................................................................................................................................................... 9
Aprendizaje Supervisado. ........................................................................................................................................... 9
Aprendizaje No Supervisado. .................................................................................................................................... 10
Aprendizaje Híbrido. ................................................................................................................................................. 10
Aprendizaje Reforzado. ............................................................................................................................................. 10
Red Neuronal Monocapa. .......................................................................................................................................... 11
Red Neuronal Multicapa. ........................................................................................................................................... 11
Red Neuronal Recurrente. ......................................................................................................................................... 11
5.2.3. DESARROLLOS ACTUALES Y APLICACIONES. ................................................................................................... 11
Redes vs. Métodos clásicos. ..................................................................................................................................... 11
Campos de aplicación. .............................................................................................................................................. 12
CONCLUSIONES. .......................................................................................................................................................... 15
BIBLIOGRAFÍA. ............................................................................................................................................................ 16
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 3 | 16
INTRODUCCIÓN.
Desde el principio de la humanidad se soñó con el desarrollo de máquinas que puedan imitar la capacidad de
aprendizaje del hombre. Actualmente es un desafío en el que pone todas sus miradas una parte de la comunidad
científica.
El hombre se ha caracterizado siempre, a lo largo de su existencia, por una búsqueda constante de nuevas vías para
mejorar sus condiciones de vida. Estos esfuerzos le han servido para reducir el trabajo en aquellas operaciones en las
que la fuerza juega un papel primordial. Los progresos obtenidos han permitido dirigir estos esfuerzos a otros campos,
como por ejemplo, a la construcción de máquinas calculadoras que ayuden a resolver de forma automática y rápida
determinadas operaciones que resultan tediosas cuando se realizan a mano. En la actualidad existen diversas maneras
de realizar procesos similares a los inteligentes humanos, a los que podemos denominar Inteligencia Artificial (AI).
Estas máquinas, denominadas máquinas inteligentes, permiten implementar fácilmente algoritmos para resolver
multitudes de problemas que antes resultaban engorrosos de solucionar. Sin embargo, se observa una limitación
importante, que ocurre cuando el problema que se quiere resolver no admite un tratamiento algorítmico, como es el
caso, de la clasificación de objetos por rasgos comunes. Este ejemplo demuestra que la construcción de nuevas
máquinas más versátiles requiere un enfoque del problema desde otro punto de vista.
Los desarrollos actuales de los científicos se dirigen al estudio de las capacidades humanas, como una fuente de
nuevas ideas para el diseño de dichas máquinas. Así, la inteligencia artificial es un intento por descubrir y describir
aspectos de la inteligencia humana que pueden ser simulados mediante máquinas. Esta disciplina se ha desarrollado
fuertemente en los últimos años, teniendo aplicación en algunos campos como visión artificial, demostración de
teoremas, procesamiento de información expresada mediante lenguajes humanos... etc. Las redes neuronales son
otra forma de emular otra de las características propias de los humanos.
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 4 | 16
5.2. REDES NEURONALES (RN).
Es un sistema compuesto por un gran número de elementos básicos (Artificial Neurons), agrupados en capas (Layers)
y que se encuentran altamente interconectados (Synapses);
Esta estructura posee varias entradas y salidas, las cuales serán entrenadas para reaccionar (valores O), de una
manera deseada, a los estímulos de entrada (valores I).
Estos sistemas emulan, de una cierta manera, al cerebro humano. Requieren aprender a comportarse (Learning) y
alguien debe encargarse de enseñarles o entrenarles (Training), en base a un conocimiento previo del entorno del
problema.
Las Redes Neuronales (RN) fueron originalmente una simulación abstracta de los sistemas nerviosos biológicos,
formados por un conjunto de unidades llamadas “neuronas” o “nodos” conectadas unas con otras. Estas conexiones
tienen una gran semejanza con las dendritas y los axones en los sistemas nerviosos biológicos.
5.2.1. CONCEPTOS BÁSICOS.
¿Qué entendemos por Red Neuronal Artificial?
Las Redes Neuronales Artificiales (ANN) son sistemas paralelos para el procesamiento de la información, inspirados
en el modo en el que las redes de neuronas biológicas del cerebro procesan esta. Es decir que se han intentado
plasmar los aspectos esenciales de una neurona real a la hora de diseñar una neurona “artificial”. Estos modelos
realizan una simplificación, averiguando cuales son los elementos relevantes del sistema, bien porque la cantidad de
información de que dispone es excesiva o bien porque es redundante. Una elección adecuada de sus características,
más una estructura conveniente, es el procedimiento convencional utilizado para construir redes capaces de realizar
una determinada tarea.
Es de prever que dichas ANN tengan características similares a las del cerebro:
Sean robustas y tolerantes a fallos.
Sean flexibles. El cerebro se adapta a nuevas circunstancias mediante el aprendizaje.
Puedan trabajar con información borrosa, incompleta, probabilística, con ruido o inconsistente.
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 5 | 16
Sean altamente paralelas. El cerebro está formado por muchas neuronas interconectadas entre si y es,
precisamente el comportamiento colectivo de todas ellas, lo que caracteriza su forma de procesar la
información.
El punto clave de las ANNs es la nueva estructuración de estos sistemas para el procesamiento de la información. A
partir de esta información como ejemplo, las ANN aprenden. Aprender en sistemas biológicos involucra la modificación
de la interconectividad entre las neuronas; este concepto también es cierto para las ANNs.
Los campos de aplicación de las ANNs crecen por momentos, por ejemplo, reconocimiento de patrones, clasificación
de datos, predicciones, su ventaja más destacada es la de solucionar problemas que con las técnicas convencionales
serían demasiado complejos.
Las redes neuronales, en su inicio eran una simulación de los sistemas nerviosos biológicos. De este modo una
primera clasificación de los modelos de ANNs puede ser basándonos en su similitud con la realidad biológica: modelos
de tipo biológico y aquellos dirigidos a aplicaciones.
Redes Neuronales de tipo Biológico.
El cerebro humano contiene aproximadamente 12 billones de células nerviosas o neuronas. Cada neurona tiene de
5600 a 60000 conexiones dendríticas provenientes de otras neuronas mientras que en el sistema nervioso hay 1014
sinapsis; teniendo cada neurona más de 1000 a la entrada y a la salida. Es importante destacar que aunque el tiempo
de conmutación de la neurona es casi un millón de veces menor que las computadoras actuales, ellas tienen una
conectividad miles de veces superior que las actuales supercomputadoras.
La principal aplicación de estas redes, es el desarrollo de elementos sintéticos para verificar las hipótesis que
conciernen a los sistemas biológicos.
Las neuronas y las conexiones entre ella, llamadas sinapsis, son la clave para el procesado de la información. Observar
la ilustración 1:
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 6 | 16
Ilustración 1 Neurona Biológica.
La mayoría de neuronas tienen una estructura parecida a la de un árbol llamadas dendritas que reciben las señales
de entrada que vienen de otras neuronas a través de las sinapsis.
Una neurona consta de tres partes:
1. El cuerpo de la neurona.
2. Ramas de extensión (dendritas) para recibir las entradas.
3. Un axón que lleva la salida de una neurona a las dendritas de otras neuronas.
Ilustración 2 Red de Neuronas.
La interacción entre dos neuronas no es del todo conocida pero el proceso del traspaso de información es modelado
como una regla de propagación representada por la red u(.). Mientras que la neurona puede ser modelada como una
simple función escalón f(.).
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 7 | 16
La Neurona Artificial.
Si se tienen N neuronas, podemos ordenarlas arbitrariamente y designarlas como unidades. Su trabajo es simple y
único, y consiste en recibir las entradas de las células vecinas y calcular un valor de salida, el cual es enviado a todas
las células restantes.
Ilustración 3 Neurona Artificial.
Se conoce como capa o nivel a un conjunto de neuronas cuyas entradas provienen de la misma fuente (que puede ser
otra capa de neuronas) y cuyas salidas se dirigen al mismo destino (que puede ser otra capa de neuronas).
De esta manera podemos destacar tres tipos de unidades:
Las unidades de entrada reciben señales desde el entorno (son señales que proceden de sensores o de otros
sectores del sistema).
Las unidades de salida envían la señal fuera del sistema (son señales que pueden controlar directamente
potencias u otros sistemas). Las neuronas de las capas ocultas pueden estar interconectadas de distinta
manera, lo que denomina, lo que determina con su número, las distintas tipologías de redes neuronales.
Las unidades ocultas son aquellas cuyas entradas y salidas se encuentran dentro del sistema (son señales
que no tienen contacto con el exterior).
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 8 | 16
Ilustración 4 Caracterización de un grupo de Neuronas.
Conexiones Entre Neuronas.
Las conexiones que unen a las neuronas que forman una red neuronal artificial, tienen asociado un peso, que es el
que hace que la red adquiera conocimiento.
Una neurona recibe un conjunto de señales que le dan información del estado de activación de todas las neuronas
con las que se encuentra conectada.
Regla de Aprendizaje.
Al igual que el funcionamiento de una red depende del número de neuronas de las que disponga y de cómo estén
conectadas entre sí, cada modelo dispone de sus propias técnicas de aprendizaje. En el caso de las redes neuronales
artificiales, se puede considerar que el conocimiento se encuentra en los pesos de las conexiones entre neuronas.
Todo proceso de aprendizaje implica cierto número de cambios en estas conexiones. En realidad puede decirse que
se aprende modificando los valores de los pesos de la red.
Redes Neuronales para aplicaciones concretas.
Debido a que el conocimiento sobre el sistema nervioso en general no es completo se han de definir otras estructuras
y funcionalidades distintas a las vistas en las de tipo biológico. Estas son sus principales características:
Auto-organización y Adaptatividad. Ofrecen procesos robustos y adaptativos ya que utilizan algoritmos de
autoaprendizaje y autoorganización.
Procesado no lineal. Proporciona una gran capacidad de aproximar, clasificar e inmunidad frente al ruido.
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 9 | 16
Procesador paralelo. Se usan un gran número de células con un alto nivel de interconectividad.
Los campos de aplicación son el procesado de señal y el de imagen.
5.2.2. CLASIFICACIÓN.
El criterio más habitual para clasificar las redes neuronales es el tipo de aprendizaje que se utilice.
La clasificación general sería la siguiente:
Aprendizaje Supervisado.
Aprendizaje No Supervisado.
Todos estos métodos de aprendizaje, necesitan unas reglas de entrenamiento específicas para cada uno de ellos.
Aprendizaje Supervisado.
En el aprendizaje supervisado (aprender con un maestro), la adaptación sucede cuando el sistema compara
directamente la salida que proporciona la red con la salida que se desearía obtener de dicha red.
Existen tres tipos básicos: por corrección de error, por refuerzo y estocástico.
En el aprendizaje por corrección de error el entrenamiento consiste en presentar al sistema un conjunto de pares de
datos, representando la entrada y la salida deseada para dicha entrada (este conjunto recibe el nombre de conjunto
de entrenamiento). El objetivo es minimizar el error entre la salida deseada y la salida que se obtiene.
El aprendizaje por refuerzo es más lento que el anterior. No se dispone de un ejemplo completo del comportamiento
deseado pues no se conoce la salida deseada exacta para cada entrada sino que se conoce el comportamiento de
manera general para diferentes entradas. La relación entrada-salida se realiza a través de un proceso de éxito o
fracaso, produciendo este una señal de refuerzo que mide el buen funcionamiento del sistema. La función del
supervisor es más la de un crítico que la de un maestro.
El aprendizaje estocástico consiste básicamente en realizar cambios aleatorios de los valores de los pesos y evaluar
su efecto a partir del objetivo deseado.
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 10 | 16
Aprendizaje No Supervisado.
La capacidad de clasificación de la red neuronal depende del valor de los pesos sinápticos, que pueden ser
preestablecidos o entrenados adaptativamente mediante mecanismos de aprendizaje.
Una clase de modelos de entrenamiento no supervisado son las redes de pesos fijos. Un ejemplo son las redes de
Memoria Asociativa, que se usan para obtener patrones originales libres de ruido a partir de señales incompletas o
distorsionadas. La principal característica de las redes asociativas de pesos fijos es que sus pesos son preestablecidos
y precalculados.
Los modelos de pesos fijos tienen aplicaciones limitadas ya que no se pueden adaptar a “ambientes cambiantes”. Hay
otra variedad de redes no supervisadas, llamadas Redes de Aprendizaje Competitivo, cuyos pesos se adaptan de
acuerdo con reglas de aprendizaje no supervisadas. Estas redes, pueden aprender en ausencia de un maestro, como
ya hemos mencionado anteriormente. En otras palabras, el entrenamiento se basa únicamente en la información de
los patrones de entrada, no necesitan la supervisión de un maestro a la salida. La clase de las redes de aprendizaje
competitivo se compone, por ejemplo, de Red de autoorganización.
De igual forma existen otras clasificaciones, que contienen características de las anteriores:
Aprendizaje Híbrido.
Es una mezcla de los anteriores. Unas capas de la red tienen un aprendizaje supervisado y otras capas de la red
tienen un aprendizaje de tipo no supervisado.
Aprendizaje Reforzado.
Es un aprendizaje con características del supervisado y con características del no supervisado. No se proporciona una
salida deseada, pero sí que se le indica a la red en cierta medida el error que comete, aunque es un error global.
Otra clasificación de las redes de neuronas artificiales que se suele hacer es en función del patrón de conexiones que
presenta.
Así se definen tres tipos básicos de redes:
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 11 | 16
Red Neuronal Monocapa.
Se corresponde con la red neuronal más sencilla ya que se tiene una capa de neuronas que proyectan las entradas a
una capa de neuronas de salida donde se realizan los diferentes cálculos.
Red Neuronal Multicapa.
Es una generalización de la anterior, existiendo un conjunto de capas intermedias entre la capa de entrada y la de
salida (capas ocultas). Este tipo de red puede estar total o parcialmente conectada.
Red Neuronal Recurrente.
Este tipo de red se diferencia de las anteriores en la existencia de lazos de realimentación en la red. Estos lazos
pueden ser entre neuronas de diferentes capas, neuronas de la misma capa o, entre una misma neurona. Esta
estructura la hace especialmente adecuada para estudiar la dinámica de los sistemas no lineales.
5.2.3. DESARROLLOS ACTUALES Y APLICACIONES.
Redes vs. Métodos clásicos.
En muchas áreas donde existen problemas de predicción, clasificación, etc., existen soluciones que no están basadas
en redes neuronales pero que dan buenos resultados, o como mínimo mejores que el no hacer nada.
Frente a este tipo de problemas, donde ya existe dicha solución “clásica”, las redes pueden aportar su alta no linealidad
y su gran facilidad en aportar datos adicionales, tanto numéricos, como borrosos y/o subjetivos, que en técnicas
convencionales o modelos “clásicos” no son tenidos en consideración. Por lo tanto, se llega a la conclusión que la
utilización de redes neuronales aporta soluciones más eficientes y seguras que las convencionales. El único dilema
existente frente a este tipo de problemas con una solución clásica, es la elección entre dos modos distintos de utilizar
las redes, es decir la utilización tipo a) o la tipo b).
Tipo a) Se basa en construir un red donde ya este incorporado el modelo “clásico”, añadir las nuevas variables que
consideremos de interés y efectuar el aprendizaje de la red de tal modo que esta solo tenga que mejorar el resultado
clásico con respecto al resultado deseado. De este modo nos aseguramos que el resultado de la red siempre sea
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 12 | 16
mejor que el resultado clásico. Solo será igual a la resultado clásico, en el caso que las variables adicionales no aporten
nada nuevo y no se necesario no utilizar la no linealidad de la red, dos condiciones que difícilmente se cumplen
simultáneamente.
Tipo b) Se basa en construir una red sin incorporar el el modelo “clásico” pero añadiendo todas las variables adicionales
que sean de interés. Esto no garantiza qu el resultado sea superior al “clásico” pero la experiencia acumulada hasta
el momento demuestra que siempre es superior debido a que se utiliza la no linealidad de la red y/o las nuevas
variables. Si en algún problema esto no fuera cierto, siempre podemos recurrir a la incorporación del modelo clásico
en la red (tipo a).
Campos de aplicación.
Las ANNs han sido aplicadas a un creciente número de problemas con una complejidad considerable, como puede
ser el reconocimiento de patrones, clasificación de datos, predicciones, etc... Su ventaja más importante está en
solucionar problemas que son demasiado complejos pata las técnicas convencionales.
Las redes neuronales pueden utilizarse en un gran número y variedad de aplicaciones, tanto comerciales como
militares. Se pueden desarrollar redes neuronales en un periodo de tiempo razonable, con la capacidad de realizar
tareas concretas mejor que otras tecnologías.
Las aplicaciones de las ANNs abarcan diversas actividades de muy diferentes campos.
Estos son:
Finanzas.
Predicción de índices
Detección de fraudes
Riesgo crediticio, clasificación
Predicción de la rentabilidad de acciones
Negocios.
Marketing
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 13 | 16
Venta cruzada
Campanas de venta
Tratamientos de texto y proceso de formas.
Reconocimiento de caracteres impresos mecánicamente.
Reconocimiento de gráficos
Reconocimiento de caracteres escritos a mano.
Reconocimiento de escritura manual cursiva.
Alimentación.
Análisis de olor y aroma
Perfilamiento de clientes en función de la compra
Desarrollo de productos
Control de calidad
Energía.
Predicción del consumo eléctrico
Distribución recursos hidráulicos para la producción eléctrica
Predicción consumo de gas ciudad
Industria manufacturera.
Control de procesos
Control de calidad
Control de robots
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 14 | 16
Medicina y salud.
Ayuda al diagnóstico
Análisis de imágenes
Desarrollo de medicamentos
Distribución de recursos
Ciencia e Ingeniería.
Análisis de datos y clasificación
Ingeniería Química
Ingeniería Eléctrica
Climatología
Transportes y comunicaciones.
Optimización de rutas
Optimización en la distribución de recursos
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 15 | 16
CONCLUSIONES.
El mundo tiene mucho que ganar con las redes neuronales, ya que las personas que las utilizan ahora y las utilizarán
en el futuro son aquellas que tienen que trabajar o analizar datos de cualquier tipo. Gente de industria, finanzas,
negocios, educación y ciencia cuyos problemas son complejos, laboriosos, confusos o simplemente sin solución con
los métodos actuales. Gente que quiere mejores soluciones y esperan ganar un lugar estratégico.
Su habilidad para aprender mediante ejemplos las hace muy flexibles y poderosas. Además no es necesario crear un
algoritmo para llevar a cabo una tarea específica, esto es, no hay necesidad de entender el mecanismo interno de la
tarea. Ellas están bien adaptadas para los sistemas de tiempo real debido a su capacidad de respuesta rápida, la cual
se debe a su arquitectura paralela.
Las Redes neuronales, con su notable habilidad para deducir significados de datos complicados o imprecisos pueden
ser usadas para extraer patrones y detectar tendencias que son demasiado complejas para ser comprendidas por los
humanos u otras técnicas computacionales. Una red neuronal capacitada puede ser concebida como algo que algún
día le podremos realizar preguntas como "qué pasaría si...".
Quizás el aspecto más excitante de las redes neuronales es la posibilidad de dotar a estas de conciencia. Existe un
número de científicos que argumentan que la concienciación es una propiedad mecánica y que la conciencia de las
redes neuronales es una posibilidad real.
Finalmente, nos gustaría afirmar que incluso las redes neuronales tienen un gran potencial que sólo obtendremos de
ellas cuando las integremos al conjunto de la Inteligencia artificial.
Unidad V Aplicaciones con Técnicas de IA.
Redes Neuronales (RN).
P á g i n a 16 | 16
BIBLIOGRAFÍA.
Caudill, M., Butler, Ch., "Understanding Neural Networks", MIT Press.
Freeman, J.A., Skapura, D.M., "Neural Networks", Ed. Addison Wesley.
Hagan, Martin T, “Neural Network Design”, PWS Publishing Company,1996.
J.R. Hilera González y V.J. Martínez “Redes Neuronales Artificiales: Fundamentos, modelos y aplicaciones”,
RA-MA, 1995.
Varios, “Aprendizaje Automático”, Edicions UPC, Barcelona, CAT, 1994.
Widrow, J., Rumelhart, D.E., Lehr, M.A., "Neural networks: Applications in industry, business and science",
ACM communications, Vol-37, 1.994.
[HEBB49] D.O Hebb. “The organization of Behaviour” John Wiley & sons, New York, 1949.
[MINS69] M. Minsky & S. Papert, “Perceptrons” MIT Press, Cambridge, MA, 1969.