Reconocimiento de patrones y métodos de clasificación en imágenes digitales

1

Reconocimiento de patrones y metodos declasificacion en imagenes digitales

Miguel Armando Lopez BeltranUniversidad Autonoma de Sinaloa

Facultad de Ciencias de la Tierra y el [email protected]

Enero 2013

Resumen—Este es un documento que trata sobre el reconoci-miento de patrones y una descripcion breve sobre clasificadoresestadısticos y redes neuronales.

I. INTRODUCCION

El procesamiento digital de imagenes se divide en dosaspectos: el procesamiento y el analisis de las imagenes [6].

El procesamiento se refiere a la transformacion y restaura-cion y mejoramiento de la imagenes [6].

Por otro lado el analisis de imagenes es un proceso que con-siste descubrir, identificar y comprender ciertos patrones y/opropiedades que son relevantes en la realizacion de cualquiertrabajo basado en imagenes digitales [6,8,10,15]. Sin embargo,el proceso de analisis de imagenes se dividen en tres areasbasicas :

Procesado de bajo nivel: Son funciones automaticasy no requieren inteligencia por parte del sistema deanalisis (reduccion de ruido, realce de contraste, realcede caracterısticas, etc.).Procesado de nivel intermedio: Comprende la extracciony caracterizacion de los componentes de la imagenobtenida en el procesos de bajo nivel (segmentacion(regiones, objetos) descripcion de objetos y clasificaciono reconocimiento).Procesado de alto nivel: Comprende el reconocmientoy la interpretacion, analisis de la imagen y funcionescognitivas.

Figura 1. Modelo general de procesamiento de imagenes. Fuente: [10,15]

Por lo tanto, existe una gran gamma de areas en la cienciaspara las aplicaciones del procesamiento digital de imagenes,

entre las principales se encuentra: medicina, biologıa, astro-nomıa, agricultura, historia, fotografıa, geomatica, veterinaria,etc., en el cual se puede aplicar cualquier nivel de procesa-miento [6,8].

Pero para el analisis de la imagen en cualquier nivel deprocesamiento es importante realizar un reconocimiento depatrones.

II. RECONOCIMIENTO DE PATRONES

El reconocimiento de patrones en imagenes se encuentraen un campo muy amplio en la investigacion [3]. El reco-nocimiento asigna un nombre a un objeto, basandose en lainformacion que proveen sus descriptores, y la interpretacionasigna su significado a un conjunto de objetos reconocidos [15].Sobrado [18] define el reconocimiento de patrones como: “esla categorizacion de datos de entrada en clases identificadas,por medio de la extraccion de caracterısticas significativas oatributos de los datos extraıdos de un medio ambiente quecontiene detalles relevantes”.

Ademas Gonzales & Woods [10] definen un patron como“es una descripcion estructural o cuantitativa de un objetoo de alguna otra entidad de interes en una imagen, en otraspalabras es una disposicion de descriptores” y una clase depatrones como “es una familia de patrones que compartenalgunas propiedades comunes”.

Por lo tanto, el reconocimiento de patrones de un determi-nado espacio son clasificados en un conjunto discreto de clasesde patrones, en donde cada una de las clases es definida conun patron representante de la clase y viene dado previamenteal inicio del proceso de clasificacion [16].

Por lo tanto, las clases de patrones se representan comow1, w2, ..., wn, donde n representa el numero total de cla-ses [10,15,16].

De acuerdo con Sobrano [18] los sistemas de reconocimientode patrones se pueden identificar en 4 tipos de metodologıas:

Heurısticas: Metodologıa base al uso de la experiencia yla intuicion humana.Matematicas: Metodologıa que hace uso de las propie-dades comunes de los patrones y se basan en reglasde clasificacion formuladas en un marco matematico. Sedivide en dos areas:• Determinısticas: No requieren de propiedades es-

tadısticas. Ejemplo clasificacion por distancia eucli-diana.

2

Figura 2. Iris etosa, Iris Versicolor, Iris virginica. Fuente: [19].

• Estadısticas: Aproximacion mas simple que consisteen representar a cada patron mediante un vector denumeros, y cada clase por uno o varios patronesprototipo.

Linguısticas: Reducen un objeto a un conjunto de ele-mentos estructurales o primitivas, anadiendo una sintaxispara relacionar estos elementos de forma espacial, es de-cir, descomponiendo a los objetos complejos en terminosde conjuntos de primitivas (arcos, angulos, rectas, etc.)con reglas para describir la relacion espacial entre ellas.Redes neuronales artificiales: El analisis implica la con-figuracion de una red de neuronas artificiales y el entre-namiento de la red para determinar como las neuronasindividuales pueden afectar uno a la otra, el modo dereconocimiento implica el envıo de datos a traves de lared y la evaluacion a que clase se aproximara mas.

Gonzales & Woods y Romo [15], menciona que las princi-pales representaciones de patrones utilizados en la practicason [10,15]:

Vectores: Descripciones cuantitativas.Cadenas.Arboles: Descripciones estructurales.

II-A. Patrones vectoriales

Los patrones vectoriales se representan utilizando letrasminusculas en negrita, como x, y, z, se representan comomatrices (nx1) (ecuacion 1) [10].

x =

x1x2...xn

(1)

Donde cada componente, xi representa el i-esimo descriptory n es el numero de descriptores.

Un ejemplo que da Gonzales & Woods [10], es describirtres tipos de lirios (Iris setosa, Iris virginica e Iris versicolor(Figura 2), por la medida de la longitud y la anchura de suspetalos. Por lo tanto, se utilizo vectores bidimensionales (verecuacion 2).

x =

[x1x2

](2)

x1 y x2 corresponden a la anchura y longitud del petalo delas Iris spp. Las tres clases de patrones, se representan porw1, w2 y w3. En la figura 3 muestra las medidas de anchuray longitud para cada tipo de lirio. Se observa que la eleccionde caracterısticas podra discriminar perfectamente la clase Irissetosa de las otras dos, pero no ası las clases Iris versicolore Iris virginica entre sı.

Figura 3. Dos medidas realizadas para tres tipos de lirios. Fuente: [10].

Otro metodo en la generacion de patrones vectoriales es conrespecto a la firma generada por sus contornos.

Una firma es una representacion funcional unidimensionalde un contorno y se pueden generar en varıas formas. La formamas simple es representar la distancia desde un punto de vistainterior, como puede ser el centroide al contorno como unafuncion del angulo. En otras palabras, la idea basica de unafirma es reducir la representacion del contorno a una funcionunidimensional.

Figura 4. Firma correspondiente a tres objetos.

En la figura 4 las imagenes superiores (circulo y cuadrado),su firma es en relacion entre el angulo y la distancia con elcentroide, mientras que la imagen inferior es en funcion a sucontorno.

II-B. Patrones de cadena

Las representaciones en forma de cadena generan adecua-damente patrones de objetos y otras entidades cuya estructurase basa en conexiones relativamente sencillas de sentencias,

3

que normalmente estan asociadas a formas de bordes o con-tornos [10].

Un ejemplo en reconocimiento de patrones de cadenas quepresenta Gonzales & Woods [10] es un patron en forma deescalera (figura 5), aunque este patron puede ser expresado enterminos de un patron vectorial utilizando un metodo de firmas(figura 4), aunque se perderıa la estructura basica, que consisteen la representacion de dos sencillos elementos a y b. Es porello, que es mas logico definir los elementos a y b y hacer queel patron sea la cadena de sımbolos W = abababab... comose muestra en la figura 5.

Figura 5. Estructura codificada en terminos de los primitivos a y b [10].

II-C. Patrones de arboles

Un arbol es una estructura jerarquica aplicada sobre unacoleccion de elementos u objetos llamados nodos, donde unoes conocido como raız, creando una relacion o parentesco entrelos nodos dando lugar a terminos como padre, hijo, hermano,antecesor, sucesor, ancestro, etc. [2].

Cairo & Guardati [2] menciona las principales caracterısticasy propiedades de los arboles en general son:

Todo arbol que no es vacıo, tiene un unico nodo raız.Todos los nodos que son descendientes directos (hijos)de un mismo nodo (padre), son hermanos.Todo nodo que no tiene ramificaciones (hijos), se conocecon el nombre de terminal u hoja.Todo nodo que no es raız, ni terminal u hoja se conocecon el nombre de interior.El grado es el numero de descendientes directos de undeterminado nodo. El grado del arbol es el maximo gradode todos los nodos del arbol.El nivel es el numero de arcos que deben ser recorridospara llegar a un determinado nodo. Por lo tanto la raıztiene un nivel 1.La altura del arbol es el maximo numero de niveles detodos los nodos del arbol.

Es una tecnica potente para muchas aplicaciones, donde lamayorıa de los esquemas de ordenacion jerarquica dan lugar

Figura 6. Ciudad de Culiacan, Sinaloa. Imagen extraıda de Google Earth.

a estructuras de tipo arbol, un ejemplo de ello es una imagende fotografıa aerea o imagen satelital [10].

Un ejemplo de esta tecnica es la siguiente: tomando comoreferencia la ciudad de Culiacan que representa una imagencompuesta de zonas rurales, agrıcolas, urbanas, cuerpos deagua, caminos terracerıa, pavimento, autopistas, etc. La raızdel arbol representa la imagen completa, aunque sus rami-ficaciones son muy abstractas, la idea de representacion semuestra en la figura 7. El nivel siguiente representa las areascompuestas de vıas de comunicacion, zonas agrıcolas, ruralesy urbanas, a la vez se componen de mas nodos, a excepciondel nodo de zona rural el cual termina siendo una hoja. Laaltura del arbol esta basado en 4 niveles, lo cual es suficientepara la representacion abstracta del ejemplo.

Figura 7. Representacion de arbol en base a la figura 6.

III. RECONOCIMIENTOS DE PATRONES BASADOS ENMETODOS MATEMATICOS DE DECISION

Uno de los motivos del uso de metodos de clasificacionesta dada por las caracterısticas de los elementos, los cualesdisponen de cierta caracterıstica similares que pueden asig-narse a cierta clase, la cual representarıa la caracterıstica encuestion.

Esta semejanza entre los elementos se utilizan para asig-nar la clase. Las tecnicas de clasificacion, proporcionan unaherramienta para asignar que elementos pertenecen a x clase.

4

La clasificacion de imagenes parte de un metodo y de unamedida cuantitativa que ayuda a encontrar la semejanza o no,entre las partes de la imagen. Los metodos pueden aplicar unatecnica supervisada o no supervisada, con enfoque estadısticoo de redes neuronales [9].

Sin embargo, Chuvieco Salinero [4], menciona un tercermetodo, los metodos mixtos.

Ademas, como ya se menciono anteriormente, Sobrano [18]

menciona que los reconocimientos de patrones que utilizanmetodologıa matematica se dividen en dos: (1) determinısticasy (2) estadısticas.

Los clasificadores estadısticos consideran que los patronesde las clases forman una poblacion estadıstica caracterizadapor una determinada funcion de distribucion o funcion dedensidad, donde las funciones tienen una forma generalmentedesconocida, por lo tanto los clasificadores intentan ajustarlosa los diferentes modelos teoricos, siguiendo enfoques pa-rametricos y no parametricos, los clasificadores determinısticasno consideran la funcion de distribucion o funcion de densi-dad [9].

Gil et al. [9] menciona algunos ejemplos de clasificadoresestadısticos, los cuales se encuentran: maxima verosimilitud,paralelepıpedos, mınima distancia, vecino mas cercano, K-means, ISODATA.

III-A. Clasificacion supervisadaEl usuario parte de cierto conocimiento de la zona de estu-

dio, fundamentalmente el usuario define con maxima precisioncada una de las categorıas que este pretende discriminar,antes de efectuar la clasificacion, es decir, el usuario alconocer la zona de estudio, delimita areas representativas delas clases a clasificar, estas areas en cuestion se denominan“Training Field” (Campos de entrenamiento), el termino decampos de entrenamiento sirven para “entrenar” al softwarede clasificacion en el reconocimiento de las distintas areas, apartir de este entrenamiento se caracterizan las areas de cadauna de las clases, y se asignan los elementos correspondientesen toda la imagen pertenecientes a cada determinada clase.El proceso de definicion de clases representativa se le conocecomo fases de entrenamiento [1,4,9].

Algunos ejemplos de clasificadores supervisados son [9,17]:Maxima verosimilitud.Paralelepıpedos.Mınima distancia.Vecino mas cercano.

III-B. Clasificacion no supervisadaSe realiza a partir de un conjunto de patrones del que

no se conoce su clase. Basicamente se trata de encontraragrupamientos [18]. No es necesario conocer el area de estudiopor parte del usuario que va realizar la clasificacion, sinembargo tendra que interpretar las clases que son generadaspor la clasificacion, por lo tanto la imagen es segmentada alnumero de clases del cual no requiere ningun muestreo o fasede entrenamiento [1,4,9].

Algunos ejemplos de clasificadores no supervisados [9,17]

ISODATA.K-means.

III-C. Clasificacion mixta

De acuerdo con Chuvieco Salinero [4], los metodos supervi-sados y no supervisados cuentan con ventajas e inconvenientes.El metodo supervisado resulta muchas veces subjetivo, puesel usuario establece a priori unas categorıas sin valorar lascaracterısticas de la imagen, el metodo no supervisado nogarantiza que las clases deducidas tengan significado para elusuario del producto, ademas es difıcil su verificacion. Con laintencion de reducir los inconvenientes en ambos metodos, sehan propuesto alternativas que los combinan de alguna forma.

IV. CLASIFICADORES ESTADISTICOS

IV-A. Maxima verosimilitud

Tambien conocido como Maxima probabilidad, es el algo-ritmo mas usado en clasificacion de imagenes, dado que essencillo su aplicacion e interpretacion de sus resultados [11]. Elmetodo utiliza el analisis estadıstico de medias, varianzas ycovarianzas de un conjunto de datos de entrenamiento, cuyocontenido se supone que tiene una distribucion normal [7,17].

Este clasificador es mas complejo dado a que demandamayor volumen de calculos, sin embargo, es el mas empleado,por su robustez y por ajustar con mas rigor los pıxeles de cadaclase [17].

En la fase de entrenamiento, el algoritmo elabora el reco-nocimiento de los patrones de cada clase con los parametrosestadısticos de la media, varianza y covarianza de un conjuntosde areas de entrenamiento localizados en la imagen. En lafase de clasificacion, se calcula cada pıxel (ecuacion 3), laprobabilidad de pertenencia a cada clase, para cada uno de lospıxeles de la imagen con base a su respuesta del patron. Porultimo el pıxel se asigna a la clase de mayor probabilidad depermanencia [11].

P (H|E) =P (E|H)p(H)

p(E)(3)

Donde:

P (H|E) es la probabilidad condicionada de la hipotesisH , dado la evidencia E, es decir la probabilidad de queel pıxel permanezca a cierta clase (Hipotesis H) tomandoen cuenta su respuesta del patron (Evidencia E).p(H) es la probabilidad de que un pıxel permanezca a laclase considerada en la hipotesis H sin tomar en cuentasu informacion de patron.p(E) es la probabilidad de la evidencia E.P (E|H) es la probabilidad condicionada de la evidenciaE dada la hipotesis H .

Chuvieco [4] menciona otra manera de clasificacion de maxi-ma verosimilitud en caso de estar trabajando con imagenesmonocromaticas, que puede calcular la probabilidad de perte-nencia a cierta clase de acuerdo con la ecuacion 4.

p(x/A) =1√2π2

A

{−(NDx − µA)

2

2σ2A

}(4)

Donde:

5

Figura 8. Ejemplo de paralelepıpedo con pıxeles sin clasificar.

p(x/A): Probabilidad de que un pıxel x, pertenezca a laclase A.NDx: Valor del pıxel.µA: Valor medio de la clase.σA: Varianza de la clase.

El pıxel sera asignado a la clase A solo si: p(x/A) ≥p(x/B) variando B desde 1 hasta c, siendo c el numero declases.

IV-B. Clasificador paralelepıdos

El clasificador paralelepıpedos es computacionalmente efi-ciente para clasificar elementos, sin embargo, algunos parale-lepıpedos se sobreponen [17]. Esto se da a que el usuario fijaun area de dominio para cada una de las clases, teniendo encuenta sus valores centrales y dispersion [4].

Vmin ≤ Vrx ≤ Vmax (5)

Donde:Vmin: Valor mınimo del rango de la clase.Vmax: Valor maximo del rango de la clase.Vrx: Valor correspondiente del pixel.

Por lo tanto el pıxel es asignado a una determinada clase sisus valores se encuentran a menos de una determinada distan-cia del centro de clases, esta distancia se fija por el usuario,aunque suele identificarse con la desviacion estandar [4].

Algunos inconvenientes en el diseno de areas de dominiopueden implicar:

Que existan pıxeles en zonas comunes a dos o mascategorıas.Que existan pıxeles sin clasificar.

Es por ello que no es recomendado cuando se consideranclases mixtas.

IV-C. Mınima distancia

Es el criterio mas sencillo para asignar un pıxel a una delas clases [4], es por ello que es una forma para determinar deque clase es miembro un patron desconocido x, por lo tantose asigna a la clase mas cercano a su prototipo . Se puedeusar la distancia euclidiana para determinar la proximidad ocualquier combinacion, utilizando la distancia euclidiana, sereduce el problema a computar las medidas de distancia [17].La distancia se compara con los valores del patron con losvalores centrales de las clases de la imagen [4].

La ecuacion mas empleada es [4]:

dx,A =

√√√√ m∑i=1

(ENDA −NDx)2 (6)

Donde:

dx,A: medida de la distancia entre el pıxel x y la categorıaA.ENDA: Valor medio de la categorıa.NDx: valor correspondiente al pıxel a clasificar.

No es recomendable para aplicaciones en que las clases depatrones estan cercanas una de otras en el espacio medidas ytienen una alta varianza [17]. Sin embargo, es bastante sencillo yrapido de ejecutar, adecuado cuando las distancias entre claseses grande comparada con la dispersion de los elementos decada clase y delimita a grupos circulares de radio proporcionala la situacion de cada clase (ver figura 9) [4].

Figura 9. Agrupaciones de mınima distancia.

IV-D. Vecino mas cercanoConocido como K-NN por sus siglas en ingles (K- Near

Neighborhood), es un clasificador no parametrico. Es unacompilacion del clasificador de distancia [14]. La idea basica elcual se fundamenta este clasificador es que un nuevo patronse va a clasificar en la clase mas frecuente a la que pertenecesus K vecinos mas cercanos [12]. Es decir, el pıxel con patronx se va asignar a la clase mas frecuente a la que pertenecensus Kc vecinos mas cercanos, los vecinos tienen la mismaimportancia de decision, sin considerar las distancias de x.

En la figura 10 se muestra un ejemplo donde el circulo verderepresenta el patron que se desea clasificar a cualquiera delas dos clases (cuadrados azules y triangulos rojos), tomandocomo referencia 3 vecinos (K3) el circulo se clasificara comotriangulo, sin embargo, si se toma de referencia 5 vecinos(K5), se clasifica como cuadrado. Esto se debe a la cantidadde vecinos cercanos al patron a clasificar. El parametro devecinos siempre es un numero impar.

La principal desventaja es la alta carga computacional,dado que se almacenan muchos patrones y se calcula muchasdistancias [14].

Dispone de algunas variantes entre ellas [12]

K-NN con rechazo.K-NN con distancia mınima.K-NN con distancia media.K-NN con ponderacion en las variables.K-NN con ponderacion a clases seleccionadas.

6

Figura 10. Ejemplo de K-NN

IV-E. K-Means

De acuerdo con Sanz [17], el nombre hace referencia a quese conoce el numero de clases o patrones involucrados, es unalgoritmo sencillo, eficiente, siempre y cuando se conozca elvalor de k con exactitud.

El algoritmo esta basado en el analisis de las varianzas,agrupa un conjunto de datos en un numero predefinidos declases o grupos. El proceso es el siguiente [5,17]:

1. Inicia al seleccionar al azar el conjunto de elementos aagrupar en k (Numero de clases) de forma que se puedagenerar los centroides de la clase.

2. Continua con un proceso recursivo, en la cual cadainteraccion generica n se distribuyen y reasignan lospatrones del conjunto entre las k clases de acuerdo ala menor distancia de la muestra y los centroides endichas clases.

3. Posteriormente del proceso de reasignacion, se actuali-zan los centroides, y se procede con el paso anterior denuevo.

4. El proceso de reasignacion no se detiene hasta queconverge al criterio de parada, es decir, cuando alcanzael parametro para terminar, como por ejemplo el numerode interacciones o que los centroides no cambien).

IV-F. ISODATA

ISODATA es el acronimo de la definicion en ingles: Inter-active Self-organizing Data Analysis Techniques [7,17]

Es similar al K-means [7,17], pero con el agregado de unacantidad de parametros y operaciones que llevan a mejorar, porejemplo el valor k de K-medias es un valor exacto de clases, enISODATA es un valor esperado del numero de clases, es decirempieza con A clases e intenta aproximarse a k clases [17].

Sin embargo, para la eliminacion o persistencia de las clasesse basa en los criterios [7]:

Combinacion: Si dos centros de clases estan mas cercasque el umbral definido, se combinan y una nueva mediaes determinada.

Numero de miembros de la clase: Si el numero demiembros de una clase es menor al numero determinado,esta clase se disuelve y se asigna a la clase mas cercana.Separacion: Si la varianza, el numero de miembro o ladistancia media excede los valores predefinidos, entoncesel grupo se puede dividir.

De acuerdo con Sanz [17] las ventajas y desventajas quepresentan son:

Provee mejores resultados que el metodo de K-medias.Es fuertemente dependiente de los parametros ingresa-dos, por lo que hay que tener suficiente conocimientosobre ellos.Permite una mayor interaccion con el usuario, medianteel ajuste de los parametros. Si se tiene un conocimientodel tipo de la imagen con la que se trabaja lograndomejores resultados.

V. REDES NEURONALES ARTIFICIALES

Las redes neuronales son modelos matematicos basados enuna estructura que permite procesar entradas de forma similara la que ocurre en el cerebro, estan compuestas por pequenasunidades llamadas neuronas que pueden estar entrelazadasentre sı [3,9].

Existen diversos modelos y paradigmas de redes neuro-nales [9] pero el modo de analisis implica una configuracionde la red neuronal y un entrenamiento a la red que permitedeterminar como las neuronas individuales trabajen colectiva-mente de diferentes maneras, de modo que el reconocimientoimplica el envıo de datos a traves de la red y la evaluaciona que clase se aproximara mas, en otras palabras una redneuronal es una estructura y distribuida de procesamientode informacion, compuesta por procesadores elementales in-terconectados mediante pesos sinapticos [9,18]. Generalmentelas redes neuronales toman una entrada numerica y producetambien una salida numerica [14].

Su principal rasgo es que es un sistema capaz de aprendera partir de una coleccion de datos de entrenamiento, cadaentrada se multiplica por un peso de conexion (Wi,j) [3,14].

La implementacion de una red neuronal atraviesa por unperiodo de prueba y error en el diseno de la misma antesde encontrar el diseno satisfactorio [17]. De manera general lasredes neuronales presentan tres caracterısticas:

Aprendizaje: Esta caracterıstica se refiere a que la neu-rona de la red dispone de una capacidad de almacenarconocimiento a traves de un entrenamiento.Generalizacion: Se refiere a que se obtiene informacionde salida razonables.Adaptabilidad: La red neuronal puede ser nuevamenteentrenada para funcionar adecuadamente ante los cam-bios.

El diseno de una red consiste en [18]

Arreglar las neuronas en varias capas.Decidir el tipo de conexion entre las neuronas de dife-rentes capas, ası como entre las neuronas de una mismacapa.Decidir la forma en que una neurona recibe una entraday produce una salida.

7

Figura 11. Esquema de red neuronal. Fuente: [17]

Determinar el peso de cada conexion dentro de la red,permitiendo que la red aprenda los valores apropiados delos pesos de conexion, usando el conjunto de datos deentrenamiento.

Existen muchas arquitecturas de redes neuronales entre ellasse encuentran: Perceptrones multicapa o de una sola capa,Redes recurrentes y de Hopfield, Redes de Kohonen, RBF(Radial Basis Function), resonancia adaptativa, recurrente,pulso-acomplado, entre otros mas [13,17,18].

Segun Sobrano [18], las redes neuronales artificiales tienemuchas similitudes con el reconocimiento estadıstico de pa-trones, esto dado que concierne en la representacion de datosy los principios de clasificacion, pero en la cuestion practicason diferentes. Por otro lado menciona algunas ventajas quepresentan las redes neuronales enfrente a los clasificadoresestadısticos:

Teoricamente se pueden determinar cualquier funcion,por lo que son adecuadas en aplicaciones que no sonfacilmente descritas analıticamente.Excepto por los patrones de entrada, no es necesariosuministrar informacion adicional.Se puede aplicar cualquier tipo de datos.Se obtienen buenos resultados con datos ruidosos.No se hacen hipotesis acerca de la distribucion estadısticade las variables de entrada.Los modelos neuronales no necesitan un conocimiento apriori de los parametros internos del clasificador.Despues de entrenadas son extremadamente rapidas yfacilmente implementadas.

En Sobrado [18] se puede encontrar informacion sobre lospasos de implementacion de una red neuronal como clasifica-dor.

En Ramırez & Chacon [13] realiza una revision de las redesneuronales durante la ultima decada, lo cual se da una brevedescripcion de algunos de las redes neuronales que presentan:

V-1. Teorıa de resonancia adaptativa (ART): Esta redpuede ser supervisada o no supervisada, su funcionamientoes similar al del cerebro humano, divido en un modulo decomparacion, un parametro de vigilancia y un modulo dereinicio. El modulo de comparacion toma el patron de entraday lo agrupa en alguna clase conocida por la red, el parametrode vigilancia se encarga de indicar el grado de pertenenciade la entrada a alguna clase dada, si el patron no pertenece aninguna clase se crea una nueva. La ventaja de esta red es la

capacidad de agrupar dato acorde a su informacion.V-2. Red neuronal celular (CNN): Basada en la teorıa de

automatas celulares, permite la interaccion de vecinos de cadaunidad en la red. Contiene una cantidad fija de unidades lla-madas celulas, las cuales son sistemas no lineales, dinamicosdonde la informacion de entrada es codificada para conocer sucomportamiento. Cada celula esta localmente interconectadascon multiples entradas que vienen de otras celulas.

V-3. Perceptron multicapa (MLP) y Backpropagation(BP): Fue uno de los primeros modelos de redes neuronales,se refiere a redes perceptron multicapa con funciones de ac-tivacion sigmoidales que son entrenadas mediante algoritmosde aprendizaje de Backpropagation.

V-4. Red neuronal oscilatoria (ONN): La teorıa de estared se basa en los estımulos con osciladores periodicas sin-cronizadas en forma de grupos en la corteza visual y esposible que sirvan para detectar caracterısticas en una escenavisual, partiendo de esto, se modelan redes con caracterısticasosciladoras que van sincronizando segun el patron de entrada.Un ejemplo de esta red es el modelo de LEGION (locallyexcitatory globally inhibitor oscillator network) en el cual laoscilacion se genera a partir de la retroalimentacion de unvecindario de unidades excitables y un inhibidor, en otraspalabras, cada unidad excitable es estimulada de forma pro-porcional a cada entrada formando una retroalimentacion conel inhibidor y se crea una oscilacion cuya forma depende delestimulo de entrada.

V-5. Red neuronal Pulso-Acoplada (PCNN): La red seimplementa en un modelo de una neurona por pıxel y suarquitectura tiene tres modulos principales: arbol de dentritas,encadenamiento y generador de pulsos. El arbol recibe lainformacion del vecindario y se procesa en el modulo deencadenamiento y el feeding (otra parte de la red que contienetambien valores de entrada), el generador de pulsos tiene unumbral dinamico que se basa en el proceso interno que tienela neurona en el feeding y el modulo de encadenamiento.

V-6. Red neuronal recurrente (RNN): Tienen conexio-nes formando un ciclo directo, esto permite comportamientodinamicos pero con el coste de consumo de mas memoriaque las redes directa. Ejemplos de la red: Hopfield, RNNbidireccional y RNN tiempo continuo.

V-7. Red neuronal con funciones base radial (RBFNN):Son redes que contienen funciones de activacion de base radialque cumplen cierto criterio, generalmente estas funcionesde activacion tienen un comportamiento gaussiano, lo cualconsiste en una red de tres capas: (1) entrada, (2) caja negraque contiene funciones de base radial no lineal y (3) salida.

V-8. Red neuronal probabilisticas (RPNN): En estos tiposde redes se encuentran red neuronal probabilıstica, el algoritmode mezclas gaussianas y la red neuronal aleatoria. La redneuronal probabilıstica consta de cuatro capas, la cual laprimera recibe los datos de entrada, la segunda dispone de unconjunto de neuronas totalmente conectadas con las neuronasde la primera capa con funciones de activacion dada por:

φjk(x) = (1

(√2πσ)d

)exp(− 1

2σ2(x − mx

jk)2). Donde d es

el tamano del vector, x es la entrada, mxjk es la media de j-

esimo vector de diferencia, k es la clase correspondiente y σ

8

es un parametro de suavizado. La tercera capa es una capa desuma que completa la estimacion de probabilidad y por ultimola capa final los clasifica la entrada de acuerdo a la decisionbayesiana.

V-9. Mapa Auto-Organizado de Kohonen (SOM): Es unared no supervisada que se basa en un proceso competitivodonde cada neurona en una red neuronal se vuelve sensitivaa las categorıas de los patrones de entrada. Esto es dado quese utiliza el aprendizaje competitivo para que las neuronas sinuna distribucion de datos especificas se vaya aproximando ala distribucion de los datos de entrada.

VI. CONCLUSIONES

El reconocimiento de patrones es un paso fundamental parael analisis e interpretacion de una imagen digital, lo cualpermitira ajustar clases de acuerdo a caracterısticas relevantesque presenten los objetos. Aunque hay una gran diversidad demetodos de clasificacion (heurısticas, matematicas, linguısticasy redes neuronales), estos ventajas y desventajas para elreconocimiento de patrones. Los metodos mas empleados sonclasificadores estadısticos y redes neuronales.

Este trabajo menciona en forma general algunos de losclasificadores (estadısticos y redes neuronales) mas usados.El cual se logro conocer la gran diversidad de modelos queexisten para el reconocimiento de patrones.

Por ultimo cabe mencionar que la descripcion de los cla-sificadores es tan solo muy general, para lograr entendersu funcionamiento, ventajas y desventajas, se requiere unarevision mas profunda.

REFERENCIAS

[1] R.M. Ayala and M. Menenti. Metodologıa para labusqueda del mejor clasificador de imagenes de satelite.Teledeteccion, medio ambiente y cambio global, pages469–472, 2001.

[2] Osvaldo Cairo and Sivia Guardati Buemo. Estructura dedatos. Mcgraw-Hill, Mexico, 1997.

[3] Enrique Calot. Reconocimiento de patrones en imagenesmedicas basado en sistemas inteligenes. Tesis de licen-ciatura, Facultad de ingenierıa. Universidad de BuenosAires, Buenos Aires, Argentina, 2008.

[4] Emilio Chuvieco Salinero. Teledeteccion ambiental: laobservacion de la tierra desde el espacio. Ariel ciencias,3ra edition, 2008.

[5] Crhistian Correa, Constantino Valero, and Pilar Barreiro.Procesamiento de imagenes para la identificacion de uvay follaje usando tecnicas de clasificacion no supervisadas.In IV Congreso de estudiantes universitarios de ciencia,tecnologıa e ingenieria agronomica, pages 53–56, 2011.

[6] R. De la Rosa Flores. Procesamiento de imagenesdigitales. In X congreso Nacional en Informatica y

computacion, pages 1–5, Puebla, Mexico, 08 al 12 deOctubre 2007. Instituto tecnologico de puebla.

[7] Michael J de Smith, Michael F Goodchild, and Paul ALongley. Geospatial analisys: a comprehensive guideto principles, techniques and softwares tools. Matador,2007.

[8] Tzitziki Janik Garcıa Mora and Jean Francois Mas. Com-paracion de metodologıas para el mapeo de la coberturay uso del suelo en el sureste de mexico. InvestigacionesGeograficas, Boletın del Instituto de Geografıa, UNAM,(67):7–19, 2008.

[9] J. L. Gil, E. B. Garcıa, D. R. Ponvert-Delisle, R. Sanchez,and M. B. Vega. Enfoques para la clasificacion digital deimagenes mono y multiespectrales y su implementacionen el software cubano TN Estudio V2.0. Revista deteledeteccion, 20:35–52, 2003.

[10] Rafael C. Gonzales and Richard E. Woods. Tratamientodigital de imagenes. Addison-Wesley, Diaz de Santos,1996.

[11] Jean Francois Mas. Aplicaciones del sensor MODIS parael monitoreo del territorio. SEMARNAT, INE, UNAMy CIGA, 2011.

[12] Abdelmalik Moujahid, Inaki Inza, and Pedro Larragana.Tema 5. clasificadores k-nn. S/F.

[13] Juan Ramırez Q. and Mario I. Chacon M. Redes neu-ronales artificiales para el procesamiento de imagenes,una revision de la ultima decada. Revista de ingenierıaelectrica, electronica y computacion, 9(1):7–16, 2011.

[14] Victor Rodrıguez Doncel. Entrenador para el controlde protesis mioelectricas. http://vroddon.sdf-eu.org/emg/proy.pdf, 2001. Accesado: 22 de Enero de 2013.

[15] Harold A. Romo R., Fabian Ramırez M., and RidierValdivieso B. Deteccion del bacilo mycobacterium tu-berculosis mediante reconocmiento de patrones. Avancesen sistemas e informatica, 4(3):111–166, 2007.

[16] Jose M. Salinas and Carmen Porras. Fundamento psi-cofisico del reconocmiento de patrones. Psicothema,5(001):161–172, 1993.

[17] Cecilia Veronica Sanz. Razonamiento evidencial dinami-co: Un metodo de clasificacion aplicado al analisis deimagenes hiperespectrales. Tesis doctoral, UniversidadNacional de La Plata. Facultad de Ciencias Exactas,Argentina, 2002.

[18] Eddie Angel Sobrado Malpartida. Sistema de vision ar-tificial para el reconocimiento y manipulacion de objetosutilizando un brazo robot. Tesis de maestrıa, PontificiaUniversidad Catolica del Peru, Peru, 2003.

[19] Kenneth Walker. Other iris from ken walker’s gar-den. http://home.astound.net/∼kenww/my garden/otheriris.htm, 1999-2003.

Technology

Reconocimiento de patrones y métodos de clasificación en imágenes digitales