Clasificación y Agrupamiento
Características para la extracción de datos
• Siempre que se haga una clasificación se deben tener bien definido las variables de interés.
• Existen dos tipos de características principales en las ciencias biomédicas.– Características biomédicas y biológicas.– Características de señales biomedicas y
procesamiento de imagen.
Características biomédicas y biológicas.
• Son definidas por el conocimiento biológico y medico disponible de los sistemas biológicos que se estudian.
• Y son propuestos por los especialistas en estas ramas
Características de señal y procesamiento de imagen.
• Este tipo de características son las que un especialista medico o biólogo, no tiene el conocimiento para identificarlas y que describen al sistema biológico.
– Energía de la señal en banda de frecuencias – Medidas de las onduletas– Medidas complejas– Medidas geométricas– Descriptores de fourier
Energía de la señal en banda de frecuencias
• El contenido de una señal en diferentes bandas de frecuencias cuantitativamente expresa las características que son vitales en el diagnostico de señales biomédicas. – En el EEG´s se tienen diferentes ondas• Ondas ß: frecuencias entre 14 y 30 Hz• Ondas : Frecuencias entre 8 y 13 Hz• Ondas : entre 4 y 7 Hz• Ondas : Frecuencias inferiores a 3.5 Hz
Medidas de las onduletas (wavelet)
• Estas proporcionan un numero de coeficientes que descompone una señal a diferentes escalas.
• Son normalmente usados para clasificación y agrupamiento de señales biológicas e imágenes.
Medidas complejas
• Cuantitativamente describe la sofisticada estructura de los sistemas biológicos– Fractal dimensional expresa la complejidad de una
señal y tiene gran importancia en técnicas de procesamiento de señales biológicas.
– Movilidad– Complejidad– Entropía
Medidas geométricas
• Son importantes en le clasificación de una imagen, y algunas son:
• Área. Que nos proporciona el tamaño del objeto de una imagen. Mostrándonos el numero de píxeles que conforman el objeto
• Perímetro. Es el numero de píxeles que forman el contorno que distingue al objeto con el fondo de la imagen.
Compacticidad
• Es una característica que nos indica que tanta área esta inmersa en un perímetro, es decir que tan compacto es el objeto
Area
PerimetrodadCampactici
2
Eje mayor y Eje menor
• El eje mayor es la mayor distancia que existe entre un par de píxeles que componen al objeto.
• Un eje perpendicular al eje mayor es llamado eje menor
• Estas medidas son importantes para la clasificación de células
Excentricidad
• Esta definido al evaluar la desviación de la forma del objeto y la similitud que tiene con una forma circular.
• Y esta definido por la siguiente formulamenorejedelLonjitud
mayorejedelLonjituddadExcentrici
Descriptores de fourier (DF’s)
• Esencialmente son transformadas discretas de fourier que representan el contorno, a través de series de fourier
• Invariantes en trasformaciones geométrica y tolerantes al ruido
El algoritmo de k-medias.
• Uno de las técnicas mas populares usadas en el análisis de imágenes y en señales biomédicas
• Esta basado en k particiones.
Clasificador bayesiano
• Un clasificador Bayesiano es una clasificador probabilístico que se basa en aplicar el Teorema de Bayes.
• Se tienen N elementos que pueden provenir de dos o más poblaciones distintas de un universo particionado en K clases. Cada elemento x puede considerarse como una variable aleatoria de dimensión n, en donde n es el número de características retenidas para representar al patrón. El problema consiste en clasificar x en una y sólo una de las poblaciones o clases.