8
Prototipo funcional de apoyo en la identificación de la Incompetencia Labial en niños en edades de 5 a 12 años Romina Robert Pérez 1 , Yadisbel Martínez Cañete 2 , Javier Lozada García 3 , Leaned M. Quintana Vivanco 4 , Vladimir Ortiz Grave de Peralta 5 1 Dpto. de Ing. Biomédica, Facultad de Ingeniería Eléctrica, Universidad de Oriente, Santiago de Cuba, Cuba 2, 4, 5 Dpto. de Ing. Informática, Facultad de Ingeniería Eléctrica, Universidad de Oriente, Santiago de Cuba, Cuba 3 Instituto Superior de Ciencias Médicas, Facultad de Estomatología, Santiago de Cuba, Cuba E-mail: [email protected] Abstract. The present paper contains an investigation, resulting in a methodology that allows through the use of computational vision techniques in images of children’s faces ages between 5 and 12 years old, the extraction of a group of particular characteristics in the mouth’s region, in order to find useful information about the labial incompetence identification. This methodology is exposed in three fundamental stages, selection of the mouth’s region of interesting, segmentation and parameterization of external and internal contours of the lips; and the proposal and computing of representative shape’s descriptors of lip’s morphology. It also presents the development and implementation of a working prototype, this prototype implement the methodology proposed and incorporates other functionalities corresponding to managing of patient’s information. 1. Introducción La Ortodoncia como ciencia dentro de la Estomatología es la encargada del estudio de la morfología tanto facial como bucal. Corresponde a ella además la prevención y corrección de las alteraciones existentes dentro de esta morfología. Uno de los componentes del aparato bucal lo constituyen los labios, estos participan en varias de las funciones del sistema estomatognático como son: la masticación, fonación, equilibrio bucal y dentario [1]. Dichas funciones muchas veces se ven afectadas a causa de la existencia de alteraciones en estos. Debido a las condiciones climáticas de Cuba y la alta prevalencia de problemas respiratorios, una de las alteraciones de mayor incidencia en nuestros niños es la denominada incompetencia labial. La incompetencia labial se define como un incorrecto cierre de los labios, lo cual se relaciona con una disminución de la fuerza labial. Según algunos autores [2], se está en presencia de un incorrecto cierre labial cuando, encontrándose el paciente en posición de reposo, se exponen los incisivos superiores más de 3mm. En nuestro país han sido realizados varios estudios a fin de determinar patrones de normalidad de la fuerza labial, y han sido propuestos de igual manera tratamientos para la recuperación de la función y la fuerza muscular [3]. Uno de los mayores problemas en estos estudios está relacionado en cómo evaluar la efectividad de los tratamientos propuestos. En los trabajos relacionados en la literatura, esta XVIII Congreso Argentino de Bioingeniería SABI 2011 - VII Jornadas de Ingeniería Clínica Mar del Plata, 28 al 30 de septiembre de 2011

Prototipo funcional de apoyo en la identificación de la ... · Prototipo funcional de apoyo en la ... dentro del procesamiento digital de imágenes y la última al diseño e

Embed Size (px)

Citation preview

Page 1: Prototipo funcional de apoyo en la identificación de la ... · Prototipo funcional de apoyo en la ... dentro del procesamiento digital de imágenes y la última al diseño e

Prototipo funcional de apoyo en la identificación de la

Incompetencia Labial en niños en edades de 5 a 12 años

Romina Robert Pérez1, Yadisbel Martínez Cañete

2, Javier Lozada García

3,

Leaned M. Quintana Vivanco4, Vladimir Ortiz Grave de Peralta

5

1 Dpto. de Ing. Biomédica, Facultad de Ingeniería Eléctrica, Universidad de Oriente,

Santiago de Cuba, Cuba 2, 4, 5

Dpto. de Ing. Informática, Facultad de Ingeniería Eléctrica, Universidad de

Oriente, Santiago de Cuba, Cuba 3 Instituto Superior de Ciencias Médicas, Facultad de Estomatología, Santiago de

Cuba, Cuba

E-mail: [email protected]

Abstract. The present paper contains an investigation, resulting in a methodology that allows

through the use of computational vision techniques in images of children’s faces ages between

5 and 12 years old, the extraction of a group of particular characteristics in the mouth’s region,

in order to find useful information about the labial incompetence identification. This

methodology is exposed in three fundamental stages, selection of the mouth’s region of

interesting, segmentation and parameterization of external and internal contours of the lips; and

the proposal and computing of representative shape’s descriptors of lip’s morphology. It also

presents the development and implementation of a working prototype, this prototype

implement the methodology proposed and incorporates other functionalities corresponding to

managing of patient’s information.

1. Introducción La Ortodoncia como ciencia dentro de la Estomatología es la encargada del estudio de la morfología

tanto facial como bucal. Corresponde a ella además la prevención y corrección de las alteraciones

existentes dentro de esta morfología.

Uno de los componentes del aparato bucal lo constituyen los labios, estos participan en varias de

las funciones del sistema estomatognático como son: la masticación, fonación, equilibrio bucal y

dentario [1]. Dichas funciones muchas veces se ven afectadas a causa de la existencia de alteraciones

en estos. Debido a las condiciones climáticas de Cuba y la alta prevalencia de problemas respiratorios,

una de las alteraciones de mayor incidencia en nuestros niños es la denominada incompetencia labial.

La incompetencia labial se define como un incorrecto cierre de los labios, lo cual se relaciona con

una disminución de la fuerza labial. Según algunos autores [2], se está en presencia de un incorrecto

cierre labial cuando, encontrándose el paciente en posición de reposo, se exponen los incisivos

superiores más de 3mm.

En nuestro país han sido realizados varios estudios a fin de determinar patrones de normalidad de la

fuerza labial, y han sido propuestos de igual manera tratamientos para la recuperación de la función y

la fuerza muscular [3]. Uno de los mayores problemas en estos estudios está relacionado en cómo

evaluar la efectividad de los tratamientos propuestos. En los trabajos relacionados en la literatura, esta

XVIII Congreso Argentino de Bioingeniería SABI 2011 - VII Jornadas de Ingeniería Clínica Mar del Plata, 28 al 30 de septiembre de 2011

Page 2: Prototipo funcional de apoyo en la identificación de la ... · Prototipo funcional de apoyo en la ... dentro del procesamiento digital de imágenes y la última al diseño e

efectividad se propone a evaluarse mediante la realización de un conjunto de mediciones físicas con

seguimiento en el tiempo. Este método, debido en gran medida al trabajo con niños es un proceso

engorroso y que además está sujeto a un alto factor subjetivo.

De lo anterior se destaca la necesidad de la existencia de sistemas automatizados de apoyo con este

fin. Como paso inicial al desarrollo de un sistema similar, en el presente trabajo se propone, mediante

el empleo de técnicas de visión computacional en imágenes de rostros de niños en edades de 5 a 12

años, una metodología para la extracción de un conjunto de características particulares pertenecientes

a la región correspondiente a la boca, y la implementación de ésta en un prototipo funcional de apoyo

al diagnóstico.

El trabajo se muestra en 4 etapas fundamentales, tres de estas dedicadas a la metodología propuesta

dentro del procesamiento digital de imágenes y la última al diseño e implementación del prototipo.

Dentro de la metodología propuesta se presentan las técnicas empleadas para la selección de la región

de la boca a partir de la imagen inicial mediante el método de Viola & Jones, la segmentación y

parametrización de los contornos externos e internos de los labios haciendo uso de los contornos

activos y de métodos de análisis de las componentes de color, y por último el cálculo de un conjunto

de descriptores de forma, a fin de representar la información de utilidad en la determinación de la

incompetencia labial.

2. Metodología Propuesta

2.1. Captura y Preprocesamiento

Se utilizaron imágenes de fotografías de niños en edad escolar en posición facial de descanso

establecida según indicaciones de un especialista, situados en fondo blanco y sin accesorios que

alterasen el aspecto facial. La adquisición de las imágenes se realizó a través de una cámara digital

(Canon Power Shot A630), sin controlar condiciones de iluminación y a una distancia focal estándar

de 1 m. Estas imágenes son tomadas a color, representadas en el espacio RGB y en formato jpg, con

resoluciones espaciales de 3264x2448, y con una profundidad de 8 bits por canal de color.

Dado que no se conoce el tipo de ruido introducido por el dispositivo de captura y teniendo en

cuenta las propiedades que presenta este, se aplica un filtro gaussiano para la atenuación del ruido [4].

Debido a que las condiciones de iluminación durante la captura de las imágenes fueron variables, se

realiza un ajuste del brillo y ecualización del histograma a fin de homogeneizar los parámetros de

brillo y contraste.

Las fotografías tomadas corresponden a información no solo del rostro sino que contemplan

además parte del busto de los niños. Debido a esto se propone como primer paso un seccionamiento de

la región correspondiente al rostro, desechando así una gran cantidad de información que no es de

interés. Luego, se procede a la localización de la región de la boca en específico, empleándose para

esto solamente la mitad inferior de la imagen seccionada.

Para la realización de ambos procedimientos se emplea el conocido algoritmo propuesto por Viola

& Jones [5]. De manera general el mecanismo empleado por este algoritmo es; primeramente realizar

una transformación de la imagen generando una nueva, denominada imagen integral, posteriormente

realizar la extracción de características mediante filtros con base Haar, y por último se aplica la técnica

de boosting (algoritmo de AdaBoost) para la construcción de clasificadores en cascada [5] [6].

Una vez aplicado dicho algoritmo se obtiene una imagen constituida por una región de interés

(ROI) rectangular correspondiente a un acotamiento de la zona de la boca. El proceso de detección

aparece plasmado de manera general en la figura 1.

XVIII Congreso Argentino de Bioingeniería SABI 2011 - VII Jornadas de Ingeniería Clínica Mar del Plata, 28 al 30 de septiembre de 2011

Page 3: Prototipo funcional de apoyo en la identificación de la ... · Prototipo funcional de apoyo en la ... dentro del procesamiento digital de imágenes y la última al diseño e

Figura 1. Esquema general del

proceso de detección

2.2. Segmentación de la Región de la Boca

Dada la forma que describen los labios y el desempeño de estos en trabajos anteriores similares, se

decide emplear el método de contornos activos paramétricos o snakes para realizar la segmentación de

los contornos externos de los labios. El snake se define como una curva plana, que se deforma en el

tiempo, ajustándose a los objetos representados en una imagen [7]. La deformación del contorno

activo en el dominio de la imagen, se especifica a través de una función de energía. Dicha función es

una combinación ponderada de fuerzas internas y externas, en términos de distintas propiedades

definidas, como se expresa en la siguiente formulación:

[ ]dssVexterna

EsVerna

Esnake

Energía ∫ +=1

0

))(())((int

(1)

Este método requiere de una inicialización previa cercana al objeto que se desea segmentar. En

este caso se toma la inicialización como la elipsis inscrita en la imagen correspondiente a la ROI de la

zona de la boca, anteriormente obtenida. Se procede además a realizar un recorte elíptico a partir de

ésta. Este recorte restringe la región de interés reduciendo la presencia de regiones de alto gradiente en

la imagen que no son de utilidad y que podrían entorpecer la adecuada convergencia del snake.

La imagen sobre la cual se sitúa el snake es la imagen previamente binarizada luego de emplear el

operador de canny [4]. El empleo de este operador se justifica en la necesidad de la existencia de

grandes cambios de gradiente para un buen funcionamiento del contorno activo, debido a que la única

fuerza externa incluida en la implementación de este modelo es la fuerza del gradiente. La obtención

final del snake así como la segmentación obtenida se muestran en la siguiente figura.

Figura 2. Imagen resultante de superponer el contorno

obtenido mediante la aplicación del snake en una

XVIII Congreso Argentino de Bioingeniería SABI 2011 - VII Jornadas de Ingeniería Clínica Mar del Plata, 28 al 30 de septiembre de 2011

Page 4: Prototipo funcional de apoyo en la identificación de la ... · Prototipo funcional de apoyo en la ... dentro del procesamiento digital de imágenes y la última al diseño e

imagen de muestra (a).Imagen correspondiente al

resultado final de la segmentación obtenida (b).

Una vez realizada la segmentación externa de los labios se procede a la segmentación interna de

estos. Un primer análisis podría ser el empleo del mismo modelo de contornos activos. La cuestión en

ello radica en el tipo de inicialización a emplear. Dado que las imágenes de análisis corresponden a

posturas labiales en descanso, éstas presentan en el área delimitada por los contornos internos de los

labios, información correspondiente a los dientes, o al interior de la boca, lo cual para un buen

funcionamiento del snake hace impracticable una inicialización interna del mismo. En cuanto a la

inicialización externa, la zona de los labios posee altos cambios de gradiente antes de llegar a los

contornos internos de estos, por lo cual no se considera tampoco conveniente.

En la literatura han sido propuestas algunas transformaciones lineales del espacio de color RGB,

lográndose en términos de separabilidad de color entre labios, piel y otras características presentes en

el rostro, buenos resultados [8]. Siguiendo esta idea, se resalta la información del área de la boca

mediante la componente de color (R) del espacio de color RGB. Luego mediante la realización de un

análisis estadístico se determina un umbral a partir del cual se binariza la imagen, extrayendo aquellos

pixeles que tengan mayor ocurrencia de color rojo. En la figura a continuación se muestra, a la

izquierda el resultado de la binarización anterior, y a la derecha, el resultado de superponer en la ROI

de la imagen de muestra, la segmentación final obtenida tanto externa como interna de los labios.

Figura 3. Imagen umbralizada resultante de aplicar un

análisis de la componente roja en la imagen de muestra

(a). Imagen resultante de superponer los contornos

tanto internos como externos (b).

2.3. Extracción de características

Según los modelos propuestos en la literatura [9], entre los puntos que se definen característicos en la

descripción de la boca, están los correspondientes a las dos esquinas horizontales de la boca (izquierda

y derecha), los puntos horizontales a la boca, representados como p1, p2, p7 y p8 en la figura 4; los

puntos de las dos esquinas verticales de la boca (superior e inferior) y los puntos verticales internos al

labio, en la figura 4 representados por p3, p4 y p5, p6, respectivamente.

Estos puntos definen un conjunto de métricas, entre las cuales las más empleadas para el análisis de

alteraciones morfológicas en los labios, están, la distancia existente entre los puntos p1 y p2 conocida

como el ancho intercomisural, y la distancia entre los puntos p5 y p6 establecido como el interlabial

gap o distancia entre los stomions.

Siguiendo la propuesta de estos modelos se extraen inicialmente los cuatro puntos correspondientes

a p1, p2, p3 y p4. La búsqueda de estos puntos se realiza empleando un sencillo algoritmo dentro del

bounding box externo o caja externa que limita la boca. Para la búsqueda de los puntos p5 y p6 se

realiza el mismo procedimiento que en el caso anterior reajustando dicha caja a la región interna de los

labios. En la figura 4 puede observarse en líneas discontinuas ambas representaciones del bounding

box.

XVIII Congreso Argentino de Bioingeniería SABI 2011 - VII Jornadas de Ingeniería Clínica Mar del Plata, 28 al 30 de septiembre de 2011

Page 5: Prototipo funcional de apoyo en la identificación de la ... · Prototipo funcional de apoyo en la ... dentro del procesamiento digital de imágenes y la última al diseño e

Figura 4. Ubicación de puntos empleados en el

cálculo de métricas propuestas en la descripción de

la boca.

Además del cálculo de las dos métricas explicadas en lo anterior, se calculan 3 descriptores de la

morfología de la boca, estos son:

• El perímetro de la región interna de los labios, definido como la suma de las distancias de los

segmentos determinados por puntos subsecuentes.

• La relación entre el eje horizontal y vertical de la región interna, definida como:

pp

pp

HVIR

56

78

−=

(2)

• El área correspondiente a la región interna de los labios denominada área interlabial. La zona

que corresponde a esta se muestra en la figura 4 sombreada en color azul y es calculada

mediante la siguiente ecuación:

11 1

2/1 −−∑= −=

iyixiy

n

i ix

RIA

(3)

2.4. Prototipo Funcional

Para el desarrollo del prototipo funcional se emplea como metodología de desarrollo la Programación

Extrema (XP), esta selección estuvo supeditada fundamentalmente a las facilidades que brinda ésta

como metodología ágil, y como lenguaje de modelado se utilizó el Lenguaje Unificado de Modelado

(UML).

Se propone como IDE de desarrollo el C++ Builder versión 6, haciendo éste uso para el

procesamiento de imágenes de la librería OpenCV (Open source Computer Vision library). Esta

librería es abierta y orientada a objetos. Se diseñó además una base de datos para la gestión de la

información referente a los pacientes y las imágenes tomadas, para su diseño e implementación se

emplea como gestor de Microsoft Access 2010.

Algunos de los requerimientos funcionales con los que cuenta el sistema son:

RF1. Gestionar los datos del paciente

RF1.1. Registrar los datos del paciente

RF1.2. Modificar los datos del paciente

RF1.3. Eliminar los datos del paciente

RF2. Gestionar Consulta

RF2.2. Calcular descriptores

RF3. Configuración del Sistema

RF3.1. Cambiar el origen de la Base de Datos

RF3.2. Cambiar el destino de las imágenes

Dentro de los requerimientos de software con que se deben contar para el funcionamiento del

prototipo están, tener instalado el Sistema operativo Windows XP o superior y contar con el gestor de

base de datos Microsoft Access 97-2003 o superior. En cuanto al Hardware se recomienda un

XVIII Congreso Argentino de Bioingeniería SABI 2011 - VII Jornadas de Ingeniería Clínica Mar del Plata, 28 al 30 de septiembre de 2011

Page 6: Prototipo funcional de apoyo en la identificación de la ... · Prototipo funcional de apoyo en la ... dentro del procesamiento digital de imágenes y la última al diseño e

procesador a 2.66 GHz o superior, memoria RAM de 256 Mb ó superior y un espacio mínimo en disco

de 200 MB.

El cálculo de los descriptores se realizó sobre 3 imágenes tomadas por niño a fin de que el

especialista contara con un margen de exactitud mayor y bajo criterios de bioestadísticas. La razón

final del diagnóstico es emitida por el especialista y almacenada en la Base de datos.

A continuación se muestra un compendio de las ventanas de interfaz principales, la ventana con

nombre SILAB es la interfaz inicial del Prototipo, la ventana con nombre Imagen3 muestra los

resultados de la segmentación interna a partir de la cual se determinan los descriptores propuestos,

siendo los resultados de estos mostrados en la ventana nombrada Calcular Parámetros.

Figura 5. Interfaces generales del prototipo funcional.

3. Experimentos y Resultados

Con el objetivo de realizar la evaluación de la metodología propuesta, se tomaron imágenes

provenientes de 70 niños en edad escolar primaria, pertenecientes a la escuela “Miguel Angel Cano”

de la provincia de Santiago de Cuba, Cuba. De ellos según diagnósticos previos por especialistas, 24

padecían de labios incompetentes. La toma de las imágenes fue realizada según el protocolo explicado

en la sección de captura y preprocesamiento y por cada niño se tomaron 3 imágenes, obteniéndose una

muestra total de 210 imágenes.

El prototipo funcional fue puesto a prueba de los especialistas médicos que colaboran con el

proyecto; a fin de evaluar la eficiencia de los descriptores calculados en la discriminación del estado

de incompetencia labial del estado de normalidad, se valoraron los porcientos de aciertos que emitían

cada uno de ellos individualmente en la clasificación establecida por los especialistas. De este análisis

resultan ser los más identificativos el área interlabial y el interlabial gap, quedando establecidos los

valores de normalidad para estos, en un rango de 0 a 150 pixeles cuadrados y de 0 a 8 pixeles

respectivamente. Los valores por encima de estos rangos son considerados valores correspondientes a

la presencia de incompetencia labial. Pese a esto, se cree necesario antes de emitir un criterio del todo

concluyente, estudiar a más profundidad los resultados obtenidos mediante los otros descriptores

propuestos, el comportamiento de estos valores ante cambios en la muestra, así como la relación

XVIII Congreso Argentino de Bioingeniería SABI 2011 - VII Jornadas de Ingeniería Clínica Mar del Plata, 28 al 30 de septiembre de 2011

Page 7: Prototipo funcional de apoyo en la identificación de la ... · Prototipo funcional de apoyo en la ... dentro del procesamiento digital de imágenes y la última al diseño e

existente entre el parámetro de la fuerza labial como método estándar de diagnóstico actualmente y

estos descriptores.

Cabe destacar que del conjunto de las imágenes iniciales a procesar se extraen aquellas en las

cuales los resultados obtenidos en la etapa de segmentación no eran correctos. Estos problemas se

deben a que, al fundamentarse el método de segmentación del área interna de los labios en

características de color, los resultados obtenidos en niños de tez clara y trigueña varían respecto a los

niños de tez oscura. En la siguiente figura se evidencian algunos ejemplos de los resultados obtenidos

durante la etapa de segmentación interna ante variaciones de color de la piel.

Figura 6. Imágenes correspondientes al resultado

obtenido luego de aplicar la segmentación interna

(izquierda) y ubicación de los puntos característicos

(derecha) en fotografías de niños de tez clara y

trigueña (a) (b) (c). Imágenes correspondientes al

resultado obtenido luego de aplicar la segmentación

interna (izquierda) y ubicación de los puntos

característicos (derecha) en fotografías de niños de

tez oscura (d) (e).

XVIII Congreso Argentino de Bioingeniería SABI 2011 - VII Jornadas de Ingeniería Clínica Mar del Plata, 28 al 30 de septiembre de 2011

Page 8: Prototipo funcional de apoyo en la identificación de la ... · Prototipo funcional de apoyo en la ... dentro del procesamiento digital de imágenes y la última al diseño e

4. Conclusiones y Recomendaciones El presente trabajo, evidencia la posibilidad de extracción de un pequeño conjunto de características a

partir de imágenes de rostro de niños, mediante las cuales es posible la determinación de la presencia o

no de incompetencia labial. Es necesario señalar que las técnicas propuestas tanto del procesamiento

como descripción contemplan un moderado costo computacional.

Dado que el método de segmentación del área interna de los labios se basa en transformaciones de

color se presentan problemas con la segmentación en las imágenes de niños de tez oscura. A fin de

disminuir estos problemas se propone el empleo de otras transformaciones basadas en el espacio de

color RGB que mejore la ubicación de los pixeles de color rojo, por ejemplo la transformación del

mapa de la curva cromática.

Se propone además la inclusión y evaluación de otros descriptores de forma tales como el factor de

forma, la redondez entre otros. Se valora además conveniente efectuar las evaluaciones en un conjunto

de imágenes más grande, con el objetivo de poder medir con mayor precisión la efectividad de los

descriptores.

Referencias [1] Manus A, Díaz G. (1983) Sistema estomatognático. Santiago (Chile): Facultad de Odontología,

Universidad de Chile. 206-59.

[2] Roth, Ricketts and Rott, Rountable (1989) Orthodontic treatment with the bioprogress technic.

California.15-17.

[3] García González, Soto L. Fuerza labial superior en niños. At

http://www.ucmh.sld.cu/rhab/articulo_rev8/fls.htm.

[4] Pajares G., De la Cruz J. M. (2002) Visión por Computador. Primera edición. Editorial

AlfaOmega / Ra-Ma, México,

[5] Guevara, M., Echeverry D., Ardila U. (2010).Detección de rostros en imágenes digitales usando

clasificador en cascada. Scientia Et Técnica. Vol. XIV. Núm. 38. pp. 1-5. Universidad

Tecnológica de Pereira. Colombia at

http://redalyc.uaemex.mx/src/inicio/ArtPdfRed.jsp?iCve=84903801

[6] Roa Edgar, Rivas Ricardo, Becerra José y Guerrero G. Neil. Diseño e implementación de una

herramienta computacional para soporte del análisis de la marcha empleando técnicas de

visión artificial.

[7] M. Kass, A. Withkin, D. Terzopoulos.(1988) Snakes: Active contour model. International,

Journal of Computer Vision.

[8] R.L. Hsu, Mottaleb, (2002) “Face Detection in Color Images”. IEEE Trans. Pattern Analysis

and Machine Intelligence, vol. 24, no. 5, pp. 696-706.

[9] Ceballos, Gómez, Prieto. (2009) seguimiento del contorno externo de la boca en imágenes de

vídeo. Revista de Ingenierías Universidad de Medellín, Vol. 8, Núm. Colombia

XVIII Congreso Argentino de Bioingeniería SABI 2011 - VII Jornadas de Ingeniería Clínica Mar del Plata, 28 al 30 de septiembre de 2011