93
INSTITUTO POLITÉCNICO NACIONAL UNIDAD PROFESIONAL INTERDISCIPLINARIA EN INGENIERÍA Y TECNOLOGÍAS AVANZADAS UPIITA "SISTEMA DE VISIÓN ARTIFICIAL PARA EL MONITORE DE LOS MOVIMIENTOS INVOLUNTARIOS DEL OJO" Trabajo Terminal Que para obtener el Título de "Ingeniero en Bíóníca" Presentan García Delgadillo Marco Antonio Montoya Raya Beatriz Adriana Asesores M. en C. Alvaro Anzueto Ríos M. en C. José de Jesús Garnica Verdiguel Dr. Reyes Haro Valencia México D.F. Junio del 2 O O 7

SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

INSTITUTO POLITÉCNICO NACIONAL

UNIDAD PROFESIONAL INTERDISCIPLINARIA EN INGENIERÍA Y TECNOLOGÍAS AVANZADAS

U P I I T A

"SISTEMA DE VISIÓN ARTIFICIAL PARA EL MONITORE

DE LOS MOVIMIENTOS INVOLUNTARIOS DEL OJO"

Trabajo Terminal

Que para obtener el Título de

"Ingeniero en Bíóníca"

Presentan

García Delgadillo Marco Antonio Montoya Raya Beatriz Adriana

Asesores

M. en C. Alvaro Anzueto Ríos M. en C. José de Jesús Garnica

Verdiguel

Dr. Reyes Haro Valencia

México D.F. Junio del 2 O O 7

Page 2: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

CONTENIDO

ÍNDICE DE TABLAS ................................................................................................................................... I

ÍNDICE DE FIGURAS ................................................................................................................................. II

OBJETIVO ................................................................................................................................................... IV

Objetivos particulares ............................................................................................................................... IV

RESUMEN ................................................................................................................................................... V

JUSTIFICACIÓN ......................................................................................................................................... VI

1 INTRODUCCIÓN ....................................................................................................................................... 3

1.1 RELACIÓN EXISTENTE ENTRE EL NISTAGMO HORIZONTAL Y LAS ONDAS

CEREBRALES .............................................................................................................................. 3

2 MARCO TEÓRICO ...................................................................... '. ........................................................... 6

2.1 ONDAS CEREBRALES ................................................................................................................. 6

2.2 SUEÑO .......................................................................................................................................... 9

2.3 TÉCNICA HEMI-SYNC .................................................................................................................. 10

2.4 NISTAGMO .................................................................................................................................... 12

2.4.1 NISTAGMO CONGÉNITO ................................................................................................... 13

2.4.2 NISTAGMO ADQUIRIDO .................................................................................................... 13

2.4.3 TIPOS DE NISTAGMO ........................................................................................................ 14

2.5 MÉTODOS PARA DETECTAR EL NISTAGMO ............................................................................. 15 2.5.1 MÉTODOS NO INVASIVOS ................................................................................................ 15

2.5.1.1 MÉTODOS DE CONTEO .......................................................................................... 15

2.5.1.2 MÉTODO POR TELEVISIÓN ................................................................................... 15

2.5.1.3 OBSERVACIÓN DEL DISCO ÓPTICO ..................................................................... 16

2.5.1.4 ELECTROOCULOGRAMA O ELECTRONISTAGMOGRAFÍA ................................. 16

2.5.1.5 VIDEOOCULOGRAFÍA ............................................................................................. 17

2.5.2 MÉTODOS INVASIVOS ...................................................................................................... 17 2.5.2.1 ESPEJO EN EL GLOBO OCULAR........................................................................... 17

2.5.2.2 MÉTODO DEL LENTE DE CONTACTO CON BARRA ............................................. 18

2.5.2.3 MÉTODO USANDO UNA BOBINA MAGNÉTICA DE RASTREO............................. 18

2.5.2.4 MÉTODO DEL ACELERÓMETRO ........................................................................... 19

2.6 BIOFÍSICA DE LA VISTA .............................................................................................................. 19 2.6.1 ÓPTICA ............................................................................................................................... 19

2.6.1.1 LENTE ....................................................................................................................... 20 2.7 OJO ............................................................................................................................................... 21

2.7.1 MOVIMIENTOS DEL OJO. MOVIMIENTOS OCULARES BÁSICOS................................... 21 2.7.1.1 DINÁMICA DEL OJO ................................................................................................ 23

2.7.1.2 ACCIÓN DE LOS MÚSCULOS OCULARES ........................................................... 24

2.7.1.3 MÚSCULOS SINERGISTAS Y ANTAGONISTAS ..................................................... 26

2.7.2 TIPOS DE MOVIMIENTOS OCULARES ............................................................................ 26 2.7.2.1 NECESIDAD DE LOS MOVIMIENTOS OCULARES ................................................. 26

2.7.2.2 CLASIFICACIÓN DE LOS MOVIMIENTOS OCULARES ......................................... 27

3 DESARROLLO

Page 3: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

3.1 ALGORITMOS ............................................................................................................................... 31

3.2 SISTEMA DE PROCESAMIENTO DE IMÁGENES ......................................................................... 32

3.3 SISTEMA DE COMPUTO ............................................................................................................... 32

3.4 CALIBRACIÓN DE LA CÁMARA .................................................................................................. 33

3.4.1 SEÑAL DE VIDEO .............................................................................................................. 33

3.4.2 TOOLBOX PARA LA CALIBRACIÓN DE LA CÁMARA EN MATLAB ................................ 33

3.5 DESCOMPOSICIÓN DEL FORMATO DE VIDEO VOB EN FORMATO AVI ................................... 38

3.6 MÉTODO PARA DETECTAR LA POSICIÓN DÉLOS OJOS ......................................................... 40

3.6.1 EXTRACCIÓN DEL CONTORNO ........................................................................................ 42 3.6.1.1 ESCALAMIENTO....................................................................................................... 42

3.6.1.2 OPERADORES MATEMÁTICOS MORFOLÓGICOS ............................................... 42

3.6.2 DETECTOR DE BORDES ..................................................................................................... 44 3.6.2.1 UMBRALIZADO ....................................................................................................... 45

3.6.2.2 REALCE DE CONTRASTE ....................................................................................... 46

3.6.2.3 DETECTOR DE BORDE DE RESIDUO DE DILATACIÓN MORFOLÓGICO ............ 47

3.6.3 DETECTOR DE CÍRCULOS ................................................................................................ 47 3.6.3.1 TRANSFORMADA DE HOUGH ................................................................................. 49

3.6.4 ESTIMACIÓN DE LA TRAYECTORIA .................................................................................. 49 3.6.4.1 CÁLCULO DE LA TRAYECTORIA ............................................................................ 50

3.6.4.2 VELOCIDAD DEL PIXEL .......................................................................................... 51

3.7 MECANISMO EMULADOR............................................................................................................ 51 3.7.1 MECANISMO EMULADOR DEL NISTAGMO ...................................................................... 51

3.8 GENERADOR DE ONDAS DIGITAL .............................................................................................. 54

3.9 SOPORTE PARA LA CÁMARA Y EL USUARIO .......................................................................... 57

4 ANÁLISIS DE RESULTADOS

4.1 ALGORITMOS ................................................................................................................................ 60

4.2 INTERPRETACIÓN DE LAS GRÁFICAS DEL SOFTWARE ALICE ............................................... 67

4.3 GENERADOR DE ONDAS ............................................................................................................. 71

5 CONCLUSIONES ...................................................................................................................................... 73 5.1 CONCLUSIONES ........................................................................................................................... 73

5.2 TRABAJO A FUTURO ................................................................................................................... 73

BIBLIOGRAFÍA ........................................................................................................................................... 77

APÉNDICE

ANEXO

Page 4: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

ÍNDICE DE TABLAS

Tabla 1, Ondas electroencefalográficas ........................................................................................... 7

Tabla 2. Movimientos del ojo dependiendo el músculo que actúa sobre él ......................................... 21

Tabla 3. Características de las computadoras disponibles ................................................................. 32

Page 5: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

ÍNDICE DE FIGURAS

Figura 2.1. Córtex cerebral ............................................................................................................ 7 Figura 2.2. Ritmos normales en electroencefalografia. Estados específicos del electroencefalograma ................................................................................................................... 9 Figura 2.3. Electrooculograma (EOG), Electromiograma (EMG) y Electroencefalograma (EEG) 9 durante las distintas fases del sueño ............................................................................................. Figura 2.4. Ondas detectadas en las fases del sueño ...................................................................... 10 Figura 2.5. Emisión y entrada de las dos ondas de diferente frecuencia ............................................. 12 Figura 2.6. Sumatoria o integración de las dos ondas emitidas a diferente frecuencia ...................... 12 Figura 2.7. Tono binaural .............................................................................................................. 12 Figura 2.8. Imitación de las ondas cerebrales mediante la técnica Hemi-Sync .................................... 12 Figura 2.9. Experimento de Verhijen ............................................................................................... 15 Figura 2.10. Diagrama de Mackworth y Mackworth (1958) ............................................................... 16 Figura 2.11. Potenciales comeo-retinales....................................................................................... 17 Figura 2.12. Representación del aparato de Adler y Fliegelman ....................................................... 18 Figura 2.13. Espejo con barra de Fender ....................................................................................... 18 Figura 2.14. Lente cilindrica .......................................................................................................... 20 Figura 2.15. Lentes convergentes .................................................................................................. 20 Figura 2.16. Lentes divergentes...................................................................................................... 20 Figura 2.17. Músculos extraoculares del ojo ....................... .„.......................................................... 21 Figura 2.18. Pares de fuerzas del globo ocular .................... "...̂ .'. .................................................... 22 Figura 2.19. Ducciones en el ojo derecho ...................................................................................... 23 Figura 2.20. Inserciones del ojo .................................................................................................... 23 Figura 2.21. Acciones del recto externo e interno en el ojo derecho ................................................... 24 Figura 2.22. Acción del recto superior ............................................................................................ 24 Figura 2.23. Acción del recto inferior ............................................................................................... 25 Figura 2.24. Acción del oblicuo superior .......................................................................................... 25 Figura 2.25. Acción del oblicuo inferior ........................................................................................... 25 Figura 2.26. Esquema de Baillart - Márquez ................................................................................... 25 Figura 2.27. Sistema vestibular del oído ......................................................................................... 27 Figura 2.28. Compensación de los movimientos de la cabeza mediante movimientos vestibulares.... 27 Figura 3.1. Cuadricula utilizada para llevara acabo la calibración .................................................... 34 Figura 3.2. Imágenes tomadas con la cámara web preliminar para llevar a cabo su calibración ........... 34 Figura 3.3. Marco de referencia a utilizar para llevar a cabo la calibración de la cámara web ............. 35 Figura 3.4. Imagen con la distorsión corregida ................................................................................ 35 Figura 3.5. Error de píxel en la imagen 1 ......................................................................................... 36 Figura 3.6. Error de píxel de todas las imágenes ............................................................................. 36 Figura 3.7. Posiciones 3D de las cuadriculas con respecto a la cámara web ..................................... 37 Figura 3.8. Cambio de vista "centro de cámara" avista "centro de mundo" ....................................... 37 Figura 3.9. Comparación de las imágenes tomadas por la cámara sin calibrar y calibrada .................. 38 Figura 3.10. Uso del programa VirtualDub para conversión de un video ............................................ 39 Figura 3.11. Selección del tipo de compresión, en este casoXVID .................................................. 39 Figura 3.12. Selección del audio .................................................................................................... 39 Figura 3.13. Guardar el video como avi .......................................................................................... 40 Figura 3.14. Selección del tipo de compresión (Uncompressed) ....................................................... 40 Figura 3.15. Diagrama a bloques del algoritmo propuesto ............................................................... 41 Figura 3.16. Diagrama de bloques conceptual del algoritmo de detección morfológico de bordes ........ 45 Figura 3.17. Diagrama a bloques conceptual del detector de bordes utilizado .................................... 46 Figura 3.18. Estructuración de elemento usado con este trabajo ..................................................... 47 Figura 3.19. Equivalencia de pixeles en número decimal ................................................................. 50 Figura 3.20. Circuito de la tarjeta controladora del servomotor ........................................................ 52 Figura 3.21. Microcontrolador PIC 16F876A (Ver Apéndice I) ........................................................... 52 Figura 3.22. Dimensiones del servomotor HS 31, acotación en mm ................................................. 53 Figura 3.23. Representación de una onda senoide con frecuencia de 450Hz .................................... 55 Figura 3.24. Representación de una onda Hemi-sync ..................................................................... 55 Figura 3.25. Representación de una onda de sonido ........................................................................ 55 Figura 3.26. En las tres primeras gráficas se pueden observar dos ondas seno de diferente frecuencia y una onda del tipo Hemi-sync, en las siguientes dos son las mismas ondas senos de

Page 6: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

entrada pero ya con la onda Hemi-sync sumada ............................................................................. 56 Figura 3.27. Aquí se observa la unión de la canción con las ondas ................................................... 56 Figura 3.28 Sonido con las ondas incluidas .................................................................................... 57 Figura 4.1. Delineado de la primera calibración de cámara .............................................................. 60 Figura 4.2. a) Imagen final con una capa de erosión, b) Imagen final con dos capas de erosión .......... 62 Figura 4.3. Detección del iris ......................................................................................................... 64 Figura 4.4a. Primeros 10 trames de un video .................................................................................. 65 Figura 4.4b. Detección, seguimiento y extracción de los círculos del iris ............................................ 65 Figura 4.5. Registro de movimientos oculares y EEG ..................................................................... 67 Figura 4.5a Desplazamiento del sujeto de prueba 1 ......................................................................... 66 Figura4.5b. Desplazamiento del sujeto de prueba 2 ........................................................................ 66 Figura4.5c. Desplazamiento del sujeto de prueba 3 ........................................................................ 67 Figura 4.6. En A se aprecian los movimientos normales de los ojos cuando esta leyendo, en B se aprecia un parpadeo .................................................................................................................... 68 Figura 4.7. Gráfica de un nistagmo ................................................................................................ 68 Figura 4.8. Movimientos Oculares Rápidos (fase MOR) .................................................................. 69 Figura 4.9. Conteo de movimientos oculares en lectura ................................................................... 69 Figura 4.10. En 1 se aprecia el nistagmo, y en 2 se puede ver un cambio en las ondas cerebrales.... 70 Figura 4.11. En 1 se observa el nistagmo, en 2 se ven ondas beta, y en 3 se observa ondas alfa ........ 70 Figura 4.12. Representación de las ondas en el software alice ......................................................... 71

Page 7: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

OBJETIVO GENERAL

Diseñar y construir un sistema de monitoreo para el estudio y caracterización del

movimiento involuntario horizontal del ojo.

OBJETIVOS PARTICULARES

• Desarrollar un algoritmo de visión artificial para llevar a cabo el

procesamiento de imágenes.

• Implementar la técnica Hemi-Sync.

• Diseñar y construir un mecanismo que interprete los datos proporcionados por un sistema de visión artificial, para emular los movimientos involuntario

horizontales del ojo.

• Diseñar y construir un soporte para el sujeto de prueba.

• Acoplar el sistema de monitoreo con el generador digital de ondas sonoras

Hemi Sync y el mecanismo que emula los movimientos involuntarios del ojo.

Page 8: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

RESUMEN

Palabras claves: Estudio, aplicación, sensor óptico, somnolencia, ondas cerebrales,

estado de vigilia, Hemi-Sync

El estudio de los movimientos involuntarios del ojo (nistagmo) y su reproducción mediante actuadores es abordado en éste trabajo.

Se llevará a cabo un estudio de las ondas cerebrales que se producen durante el estado

de relajación o somnolencia, ya que se tiene conocimiento de que cuando una persona

pasa del estado de vigilia alerta al estado de somnolencia o vigilia relajada hay un

cambio en las ondas cerebrales. Éste estudio pretende encontrar un patrón de los

movimientos involuntarios del ojo con los parámetros de los diferentes tipos de ondas

cerebrales, para comprobar que hay una correspondencia entre los movimientos, y el

estado de vigilia relajada del cerebro.

Para la realización del estudio se contó con la presencia de diez sujetos, los cuales

fueron privados de sueño toda una noche, con la finalidad de inducir el nistagmo por

agotamiento. En los sujetos donde éste se presento, mediante el uso de la técnica Hemi-Sync, se les indujo ondas del tipo BETA para'poner de nuevo al sujeto en estado

de vigilia alerta, y poder observar el comportamiento de los movimientos de sus ojos,

esperando como resultado la disminución o eliminación del movimiento nistagmico.

Por medio de un mecanismo y sensor óptico se monitorean los movimientos

involuntarios horizontales que el ojo realiza, así como su emulación.

ABSTRACT

The study and application of the nistagmo is subject of this work. Using a mechanism and

optic sensor, the horizontal involuntary eye movements are observed, as well as its

emulation. It will be carried out a study of the cerebral waves that take place during the

relaxation state or drowsiness, because is well known that when a person passes from

the state of alert vigil to the state of drowsiness or relaxed vigil there is a change in the cerebral waves.

These studies attempt to find a pattern of the involuntary eye movements with the

parameters of the different types of cerebral waves, to check if there is a correspondence

among the movements, and the state of relaxed vigil of the brain. For the realization of

the study, the help of ten persons deprived of dream an entire night is needed.

In the persons where nistagmo had been presented, by means of the Hemi-Sync

technique beta type cerebral waves will be induced to their brains, so that they return to a

state of alert vigil, and making it possible to watch the behavior of the eye movements,

waiting the decrease or elimination of the nistagmo as a result.

Page 9: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

JUSTIFICACIÓN

Una de las causas asociadas al vértigo es la presencia del nistagmo, el cual puede ser

del tipo congénito, esta relación es poco conocida y por ende poco estudiada.

Existe un nistagmo de fijación o mirada parética que se presenta según la fijación y se

amplia con la mirada lateral y cesa cuando desaparece la fijación; esto puede ser un

indicativo de diferentes anomalías como lo son: intoxicaciones del tipo tóxico

medicamentosas, enfermedad de Wemicke, esclerosis múltiple y gliomas protuberenciales.

El nistagmo en la mayoría de los casos provoca fatiga en los músculos extraoculares, y uno de los nistagmos más frecuentes asociado a la fatiga, es el nistagmo optocinético

que es inducido por la recepción de estímulos visuales en movimientos continuados y

con cierta cadencia, este se puede presentar mientras se conduce en estado de fatiga un

automóvil. Se sabe que cada año, al menos 100,000 accidentes de automóviles y 1,550

muertes por accidentes de tráfico son provocados por quedarse dormido al volante.

Por lo cual el estudio del nistagmo es requerido. Actualmente este es un campo poco

estudiado. En UPIITA no se tiene registro alguno sobre éste tema. Éste trabajo

contribuye a la investigación de los parámetros de medición y detección del movimiento

involuntario del ojo.

Page 10: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

CAPÍTULO 1

INTRODUCCIÓN

Page 11: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

1 INTRODUCCIÓN

El presente trabajo sustenta la propuesta de realizar un estudio sobre las ondas

cerebrales que están presentes cuando una persona se encuentra en estado de

somnolencia, así como el comportamiento del ojo en éste mismo estado (nistagmo).

Se abordan algunos aspectos sobre las ondas cerebrales interpretadas por la técnica

Hemi-Sync.

La técnica Hemi-Sync es un proceso que se ha ido puliendo alrededor de cuarenta años

por medio de investigación y experimentos, estos resultados revelan la influencia que hay

de ciertos patrones de sonidos sobre la conciencia [1]. Este tipo de influencias sobre la

conciencia se puede ver reflejado, por ejemplo, induciendo sueño o poniendo en estado

de alerta a un sujeto.

La técnica Hemi-Sync empalma señales de frecuencias diferentes, esto es, en el canal

derecho se encuentra mezclada una melodía con un sonido de baja frecuencia y en el

canal izquierdo la misma melodía con un sonido de baja frecuencia diferente al derecho,

dichas frecuencias son interpretadas por el cerebro produciendo una tercera de la

diferencia de las otras dos, dando como resultado un tipo de onda conocida como tono

binaural, que el cerebro valiéndose de los hemisferios en forma sincronizada reconocerá.

Esta onda ya reconocida inicia los cambios en la actividad cerebral.

El nistagmo es un movimiento rítmico e involuntario que ocurre en el ojo, en el cual las

oscilaciones pueden ser horizontales (de lado a lado), verticales (de arriba hacia abajo),

giratorias o mixtas, estos movimientos se pueden dar en ambos ojos o solamente en uno.

1.1 RELACIÓN EXISTENTE ENTRE EL NISTAGMO HORIZONTAL Y LAS ONDAS

CEREBRALES

La hipótesis planteada en este trabajo es la existencia de un determinado patrón entre el

movimiento involuntario horizontal del ojo provocado por la fatiga y las ondas cerebrales

que estén presentes en ese momento.

Ésta hipótesis también sugiere que si una persona presenta movimiento involuntario del

ojo por fatiga, se le induzcan ondas cerebrales tipo beta y esperar que éste cese.

Page 12: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

CAPÍTULO 2

MARCO TEÓRICO

Page 13: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

2 MARCO TEÓRICO

2.1 ONDAS CEREBRALES

Una onda es una perturbación de alguna propiedad de un medio la cual se propaga a

través del espacio transportando energía. El medio perturbado puede ser de naturaleza diversa, como el aire, agua, un trozo de metal, en incluso el vacío; y las propiedades que

sufren la perturbación pueden ser también variadas, por ejemplo, densidad, presión,

campo eléctrico, campo magnético.

La propiedad del medio en la que se observa la perturbación se expresa como una

función tanto de la posición como del tiempo:

(1)

Las ondulaciones de los potenciales eléctricos registrados en la superficie externa de la

cabeza se les denomina ondas cerebrales y al conjunto de éstas, electroencefalograma

(EEG).

El electroencefalograma es el registro y evaluación de los potenciales eléctricos generados por el cerebro, el electroencefalógrafo mide el comportamiento de un grupo

de células, es decir, la actividad eléctrica de las neuronas del encéfalo. Dicho registro

posee formas muy complejas que varían mucho con la localizacíón de los electrodos y

entre individuos. Esto es debido al gran número de interconexiones que presentan las

neuronas y por la estructura no uniforme del encéfalo.

Los registros eléctricos tomados desde la superficie del encéfalo o la externa de la

cabeza muestran una actividad eléctrica continua en el encéfalo. La intensidad y los

patrones de esta actividad eléctrica están determinados en gran medida por el nivel global de excitación del encéfalo como consecuencia del sueño, vigilia y las

enfermedades encefálicas como la epilepsia e incluso algunas psicosis.

La intensidad de las ondas cerebrales sobre la superficie del cuero cabelludo varía entre

0 y 200 milivolts. Las ondas son muy diferentes en los estados de vigilia, coma y sueño.

Las características de las ondas dependen mucho del grado de actividad de la corteza

cerebral.

Las ondas cerebrales, la mayor parte del tiempo, son irregulares y en el EEG no se

puede encontrar ningún patrón general. Sin embargo, en otras ocasiones aparecen

patrones definidos procedentes del cortex cerebral (figura 2.1), son el reflejo de la

actividad neuroquímica en estructuras más profundas. Estas ondas se clasifican de

acuerdo a su frecuencia como se muestra en la tabla 1.

Page 14: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Figura 2.1. Córtex cerebral.

La terminología que se sigue para designar las distintas bandas de frecuencia que se

pueden registrar en un electroencefalograma es la que inventó Hangs Berger, que

asignó letras griegas a cada banda mostrada en la tabla 1 [2].

Page 15: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Tabla 1. Ondas electroencefalográficas (figura 2.2).

Page 16: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Figura 2.2. Ritmos normales en electroencefalograma. Estados específicos del electroencefalograma.

Esta clasificación es meramente arbitraria porque existen notables diferencias individuales.

2.2 SUEÑO

El sueño es el estado de reposo uniforme de un organismo. En contraposición con el estado de vigilia, el sueño se caracteriza por los bajos niveles de actividad fisiológica

(presión sanguínea, respiración, latidos del corazón) y por una respuesta menor ante

estímulos externos [3].

El "Manual de terminología estandarizada, técnicas y sistemas de monitorización de las

fases el sueño en sujetos humanos", editado por Alan Rechtschaffen y Anthony Kales,

estableció las bases de la división actual de las fases del sueño. Se basa en el registro del electroencefalograma, electromiograma y electrooculograma. En base a estos

parámetros neurofisiológicos se elaboró una división del sueño en dos fases, sueño REM

(Rapid Eye Movement) y sueño NREM (Non-Rapid Eye Movement). El sueño NREM se

dividió, a su vez, en cuatro fases, Fases I a IV (figura 2.3).

Figura 2.3. Electrooculograma (EOG), Electromiograma (EMG) y Electroencefalograma (EEG) durante las distintas

fases del sueño.

Haciendo referencia a las características de las ondas cerebrales que se producen

cuando una persona se comienza a dormir (figura 2.4) se muestra lo siguiente:

Cuando un sujeto se dispone a dormir, cierra los ojos y se relaja, desaparecen las ondas

beta (8-10 csegundo) y son sustituidas paulatinamente por otras de mayor intensidad y

menor frecuencia denominadas ondas alfa. Si en este momento se abren los ojos

desaparece esta configuración y reaparece la anterior, la banda beta, pero si se continúa

en ese estado de reposo con la intención de dormir, la banda alfa va

Page 17: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

siendo sustituida por ondas de menor frecuencia (4-7 c/segundo) y de mayor intensidad

denominadas ondas Theta. Este cambió dura varios minutos y por un tiempo ambos tipos de registros luchan por dominar el trazado. A esta fase del sueño se la denomina estado

1 o fase de adormecimiento, y es el momento en que producen las llamadas

alucinaciones hipnagógicas. Incluso la actividad Theta continua no garantiza que el

sujeto esté totalmente dormido, hace falta que aparezcan unos signos EEG precisos para

determinarlo con seguridad, estos signos aparecen a continuación y se denominan

"complejos k" y "husos" o "picos" del sueño. El primero consiste en una única onda de

intensidad cuatro veces mayor que la actividad de fondo Theta y el segundo consiste en

una actividad de alta frecuencia (12-14 c/seg.) e intensidad parecida a la banda Theta. A

diferencia de la actividad Alfa o Theta que duran varios minutos, estos signos EEG son

episódicos y duran de medio a un segundo, la aparición de los mismos certifica que el

sujeto se halla completamente dormido. También comienzan a aparecer unas ondas de

mayor intensidad y menor frecuencia que las anteriores denominadas ondas Delta, mientras la suma total de ondas delta no supera el 20% del conjunto del trazado se halla

en el estado 2 del sueño. Este estado, como el anterior, corresponde todavía a lo que se

denomina sueño superficial.

2.3 TÉCNICA HEMI-SYNC

El término es una abreviación de hemispheñc synchronization refiriéndose a la

sincronización de ambos hemisferios del cerebro, lográndose mediante el uso de sonidos que permiten entrar con gran facilidad a distintos niveles de conciencia [4].

Con dicha tecnología se envían al cerebro simultáneamente dos sonidos o tonos

(binaural) de frecuencias diferentes. A fin de poder reconocer esos dos tonos el cerebro,

automáticamente, y valiéndose de ambos hemisferios en forma sincronizada, tiene que

combinarlos en una tercera vibración a una frecuencia diferente de los dos tonos

originales. O sea, mediante los tonos emitidos se va induciendo al cerebro a entrar en

frecuencias específicas en las que es posible realizar funciones específicas.

Una de las ventajas de esta metodología, además de su efectividad es su facilidad de

uso. Se presenta en Compact Disk o Cinta Cassette y sólo hace falta disponer de un

equipo de música.

Page 18: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Al ser una técnica diseñada con un sistema binaural, la mejor manera de utilizarlo, como es más efectivo, es a través de auriculares. Sin embargo, también es muy efectivo si es

usado a través de altavoces, sobretodo si se colocan a ambos lados del cuerpo. Por

último, también puede usarse sin auriculares ni altavoces situados a ambos lados del

cuerpo, simplemente como música ambiente, aunque su efectividad no es tan potente

como de las otras maneras.

Es bien conocido que el cerebro humano tiene dos hemisferios aparentemente iguales

pero cada uno con una función determinada y un papel complementario al del otro. Sin

embargo, hasta hace poco no se sabía que el funcionamiento sincronizado de ambos

hemisferios es uno de los aspectos más importantes del desarrollo de la mente humana y

que esa cualidad puede entrenarse. Como se sabe, al hemisferio izquierdo le corresponden las facultades ligüísticas mientras las facultades auditivas y visuales están

disminuidas. Su tono emocional es objetivo y su comportamiento amable y sociable.

Controla el pensamiento lógico, analítico y abstracto, y hasta los años 50 se le

consideraba el hemisferio más importante. Al hemisferio derecho, en cambio, le

corresponden más intensamente las facultades auditivas y visuales pero tiene dificultad

para comprender las palabras y se comunica mejor por gestos. Su tono emocional tiende

a la tristeza, al pesimismo, a la emotividad y a la irritabilidad. Controla el pensamiento

concreto, audiovisual y afectivo. Y aunque ambos hemisferios están unidos entre sí por el

cuerpo calloso cada uno procesa la información de manera distinta. Uno percibe el

mundo en su riqueza y otro ío analiza. A pesar de que durante algún tiempo se creyó que

el izquierdo es más importante, los últimos descubrimientos en neurociencia indican que

la integración de ambos es la clave de un sujeto equilibrado, productivo y con una idea correcta del mundo.

La audición tiene 3 funciones principales: detectar sonidos, determinar la localización de

las fuentes y reconocer la identidad de estos sonidos. El sistema auditivo del cerebro

reconoce patrones específicos que pertenecen a fuentes particulares, y cada uno de ellos

es percibido como una entidad independiente, por lo que éste presenta una respuesta en

sus células receptoras en los oídos a partir de frecuencias de 20 Hz y hasta 20 kHz. Sin

embargo la teoría de la técnica Hemi-Sync, afirma que el sistema nervioso central

responde a ciertos estímulos cuando se aplican ciertas frecuencias [5].

La técnica Hemi-Sync es un proceso que se ha ido puliendo alrededor de cuarenta años

por medio de investigación y experimentos. Esta técnica afirma que cuando el cerebro esta captando dos sonidos de diferente frecuencia, que son inducidas a cada uno de los

oídos por medio de unas bocinas o unos audífonos los cuales deben de poseer la

capacidad de proveer separación de sonidos laterales (figura 2.5), el cerebro a fin de

poder reconocer esos dos tonos automáticamente, y valiéndose de ambos hemisferios en

forma sincronizada, integra estas dos frecuencias produciendo una tercera de la

diferencia de estas dos, a este fenómeno se le llama audición binaural (figura 2.6). El

tono binaural origina en los núcleos olivares superiores del tallo cerebral el sitio de la

integración contralateral de la entrada auditiva.

Page 19: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

El tono binaural es neurológicamente transportado a la formación reticular, el cual usa

neurotransmisores para iniciar los cambios en Inactividad cerebral, con el fenómeno de la

audición binaural y con una buena manipulación de las frecuencias se le puede inducir ciertos tipos de ondas al cerebro a fin de imitar a las mismas ondas cerebrales que se

hace mención anteriormente en este capítulo, y así crear ciertos patrones de sonidos

sobre la conciencia, y este tipo de influencias se puede ver reflejado, por ejemplo,

induciendo sueño o poniendo en estado de alerta a un sujeto (figura 2.8).

2.4 NISTAGMO

La palabra nistagmo viene del griego "nustagmos ", que significa adormecimiento, y que

a su vez viene de "nustazein" que quiere decir cabecear en sueño (esto es una analogía

que ilustra el movimiento inicial de la caída lenta de la cabeza conforme los músculos del

cuello se relajan durante el adormecimiento, y el movimiento consecutivo rápido que lo corrige). [6, 7, 8]:

El nistagmo consiste en una oscilación rítmica e involuntaria de los globos oculares que

se produce en dos fases, una lenta y otra rápida; la desviación lenta de la mirada se

sigue de un movimiento ocular rápido que devuelve el ojo a su posición inicial. La

Page 20: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

dirección de la fase rápida es la que define la dirección del nistagmo. Para la exploración

del nistagmo el paciente debe estar sentado, con la cabeza recta y los ojos bien

iluminados, a continuación se le hace mirar un objeto situado a medio metro de su cara.

Seguidamente tendrá que mirar al frente, arriba, abajo, a la derecha y a la izquierda.

El nistagmo se puede clasificar como espontáneo o inducido; atendiendo a su dirección (horizontal, vertical, horizontal-rotatorio), según su fatigabilidad y según su grado

atendiendo a su presencia en una posición de la mirada. El nistagmo espontáneo puede

observarse fácilmente: el explorador desplaza su dedo índice horizontalmente delante del

paciente, que deberá seguirlo con la mirada. El nistagmo inducido se puede provocar

mediante estimulación calórica (cuando el agua fría entra al oído, debe causar

movimientos oculares rápidos de lado a lado, los ojos deben moverse lejos del agua fría

y regresar lentamente, en seguida, se coloca agua tibia dentro del oído y los ojos ahora

deben moverse hacia el agua tibia y luego alejarse lentamente); antes de la realización

de esta prueba hay que asegurarse que el tímpano está íntegro.

Los movimientos anormales del ojo en el nistagmo son causados por anomalías de

funcionamiento en las áreas del cerebro que controlan el movimiento, pero a menudo no se comprende muy bien la naturaleza exacta de este trastorno. El nistagmo puede ser

congénito (presente al nacer) o puede ser causado por una enfermedad o lesión

posterior en la vida.

2.4.1 NISTAGMO CONGÉNITO

El nistagmo congénito es más común que el adquirido, es leve, no cambia en severidad y

no está asociado con ningún otro trastorno.

Las personas afectadas no son conscientes de los movimientos del ojo, aunque un

observador cuidadoso los puede notar. Si estos movimientos son de gran amplitud, la

agudeza visual puede estar por debajo de 20/20 y se puede utilizar la cirugía para mejorada.

En muy raras ocasiones, el nistagmo se presenta como resultado de enfermedades

congénitas del ojo que provocan disminución en la visión; sin embargo, el oftalmólogo

debe evaluar a cualquier niño con nistagmo para verificarlo.

2.4.2 NISTAGMO ADQUIRIDO

Una enfermedad o una lesión del sistema nervioso central es una causa menos común

de nistagmo.

En las personas jóvenes, la causa más común de nistagmo adquirido es la lesión en la cabeza a causa de accidentes en vehículos; mientras que en las personas de edad, la

causa más común es la apoplejía (bloqueo de los vasos sanguíneos en el cerebro).

Page 21: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Cualquier enfermedad cerebral, como esclerosis múltiple o tumores cerebrales, puede

causar nistagmo, si se presenta daño a las áreas que controlan el movimiento.

Debido a que el control de los movimientos del ojo está afectado por la entrada desde el

laberinto (la parte del oído interno que percibe el movimiento y la posición), los trastornos

del oído interno (como la enfermedad de Meniere) también pueden conducir a nistagmo

adquirido. Otras causas pueden ser: el uso de Dilantin (un medicamento anticonvulsivante) o intoxicación por alcohol.

El nistagmo se puede observar a través del siguiente procedimiento: si la persona

afectada gira durante 30 segundos, para e intenta fijar la mirada en un objeto, los ojos se

mueven primero lentamente en una dirección y luego se mueven rápidamente en la

dirección opuesta. La orientación de estos movimientos alternantes (de lado a lado, de

arriba hacia abajo o en un patrón circular) dependen del tipo de nistagmo.

2.4.3 TIPOS DE NISTAGMO

El nistagmo más característico consiste en movimientos rítmicos, más rápidos en una dirección que en la contraria, es decir, se refiérela los movimientos involuntarios de los

ojos que se pueden dar de lado a lado (nistagmo horizontal). Estos nistagmos también se

pueden llegar a presentar en otras circunstancias y dependiendo de tal es el nombre que

se le asigna teniendo por ejemplo:

Nistagmo de fatiga. Nistagmo que aparece cuando se mantiene excesivamente la mirada en una sola posición.

Nistagmo de fijación y de mirada parética. Nistagmo horizontal o vertical, según la fijación de la mirada que aparece al fijar la vista en un objeto. Se amplía con la mirada lateral y

cesa cuando desaparece la fijación. Es indicativo de intoxicaciones

toxicomedicamentosas, enfermedad de Wernicke, esclerosis múltiple y gliomas

protuberenciales.

Nistagmo de los mineros. Nistagmo por iluminación insuficiente.

Nistagmo de rebote. Nistagmo horizontal que late en la dirección de la mirada, fatigándose y pudiendo entonces cambiar de dirección al cambiar la mirada o refijarla en la posición primitiva.

Nistagmo optocinético. Nistagmo inducido por la recepción de estímulos visuales en movimientos continuados y con una cierta cadencia.

Nistagmo posicional. Nistagmo que aparece en los cambios de posición.

Nistagmo rítmico. Nistagmo en el que los ojos se mueven lentamente en una dirección y

luego sobreviene un movimiento rápido en dirección opuesta.

Nistagmo terminal. Nistagmo en resorte fino y de frecuencia moderada que se produce

cuando los ojos están en posición de mirada extrema.

Page 22: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

2.5 MÉTODOS PARA DETECTAR EL NISTAGMO

Existen dos tipos de métodos para detectar el nistagmo, Los métodos que no requieren

un accesorio directamente en el ojo (diseñados a partir de métodos viejos dirigidos a

registrar y medir movimientos grandes del ojo). Y los métodos que requieren un

accesorio directamente en el ojo.

2.5.1 MÉTODOS NO INVASIVOS

2.5.1.1 Método de conteo

En este método el paciente observa un patrón en forma repetitiva (el más simple es un

grupo de líneas equidistantes paralelas) y cuenta las líneas; lo cual efectúan en forma

más sencilla cuando el ángulo de visión de los elementos adyacentes es de 20'. Si esta

distancia se agranda o se acorta, llega un momento en el que el conteo no se puede realizar o es erróneo.

Desventajas: No es aplicable en movimientos finos del ojo, no proporciona valores

cuantitativos de la magnitud de los movimientos oculares, a la persona se le restringen

movimientos de la cabeza y debe permanecer en el lugar de estudio.

2.5.1.2 Método por televisión

Mackworth y Mackworth (1958) aplicaron un método en el que el reflejo de la cornea es

grabado por una cámara de TV mientras que una segunda cámara registra la escena

expuesta

al paciente; ambas imágenes son sobrepuestas de manera que el reflejo que muestra el

movimiento ocular se ajuste para coincidir en el área de movimiento de la escena.

Desventajas: Los resultados son sólo imágenes, no entrega resultados cuantitativos, no

es confiable en movimientos oculares muy finos, al paciente se le fija la cabeza

apoyando su barba en un soporte y mordiendo un soporte dental.

Page 23: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

2.5.1.3 Observación del disco óptico

La única característica de éste método es que mide directamente el movimiento de una

imagen de la retina tomando de referencia marcas tomadas de venas.

Desventajas: El método fue usado por Cornsweét (1958) y sólo media movimientos horizontales, sólo se podía aplicar a personas con venas lo suficientemente largas

cruzando en forma vertical la retina, se necesitaba un aparato grande en un lugar fijo, se

restringen movimientos de la cabeza.

2.5.1.4 Electrooculograma o electronistagmografía

El electrooculograma (EOG) o electronistagmografía (ENG) es un examen que consiste

en colocar pequeños electrodos cerca de los músculos de los ojos para medir el

movimiento de éstos. Este examen es utilizado en la polisomnografía. En condiciones

habituales existe una diferencia de potencial de aproximadamente de 0,4 a 5 mV entre la

córnea y la membrana de Bruch situada en la parte posterior del ojo. Ahora bien, el

potencial producido por este dipolo es susceptible de ser registrado a través de sistemas de registros tanto unipolares como bipolares, mediante la colocación de electrodos en la

piel cercana al ojo. Al medir el potencial producido por un dipolo, la magnitud (voltaje) y

polaridad del potencial registrado dependerán, en gran medida del movimiento en

posición del dipolo, ya que al sufrir un movimiento en su posición, debe presentarse una

variación en el voltaje.

Desventajas: La cantidad de artefactos que se mezclan en la señal de interés, tal como

el EEG, EMG y respuestas de la piel Es una prueba corta debido al contacto

piel-electrodo, no es ambulatoria y no detecta movimientos finos.

Page 24: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

2.5.1.5 Videooculografía

Esta prueba se basa en un reflejo entre el oído interno y el ojo o reflejo

vestíbulo-oculomotor que hace referencia al movimiento ocular provocado por el estimulo

del sistema vestibular. Como ya se ha mencionado anteriormente el movimiento de los

ojos se coordina con el cerebro para permitir mantener la visión estable con una

agudeza visual precisa durante el movimiento activo en esta prueba el movimiento ocular

se registra de dos maneras . en la electronistagmografia se colocan pequeños electrodos

en la piel alrededor de los ojos mientras que en la VOG se utilizan unas cámaras

especiales que filman el movimiento ocular.

Desventajas: Los resultados son sólo imágenes, no entrega resultados cuantitativos.

2.5.2 MÉTODOS INVASIVOS

2.5.2.1 Espejo en el globo ocular

Adler y Fliegelman (1934) colocaron un espejo delgado de 3 mm de diámetro en el limbo

temporal del ojo (M) y lo anestesiaron con una droga que no afecta la pupila ni la

humedad del mismo. El paciente estaba en posición vertical y sentado, deteniendo con

un dedo su párpado para evitar que lo cerrara.

Desventajas: Sólo se grabaron movimientos oculares horizontales restringiendo los de la cabeza, e imprimiendo la imagen enfocada con un lente cilindrico (C) en una película (F).

Ratliff y Riggs (1950) comprobaron que el método tenía un error matemático en su forma

de calcular los movimientos oculares. Se usa anestesia, es invasivo, se restringen

movimientos del párpado.

Page 25: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

2.5.2.2 Método del lente de contacto con barra

Fender (1956) aportó nuevas versiones a este método; la primera consistió en agregar

una barrita que soporta un espejito (figura 2.13A) orientado en forma normal al eje de

visión, lo que permite registrar movimientos horizontales y verticales sin afectarse por movimientos torsionales. Estos últimos fueron registrados agregando un segundo espejo

(figura 2.13B) en la barra pequeña; aquí se hacen incidir dos rayos de luz, uno de ellos

implica detectar movimientos horizontales y verticales, y el otro detecta movimientos

horizontales y torsionales.

Desventajas: Es invasivo, incluye un arreglo complicado de lentes, restringe los

movimientos de la cabeza y se debe estar en un lugar fijo. N. A

2.5.2.3 Método usando una bobina magnética de rastreo

R :b¡nson (1963) midió el movimiento ocular a través del voltaje generado en bobinas

ntadas en la parte de la esclera de un lente de contacto. La cabeza del paciente aba

inmersa en un campo magnético alternante y uniforme. El nivel de ruido de los

amplificadores era de 2 fiV y la exactitud de 0.01 o de 1. El sistema era capaz de

'egistrar frecuencias mayores de 1000 Hz, lo cual permitía registrar sacádicos y ".emblores finos.

Page 26: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Desventajas: Es invasivo, no es ambulatorio, restringe los movimientos de la cabeza y

debe ser practicado en el lugar de estudio.

2.5.2.4 Método del acelerómetro

Aquí se registra mediante el doblamiento de una galga o un piezoeléctrico pegado al

bastoncillo de un lente de contacto. El bastoncillo debe de poder doblarse cuando el ojo

efectúa un movimiento sacádico. Thomas (1961), Bengi y Thomas (1967 y 1968), West y

Boyce (1968) aplicaron este método para medir la distribución de los sacádicos y para

sacar estadísticas de sus magnitudes.

Desventajas: No detecta movimientos lentos, es invasivo, restringe los movimientos de

la cabeza, no es ambulante [9].

2.6 BIOFÍSICA DEL SENTIDO DE LA VISTA

La visión es la facultad por la cual a través del ojo, órgano visual, se percibe el mundo

exterior. Muchos organismos simples tienen receptores luminosos capaces de

reaccionar ante determinados movimientos y sombras, pero la verdadera visión supone

la formación de imágenes en el cerebro.

Este proceso se lleva a cabo en la corteza cerebral que recubre el lóbulo occipital y esta implicada con la percepción visual cuando estamos despiertos, este proceso se necia

cuando la retina ocular es excitada por los rayos de la luz reflejados por los objetos, esta

excitación provoca trenes de impulsos bioeléctricos que recorren el nervio óptico el cual

llega a la corteza cerebral del lóbulo occipital. Una vez aquí los axones establecen

conexiones con las neuronas corticales, la llegada de los impulsos retiñíanos y su

interpretación provoca la percepción visual. Finalmente, la actividad de ¡a corteza del

lóbulo temporal se relaciona con los fenómenos mentales de percepción, imaginación y

fantasía auditiva.

2.6.1 ÓPTICA

Es el estudio de los mecanismos de la transmisión de la luz. Esto implica información sobre la forma, luminosidad, posición y color de los objetos cuyas imágenes se analizan,

así como sobre el estado de la materia que emite, absorbe o transmite dicha luz.

Page 27: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

2.6.1.1 Lentes

Un medio transparente separado de otro por dos caras no paralelas constituye una lente.

Las lentes pueden ser delgadas (su espesor es despreciable en relación con las otras

dimensiones del elemento) o gruesas (su espesor es considerable) [10].

Cuando la superficie de las caras son casquetes esféricos hablamos de lentes esféricas. Si las superficies son cilindricas se habla de lentes cilindricas (figura 2.14).

Los elementos de una lente esférica delgada:

1. Dos superficies esféricas.

2. Un centro óptico (O).

3. Un eje óptico (la recta que une los centros de curvatura). 4. Dos focos: Uno es el foco del objeto (f). Todo rayo que incide en la lente pasando

por f sale paralelo al eje óptico. Otro es el foco de la imagen (f'). Todo rayo que

incide paralelo al eje óptico emerge pasando por f'.

Una lente es positiva (convergente) cuando al atravesarla los rayos se acercan al eje

óptico. Esto ocurre en las lentes biconvexas y en las convexocóncavas cuando el radio

de curvatura de la segunda superficie es menor que el de la primera (figura 2.15).

Una lente es negativa (divergente) (figura 2.16) cuando los rayos se alejan del eje óptico. Esto ocurre en las lentes bicóncavas en las convexocóncavas cuando el radio de

curvatura de la segunda superficie es mayor que el de la primera.

Las lentes convergentes se diferencian en la práctica de las divergentes porque las

primeras son más gruesas en el centro que en el borde y las segundas a la inversa.

Page 28: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Otra forma de identificarlas es deslizarías en forma paralela a una superficie escrita. Si la

imagen que se observa se mueve en el mismo sentido que el movimiento impuesto a la

lente ésta es divergente o negativa. Si se mueve en sentido contrario es convergente o positiva.

2.7 OJO

El ojo es un órgano que ha evolucionado para la finalidad de detectar la luz. Se compone

de un sistema sensible a los cambios de luz, capaz de transformar éstos en impulsos

eléctricos. Los ojos más sencillos no hacen más que detectar si los alrededores están

iluminados u oscuros. Los más complejos sirven para proporcionar el sentido de la vista.

2.7.1 MOVIMIENTOS DEL OJO. MOVIMIENTOS OCULARES BÁSICOS

Los ojos se mueven en distintas direcciones gracias a 6 músculos extraoculares, que son: recto interno, recto externo, recto superior, recto inferior, oblicuo superior y oblicuo

inferior (figura 2.17).

Estos músculos son ¡nervados por los siguientes nervios craneanos:

Nervio oculomotor o motor ocular común (III par craneal): músculos recto interno, recto

superior, recto inferior y oblicuo inferior.

Nervio troclear o patético (IV par craneal): músculo oblicuo superior.

Nervio abducente o motor ocular externo (VI par craneal): músculo recto externo.

Cada músculo determina un movimiento específico, de acuerdo a la siguiente tabla:

Page 29: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

El músculo oblicuo superior se inserta en la región superior y externa del globo ocular y

lo tracciona en dirección hacia abajo y medial. Por lo tanto, por la acción de este músculo

en cada ojo, las personas miran hacia abajo en forma convergente y pueden bajar una

escalera con más seguridad. El músculo oblicuo inferior se inserta en la región inferior y

externa del globo ocular y lo tracciona en dirección hacia arriba y medial.

Para poder ver de forma correcta una imagen es necesario enfocarla adecuadamente sobre la retina, proceso complejo que depende de la refracción de la luz al atravesar las

estructuras transparentes del globo ocular (córnea, humor acuoso, cristalino y humor

vitreo), de la abertura pupilar, de la acomodación del ojo a la distancia del objeto que se

mira y de la inversión de la imagen sobre la retina.

El sistema visual permite que la imagen del campo visual se transforme en la retina en

actividad bioeléctrica y que sea transportada hasta la corteza cerebral [11].

A partir de la definición de los ejes de Fick, pueden definirse las siguientes posiciones y movimientos, figura 2.18.

Movimiento simple o secundario: cualquier rotación alrededor del eje Y o Z de Fick.

Movimiento oblicuo o terciario: cualquier combinación de movimientos o giros

alrededor de un eje de Fick.

Posición primaria de mirada: es aquella desde la que se inician todos los movimientos.

Consiste en una posición de mirada al frente.

Posición secundaria: aquella a la que se llega a través de un movimiento secundario de

giro alrededor de los ejes y o z.

Posición terciaria: cualquier otra posición a la que se llega girando alrededor de un eje que

no sea de Fick.

Las rotaciones que puede realizar el ojo, figura 2.19, se denominan ducciones y se pueden

clasificar en:

• Supraducción: elevación alrededor del eje Y.

• Infraducción: depresión alrededor del eje Y.

Page 30: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

• Abducción: giro hacia el lado del hueso temporal alrededor del eje Z. También se denomina dextroducción en el ojo derecho (OD) y levoducción en el ojo izquierdo (Ol).

• Adducción: giro hacia el lado nasal de la cabeza alrededor del eje Z. También se

denomina levoducción en el OD y dextroducción en el Ol.

• Intorsión (o inciclotorsión): giro alrededor del eje X en dirección nasal

• Extorsión (o exciclotorsión): giro alrededor del eje X en dirección temporal.

Los movimientos terciarios se pueden descomponer en dos movimientos secundarios y su

notación es la composición de los dos nombres.

2.7.1.1 Dinámica del ojo

En relación a la figura 2.20 se definen:

• Inserción anatómica (A): es el punto de inserción fija de los músculos en el globo ocular.

• Inserción orbitaria (O): es el punto de la órbita del ojo donde se inserta el músculo.

• Inserción fisiológica (P): Punto tangente donde se aplica la fuerza del músculo al globo ocular.

• Arco de contacto (AP): es la zona de contacto entre el músculo y el globo ocular.

• Línea de acción (PO): Línea de contracción del músculo ocular.

• Plano de acción: Es el plano que contiene la línea de acción y el centro de rotación del ojo.

Cuando se produce la acción del músculo, éste se contrae a lo largo de su línea de acción,

de forma que el arco de contacto disminuye.

Page 31: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

2.7.1.2 Acción de los músculos oculares.

Los músculos oculares tienen una potencia muy superior a la necesaria para producir el

movimiento ocular (200 veces superior), ya que en caso contrario, se tendría fatiga de

estos músculos, impidiendo la correcta función visual.

El plano de acción de los rectos externos e interno contiene al eje visual, por lo que su acción es simple. El recto externo tiene una acción abductora, mientras que el recto interno es aductor, figura 2.21.

El plano de acción del recto superior no contiene al eje visual, por lo que los movimientos que ocasiona son más complejos, figura 2.22. Su línea de acción forma un ángulo de 23°

con el eje visual, de forma que se origina componentes tanto en la dirección del eje visual

produciendo una elevación, como en la perpendicular, produciendo una adducción. También se produce una ciclotorsión hacia el lado nasal, es decir, una intorsión.

Al igual que en el caso anterior, el plano de acción del recto inferior no contiene al eje

visual, figura 2.23. Su línea de acción forma también un ángulo de 23° con el eje visual.

La acción de este músculo también es triple: adductora, depresora (provoca una

infraducción) y extorsionadora.

Page 32: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

El plano de acción del oblicuo superior está inclinado respecto al eje visual unos 51° ya

que su inserción orbitaria está en la tróclea, figura 2.24. Su inserción anatómica se

encuentra en el hueso temporal, por lo que al contraerse da lugar a tres movimientos:

¡nfraducción, abducción e intorsión.

Las inserciones del oblicuo inferior son similares a las del oblicuo superior, pero por la

parte inferior del globo ocular, figura 2.25. Sus principales acciones son elevadora, extorsionadora y abductora.

El esquema de Baillart-Márquez, figura 2.26, representa las acciones de cada músculo

con una serie de flechas, cuya longitud está relacionada con la importancia del

movimiento producido.

Page 33: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

2.7.1.3 Músculos sinergistas y antagonistas

Para producir un determinado movimiento es necesario que dos o más músculos actúen

al mismo tiempo. Estos músculos se denominan sinergistas homolaterales. Para las seis

ducciones fundamentales se encuentran las siguientes sinergias homolaterales:

• Abducción: recto externo, oblicuo superior y oblicuo inferior.

• Adducción: recto interno, recto superior y recto inferior.

• Supraducción: Recto superior y oblicuo inferior.

• Infraducción: recto inferior y oblicuo superior.

• Intorsión: recto superior y oblicuo superior.

• Extorsión: recto inferior y oblicuo inferior.

Y cuando un músculo se contrae es necesario que otro se relaje para evitar que se

produzcan acciones contrarias que anulen el movimiento. Los músculos que se deben

relajar para que se produzca una determinada acción de otro músculo son llamados antagonistas homolaterales. En general se puede hablar de tres pares de antagonistas

homolaterales: el recto interno y el recto externo; el recto superior y recto inferior y el

oblicuo superior y el oblicuo inferior. Finalmente, la actuación de antagonistas y

sinergistas esta dirigida por la L^y de Sherrington, que dice que "cuando el sinergista se

contrae, el antagonista se relaja".

2.7.2 TIPOS DE MOVIMIENTOS OCULARES

2.7.2.1 Necesidad de los movimientos oculares

Según las evidencias, existe mejor calidad en la imagen percibida por la retina en la

presencia de movimientos oculares que sin ellos. Por ejemplo, Kelly estabilizó la magen en la retina, tratando aumentar la agudeza visual al eliminar el emborronamiento

producido por los movimientos oculares. Sin embargo, al estabilizar ia imagen en la retina

esta desaparecía, este fenómeno es conocido como fading. Este fenómeno se produce

por la saturación de los fotorreceptores retiñíanos, ya que los pequeños movimientos

oculares rápidos previenen su aparición. Otras contribuciones de los movimientos

oculares son:

El campo visual es limitado, pero gracias a la combinación de movimientos oculares y de

la cabeza se logra un campo visual efectivo de 360°.

Las ventajas de la visión binocular se pueden mantener si y sólo si se produce un -ovimiento coordinado de los dos ojos.

Page 34: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

2.7.2.2 Clasificación de los movimientos oculares

La clasificación de los movimientos oculares de Carpenter se basa en la funcionalidad

del movimiento. Según este criterio, se pueden determinar tres tipos de movimientos:

• Movimientos para el mantenimiento de la mirada.

• Movimientos para el desplazamiento de la mirada.

• Movimientos de fijación o micromovimientos.

Los movimientos para el mantenimiento de la mirada son aquellos encargados de

mantener la mirada sobre un objeto con independencia de los movimientos de la cabeza

o del objeto. Los movimientos que compensan los movimientos de la cabeza se

denominan vestíbulo -oculares o vestibulares, mientras que los que compensan el

movimiento del objeto se denominan optocinéticos.

Los movimientos vestíbulo - oculares se originan en el sistema vestibular, que es el

centro de control del sistema de posicionamiento espacial. Este sistema, situado en el

oído, consiste en tres anillos dispuestos perpendicularmente entre sí, por los que corre

un líquido denominado endolinfa, figura 2.27.

Los movimientos de este líquido permiten conocer el sentido y dirección de los movimientos de la cabeza, permitiendo activar el sistema oculomotor y compensarlos,

figura 2.28. Son movimientos involuntarios, ya que la estimulación con calor del líquido

endolinfático que produce corrientes de convección que mueven la endolinfa, da lugar a

señales falsas de posición espacial produciendo movimientos oculares. Cuando la

cabeza gira cierto ángulo hacia determinada dirección, los ojos efectúan un movimiento

de la misma magnitud en dirección contraria. Otro movimiento de compensación son las

ciclotorsiones, que se producen para compensar los giros de la cabeza en el plano

frontal.

Cabe mencionar que una vez que aparece el nistagmo, como consecuencia del mismo,

aparece el vértigo en las personas, por lo que la cabeza tiende a moverse

Page 35: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

lateralmente hacia el lado que está ocurriendo el nistagmo para compensar dicho

síntoma y de esta manera tratar de evitarlo[9].

Sin embargo, se ha comprobado que pueden existir contribuciones voluntarias a los

movimientos reflejos vestibulares, sobre todo en entornos de realidad virtual.

Los movimientos optocinéticos son aquellos que siguen el movimiento de los objetos

lentos. Cuando el movimiento es continuo, se produce un movimiento regular y rítmico denominado nistagmo optocinético.

Los movimientos para el desplazamiento de la mirada permiten desplazar la atención de un punto a otro del espacio. Dentro de este tipo de movimientos se encuentran los

movimientos sacádicos, los movimientos de persecución y las versiones.

Los movimientos sacádicos son cambios bruscos de fijación (su nombre proviene del

término "sacudida"). Durante este movimiento, la velocidad que alcanzan los ojos es del

orden de los 1000°/s (aproximadamente 1 m/s). Contrario a lo que pudiese pensarse,

debido a su alta velocidad, durante estos movimientos no se tiene percepción de

borrosidad. Debido a que la sensibilidad visual disminuye durante el movimiento. Esto

suprime, únicamente, la visión de estímulos menores a 20 ms. (supresión sacádica), ya

que otros estímulos como un flash de luz, por ejemplo, si pueden ser percibidos.

Los movimientos de persecución o seguimientos son más rápidos que los optocinéticos y

siguen movimientos de objetos rápidos. Actúan en una amplia variedad de circunstancias

oculomotoras, como mantener la mirada ante derivas involuntarias del ojo o la regulación

de la fijación durante movimientos vergenciales.

Las versiones y vergencias son movimientos binoculares en los que varía el ángulo entre

los dos ejes visuales (vergencias), o permanece constante (versiones).

Los movimientos para el mantenimiento de la fijación son conocidos como

micromovimientos, por su pequeña amplitud. Su función es mantener la fijación e impedir

el fenómeno de fading. Parecen estar relacionados también con el mecanismo de la

acomodación.

Los tipos de movimientos son:

Tremores: Son temblores de los ojos, de muy pequeña amplitud, entre17" y 1', y de

altísima frecuencia, entre 30 y 70 ciclos/s.

Fluctuaciones: Son de mayor amplitud (5') y frecuencia más baja (unos 5 ciclos/s).

Microsacádicos: son los micromovimientos de mayor amplitud, entre los 5 y 10' de arco, con una velocidad media de 107s.

Page 36: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

CAPÍTULO 3

DESARROLLO

Page 37: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

3 DESARROLLO

3.1 ASPECTOS GENERALES

Las cámaras fotográficas y de video digitales ocupan tecnologías especiales para poder

capturar imágenes y video, por lo común trabajan con sensores llamados de imagen,

fabricados con materiales semiconductores de Metal Óxido (MOS) y estructurados en

forma de matriz que poseen diferentes características según su tipo.

La cámara utilizada para llevar a cabo las pruebas del algoritmo fue una webcam 300K

píxeles (ver Apéndice I).

Se escogió esta cámara porque solamente se están llevando a cabo las pruebas de los

algoritmos con ella y no es necesario contar con características específicas como alta resolución. Ya que como se podrá ver en el capítulo 4 las pruebas realizadas con dicha

cámara arrojan un resultado satisfactorio para la manipulación de los datos.

Los videos tomados en la Clínica del sueño a los pacientes se realizaron con la cámara

de video minidvd marca Sony (ver Apéndice I). Dicha cámara fue elegida debido a las

características con las que ésta cuenta, especialmente por la resolución con la que

trabaja y por el sensor CMOS que utiliza ya que entre mayor sea la resolución se tendrá

un mejor manejo de los datos que se obtendrán de ella, es decir, con la resolución con la

que cuenta ésta cámara se podrá obtener con mayor precisión el centroide que se desea

obtener del ojo en el procesamiento de imágenes.

La visión por computadora es una rama de la inteligencia artificial cuyo principal objetivo

es modelar matemáticamente los procesos de percepción visual en los seres vivos y generar programas que permitan simular estas capacidades visuales por computadora.

Por medio de la percepción los agentes obtienen información relacionada con el mundo

en donde se encuentran. Tal percepción se origina en lo que se conoce como sensores.

Un sensor es todo aquello capaz de modificar el estado de cómputo de un agente como

respuesta a un cambio en el estado del mundo. Puede ser algo tan simple como un

sensor de un bit que detecta si un interruptor está encendido o apagado, o tan complejo

como la retina de un ojo humano, en donde están presentes más de cien millones de

elementos fotosensibles [12].

Los agentes artificiales disponen de una gran diversidad de modalidades sensoriales.

Las que comparten con los humanos son la vista, la audición y el tacto.

La visión artificial, también conocida como visión por computadora (del inglés Computer Visión) o visión técnica, es un subcampo de la inteligencia artificial. El propósito de la

visión artificial es programar un computador para que "entienda" una escena o las

características de una imagen.

Page 38: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Los objetivos típicos de la visión artificial incluyen:

• La detección, segmentación, localización y reconocimiento de ciertos objetos en

imágenes (por ejemplo, caras humanas).

• La evaluación de los resultados (ej.: segmentación, registro).

• Registro de diferentes imágenes de una misma escena u objeto, Le., hacer

concordar un mismo objeto en diversas imágenes.

• Seguimiento de un objeto en una secuencia de imágenes.

• Mapeo de una escena para generar un modelo tridimensional de la escena; tal

modelo podría ser usado por un robot para navegar por la escena.

• Estimación de las posturas tridimensionales de humanos.

• Búsqueda de imágenes digitales por su contenido.

Estos objetivos se consiguen por medio de reconocimiento de patrones, aprendizaje estadístico, geometría de proyección, procesado de imágenes, teoría de grafos y otros

campos. La visión artificial cognitiva está muy relacionada con la psicología cognitiva y la

computación biológica.

3.2 SISTEMA DE PROCESAMIENTO DE IMÁGENES

El sistema de procesamiento de imágenes esta integrado por el sistema de cómputo

empleado, el algoritmo de visión artificial y el lenguaje de programación.

Desde el punto de vista del procesamiento de imágenes se requiere que el ojo

permanezca en la misma posición dentro de la toma de la cámara para evitar errores en

el momento de la transferencia de datos, por lo que el diseño propuesto debe mantener la posición del sujeto de prueba fija para evitar dichos errores.

3.3 SISTEMA DE CÓMPUTO

El procesamiento de imágenes se realiza en una computadora personal. Para probar los

algoritmos de procesamiento se cuenta con dos computadoras. Las características de

estas computadoras se mencionan en la tabla 3:

Page 39: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

3.4 CALIBRACIÓN DE LA CÁMARA

El proceso de calibración de la cámara permite conocer con precisión las características

físicas de la cámara, como aquellas que tienen relación con el objetivo utilizado. Pero

dentro de los parámetros de calibración también se incluyen los que hacen referencia a la posición y orientación de la cámara en el espacio, y este punto lleva a la necesidad de

definir un sistema de coordenadas espaciales que permita situar físicamente la cámara

en su entorno, posibilitando así establecer las relaciones entre las imágenes y las

posiciones espaciales que representan.

3.4.1 SEÑAL DE VIDEO

Existen 2 clases de señales de video, las digitales y las analógicas. La señal de video

digital presenta varias ventajas respecto a la analógica. Es más robusta al ruido, tiene

mayor calidad, mejor resolución, alta fidelidad en la transmisión y duplicado de la señal.

El número de imágenes mostradas en un segundo (fps) se conoce como taza de imágenes o cuadros de video. Una taza de cuadrós-de video grande mejora la calidad

del video ya que define mejor el movimiento. Cuando se genera un video tomando como

base un video fuente existen dos tazas de cuadros de video. En el video fuente es él numero de muestras visuales creadas por segundo cuando sé esta capturando. En el

video final, es el número de cuadros exportados en el video.

La forma en que se manejan y sincronizan los datos de video se conoce como

arquitectura de video. Cada arquitectura está optimizada para una plataforma de

cómputo específica, por ejemplo, Windows Media para el PC, QuickTime para Apple y

Real Systems para redes. Todas las arquitecturas de video son similares en funciones,

pero difieren en los detalles.

3.4.2 TOOLBOX PARA LA CALIBRACIÓN DE LA CÁMARA EN MATLAB

La idea de la calibración es hallar la correspondencia entre dos sistemas de referencia (el real exterior a la cámara, y el de las imágenes capturadas con la cámara). De esta

manera se hace obvio la necesidad de obtener puntos de referencia en la escena real y

dentro de las imágenes capturadas.

Para la calibración se siguieron los siguientes pasos:

• Montaje experimental. Colocar una plantilla cuadriculada en una superficie plana

(figura 3.1) de forma que el eje de la cámara sea perpendicular a dicha superficie.

• Se elige un sistema de referencia del mundo real y se seleccionan un conjunto de

puntos de los que se medirán sus coordenadas (xi, yi) con respecto a nuestro

sistema de referencia.

Page 40: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

La calibración de la cámara se llevo a cabo mediante un toolbox, herramienta de MatLab 7.0, con una documentación completa, que permite al usuario calibrar una cámara web

de la siguiente manera:

Tomar una serie de imágenes (figura 3.2) para llevar a cabo, mediante el uso del tool box, la calibración de la cámara web a utilizar para realizar las primeras pruebas.

Una vez que se tienen las imágenes se tomó un marco en cada una de ellas, haciendo

uso de la caja de herramientas, para lograr así la calibración de la cámara web. Esto se

realizó para relacionar los cuadros negros y blancos con la cantidad de píxeles que cada uno de dichos cuadros ocupa, así como para determinar la distancia focal, la distorsión,

entre otras características que hasta el momento no son requeridas.

Una vez que se tiene el cuadro o marco de referencia donde se va a trabajar se detectan

cada uno de los cuadros que se encuentran dentro de ese marco (figura 3.3) y de esta

manera poder corregir la distorsión de la imagen, esto se logra acercando la distancia

entre cada uno de los cuadros situados en el marco, solamente en caso de que no se

haya detectado correctamente por el algoritmo utilizado (figura 3.4).

Page 41: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

El procedimiento anterior se realizó para cada una de las imágenes a analizar. Cabe

destacar que las tomas de las imágenes se realizaron con la misma iluminación y con la

cámara fija para obtener el menor ruido posible dentro de las mismas y de esta manera

obtener una mejor calibración de la webcam utilizada.

Una vez terminado el proceso anterior se puede observar el error que se tiene en la

calibración, por ejemplo para la imagen número 1 tiene un error de píxel como se

muestra a continuación:

Number(s) of image(s) to show (Q = all images) = 1 Loading image camera_calib1.tif...

Pixel error: err= [0.93780 1.03151] (all active images)

Page 42: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

De esta manera el error de píxel, una vez calibrada la cámara de todas las imágenes es el que se muestra a continuación:

Calibration results after optimization (with uncertainties):

Focal Length: fe = [ 397.44635 398.70643] ± [5.79315 5.87248]

Principal point: ce = [ 179.58360 158.76004]± [ 10.49350 9.11140]

Skew: alpha__c = [ 0.00000 ] ± [ 0.00000 ] => angle of pixel axes = 90.00000 ±

0.00000 degrees

Distortion: " kc = [ -0.33131 0.20985 -0.00927 -0.00105 0.00000 ] ± [ 0.04968

0.15253 0.00449 0.00327 0.00000] Pixel error: err = [ 0.93780 1.03151 ]

Note: The numerical errors are approximately three times the standard deviations (for

reference).

En la figura 3.6 se puede observar que el error de la proyección es muy grande cuando

se tiene una gran cantidad de imágenes. La razón de esto es que no se realizó un

trabajo muy cuidadoso en extraer las esquinas en algunas imágenes altamente torcidas.

Page 43: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

En esta figura, el marco (Oc, Xc, Ye, Zc) es el marco de la referencia de la cámara

fotográfica. La pirámide corresponde al campo visual eficaz de la cámara fotográfica

definida por el plano de imagen.

En esta nueva figura, cada posición y orientación de la cámara fotográfica es

representada por una pirámide verde.

El procedimiento anterior se llevó a cabo para cada una de las imágenes capturadas por

la webeam (figura 3.1) pero solo se describe el procedimiento para una de las imágenes

en el presente reporte para dar a entender como se realizo la calibración, así como los resultados obtenidos de dicha calibración.

Nota: Al ejecutar el tool box para la calibración de una cámara se puede elegir entre dos

modos de trabajo, en modo estándar, todas las imágenes usadas para la calibración una

vez que se cargan en memoria no se vuelven a leer del disco. Esto reduce al mínimo el

número total del acceso de disco, y acelera todo el proceso de imagen y funciones de

desplegado de la misma. Sin embargo, si las imágenes son grandes, o se trabaja con

muchas, se genera un error por la saturación de la memoria. Si éste es el caso, debe

usarse el método de memoria eficiente, en este modo, cada imagen se carga una por

una y nunca se almacena permanentemente en memoria. Si se elige funcionar con el

modo estándar siempre se tiene la opción de cambiar al modo eficiente de memoria en

caso de que se genere el error de saturación de la memoria.

Una vez corregidos los errores que tiene la calibración se realizaron pruebas de varias

imágenes tomadas por la cámara para evitar la distorsión (figura 3.9).

Page 44: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

En la figura 3.9 se puede observar claramente como las partes que aparecen curvas se

vuelven más rectas, por lo que se puede concluir que se logro satisfactoriamente la

calibración de nuestra cámara web.

3.5 DESCOMPOSICIÓN DEL FORMATO DE VIDEO VOB EN FORMATO AVI

Se realizaron pruebas con uno de los videos tomados de los sujetos que sí presentaron movimiento nistágmico del ojo, y se tienen varios aspectos a tratar.

El video arrojado por la cámara utilizada para la captura del mismo (cámara de video

minidvd marca sony) es con extensión.vob; por lo que lo primero a realizar para llevar a

cabo el tratamiento de cada cuadro de la película es la transformación de dicha

extensión a .avi con el programa VirtualDub-MPEG2 1.6.15 puesto que hasta el

momento por la teoría investigada se sabe que MatLab solo acepta este tipo de video.

Los resultados obtenidos fueron satisfactorios ya que se redujo el tamaño del video, por

ejemplo, el video del paciente número dos en formato DVD o con extensión.vob tenia un

tamaño de 1, 048, 544 kb y al comprimirlo a la extensión.avi se redujo su tamaño a 135,

392 kb, esto se realizó con compresión de video XVID1 de la siguiente manera:

Abrir VirtualDub y cargar el MPG haciendo click en File y a continuación en Open video file con lo que saldrá un explorador donde se debe seleccionar y buscar el MPG que se

desea convertir a AVI. Después se da click en Video y se marca Full processing mode,

de nuevo se repite el click en Video y se selecciona Compression (figura 3.10).

1 El codee Xvid hace posible comprimir una película completa con una calidad cercana a la de la fuente original para

que ocupe tan solo 700 MB (en ocasiones 1400 MB, dependiendo de la duración y otros factores). Las películas codificadas en Xvid ofrecen videos de alta calidad en archivos de tamaño reducido, además de llevar menos tiempo su compresión que en MPEG-2 debido a un algoritmo de compresión más avanzado.

Page 45: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Al hacer clic en Full processing mode se observará una pantalla como la siguiente (figura 3.11).

En la cual se escoge Xvid como codee para comprimir el video. Una vez hecho lo anterior se da clic en Audio y después de marcar Full processing mode

se selecciona también No audio como se observa en la imagen 3.12. En este caso no es

necesario el audio por lo que se omite.

Al finalizar con lo anterior se da clic nuevamente en File y luego en Save as AVI (figura

3.13), de esta manera comienza la compresión del video.

Page 46: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Una vez comprimido el video se prosigue con la manipulación de cada uno de los

cuadros que lo conforman, sin embargo MatLab acepta solamente videos

descomprimidos para poder llevar a cabo una buena manipulación de los mismos, por

lo que aunque se contaba con un video de reducido tamaño no se podía manipular en

MatLab, nuevamente con ayuda del programa VirtualDub se descomprimió el video

siguiendo los mismos pasos que para comprimirlo al formato avi pero con la diferencia

del tipo de compresión (figura 3.14). t .

El tipo de compresión elegido fue Uncompressed puesto que se desea la obtención de

un video descomprimido para la manipulación de los cuadros de video en MatLAb.

3.6 MÉTODO PARA DETECTAR LA POSICIÓN DE LOS OJOS

El método propuesto es capaz de rastrear regiones de objeto completas en una

secuencia de cuadros de video. En este trabajo el rastreo de objeto es alcanzado

mediante el análisis del movimiento de los contornos.

El algoritmo propuesto implica tres componentes principales para analizar las formas y

los movimientos del objeto en los cuadros de video. Primero, un algoritmo de

Page 47: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

detección de borde de morfología matemático modificado es utilizado para extraer los

rasgos de contorno en los cuadros de video. Entonces, se propone un algoritmo de

detección de círculos, aplicado a los rasgos de contorno para dividir los objetos

predeterminados objetivo, en este caso el círculo del iris, en los marcos de video.

Finalmente, un esquema sencillo de valoración de trayectoria es desarrollado para manejar los movimientos de los objetos en los marcos de video. El algoritmo de

detección de círculos propuesto es capaz de la partición automática de los objetos

predeterminados. El análisis de resultados muestra que el algoritmo propuesto puede

rastrear el objeto predeterminado en cada uno de los cuadros de video [13].

El rastreo de las regiones completas de los objetos puede ser alcanzado analizando las

características del contorno en los cuadros de video.

En este trabajo, un acercamiento matemático a base de morfología es presentado. El

algoritmo propuesto es un híbrido de tres componentes principales, que son un detector

matemático morfológico de borde realzado, un algoritmo de detección de círculos a base

de contorno, y un esquema de valoración de trayectoria, respectivamente. El detector de

borde utilizado es una versión perfeccionada del detector de borde de morfología matemático, que es capaz de bosquejar hacia fuera rasgos de borde muy delgados

(finos) que normalmente son eliminados por otros detectores de bordes convencionales

[13]. Además, el algoritmo de segmentación de imagen propuesto (detector de círculos)

también es utilizado para dividir el objeto predeterminado de una manera precisa en el

cuadro de video. El esquema de valoración de trayectoria propuesto es aplicado para

estimar las posiciones de los objetos predeterminados en las secuencias siguientes de

los cuadros de video. El diagrama de bloque conceptual es representado en la figura

3.15.

Page 48: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

3.6.1 EXTRACCIÓN DEL CONTORNO

Se utiliza un detector de bordes matemático morfológico bosquejando las características de contorno en cuadros de video, debido a que el algoritmo de rastreo propuesto está

basado en los rasgos de contorno de los mismos, la detección de características de

borde es una tarea importante para el algoritmo propuesto y de esta manera extraer el

objeto deseado.

3.6.1.1 Escalamiento

La imagen original tomada por la cámara web utilizada es de 320x240. Uno de los

primeros pasos en el detector de círculos es determinar todos los valores dentro de la

imagen iguales a 1 (sección 3.4.2), la imagen para este paso se encuentra en estado

binario (ceros y unos), por lo tanto, se obtienen demasiados píxeles con dicho valor y el tiempo de procesado con la imagen original es tardado (ver capítulo 4) por lo que se

aplica un escalamiento a dicha imagen, es decir, la imagen se reduce un 70% y su

tamaño cambia a 96x72 píxeles, de esta manera el tiempo de procesado se reduce

también en un 70% aproximadamente.

3.6.1.2 Operadores matemáticos morfológicos

La teoría de morfología matemática fue inventada por Matheron en 1970 [13]. Al principio

fue desarrollado para analizar estructuras geométricas. Serra fue el primero que utilizó la

teoría de morfología matemática para realizar el análisis de imagen. La morfología

matemática es el análisis de señales no lineales en términos de formas, esto simplemente significa objetos que cambian de forma contenidos dentro de las señales no

lineales. La imagen es tratada aplicando las operaciones basadas en la morfología

matemática, y los operandos en todas las operaciones de morfología matemática son

tratados, también. Hay dos tipos de señales complicadas en las operaciones

matemáticas morfológicas, uno es la forma de la señal que se determina mediante los

valores que la señal va tomando, y el otro es la forma de la señal que es extraída

aplicando un elemento de estructura para funcionar sobre la señal. La morfología puede

ser aplicada a una amplia gama de usos, como el realce de imagen, la restauración de

imagen, la detección de borde, y la reducción de ruido.

Hay dos operadores básicos morfológicos: erosión y dilatación. Muchas otras

operaciones son sacadas de las operaciones definidas en términos de erosión y

dilatación.

La erosión de una imagen de nivel gris F por otro elemento de estructuración B, denotada

por F©B, es definida como:

Page 49: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

donde (x, y) y (i, j) son los valores en alto (1) de coordenada de la imagen F y el elemento

de estructuración B, respectivamente. La erosión es un operador 'que se encoge'. Los

valores de F©B son siempre menores que o iguales a los valores de F.

La dilatación de una imagen a nivel gris F por otro elemento de estructuración B,

denotada por FSB, es definida como lo siguiente:

La dilatación es un operador 'de extensión'. Los valores de F©B son siempre mayores

que o iguales a los valores de F.

En los operadores de erosión y dilatación definidos arriba, podemos descubrir el borde en

la imagen F, denotada por Ee (F), que es definido como el valor de diferencia de la

imagen original F y el resultado de erosión de F. También se conoce como el detector de

borde de residuo de erosión:

Otro método de descubrir rasgos de borde en la imagen F, denotada por el Ed(F), es

definido como el valor de diferencia del resujtado de dilatación de F y la imagen original

F. También se le conoce como el detector-de borde de residuo de dilatación:

La apertura de una secuencia de datos F por un elemento de estructuración B es definida como la erosión seguida de la dilatación, que puede ser denotada por F°B y expresada

como lo siguiente:

La apertura de una secuencia de datos puede ser interpretada como el barrido del

elemento de estructuración a lo largo de la secuencia de datos desde abajo y el resultado

son los puntos más altos alcanzados por cualquier parte del elemento de estructuración.

Generalmente, la apertura puede alisar el bosquejo de una imagen y romper huecos

estrechos.

El cierre de una secuencia de datos por un elemento de estructuración es definido como

la dilatación seguida de la erosión, que puede ser denotada por F»B y expresada como

sique:

El cierre de una secuencia de datos puede ser interpretado como el barrido, un

'tirado-sobre' la versión del elemento de estructuración a lo largo de la secuencia de

datos desde arriba y el resultado son los puntos más bajos alcanzados por cualquier

parte del elemento de estructuración. Generalmente, el cierre puede fundir roturas

estrechas y llenarse de pequeños agujeros y huecos en el bosquejo.

La apertura y operaciones de cierre pueden ser usadas para construir la transformación

de top-hat para realzar las regiones brillantes o regiones oscuras. La transformación de

top-hat blanca de la imagen F, denotada como WTH(F), es definida

Page 50: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

La transformación de top-hat negra de la imagen F, denotada como BTH(F), es definida

como la adición del resultado en alto (1) de cierre de F y la imagen original F y puede ser

formulada como sigue:

Por lo tanto, una operación de realce simple a base de vecindad morfológica de contraste

puede ser obtenida por la paralela que calcula el top-hat blanco y negro de la imagen F. Por ejemplo, el top-hat blanco puede ser añadido a la imagen original F para realzar los

objetos brillantes y el top-hat negro puede ser restado de la imagen resultante de realzar

los objetos oscuros, respectivamente. El operador de realce de contraste de top-hat final

es denotado por k™ y puede ser formulado como sigue:

3.6.2 DETECTOR DE BORDES

El objetivo primario de utilizar el detector de bordes [13] es descubrir rasgos de borde en

los cuadros de video y preservar las características de un contorno suave o liso también.

En esta sección, el detector de bordes utilizado en el algoritmo propuesto del rastreo de

un objeto es brevemente presentado. La descripción el diagrama de bloque conceptual

es ilustrada en la figura 3.16.

El objetivo principal de este paso es descubrir y conservar rasgos de borde delgados (finos) en regiones bajas de contraste en la imagen. Con este trabajo, utilizamos al

operador de realce de contraste de top-hat morfológico para aumentar las diferencias de

intensidad de píxel de la imagen. Por lo tanto, podemos obtener la mejor calidad de

imagen de borde que usa el detector de borde de residuo de dilatación morfológico. Sin

embargo, cuando los rasgos de borde delgados (finos) están en los sitios de regiones

bajas de contraste, las fuerzas de diferencias de intensidad de píxel son muy débiles y

probablemente imperceptibles por un valor de umbral global.

Por lo tanto, un umbral global es aplicado para transformar la imagen de borde en

binario, enseguida se realzan las diferencias de intensidad de píxel, ya que los rasgos de

contorno enteros finos son realzados. El procedimiento total del algoritmo propuesto es

¡lustrado en la figura 3.17.

como el valor de diferencia de la imagen original F y el resultado de apertura de F y puede ser formulada como sigue:

Page 51: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

3.6.2.1 Umbralizado

Como se menciona en la Sección 3.4.2.3, cuando el nivel de resplandor no es bien

distribuido en la imagen entera original F, las características de contorno extraídas por Fe

podrían contener bordes en varias intensidades.

Se tiene la imagen umbralizada entera por un valor de umbral global para transformar la

imagen original F en una imagen binaria y enseguida aplicar el realce de contraste y los

demás pasos descritos posteriormente y poder quitar los puntos ruidosos. El proceso de

umbralizado puede ser descrito como

donde F es la imagen de borde binaria, y la T es el valor de umbral dado. Un valor de

umbral apropiado puede ser obtenido experimentalmente. Un mayor valor de umbral

puede extraer bordes más delgados (finos), pero también conducir a extraer más puntos

ruidosos que realmente no pertenecen a ningún borde. Un valor pequeño de umbral es

todavía capaz de extraer los bordes realzados delgados (finos) sin producir una enorme

cantidad de ruido, pero esto puede eliminar algunos bordes realmente delgados (finos).

Se sugiere aplicar un valor de umbral en los límites de 50 a 60 para producir la imagen Ft

con los bordes delgados (finos) claramente y sin sufrir de demasiados puntos ruidosos.

Page 52: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

El objetivo primario de aplicar un umbral antes de los operadores morfológicos es de

quitar píxeles indeseados ruidosos en Ft.

3.6.2.2 Realce de contraste

Como se mencionó, el algoritmo propuesto consiste en cuatro pasos. El primero y

segundo pasos están basados en las operaciones matemáticas morfológicas. F denotara

el nivel en alto de la imagen original, y B el nivel en alto del elemento de estructuración, y las descripciones formales son presentadas en los párrafos siguientes.

Para aumentar el nivel de contraste de la imagen original F, el proceso de realce morfológico de contraste es aplicado a F para aumentar las diferencias de intensidad de

píxel que cooperan con una estructura el elemento B como se muestra en la figura 3.18,

y el realce(la mejora) de contraste puede ser formulada como

donde Fe es el contraste de la imagen realzada sacada la imagen F, y el WTH(F) y BTH

(F) son la transformación de top-hat blanca y la transformación de top-hat negra de

imagen Ft, respectivamente. Una forma simplificada de la ecuación (12) puede ser

sacado de la sustitución de ec. (8) a ec. (10) como se muestra abajo:

El objetivo primario del proceso de realce de contraste es acentuar y afilar los rasgos en

la imagen, y hacer la imagen original más útil para la visualización de los ojos humanos o

dejar a la imagen ser analizada por el más fácil detector de borde de residuo de

dilatación morfológico.

Page 53: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

3.6.2.3 Detector de borde de residuo de dilatación morfológico

El detector de borde de residuo de dilatación morfológico es aplicado al contraste de la

imagen realzada (mejorada) Fe para extraer los detalles de rasgo de contorno de la

imagen original F. El proceso puede ser formulado como

donde Fe son los rasgos de contorno extraídos que contienen bordes con varias

intensidades.

Aunque el nivel de contraste de la imagen original^ ha sido realzado (mejorado) antes de detectar los rasgos de borde en la imagen, algunos bordes lisos en las regiones de nivel

bajas de contraste son todavía demasiado débiles para ser detectadas si un valor de

umbral global es aplicado a Fe para extraer puntos de borde. Para impedir que se

eliminen detalles de contorno delgados (finos) una vez aplicado el umbralizado, es

necesario desarrollar una técnica para realzarlos (mejorarlos) que es lo que se pretende

al determinar Fe.

3.6.3 DETECTOR DE CÍRCULOS

La segmentación llevada a cabo en este proyecto se basa en la detección de círculos y

extracción de un objeto (en este caso el iris) y se define como la agrupación de partes

pertenecientes a una imagen genérica en unidades que son homogéneas en relación a

uno o varios atributos.

La segmentación en pocas palabras es agrupar píxeles en unidades con significado

dentro del campo visual. Su objetivo es avanzar en la compresión del contenido de la

imagen y existen criterios para la segmentación:

a) proximidad

b) similitud

c) continuad

d) otros

Técnicas basadas en umbralización

Es posible segmentar la imagen en función de los valores de intensidad de los pixeles obtenidos del histograma.

Page 54: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

ODe ración:

donde:

T - Umbral del píxel

x - Fila del píxel

y - Columna del píxel p(x, y) - Propiedad del píxel en la coordenada (x, y).

f(x, y) - Intensidad del píxel en la coordenada (x, y).

1. Umbralización global. Solo depende de la intensidad f(x, y). Permite una clara

definición entre objetos y fondo. La selección del umbral se realiza a partir del

conocimiento del histograma.

2. Umbralización Zonal. Depende de f(x, y) y de p(x, y). Se selecciona un umbral

único para cada subimagen.

El modo de operación es:

• Dividir la imagen en subimagenes arbitrariamente o mediante la aplicación de

heurísticos.

• Elegir un umbral para cada subimagen.

• Aplicar su umbral en cada región.

• Se hace una segunda pasada para homogeneizar en objetos.

3. Umbralización multiumbral. Depende de f(x, y), p(x, y), x, y. Se aplica para

imágenes con N objetos en donde cada uno ocupa un rango del histograma,

definido por dos umbrales. La selección de umbrales se hace dividiendo N-1

entre los N máximos (N son los objetos). El rango de aplicación se extiende a

toda la imagen.

Técnicas basadas en la frontera

1. Procedimiento general

• Se calcula la imagen gradiente

Localización de bordes

• Bordes que pueden aparecer

- Correctos: bordes reales de la escena

- Falsos: no deberían aparecer en la imagen derivada

- Perdidos: existen en la imagen pero no aparecen en la derivada.

• La imagen gradiente se pasa al detector de frontera

- Otorga significado a la imagen derivada

- Localiza y ordena bordes correctos, rechaza bordes falsos y

restaura bordes perdidos.

Tipos de detectores de frontera

• Basados en criterios locales (seguimiento del contorno)

- Analizan un contorno de vecindad del píxel dado. Consideran el

valor y dirección del gradiente en el punto y el entorno.

• Basados en criterios globales

Page 55: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

- Analizan la imagen en conjunto. - Existen los métodos de búsqueda heurística, ajuste de curvas y

transformada de Hough.

3.6.3.1 Transformada de Hough

Es un algoritmo empleado en reconocimiento de patrones en imágenes que permite encontrar ciertas formas dentro de una imagen, como líneas, círculos, etc. La versión

utilizada es la de encontrar círculos. Su modo de operación es principalmente estadístico

y consiste en que para cada punto que se desea averiguar si es parte de un círculo se

aplica una operación dentro de cierto rango, con lo que se averiguan las posibles

circunferencias de las que puede ser parte el punto. Esto se continúa para todas los

puntos en la imagen, al final se determina cuales coordenadas de cada una de las

circunferencias encontradas fueron las que más puntos posibles tuvieron y ese se

considera el centro del objeto de determinado radio que se está.

Básicamente, la transformada de Hough es una técnica utilizada para aislar

características de forma particular dentro de una imagen. La idea básica es encontrar curvas que puedan ser parametrizadas como líneas rectas, polinomios y círculos [14].

La ecuación del círculo tiene tres parámetros (dos para el centro del círculo, uno para el

radio). Por lo tanto el espacio de parámetros formado es de dimensión tres. Esto dificulta

el algoritmo, recorrer un espacio de dimensión dos, y encontrar máximos en espacio de

dimensión tres. Sin embargo una ecuación conveniente para describir un conjunto de

círculos es:

Los puntos de intersección de las circunferencias, corresponden a los parámetros (a, b)

de los posibles círculos que se encuentran en la imagen.

En las ees. (17 y 18) x y y denotan las coordenadas de cada uno de los puntos de la

imagen donde se trazará la circunferencia de radio correspondiente r. El ángulo 0 es el

barrido desde 1 hasta 360 grados para tener una circunferencia completa con centro en

el punto (x, y).

3.6.4 ESTIMACIÓN DE LA TRAYECTORIA

El motor debe recibir las coordenadas a las que se debe mover desde MatLab mediante

el puerto paralelo, según el movimiento que el ojo realice. Cabe mencionar

Donde r es el radio que se busca encontrar dentro de la imagen.

De la ecuación 16 se derivan dos ecuaciones más que nos permitirán trazar cada una de

las circunferencias en los distintos puntos:

Page 56: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

que solo se toma en cuenta la trayectoria que realiza dicho órgano de izquierda a derecha, debido a que el nistagmo que se estudia en este momento es el que se

presenta horízontalmente, por lo que las coordenadas verticales se descartan.

3.6.4.1 Cálculo de la trayectoria

El manejo del motor desde MatLab se realiza mediante la instrucción matport, llevando a

cabo previamente una instalación de la librería determinada para el manejo del puerto

paralelo desde dicho lenguaje.

La instrucción mencionada anteriormente para el manejo del puerto paralelo, recibe los datos decimalmente, es decir (ver sección 3.7):

matport('outport', 888, #decimal)

Debido al uso de la instrucción anterior se realiza una conversión de pixeles a número

decimal, tomando en cuanta la figura 3.19.

Mediante pruebas con el motor y el manejo del puerto desde MatLab se determinó que el centro del motor (90°) equivale al número decimal 155 y en píxeles es el píxel 55 de la

imagen situado en el centro, ya que el tamaño de la imagen escalada es de 109x85. Y se

toman como referencia desde el píxel 1 (0o) equivalente a 70 en número decimal, según

las pruebas realizadas, hasta el píxel 109 (180°) equivalente a 240 en número decimal.

Haciendo la relación píxel-numero decimal se tiene lo siguiente (ver figura 3.19):

155 decimal - 70 decimal = 85 decimal

55 píxeles - 1 píxel = 54 píxeles

85 decimal -> 54 píxeles 1 decimal

-> x1 = 0.6353 píxeles

1 decimal -> 0.6353 píxeles Npixeles

(coordenadas del iris)-> x2

x2 = Npixeles / 0.6353

Page 57: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Donde Npixeles son las coordenadas horizontales del centro del iris obtenido en cada

uno de los cuadros analizados.

3.6.4.2 Velocidad del píxel

Una vez transformados los píxeles a coordenadas de motor se procede a determinar la

velocidad con la que cada centro obtenido se mueve, para ello se utiliza la fórmula de

velocidad (ecuación 19) Í151:

Donde s1 y s2 son los desplazamientos sufridos por el centro horizontalmente y t1 y t2

es el tiempo transcurrido en ese desplazamiento. En nuestro caso se determina

mediante los cuadros por segundo que maneja la cámara web utilizada, es decir, la

cámara obtiene 30 cuadros en 1 segundo, por lo que:

Donde Ncuadros es el número de cuadros que se le indica al programa leer mediante la

cámara web.

Una vez obtenida la velocidad se debe determinar si existe la presencia de un nistagmo

en el movimiento que esta captando la cámara web en determinado momento que se

esta llevando a cabo en el ojo de un sujeto de prueba.

3.7 MECANISMO EMULADOR

3.7.1 MECANISMO EMULADOR DEL NISTAGMO

El mecanismo que se encarga de la emulación del nistagmo esta constituido por un servomotor de la marca Hitec y una tarjeta controladora del motor, además de una base

donde en su interior se encuentra la tarjeta, y por encima el motor, acoplado a éste, en

su parte superior se haya la representación de un ojo (ver Anexo B).

Para la construcción de la tarjeta para controlar el servomotor se requieren los siguientes

materiales:

• 1 Tarjeta perforada

• 1 PIC 16F876A

• 1 programador para pic's

Page 58: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

• 1 conectar DB 25 hembra

• 1 oscilador cristal de 4Mhz

• 1 tira de 40 headers

• 2 capacitores cerámicos de 10 |jf

• 5 resistencias de 1KQ

• Soldadura

• Cautín

Para realizar la interfase entre la computadora y la tarjeta se hace uso del puertc

paralelo como medio de comunicación, y un microcontrolador PIC 16F876A parí controlar dicha tarea (figura 3.21), se elige este microcontrolador por contar con ur

bloque exclusivo de puerto paralelo y con dos salidas independientes de modulaciór

PWM, una de las salidas del microcontrolador es programada para enviar un pulse cada

20 ms, que es el tiempo requerido en el diseño.

Page 59: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Para programar el PIC se utiliza el software Micro-Code Studio, en el cual se encuentra

el código de funcionamiento del microcontrolador y el software IC PROG 1.05C para

mandar descargar el programa en PIC. El programa es el siguiente:

ADCON1=7

TRISA=0 * ,

TRISB=%11111111

ANCHO VAR BYTE

PORTA.0=0 LOOP:

ANCHO=PORTB

PULSOUT PORTA.O , ANCHO

PAUSE 20

GOTO LOOP

El comando ADCON1 deshabilita el convertidor a na lógico-digital y deja habilitadas las

entradas como digitales, esto porque a la entrada se tiene un numero binario de 8 bits.

Con la instrucción TRISA=0 el puerto A queda configurado como salidas, del cual solo se

utilizara el pin numero 2 del PIC que es, el primer pin del puerto A, este es la salida de

donde sale el pulso.

Con la orden TRISB=%11111111 se configura el puerto B como entradas digitales.

ANCHO VAR BYTE indica al programa que los valores que se le van a asignar a la

variable ANCHO van a ser del tipo BYTE.

Con la instrucción PORTA.0=0 se asegura que todo el tiempo se va a tener un cero en el

primer pin del puerto A.

Con el código: LOOP:

ANCHO=PORTB PULSOUT PORTA.O , ANCHO PAUSE 20 GOTO LOOP

El servomotor es un HS311 estándar de Hitec (figura 3.22) el cual opera a una velocidad

de 0.15seg/60° a un voltaje de 6v y con un torque de 3.7 kg.cm (Ver Apéndice I).

Page 60: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Se hace un ciclo donde se esta verificando todo el tiempo que valores son los que están entrando por el puerto B, aquí se recibe un numero binario el cual se le asigna a ANCHO,

ahora por la manera en que se configura el reloj con el oscilador de 4Mhz, por cada

unidad que haya en el puerto B se tienen 10us, por lo que este numero es un factor el

cual escala cada uno de los valores binarios de entrada, estos son sacados por el primer pin del puerto A como un pulso con la función PULSOUT, con la función PAUSE 20 se le

indica al PIC que cada 20us. le manda un pulso, esto por las especificaciones del motor,

pero ahora como el motor solo funciona en el rango de los 1100 a 1900us. se le mandan

los números del 50 al 240 binario, estos 190 valores se dividen entre los 200 grados que

da el motor, y entonces dependiendo el valor que entre por el puerto B y siendo mayor a

50 y menor a 240 es la posición en ángulo que toma el motor.

Para probar que el programa y el microcontrolador funcionen de manera correcta antes de probar con el algoritmo, se pueden hacer pruebas de la siguiente manera: primero se

tiene que configurar el puerto paralelo, puesto que Windows XP no deja controlar los

puertos entonces se procede a instalar el software NTPort Library 2.7 para poder abrir el

puerto, después con el uso de MatLab y la instrucción matport se pueden manipular

datos tanto de entrada como de salida, así como el puerto que se quiere usar, para este

caso solo se manipulan datos de salida y, estos son valores decimales que la instrucción los convierte en números binarios. Ahora para usar el puerto de la impresora se le tiene

que dar la dirección del puerto al programa, por lo que la instrucción en MatLab para

enviar datos por el puerto LPT1 queda de la siguiente manera:

Matport('pout', 888,50-240);

Donde 50-240 indica el valor que se le introduce a la tarjeta, y este número se ve

reflejado en un movimiento en ángulo en el servomotor.

3.8 GENERADOR DE ONDAS DIGITAL

El generador de ondas son algoritmos que generaran sonidos por medio de la computadora, ya que con la computadora se pueden generar estos a diferentes

frecuencias hasta 45Khz.

Para la creación de estos algoritmos se propone utilizar MatLab como interfaz, ya que se

puede controlar con precisión las frecuencias, ganancias, y los canales. (Figura 3.23).

Page 61: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Se han realizado diversos estudios en la clínica del sueño donde se ha encontrado que el sonido puro generado con la técnica Hemi-sync (figura 3.24) es molesto y tiende a

provocar dolor de cabeza. Por lo que se recomienda esconder el sonido dentro de una

melodía.

La manera de esconder el sonido puro generado consiste en sumar ambas señales.

Por lo tanto el generador de señales utilizado adiciona una señal de sonido de una

melodía (figura 3.25) con una onda de 440 y 464Hz. Simultáneamente. Se manejan estos

valores de frecuencia, ya que en la bibliografía consultada, las ondas betas oscilan entre

los 18 Hz y los 35 Hz.

En matlab se creo una simulación de cómo se ven dos ondas de diferente sonido y una

onda hemi-sync , así como la simulación de que pasa cuando se le suma la onda

hemi-sync a las ondas de diferente frecuencia (figura 3.26).

Page 62: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Para sumar las ondas con el sonido final, se hace uso de un software de edición de

sonido, ya que un sonido o una canción tiene que estar en extensión .wav para que

MatLab la lea sin ningún problema, dichas canciones tienen demasiados componentes (cientos de miles) por lo que MatLab no soportaría le manipulación de los sonidos para

sumarles las ondas, y esto paraliza la computadora, así que se utiliza, el software

Acoustica MP3 Player and Mixer para hacer la suma de las ondas y el sonido a utilizar,

así también con este software se realiza la separación de los diferentes canales de

salida. (Figura 3.27).

Una vez hecho esto el archivo se puede guardar como una sola canción que ya contiene

a las ondas y que esta programado para que se reproduzca en dos canales distintos

(figura 3.28).

Page 63: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

3.9 SOPORTE PARA LA CÁMARA Y EL USUARIO

Soporte para el propósito de mantener la cámara fija frente al ojo del usuario de una

manera que no sea tan incómoda (ver Anexo A).

El proyecto requiere de un soporte de cámara y de un soporte para el usuario para que la

cámara pueda estar captando siempre el ojo del paciente manteniéndose firme, tanto la

cámara como el sujeto de prueba, sin necesidad de que el usuario deba sostenerla. El

soporte, además, debe manteneeel ojo dentro del mismo rango visual.

El soporte para el sujeto esta constituido de varillas de aluminio: el esqueleto consta de

varillas de Vi plg y V* plg de diámetro, unidas por agarraderas también de aluminio. Para

la sujeción de la cabeza del sujeto de prueba se requiere de una correa de plástico

flexible de 1mm de espesor, para la recargar la cabeza se utiliza un cojinete de espuma

de poliuretano recubierto con piel sintética.

En la base se monta el esqueleto, esta está constituida por dos varillas de 3A plg de

diámetro y 50cm de longitud. Separadas aproximadamente 60cm. En las esquinas

tendrán gomas antiderrapantes y en el centro, unas uniones de aluminio para montar el

esqueleto, que será de dos varillas de V2 plg de diámetro y 150cm de longitud, en

posición vertical, las cuales se unirán por los dos sujetadores de la cabeza, los cuales

tienen incorporados unos anillos que servirán de correderas para adaptarse a la altura del

sujeto. El soporte principal de la cabeza será una lámina de aluminio de 2mm de espesor,

la cual será acondicionada para tener una forma cómoda para el sujeto y se forrará con

espuma de poliuretano que a su vez estará cubierta con piel sintética. El soporte para la

frente será una correa de plástico flexible de aproximadamente 1mm de espesor.

En anexo I se presenta el diseño del mecanismo, y el soporte para el usuario.

Page 64: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

CAPÍTULO 4

ANÁLISIS DE RESULTADOS

Page 65: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

4 ANÁLISIS DE RESULTADOS

4.1 ALGORITMOS

En cuanto a la calibración de la cámara cabe mencionar que el método utilizado con el

toolbox de MatLab es más fácil, en cuanto a manipulación y obtención de lo deseado

(calibración), que el método tradicional utilizado para calibración de cámaras sin uso del

toolbox. Existen varios métodos tradicionales para llevar a cabo dicho procedimiento,

uno de los cuales consiste en rayar una cartulina y tomarle fotografías a diferentes

distancias variadas de 5 cm en 5 cm a partir de que la imagen de la cartulina se pueda observar completamente en la cámara web (figura 4.1). Una vez obtenidas las imágenes

se debe relacionar la distancia pixeles-centímetros y se procede a la calibración

geométricamente, sin embargo se necesita realizar un análisis geométrico muy exhausto

y preciso.

Con el uso del toolbox se facilitó la calibración ya que dicha librería incluye los cálculos

necesarios que se debían calcular manualmente con la calibración tradicional antes

mencionada.

Se tuvieron diversos problemas para el manejo de video en MatLab debido al tipo de

compresión que usaba la cámara de video utilizada para grabar los videos de cada uno

de los sujetos de prueba por lo que se tomó la decisión de utilizar VirtualDub (ver capítulo

3 sección 3.5) para descomprimir el video, sin embargo este proceso tardó

aproximadamente 40 minutos.

Una vez hecho lo anterior el video descomprimido aumento a poco mas de 20 Gb por lo

que el tiempo de procesado en MatLab tardó aproximadamente 2 horas.

Para solucionar lo anterior se tomó solo un fragmento del video de 9 segundos con 272

cuadros a 30 cuadros/segundo. Y se realizaron pruebas con dicho fragmento

incorporado al programa de identificación del ojo descrito en el capítulo 3.

En este fragmento de video no se observó ningún tipo de nistagmo por lo que se ajustó

el programa para que a lo largo de todo el video se mostrara solamente 1 frame de cada

5 y a ese cuadro aplicarle el algoritmo de identificación del ojo.

Page 66: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Una vez descomprimido el video, el procesamiento de imágenes es realizado frame por

frame, al realizar esto el tiempo de procesamiento es menor en comparación a trabajar

toda una señal de video.

Se necesita descomponer un video en trames lo cual se realiza mediante el siguiente

algoritmo:

a = aviread('video.avi');

j=i; for ¡=1:5:250 h= a(i).cdata; Igris=rgb2gray(h);

imwrite(ll,(cat(2,,ojo.

,,num2strü,'%02d'),'.jpg')));

H+1; end

La instrucción imwrite guarda en memoria de la computadora cada una de los trames

que conforman al video con el nombre ojo.01, ojo.02, ojo.03, etc., con formato jpg.

La instrucción getframe de MatLab regresa cada uno de los cuadros que conforman un

video, los cuales son estructurados en dos tipos,de campo:

cdata: Los datos de una imagen se guardan como una matriz con valores uint8. colormap: El mapa de color es guardado en una matriz de valores dobles de nx3. F.colormap está

vacío para sistemas de color real.

Por lo descrito anteriormente el campo del getframe que obtiene cada uno de los frames

o cuadros de video es el cdata, por lo que se utiliza dentro de un for para obtener todos

los frames de un video.

Del mismo modo se necesita comprimir varios frames en video, eso se realiza con el

siguiente programa:

objavi=avifile('video2.avi');

for i=1 :#frames deseados

aux = imread(cat(2, 'ojo.', num2str(i,'%02d'),,.jpg'));

objavi=addframe(objavi,aux);

end

Con el subprograma anterior se leen determinadas imágenes llamadas ojo.01, ojo.02,

ojo.03, etc., de extención jpg y las almacena en un video llamado video2.avi. Para

observar el video se utiliza getframe y movie.

Los programas realizados se anexan a la tesis en un cd.

Haciendo uso de lo descrito en el capítulo 3 en la sección 3.6 se realizaron los siguientes

algoritmos:

function erosion=ero(a); B=[0 1

0;1 1 1;0 1 0];

erosion=imerode(a,B); erosion=imerode(erosion,B);

Page 67: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

El subprograma es establecido como una función, la cual será utilizada por otros programas posteriormente. Se observa que se aplica dos veces la máscara de erosión,

esto con el fin de delinear más el contorno o borde y eliminar ruido en la imagen que se

va a procesar al final con el programa de la transformada de Hough.

function dilatacion=dila(a);

B=[0 1 0;1 1 1;0 1 0];

d¡latacion=imd¡late(a,B);

Esta es otra función que se manda llamar posteriormente y es la segunda operación

morfológica. Se recibe una imagen a la que se le aplica la máscara de la dilatación.

function FoB=erodila(a); erosion=ero(a);

FoB=dila(erosion);

En la función denominada erodila se define la erosión seguida de la dilatación como parte

del detector de bordes.

function FOB=dilaero(a); dilatacion=dila(a);

FOB=ero(dilatacion);

De la misma manera en la función llamada dilaero se define la dilatación seguida de la

erosión como parte del detector de bordes.

function WTH=wth(a);

[n,m]=size(a);

WTH=zeros(size(a));

FoB=erodila(a); for

i=1:n forj=1:m

Page 68: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

WTH(i,j>a(i,j)-FoB(i,j); end end

En la función denominada wth o white top-hat se define la resta de la imagen original y la

función erodila como parte del detector de bordes.

function BTH=bth(a);

[n,m]=size(a);

BTH=zeros(size(a));

FOB=dilaero(a);

fori=1:n

forj=1:m

BTH(i,j)=FOB(i,j)+a(i,j);

end

end

En la función llamada bth se define lo contrario a la función del subprograma anterior

wth, ya que se hace uso de la suma de la imagen original con la función dilaero.

function kTH=kth(a);

[n,m]=size(a);

WTH=wth(a);

BTH=bth(a);

for i=2:n-1

forj=2:m-1

kTH(i,j)=a(i,j)+WTH(i,j)-BTH(i,j);

end

end

El subprograma anterior marca una función llamada kth que es el realce del contraste

final de los dos top-hat utilizados en las funciones anteriores, esto con el fin de poder

llevar a cabo un detector de bordes de una manera eficaz y sencilla.

Una vez terminadas las operaciones morfológicas básicas se procede al detector de bordes finalmente, inicialmente se tiene una imagen en escala de grises a la cual se el

aplica un umbral con valor de 60 ya que se le aplica, posteriormente, dos veces la capa

de erosión y no es necesario un umbral con un valor mayor. La instrucción para realizar

lo anterior es:

Imagenumbralizada = Imagenoriginal > valor del umbral;

Una vez realizado lo anterior se debe aplicar el realce de contraste morfológico y es

denominado como la función Fc1:

function FC1=Fc1(a);

FoB=erodila(a);

FOB=dilaero(a); [n,m]=size(a);

Page 69: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

for i=2:n-1

forj=2:m-1 FC1(i,j)=(2*a(i,j))+FoB(i,j)-FOB(i,j);

end

end

La función anterior se basa en la fórmula (13) de la presente tesis.

Para finalizar con las operaciones morfológicas basta aplicar a la función Fc1 la ecuación

14, lo cual se logra con ei siguiente subprograma:

function FE=Fe(a);

FC1=Fc1(a);

dilafc=dila(FC1);

[n,m]=size(a); for

¡=2:n-1

forj=2:m-1 FE(i,j)=dilafc(i,j)-FC1(i,j);

end ~

end

donde Fe es la función que contiene los rasgos de contorno extraídos que contienen bordes con varias intensidades.

Una vez que se le ha aplicado el detector de bordes a cada imagen que se recibe de la

cámara en se procede a detectar el centro del iris y llevar un seguimiento del mismo a

través de los cuadros de video, mediante la transformada de Hough de detección de

círculos de determinado radio dentro de una imagen.

Se realizó un programa que localiza el centro del iris y lo sigue conforme detecta los cuadros de video (ver CD anexo sección programas: tt.m)

El programa básicamente detecta cada uno de los cuadros de un video y los procesa

aplicando el código mencionado anteriormente, en cada valor 1 de la imagen original

dibuja un circulo y por medio de este método detecta el centro del iris y dibuja otra

circunferencia con radio igual al propuesto (figura 4.3).

Page 70: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

De una manera mas gráfica para poder explicar el algoritmo anterior se muestra la figura 4.4 donde se observa en la parte (a) los frames del video tomado al sujeto de prueba 11,

el cual puede realizar voluntariamente los movimientos nistágmicos, mientras que en la

parte (b) se observa la detección, rastreo o seguimiento de los círculos de radio r propuesto y la extracción del círculo buscado.

Como se observa en la figura 4.4b el algoritmo tiene algunas fallas cuando intenta

detectar el centro del iris, esto se soluciona cambiando el valor de umbral para dejar

pasar menos ruido en la imagen a tratar.

Mediante el uso de las funciones tic toe de MatLab se obtiene un tiempo de procesado

del algoritmo entre cada imagen o cuadro de aproximadamente 9.281 segundos. Por lo

que no es posible decir que el algoritmo se ejecuta en tiempo real puesto que el

movimiento de un ojo se da en menos de 1 segundo.

Una vez obtenidas las coordenadas de los centros de cada uno de los iris de los frames

leídos, mediante lo explicado en el capítulo 3 sección 3.6.4, se gráfica (figura 4.5) el

desplazamiento sufrido por el iris en el sujeto de prueba 1, el cual puede producir

nistagmos voluntariamente, se edita el video para obtener un transcurso de 14 segundos

que incluye 428 frames (figura 4.5a). En este primer caso se observa en la gráfica la

ocurrencia de nistagmo desde el segundo 2 aproximadamente hasta el segundo 10, lo

cual se pudo corroborar mediante el video tomado a dicho sujeto. Se considera nistagmo

un cierto número de ocurrencias de cierto rango de desplazamiento, en este caso que

ocurra 7 veces con rango de -0 a 0 cm.

Page 71: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

En el segundo sujeto de prueba se leyeron 50 frames con el algoritmo desarrollado, con

duración de aproximadamente 2 segundos, considerando como presencia de nistagmo la

ocurrencia, 7 veces seguidas por lo menos, de un desplazamiento con rango -0.4 a

0.4cm (figura 4.5b). El sujeto de prueba produce nistagmos voluntariamente.

Finalmente se registro a un tercer sujeto de prueba, el cual no logra producir nistagmos

voluntariamente, se incluye para observar la diferencia existente entre un movimiento nistágmico y un movimiento normal del ojo. El video tarda aproximadamente 7 segundos

con 200 frames capturados y se puede ver claramente que la oscilación del ojo es

variada y no mantiene un rango estable que permita al programa identificar como

nistagmo.

Page 72: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Se puede notar la diferencia existente entre las gráficas 4.5a y 4.5c por ejemplo, en la primera se observa la presencia de nistagmo por el patrón que sigue el desplazamiento,

mientras que en la segunda se observa la variación de desplazamiento sin tener un

patrón de desplazamiento.

Cabe mencionar que una vez detectado un nistagmo el programa reproduce

automáticamente la melodía con ondas Hemi-Sync.

4.2 INTERPRETACIÓN DE LAS GRÁFICAS DEL SOFTWARE ALICE

El método que se plantea en este trabajo para medir los nistagmos es, haciendo un conteo de los movimientos de los ojos registrados en el software alice, estos se

distinguen en la gráfica como una deflexión en la señal capturada (ver patrón 2) y se

diferencian de los registros EEG (ver patrón 1) (figura 4.5)

Page 73: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

Se realizaron pruebas que consistieron en privar de sueño toda una noche a 10 sujetos,

para después dentro de la clínica, colocarles los electrodos convenientes y proceder a

filmarlos; para conseguir registros donde se tuviera una apreciación de los movimientos

de los ojos, se les puso a leer a un grupo de 5 personas y a ver una película a otras 5

con el propósito de ver como son unos movimientos oculares normales (figura 4.6) y

como se presentan en las gráficas el nistagmo (figura 4.7) así como la diferencia que hay

entre los movimientos de los ojos en la fase MOR (figura 4.8)

En las pruebas realizadas a los diez sujetos, sólo en tres que estuvieron en el grupo de

los lectores, se logró apreciar el nistagmo tanto en el video como en el registro.

Page 74: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

En una persona normal, sin ninguna afección en sus ojos, el número de movimientos que se registran es aproximadamente de 8 a 12 movimientos en 30 segundos (figura 4.9).

Cuando se presenta el nistagmo en el registro de movimientos, se ve un aumento

considerable en el conteo de estos; cabe mencionar, que el nistagmo es una serie de

movimientos finos y rápidos; el software sólo registra cuando un movimiento está en

máxima deflexión, esto es que después de dos o tres sacudidas muy finas se presenta

una de mayor magnitud, la oscilación de mayor magnitud es la registrada por el software,

obteniendo 10 movimientos aproximadamente, esto difiere con lo detectado por el video,

el cual siempre detecta una mayor cantidad; para el ejemplo manejado cuenta de 15 a 30

sacudidas en 8 segundos, con lo que la propuesta de este trabajo

Page 75: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

es clasificar el nistagmo en: leve (de 15 a 20 sacudidas), moderado (de 20 a 25 sacudidas) y fuerte (de 25 a 30 sacudidas). Éstas sacudidas también se acompañan de

un cambio en las ondas cerebrales (figura 4.10).

Se sabe que cuando una persona esta en vigilia, las ondas que se encuentran presentes

son las ondas beta y al cerrar los ojos, cambian inmediatamente a ondas alfa, con la

presencia del nistagmo se observo el cambio de ondas beta a ondas alfa, esto se puede

observar en la siguiente gráfica (figura 4.11)

Page 76: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

4.3 GENERADOR DE ONDAS

El archivo basado en la técnica Hemi-Sync, en el cual se procedió a esconder las ondas

beta, se probo en la clínica del sueño para poder corroborar que se este induciendo el

tipo de onda indicado.

Para este objetivo se requirió de la presencia de un sujeto en estado de somnolencia,

esto con el propósito de visualizar de mejor manera las ondas alfa, puesto que cuando

una persona cansada cierra los ojos la transición de ondas beta a alfa se origina en

pocos segundos.

Nota: Cuando un sujeto se dispone a dormir, cierra los ojos y se relaja, desaparecen las ondas Beta y son sustituidas paulatinamente por otras de mayor intensidad y menor

frecuencia denominadas ondas Alfa. Si en este momento se abren los ojos desaparece

esta configuración y reaparece la anterior, la banda Beta

Se hizo nuevamente uso del software alice para captar las ondas cerebrales, y de

manera gráfica comprobar el cambio de éstas, que a continuación se describirá en la

figura (4.12).

En el patrón numero 1 se observa al sujeto con los ojos abiertos, y por consecuencia en

los canales de las ondas cerebrales se pueden ver las ondas beta, al inicio del patrón 2

se ve cuando el sujeto cierra y mantiene cerrados los ojos, y se nota el cambio de ondas

beta a alfa después de unos tres segundos, después de aproximadamente cinco

segundos se pone en reproducción el archivo que contiene la

Page 77: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

técnica Hemi-Sync con ondas beta y entonces en el patrón 3 se nota el cambio de ondas alfa a beta, este cambio duro aproximadamente 3 segundos y después regresan las

ondas alfa, pero pasados unos diez segundos se vuelve a presentar el cambio a ondas

beta, y éste cambio duro alrededor de 15 segundos, en todo este tiempo el sujeto tuvo

los ojos cerrados. Por lo que con este análisis se comprueba la efectividad del archivo.

Con el análisis realizado hasta este momento se da la reproducción mediante el actuador

de los movimientos realizados por el ojo del sujeto.

Page 78: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

CAPITULO 5

CONCLUSIONES

Page 79: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

5 CONCLUSIONES

5.1 CONCLUSIONES

• El algoritmo de visión artificial para el procesado digital de imágenes funciona de acuerdo a las necesidades de éste trabajo

• La implementación de la técnica Hemi-Sync se llevo a cabo de u na manera

satisfactoria pudiendo corroborar su efectividad.

• El mecanismo emulador de los movimientos involuntarios del ojo funciono

dependiendo las capacidades del ordenador a usar, teniendo como resultado el

tiempo de procesado.

• El soporte para el sujeto de prueba tuvo algunas complicaciones en su

construcción ya que sufrió modificaciones a lo largo del trabajo.

• El acoplamiento del todo el sistema estuvo sujeto a las capacidades del ordenador,

puesto que dependiendo del tiempo^de procesado será la efectividad de éste,

hablando en termino de la detección y emulación.

• De las diez personas estudiadas en la clínica solo en tres se pudo observar y

registrar de una manera clara y concisa el movimiento involuntario del ojo causado

por fatiga.

• La manera más adecuada para llevar a cabo la detección de las señales de los

sujetos de prueba, es estando recostados. Y como método se recomienda la

lectura de un libro ya que éste hizo que se presentara el movimiento involuntario.

• Se detecta un cambio en las ondas cerebrales cuando ocurre el movimiento

involuntario. El paciente se encuentra en un estado de somnolencia y se da el

cambio de ondas beta a ondas alfa, al mismo tiempo que se presenta el

movimiento involuntario.

5.2 TRABAJO A FUTURO

El presente trabajo puede mejorarse tomando en cuenta diversos puntos que se enlistan a continuación:

• Utilizar otro lenguaje de programación de alto nivel que mejore el proceso de los

algoritmos desarrollados en MatLab.

• Mejorar el protocolo de comunicación.

• El trabajo presentado puede ser implementado en el seguimiento de objetos, para

la detección de miras, ya que se puede utilizar como un filtro, basado en el

nistagmo, para una imagen que se encuentre inestable, en cuanto a movimiento, y

de esta manera eliminar o disminuir la inestabilidad de la misma.

Page 80: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

BIBLIOGRAFÍA

Page 81: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

CIBERGRAFÍA

[I] "Hemi-Sync" en Instituto Monroe . http://www.themonroeinstitute.com

[3] Microsoft ® Encarta ® 2007, © 1993-2006 Microsoft Corporation

[4] http://www.nueva-mente.com/principalhemi.htm

[II] Alvaro M. Pons. "Temas de visión binocular" en Universidad de Valencia.

http://www. uv.es/~ponsa/docencia. htm.

[14] http://pci.unalmzl.edu.co/Tesis/emmenueljuanpablo.pdf

[15] http://www.hiru.com/es/fisika/fisika_00200.html

BIBLIOGRAFÍA

[2] E. Basar. Brain function and oscillations. Editorial Springer; Germany; 1998

[5] Carlson, Neil R., Fundamento de Psicología Fisiológica. 3ra. Edición; Editorial

Prentice Hall; México; 2004

[6] F. Blair Simmons, Suzanne F. Gillam, Douglas E. Mattox. An atlas oí

electronystagmography. Gruñe & Stratton. USA, 1979.

[7] D. Schmidt. Congenital nystagmus, clinical aspects. International Symposium on

1981. Functional basis of ocular motility disorders. Edit. Pergamon Press.

Stockholm-Suecia,

[8] L. F. Dell'Osso. Congenital nystagmus, basic aspects. International Symposium on

Functional basis of ocular motility disorders. Edit. Pergamon Press. Stockholm-Suecia,

1981.

[9] Leybon Ibarra Jaime. Electro-estimulador con fines ortoptistas. CINVESTAV

[10] M. Parisi; Temas de biofísica; 4tó Edición; Me Graw Hill; México; 2004

[12] Stuart Russell-Peter Norving; Inteligencia Artificial. Un Enfoque Moderno"; Ed.

Prentice Hall; 1996

[13] Paper Image and Vision Computing 24 (2006); "Robust múltiple objeets tracking using image segmentation and trajectory estimation scheme in video frames"; 1123-1136.

Page 82: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

APÉNDICE I

Page 83: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx
Page 84: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx
Page 85: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx
Page 86: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx

ANEXO A

SOPORTE PARA LA CÁMARA Y EL USUARIO

Page 87: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx
Page 88: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx
Page 89: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx
Page 90: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx
Page 91: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx
Page 92: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx
Page 93: SISTEMA DE VISIÓN ARTIFICIAL PARA EL ... - tesis.ipn.mx