Binarización de Imágenes

ESCUELA TCNICA SUPERIOR DE INGENIERA INFORMTICA

INGENIERA SUPERIOR EN INFORMTICA

MTODOS DE BINARIZACIN DE IMGENES EN NIVELES DE GRIS

Realizado por JOS MANUEL DELGADO ROMERO

Dirigido por PEDRO REAL JURADO

Departamento

MATEMTICA APLICADA I

Sevilla, Septiembre de 2005

Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

Jos Manuel Delgado Romero 2

0. INDICE INDICE GENERAL 1. DEFINICIN DE OBJETIVOS, 6

1.1. BREVE EXPLICACIN DEL PROYECTO FIN DE CARRERA, 6

1.2. JUSTIFICACIN DEL TRABAJO, 8

2. ESTUDIO TERICO, 10

2.1. CONCEPTOS PREVIOS SOBRE EL COLOR, 10

2.2. MODELOS DE COLOR, 12

2.2.1 MODELO DE COLOR RGB, 12

2.2.2 MODELO DE COLOR CMY, 13

2.2.3 MODELO DE COLOR HSI, 15

2.2.4 MODELO DE COLOR YCbCr,, 18

2.3. DE RGB A ESCALA DE GRISES, 18

2.4. NEGATIVO DE UNA IMAGEN, 19

2.5. ROTACIONES Y GIROS DE UNA IMAGEN, 20

2.6. MTODOS DE BINARIZACIN DE IMGENES ESTUDIADOS, 22

2.6.1 MTODOS GLOBALES DE BINARIZACIN DE IMGENES, 22

2.6.1.1. MTODO VALOR DE NIVEL DE GRIS MEDIO, 22

2.6.1.2 MTODO DE PORCENTAJE DE PXELES NEGROS, 23

2.6.1.3. MTODO DE LOS DOS PICOS, 23

2.6.1.4. MTODO DE WESKA, 24

2.6.1.5. MTODO DE RIDLER, 24

2.6.1.6. MTODO DE THRUSSELL, 25

2.6.1.7. MTODO DE OTSU, 25

2.6.1.8. MTODO DE KAPUR, 26

2.6.1.9. MTODO DE JOHANNSEN, 29

2.6.1.10. MTODO DE HUANG, 29

2.6.1.11. MTODO DE YAGGER, 31

2.6.1.12. MTODO DE KITLER, 32

2.6.2 MTODOS GLOBALES DE BINARIZACIN DE IMGENES, 33

2.6.2.1. MTODO DE BERNSEN, 33

2.6.2.2. MTODO DE EIKVIL Y OTROS, 34

2.6.2.3. MTODO DE MARDIA Y HAINSWORTH, 35

2.6.2.4. MTODO DE NIBLACK, 35

2.6.2.5. MTODO DE TAXT Y OTROS, 36

2.6.2.6. MTODO DE YANOWITZ Y BRUCKSTEIN, 37

2.6.2.7. MTODO DE WHITE Y ROHRER, 38

2.6.2.8. MTODO DE PARKER, 39

2.6.3. OTROS MTODOS DE BINARIZACIN DE IMGENES, 40

2.6.3.1. MTODO WELLNER, 40

2.6.3.2. MTODO DE LOS UMBRALES POR REGIONES, 41

2.7. COMPONENTES CONEXAS DE UNA IMAGEN, 42

2.7.1 ALGORITMO PARA EL ETIQUETADO DE COMPONENTES CONEXAS, 42

2.7.2 COMPONENTES CONEXAS DE N PXELES, 44

2.8. VALORES ESTADSTICOS DE UNA IMAGEN EN BLANCO Y NEGRO, 45

3. ANLISIS TEMPORAL Y DE COSTES DE DESARROLLO, 48

3.1. CUADERNO DE TIEMPO SEMANAL, 48

3.2. CUADERNO DE TIEMPO MENSUAL, 49

3.3. CUADERNOS DE TIEMPO TOTAL, 49

4. ANLISIS DE REQUISITOS, DISEO E IMPLEMENTACIN, 50

4.1. ANLISIS DE REQUISITOS, 50

4.1.1 INTRODUCCIN, 50

4.1.2 REQUISITOS FUNCIONALES, 50



4.1.3 REQUISITOS NO FUNCIONALES, 51

4.1.4 OTROS REQUISITOS, 53

4.2. DISEO, 54

4.2.1 OBJETIVOS DEL DISEO, 54

4.2.2 PREPROCESAMIENTO, 55

4.2.3 BINARIZACIN, 55

4.2.4. POSTPROCESAMIENTO, 56

4.2.5. EXTENDER LA FUNCIONALIDAD DE LA APLICACIN, 57

4.3.1. DISEO TECNOLGICO, 59

4.3.2. CLASES Y TIPOS DE DATOS UTILIZADOS, 60

4.3.3. DETALLES DE IMPLEMENTACIN, 68

4.3.3.1 CONVERTIR UNA IMAGEN EN COLOR A ESCALA DE GRISES, 68

4.3.3.2 BINARIZAR GLOBALMENTE UNA IMAGEN EN ESCALA DE GRISES, 69

4.3.3.3. BINARIZAR LOCALMENTE UNA IMAGEN EN ESCALA DE GRISES, 70

4.3.3.4 OPERACIN LGICA XOR ENTRE DOS IMGENES BINARIAS, 73

5. MANUAL DE USUARIO, 76

5.1. INTRODUCCIN DE LA APLICACIN, 76

5.2. INSTALACIN DEL PROGRAMA, 76

5.3. PANTALLAS, VENTANAS Y OPERACIONES DE LA APLICACIN, 77

5.3.1 PANTALLA PRINCIPAL, 77

5.3.2 VENTANA NEGATIVO DE LA IMAGEN, 80

5.3.3 VENTANA CONVERTIR A ESCALA DE GRISES, 82

5.3.4 OPERACIN SEPARAR CANALES DE COLOR RGB, 84

5.3.5 VENTANA BALANCE DE COLOR, 85

5.3.6 VENTANA OPERACIN AND, 86

5.3.7 VENTANA OPERACIN OR, 87

5.3.8 VENTANA OPERACIN XOR, 88

5.3.9 VENTANA CONFIGURACIN DE INTERVALOS, 89

5.3.10 VENTANA DE BINARIZACIN GLOBAL, 91

5.3.10.1. METODO GLOBAL DEL NIVEL DE GRIS MEDIO, 94

5.3.10.2 METODO GLOBAL DEL PORCENTAJE, 96

5.3.10.3 METODO GLOBAL DE LOS DOS PICOS, 98

5.3.10.4 METODO GLOBAL HUANG, 100

5.3.10.5 METODO GLOBAL DE YAGGER, 102

5.3.10.6 METODO GLOBAL DE KITLER, 104

5.3.10.7 METODO GLOBAL DE OTSU, 106

5.3.10.8 METODO GLOBAL DE RIDDLER, 108

5.3.10.9 METODO GLOBAL DE THRUSSELL, 110

5.3.10.10 METODO GLOBAL DE WESKA, 112

5.3.10.11 METODO GLOBAL DE JOHANNSEN, 114

5.3.11 VENTANA DE BINARIZACIN LOCAL, 116

5.3.11.1 METODO LOCA DE BERNSEN, 118

5.3.11.2 METODO LOCAL DE EIKVIL, TAXT & MOEN, 120

5.3.11.3 METODO LOCAL DE MARDIA & HAINSWORTH, 122

5.3.11.4 METODO LOCAL DE NIBLACK, 124

5.3.11.5 METODO LOCAL DE TAXT, FLYNN & JAIN, 126

5.3.11.6 METODO LOCAL: YANOWITZ & BRUCKSTEIN, 127

5.3.11.7 METODO LOCAL DE WHITE & ROHRER, 129

5.3.11.8 METODO LOCAL DE PARKER, 130

5.3.12 VENTANA DE BINARIZACIN CON OTROS MTODOS, 132

5.3.12.1 METODO DE WELLNER, 133

5.3.12.2 METODO DE UMBRALES POR REGIONES, 135

6. PRUEBAS, 136

6.1. FORMATO DE LAS IMGENES, 136

6.2. TAMAO DE LAS IMGENES, 136



6.3. MTODOS DE BINARIZACIN, 136

7. EVALUACIN DE OTRAS ALTERNATIVAS, 137

8. CONCLUSIONES, 138

8.1. CONCLUSIONES DE CARCTER GENERAL, 138

8.2. APORTACIN PERSONAL DEL PROYECTO, 138

9. BIBLIOGRAFA, 139

9.1. REFERENCIAS BIBLIOGRFICAS, 139

9.2. REFERENCIAS DE DIRECCIONES ELECTRNICAS, 140

LISTA DE FIGURAS

FIGURA 1. INTRODUCCIN AL PROCESO DE BINARIZACIN DE IMGENES,

7

FIGURA 2. ESPECTRO DE COLORES, 10

FIGURA 3. ESPECTRO DE ONDAS VISTA POR EL HOMBRE, 11

FIGURA 4. CUBO RGB, 12

FIGURA 5. COLORES CMY, 14

FIGURA 6. MODELOS ADITIVO Y SUBSTRACTIVO, 15

FIGURA 7. MODELO HSI, 16

FIGURA 8. NEGATIVO DE LA IMAGEN, 19

FIGURA 9. ROTACIONES Y GIROS DE LA IMAGEN, 20

FIGURA 10. RECORRIDO DE EIKVIL, 34

FIGURA 11. 4-ADYACENCIA, 42

FIGURA 12. ESQUEMA DE DISEO, 54

FIGURA 13. CLASIFICACIN DE MTODOS DE BINARIZACIN, 55

FIGURA 14. FUNCIONALIDAD EXTENDIDA, 58

FIGURA 15. FRAGMENTO DE CDIGO DE BINARIZACIN GLOBAL, 69

FIGURA 16. FRAGMENTO DE CDIGO DE BINARIZACIN GLOBAL II, 70

FIGURA 17. FRAGMENTO DE CDIGO DE BINARIZACIN LOCAL, 71

FIGURA 18. FRAGMENTO DE CDIGO DE BINARIZACIN LOCAL II, 72

FIGURA 19. FRAGMENTO DE CDIGO DE BINARIZACIN LOCAL III, 73

FIGURA 20. FRAGMENTO DE CDIGO DE LA OPERACIN XOR, 74

FIGURA 21. FRAGMENTO DE CDIGO DEL MTODO PORCENTAJE, 75

FIGURA 22. PANTALLA PRINCIPAL DE LA APLICACIN, 77

FIGURA 23. MENS DE LA APLICACIN, 77

FIGURA 24. BARRA DE BOTONES DE LA APLICACIN, 78

FIGURA 25. VENTANA NEGATIVO DE LA IMAGEN, 80

FIGURA 26. VENTANA CONVERTIR A ESCALA DE GRISES, 82

FIGURA 27. OPERACIN SEPARAR CANALES DE COLOR RGB, 84

FIGURA 28. VENTANA OPERACIN AND, 86

FIGURA 29. VENTANA OPERACIN OR, 87

FIGURA 30. VENTANA OPERACIN XOR, 88

FIGURA 31. VENTANA CONFIGURACIN DE INTERVALOS, 89

FIGURA 32. VENTANA BINARIZACIN GLOBAL, 91

FIGURA 33. VENTANA BINARIZACIN GLOBAL EXTENDIDA, 92

FIGURA 34. MTODO NIVEL DE GRIS MEDIO, 94

FIGURA 35. MTODO DE PORCENTAJE, 96

FIGURA 36. MTODO DE LOS DOS PICOS, 98

FIGURA 37. MTODO DE HUANG, 100

FIGURA 38. MTODO DE YAGGER, 102

FIGURA 39. MTODO DE KITLER, 104

FIGURA 40. MTODO DE OTSU, 106

FIGURA 41. MTODO DE RIDDLER, 108

FIGURA 42. MTODO DE THRUSSELL, 110



FIGURA 43. MTODO DE WESKA, 112

FIGURA 44. MTODO DE JOHANNSEN, 114

FIGURA 45. VENTANA BINARIZACIN LOCAL, 116

FIGURA 46. VENTANA BINARIZACIN LOCAL II, 117

FIGURA 47. MTODO DE BERNSEN, 118

FIGURA 48. MTODO DE EIKVIL Y OTROS, 120

FIGURA 49. MTODO DE MARDIA Y HAINSWORTH, 122

FIGURA 50. MTODO DE NIBLACK, 124

FIGURA 51. MTODO DE TAXT Y OTROS, 126

FIGURA 52. MTODO DE YANOWITZ Y BRUCKSTEIN, 127

FIGURA 53. MTODO DE WHITE Y ROHRER, 129

FIGURA 54. MTODO DE PARKER, 130

FIGURA 55. VENTANA BINARIZACIN CON OTROS MTODOS, 132

FIGURA 56. MTODO DE WELLNER, 133

FIGURA 57. MTODO DE UMBRALES POR REGIONES, 135



1. DEFINICIN DE OBJETIVOS

1.1. BREVE EXPLICACIN DEL PROYECTO FIN DE CARRERA

Qu se entiende por binarizacin de imgenes en niveles de gris?

La binarizacin de imgenes en niveles de gris es un proceso para extraer de una

imagen aquellos pxeles que representan objetos dentro de una imagen.

Estos objetos pueden ser de naturaleza muy diversa, desde texto escrito en un

documento, lneas pertenecientes a mapas, un peatn cruzando una calle o una retina

perteneciente a un ojo humano.

Despus de binarizar una imagen en niveles de grises, el resultado es una imagen con

dos niveles de grises, cuyos pxeles pertenecientes a los objetos tienen todos un nivel de

gris y los pxeles pertenecientes al fondo de la imagen tienen otro.

Lo normal es que tras binarizar una imagen en niveles de gris se obtenga una imagen

monocroma en la que los pxeles correspondientes a objetos se muestren negros y los

correspondientes al fondo de la imagen aparezcan blancos.

La segmentacin de un nivel es casi esencial antes de procedimientos como

adelgazamiento, vectorizacin y operaciones morfolgicas.

A continuacin se describen los mtodos ms comunes para realizar esta tarea.

Mtodos de Binarizacin de imgenes en niveles de gris

El objetivo de este proyecto es estudiar, analizar e implementar numerosos de los

existentes mtodos de binarizacin de imgenes creados hasta la fecha.

Hay que tener en cuenta la dificultad que existe en decidir qu mtodo usar cuando nos

planteamos binarizar una imagen en niveles de grises, ya que cada mtodo ha sido

diseado y planteado para una aplicacin concreta.

A lo largo de la historia, son muchos los autores que han investigado en este campo

aportando soluciones a diversos problemas. Este proyecto tambin se encarga de

recopilar esa informacin describiendo cada mtodo, mostrndolos por nombre de autor

y fecha de creacin de dicho mtodo, clasificarlos y facilitar al usuario su uso en una

plataforma comn, como es la de los pcs con Windows y facilitarle la ayuda,

permitindole mostrar la teora suficiente como para que un usuario experto pueda sacar

el mximo provecho y mostrrle la ayuda en lnea para esos usuarios menos expertos o

que estn en fase de aprendizaje.

Por otro lado, decir que la base terica de este proyecto es de las ms ricas que se puede

encontrar en un problema de tratamiento de imgenes, ya que implica numerosos temas,

y se nutre de muchos tratamientos de imgenes, que aunque no intervienen directamente

en los objetivos de un mtodo de binarizacin de imgenes, si pueden ser considerados

necesarios ante la ejecucin de un mtodo de binarizacin.



A grandes rasgos, y como anticipo del apartado 4.2. Diseo, podramos decir que las fases de un mtodo de binarizacin seran estas:

Figura 1. Introduccin al proceso de binarizacin de imgenes

La mayor parte de este proyecto trata de cmo realizar la binarizacin de la imagen para

pasar una imagen en grises a una imagen en blanco y negro.

Como veremos ms adelante, el proceso de binarizacin de una imagen puede ser tan

complejo en tiempo, facilidad de compresin, operaciones y conocimientos

matemticos utilizados como el autor quiera.

Este proyecto tiene como base los artculos comparativos de 0ivind Due Trien y Torfinn

Taxt, y de J.R. Parker.

Los trabajos de estas personas se bajan en elegir una serie de mtodos para, despus de

su exposicin comparlos los resultados entre s.

Uno de los grandes aadidos de este proyecto es la obtencin de estadsticas de una

imagen tras aplicarle un mtodo, por lo que cualquier investigador puede realizar un

artculo del tipo del que han hecho los citados autores comparando cualitativa y

cuantitativamente los resultados de los mtodos que dispone esta aplicacin.

IMAGEN EN

COLOR

IMAGEN EN

GRISES

IMAGEN EN

BLANCO Y

NEGRO

BINARIZAR IMAGEN

CONVERTIR A GRISES



1.2. JUSTIFICACIN DEL TRABAJO

En campo de procesamiento de imgenes digitales es bastante amplio y se tratan

numerosos temas. Cada investigador trata de aportar ideas y conocimientos nuevos en

un determinado campo del procesamiento de imgenes digitales para una aplicacin

determinada.

El tema de binarizacin de imgenes en niveles de grises es un campo muy activo

dentro de esta disciplina, y aunque es fcil ir a una revista especializada y encontrar el

trabajo de un determinado investigador, es muy difcil probar realmente el mtodo en un

ordenador. En la mayora de los casos los autores de estos artculos nos lo describen,

dndonos las frmulas matemticas en las que estn basadas, pero no nos muestran una

implementacin en un lenguaje de alto nivel para poder practicar con ella. Slo nos

muestran los resultados cualitativos con las imgenes impresas en papel y en algunos

casos los tiempos que han tardado en ejecutarse en una determinadaza maquina,

comparando los tiempos con los mtodos de otros autores.

En otros muchos casos los nuevos mtodos estn basados en mtodos anteriormente

publicados por otros autores.

Es por ello por lo que resulta muy difcil para un estudiante o investigador acceder a

probar, analizar, mejorar o investigar en este campo.

Con este proyecto fin de carrera intento crear un marco de trabajo en el que cualquier

persona interesada pueda acceder a estos mtodos, estudindolos, modificando los

parmetros de entrada en aquellos que lo admitan, y en definitiva, ver los resultados

experimentales con cualquier imagen que disponga.

Anteriormente, curs la asignatura de 5 de Ingeniera Informtica : Procesamiento de

Imgenes digitales, en la cual un grupo de cuatro alumnos desarrollamos una aplicacin

que usaba mtodos de segmentacin en niveles gris locales.

Dicha fue escrita en Visual Basic 6.0. Tras realizar ese trabajo, me di cuenta que se

poda mejorar notablemente, tanto en eficiencia, como es aspectos tcnicos. Sera

interesante que soportase cualquier imagen est en el formato grfico que est. Adems,

el tamao de la imagen no debera importar ya que frecuentemente la binarizacin de

imgenes en niveles de gris tiene como objetivo los mapas, y stos son escaneados a

una resolucin bastante alta.

El trabajo anterior solo trataba mtodos de binarizacin globales, por lo que vi muy

interesante que la aplicacin tambin soportase mtodos locales. Esto ltimo lo tom

como un reto, debido a la escasez de informacin y de implementaciones acerca de

estos ltimos.

As pues, una vez abierta esta lnea investigacin, decid realizar una aplicacin que

tratase sobre mtodos de binarizacin lo ms completo posible, de fcil uso y que fuese

didctico, que sirviese para usuarios experimentados y que pudiese ser ampliada y

utilizada como base para futuros proyectos.

A nivel tcnico, este proyecto, aplica numerosos algoritmos de anlisis,

tratamiento de imgenes, estructura de ficheros, creacin de un entorno

amigable para el usuario, etc....

Se trata de un proyecto muy completo que he intentado que abarque lo



mximo de mis conocimientos informticos no slo en el tratamiento de imagen, sino

tambin en nuevas tecnologas (.NET), aplicacin de mis conocimientos como

programador (Visual Basic .NET) y la resolucin de un problema real que est a la

orden del da, sobre todo en el campo de mapas y de imgenes mdicas.

Con respecto a la utilidad del producto queda demostrado anteriormente que

este producto puede general un alto grado de ROI (retorno de inversin) que

posibilite poder seguir investigando en esta rama de anlisis de imgenes.

A nivel personal, el proyecto queda justificado ya que he conseguido

enfrentarme a una dura prueba de investigacin, desarrollo y trabajo con el

departamento de matemtica aplicada I. Manual de usuario



2. ESTUDIO TERICO 2.1. CONCEPTOS PREVIOS SOBRE EL COLOR

Color: Segn la Real Academia Espaola el color es: s. m. Sensacin visual que

producen sobre la retina los rayos de luz reflejados por un cuerpo. Sustancia preparada

para pintar. Colorido de una pintura.

En 1666, Isaac Newton descubri que al pasar un rayo de luz solar a travs de un prisma

de cristal, el rayo de luz que sale no es blanco, est formado por un espectro continuo de

colores que van desde el magenta al rojo.

Figura 2. Espectro de colores

Los colores del espectro que pueden distinguirse son el magenta, azul, cian, verde,

amarillo, y rojo. Al ser el espectro de colores continuo cada color de los que se muestran

se mezcla suavemente con el siguiente.

El sol irradia una amplia variedad de ondas electromagnticas, cada una con una

longitud de onda diferente, como por ejemplo los rayos gamma, rayos X o los

Ultravioletas. El ojo humano solo es sensible a un pequeo intervalo de esas longitudes

de onda, denominado luz blanca.

El siguiente grfico muestra el espectro de ondas vistas por el hombre:



Figura 3. Espectro de ondas vista por el hombre

El ser humano percibe el color como un acto de la reaccin de 3 tipos de conos, por ello

los sistemas de color estn basados en tres componentes. Ejemplos de sistemas de color

son el RGB, CMY, HSI, y YCbCr .

Se puede decir que la luz blanca no es un color, sino que la mezcla de todos los colores.

Asimismo el negro tampoco es un color propiamente dicho, sino que es la ausencia de

la luz, y estos se ven negros cuando absorben todas las frecuencias de la luz visible.

En realidad, el negro que se muestra en los monitores de color es similar a un verde

oscuro o verde marrn debido a emisiones de luz dispersas. La gama de colores que

puede mostrarse en un monitor es ms pequea que la que puede verse en la naturaleza

debido a que est limitada por las caractersticas de los revestimientos de fsforo de la

pantalla que emiten la luz



2.2. MODELOS DE COLOR

2.2.1 MODELO DE COLOR RGB Es el modelo de color ms usado, ya que el ser humano recibe la informacin del color

separada en rojo, verde y azul mediante conos receptores presentes en el ojo. El cerebro

se encarga de procesar estos tres componentes y componer una imagen en color.

El modelo de color RGB, cada color aparece descompuesto en sus componentes

espectrales rojo (Red), verde (Green) y azul (Blue), cuya combinacin produce el color

resultante.

Se denominan colores primarios aditivos a los colores rojo, verde y azul, ya que los

dems colores se pueden obtener como combinacin de estos.

Este modelo se puede representarse en forma de cubo tridimensional, en el que los ejes

x, y, z son los componentes espectrales rojo, verde y azul.

La siguiente figura representa un modelo de color RGB normalizado a uno, en el que

cada componente R,G,B puede valer 0 1, obteniendo as 8 posibles colores.

Figura 4. Cubo RGB

El negro sera el origen del sistema de coordenadas(0,0,0).Todo lo contrario sera el

blanco (1, 1, 1).

Aquellos puntos que van del (0,0,0) al (1,1,1) estaran dentro de la diagonal principal y



formaran lo que se llama escala de grises niveles de grises. (Recordemos que el

objetivo final va a ser pasar de una imagen en color a una imagen en escala de grises).

El modelo descrito corresponde a un modelo RGB en el que cada componente puede

valer 0 1 (1 bit por canal), dando lugar a 8 posibles colores.

Se pueden obtener modelos con mas colores, como el de 24-bits, en el que cada

componente puede valer de 0 a 255 (8 bits por canal) y que da lugar a un nmero de

colores extensamente amplio.

Actualmente los monitores CRT, la mayora de video camaras a color y casi todos los

sistemas grficos por ordenador usan el modelo de color RGB, debido a que se

simplifica el diseo.

La pega a este modelo es que al tener tres colores, dificulta algunas operaciones sobre

imgenes como ecualizaciones de histograma. Por ello muchos algoritmos convierte

este modelo al modelo de color HSI (hue-saturation-intensity) en el que la componente

de color solo es una , hue .

Se puede decir que para un proceso u otro vendr mejor un sistema de color u otro

atendiendo a diferentes razones.

2.2.2 MODELO DE COLOR CMY

El modelo de color CMY, cada color aparece descompuesto en sus componentes

espectrales Cyan , Magenta y amarillo (Yellow), cuya combinacin produce el color

resultante.

El modelo de color CMY es un modelo complementario al RGB ya que cian, magenta,

y amarillo son los colores complementarios de rojo, verde y azul, respectivamente.

A diferencia de los colores de sistema RGB, los colores primarios de CMY Cyan ,

Magenta y Amarillo son conocidos como colores primarios substractivos, ya que estos

primarios son restados de la luz blanca para producir el color deseado.

Cyan absorve del color rojo, magenta del verde y amarillo del azul. Esto significa que

podemos incrementar el verde de una imagen decrementando el magenta

(complementario del verde), o incrementando el amarillo y el cyan.



Figura 5. Colores CMY

Al ser RGB y CMY modelos de color complementario ser fcil la conversin entre

ambos, que viene dada por las formulas:

Convertir de RGB a CMY:

C = 1.0 R M = 1.0 - G

Y = 1.0 - B

Convertir CMY a RGB:

R = 1.0 - C

G = 1.0 - M

B = 1.0 - Y

Estas ecuaciones serian vlidas para un sistema de color normalizado, con sus valores

entre 0.0 y 1.0. En un modelo de color de 24-bit cyan vendra dado por C=255 - R.



Figura 6. Modelos aditivo y substractivo

En el rea de la industria de impresin se usa el modelo CMY con una ligera variacin,

se le aade un cuarto color, el negro (k), denominndose sistema de color CMYK. Esta

componente negra (K) se aade en el proceso de impresin porque proporciona un color

negro ms puro que la combinacin de los otros tres colores del modelo,

proporcionando un mejor contraste. Adems este modelo tiene el aadido de que la tinta

negra es ms barata que la de color, por lo que interesa ms aadir una componte de

color negro, que producir esta mediante las tres componentes de color.

Las siguientes formulas indican cmo convertir de CMY a CMYK:

K = Min(C, M, Y)

C = C - K

M = M - K

Y = Y K

2.2.3 MODELO DE COLOR HSI

En este modelo, se separa la luminancia o intensidad (I) de la informacin del color,

descrita por los canales de tono o hue (H) y saturacin.

Hue (tono), Saturation (saturacin), Intensity (intensidad) son tres propiedades que se

usan para describir un color, de las cuales el tono y la saturacin responden

acertadamente a la forma en que los seres humanos perciben el color.

A diferencia del modelo de color RGB, ya no hace falta saber qu porcentaje de rojo,

verde o azul hace falta para obtener un color determinada, basta con ajustar el tono. Para

hacerlo ms claro o ms oscuro variamos la intensidad, y ajustando la saturacin

podremos pasar por ejemplo de un color rojo oscuro a un color rosa claro.

Aplicaciones de procesamiento de imgenes, como operaciones sobre histogramas,

transformaciones de intesidad y convolucin solo operan en la intensidad de la imagen,



por lo que estas operaciones son ms sencillas de realizar usando el modelo de color

HSI.

El tono (Hue) se representa como un ngulo, que varia de 0o a 360

o.

La saturacin (S) corresponde al radio, que varia de 0 a 1.

La intensidad (I) vara a lo largo del eje z desde 0 siendo negro a 1 siendo blanco.

Figura 7. Modelo HSI

Si S = 0, el color es un gris de intensidad 1. Si S = 1, el color est en el lmite de la base

superior del cono.

Ajustando el tono el color variar de rojo en 0o, verde en 120

o, azul en 240

o, y volver

a rojo a los 360o.

Cuando I = 0, el color es negro y por lo tanto H es indefinido. Cuando S = 0, el color

esta en escala de grises. H es tambin indefinido en este caso.

Ajustando la intensidad, I, un color se puede hacer ms oscuro o ms claro. Si

mantenemos S=1 y ajustamos I, se van creando matices de ese color.



Las siguientes formulas muestran como convertir de RGB a HSI:

Si B es mayor que G, entonces H=360 - H

Las siguientes formulas muestran como convertir de HSI a RGB:

Dependiendo del sector de color en el que se encuentre H, la conversin vendr dada

por:

00 H 1200 (sector RG):

1200 H 2400 (sector GB):

2400 H 3600 (sector BR):

Estos valores r, g, b son valores normalizados de las componentes R, G, B. Adems

estas ecuaciones esperan los ngulos en grados.



2.2.4 MODELO DE COLOR YCbCr

El modelo de color YCbCr separa la luminancia de la informacin de color. La

luminancia se codifica en la componente Y, y el grado de azul y de rojo se codifica en

las componentes Cb y Cr. respectivamente. Las siguientes formulas detallan como se

convierte de RGB a YCbCr y viceversa.

De RGB a YCbCr:

Y = 0.29900R + 0.58700G + 0.11400B

Cb = -0. 16874R - 0.33126G + 0.50000B

Cr = 0.50000R-0.41869G - 0.08131B

De YCbCr a RGB:

R = 1.00000Y + 1.40200Cr

G = 1.00000Y - 0.34414Cb - 0.71414Cr,

B = 1.00000Y + 1.77200Cb

Estas no son las nicas formas de convertir a/desde YCbCr. La mostrada aqu es la

recomendacin CCIR (International Radio Consultive Committee) 601-1 y es la que se

usa en la compresin de imgenes JPEG:

2.3. DE RGB A ESCALA DE GRISES

El modelo de color de escala de grises consiste en que cada pixel puede tener un valor,

denominado intensidad de gris, que va de 0 a 255. El valor cero se corresponde con el

negro y el 255 con el blanco.

Una conversin simple es usar la componente verde del modelo RGB como escala de grises, ya que el verde representa un componente grande en la escala

de grises. Es una conversin muy simple, pero no siempre produce los mejores

resultados.

Una conversin muy comn de RGB a escala de grises es una simple media: Gris = (R+G+B)/3 = 0.333R + 0.333G + 0.333B

Esta conversin es usada en muchas aplicaciones, como por ejemplo en la

conversin de modelo de color RGB a HSI.

Otra conversin una media ponderada: Gris = ( 3 * R + 4 * B + 2 * G ) / 9

La conversin que suele dar mejores resultados viene dado por la siguiente frmula:

Gris = 0.299R + 0.587G + 0.114B

Esta ecuacin es la ecuacin del estndar NTSC para la luminancia.

Entendemos luminancia como la suma ponderada de los 3 colores de luz

usados en la televisin a color y en monitores a color, que son rojo, verde y azul

(RGB). Una mayor luminancia indica un brillo ms intenso de luz en un sitio



dado de la pantalla. Los coeficientes que acompaan a las componentes R,G,B

reflejan la sensibilidad del ojo al brillo de esos colores primarios.

Por ltimo, segn la ITU-R, en su recomendacin BT. 709 (Recommendation BT.709, "Basic Parameter Values for the Studio and for International

Programme Exchange (1990) [formerly CCIR Rec. 709] ) tenemos:

Gris = 0.2125 * R + 0.7154 * G + 0.0721 * B

2.4. NEGATIVO DE UNA IMAGEN

El negativo de una imagen digital en escala de grises se obtiene aplicando la funcin:

g(x,y)= L - 1 - f(x,y)

donde L es el n de niveles de gris de la imagen.

Se trata de un procedimiento de inversin de la escala de grises. Es muy utilizado por

ejemplo, en imgenes mdicas.

Figura 8. Negativo de la imagen

La figura ilustra el empleo de esta sencilla transformacin (r y s indican los niveles de

gris de entrada y de salida respectivamente)

El negativo de una imagen tambin se puede aplicar a cualquiera de los canales RGB de

una imagen a color.



2.5. ROTACIONES Y GIROS DE UNA IMAGEN

Se realiza girando el objeto alrededor de un eje, modificando as su orientacin en el

espacio.

Figura 9. Rotaciones y giros de la imagen

Para ello se utilizan tranformadas.

La rotacin de un punto un ngulo alrededor del eje de coordenadas Z se consigue con la transformacin:

El ngulo de rotacin se mide en el sentido de las agujas del reloj. Esta transformacin afecta nicamente a los valores de las coordenadas x e y.

La rotacin de un punto un ngulo sobre el eje X se consigue con la transformacin:



La rotacin de un punto un ngulo alrededor del eje Y se consigue con la transformacin:



2.6. MTODOS DE BINARIZACIN DE IMGENES ESTUDADOS

La segmentacin de un nivel o binarizacin es una conversin entre una imagen en

niveles de grises y una imagen monocroma (blanco y negro).

Dicha imagen monocroma debe contener toda la informacin esencial de la imagen en

niveles de grises. (mismo nmero de objetos, misma posicin y la misma forma de los

objetos).

Al tener solo dos colores (blanco y negro) la cantidad de informacin para representar la

imagen monocroma es mucho menor.

Para una mayor comodidad en este he estudio, he dividido estos mtodos en tres

apartados.

- Mtodos globales de binarizacin de imgenes

- Mtodos locales de binarizacin de imgenes

- Otros mtodos de binarizacin de imgenes

A continuacin se describe cada uno de estos apartados y los mtodos de binarizacin

estudiados en cada uno de ellos.

2.6.1 MTODOS GLOBALES DE BINARIZACIN DE IMGENES

Estos mtodos se basan en la idea de elegir un valor de umbral para toda la imagen.

Todos los pxeles de las imgenes en escala de grises con un valor menor se consideran

negros (0), y todos aquellos cuyo nivel de gris sea igual o superior se consideran

blancos (1).

El problema de la segmentacin es elegir ese valor de umbral.

Segn el nivel de gris de cada pxel, y el umbral elegido, cada pxel va a pertenecer a

una de los siguientes conjuntos:

* Conjunto de pxeles negros: Imagen(i,j) < T

* Conjunto de pxeles blancos: Imagen(i,j) >= T

Donde T es el valor de umbral elegido.

2.6.1.1. MTODO VALOR DE NIVEL DE GRIS MEDIO

El valor de umbral debe determinarse de los valores de los pxeles de la imagen.

En este mtodo en valor de umbral se determina de una medida del conjunto de

propiedades de la imagen.

Un simple ejemplo, no especialmente bueno, es usar el nivel medio de gris de la imagen

como valor de umbral. El efecto de esto es que casi la mitad de los pxeles sern

considerados como blancos, y los dems como negros. El algoritmo Nivel de Gris

Medio muestra este ejemplo.

Aunque se pudiese fijar dicho valor al 50% de pxeles negros, no sera una buena idea.



Por ejemplo, en imgenes de texto escaneadas (imgenes que slo contienen texto) el

porcentaje de pxeles negros vara de un 8% a un 15%. Con un umbral que causase que

el 15% de pxeles fuesen negros ya se obtendran unos resultados con xitos.

2.6.1.2 MTODO DE PORCENTAJE DE PXELES NEGROS

Una forma fcil de encontrar este valor de umbral es usar el histograma de niveles de

grises de la imagen.

Dado un histograma, y un porcentaje de pxeles negros deseados, se determina el

nmero de pxeles negros multiplicando el porcentaje por el nmero total de pxeles.

A continuacin se cuentan el nmero de pxeles de cada nivel del histograma,

empezando por el nivel cero, hasta llegar al nmero de pxeles negros deseados.

El umbral ser el nivel de gris del histograma, en el que la cuenta llegue al nmero de

pxeles negros deseados.

Este mtodo es bastante antiguo y a veces es llamado p-tile.

2.6.1.3. MTODO DE LOS DOS PICOS

Una observacin practica de estos mtodos es que cuando se encuentra este valor, suele

aparecer en el punto bajo entre dos picos del histograma.

Si el histograma muestra dos picos, esta seleccin para valor de umbral puede ser la

buena.

El problema de seleccionar el umbral automticamente ahora consiste en:

Encontrar los dos picos.

Encontrar el punto bajo entre ellos.

Encontrar el primer pico es fcil (aquel que tenga el mayor valor). El segundo pico es

ms difcil de encontrar, ya que el segundo valor ms grande del histograma puede ser

el que est ms a la derecha del mayor, en vez de ser el segundo pico.

Una manera simple que suele funcionar para encontrar el segundo pico es multiplicar

los valores del histograma por el cuadrado de la distancia del primer pico. Esto da

preferencia a aquellos picos que no estn cercanos al mximo As si el pico ms alto

est al nivel j en el histograma, debemos seleccionar el segundo pico mediante la

frmula:

)}2550(|))max{(( 2 kkhfk

Donde h representa al histograma, y hay 256 niveles de gris, de 0 a 255.

La mejor manera de identificar los picos en el histograma es observar que resultan de

muchas observaciones de niveles de grises que aproximadamente son el mismo excepto

algunas perturbaciones (ruido). Si el ruido est normalmente distribuido, los picos del

histograma pueden aproximarse por curvas Gausianas. Dichas curvas pueden ajustarse

al histograma, y las dos mayores son usadas como los picos ms altos, el umbral debe

estar comprendido aqu. Esta proposicin es ms costosa y sin compromiso de un mejor

resultado.



2.6.1.4. MTODO DE WESKA, 1984. (USANDO PXELES DE BORDE)

Un pxel de borde debe estar cercano al lmite entre un objeto y el fondo de la imagen, o

entre dos objetos, por ello se denomina pxel de borde. El resultado de esto es que el

valor de un pxel de borde puede ser bastante consistente, ya que muchas veces estarn

dentro del objeto y otras veces un poco fuera debido al contorno. El histograma de

estos pxeles ser mas regular que el histograma general de la imagen.

El mtodo buscar un umbral haciendo uso del Laplaciano digital hace uso de esta idea.

El Laplaciano digital es un operador de deteccin de borde no direccional.

Dicho valor de umbral se puede encontrar mediante el Laplaciano de la imagen de

entrada. Un mtodo simple para realizar este proceso es convolucionar la imagen de

entrada con la siguiente mscara:

0 1 0

1 -4 1

0 1 0

A partir de ahora el histograma de la imagen original se encuentra considerando solo

aquellos pxeles que tienen un valor grande de Laplaciano (se considera a partir del

85%).

Aquellos pxeles con un Lapaciano superior al 85% tendrn su nivel de gris apareciendo

en el histograma, mientras aquellos que no superen el 85% no lo tendrn.

Ahora el umbral es seleccionado usando el histograma as calculado.

El usar una mejor aproximacin del operador Laplaciano debera dar mejores

resultados, pero en algunos casos este procedimiento simple puede mostrar mejoras

sobre otros mtodos.

2.6.1.5. MTODO DE RIDLER,1978. (SELECCIN ITERATIVA)

La seleccin iterativa (Ridler 1978) es un proceso en el que la conjetura inicial sobre un

umbral es refinada a travs de consecutivo pasos por la imagen. Este no usa el

histograma, pero en cambio usa los umbrales de la imagen del objeto y clases de fondo

repetidamente, usando los niveles en cada clase para mejorar el umbral.

La conjetura inicial sobre el umbral es simplemente el nivel medio de gris. Este umbral

entonces es usado para recoger la estadstica de las regiones en blanco y negro

obtenidas; el nivel medio de gris para todo los pxeles debajo del umbral es encontrado

y llamado Tb, y el nivel medio de gris de los pxeles mayor o igual al umbral inicial es

llamado To. Ahora una estimacin nueva del umbral es calculada como (Tb + To)/2, o

el promedio de los niveles medios en cada clase de pxel, y el proceso es repetido

usando este umbral. Cuando ningn cambio del umbral es encontrado en dos,

consecutivas pasadas por la imagen, el proceso finaliza.



2.6.1.6. MTODO DE THRUSSELL, 1979. (VARIANTE DE LA SELECCIN

ITERATIVA DE RIDLER)

El algoritmo de seleccin iterativa de Ridler est diseado para que funcione bien en

una implementacin hardware, en la que la estimacin inicial de un umbral asume que

las cuatro esquinas de la imagen corresponden a regiones de fondo y el resto de la

imagen es usado como una estimacin de los niveles grises de los objetos. Sin embargo,

en una implementacin software, el mismo umbral puede ser calculado utilizando el

histograma. Esto debera ser ms rpido, ya que el histograma es un array

unidimensional de pequeo tamao fijos.

Comenzando con la estimacin inicial del umbral To, la estimacin de k-sima del

umbral es (Thrussel 1979):

N

Tj

N

Tj

T

i

T

i

K

K

K

K

K

jh

jhj

ih

ihi

T

1

1

0

0

1

1

1

1

][2

][

][2

][

Donde h es el histograma de los niveles grises en la imagen.

De nuevo, cuando Tk = Tk+1, entonces Tk es el umbral apropiado.

2.6.1.7. MTODO DE OTSU, 1978. (HISTOGRAMAS DE NIVEL DE GRIS)

Los mtodos de obtencin de umbral que estn basados en seleccionar el punto bajo

entre dos picos de un histograma usan el concepto que los pxeles correspondientes a

objetos y pxeles correspondientes al fondo de la imagen tienen niveles medios

diferentes, y son nmeros aleatorios dibujados de una de dos distribuciones normales.

Estas distribuciones tambin tienen sus propias desviaciones estndar y varianzas,

donde la varianza es el cuadrado de la desviacin estndar.

Si hay dos grupos de pxeles en la imagen, entonces esto es una tarea simple calcular lal

general, o total la varianza de los valores de nivel grises en la imagen, denotado por 2

t .

Para cualquier valor t de umbral dado, tambin es posible calcular separadamente la

varianza de los pxeles de objeto y de los pxeles de fondo; estos representan los

valores de varianza dentro-de-clases, denotado por 2w .

Finalmente, la variacin de los valores medio para cada clase del total medio de todos

los pxeles define una varianza entre-clases, que ser denotada por 2b .

Esto es el principio de un mtodo estadstico llamado anlisis de varianza.

La cuestin importante es que un umbral ptimo puede ser encontrado reduciendo al

mnimo la proporcin de la varianza entre-clases de la varianza total:



2

2

)(t

bt

Esta frmula define el radio necesitado y el valor de t que da el valor ms pequeo para

, que ser el mejor umbral.

Como la varianza total 2t es fcil de calcular de la imagen, as como su valor medio

T . La varianza entre-clases es calculado por:

2

1010

2 )( b

Donde:

010

0 1

t

i

ip

Con ip siendo la probabilidad de nivel de gris i, o el valor de i en el histograma

dividido por el nmero total de pxeles. Tambin:

0

0

t

0

11

tT

t

i

it pi0

.

Todos estos valores son fciles de obtener del histograma de la imagen. El valor de t

que minimice (t) ser el valor de umbral ptimo.

2.6.1.8. MTODO DE KAPUR, 1985. (ENTROPA)

La entropa es una medida del contenido de la informacin. En trminos de la teora de

la informacin asumimos que hay n smbolos posibles x (por ejemplo, letras o dgitos) y

que el smbolo i ocurre con la probabilidad p ( ix ).

Entonces la entropa asociada con la fuente de los smbolos X es

))(log()()(1

i

n

i

i xpxpXH

Donde la entropa es medida en bits/smbolos.

Una imagen puede ser vista como una fuente de smbolos, o como niveles de grises. La

entropa asociada con los pxeles negro es (Pun, 1981):



)log(0

i

t

i

ib ppH

Donde la ip es la probabilidad de gris del nivel i. De forma parecida, la entropa de los

pxeles blancos es:

)log(255

1

i

ti

iw ppH

Para una imagen con niveles de 0 a 255. El algoritmo sugerido intenta encontrar el valor

de umbral t que maximiza:

wb HHH

En el cual Pun nos muestra que es lo mismo que maximizar:

}),...,log(max{

)1log(1

}),...,log(max{

log)(

2552110 PPP

P

H

H

PPP

P

H

Htf

tt

t

T

t

t

t

T

t

Donde:

i

t

i

it ppH log0

Es la entropa de los pxeles negros

i

i

iT ppH log255

0

Es la entropa total, y

t

i

it pP0

Es la probabilidad acumulativa hasta el nivel de gris t, o la probabilidad que un

pxel dado tenga un valor menor o igual que t. Estos tres factores pueden ser calculados

del histograma de nivel gris, con lo cual la ecuacin

i

i

iT ppH log255

0

no depende del valor de t.



Una variacin sobre este tema (Kapur 1985) intenta definir una distribucin de

probabilidad de un objeto, A y una distribucin de fondo B de la siguiente manera:

t

t

tt p

p

p

p

p

pA ,...,,: 10

tt

t

t

t

p

p

p

p

p

pB

1,...,

1,

1: 25521

Ahora la entropa de pxeles en blanco y negro es calculada de un modo similar a

ecuaciones anteriores, que calculaban bH y wH , pero usando estas distribuciones

nuevas:

t

it

i t

ib

p

p

p

pH log

0

t

i

ti t

iw

p

p

p

pH

1log

1

255

1

El umbral ptimo es el valor de t que maximiza

wb HHH

Para encontrar este valor, todos los umbrales entre 0 y 255 son intentados, y el que da el

valor ms grande de H es escogido.



2.6.1.9. MTODO DE JOHANNSEN,1982. (VARIANTE DE LA ENTROPA DE

KAPUR)

Esta variacin del mtodo de Kapur propone dividir los niveles de grises sobre dos

partes para a minimizar la interdependencia entre ellos (Johannsen 1982). Sin perseguir

esto en demasiado detalle, el mtodo asciende a la reduccin al mnimo de:

)()( tStS wb

Donde:

)()(1

)log()(1

00

0

t

i

it

t

it

i

i

ib pEpE

p

ptS

)()(1

)log()(255

1

255

255ti

it

ti

ti

i

iw pEpE

p

ptS

)log()( xxxE es la funcin de entropa.

Poniendo en prctica este algoritmo, el gran cuidado debe ser tomado para no

evaluar )(tSb y )(tSw para los valores de t donde

2.6.1.10. MTODO DE HUANG, 1995.(CONJUNTOS DIFUSOS)

En la teora normal de conjuntos, un elemento pertenece o no a un determinado

conjunto. En los conjuntos difusos (fuzzy) un elemento pertenece a un conjunto con una

determinad propiedad.

En este apartado, con objeto de encontrar un umbral para binarizar una imagen, vamos a

clasificar los pxeles como pertenecientes al conjunto de pxeles de fondo, o como

pertenecientes al conjunto de pxeles de objeto, y la aplicabilidad de los conjuntos

difusos a esta problemtica.

El mtodo descrito a continuacin usa una medida de difusidad, definida como distancia entre la imagen original en niveles de grises y la imagen binarizada mediante

el uso de un umbral. El objetivo se centra ahora en minimizar esa difusidad, ya que mientras menor sea, ms exacta ser la imagen binarizada de la original en niveles de

grises.



Una buena funcin para definir la pertenencia (o probabilidad) de un pxel al conjunto

de pxeles de fondo o pxeles de objetos es la siguiente:

)(xux Cx /1

1

0 Si x1

Donde :

. C es una constante consistente en la diferencia entre el nivel de gris mximo y

el nivel de gris mnimo de la imagen.

. 0 es el nivel medio de gris del fondo de la imagen

. 1 es el nivel medio de gris de los pxeles de objetos de la imagen

. t es un cierto valor de umbral dado

Un pxel x pertenecer al conjunto de pxeles de fondo o al conjunto de pxeles de

objetos dependiendo de la relacin entre el nivel de gris de dicho pxel y el valor de

umbral t.

Para un pxel de objeto (x>t), el grado en el cual pertenece al conjunto de pxeles de

objeto est dado por )(xux , el cual debe ser un valor comprendido entre y 1.

Una medida de la difusidad est basada en la entropa de conjuntos difusos, que viene dada por la formula:

)())((1)( ghgHMN

tE xt

Donde tH (t) = - x log(x) (1-x) log (1-x) que es la frmula de Shannon.

Los niveles de grises son g, N y M son el nmero de filas y columnas, respectivamente,

y h es el histograma de niveles de grises de la imagen.

Donde el valor de E(t) sea mnimo, tendremos que t es el umbral apropiado que

minimiza la difusidad.



2.6.1.11 . MTODO DE YAGGER, 1979. (CONJUNTOS DIFUSOS)

Otra medida de la difusidad est basada en la idea de que para un conjunto normal A no hay elementos en comn entre A y su complementario, en contraposicin con la

teora de conjuntos difusos, en los que cada elemento puede pertenecer a un conjunto A

o su complementario con ciertas probabilidades.

El grado en el cual A y su complementaria son no distintos es una medida de cmo de

difuso (fuzzy) es A.

Ello se puede calcular mediante la siguiente expresin:

pg xxp

ggtD/1

)()()(

Para niveles g, donde p es un nmero entero y )(1)( gg xx

El valor de p usado define una medida de la distancia, en nuestro caso usamos p=2 que

se corresponde con la distancia eucldea.

Para un valor de umbral t, tenemos los siguientes valores:

Estimacin de la media de pxeles de fondo

t

g

t

g

gh

ghg

t

0

0

0

)(

)(

)(

Estimacin de la media de pxeles objetos

254

1

254

1

1

)(

)(

)(

tg

tg

gh

ghg

t

Ahora todo lo necesitado para minimizar la difusidad est conocido, simplemente hay que probar los posibles valores de umbral t y seleccionar aquel que produzca el valor

mnimo de medida de difusidad.



2.6.1.12. MTODO DE KITLER, 1986 (UMBRAL DE MNIMO ERROR)

El histograma de la imagen puede ser pensado como una funcin de densidad de

probabilidad de las dos distribuciones (pxeles objetos y pxeles de fondo). Estos son

generalmente, como ha sido hablado, pensados como distribuciones normales, entonces

el histograma es una aproximacin de :

22222121 2/

2

2/

1 2

1

2

1)(

gg eegp

Donde 1 y 1 1es la desviacin estndar y la media de una de las clases, y 2 y 2 son la desviacin estndar y la media de la otra.

Despus de tomar logaritmo en ambos lados y reorganizarla, conseguimos una ecuacin

cuadrtica que podra ser solucionada para g:

222

2

2

2112

1

2

1 log2log)(

log2log)(

Pg

Pg

Sin embargo, los valores de , y P no son conocidos, y ellos pueden ser estimados slo con alguna dificultad. En vez de esto, Kittler y Illingworth (Kittler 1986) crearon

una funcin de criterio nueva para ser minimizada:

)(log)()(log)(2)(log)()(log)(21)( 22112211 tPtPtPtPttPttPtJ

Usando frmulas que deberan parecernos familiares:

t

g

ghtp0

1 )()(

255

1

2 )()(tg

ghtp

)(

)(

)(1

0

1tp

ghg

t

t

g

)(

)(

)(2

255

1

2tp

ghg

ttg

)(

))()((

)(1

0

2

1

2

1tp

tggh

t

t

g



)(

))()((

)(2

255

1

2

2

2

2tp

tggh

ttg

El valor de t que minimiza la J (t) es el mejor umbral. Esto a menudo es mencionado

como mnimum error thresholding o umbral de mnimo error.

2.6.2 MTODOS LOCALES DE BINARIZACIN DE IMGENES Se calcula un umbral para cada pxel de la imagen en base a la informacin contenida en

su vecindario de pxeles, o sub-region de la imagen.

Cada uno sobre una sub-regin de la imagen. El mximo nmero de subregiones es el

mismo que el nmero de pxeles de la imagen.

Algunos mtodos calculan una superficie de binarizacin sobre la imagen completa. Si

un pxel p(x,y) en la imagen de entrada tuene un nivel de gris mayor que la superficie de

binarizacin en ese punto, entonces ese pxel es considerado como pxel de fondo,

blanco, en caso contrario se considerara como pxel de objeto, negro.

Otros mtodos no usan umbrales explicitos, sino que buscan pxeles pertenecientes a

objetos en una transformada de la imagen.

En definitiva, cada mtodo de los aqu presentes de una forma, pero la caracterstica que

los une es que el umbral en cada pxel se calcula en base a informacin de sus vecinos.

2.6.2.1. MTODO DE BERNSEN, 1986

Para cada pxel (x,y), se define el umbral

2/)(),( highlow zzyxT

Donde zlow y zhigh representan el valor de nivel de gris ms bajo y ms alto,

respectivamente, de una matrix de dimensiones r x r de pxeles vecinos centrada en el

punto (x,y).

Definimos la medida del contraste de un pixel como:

)(),( lowhigh zzyxC

Si )(),( lowhigh zzyxC , donde es un cierto

valor entero conocido, entonces el vecindario consiste solo en una clase, objeto o fondo

de imagen.



En algunas imgenes, como las de mapas, grandes zonas de objetos raramente ocurren,

por lo que sus pxeles son etiquetados como fondo de imagen en dichos casos.

Resultados experimentales indican que tomando 15 y 15r se obtienen buenos resultados.

2.6.2.2. MTODO DE EIKVIL Y OTROS, 1991

Definimos una pequea ventana (matriz) de pxeles denominada S. Esta ventana est

incluida en otra mayor llamada L, que es concntrica sobre S.

El proceso consiste en deslizar las ventanas S y L a travs de la imagen en pasos igual al

tamao de S. La siguiente figura indica el sentido del movimiento:

Figura 10. Recorrido de Eikvil

Un ejemplo comn del tamao de las ventanas S y L es 3 x 3 pxeles para S y de 15 x

15 pxeles para L.

En cada paso, a todos los pxeles dentro de la ventana L se les calcula el mtodo de Otsu

para dividir los pxeles en dos grupos. Cualquier otro mtodo global puede reemplazar

al de Otsu, aunque ste da muy buenos resultados.

Si las estimaciones medias de los grupos son 1 y 2 estn ms alejadas que un lmite

especificado por el usuario 21 , los pxeles dentro de S son binarizados usando

el valor de umbral T (encontrado por el mtodo de Otsu).

Por el contrario, si se verifica que 21 todos los pxeles incluidos en S son

asignados a la clase con el valor medio actualizado ms cercano.

Un valor usado muy comn para es 15 .



2.6.2.3. MTODO DE MARDIA Y HAINSWORTH, 1988

Este mtodo en un primer momento realiza una binarizacin inicial, usando por ejemplo

un mtodo de binarizacin global como el mtodo de Otsu, para seguir con varios pasos

hasta alcanzar la convergencia.

El primero de estos pasos es calcular el valor medio i y el nmero de pxeles ni de las

dos regiones de la imagen binaria (objeto y fondo).

El siguiente paso es obtener un valor de umbral t* basado en estos valores, y para cada

pxel p(x,y) una media ponderada G de l y sus ocho vecinos es calculada.

Dado un pxel p(x,y), si cumple que G *t ser considerado como objeto(pxel negro) en caso contrario ser considerado como fondo.

2.6.2.4. MTODO DE NIBLACK, 1986

La idea de este mtodo es variar el umbral sobre la imagen, basndose en la media local

y en la desviacin estndar.

El umbral en el pxel p(x,y), T(x,y) es calculado como:

T(x,y) = m(x,y)+ k * s(x,y)

Donde m(x,y) es la media de la muestra y s(x,y) es la desviacin estndar, ambas de un

vecindario de pxeles centrados en el pxel (x,y).

El tamao de este vecindario de pxeles debera ser lo suficientemente pequeo para

preservar los detalles, y lo suficiente grande como para evitar el ruido.

El valor de k se usa para ajustar cuanto del lmite del total del objeto es tomado como

parte del mismo. Un valor de k = -0.2 ofrece a menudo una buena separacin entre

objetos.



2.6.2.5. MTODO DE TAXT Y OTROS, 1989

En este mtodo, la imagen es dividida en ventanas no superpuestas de tamao 32 x 32

pxeles.

En cada ventana, el histograma es aproximado por una mezcla de dos distribuciones

Gausianas. Los parmetros de la mezcla son estimados usando un algoritmo

denominado Expectation-Maximization (EM). En cada ventana, los pxeles son clasificados mediante el clasificador cuadrtico de Bayes.

El algoritmo EM requiere valores iniciales para estimar las medias de las clases 1 , 2

y las varianzas de clases 21 , 2

2 , y el factor de peso de la mezcla .

Normalmente se usa un valor de = 0.5 . Los otros 4 parmetros 1 , 2 y 2

1 , 2

2

estimados suelen ser estimados de una agrupacin de 100 pxeles elegidos de forma

aleatoria.

El problema de este mtodo es que aparecen cambios bruscos en el borde de la ventana.

Se puede decir que el citado mtodo de Eikvil y otros es una mejora de ste, ya que:

Al usar dos ventanas evita estos cambios bruscos en el borde

El usar el mtodo de Otsu como una aproximacin del algoritmo EM supone una mejora de tiempo respecto as este

El mtodo de Taxt necesita una mayor ventana que el mtodo de Eikvil ya que hay que realizar la estimacin de cinco parmetros.



2.6.2.6. MTODO DE YANOWITZ Y BRUCKSTEIN, 1989

Una superficie potencial que pasa sobre la imagen en los mximos locales del gradiente

es usada como superficie de binarizacin.

La magnitud del gradiente es calculada usando el operador de borde de Sobel, aunque

algunos autores como Jain y Dubuisson han usado el detector de bordes de Canny.

La imagen es binarizada y adelgazada con lneas de un pxel de anchura para identificar

los pxeles que forman el borde.

La imagen de entrada es suavizada mediante un filtro de media 3 x 3. La superficie

potencial se construye con un esquema de interpolacin iterativa con el objeto de

hacerla pasar sobre los pxeles de borde de la imagen.

Una interpolacin residual R(x,y) se calcula para cada pxel que no sea un pxel de

borde, y el nuevo valor del pxel P(x,y) en la iteracin n+1 se calcula como:

4

),(.),(),( 111

yxRyxPyxP nnn

),(4)1,()1,(),1(),1(),( yxPyxPyxPyxPyxPyxR nnnnnn

Las recomendaciones de Yanowitz y Bruckstein para el valor de es que permanezca

dentro del siguiente intervalo 0.20.1 para una rpida convergencia.



2.6.2.7. MTODO DE WHITE Y ROHRER, 1983

Un promedio mvil parcial es usado como umbral para cada pxel p(x,y).

El promedio horizontal en el pxel p(x,y) viene dado por:

),1().1(),(.),( yxHfyxZfyxH

Donde:

Z(x,y) es la imagen de entrada

El factor de peso f es una funcin no linear de ),1(),( yxHyxZ , con 0



2.6.2.8. MTODO DE PARKER, 1991

Este mtodo inicialmente detecta bordes, y luego rellena el interior de objetos entre

bordes.

Para cada pxel p(x,y) en la imagen de entrada Z(x,y) se calcula:

)),(),((),(8..1 iii

yxZyxZyxD min

Donde:

p(xi,yi), con i variando de 1 a 8 son los 8 vecinos conectados del punto p(x,y)

De este modo se calcula el negativo del gradiente en la direccin del pxel vecino con

ms brillo (luminancia).

A continuacin se divide D en regiones de tamao r x r y para cada regin se calcula la

media de la muestra y la desviacin estndar. Ambos valores se suavizan y se interpolan

bilinearmente para dar lugar a las imgenes M y S, originadas respectivamente de los

valores de la media y la desviacin.

Entonces, para un pxel p(x,y) podemos considerar los siguientes casos:

Si 0),( myxM 0),( syxS el pxel es marcado como parte de una regin

lisa y permanecer no marcado.

Si ),(.),(),( yxSkyxMyxD entones el pxel p(x,y) pasa a ser marcado

como imprimible, pxel que va a pertenecer a un objeto.

En otro caso el pxel permanece como no marcado.

La imagen binaria resultante aparece con los bordes muy marcados.

Seguidamente se le realiza una agregacin de pxeles y pasos de crecimiento de la

regin para localizar las partes restantes de los objetos que van a ser imprimibles.

Los siguientes parmetros proporcionan resultados aceptables:

0.1,0.1,0.1,16 00 ksmr



2.6.3. OTROS MTODOS DE BINARIZACIN DE IMGENES En este apartado se estudian aquellos mtodos de binarizacin que por su naturaleza no

pueden ser considerados como globales ni como locales.

2.6.3.1. MTODO WELLNER, 1993

Este mtodo se basa en encontrar un umbral por pxel de una manera rpida, y da

segmentaciones sorprendentemente buenas. Se disea para imgenes que contienen

textos (por ejemplo: Textos Escaneados). En este caso la iluminacin puede ser buena,

como puede ser la calidad de una imagen en general.

Un promedio mvil es simplemente el significado del nivel de gris de los ltimos n

pxeles vistos. La imagen puede tratarse como un array mono-dimensional de pxeles,

que es comn en lenguajes de programacin (como C), y el promedio se calcula

exactamente o estimado por medio de:

Mi1 Mi

Min gi1

donde Mi+1 es la estimacin del promedio mvil para el pxel i+1 cuyo nivel gris es g i+1

y Mi es el promedio mvil anterior.

Cualquier pxel menor a un porcentaje fijo de su promedio mvil pertenece al conjunto

de pxeles negro; de otra manera al conjunto de blanco. Para evitar una predisposicin

para un de lado de la imagen sobre el otro.

Se cruzan pxeles en direcciones opuestas en cada lnea nueva. Esto es, el pxel

siguiente al ultimo de la fila i es el ltimo en la fila i+1, seguido por el penltimo de la

fila i+1, y as asta llegar al primer pxel de la fila i+1; este es seguido por el pxel que

de comienzo de la fila i+2. Esto evita la discontinuidad al final de la lnea que ocurre en

lenguajes de programacin como C al usar una estructura de array bidimensional.

El proceso comienza con una estimacin del promedio mvil; un valor de 127 x n se

selecciona como primer Mi, esto solo afectar los primeros pxeles en la imagen. El

valor de n usado es el nmero de columnas dividido por 8. Ahora la ecuacin de abajo

se usa para computar la estimacin del promedio mvil para el prximo pxel (el

primero), que se usa inmediatamente como un umbral.

Donde V es el valor que tomar el pxel y pct es el valor del porcentaje fijo; El valor

ms comn empleado para pct es 15, debido a que este da buenos resultados en general.

g i

M in

100pct

1000

si 255 en otro

caso

V

=



2.6.3.2. MTODO DE LOS UMBRALES POR REGIONES

Este mtodo aunque puede ser considerado como mtodo local, lo he puesto en este

apartado, ya que no pertenece a ningn autor, es un ejemplo que aparece como

introdcuccin a los mtodos locales en el libro de J.R. Parker.

Los umbrales regionales son determinados por las regiones que las requieren, y por

cmo son los tamaos de dichas regiones. Una vez que este terminado, puede que

previamente se discuta los algoritmos que deben ser usados para conseguir un umbral

para cada una de las regiones, dichos umbrales simplificarn la realizacin de los

clculos. El nmero de regiones pueden simplemente ser fijado, al decidir romper la

imagen original en M subimagenes.

Este mtodo calcula el umbral usando una seleccin iterativa de 21 x 21 regiones

centrado en cada pxel. El umbral encontrado en cada regin ser usado solamente

como umbral del pxel que est en el centro, consiguiendo un umbral por cada pxel. Por

supuesto, habr 10 pxeles por el margen exterior y por alrededor de la imagen que no

conseguir calcular el umbral, pero que ser fijado posteriormente.

Esto es lo menos que puede ser esperado, pero hay una explicacin simple. El

algoritmo de clculo de umbral aplicado a cada regin intenta dividir los pxeles en dos

grupos, objetos y fondos, igualados cuanto la regin no contenga ejemplos de ambas

clases. Cuando la regin consiste solo en pxeles de fondo el algoritmo intenta tambin

resistirse, y crea dos clases donde solo uno es verdadero. Por consiguiente esto es

necesario, cuando se usa los mtodos regionales, seguramente al construir cualquiera de

cada una de las regiones contienen un ejemplo de ambos pxeles, tanto de objetos como

de fondos, o no se intenta calcular el umbral cuando solo existe una clase de pxel.



2.7. COMPONENTES CONEXAS DE UNA IMAGEN

Definicin: Una componente conexa es un conjunto de pxeles tal que para cualquier

par de pxeles del conjunto, existe un camino digital que los une.

Recordatorio: 4-Adyacencia

Si un pxel se encuentra en posicin (x,y), recordemos que sus vecinos pueden ser:

Figura 11. 4-Adyacencia

Para el caso de 8-Adyacencia, adems de estos, tambin son vecinos los (x-1,y-1),

(x+1,y-1), C(x-1,y+1) y D(x+1,y+1).

2.7.1 ALGORITMO PARA EL ETIQUETADO DE COMPONENTES CONEXAS

El siguiente algoritmo es uno de los posibles para realizar esta funcin. A continuacin

lo describo como se hace en la teora de la asignatura Procesamiento de Imgenes Digitales de 5 de Ingeniera Informtica de la Universidad de Sevilla.

Recorremos la imagen de izquierda a derecha y de arriba a abajo.

Durante el primer rastreo, para cada punto que tenga valor 1, examinamos a los

vecinos de arriba y a mano izquierda de P; ntese que si existen, acaban de ser

visitados por el rastreo, as que si son 1s, ya han sido etiquetados.

Si ambos son 0s, damos a P una nueva etiqueta;

si tan slo uno es 0, le damos a P la etiqueta del otro;



y si ninguno es 0s, le damos a P (por ejemplo) la etiqueta del de la izquierda, y

si sus etiquetas son diferentes, registramos el hecho de que son equivalentes,

i.e., pertenecen a la misma componente.

Cuando se completa este rastreo, cada 1 tiene una etiqueta, pero puede que se asignen

muchas etiquetas diferentes a puntos en el mismo componente. Ahora ordenamos las

parejas equivalentes en clases de equivalencia, y escogemos una etiqueta para

representar cada clase. Finalmente, realizamos un segundo rastreo de la imagen y

sustituimos cada etiqueta por el representante de cada clase; cada componente ha sido

ahora etiquetada de forma nica.

Si consideramos al 8-adyacencia para negro, para cada pxel P(x,y) en negro,

examinamos los pxeles superiores A(x+1,y-1), B(x,y-1), C(x-1,y-1) y D(x-1,y).

Si todos sus vecinos son blancos, damos al actual pxel una etiqueta nueva.

En otro caso, si uno de sus vecinos es negro, al pxel P le damos la misma

etiqueta que la del pxel negro.

Si dos o ms pxeles son negros, le damos a P una de las etiquetas y anotamos

que dichas etiquetas son equivalentes.

El proceso de equivalencia y re-etiquetado se realiza como en el caso de 4-adyacencia.

En la pgina web de la asignatura citada ( http://www.us.es/gtocoma/pid/ ), se detalla

este algoritmo con un ejemplo prctico.



2.7.2 COMPONENTES CONEXAS DE N PXELES, Ns(T)

Definicin: Ns(t) es el nmero de componentes conexas con un tamao de al menos s

pxeles en una imagen binarizada con umbral t.

Como umbral, t debe estar comprendido en el intervalo [0, 255].

s se suele tomar de un conjunto de valores de resoluciones R.

Esta definicin es importante, ya que permite obtener caractersticas de la imagen .

Un ejemplo de esto es la granularidad, muy usado en el para imgenes que representan

texturas.

Segn esta caracterstica, una imagen se considerar:

Muy granulosa: Si el nmero de componentes conexas cambia rpidamente cuando tomamos valores umbrales cercanos.

Poco granulosa: Si el nmero de componentes conexas no vara al ir cogiendo distintos valores umbrales cercanos.

Con esto vemos que gracias al estudio de las componentes conexas de N pxeles

podemos obtener un enfoque para caracterizar. En el ejemplo anterior se caracterizaban

imgenes que representan texturas.



2.8. VALORES ESTADSTICOS DE UNA IMAGEN EN BLANCO Y NEGRO

La media de una serie estadstica nos proporciona una idea de sus caractersticas, pero

esta informacin es insuficiente. Por ejemplo, una imagen puede tener una determinada

media de pxeles negros pero desigualmente distribuida, con algunas zonas con muchos

pxeles negros, y otras con apenas alguno. De estas observaciones, surge la necesidad de

utilizar las medidas de dispersin, las ms importantes son la desviacin media y la

desviacin cuadrtica media o desviacin estndar.

Definicin: Media aritmtica

Una de las medidas que caracterizan a una distribucin es la media aritmtica, que se

obtiene sumando los valores xi introducidos, y dividiendo entre el nmero total N..

La media de pxeles negros de una imagen en blanco y negro, se obtendra de la

siguente forma:

MN

jipV

x

M

i

N

j

n*

)),((1 1

, siendo N*M las dimensiones de la imagen,

V(p(i,j)) = 1 si p(i,j) representa a un pxel negro y

V(p(i,j)) = 0 si p(i,j) representa a un pxel blanco.

La media de pxeles blancos de una imagen en blanco y negro, se obtendra de la

siguente forma:

MN

jipV

x

M

i

N

j

n*

)),((1 1


p(i,j) = 1 si p(i,j) representa a un pxel blanco y

p(i,j) = 0 si p(i,j) representa a un pxel negro.



Medidas de dispersin

Se denomina desviacin, a la diferencia entre un valor y la media aritmtica de la serie

estadstica, di=xi-. La desviacin media es la media aritmtica de los valores

absolutos de todas las desviaciones. Su frmula es

La desviacin media de pxeles negros de una imagen en blanco y negro, se obtendra

de la siguente forma:

MN

pnMediajipV

x

M

i

N

j

n*

_)),((1 1




La desviacin media de pxeles blancos de una imagen en blanco y negro, se obtendra


MN

pbMediajipV

x

M

i

N

j

n*

_)),((1 1






La desviacin cuadrtica media es la raz cuadrada de la varianza, es decir, de la media

aritmtica de los cuadrados de las desviaciones respecto a la media.

Podemos obtener la varianza de pxeles negros y pxeles blanco a para una imagen a

partir de esta expresin.

La varianza de pxeles negros de una imagen en blanco y negro, se obtendra de la

siguente forma:

MN

pnMediajipV

x

M

i

N

j

n*

_)),((1 1

2

, siendo N*M las dimensiones de la

imagen,



La desviacin media de pxeles blancos de una imagen en blanco y negro, se obtendra


MN

pbMediajipV

x

M

i

N

j

n*

_)),((1 1

2

, siendo N*M las dimensiones de la

imagen,





3. ANLISIS TEMPORAL Y DE COSTES DE DESARROLLO 3.1. CUADERNO DE TIEMPO SEMANAL

Semana

T.

Total

T.

Interr

T.

Activo

T.

Tutora

T.

Desarr.

T.

Investig.

T.

Memoria

Descripcin Tareas

Realizadas

28 Marzo

03 Abril

1:00 0:00 0:00 1:00 0:00 0:00 0:00 Adjudicacin del

proyecto fin de carrera

04 Abril 10 Abril

12:00 2:00 10:00 0:00 10:00 0:00 0:00 Operaciones con

imgenes en .NET

11 Abril 17 Abril

11:00 1:00 10:00 0:00 5:00 0:00 5:00 Modelos de color, de

color a grises

18 Abril 24 Abril

10:00 0:00 10:00 0:00 5:00 0:00 5:00 Modelos de color, de

color a grises

25 Abril 01 Mayo

7:00 0:00 7:00 0:00 0:00 7:00 0:00 Bsqueda de

informacin

02 Mayo 08 Mayo

16:00 3:00 13:00 1:00 10:00 2:00 0:00 Clases implementacin,

09 Mayo 15 Mayo

14:45 3:00 11:45 0:00 10:00 1:45 0:00 Clases

implementacin,Mtod

os Globales

16 Mayo 21 Mayo

13:15 00:15 13:00 0:00 12:00 1:00 0:00 Mtodos Globales,

Busqueda de

informacin

23 Mayo 29 Mayo

16:00 0:00 16:00 0:00 10:00 6:00 0:00 Mtodos Globales

30 Mayo 05 Junio

16:00 1:00 15:00 0:00 10:00 5:00 0:00 Mtodos Globales,

busqueda de

informacin

06 Junio 12 Junio

15:30 1:30 14:00 0:00 14:00 0:00 0:00 Mtodos Globales

13 Junio 18 Junio

11:30 0:30 11:00 0:00 11:00 0:00 0:00 Otros Mtodos

19 Junio 26 Junio

12:00 0:00 12:00 0:00 12:00 0:00 0:00

Mtodos Globales

27 Junio 03 Julio

4:00 0:00 4:00 1:00 0:00 3:00 0:00 Operaciones sobre

imgenes

04 Julio 10 Julio

17:45 1:30 16:15 0:00 12:00 00:45 3:30 Mtodos locales,

Memoria, Estudio

terico

11 Julio 17 Julio

18:00 0:30 17:30 0:00 15:00 0:00 2:30 Mtodos locales,

Estudio terico

18 Julio 24 Julio

17:15 1:00 16:15 0:00 10:15 1:00 5:00 Mtodos locales,

Estudio terico

25 Julio 30 Julio

17:00 2:00 15:00 0:00 6:00 0:00 9:00

Mtodos locales,

Estudio terico

01 Agost

07 Agost

24:00 0:00 24:00 1:00 21:00 0:00 2:00 Manual Usuario,

interfaz grafica



08 Agost

14 Agost

23:00 2:00 21:00 0:00 15:00 0:00 6:00 Manual Usuario,

interfaz grafica

15 Agost

21 Agost

20:00 0:00 20:00 0:00 6:00 0:00 14:00 Manual Usuario,

interfaz grafica

22 Agost

28 Agost

15:00 0:00 15:00 0:00 4:00 0:00 11:00 Manual Usuario,

interfaz grafica

29 Agost

04 Sept

12:30 0:00 12:30 1:30 4:00 0:00 7:00 Componentes conexas,

estadsticas

05 Sept 11 Sept

11:00 0:00 11:00 0:00 1:00 0:00 10:00 Memoria

12 Agost

18 Sept

16:30 0:00 16:30 0:00 1:30 0:00 15:00 Memoria

3.2. CUADERNO DE TIEMPO MENSUAL

Mes

T.

Total

T.

Interr

T.

Activo

T.

Tutora

T.

Desarr.

T.

Investig.

T.

Memoria

Marzo 1:00 0:00 1:00 1:00 0:00 0:00 0:00

Abril 40:00 3:00 37:00 0:00 20:00 7:00 10:00

Mayo 60:00 6:15 53:45 1:00 42:00 10:45 0:00

Junio 55:00 3:00 52:00 0:00 47:00 5:00 0:00

Julio 74:00 5:00 69:00 1:00 43:15 4:45 20:00

Agosto 82:00 2:00 80:00 1:00 46:00 0:00 33:00

Septiembre 40:00 0:00 40:00 1:30 6:30 0:00 32:00

3.3. CUADERNO DE TIEMPO TOTAL

Total

T.

Total

T.

Interr

T.

Activo

T.

Tutora

T.

Desarr.

T.

Investig.

T.

Memoria

352 19:15 332:45 5:30 204:45 27:30 95



4. ANLISIS DE REQUISITOS, DISEO E IMPLEMENTACIN

4.1. ANLISIS DE REQUISITOS

4.1.1 INTRODUCCIN

Todos los requisitos funcionales y no funcionales especificados en esta memoria han

sido resueltos en la aplicacin.

4.1.2 REQUISITOS FUNCIONALES

El posible cliente de la aplicacin necesitar que se cumplan los siguientes requisitos.

Aplicacin didctica: La aplicacin no slo debe ser efectiva sino adems didctica. Presentar toda la

informacin terica y de ayuda al usuario en todas las fases.

Aplicacin directa: Aparte de la cuestin de que debe ser didctica debe presentar una opcin que

permita al cliente ejecutar la aplicacin directamente sin pasos previos. Debe tenerse en

cuenta que el usuario puede ser inexperto as pues este apartado debe ser lo ms sencillo

posible. La interaccin del usuario con la aplicacin debe ser muy sencilla, es decir, el

usuario no debe tener que especificar parmetros engorrosos y cada parmetro deber

estar perfectamente descrito.

Presentacin de solucin: La solucin debe ser lo ms clara posible. En caso de que cualquier operacin no

haya sido correcta debe comunicarlo con un mensaje

Uso del programa por cliente experto: Un cliente que se halla ledo el manual del usuario tiene la posibilidad de cambiar

los diferentes parmetros que modificarn el comportamiento de la aplicacin,

mejorando su efectividad.



4.1.3 REQUISITOS NO FUNCIONALES

Coste computacional Adems las caractersticas deben contar con otros requerimientos como son que

tengan un bajo gasto computacional, tanto en tiempo como en complejidad. Debido a

estos motivos es muy difcil conseguir unas caractersticas ptimas.

Modulacin: La aplicacin debe estar estructurada modularmente ya que debe permitir la

incorporacin de nuevos mdulos que extienda su utilizar o su eficiencia. La aplicacin

estar estructurada en formularios. Cada formulario tendr asociado una o ms clases y

cada una de las clases podrn delegar en otras clases para realizar su cometido.

Encapsulacin: La aplicacin estar perfectamente encapsulada de tal forma que sea fcil su

instalacin. La aplicacin se instalar bajo en directorio que el propio usuario elegir en

el proceso de instalacin.

Posibilidad de ampliacin Al estar perfectamente modulada, la aplicacin permitir ampliacin simplemente

aadiendo nuevos mdulos. Las posibles ampliaciones pueden estar dirigidas a nuevos

mdulos que implementen otros algoritmos matemticos para la binarizacin de

imgenes en escalas de grises.

ROI Esta aplicacin generar un buen ROI (retorno de inversin). En este caso, al ser un

Proyecto informtico no est orientado para el comercio. Pero siempre cabe la

posibilidad de un retorno de inversin tecnolgico que permita agrandar la herramienta.

Cabe tambin la posibilidad de un retorno de inversin financiero una vez que la

herramienta est ms desarrollada y apetecible para el usuario, ya que hay que recordar que esta versin es una beta destinada al aprendizaje de los mtodos de

binarizacin existentes.

Usabilidad Tiene que ser de fcil uso para el cliente. Tiene la posibilidad de dos alternativas

distintas.

Cliente inexperto: no tiene por que manejar los distintos factores que modifiquen

algunos de los mtodos implementados, dejando los valores por defecto de dichos

mtodos, que suelen dar buenos resultados.

Cliente experto: Una vez ledo el manual del usuario y con conocimientos sobre

tratamientos de imgenes, el cliente tiene la capacidad de modificar los distintos

factores que permitan una binarizacin de la imagen con todo el detalle que desee.

Integridad: La aplicacin, al basarse en tecnologa .NET presenta una gran integridad y

facilidad de instalacin. Simplemente deber ejecutarse el instalador para poder instalar

la aplicacin en el directorio elegido. Ser necesario instalar previamente el framework

de .NET antes de realizar la instalacin si no se encuentra en el sistema.



Portabilidad: Estos requisitos definen qu caractersticas deber tener el software para que sea

fcil utilizarlo en otra mquina o bajo otros sistemas operativos.

En este caso puede funcionar bajo los siguientes sistemas operativos:

a. Windows 2000

b. Windows 2003

c. Windows XP

Fiabilidad: Estos requisitos deben establecer los factores que se requieren para la fiabilidad del

software en tiempo de explotacin.

Mide la probabilidad del sistema de producir una respuesta satisfactoria a las demandas

del usuario.

La tasa de fallos de la aplicacin no podr ser superior a 2 fallos por cada 500 imgenes

tratadas.

Eficiencia: Los tratamientos de imgenes deben ser lo ms rpido posible en tiempo de

ejecucin y con el menor de errores. La eficiencia de las operaciones de binarizacin de

una imagen en escala de grises est sujeta al mtodo de binarizacin elegido.

Para los dems algoritmos de la aplicacin, aquellos tratamientos de imgenes que

no pertenecen a un mtodo de un autor, se han escogidos los ms eficientes posibles

tanto en rapidez, esfuerzo y efectividad.

Fcil mantenimiento La modulacin del proyecto permite un fcil mantenimiento por parte de una

persona ajena a la construccin del mismo. Todas las funciones estn perfectamente

detalladas y el cdigo fuente tambin contiene breves explicaciones que harn ms fcil

el mantenimiento.

Facilidad de prueba: La aplicacin es fcilmente sometible a pruebas por parte de un usuario debido a su

alta interactividad con el mismo. El poder trabajar con mltiples imgenes al mismo

tiempo facilita mucho la aplicacin de pruebas con todo tipo de imgenes y la

comparacin de resultados.



4.1.4 OTROS REQUISITOS

Requisitos de interfaz de usuario Este tipo de requisitos especifica las caractersticas que deber tener el sistema en

su comunicacin con el usuario.

En la aplicacin lo nico que se pide es que sea sencilla para el manejo del usuario y

genere resultados correctos. Adems la interfaz de la aplicacin debe ser del tipo MDI

(Multiple Document Interface) para permitir poder trabajar simultneamente con varios

documentos.

Estos requisitos deben establecer los factores que se requieren para la fiabilidad del

software en tiempo de explotacin.

Mide la probabilidad del sistema de producir una respuesta satisfactoria a la

demanda del usuario.

La tasa de fallos de la aplicacin no podr ser superior a 2 fallos por cada 500 imgenes

tratadas.

Requisitos de entorno de desarrollo Este tipo de requisitos especifican si el sistema debe desarrollarse con un producto

especfico.

En el caso de la aplicacin necesito en entorno Visual Studio .Net 2.0 o superior.



4.2. DISEO

4.2.1 OBJETIVOS DEL DISEO

La idea a la hora de disear la aplicacin es bien simple, partir de una imagen a color y

convertirla en una imagen en blanco y negro.

partimos de una imagen en color, a la que se le puede hacer un preprocesamiento y

seguir siendo una imagen a color o bien haberse convertido en una imagen en escala de

grises tras haberle aplicado el procesamiento adecuado.

Una vez estamos trabajando con una imagen en escala de grises, a esta se le pueden

seguir efectuando operaciones (seguir llamndolas preprocesamiento) mantenindose

como imagen en escala de grises, o bien realizarle un proceso de binarizacin con lo

cual la imagen se convertira en una imagen en blanco y negro.

Con la imagen en blanco y negro, que es nuestro objetivo, podremos realizar ciertas

operaciones, que llamaremos operaciones de postprocesamiento.

La siguiente figura explica este proceso vindo

Documents

Binarización de Imágenes