Upload
williancastillo
View
83
Download
0
Embed Size (px)
DESCRIPTION
Muestra como convertir una imagen comprimida en datos binarios
Citation preview
ESCUELA TCNICA SUPERIOR DE INGENIERA INFORMTICA
INGENIERA SUPERIOR EN INFORMTICA
MTODOS DE BINARIZACIN DE IMGENES EN NIVELES DE GRIS
Realizado por JOS MANUEL DELGADO ROMERO
Dirigido por PEDRO REAL JURADO
Departamento
MATEMTICA APLICADA I
Sevilla, Septiembre de 2005
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 2
0. INDICE INDICE GENERAL 1. DEFINICIN DE OBJETIVOS, 6
1.1. BREVE EXPLICACIN DEL PROYECTO FIN DE CARRERA, 6
1.2. JUSTIFICACIN DEL TRABAJO, 8
2. ESTUDIO TERICO, 10
2.1. CONCEPTOS PREVIOS SOBRE EL COLOR, 10
2.2. MODELOS DE COLOR, 12
2.2.1 MODELO DE COLOR RGB, 12
2.2.2 MODELO DE COLOR CMY, 13
2.2.3 MODELO DE COLOR HSI, 15
2.2.4 MODELO DE COLOR YCbCr,, 18
2.3. DE RGB A ESCALA DE GRISES, 18
2.4. NEGATIVO DE UNA IMAGEN, 19
2.5. ROTACIONES Y GIROS DE UNA IMAGEN, 20
2.6. MTODOS DE BINARIZACIN DE IMGENES ESTUDIADOS, 22
2.6.1 MTODOS GLOBALES DE BINARIZACIN DE IMGENES, 22
2.6.1.1. MTODO VALOR DE NIVEL DE GRIS MEDIO, 22
2.6.1.2 MTODO DE PORCENTAJE DE PXELES NEGROS, 23
2.6.1.3. MTODO DE LOS DOS PICOS, 23
2.6.1.4. MTODO DE WESKA, 24
2.6.1.5. MTODO DE RIDLER, 24
2.6.1.6. MTODO DE THRUSSELL, 25
2.6.1.7. MTODO DE OTSU, 25
2.6.1.8. MTODO DE KAPUR, 26
2.6.1.9. MTODO DE JOHANNSEN, 29
2.6.1.10. MTODO DE HUANG, 29
2.6.1.11. MTODO DE YAGGER, 31
2.6.1.12. MTODO DE KITLER, 32
2.6.2 MTODOS GLOBALES DE BINARIZACIN DE IMGENES, 33
2.6.2.1. MTODO DE BERNSEN, 33
2.6.2.2. MTODO DE EIKVIL Y OTROS, 34
2.6.2.3. MTODO DE MARDIA Y HAINSWORTH, 35
2.6.2.4. MTODO DE NIBLACK, 35
2.6.2.5. MTODO DE TAXT Y OTROS, 36
2.6.2.6. MTODO DE YANOWITZ Y BRUCKSTEIN, 37
2.6.2.7. MTODO DE WHITE Y ROHRER, 38
2.6.2.8. MTODO DE PARKER, 39
2.6.3. OTROS MTODOS DE BINARIZACIN DE IMGENES, 40
2.6.3.1. MTODO WELLNER, 40
2.6.3.2. MTODO DE LOS UMBRALES POR REGIONES, 41
2.7. COMPONENTES CONEXAS DE UNA IMAGEN, 42
2.7.1 ALGORITMO PARA EL ETIQUETADO DE COMPONENTES CONEXAS, 42
2.7.2 COMPONENTES CONEXAS DE N PXELES, 44
2.8. VALORES ESTADSTICOS DE UNA IMAGEN EN BLANCO Y NEGRO, 45
3. ANLISIS TEMPORAL Y DE COSTES DE DESARROLLO, 48
3.1. CUADERNO DE TIEMPO SEMANAL, 48
3.2. CUADERNO DE TIEMPO MENSUAL, 49
3.3. CUADERNOS DE TIEMPO TOTAL, 49
4. ANLISIS DE REQUISITOS, DISEO E IMPLEMENTACIN, 50
4.1. ANLISIS DE REQUISITOS, 50
4.1.1 INTRODUCCIN, 50
4.1.2 REQUISITOS FUNCIONALES, 50
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 3
4.1.3 REQUISITOS NO FUNCIONALES, 51
4.1.4 OTROS REQUISITOS, 53
4.2. DISEO, 54
4.2.1 OBJETIVOS DEL DISEO, 54
4.2.2 PREPROCESAMIENTO, 55
4.2.3 BINARIZACIN, 55
4.2.4. POSTPROCESAMIENTO, 56
4.2.5. EXTENDER LA FUNCIONALIDAD DE LA APLICACIN, 57
4.3.1. DISEO TECNOLGICO, 59
4.3.2. CLASES Y TIPOS DE DATOS UTILIZADOS, 60
4.3.3. DETALLES DE IMPLEMENTACIN, 68
4.3.3.1 CONVERTIR UNA IMAGEN EN COLOR A ESCALA DE GRISES, 68
4.3.3.2 BINARIZAR GLOBALMENTE UNA IMAGEN EN ESCALA DE GRISES, 69
4.3.3.3. BINARIZAR LOCALMENTE UNA IMAGEN EN ESCALA DE GRISES, 70
4.3.3.4 OPERACIN LGICA XOR ENTRE DOS IMGENES BINARIAS, 73
5. MANUAL DE USUARIO, 76
5.1. INTRODUCCIN DE LA APLICACIN, 76
5.2. INSTALACIN DEL PROGRAMA, 76
5.3. PANTALLAS, VENTANAS Y OPERACIONES DE LA APLICACIN, 77
5.3.1 PANTALLA PRINCIPAL, 77
5.3.2 VENTANA NEGATIVO DE LA IMAGEN, 80
5.3.3 VENTANA CONVERTIR A ESCALA DE GRISES, 82
5.3.4 OPERACIN SEPARAR CANALES DE COLOR RGB, 84
5.3.5 VENTANA BALANCE DE COLOR, 85
5.3.6 VENTANA OPERACIN AND, 86
5.3.7 VENTANA OPERACIN OR, 87
5.3.8 VENTANA OPERACIN XOR, 88
5.3.9 VENTANA CONFIGURACIN DE INTERVALOS, 89
5.3.10 VENTANA DE BINARIZACIN GLOBAL, 91
5.3.10.1. METODO GLOBAL DEL NIVEL DE GRIS MEDIO, 94
5.3.10.2 METODO GLOBAL DEL PORCENTAJE, 96
5.3.10.3 METODO GLOBAL DE LOS DOS PICOS, 98
5.3.10.4 METODO GLOBAL HUANG, 100
5.3.10.5 METODO GLOBAL DE YAGGER, 102
5.3.10.6 METODO GLOBAL DE KITLER, 104
5.3.10.7 METODO GLOBAL DE OTSU, 106
5.3.10.8 METODO GLOBAL DE RIDDLER, 108
5.3.10.9 METODO GLOBAL DE THRUSSELL, 110
5.3.10.10 METODO GLOBAL DE WESKA, 112
5.3.10.11 METODO GLOBAL DE JOHANNSEN, 114
5.3.11 VENTANA DE BINARIZACIN LOCAL, 116
5.3.11.1 METODO LOCA DE BERNSEN, 118
5.3.11.2 METODO LOCAL DE EIKVIL, TAXT & MOEN, 120
5.3.11.3 METODO LOCAL DE MARDIA & HAINSWORTH, 122
5.3.11.4 METODO LOCAL DE NIBLACK, 124
5.3.11.5 METODO LOCAL DE TAXT, FLYNN & JAIN, 126
5.3.11.6 METODO LOCAL: YANOWITZ & BRUCKSTEIN, 127
5.3.11.7 METODO LOCAL DE WHITE & ROHRER, 129
5.3.11.8 METODO LOCAL DE PARKER, 130
5.3.12 VENTANA DE BINARIZACIN CON OTROS MTODOS, 132
5.3.12.1 METODO DE WELLNER, 133
5.3.12.2 METODO DE UMBRALES POR REGIONES, 135
6. PRUEBAS, 136
6.1. FORMATO DE LAS IMGENES, 136
6.2. TAMAO DE LAS IMGENES, 136
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 4
6.3. MTODOS DE BINARIZACIN, 136
7. EVALUACIN DE OTRAS ALTERNATIVAS, 137
8. CONCLUSIONES, 138
8.1. CONCLUSIONES DE CARCTER GENERAL, 138
8.2. APORTACIN PERSONAL DEL PROYECTO, 138
9. BIBLIOGRAFA, 139
9.1. REFERENCIAS BIBLIOGRFICAS, 139
9.2. REFERENCIAS DE DIRECCIONES ELECTRNICAS, 140
LISTA DE FIGURAS
FIGURA 1. INTRODUCCIN AL PROCESO DE BINARIZACIN DE IMGENES,
7
FIGURA 2. ESPECTRO DE COLORES, 10
FIGURA 3. ESPECTRO DE ONDAS VISTA POR EL HOMBRE, 11
FIGURA 4. CUBO RGB, 12
FIGURA 5. COLORES CMY, 14
FIGURA 6. MODELOS ADITIVO Y SUBSTRACTIVO, 15
FIGURA 7. MODELO HSI, 16
FIGURA 8. NEGATIVO DE LA IMAGEN, 19
FIGURA 9. ROTACIONES Y GIROS DE LA IMAGEN, 20
FIGURA 10. RECORRIDO DE EIKVIL, 34
FIGURA 11. 4-ADYACENCIA, 42
FIGURA 12. ESQUEMA DE DISEO, 54
FIGURA 13. CLASIFICACIN DE MTODOS DE BINARIZACIN, 55
FIGURA 14. FUNCIONALIDAD EXTENDIDA, 58
FIGURA 15. FRAGMENTO DE CDIGO DE BINARIZACIN GLOBAL, 69
FIGURA 16. FRAGMENTO DE CDIGO DE BINARIZACIN GLOBAL II, 70
FIGURA 17. FRAGMENTO DE CDIGO DE BINARIZACIN LOCAL, 71
FIGURA 18. FRAGMENTO DE CDIGO DE BINARIZACIN LOCAL II, 72
FIGURA 19. FRAGMENTO DE CDIGO DE BINARIZACIN LOCAL III, 73
FIGURA 20. FRAGMENTO DE CDIGO DE LA OPERACIN XOR, 74
FIGURA 21. FRAGMENTO DE CDIGO DEL MTODO PORCENTAJE, 75
FIGURA 22. PANTALLA PRINCIPAL DE LA APLICACIN, 77
FIGURA 23. MENS DE LA APLICACIN, 77
FIGURA 24. BARRA DE BOTONES DE LA APLICACIN, 78
FIGURA 25. VENTANA NEGATIVO DE LA IMAGEN, 80
FIGURA 26. VENTANA CONVERTIR A ESCALA DE GRISES, 82
FIGURA 27. OPERACIN SEPARAR CANALES DE COLOR RGB, 84
FIGURA 28. VENTANA OPERACIN AND, 86
FIGURA 29. VENTANA OPERACIN OR, 87
FIGURA 30. VENTANA OPERACIN XOR, 88
FIGURA 31. VENTANA CONFIGURACIN DE INTERVALOS, 89
FIGURA 32. VENTANA BINARIZACIN GLOBAL, 91
FIGURA 33. VENTANA BINARIZACIN GLOBAL EXTENDIDA, 92
FIGURA 34. MTODO NIVEL DE GRIS MEDIO, 94
FIGURA 35. MTODO DE PORCENTAJE, 96
FIGURA 36. MTODO DE LOS DOS PICOS, 98
FIGURA 37. MTODO DE HUANG, 100
FIGURA 38. MTODO DE YAGGER, 102
FIGURA 39. MTODO DE KITLER, 104
FIGURA 40. MTODO DE OTSU, 106
FIGURA 41. MTODO DE RIDDLER, 108
FIGURA 42. MTODO DE THRUSSELL, 110
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 5
FIGURA 43. MTODO DE WESKA, 112
FIGURA 44. MTODO DE JOHANNSEN, 114
FIGURA 45. VENTANA BINARIZACIN LOCAL, 116
FIGURA 46. VENTANA BINARIZACIN LOCAL II, 117
FIGURA 47. MTODO DE BERNSEN, 118
FIGURA 48. MTODO DE EIKVIL Y OTROS, 120
FIGURA 49. MTODO DE MARDIA Y HAINSWORTH, 122
FIGURA 50. MTODO DE NIBLACK, 124
FIGURA 51. MTODO DE TAXT Y OTROS, 126
FIGURA 52. MTODO DE YANOWITZ Y BRUCKSTEIN, 127
FIGURA 53. MTODO DE WHITE Y ROHRER, 129
FIGURA 54. MTODO DE PARKER, 130
FIGURA 55. VENTANA BINARIZACIN CON OTROS MTODOS, 132
FIGURA 56. MTODO DE WELLNER, 133
FIGURA 57. MTODO DE UMBRALES POR REGIONES, 135
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 6
1. DEFINICIN DE OBJETIVOS
1.1. BREVE EXPLICACIN DEL PROYECTO FIN DE CARRERA
Qu se entiende por binarizacin de imgenes en niveles de gris?
La binarizacin de imgenes en niveles de gris es un proceso para extraer de una
imagen aquellos pxeles que representan objetos dentro de una imagen.
Estos objetos pueden ser de naturaleza muy diversa, desde texto escrito en un
documento, lneas pertenecientes a mapas, un peatn cruzando una calle o una retina
perteneciente a un ojo humano.
Despus de binarizar una imagen en niveles de grises, el resultado es una imagen con
dos niveles de grises, cuyos pxeles pertenecientes a los objetos tienen todos un nivel de
gris y los pxeles pertenecientes al fondo de la imagen tienen otro.
Lo normal es que tras binarizar una imagen en niveles de gris se obtenga una imagen
monocroma en la que los pxeles correspondientes a objetos se muestren negros y los
correspondientes al fondo de la imagen aparezcan blancos.
La segmentacin de un nivel es casi esencial antes de procedimientos como
adelgazamiento, vectorizacin y operaciones morfolgicas.
A continuacin se describen los mtodos ms comunes para realizar esta tarea.
Mtodos de Binarizacin de imgenes en niveles de gris
El objetivo de este proyecto es estudiar, analizar e implementar numerosos de los
existentes mtodos de binarizacin de imgenes creados hasta la fecha.
Hay que tener en cuenta la dificultad que existe en decidir qu mtodo usar cuando nos
planteamos binarizar una imagen en niveles de grises, ya que cada mtodo ha sido
diseado y planteado para una aplicacin concreta.
A lo largo de la historia, son muchos los autores que han investigado en este campo
aportando soluciones a diversos problemas. Este proyecto tambin se encarga de
recopilar esa informacin describiendo cada mtodo, mostrndolos por nombre de autor
y fecha de creacin de dicho mtodo, clasificarlos y facilitar al usuario su uso en una
plataforma comn, como es la de los pcs con Windows y facilitarle la ayuda,
permitindole mostrar la teora suficiente como para que un usuario experto pueda sacar
el mximo provecho y mostrrle la ayuda en lnea para esos usuarios menos expertos o
que estn en fase de aprendizaje.
Por otro lado, decir que la base terica de este proyecto es de las ms ricas que se puede
encontrar en un problema de tratamiento de imgenes, ya que implica numerosos temas,
y se nutre de muchos tratamientos de imgenes, que aunque no intervienen directamente
en los objetivos de un mtodo de binarizacin de imgenes, si pueden ser considerados
necesarios ante la ejecucin de un mtodo de binarizacin.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 7
A grandes rasgos, y como anticipo del apartado 4.2. Diseo, podramos decir que las fases de un mtodo de binarizacin seran estas:
Figura 1. Introduccin al proceso de binarizacin de imgenes
La mayor parte de este proyecto trata de cmo realizar la binarizacin de la imagen para
pasar una imagen en grises a una imagen en blanco y negro.
Como veremos ms adelante, el proceso de binarizacin de una imagen puede ser tan
complejo en tiempo, facilidad de compresin, operaciones y conocimientos
matemticos utilizados como el autor quiera.
Este proyecto tiene como base los artculos comparativos de 0ivind Due Trien y Torfinn
Taxt, y de J.R. Parker.
Los trabajos de estas personas se bajan en elegir una serie de mtodos para, despus de
su exposicin comparlos los resultados entre s.
Uno de los grandes aadidos de este proyecto es la obtencin de estadsticas de una
imagen tras aplicarle un mtodo, por lo que cualquier investigador puede realizar un
artculo del tipo del que han hecho los citados autores comparando cualitativa y
cuantitativamente los resultados de los mtodos que dispone esta aplicacin.
IMAGEN EN
COLOR
IMAGEN EN
GRISES
IMAGEN EN
BLANCO Y
NEGRO
BINARIZAR IMAGEN
CONVERTIR A GRISES
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 8
1.2. JUSTIFICACIN DEL TRABAJO
En campo de procesamiento de imgenes digitales es bastante amplio y se tratan
numerosos temas. Cada investigador trata de aportar ideas y conocimientos nuevos en
un determinado campo del procesamiento de imgenes digitales para una aplicacin
determinada.
El tema de binarizacin de imgenes en niveles de grises es un campo muy activo
dentro de esta disciplina, y aunque es fcil ir a una revista especializada y encontrar el
trabajo de un determinado investigador, es muy difcil probar realmente el mtodo en un
ordenador. En la mayora de los casos los autores de estos artculos nos lo describen,
dndonos las frmulas matemticas en las que estn basadas, pero no nos muestran una
implementacin en un lenguaje de alto nivel para poder practicar con ella. Slo nos
muestran los resultados cualitativos con las imgenes impresas en papel y en algunos
casos los tiempos que han tardado en ejecutarse en una determinadaza maquina,
comparando los tiempos con los mtodos de otros autores.
En otros muchos casos los nuevos mtodos estn basados en mtodos anteriormente
publicados por otros autores.
Es por ello por lo que resulta muy difcil para un estudiante o investigador acceder a
probar, analizar, mejorar o investigar en este campo.
Con este proyecto fin de carrera intento crear un marco de trabajo en el que cualquier
persona interesada pueda acceder a estos mtodos, estudindolos, modificando los
parmetros de entrada en aquellos que lo admitan, y en definitiva, ver los resultados
experimentales con cualquier imagen que disponga.
Anteriormente, curs la asignatura de 5 de Ingeniera Informtica : Procesamiento de
Imgenes digitales, en la cual un grupo de cuatro alumnos desarrollamos una aplicacin
que usaba mtodos de segmentacin en niveles gris locales.
Dicha fue escrita en Visual Basic 6.0. Tras realizar ese trabajo, me di cuenta que se
poda mejorar notablemente, tanto en eficiencia, como es aspectos tcnicos. Sera
interesante que soportase cualquier imagen est en el formato grfico que est. Adems,
el tamao de la imagen no debera importar ya que frecuentemente la binarizacin de
imgenes en niveles de gris tiene como objetivo los mapas, y stos son escaneados a
una resolucin bastante alta.
El trabajo anterior solo trataba mtodos de binarizacin globales, por lo que vi muy
interesante que la aplicacin tambin soportase mtodos locales. Esto ltimo lo tom
como un reto, debido a la escasez de informacin y de implementaciones acerca de
estos ltimos.
As pues, una vez abierta esta lnea investigacin, decid realizar una aplicacin que
tratase sobre mtodos de binarizacin lo ms completo posible, de fcil uso y que fuese
didctico, que sirviese para usuarios experimentados y que pudiese ser ampliada y
utilizada como base para futuros proyectos.
A nivel tcnico, este proyecto, aplica numerosos algoritmos de anlisis,
tratamiento de imgenes, estructura de ficheros, creacin de un entorno
amigable para el usuario, etc....
Se trata de un proyecto muy completo que he intentado que abarque lo
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 9
mximo de mis conocimientos informticos no slo en el tratamiento de imagen, sino
tambin en nuevas tecnologas (.NET), aplicacin de mis conocimientos como
programador (Visual Basic .NET) y la resolucin de un problema real que est a la
orden del da, sobre todo en el campo de mapas y de imgenes mdicas.
Con respecto a la utilidad del producto queda demostrado anteriormente que
este producto puede general un alto grado de ROI (retorno de inversin) que
posibilite poder seguir investigando en esta rama de anlisis de imgenes.
A nivel personal, el proyecto queda justificado ya que he conseguido
enfrentarme a una dura prueba de investigacin, desarrollo y trabajo con el
departamento de matemtica aplicada I. Manual de usuario
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 10
2. ESTUDIO TERICO 2.1. CONCEPTOS PREVIOS SOBRE EL COLOR
Color: Segn la Real Academia Espaola el color es: s. m. Sensacin visual que
producen sobre la retina los rayos de luz reflejados por un cuerpo. Sustancia preparada
para pintar. Colorido de una pintura.
En 1666, Isaac Newton descubri que al pasar un rayo de luz solar a travs de un prisma
de cristal, el rayo de luz que sale no es blanco, est formado por un espectro continuo de
colores que van desde el magenta al rojo.
Figura 2. Espectro de colores
Los colores del espectro que pueden distinguirse son el magenta, azul, cian, verde,
amarillo, y rojo. Al ser el espectro de colores continuo cada color de los que se muestran
se mezcla suavemente con el siguiente.
El sol irradia una amplia variedad de ondas electromagnticas, cada una con una
longitud de onda diferente, como por ejemplo los rayos gamma, rayos X o los
Ultravioletas. El ojo humano solo es sensible a un pequeo intervalo de esas longitudes
de onda, denominado luz blanca.
El siguiente grfico muestra el espectro de ondas vistas por el hombre:
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 11
Figura 3. Espectro de ondas vista por el hombre
El ser humano percibe el color como un acto de la reaccin de 3 tipos de conos, por ello
los sistemas de color estn basados en tres componentes. Ejemplos de sistemas de color
son el RGB, CMY, HSI, y YCbCr .
Se puede decir que la luz blanca no es un color, sino que la mezcla de todos los colores.
Asimismo el negro tampoco es un color propiamente dicho, sino que es la ausencia de
la luz, y estos se ven negros cuando absorben todas las frecuencias de la luz visible.
En realidad, el negro que se muestra en los monitores de color es similar a un verde
oscuro o verde marrn debido a emisiones de luz dispersas. La gama de colores que
puede mostrarse en un monitor es ms pequea que la que puede verse en la naturaleza
debido a que est limitada por las caractersticas de los revestimientos de fsforo de la
pantalla que emiten la luz
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 12
2.2. MODELOS DE COLOR
2.2.1 MODELO DE COLOR RGB Es el modelo de color ms usado, ya que el ser humano recibe la informacin del color
separada en rojo, verde y azul mediante conos receptores presentes en el ojo. El cerebro
se encarga de procesar estos tres componentes y componer una imagen en color.
El modelo de color RGB, cada color aparece descompuesto en sus componentes
espectrales rojo (Red), verde (Green) y azul (Blue), cuya combinacin produce el color
resultante.
Se denominan colores primarios aditivos a los colores rojo, verde y azul, ya que los
dems colores se pueden obtener como combinacin de estos.
Este modelo se puede representarse en forma de cubo tridimensional, en el que los ejes
x, y, z son los componentes espectrales rojo, verde y azul.
La siguiente figura representa un modelo de color RGB normalizado a uno, en el que
cada componente R,G,B puede valer 0 1, obteniendo as 8 posibles colores.
Figura 4. Cubo RGB
El negro sera el origen del sistema de coordenadas(0,0,0).Todo lo contrario sera el
blanco (1, 1, 1).
Aquellos puntos que van del (0,0,0) al (1,1,1) estaran dentro de la diagonal principal y
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 13
formaran lo que se llama escala de grises niveles de grises. (Recordemos que el
objetivo final va a ser pasar de una imagen en color a una imagen en escala de grises).
El modelo descrito corresponde a un modelo RGB en el que cada componente puede
valer 0 1 (1 bit por canal), dando lugar a 8 posibles colores.
Se pueden obtener modelos con mas colores, como el de 24-bits, en el que cada
componente puede valer de 0 a 255 (8 bits por canal) y que da lugar a un nmero de
colores extensamente amplio.
Actualmente los monitores CRT, la mayora de video camaras a color y casi todos los
sistemas grficos por ordenador usan el modelo de color RGB, debido a que se
simplifica el diseo.
La pega a este modelo es que al tener tres colores, dificulta algunas operaciones sobre
imgenes como ecualizaciones de histograma. Por ello muchos algoritmos convierte
este modelo al modelo de color HSI (hue-saturation-intensity) en el que la componente
de color solo es una , hue .
Se puede decir que para un proceso u otro vendr mejor un sistema de color u otro
atendiendo a diferentes razones.
2.2.2 MODELO DE COLOR CMY
El modelo de color CMY, cada color aparece descompuesto en sus componentes
espectrales Cyan , Magenta y amarillo (Yellow), cuya combinacin produce el color
resultante.
El modelo de color CMY es un modelo complementario al RGB ya que cian, magenta,
y amarillo son los colores complementarios de rojo, verde y azul, respectivamente.
A diferencia de los colores de sistema RGB, los colores primarios de CMY Cyan ,
Magenta y Amarillo son conocidos como colores primarios substractivos, ya que estos
primarios son restados de la luz blanca para producir el color deseado.
Cyan absorve del color rojo, magenta del verde y amarillo del azul. Esto significa que
podemos incrementar el verde de una imagen decrementando el magenta
(complementario del verde), o incrementando el amarillo y el cyan.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 14
Figura 5. Colores CMY
Al ser RGB y CMY modelos de color complementario ser fcil la conversin entre
ambos, que viene dada por las formulas:
Convertir de RGB a CMY:
C = 1.0 R M = 1.0 - G
Y = 1.0 - B
Convertir CMY a RGB:
R = 1.0 - C
G = 1.0 - M
B = 1.0 - Y
Estas ecuaciones serian vlidas para un sistema de color normalizado, con sus valores
entre 0.0 y 1.0. En un modelo de color de 24-bit cyan vendra dado por C=255 - R.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 15
Figura 6. Modelos aditivo y substractivo
En el rea de la industria de impresin se usa el modelo CMY con una ligera variacin,
se le aade un cuarto color, el negro (k), denominndose sistema de color CMYK. Esta
componente negra (K) se aade en el proceso de impresin porque proporciona un color
negro ms puro que la combinacin de los otros tres colores del modelo,
proporcionando un mejor contraste. Adems este modelo tiene el aadido de que la tinta
negra es ms barata que la de color, por lo que interesa ms aadir una componte de
color negro, que producir esta mediante las tres componentes de color.
Las siguientes formulas indican cmo convertir de CMY a CMYK:
K = Min(C, M, Y)
C = C - K
M = M - K
Y = Y K
2.2.3 MODELO DE COLOR HSI
En este modelo, se separa la luminancia o intensidad (I) de la informacin del color,
descrita por los canales de tono o hue (H) y saturacin.
Hue (tono), Saturation (saturacin), Intensity (intensidad) son tres propiedades que se
usan para describir un color, de las cuales el tono y la saturacin responden
acertadamente a la forma en que los seres humanos perciben el color.
A diferencia del modelo de color RGB, ya no hace falta saber qu porcentaje de rojo,
verde o azul hace falta para obtener un color determinada, basta con ajustar el tono. Para
hacerlo ms claro o ms oscuro variamos la intensidad, y ajustando la saturacin
podremos pasar por ejemplo de un color rojo oscuro a un color rosa claro.
Aplicaciones de procesamiento de imgenes, como operaciones sobre histogramas,
transformaciones de intesidad y convolucin solo operan en la intensidad de la imagen,
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 16
por lo que estas operaciones son ms sencillas de realizar usando el modelo de color
HSI.
El tono (Hue) se representa como un ngulo, que varia de 0o a 360
o.
La saturacin (S) corresponde al radio, que varia de 0 a 1.
La intensidad (I) vara a lo largo del eje z desde 0 siendo negro a 1 siendo blanco.
Figura 7. Modelo HSI
Si S = 0, el color es un gris de intensidad 1. Si S = 1, el color est en el lmite de la base
superior del cono.
Ajustando el tono el color variar de rojo en 0o, verde en 120
o, azul en 240
o, y volver
a rojo a los 360o.
Cuando I = 0, el color es negro y por lo tanto H es indefinido. Cuando S = 0, el color
esta en escala de grises. H es tambin indefinido en este caso.
Ajustando la intensidad, I, un color se puede hacer ms oscuro o ms claro. Si
mantenemos S=1 y ajustamos I, se van creando matices de ese color.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 17
Las siguientes formulas muestran como convertir de RGB a HSI:
Si B es mayor que G, entonces H=360 - H
Las siguientes formulas muestran como convertir de HSI a RGB:
Dependiendo del sector de color en el que se encuentre H, la conversin vendr dada
por:
00 H 1200 (sector RG):
1200 H 2400 (sector GB):
2400 H 3600 (sector BR):
Estos valores r, g, b son valores normalizados de las componentes R, G, B. Adems
estas ecuaciones esperan los ngulos en grados.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 18
2.2.4 MODELO DE COLOR YCbCr
El modelo de color YCbCr separa la luminancia de la informacin de color. La
luminancia se codifica en la componente Y, y el grado de azul y de rojo se codifica en
las componentes Cb y Cr. respectivamente. Las siguientes formulas detallan como se
convierte de RGB a YCbCr y viceversa.
De RGB a YCbCr:
Y = 0.29900R + 0.58700G + 0.11400B
Cb = -0. 16874R - 0.33126G + 0.50000B
Cr = 0.50000R-0.41869G - 0.08131B
De YCbCr a RGB:
R = 1.00000Y + 1.40200Cr
G = 1.00000Y - 0.34414Cb - 0.71414Cr,
B = 1.00000Y + 1.77200Cb
Estas no son las nicas formas de convertir a/desde YCbCr. La mostrada aqu es la
recomendacin CCIR (International Radio Consultive Committee) 601-1 y es la que se
usa en la compresin de imgenes JPEG:
2.3. DE RGB A ESCALA DE GRISES
El modelo de color de escala de grises consiste en que cada pixel puede tener un valor,
denominado intensidad de gris, que va de 0 a 255. El valor cero se corresponde con el
negro y el 255 con el blanco.
Una conversin simple es usar la componente verde del modelo RGB como escala de grises, ya que el verde representa un componente grande en la escala
de grises. Es una conversin muy simple, pero no siempre produce los mejores
resultados.
Una conversin muy comn de RGB a escala de grises es una simple media: Gris = (R+G+B)/3 = 0.333R + 0.333G + 0.333B
Esta conversin es usada en muchas aplicaciones, como por ejemplo en la
conversin de modelo de color RGB a HSI.
Otra conversin una media ponderada: Gris = ( 3 * R + 4 * B + 2 * G ) / 9
La conversin que suele dar mejores resultados viene dado por la siguiente frmula:
Gris = 0.299R + 0.587G + 0.114B
Esta ecuacin es la ecuacin del estndar NTSC para la luminancia.
Entendemos luminancia como la suma ponderada de los 3 colores de luz
usados en la televisin a color y en monitores a color, que son rojo, verde y azul
(RGB). Una mayor luminancia indica un brillo ms intenso de luz en un sitio
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 19
dado de la pantalla. Los coeficientes que acompaan a las componentes R,G,B
reflejan la sensibilidad del ojo al brillo de esos colores primarios.
Por ltimo, segn la ITU-R, en su recomendacin BT. 709 (Recommendation BT.709, "Basic Parameter Values for the Studio and for International
Programme Exchange (1990) [formerly CCIR Rec. 709] ) tenemos:
Gris = 0.2125 * R + 0.7154 * G + 0.0721 * B
2.4. NEGATIVO DE UNA IMAGEN
El negativo de una imagen digital en escala de grises se obtiene aplicando la funcin:
g(x,y)= L - 1 - f(x,y)
donde L es el n de niveles de gris de la imagen.
Se trata de un procedimiento de inversin de la escala de grises. Es muy utilizado por
ejemplo, en imgenes mdicas.
Figura 8. Negativo de la imagen
La figura ilustra el empleo de esta sencilla transformacin (r y s indican los niveles de
gris de entrada y de salida respectivamente)
El negativo de una imagen tambin se puede aplicar a cualquiera de los canales RGB de
una imagen a color.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 20
2.5. ROTACIONES Y GIROS DE UNA IMAGEN
Se realiza girando el objeto alrededor de un eje, modificando as su orientacin en el
espacio.
Figura 9. Rotaciones y giros de la imagen
Para ello se utilizan tranformadas.
La rotacin de un punto un ngulo alrededor del eje de coordenadas Z se consigue con la transformacin:
El ngulo de rotacin se mide en el sentido de las agujas del reloj. Esta transformacin afecta nicamente a los valores de las coordenadas x e y.
La rotacin de un punto un ngulo sobre el eje X se consigue con la transformacin:
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 21
La rotacin de un punto un ngulo alrededor del eje Y se consigue con la transformacin:
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 22
2.6. MTODOS DE BINARIZACIN DE IMGENES ESTUDADOS
La segmentacin de un nivel o binarizacin es una conversin entre una imagen en
niveles de grises y una imagen monocroma (blanco y negro).
Dicha imagen monocroma debe contener toda la informacin esencial de la imagen en
niveles de grises. (mismo nmero de objetos, misma posicin y la misma forma de los
objetos).
Al tener solo dos colores (blanco y negro) la cantidad de informacin para representar la
imagen monocroma es mucho menor.
Para una mayor comodidad en este he estudio, he dividido estos mtodos en tres
apartados.
- Mtodos globales de binarizacin de imgenes
- Mtodos locales de binarizacin de imgenes
- Otros mtodos de binarizacin de imgenes
A continuacin se describe cada uno de estos apartados y los mtodos de binarizacin
estudiados en cada uno de ellos.
2.6.1 MTODOS GLOBALES DE BINARIZACIN DE IMGENES
Estos mtodos se basan en la idea de elegir un valor de umbral para toda la imagen.
Todos los pxeles de las imgenes en escala de grises con un valor menor se consideran
negros (0), y todos aquellos cuyo nivel de gris sea igual o superior se consideran
blancos (1).
El problema de la segmentacin es elegir ese valor de umbral.
Segn el nivel de gris de cada pxel, y el umbral elegido, cada pxel va a pertenecer a
una de los siguientes conjuntos:
* Conjunto de pxeles negros: Imagen(i,j) < T
* Conjunto de pxeles blancos: Imagen(i,j) >= T
Donde T es el valor de umbral elegido.
2.6.1.1. MTODO VALOR DE NIVEL DE GRIS MEDIO
El valor de umbral debe determinarse de los valores de los pxeles de la imagen.
En este mtodo en valor de umbral se determina de una medida del conjunto de
propiedades de la imagen.
Un simple ejemplo, no especialmente bueno, es usar el nivel medio de gris de la imagen
como valor de umbral. El efecto de esto es que casi la mitad de los pxeles sern
considerados como blancos, y los dems como negros. El algoritmo Nivel de Gris
Medio muestra este ejemplo.
Aunque se pudiese fijar dicho valor al 50% de pxeles negros, no sera una buena idea.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 23
Por ejemplo, en imgenes de texto escaneadas (imgenes que slo contienen texto) el
porcentaje de pxeles negros vara de un 8% a un 15%. Con un umbral que causase que
el 15% de pxeles fuesen negros ya se obtendran unos resultados con xitos.
2.6.1.2 MTODO DE PORCENTAJE DE PXELES NEGROS
Una forma fcil de encontrar este valor de umbral es usar el histograma de niveles de
grises de la imagen.
Dado un histograma, y un porcentaje de pxeles negros deseados, se determina el
nmero de pxeles negros multiplicando el porcentaje por el nmero total de pxeles.
A continuacin se cuentan el nmero de pxeles de cada nivel del histograma,
empezando por el nivel cero, hasta llegar al nmero de pxeles negros deseados.
El umbral ser el nivel de gris del histograma, en el que la cuenta llegue al nmero de
pxeles negros deseados.
Este mtodo es bastante antiguo y a veces es llamado p-tile.
2.6.1.3. MTODO DE LOS DOS PICOS
Una observacin practica de estos mtodos es que cuando se encuentra este valor, suele
aparecer en el punto bajo entre dos picos del histograma.
Si el histograma muestra dos picos, esta seleccin para valor de umbral puede ser la
buena.
El problema de seleccionar el umbral automticamente ahora consiste en:
Encontrar los dos picos.
Encontrar el punto bajo entre ellos.
Encontrar el primer pico es fcil (aquel que tenga el mayor valor). El segundo pico es
ms difcil de encontrar, ya que el segundo valor ms grande del histograma puede ser
el que est ms a la derecha del mayor, en vez de ser el segundo pico.
Una manera simple que suele funcionar para encontrar el segundo pico es multiplicar
los valores del histograma por el cuadrado de la distancia del primer pico. Esto da
preferencia a aquellos picos que no estn cercanos al mximo As si el pico ms alto
est al nivel j en el histograma, debemos seleccionar el segundo pico mediante la
frmula:
)}2550(|))max{(( 2 kkhfk
Donde h representa al histograma, y hay 256 niveles de gris, de 0 a 255.
La mejor manera de identificar los picos en el histograma es observar que resultan de
muchas observaciones de niveles de grises que aproximadamente son el mismo excepto
algunas perturbaciones (ruido). Si el ruido est normalmente distribuido, los picos del
histograma pueden aproximarse por curvas Gausianas. Dichas curvas pueden ajustarse
al histograma, y las dos mayores son usadas como los picos ms altos, el umbral debe
estar comprendido aqu. Esta proposicin es ms costosa y sin compromiso de un mejor
resultado.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 24
2.6.1.4. MTODO DE WESKA, 1984. (USANDO PXELES DE BORDE)
Un pxel de borde debe estar cercano al lmite entre un objeto y el fondo de la imagen, o
entre dos objetos, por ello se denomina pxel de borde. El resultado de esto es que el
valor de un pxel de borde puede ser bastante consistente, ya que muchas veces estarn
dentro del objeto y otras veces un poco fuera debido al contorno. El histograma de
estos pxeles ser mas regular que el histograma general de la imagen.
El mtodo buscar un umbral haciendo uso del Laplaciano digital hace uso de esta idea.
El Laplaciano digital es un operador de deteccin de borde no direccional.
Dicho valor de umbral se puede encontrar mediante el Laplaciano de la imagen de
entrada. Un mtodo simple para realizar este proceso es convolucionar la imagen de
entrada con la siguiente mscara:
0 1 0
1 -4 1
0 1 0
A partir de ahora el histograma de la imagen original se encuentra considerando solo
aquellos pxeles que tienen un valor grande de Laplaciano (se considera a partir del
85%).
Aquellos pxeles con un Lapaciano superior al 85% tendrn su nivel de gris apareciendo
en el histograma, mientras aquellos que no superen el 85% no lo tendrn.
Ahora el umbral es seleccionado usando el histograma as calculado.
El usar una mejor aproximacin del operador Laplaciano debera dar mejores
resultados, pero en algunos casos este procedimiento simple puede mostrar mejoras
sobre otros mtodos.
2.6.1.5. MTODO DE RIDLER,1978. (SELECCIN ITERATIVA)
La seleccin iterativa (Ridler 1978) es un proceso en el que la conjetura inicial sobre un
umbral es refinada a travs de consecutivo pasos por la imagen. Este no usa el
histograma, pero en cambio usa los umbrales de la imagen del objeto y clases de fondo
repetidamente, usando los niveles en cada clase para mejorar el umbral.
La conjetura inicial sobre el umbral es simplemente el nivel medio de gris. Este umbral
entonces es usado para recoger la estadstica de las regiones en blanco y negro
obtenidas; el nivel medio de gris para todo los pxeles debajo del umbral es encontrado
y llamado Tb, y el nivel medio de gris de los pxeles mayor o igual al umbral inicial es
llamado To. Ahora una estimacin nueva del umbral es calculada como (Tb + To)/2, o
el promedio de los niveles medios en cada clase de pxel, y el proceso es repetido
usando este umbral. Cuando ningn cambio del umbral es encontrado en dos,
consecutivas pasadas por la imagen, el proceso finaliza.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 25
2.6.1.6. MTODO DE THRUSSELL, 1979. (VARIANTE DE LA SELECCIN
ITERATIVA DE RIDLER)
El algoritmo de seleccin iterativa de Ridler est diseado para que funcione bien en
una implementacin hardware, en la que la estimacin inicial de un umbral asume que
las cuatro esquinas de la imagen corresponden a regiones de fondo y el resto de la
imagen es usado como una estimacin de los niveles grises de los objetos. Sin embargo,
en una implementacin software, el mismo umbral puede ser calculado utilizando el
histograma. Esto debera ser ms rpido, ya que el histograma es un array
unidimensional de pequeo tamao fijos.
Comenzando con la estimacin inicial del umbral To, la estimacin de k-sima del
umbral es (Thrussel 1979):
N
Tj
N
Tj
T
i
T
i
K
K
K
K
K
jh
jhj
ih
ihi
T
1
1
0
0
1
1
1
1
][2
][
][2
][
Donde h es el histograma de los niveles grises en la imagen.
De nuevo, cuando Tk = Tk+1, entonces Tk es el umbral apropiado.
2.6.1.7. MTODO DE OTSU, 1978. (HISTOGRAMAS DE NIVEL DE GRIS)
Los mtodos de obtencin de umbral que estn basados en seleccionar el punto bajo
entre dos picos de un histograma usan el concepto que los pxeles correspondientes a
objetos y pxeles correspondientes al fondo de la imagen tienen niveles medios
diferentes, y son nmeros aleatorios dibujados de una de dos distribuciones normales.
Estas distribuciones tambin tienen sus propias desviaciones estndar y varianzas,
donde la varianza es el cuadrado de la desviacin estndar.
Si hay dos grupos de pxeles en la imagen, entonces esto es una tarea simple calcular lal
general, o total la varianza de los valores de nivel grises en la imagen, denotado por 2
t .
Para cualquier valor t de umbral dado, tambin es posible calcular separadamente la
varianza de los pxeles de objeto y de los pxeles de fondo; estos representan los
valores de varianza dentro-de-clases, denotado por 2w .
Finalmente, la variacin de los valores medio para cada clase del total medio de todos
los pxeles define una varianza entre-clases, que ser denotada por 2b .
Esto es el principio de un mtodo estadstico llamado anlisis de varianza.
La cuestin importante es que un umbral ptimo puede ser encontrado reduciendo al
mnimo la proporcin de la varianza entre-clases de la varianza total:
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 26
2
2
)(t
bt
Esta frmula define el radio necesitado y el valor de t que da el valor ms pequeo para
, que ser el mejor umbral.
Como la varianza total 2t es fcil de calcular de la imagen, as como su valor medio
T . La varianza entre-clases es calculado por:
2
1010
2 )( b
Donde:
010
0 1
t
i
ip
Con ip siendo la probabilidad de nivel de gris i, o el valor de i en el histograma
dividido por el nmero total de pxeles. Tambin:
0
0
t
0
11
tT
t
i
it pi0
.
Todos estos valores son fciles de obtener del histograma de la imagen. El valor de t
que minimice (t) ser el valor de umbral ptimo.
2.6.1.8. MTODO DE KAPUR, 1985. (ENTROPA)
La entropa es una medida del contenido de la informacin. En trminos de la teora de
la informacin asumimos que hay n smbolos posibles x (por ejemplo, letras o dgitos) y
que el smbolo i ocurre con la probabilidad p ( ix ).
Entonces la entropa asociada con la fuente de los smbolos X es
))(log()()(1
i
n
i
i xpxpXH
Donde la entropa es medida en bits/smbolos.
Una imagen puede ser vista como una fuente de smbolos, o como niveles de grises. La
entropa asociada con los pxeles negro es (Pun, 1981):
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 27
)log(0
i
t
i
ib ppH
Donde la ip es la probabilidad de gris del nivel i. De forma parecida, la entropa de los
pxeles blancos es:
)log(255
1
i
ti
iw ppH
Para una imagen con niveles de 0 a 255. El algoritmo sugerido intenta encontrar el valor
de umbral t que maximiza:
wb HHH
En el cual Pun nos muestra que es lo mismo que maximizar:
}),...,log(max{
)1log(1
}),...,log(max{
log)(
2552110 PPP
P
H
H
PPP
P
H
Htf
tt
t
T
t
t
t
T
t
Donde:
i
t
i
it ppH log0
Es la entropa de los pxeles negros
i
i
iT ppH log255
0
Es la entropa total, y
t
i
it pP0
Es la probabilidad acumulativa hasta el nivel de gris t, o la probabilidad que un
pxel dado tenga un valor menor o igual que t. Estos tres factores pueden ser calculados
del histograma de nivel gris, con lo cual la ecuacin
i
i
iT ppH log255
0
no depende del valor de t.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 28
Una variacin sobre este tema (Kapur 1985) intenta definir una distribucin de
probabilidad de un objeto, A y una distribucin de fondo B de la siguiente manera:
t
t
tt p
p
p
p
p
pA ,...,,: 10
tt
t
t
t
p
p
p
p
p
pB
1,...,
1,
1: 25521
Ahora la entropa de pxeles en blanco y negro es calculada de un modo similar a
ecuaciones anteriores, que calculaban bH y wH , pero usando estas distribuciones
nuevas:
t
it
i t
ib
p
p
p
pH log
0
t
i
ti t
iw
p
p
p
pH
1log
1
255
1
El umbral ptimo es el valor de t que maximiza
wb HHH
Para encontrar este valor, todos los umbrales entre 0 y 255 son intentados, y el que da el
valor ms grande de H es escogido.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 29
2.6.1.9. MTODO DE JOHANNSEN,1982. (VARIANTE DE LA ENTROPA DE
KAPUR)
Esta variacin del mtodo de Kapur propone dividir los niveles de grises sobre dos
partes para a minimizar la interdependencia entre ellos (Johannsen 1982). Sin perseguir
esto en demasiado detalle, el mtodo asciende a la reduccin al mnimo de:
)()( tStS wb
Donde:
)()(1
)log()(1
00
0
t
i
it
t
it
i
i
ib pEpE
p
ptS
)()(1
)log()(255
1
255
255ti
it
ti
ti
i
iw pEpE
p
ptS
)log()( xxxE es la funcin de entropa.
Poniendo en prctica este algoritmo, el gran cuidado debe ser tomado para no
evaluar )(tSb y )(tSw para los valores de t donde
2.6.1.10. MTODO DE HUANG, 1995.(CONJUNTOS DIFUSOS)
En la teora normal de conjuntos, un elemento pertenece o no a un determinado
conjunto. En los conjuntos difusos (fuzzy) un elemento pertenece a un conjunto con una
determinad propiedad.
En este apartado, con objeto de encontrar un umbral para binarizar una imagen, vamos a
clasificar los pxeles como pertenecientes al conjunto de pxeles de fondo, o como
pertenecientes al conjunto de pxeles de objeto, y la aplicabilidad de los conjuntos
difusos a esta problemtica.
El mtodo descrito a continuacin usa una medida de difusidad, definida como distancia entre la imagen original en niveles de grises y la imagen binarizada mediante
el uso de un umbral. El objetivo se centra ahora en minimizar esa difusidad, ya que mientras menor sea, ms exacta ser la imagen binarizada de la original en niveles de
grises.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 30
Una buena funcin para definir la pertenencia (o probabilidad) de un pxel al conjunto
de pxeles de fondo o pxeles de objetos es la siguiente:
)(xux Cx /1
1
0 Si x1
Donde :
. C es una constante consistente en la diferencia entre el nivel de gris mximo y
el nivel de gris mnimo de la imagen.
. 0 es el nivel medio de gris del fondo de la imagen
. 1 es el nivel medio de gris de los pxeles de objetos de la imagen
. t es un cierto valor de umbral dado
Un pxel x pertenecer al conjunto de pxeles de fondo o al conjunto de pxeles de
objetos dependiendo de la relacin entre el nivel de gris de dicho pxel y el valor de
umbral t.
Para un pxel de objeto (x>t), el grado en el cual pertenece al conjunto de pxeles de
objeto est dado por )(xux , el cual debe ser un valor comprendido entre y 1.
Una medida de la difusidad est basada en la entropa de conjuntos difusos, que viene dada por la formula:
)())((1)( ghgHMN
tE xt
Donde tH (t) = - x log(x) (1-x) log (1-x) que es la frmula de Shannon.
Los niveles de grises son g, N y M son el nmero de filas y columnas, respectivamente,
y h es el histograma de niveles de grises de la imagen.
Donde el valor de E(t) sea mnimo, tendremos que t es el umbral apropiado que
minimiza la difusidad.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 31
2.6.1.11 . MTODO DE YAGGER, 1979. (CONJUNTOS DIFUSOS)
Otra medida de la difusidad est basada en la idea de que para un conjunto normal A no hay elementos en comn entre A y su complementario, en contraposicin con la
teora de conjuntos difusos, en los que cada elemento puede pertenecer a un conjunto A
o su complementario con ciertas probabilidades.
El grado en el cual A y su complementaria son no distintos es una medida de cmo de
difuso (fuzzy) es A.
Ello se puede calcular mediante la siguiente expresin:
pg xxp
ggtD/1
)()()(
Para niveles g, donde p es un nmero entero y )(1)( gg xx
El valor de p usado define una medida de la distancia, en nuestro caso usamos p=2 que
se corresponde con la distancia eucldea.
Para un valor de umbral t, tenemos los siguientes valores:
Estimacin de la media de pxeles de fondo
t
g
t
g
gh
ghg
t
0
0
0
)(
)(
)(
Estimacin de la media de pxeles objetos
254
1
254
1
1
)(
)(
)(
tg
tg
gh
ghg
t
Ahora todo lo necesitado para minimizar la difusidad est conocido, simplemente hay que probar los posibles valores de umbral t y seleccionar aquel que produzca el valor
mnimo de medida de difusidad.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 32
2.6.1.12. MTODO DE KITLER, 1986 (UMBRAL DE MNIMO ERROR)
El histograma de la imagen puede ser pensado como una funcin de densidad de
probabilidad de las dos distribuciones (pxeles objetos y pxeles de fondo). Estos son
generalmente, como ha sido hablado, pensados como distribuciones normales, entonces
el histograma es una aproximacin de :
22222121 2/
2
2/
1 2
1
2
1)(
gg eegp
Donde 1 y 1 1es la desviacin estndar y la media de una de las clases, y 2 y 2 son la desviacin estndar y la media de la otra.
Despus de tomar logaritmo en ambos lados y reorganizarla, conseguimos una ecuacin
cuadrtica que podra ser solucionada para g:
222
2
2
2112
1
2
1 log2log)(
log2log)(
Pg
Pg
Sin embargo, los valores de , y P no son conocidos, y ellos pueden ser estimados slo con alguna dificultad. En vez de esto, Kittler y Illingworth (Kittler 1986) crearon
una funcin de criterio nueva para ser minimizada:
)(log)()(log)(2)(log)()(log)(21)( 22112211 tPtPtPtPttPttPtJ
Usando frmulas que deberan parecernos familiares:
t
g
ghtp0
1 )()(
255
1
2 )()(tg
ghtp
)(
)(
)(1
0
1tp
ghg
t
t
g
)(
)(
)(2
255
1
2tp
ghg
ttg
)(
))()((
)(1
0
2
1
2
1tp
tggh
t
t
g
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 33
)(
))()((
)(2
255
1
2
2
2
2tp
tggh
ttg
El valor de t que minimiza la J (t) es el mejor umbral. Esto a menudo es mencionado
como mnimum error thresholding o umbral de mnimo error.
2.6.2 MTODOS LOCALES DE BINARIZACIN DE IMGENES Se calcula un umbral para cada pxel de la imagen en base a la informacin contenida en
su vecindario de pxeles, o sub-region de la imagen.
Cada uno sobre una sub-regin de la imagen. El mximo nmero de subregiones es el
mismo que el nmero de pxeles de la imagen.
Algunos mtodos calculan una superficie de binarizacin sobre la imagen completa. Si
un pxel p(x,y) en la imagen de entrada tuene un nivel de gris mayor que la superficie de
binarizacin en ese punto, entonces ese pxel es considerado como pxel de fondo,
blanco, en caso contrario se considerara como pxel de objeto, negro.
Otros mtodos no usan umbrales explicitos, sino que buscan pxeles pertenecientes a
objetos en una transformada de la imagen.
En definitiva, cada mtodo de los aqu presentes de una forma, pero la caracterstica que
los une es que el umbral en cada pxel se calcula en base a informacin de sus vecinos.
2.6.2.1. MTODO DE BERNSEN, 1986
Para cada pxel (x,y), se define el umbral
2/)(),( highlow zzyxT
Donde zlow y zhigh representan el valor de nivel de gris ms bajo y ms alto,
respectivamente, de una matrix de dimensiones r x r de pxeles vecinos centrada en el
punto (x,y).
Definimos la medida del contraste de un pixel como:
)(),( lowhigh zzyxC
Si )(),( lowhigh zzyxC , donde es un cierto
valor entero conocido, entonces el vecindario consiste solo en una clase, objeto o fondo
de imagen.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 34
En algunas imgenes, como las de mapas, grandes zonas de objetos raramente ocurren,
por lo que sus pxeles son etiquetados como fondo de imagen en dichos casos.
Resultados experimentales indican que tomando 15 y 15r se obtienen buenos resultados.
2.6.2.2. MTODO DE EIKVIL Y OTROS, 1991
Definimos una pequea ventana (matriz) de pxeles denominada S. Esta ventana est
incluida en otra mayor llamada L, que es concntrica sobre S.
El proceso consiste en deslizar las ventanas S y L a travs de la imagen en pasos igual al
tamao de S. La siguiente figura indica el sentido del movimiento:
Figura 10. Recorrido de Eikvil
Un ejemplo comn del tamao de las ventanas S y L es 3 x 3 pxeles para S y de 15 x
15 pxeles para L.
En cada paso, a todos los pxeles dentro de la ventana L se les calcula el mtodo de Otsu
para dividir los pxeles en dos grupos. Cualquier otro mtodo global puede reemplazar
al de Otsu, aunque ste da muy buenos resultados.
Si las estimaciones medias de los grupos son 1 y 2 estn ms alejadas que un lmite
especificado por el usuario 21 , los pxeles dentro de S son binarizados usando
el valor de umbral T (encontrado por el mtodo de Otsu).
Por el contrario, si se verifica que 21 todos los pxeles incluidos en S son
asignados a la clase con el valor medio actualizado ms cercano.
Un valor usado muy comn para es 15 .
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 35
2.6.2.3. MTODO DE MARDIA Y HAINSWORTH, 1988
Este mtodo en un primer momento realiza una binarizacin inicial, usando por ejemplo
un mtodo de binarizacin global como el mtodo de Otsu, para seguir con varios pasos
hasta alcanzar la convergencia.
El primero de estos pasos es calcular el valor medio i y el nmero de pxeles ni de las
dos regiones de la imagen binaria (objeto y fondo).
El siguiente paso es obtener un valor de umbral t* basado en estos valores, y para cada
pxel p(x,y) una media ponderada G de l y sus ocho vecinos es calculada.
Dado un pxel p(x,y), si cumple que G *t ser considerado como objeto(pxel negro) en caso contrario ser considerado como fondo.
2.6.2.4. MTODO DE NIBLACK, 1986
La idea de este mtodo es variar el umbral sobre la imagen, basndose en la media local
y en la desviacin estndar.
El umbral en el pxel p(x,y), T(x,y) es calculado como:
T(x,y) = m(x,y)+ k * s(x,y)
Donde m(x,y) es la media de la muestra y s(x,y) es la desviacin estndar, ambas de un
vecindario de pxeles centrados en el pxel (x,y).
El tamao de este vecindario de pxeles debera ser lo suficientemente pequeo para
preservar los detalles, y lo suficiente grande como para evitar el ruido.
El valor de k se usa para ajustar cuanto del lmite del total del objeto es tomado como
parte del mismo. Un valor de k = -0.2 ofrece a menudo una buena separacin entre
objetos.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 36
2.6.2.5. MTODO DE TAXT Y OTROS, 1989
En este mtodo, la imagen es dividida en ventanas no superpuestas de tamao 32 x 32
pxeles.
En cada ventana, el histograma es aproximado por una mezcla de dos distribuciones
Gausianas. Los parmetros de la mezcla son estimados usando un algoritmo
denominado Expectation-Maximization (EM). En cada ventana, los pxeles son clasificados mediante el clasificador cuadrtico de Bayes.
El algoritmo EM requiere valores iniciales para estimar las medias de las clases 1 , 2
y las varianzas de clases 21 , 2
2 , y el factor de peso de la mezcla .
Normalmente se usa un valor de = 0.5 . Los otros 4 parmetros 1 , 2 y 2
1 , 2
2
estimados suelen ser estimados de una agrupacin de 100 pxeles elegidos de forma
aleatoria.
El problema de este mtodo es que aparecen cambios bruscos en el borde de la ventana.
Se puede decir que el citado mtodo de Eikvil y otros es una mejora de ste, ya que:
Al usar dos ventanas evita estos cambios bruscos en el borde
El usar el mtodo de Otsu como una aproximacin del algoritmo EM supone una mejora de tiempo respecto as este
El mtodo de Taxt necesita una mayor ventana que el mtodo de Eikvil ya que hay que realizar la estimacin de cinco parmetros.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 37
2.6.2.6. MTODO DE YANOWITZ Y BRUCKSTEIN, 1989
Una superficie potencial que pasa sobre la imagen en los mximos locales del gradiente
es usada como superficie de binarizacin.
La magnitud del gradiente es calculada usando el operador de borde de Sobel, aunque
algunos autores como Jain y Dubuisson han usado el detector de bordes de Canny.
La imagen es binarizada y adelgazada con lneas de un pxel de anchura para identificar
los pxeles que forman el borde.
La imagen de entrada es suavizada mediante un filtro de media 3 x 3. La superficie
potencial se construye con un esquema de interpolacin iterativa con el objeto de
hacerla pasar sobre los pxeles de borde de la imagen.
Una interpolacin residual R(x,y) se calcula para cada pxel que no sea un pxel de
borde, y el nuevo valor del pxel P(x,y) en la iteracin n+1 se calcula como:
4
),(.),(),( 111
yxRyxPyxP nnn
),(4)1,()1,(),1(),1(),( yxPyxPyxPyxPyxPyxR nnnnnn
Las recomendaciones de Yanowitz y Bruckstein para el valor de es que permanezca
dentro del siguiente intervalo 0.20.1 para una rpida convergencia.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 38
2.6.2.7. MTODO DE WHITE Y ROHRER, 1983
Un promedio mvil parcial es usado como umbral para cada pxel p(x,y).
El promedio horizontal en el pxel p(x,y) viene dado por:
),1().1(),(.),( yxHfyxZfyxH
Donde:
Z(x,y) es la imagen de entrada
El factor de peso f es una funcin no linear de ),1(),( yxHyxZ , con 0
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 39
2.6.2.8. MTODO DE PARKER, 1991
Este mtodo inicialmente detecta bordes, y luego rellena el interior de objetos entre
bordes.
Para cada pxel p(x,y) en la imagen de entrada Z(x,y) se calcula:
)),(),((),(8..1 iii
yxZyxZyxD min
Donde:
p(xi,yi), con i variando de 1 a 8 son los 8 vecinos conectados del punto p(x,y)
De este modo se calcula el negativo del gradiente en la direccin del pxel vecino con
ms brillo (luminancia).
A continuacin se divide D en regiones de tamao r x r y para cada regin se calcula la
media de la muestra y la desviacin estndar. Ambos valores se suavizan y se interpolan
bilinearmente para dar lugar a las imgenes M y S, originadas respectivamente de los
valores de la media y la desviacin.
Entonces, para un pxel p(x,y) podemos considerar los siguientes casos:
Si 0),( myxM 0),( syxS el pxel es marcado como parte de una regin
lisa y permanecer no marcado.
Si ),(.),(),( yxSkyxMyxD entones el pxel p(x,y) pasa a ser marcado
como imprimible, pxel que va a pertenecer a un objeto.
En otro caso el pxel permanece como no marcado.
La imagen binaria resultante aparece con los bordes muy marcados.
Seguidamente se le realiza una agregacin de pxeles y pasos de crecimiento de la
regin para localizar las partes restantes de los objetos que van a ser imprimibles.
Los siguientes parmetros proporcionan resultados aceptables:
0.1,0.1,0.1,16 00 ksmr
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 40
2.6.3. OTROS MTODOS DE BINARIZACIN DE IMGENES En este apartado se estudian aquellos mtodos de binarizacin que por su naturaleza no
pueden ser considerados como globales ni como locales.
2.6.3.1. MTODO WELLNER, 1993
Este mtodo se basa en encontrar un umbral por pxel de una manera rpida, y da
segmentaciones sorprendentemente buenas. Se disea para imgenes que contienen
textos (por ejemplo: Textos Escaneados). En este caso la iluminacin puede ser buena,
como puede ser la calidad de una imagen en general.
Un promedio mvil es simplemente el significado del nivel de gris de los ltimos n
pxeles vistos. La imagen puede tratarse como un array mono-dimensional de pxeles,
que es comn en lenguajes de programacin (como C), y el promedio se calcula
exactamente o estimado por medio de:
Mi1 Mi
Min gi1
donde Mi+1 es la estimacin del promedio mvil para el pxel i+1 cuyo nivel gris es g i+1
y Mi es el promedio mvil anterior.
Cualquier pxel menor a un porcentaje fijo de su promedio mvil pertenece al conjunto
de pxeles negro; de otra manera al conjunto de blanco. Para evitar una predisposicin
para un de lado de la imagen sobre el otro.
Se cruzan pxeles en direcciones opuestas en cada lnea nueva. Esto es, el pxel
siguiente al ultimo de la fila i es el ltimo en la fila i+1, seguido por el penltimo de la
fila i+1, y as asta llegar al primer pxel de la fila i+1; este es seguido por el pxel que
de comienzo de la fila i+2. Esto evita la discontinuidad al final de la lnea que ocurre en
lenguajes de programacin como C al usar una estructura de array bidimensional.
El proceso comienza con una estimacin del promedio mvil; un valor de 127 x n se
selecciona como primer Mi, esto solo afectar los primeros pxeles en la imagen. El
valor de n usado es el nmero de columnas dividido por 8. Ahora la ecuacin de abajo
se usa para computar la estimacin del promedio mvil para el prximo pxel (el
primero), que se usa inmediatamente como un umbral.
Donde V es el valor que tomar el pxel y pct es el valor del porcentaje fijo; El valor
ms comn empleado para pct es 15, debido a que este da buenos resultados en general.
g i
M in
100pct
1000
si 255 en otro
caso
V
=
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 41
2.6.3.2. MTODO DE LOS UMBRALES POR REGIONES
Este mtodo aunque puede ser considerado como mtodo local, lo he puesto en este
apartado, ya que no pertenece a ningn autor, es un ejemplo que aparece como
introdcuccin a los mtodos locales en el libro de J.R. Parker.
Los umbrales regionales son determinados por las regiones que las requieren, y por
cmo son los tamaos de dichas regiones. Una vez que este terminado, puede que
previamente se discuta los algoritmos que deben ser usados para conseguir un umbral
para cada una de las regiones, dichos umbrales simplificarn la realizacin de los
clculos. El nmero de regiones pueden simplemente ser fijado, al decidir romper la
imagen original en M subimagenes.
Este mtodo calcula el umbral usando una seleccin iterativa de 21 x 21 regiones
centrado en cada pxel. El umbral encontrado en cada regin ser usado solamente
como umbral del pxel que est en el centro, consiguiendo un umbral por cada pxel. Por
supuesto, habr 10 pxeles por el margen exterior y por alrededor de la imagen que no
conseguir calcular el umbral, pero que ser fijado posteriormente.
Esto es lo menos que puede ser esperado, pero hay una explicacin simple. El
algoritmo de clculo de umbral aplicado a cada regin intenta dividir los pxeles en dos
grupos, objetos y fondos, igualados cuanto la regin no contenga ejemplos de ambas
clases. Cuando la regin consiste solo en pxeles de fondo el algoritmo intenta tambin
resistirse, y crea dos clases donde solo uno es verdadero. Por consiguiente esto es
necesario, cuando se usa los mtodos regionales, seguramente al construir cualquiera de
cada una de las regiones contienen un ejemplo de ambos pxeles, tanto de objetos como
de fondos, o no se intenta calcular el umbral cuando solo existe una clase de pxel.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 42
2.7. COMPONENTES CONEXAS DE UNA IMAGEN
Definicin: Una componente conexa es un conjunto de pxeles tal que para cualquier
par de pxeles del conjunto, existe un camino digital que los une.
Recordatorio: 4-Adyacencia
Si un pxel se encuentra en posicin (x,y), recordemos que sus vecinos pueden ser:
Figura 11. 4-Adyacencia
Para el caso de 8-Adyacencia, adems de estos, tambin son vecinos los (x-1,y-1),
(x+1,y-1), C(x-1,y+1) y D(x+1,y+1).
2.7.1 ALGORITMO PARA EL ETIQUETADO DE COMPONENTES CONEXAS
El siguiente algoritmo es uno de los posibles para realizar esta funcin. A continuacin
lo describo como se hace en la teora de la asignatura Procesamiento de Imgenes Digitales de 5 de Ingeniera Informtica de la Universidad de Sevilla.
Recorremos la imagen de izquierda a derecha y de arriba a abajo.
Durante el primer rastreo, para cada punto que tenga valor 1, examinamos a los
vecinos de arriba y a mano izquierda de P; ntese que si existen, acaban de ser
visitados por el rastreo, as que si son 1s, ya han sido etiquetados.
Si ambos son 0s, damos a P una nueva etiqueta;
si tan slo uno es 0, le damos a P la etiqueta del otro;
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 43
y si ninguno es 0s, le damos a P (por ejemplo) la etiqueta del de la izquierda, y
si sus etiquetas son diferentes, registramos el hecho de que son equivalentes,
i.e., pertenecen a la misma componente.
Cuando se completa este rastreo, cada 1 tiene una etiqueta, pero puede que se asignen
muchas etiquetas diferentes a puntos en el mismo componente. Ahora ordenamos las
parejas equivalentes en clases de equivalencia, y escogemos una etiqueta para
representar cada clase. Finalmente, realizamos un segundo rastreo de la imagen y
sustituimos cada etiqueta por el representante de cada clase; cada componente ha sido
ahora etiquetada de forma nica.
Si consideramos al 8-adyacencia para negro, para cada pxel P(x,y) en negro,
examinamos los pxeles superiores A(x+1,y-1), B(x,y-1), C(x-1,y-1) y D(x-1,y).
Si todos sus vecinos son blancos, damos al actual pxel una etiqueta nueva.
En otro caso, si uno de sus vecinos es negro, al pxel P le damos la misma
etiqueta que la del pxel negro.
Si dos o ms pxeles son negros, le damos a P una de las etiquetas y anotamos
que dichas etiquetas son equivalentes.
El proceso de equivalencia y re-etiquetado se realiza como en el caso de 4-adyacencia.
En la pgina web de la asignatura citada ( http://www.us.es/gtocoma/pid/ ), se detalla
este algoritmo con un ejemplo prctico.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 44
2.7.2 COMPONENTES CONEXAS DE N PXELES, Ns(T)
Definicin: Ns(t) es el nmero de componentes conexas con un tamao de al menos s
pxeles en una imagen binarizada con umbral t.
Como umbral, t debe estar comprendido en el intervalo [0, 255].
s se suele tomar de un conjunto de valores de resoluciones R.
Esta definicin es importante, ya que permite obtener caractersticas de la imagen .
Un ejemplo de esto es la granularidad, muy usado en el para imgenes que representan
texturas.
Segn esta caracterstica, una imagen se considerar:
Muy granulosa: Si el nmero de componentes conexas cambia rpidamente cuando tomamos valores umbrales cercanos.
Poco granulosa: Si el nmero de componentes conexas no vara al ir cogiendo distintos valores umbrales cercanos.
Con esto vemos que gracias al estudio de las componentes conexas de N pxeles
podemos obtener un enfoque para caracterizar. En el ejemplo anterior se caracterizaban
imgenes que representan texturas.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 45
2.8. VALORES ESTADSTICOS DE UNA IMAGEN EN BLANCO Y NEGRO
La media de una serie estadstica nos proporciona una idea de sus caractersticas, pero
esta informacin es insuficiente. Por ejemplo, una imagen puede tener una determinada
media de pxeles negros pero desigualmente distribuida, con algunas zonas con muchos
pxeles negros, y otras con apenas alguno. De estas observaciones, surge la necesidad de
utilizar las medidas de dispersin, las ms importantes son la desviacin media y la
desviacin cuadrtica media o desviacin estndar.
Definicin: Media aritmtica
Una de las medidas que caracterizan a una distribucin es la media aritmtica, que se
obtiene sumando los valores xi introducidos, y dividiendo entre el nmero total N..
La media de pxeles negros de una imagen en blanco y negro, se obtendra de la
siguente forma:
MN
jipV
x
M
i
N
j
n*
)),((1 1
, siendo N*M las dimensiones de la imagen,
V(p(i,j)) = 1 si p(i,j) representa a un pxel negro y
V(p(i,j)) = 0 si p(i,j) representa a un pxel blanco.
La media de pxeles blancos de una imagen en blanco y negro, se obtendra de la
siguente forma:
MN
jipV
x
M
i
N
j
n*
)),((1 1
, siendo N*M las dimensiones de la imagen,
p(i,j) = 1 si p(i,j) representa a un pxel blanco y
p(i,j) = 0 si p(i,j) representa a un pxel negro.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 46
Medidas de dispersin
Se denomina desviacin, a la diferencia entre un valor y la media aritmtica de la serie
estadstica, di=xi-. La desviacin media es la media aritmtica de los valores
absolutos de todas las desviaciones. Su frmula es
La desviacin media de pxeles negros de una imagen en blanco y negro, se obtendra
de la siguente forma:
MN
pnMediajipV
x
M
i
N
j
n*
_)),((1 1
, siendo N*M las dimensiones de la imagen,
V(p(i,j)) = 1 si p(i,j) representa a un pxel negro y
V(p(i,j)) = 0 si p(i,j) representa a un pxel blanco.
La desviacin media de pxeles blancos de una imagen en blanco y negro, se obtendra
de la siguente forma:
MN
pbMediajipV
x
M
i
N
j
n*
_)),((1 1
, siendo N*M las dimensiones de la imagen,
p(i,j) = 1 si p(i,j) representa a un pxel blanco y
p(i,j) = 0 si p(i,j) representa a un pxel negro.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 47
La desviacin cuadrtica media es la raz cuadrada de la varianza, es decir, de la media
aritmtica de los cuadrados de las desviaciones respecto a la media.
Podemos obtener la varianza de pxeles negros y pxeles blanco a para una imagen a
partir de esta expresin.
La varianza de pxeles negros de una imagen en blanco y negro, se obtendra de la
siguente forma:
MN
pnMediajipV
x
M
i
N
j
n*
_)),((1 1
2
, siendo N*M las dimensiones de la
imagen,
V(p(i,j)) = 1 si p(i,j) representa a un pxel negro y
V(p(i,j)) = 0 si p(i,j) representa a un pxel blanco.
La desviacin media de pxeles blancos de una imagen en blanco y negro, se obtendra
de la siguente forma:
MN
pbMediajipV
x
M
i
N
j
n*
_)),((1 1
2
, siendo N*M las dimensiones de la
imagen,
p(i,j) = 1 si p(i,j) representa a un pxel blanco y
p(i,j) = 0 si p(i,j) representa a un pxel negro.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 48
3. ANLISIS TEMPORAL Y DE COSTES DE DESARROLLO 3.1. CUADERNO DE TIEMPO SEMANAL
Semana
T.
Total
T.
Interr
T.
Activo
T.
Tutora
T.
Desarr.
T.
Investig.
T.
Memoria
Descripcin Tareas
Realizadas
28 Marzo
03 Abril
1:00 0:00 0:00 1:00 0:00 0:00 0:00 Adjudicacin del
proyecto fin de carrera
04 Abril 10 Abril
12:00 2:00 10:00 0:00 10:00 0:00 0:00 Operaciones con
imgenes en .NET
11 Abril 17 Abril
11:00 1:00 10:00 0:00 5:00 0:00 5:00 Modelos de color, de
color a grises
18 Abril 24 Abril
10:00 0:00 10:00 0:00 5:00 0:00 5:00 Modelos de color, de
color a grises
25 Abril 01 Mayo
7:00 0:00 7:00 0:00 0:00 7:00 0:00 Bsqueda de
informacin
02 Mayo 08 Mayo
16:00 3:00 13:00 1:00 10:00 2:00 0:00 Clases implementacin,
09 Mayo 15 Mayo
14:45 3:00 11:45 0:00 10:00 1:45 0:00 Clases
implementacin,Mtod
os Globales
16 Mayo 21 Mayo
13:15 00:15 13:00 0:00 12:00 1:00 0:00 Mtodos Globales,
Busqueda de
informacin
23 Mayo 29 Mayo
16:00 0:00 16:00 0:00 10:00 6:00 0:00 Mtodos Globales
30 Mayo 05 Junio
16:00 1:00 15:00 0:00 10:00 5:00 0:00 Mtodos Globales,
busqueda de
informacin
06 Junio 12 Junio
15:30 1:30 14:00 0:00 14:00 0:00 0:00 Mtodos Globales
13 Junio 18 Junio
11:30 0:30 11:00 0:00 11:00 0:00 0:00 Otros Mtodos
19 Junio 26 Junio
12:00 0:00 12:00 0:00 12:00 0:00 0:00
Mtodos Globales
27 Junio 03 Julio
4:00 0:00 4:00 1:00 0:00 3:00 0:00 Operaciones sobre
imgenes
04 Julio 10 Julio
17:45 1:30 16:15 0:00 12:00 00:45 3:30 Mtodos locales,
Memoria, Estudio
terico
11 Julio 17 Julio
18:00 0:30 17:30 0:00 15:00 0:00 2:30 Mtodos locales,
Estudio terico
18 Julio 24 Julio
17:15 1:00 16:15 0:00 10:15 1:00 5:00 Mtodos locales,
Estudio terico
25 Julio 30 Julio
17:00 2:00 15:00 0:00 6:00 0:00 9:00
Mtodos locales,
Estudio terico
01 Agost
07 Agost
24:00 0:00 24:00 1:00 21:00 0:00 2:00 Manual Usuario,
interfaz grafica
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 49
08 Agost
14 Agost
23:00 2:00 21:00 0:00 15:00 0:00 6:00 Manual Usuario,
interfaz grafica
15 Agost
21 Agost
20:00 0:00 20:00 0:00 6:00 0:00 14:00 Manual Usuario,
interfaz grafica
22 Agost
28 Agost
15:00 0:00 15:00 0:00 4:00 0:00 11:00 Manual Usuario,
interfaz grafica
29 Agost
04 Sept
12:30 0:00 12:30 1:30 4:00 0:00 7:00 Componentes conexas,
estadsticas
05 Sept 11 Sept
11:00 0:00 11:00 0:00 1:00 0:00 10:00 Memoria
12 Agost
18 Sept
16:30 0:00 16:30 0:00 1:30 0:00 15:00 Memoria
3.2. CUADERNO DE TIEMPO MENSUAL
Mes
T.
Total
T.
Interr
T.
Activo
T.
Tutora
T.
Desarr.
T.
Investig.
T.
Memoria
Marzo 1:00 0:00 1:00 1:00 0:00 0:00 0:00
Abril 40:00 3:00 37:00 0:00 20:00 7:00 10:00
Mayo 60:00 6:15 53:45 1:00 42:00 10:45 0:00
Junio 55:00 3:00 52:00 0:00 47:00 5:00 0:00
Julio 74:00 5:00 69:00 1:00 43:15 4:45 20:00
Agosto 82:00 2:00 80:00 1:00 46:00 0:00 33:00
Septiembre 40:00 0:00 40:00 1:30 6:30 0:00 32:00
3.3. CUADERNO DE TIEMPO TOTAL
Total
T.
Total
T.
Interr
T.
Activo
T.
Tutora
T.
Desarr.
T.
Investig.
T.
Memoria
352 19:15 332:45 5:30 204:45 27:30 95
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 50
4. ANLISIS DE REQUISITOS, DISEO E IMPLEMENTACIN
4.1. ANLISIS DE REQUISITOS
4.1.1 INTRODUCCIN
Todos los requisitos funcionales y no funcionales especificados en esta memoria han
sido resueltos en la aplicacin.
4.1.2 REQUISITOS FUNCIONALES
El posible cliente de la aplicacin necesitar que se cumplan los siguientes requisitos.
Aplicacin didctica: La aplicacin no slo debe ser efectiva sino adems didctica. Presentar toda la
informacin terica y de ayuda al usuario en todas las fases.
Aplicacin directa: Aparte de la cuestin de que debe ser didctica debe presentar una opcin que
permita al cliente ejecutar la aplicacin directamente sin pasos previos. Debe tenerse en
cuenta que el usuario puede ser inexperto as pues este apartado debe ser lo ms sencillo
posible. La interaccin del usuario con la aplicacin debe ser muy sencilla, es decir, el
usuario no debe tener que especificar parmetros engorrosos y cada parmetro deber
estar perfectamente descrito.
Presentacin de solucin: La solucin debe ser lo ms clara posible. En caso de que cualquier operacin no
haya sido correcta debe comunicarlo con un mensaje
Uso del programa por cliente experto: Un cliente que se halla ledo el manual del usuario tiene la posibilidad de cambiar
los diferentes parmetros que modificarn el comportamiento de la aplicacin,
mejorando su efectividad.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 51
4.1.3 REQUISITOS NO FUNCIONALES
Coste computacional Adems las caractersticas deben contar con otros requerimientos como son que
tengan un bajo gasto computacional, tanto en tiempo como en complejidad. Debido a
estos motivos es muy difcil conseguir unas caractersticas ptimas.
Modulacin: La aplicacin debe estar estructurada modularmente ya que debe permitir la
incorporacin de nuevos mdulos que extienda su utilizar o su eficiencia. La aplicacin
estar estructurada en formularios. Cada formulario tendr asociado una o ms clases y
cada una de las clases podrn delegar en otras clases para realizar su cometido.
Encapsulacin: La aplicacin estar perfectamente encapsulada de tal forma que sea fcil su
instalacin. La aplicacin se instalar bajo en directorio que el propio usuario elegir en
el proceso de instalacin.
Posibilidad de ampliacin Al estar perfectamente modulada, la aplicacin permitir ampliacin simplemente
aadiendo nuevos mdulos. Las posibles ampliaciones pueden estar dirigidas a nuevos
mdulos que implementen otros algoritmos matemticos para la binarizacin de
imgenes en escalas de grises.
ROI Esta aplicacin generar un buen ROI (retorno de inversin). En este caso, al ser un
Proyecto informtico no est orientado para el comercio. Pero siempre cabe la
posibilidad de un retorno de inversin tecnolgico que permita agrandar la herramienta.
Cabe tambin la posibilidad de un retorno de inversin financiero una vez que la
herramienta est ms desarrollada y apetecible para el usuario, ya que hay que recordar que esta versin es una beta destinada al aprendizaje de los mtodos de
binarizacin existentes.
Usabilidad Tiene que ser de fcil uso para el cliente. Tiene la posibilidad de dos alternativas
distintas.
Cliente inexperto: no tiene por que manejar los distintos factores que modifiquen
algunos de los mtodos implementados, dejando los valores por defecto de dichos
mtodos, que suelen dar buenos resultados.
Cliente experto: Una vez ledo el manual del usuario y con conocimientos sobre
tratamientos de imgenes, el cliente tiene la capacidad de modificar los distintos
factores que permitan una binarizacin de la imagen con todo el detalle que desee.
Integridad: La aplicacin, al basarse en tecnologa .NET presenta una gran integridad y
facilidad de instalacin. Simplemente deber ejecutarse el instalador para poder instalar
la aplicacin en el directorio elegido. Ser necesario instalar previamente el framework
de .NET antes de realizar la instalacin si no se encuentra en el sistema.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 52
Portabilidad: Estos requisitos definen qu caractersticas deber tener el software para que sea
fcil utilizarlo en otra mquina o bajo otros sistemas operativos.
En este caso puede funcionar bajo los siguientes sistemas operativos:
a. Windows 2000
b. Windows 2003
c. Windows XP
Fiabilidad: Estos requisitos deben establecer los factores que se requieren para la fiabilidad del
software en tiempo de explotacin.
Mide la probabilidad del sistema de producir una respuesta satisfactoria a las demandas
del usuario.
La tasa de fallos de la aplicacin no podr ser superior a 2 fallos por cada 500 imgenes
tratadas.
Eficiencia: Los tratamientos de imgenes deben ser lo ms rpido posible en tiempo de
ejecucin y con el menor de errores. La eficiencia de las operaciones de binarizacin de
una imagen en escala de grises est sujeta al mtodo de binarizacin elegido.
Para los dems algoritmos de la aplicacin, aquellos tratamientos de imgenes que
no pertenecen a un mtodo de un autor, se han escogidos los ms eficientes posibles
tanto en rapidez, esfuerzo y efectividad.
Fcil mantenimiento La modulacin del proyecto permite un fcil mantenimiento por parte de una
persona ajena a la construccin del mismo. Todas las funciones estn perfectamente
detalladas y el cdigo fuente tambin contiene breves explicaciones que harn ms fcil
el mantenimiento.
Facilidad de prueba: La aplicacin es fcilmente sometible a pruebas por parte de un usuario debido a su
alta interactividad con el mismo. El poder trabajar con mltiples imgenes al mismo
tiempo facilita mucho la aplicacin de pruebas con todo tipo de imgenes y la
comparacin de resultados.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 53
4.1.4 OTROS REQUISITOS
Requisitos de interfaz de usuario Este tipo de requisitos especifica las caractersticas que deber tener el sistema en
su comunicacin con el usuario.
En la aplicacin lo nico que se pide es que sea sencilla para el manejo del usuario y
genere resultados correctos. Adems la interfaz de la aplicacin debe ser del tipo MDI
(Multiple Document Interface) para permitir poder trabajar simultneamente con varios
documentos.
Estos requisitos deben establecer los factores que se requieren para la fiabilidad del
software en tiempo de explotacin.
Mide la probabilidad del sistema de producir una respuesta satisfactoria a la
demanda del usuario.
La tasa de fallos de la aplicacin no podr ser superior a 2 fallos por cada 500 imgenes
tratadas.
Requisitos de entorno de desarrollo Este tipo de requisitos especifican si el sistema debe desarrollarse con un producto
especfico.
En el caso de la aplicacin necesito en entorno Visual Studio .Net 2.0 o superior.
Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris
Jos Manuel Delgado Romero 54
4.2. DISEO
4.2.1 OBJETIVOS DEL DISEO
La idea a la hora de disear la aplicacin es bien simple, partir de una imagen a color y
convertirla en una imagen en blanco y negro.
partimos de una imagen en color, a la que se le puede hacer un preprocesamiento y
seguir siendo una imagen a color o bien haberse convertido en una imagen en escala de
grises tras haberle aplicado el procesamiento adecuado.
Una vez estamos trabajando con una imagen en escala de grises, a esta se le pueden
seguir efectuando operaciones (seguir llamndolas preprocesamiento) mantenindose
como imagen en escala de grises, o bien realizarle un proceso de binarizacin con lo
cual la imagen se convertira en una imagen en blanco y negro.
Con la imagen en blanco y negro, que es nuestro objetivo, podremos realizar ciertas
operaciones, que llamaremos operaciones de postprocesamiento.
La siguiente figura explica este proceso vindo