Binarización de Imágenes

Embed Size (px)

DESCRIPTION

Muestra como convertir una imagen comprimida en datos binarios

Citation preview

  • ESCUELA TCNICA SUPERIOR DE INGENIERA INFORMTICA

    INGENIERA SUPERIOR EN INFORMTICA

    MTODOS DE BINARIZACIN DE IMGENES EN NIVELES DE GRIS

    Realizado por JOS MANUEL DELGADO ROMERO

    Dirigido por PEDRO REAL JURADO

    Departamento

    MATEMTICA APLICADA I

    Sevilla, Septiembre de 2005

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 2

    0. INDICE INDICE GENERAL 1. DEFINICIN DE OBJETIVOS, 6

    1.1. BREVE EXPLICACIN DEL PROYECTO FIN DE CARRERA, 6

    1.2. JUSTIFICACIN DEL TRABAJO, 8

    2. ESTUDIO TERICO, 10

    2.1. CONCEPTOS PREVIOS SOBRE EL COLOR, 10

    2.2. MODELOS DE COLOR, 12

    2.2.1 MODELO DE COLOR RGB, 12

    2.2.2 MODELO DE COLOR CMY, 13

    2.2.3 MODELO DE COLOR HSI, 15

    2.2.4 MODELO DE COLOR YCbCr,, 18

    2.3. DE RGB A ESCALA DE GRISES, 18

    2.4. NEGATIVO DE UNA IMAGEN, 19

    2.5. ROTACIONES Y GIROS DE UNA IMAGEN, 20

    2.6. MTODOS DE BINARIZACIN DE IMGENES ESTUDIADOS, 22

    2.6.1 MTODOS GLOBALES DE BINARIZACIN DE IMGENES, 22

    2.6.1.1. MTODO VALOR DE NIVEL DE GRIS MEDIO, 22

    2.6.1.2 MTODO DE PORCENTAJE DE PXELES NEGROS, 23

    2.6.1.3. MTODO DE LOS DOS PICOS, 23

    2.6.1.4. MTODO DE WESKA, 24

    2.6.1.5. MTODO DE RIDLER, 24

    2.6.1.6. MTODO DE THRUSSELL, 25

    2.6.1.7. MTODO DE OTSU, 25

    2.6.1.8. MTODO DE KAPUR, 26

    2.6.1.9. MTODO DE JOHANNSEN, 29

    2.6.1.10. MTODO DE HUANG, 29

    2.6.1.11. MTODO DE YAGGER, 31

    2.6.1.12. MTODO DE KITLER, 32

    2.6.2 MTODOS GLOBALES DE BINARIZACIN DE IMGENES, 33

    2.6.2.1. MTODO DE BERNSEN, 33

    2.6.2.2. MTODO DE EIKVIL Y OTROS, 34

    2.6.2.3. MTODO DE MARDIA Y HAINSWORTH, 35

    2.6.2.4. MTODO DE NIBLACK, 35

    2.6.2.5. MTODO DE TAXT Y OTROS, 36

    2.6.2.6. MTODO DE YANOWITZ Y BRUCKSTEIN, 37

    2.6.2.7. MTODO DE WHITE Y ROHRER, 38

    2.6.2.8. MTODO DE PARKER, 39

    2.6.3. OTROS MTODOS DE BINARIZACIN DE IMGENES, 40

    2.6.3.1. MTODO WELLNER, 40

    2.6.3.2. MTODO DE LOS UMBRALES POR REGIONES, 41

    2.7. COMPONENTES CONEXAS DE UNA IMAGEN, 42

    2.7.1 ALGORITMO PARA EL ETIQUETADO DE COMPONENTES CONEXAS, 42

    2.7.2 COMPONENTES CONEXAS DE N PXELES, 44

    2.8. VALORES ESTADSTICOS DE UNA IMAGEN EN BLANCO Y NEGRO, 45

    3. ANLISIS TEMPORAL Y DE COSTES DE DESARROLLO, 48

    3.1. CUADERNO DE TIEMPO SEMANAL, 48

    3.2. CUADERNO DE TIEMPO MENSUAL, 49

    3.3. CUADERNOS DE TIEMPO TOTAL, 49

    4. ANLISIS DE REQUISITOS, DISEO E IMPLEMENTACIN, 50

    4.1. ANLISIS DE REQUISITOS, 50

    4.1.1 INTRODUCCIN, 50

    4.1.2 REQUISITOS FUNCIONALES, 50

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 3

    4.1.3 REQUISITOS NO FUNCIONALES, 51

    4.1.4 OTROS REQUISITOS, 53

    4.2. DISEO, 54

    4.2.1 OBJETIVOS DEL DISEO, 54

    4.2.2 PREPROCESAMIENTO, 55

    4.2.3 BINARIZACIN, 55

    4.2.4. POSTPROCESAMIENTO, 56

    4.2.5. EXTENDER LA FUNCIONALIDAD DE LA APLICACIN, 57

    4.3.1. DISEO TECNOLGICO, 59

    4.3.2. CLASES Y TIPOS DE DATOS UTILIZADOS, 60

    4.3.3. DETALLES DE IMPLEMENTACIN, 68

    4.3.3.1 CONVERTIR UNA IMAGEN EN COLOR A ESCALA DE GRISES, 68

    4.3.3.2 BINARIZAR GLOBALMENTE UNA IMAGEN EN ESCALA DE GRISES, 69

    4.3.3.3. BINARIZAR LOCALMENTE UNA IMAGEN EN ESCALA DE GRISES, 70

    4.3.3.4 OPERACIN LGICA XOR ENTRE DOS IMGENES BINARIAS, 73

    5. MANUAL DE USUARIO, 76

    5.1. INTRODUCCIN DE LA APLICACIN, 76

    5.2. INSTALACIN DEL PROGRAMA, 76

    5.3. PANTALLAS, VENTANAS Y OPERACIONES DE LA APLICACIN, 77

    5.3.1 PANTALLA PRINCIPAL, 77

    5.3.2 VENTANA NEGATIVO DE LA IMAGEN, 80

    5.3.3 VENTANA CONVERTIR A ESCALA DE GRISES, 82

    5.3.4 OPERACIN SEPARAR CANALES DE COLOR RGB, 84

    5.3.5 VENTANA BALANCE DE COLOR, 85

    5.3.6 VENTANA OPERACIN AND, 86

    5.3.7 VENTANA OPERACIN OR, 87

    5.3.8 VENTANA OPERACIN XOR, 88

    5.3.9 VENTANA CONFIGURACIN DE INTERVALOS, 89

    5.3.10 VENTANA DE BINARIZACIN GLOBAL, 91

    5.3.10.1. METODO GLOBAL DEL NIVEL DE GRIS MEDIO, 94

    5.3.10.2 METODO GLOBAL DEL PORCENTAJE, 96

    5.3.10.3 METODO GLOBAL DE LOS DOS PICOS, 98

    5.3.10.4 METODO GLOBAL HUANG, 100

    5.3.10.5 METODO GLOBAL DE YAGGER, 102

    5.3.10.6 METODO GLOBAL DE KITLER, 104

    5.3.10.7 METODO GLOBAL DE OTSU, 106

    5.3.10.8 METODO GLOBAL DE RIDDLER, 108

    5.3.10.9 METODO GLOBAL DE THRUSSELL, 110

    5.3.10.10 METODO GLOBAL DE WESKA, 112

    5.3.10.11 METODO GLOBAL DE JOHANNSEN, 114

    5.3.11 VENTANA DE BINARIZACIN LOCAL, 116

    5.3.11.1 METODO LOCA DE BERNSEN, 118

    5.3.11.2 METODO LOCAL DE EIKVIL, TAXT & MOEN, 120

    5.3.11.3 METODO LOCAL DE MARDIA & HAINSWORTH, 122

    5.3.11.4 METODO LOCAL DE NIBLACK, 124

    5.3.11.5 METODO LOCAL DE TAXT, FLYNN & JAIN, 126

    5.3.11.6 METODO LOCAL: YANOWITZ & BRUCKSTEIN, 127

    5.3.11.7 METODO LOCAL DE WHITE & ROHRER, 129

    5.3.11.8 METODO LOCAL DE PARKER, 130

    5.3.12 VENTANA DE BINARIZACIN CON OTROS MTODOS, 132

    5.3.12.1 METODO DE WELLNER, 133

    5.3.12.2 METODO DE UMBRALES POR REGIONES, 135

    6. PRUEBAS, 136

    6.1. FORMATO DE LAS IMGENES, 136

    6.2. TAMAO DE LAS IMGENES, 136

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 4

    6.3. MTODOS DE BINARIZACIN, 136

    7. EVALUACIN DE OTRAS ALTERNATIVAS, 137

    8. CONCLUSIONES, 138

    8.1. CONCLUSIONES DE CARCTER GENERAL, 138

    8.2. APORTACIN PERSONAL DEL PROYECTO, 138

    9. BIBLIOGRAFA, 139

    9.1. REFERENCIAS BIBLIOGRFICAS, 139

    9.2. REFERENCIAS DE DIRECCIONES ELECTRNICAS, 140

    LISTA DE FIGURAS

    FIGURA 1. INTRODUCCIN AL PROCESO DE BINARIZACIN DE IMGENES,

    7

    FIGURA 2. ESPECTRO DE COLORES, 10

    FIGURA 3. ESPECTRO DE ONDAS VISTA POR EL HOMBRE, 11

    FIGURA 4. CUBO RGB, 12

    FIGURA 5. COLORES CMY, 14

    FIGURA 6. MODELOS ADITIVO Y SUBSTRACTIVO, 15

    FIGURA 7. MODELO HSI, 16

    FIGURA 8. NEGATIVO DE LA IMAGEN, 19

    FIGURA 9. ROTACIONES Y GIROS DE LA IMAGEN, 20

    FIGURA 10. RECORRIDO DE EIKVIL, 34

    FIGURA 11. 4-ADYACENCIA, 42

    FIGURA 12. ESQUEMA DE DISEO, 54

    FIGURA 13. CLASIFICACIN DE MTODOS DE BINARIZACIN, 55

    FIGURA 14. FUNCIONALIDAD EXTENDIDA, 58

    FIGURA 15. FRAGMENTO DE CDIGO DE BINARIZACIN GLOBAL, 69

    FIGURA 16. FRAGMENTO DE CDIGO DE BINARIZACIN GLOBAL II, 70

    FIGURA 17. FRAGMENTO DE CDIGO DE BINARIZACIN LOCAL, 71

    FIGURA 18. FRAGMENTO DE CDIGO DE BINARIZACIN LOCAL II, 72

    FIGURA 19. FRAGMENTO DE CDIGO DE BINARIZACIN LOCAL III, 73

    FIGURA 20. FRAGMENTO DE CDIGO DE LA OPERACIN XOR, 74

    FIGURA 21. FRAGMENTO DE CDIGO DEL MTODO PORCENTAJE, 75

    FIGURA 22. PANTALLA PRINCIPAL DE LA APLICACIN, 77

    FIGURA 23. MENS DE LA APLICACIN, 77

    FIGURA 24. BARRA DE BOTONES DE LA APLICACIN, 78

    FIGURA 25. VENTANA NEGATIVO DE LA IMAGEN, 80

    FIGURA 26. VENTANA CONVERTIR A ESCALA DE GRISES, 82

    FIGURA 27. OPERACIN SEPARAR CANALES DE COLOR RGB, 84

    FIGURA 28. VENTANA OPERACIN AND, 86

    FIGURA 29. VENTANA OPERACIN OR, 87

    FIGURA 30. VENTANA OPERACIN XOR, 88

    FIGURA 31. VENTANA CONFIGURACIN DE INTERVALOS, 89

    FIGURA 32. VENTANA BINARIZACIN GLOBAL, 91

    FIGURA 33. VENTANA BINARIZACIN GLOBAL EXTENDIDA, 92

    FIGURA 34. MTODO NIVEL DE GRIS MEDIO, 94

    FIGURA 35. MTODO DE PORCENTAJE, 96

    FIGURA 36. MTODO DE LOS DOS PICOS, 98

    FIGURA 37. MTODO DE HUANG, 100

    FIGURA 38. MTODO DE YAGGER, 102

    FIGURA 39. MTODO DE KITLER, 104

    FIGURA 40. MTODO DE OTSU, 106

    FIGURA 41. MTODO DE RIDDLER, 108

    FIGURA 42. MTODO DE THRUSSELL, 110

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 5

    FIGURA 43. MTODO DE WESKA, 112

    FIGURA 44. MTODO DE JOHANNSEN, 114

    FIGURA 45. VENTANA BINARIZACIN LOCAL, 116

    FIGURA 46. VENTANA BINARIZACIN LOCAL II, 117

    FIGURA 47. MTODO DE BERNSEN, 118

    FIGURA 48. MTODO DE EIKVIL Y OTROS, 120

    FIGURA 49. MTODO DE MARDIA Y HAINSWORTH, 122

    FIGURA 50. MTODO DE NIBLACK, 124

    FIGURA 51. MTODO DE TAXT Y OTROS, 126

    FIGURA 52. MTODO DE YANOWITZ Y BRUCKSTEIN, 127

    FIGURA 53. MTODO DE WHITE Y ROHRER, 129

    FIGURA 54. MTODO DE PARKER, 130

    FIGURA 55. VENTANA BINARIZACIN CON OTROS MTODOS, 132

    FIGURA 56. MTODO DE WELLNER, 133

    FIGURA 57. MTODO DE UMBRALES POR REGIONES, 135

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 6

    1. DEFINICIN DE OBJETIVOS

    1.1. BREVE EXPLICACIN DEL PROYECTO FIN DE CARRERA

    Qu se entiende por binarizacin de imgenes en niveles de gris?

    La binarizacin de imgenes en niveles de gris es un proceso para extraer de una

    imagen aquellos pxeles que representan objetos dentro de una imagen.

    Estos objetos pueden ser de naturaleza muy diversa, desde texto escrito en un

    documento, lneas pertenecientes a mapas, un peatn cruzando una calle o una retina

    perteneciente a un ojo humano.

    Despus de binarizar una imagen en niveles de grises, el resultado es una imagen con

    dos niveles de grises, cuyos pxeles pertenecientes a los objetos tienen todos un nivel de

    gris y los pxeles pertenecientes al fondo de la imagen tienen otro.

    Lo normal es que tras binarizar una imagen en niveles de gris se obtenga una imagen

    monocroma en la que los pxeles correspondientes a objetos se muestren negros y los

    correspondientes al fondo de la imagen aparezcan blancos.

    La segmentacin de un nivel es casi esencial antes de procedimientos como

    adelgazamiento, vectorizacin y operaciones morfolgicas.

    A continuacin se describen los mtodos ms comunes para realizar esta tarea.

    Mtodos de Binarizacin de imgenes en niveles de gris

    El objetivo de este proyecto es estudiar, analizar e implementar numerosos de los

    existentes mtodos de binarizacin de imgenes creados hasta la fecha.

    Hay que tener en cuenta la dificultad que existe en decidir qu mtodo usar cuando nos

    planteamos binarizar una imagen en niveles de grises, ya que cada mtodo ha sido

    diseado y planteado para una aplicacin concreta.

    A lo largo de la historia, son muchos los autores que han investigado en este campo

    aportando soluciones a diversos problemas. Este proyecto tambin se encarga de

    recopilar esa informacin describiendo cada mtodo, mostrndolos por nombre de autor

    y fecha de creacin de dicho mtodo, clasificarlos y facilitar al usuario su uso en una

    plataforma comn, como es la de los pcs con Windows y facilitarle la ayuda,

    permitindole mostrar la teora suficiente como para que un usuario experto pueda sacar

    el mximo provecho y mostrrle la ayuda en lnea para esos usuarios menos expertos o

    que estn en fase de aprendizaje.

    Por otro lado, decir que la base terica de este proyecto es de las ms ricas que se puede

    encontrar en un problema de tratamiento de imgenes, ya que implica numerosos temas,

    y se nutre de muchos tratamientos de imgenes, que aunque no intervienen directamente

    en los objetivos de un mtodo de binarizacin de imgenes, si pueden ser considerados

    necesarios ante la ejecucin de un mtodo de binarizacin.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 7

    A grandes rasgos, y como anticipo del apartado 4.2. Diseo, podramos decir que las fases de un mtodo de binarizacin seran estas:

    Figura 1. Introduccin al proceso de binarizacin de imgenes

    La mayor parte de este proyecto trata de cmo realizar la binarizacin de la imagen para

    pasar una imagen en grises a una imagen en blanco y negro.

    Como veremos ms adelante, el proceso de binarizacin de una imagen puede ser tan

    complejo en tiempo, facilidad de compresin, operaciones y conocimientos

    matemticos utilizados como el autor quiera.

    Este proyecto tiene como base los artculos comparativos de 0ivind Due Trien y Torfinn

    Taxt, y de J.R. Parker.

    Los trabajos de estas personas se bajan en elegir una serie de mtodos para, despus de

    su exposicin comparlos los resultados entre s.

    Uno de los grandes aadidos de este proyecto es la obtencin de estadsticas de una

    imagen tras aplicarle un mtodo, por lo que cualquier investigador puede realizar un

    artculo del tipo del que han hecho los citados autores comparando cualitativa y

    cuantitativamente los resultados de los mtodos que dispone esta aplicacin.

    IMAGEN EN

    COLOR

    IMAGEN EN

    GRISES

    IMAGEN EN

    BLANCO Y

    NEGRO

    BINARIZAR IMAGEN

    CONVERTIR A GRISES

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 8

    1.2. JUSTIFICACIN DEL TRABAJO

    En campo de procesamiento de imgenes digitales es bastante amplio y se tratan

    numerosos temas. Cada investigador trata de aportar ideas y conocimientos nuevos en

    un determinado campo del procesamiento de imgenes digitales para una aplicacin

    determinada.

    El tema de binarizacin de imgenes en niveles de grises es un campo muy activo

    dentro de esta disciplina, y aunque es fcil ir a una revista especializada y encontrar el

    trabajo de un determinado investigador, es muy difcil probar realmente el mtodo en un

    ordenador. En la mayora de los casos los autores de estos artculos nos lo describen,

    dndonos las frmulas matemticas en las que estn basadas, pero no nos muestran una

    implementacin en un lenguaje de alto nivel para poder practicar con ella. Slo nos

    muestran los resultados cualitativos con las imgenes impresas en papel y en algunos

    casos los tiempos que han tardado en ejecutarse en una determinadaza maquina,

    comparando los tiempos con los mtodos de otros autores.

    En otros muchos casos los nuevos mtodos estn basados en mtodos anteriormente

    publicados por otros autores.

    Es por ello por lo que resulta muy difcil para un estudiante o investigador acceder a

    probar, analizar, mejorar o investigar en este campo.

    Con este proyecto fin de carrera intento crear un marco de trabajo en el que cualquier

    persona interesada pueda acceder a estos mtodos, estudindolos, modificando los

    parmetros de entrada en aquellos que lo admitan, y en definitiva, ver los resultados

    experimentales con cualquier imagen que disponga.

    Anteriormente, curs la asignatura de 5 de Ingeniera Informtica : Procesamiento de

    Imgenes digitales, en la cual un grupo de cuatro alumnos desarrollamos una aplicacin

    que usaba mtodos de segmentacin en niveles gris locales.

    Dicha fue escrita en Visual Basic 6.0. Tras realizar ese trabajo, me di cuenta que se

    poda mejorar notablemente, tanto en eficiencia, como es aspectos tcnicos. Sera

    interesante que soportase cualquier imagen est en el formato grfico que est. Adems,

    el tamao de la imagen no debera importar ya que frecuentemente la binarizacin de

    imgenes en niveles de gris tiene como objetivo los mapas, y stos son escaneados a

    una resolucin bastante alta.

    El trabajo anterior solo trataba mtodos de binarizacin globales, por lo que vi muy

    interesante que la aplicacin tambin soportase mtodos locales. Esto ltimo lo tom

    como un reto, debido a la escasez de informacin y de implementaciones acerca de

    estos ltimos.

    As pues, una vez abierta esta lnea investigacin, decid realizar una aplicacin que

    tratase sobre mtodos de binarizacin lo ms completo posible, de fcil uso y que fuese

    didctico, que sirviese para usuarios experimentados y que pudiese ser ampliada y

    utilizada como base para futuros proyectos.

    A nivel tcnico, este proyecto, aplica numerosos algoritmos de anlisis,

    tratamiento de imgenes, estructura de ficheros, creacin de un entorno

    amigable para el usuario, etc....

    Se trata de un proyecto muy completo que he intentado que abarque lo

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 9

    mximo de mis conocimientos informticos no slo en el tratamiento de imagen, sino

    tambin en nuevas tecnologas (.NET), aplicacin de mis conocimientos como

    programador (Visual Basic .NET) y la resolucin de un problema real que est a la

    orden del da, sobre todo en el campo de mapas y de imgenes mdicas.

    Con respecto a la utilidad del producto queda demostrado anteriormente que

    este producto puede general un alto grado de ROI (retorno de inversin) que

    posibilite poder seguir investigando en esta rama de anlisis de imgenes.

    A nivel personal, el proyecto queda justificado ya que he conseguido

    enfrentarme a una dura prueba de investigacin, desarrollo y trabajo con el

    departamento de matemtica aplicada I. Manual de usuario

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 10

    2. ESTUDIO TERICO 2.1. CONCEPTOS PREVIOS SOBRE EL COLOR

    Color: Segn la Real Academia Espaola el color es: s. m. Sensacin visual que

    producen sobre la retina los rayos de luz reflejados por un cuerpo. Sustancia preparada

    para pintar. Colorido de una pintura.

    En 1666, Isaac Newton descubri que al pasar un rayo de luz solar a travs de un prisma

    de cristal, el rayo de luz que sale no es blanco, est formado por un espectro continuo de

    colores que van desde el magenta al rojo.

    Figura 2. Espectro de colores

    Los colores del espectro que pueden distinguirse son el magenta, azul, cian, verde,

    amarillo, y rojo. Al ser el espectro de colores continuo cada color de los que se muestran

    se mezcla suavemente con el siguiente.

    El sol irradia una amplia variedad de ondas electromagnticas, cada una con una

    longitud de onda diferente, como por ejemplo los rayos gamma, rayos X o los

    Ultravioletas. El ojo humano solo es sensible a un pequeo intervalo de esas longitudes

    de onda, denominado luz blanca.

    El siguiente grfico muestra el espectro de ondas vistas por el hombre:

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 11

    Figura 3. Espectro de ondas vista por el hombre

    El ser humano percibe el color como un acto de la reaccin de 3 tipos de conos, por ello

    los sistemas de color estn basados en tres componentes. Ejemplos de sistemas de color

    son el RGB, CMY, HSI, y YCbCr .

    Se puede decir que la luz blanca no es un color, sino que la mezcla de todos los colores.

    Asimismo el negro tampoco es un color propiamente dicho, sino que es la ausencia de

    la luz, y estos se ven negros cuando absorben todas las frecuencias de la luz visible.

    En realidad, el negro que se muestra en los monitores de color es similar a un verde

    oscuro o verde marrn debido a emisiones de luz dispersas. La gama de colores que

    puede mostrarse en un monitor es ms pequea que la que puede verse en la naturaleza

    debido a que est limitada por las caractersticas de los revestimientos de fsforo de la

    pantalla que emiten la luz

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 12

    2.2. MODELOS DE COLOR

    2.2.1 MODELO DE COLOR RGB Es el modelo de color ms usado, ya que el ser humano recibe la informacin del color

    separada en rojo, verde y azul mediante conos receptores presentes en el ojo. El cerebro

    se encarga de procesar estos tres componentes y componer una imagen en color.

    El modelo de color RGB, cada color aparece descompuesto en sus componentes

    espectrales rojo (Red), verde (Green) y azul (Blue), cuya combinacin produce el color

    resultante.

    Se denominan colores primarios aditivos a los colores rojo, verde y azul, ya que los

    dems colores se pueden obtener como combinacin de estos.

    Este modelo se puede representarse en forma de cubo tridimensional, en el que los ejes

    x, y, z son los componentes espectrales rojo, verde y azul.

    La siguiente figura representa un modelo de color RGB normalizado a uno, en el que

    cada componente R,G,B puede valer 0 1, obteniendo as 8 posibles colores.

    Figura 4. Cubo RGB

    El negro sera el origen del sistema de coordenadas(0,0,0).Todo lo contrario sera el

    blanco (1, 1, 1).

    Aquellos puntos que van del (0,0,0) al (1,1,1) estaran dentro de la diagonal principal y

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 13

    formaran lo que se llama escala de grises niveles de grises. (Recordemos que el

    objetivo final va a ser pasar de una imagen en color a una imagen en escala de grises).

    El modelo descrito corresponde a un modelo RGB en el que cada componente puede

    valer 0 1 (1 bit por canal), dando lugar a 8 posibles colores.

    Se pueden obtener modelos con mas colores, como el de 24-bits, en el que cada

    componente puede valer de 0 a 255 (8 bits por canal) y que da lugar a un nmero de

    colores extensamente amplio.

    Actualmente los monitores CRT, la mayora de video camaras a color y casi todos los

    sistemas grficos por ordenador usan el modelo de color RGB, debido a que se

    simplifica el diseo.

    La pega a este modelo es que al tener tres colores, dificulta algunas operaciones sobre

    imgenes como ecualizaciones de histograma. Por ello muchos algoritmos convierte

    este modelo al modelo de color HSI (hue-saturation-intensity) en el que la componente

    de color solo es una , hue .

    Se puede decir que para un proceso u otro vendr mejor un sistema de color u otro

    atendiendo a diferentes razones.

    2.2.2 MODELO DE COLOR CMY

    El modelo de color CMY, cada color aparece descompuesto en sus componentes

    espectrales Cyan , Magenta y amarillo (Yellow), cuya combinacin produce el color

    resultante.

    El modelo de color CMY es un modelo complementario al RGB ya que cian, magenta,

    y amarillo son los colores complementarios de rojo, verde y azul, respectivamente.

    A diferencia de los colores de sistema RGB, los colores primarios de CMY Cyan ,

    Magenta y Amarillo son conocidos como colores primarios substractivos, ya que estos

    primarios son restados de la luz blanca para producir el color deseado.

    Cyan absorve del color rojo, magenta del verde y amarillo del azul. Esto significa que

    podemos incrementar el verde de una imagen decrementando el magenta

    (complementario del verde), o incrementando el amarillo y el cyan.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 14

    Figura 5. Colores CMY

    Al ser RGB y CMY modelos de color complementario ser fcil la conversin entre

    ambos, que viene dada por las formulas:

    Convertir de RGB a CMY:

    C = 1.0 R M = 1.0 - G

    Y = 1.0 - B

    Convertir CMY a RGB:

    R = 1.0 - C

    G = 1.0 - M

    B = 1.0 - Y

    Estas ecuaciones serian vlidas para un sistema de color normalizado, con sus valores

    entre 0.0 y 1.0. En un modelo de color de 24-bit cyan vendra dado por C=255 - R.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 15

    Figura 6. Modelos aditivo y substractivo

    En el rea de la industria de impresin se usa el modelo CMY con una ligera variacin,

    se le aade un cuarto color, el negro (k), denominndose sistema de color CMYK. Esta

    componente negra (K) se aade en el proceso de impresin porque proporciona un color

    negro ms puro que la combinacin de los otros tres colores del modelo,

    proporcionando un mejor contraste. Adems este modelo tiene el aadido de que la tinta

    negra es ms barata que la de color, por lo que interesa ms aadir una componte de

    color negro, que producir esta mediante las tres componentes de color.

    Las siguientes formulas indican cmo convertir de CMY a CMYK:

    K = Min(C, M, Y)

    C = C - K

    M = M - K

    Y = Y K

    2.2.3 MODELO DE COLOR HSI

    En este modelo, se separa la luminancia o intensidad (I) de la informacin del color,

    descrita por los canales de tono o hue (H) y saturacin.

    Hue (tono), Saturation (saturacin), Intensity (intensidad) son tres propiedades que se

    usan para describir un color, de las cuales el tono y la saturacin responden

    acertadamente a la forma en que los seres humanos perciben el color.

    A diferencia del modelo de color RGB, ya no hace falta saber qu porcentaje de rojo,

    verde o azul hace falta para obtener un color determinada, basta con ajustar el tono. Para

    hacerlo ms claro o ms oscuro variamos la intensidad, y ajustando la saturacin

    podremos pasar por ejemplo de un color rojo oscuro a un color rosa claro.

    Aplicaciones de procesamiento de imgenes, como operaciones sobre histogramas,

    transformaciones de intesidad y convolucin solo operan en la intensidad de la imagen,

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 16

    por lo que estas operaciones son ms sencillas de realizar usando el modelo de color

    HSI.

    El tono (Hue) se representa como un ngulo, que varia de 0o a 360

    o.

    La saturacin (S) corresponde al radio, que varia de 0 a 1.

    La intensidad (I) vara a lo largo del eje z desde 0 siendo negro a 1 siendo blanco.

    Figura 7. Modelo HSI

    Si S = 0, el color es un gris de intensidad 1. Si S = 1, el color est en el lmite de la base

    superior del cono.

    Ajustando el tono el color variar de rojo en 0o, verde en 120

    o, azul en 240

    o, y volver

    a rojo a los 360o.

    Cuando I = 0, el color es negro y por lo tanto H es indefinido. Cuando S = 0, el color

    esta en escala de grises. H es tambin indefinido en este caso.

    Ajustando la intensidad, I, un color se puede hacer ms oscuro o ms claro. Si

    mantenemos S=1 y ajustamos I, se van creando matices de ese color.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 17

    Las siguientes formulas muestran como convertir de RGB a HSI:

    Si B es mayor que G, entonces H=360 - H

    Las siguientes formulas muestran como convertir de HSI a RGB:

    Dependiendo del sector de color en el que se encuentre H, la conversin vendr dada

    por:

    00 H 1200 (sector RG):

    1200 H 2400 (sector GB):

    2400 H 3600 (sector BR):

    Estos valores r, g, b son valores normalizados de las componentes R, G, B. Adems

    estas ecuaciones esperan los ngulos en grados.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 18

    2.2.4 MODELO DE COLOR YCbCr

    El modelo de color YCbCr separa la luminancia de la informacin de color. La

    luminancia se codifica en la componente Y, y el grado de azul y de rojo se codifica en

    las componentes Cb y Cr. respectivamente. Las siguientes formulas detallan como se

    convierte de RGB a YCbCr y viceversa.

    De RGB a YCbCr:

    Y = 0.29900R + 0.58700G + 0.11400B

    Cb = -0. 16874R - 0.33126G + 0.50000B

    Cr = 0.50000R-0.41869G - 0.08131B

    De YCbCr a RGB:

    R = 1.00000Y + 1.40200Cr

    G = 1.00000Y - 0.34414Cb - 0.71414Cr,

    B = 1.00000Y + 1.77200Cb

    Estas no son las nicas formas de convertir a/desde YCbCr. La mostrada aqu es la

    recomendacin CCIR (International Radio Consultive Committee) 601-1 y es la que se

    usa en la compresin de imgenes JPEG:

    2.3. DE RGB A ESCALA DE GRISES

    El modelo de color de escala de grises consiste en que cada pixel puede tener un valor,

    denominado intensidad de gris, que va de 0 a 255. El valor cero se corresponde con el

    negro y el 255 con el blanco.

    Una conversin simple es usar la componente verde del modelo RGB como escala de grises, ya que el verde representa un componente grande en la escala

    de grises. Es una conversin muy simple, pero no siempre produce los mejores

    resultados.

    Una conversin muy comn de RGB a escala de grises es una simple media: Gris = (R+G+B)/3 = 0.333R + 0.333G + 0.333B

    Esta conversin es usada en muchas aplicaciones, como por ejemplo en la

    conversin de modelo de color RGB a HSI.

    Otra conversin una media ponderada: Gris = ( 3 * R + 4 * B + 2 * G ) / 9

    La conversin que suele dar mejores resultados viene dado por la siguiente frmula:

    Gris = 0.299R + 0.587G + 0.114B

    Esta ecuacin es la ecuacin del estndar NTSC para la luminancia.

    Entendemos luminancia como la suma ponderada de los 3 colores de luz

    usados en la televisin a color y en monitores a color, que son rojo, verde y azul

    (RGB). Una mayor luminancia indica un brillo ms intenso de luz en un sitio

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 19

    dado de la pantalla. Los coeficientes que acompaan a las componentes R,G,B

    reflejan la sensibilidad del ojo al brillo de esos colores primarios.

    Por ltimo, segn la ITU-R, en su recomendacin BT. 709 (Recommendation BT.709, "Basic Parameter Values for the Studio and for International

    Programme Exchange (1990) [formerly CCIR Rec. 709] ) tenemos:

    Gris = 0.2125 * R + 0.7154 * G + 0.0721 * B

    2.4. NEGATIVO DE UNA IMAGEN

    El negativo de una imagen digital en escala de grises se obtiene aplicando la funcin:

    g(x,y)= L - 1 - f(x,y)

    donde L es el n de niveles de gris de la imagen.

    Se trata de un procedimiento de inversin de la escala de grises. Es muy utilizado por

    ejemplo, en imgenes mdicas.

    Figura 8. Negativo de la imagen

    La figura ilustra el empleo de esta sencilla transformacin (r y s indican los niveles de

    gris de entrada y de salida respectivamente)

    El negativo de una imagen tambin se puede aplicar a cualquiera de los canales RGB de

    una imagen a color.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 20

    2.5. ROTACIONES Y GIROS DE UNA IMAGEN

    Se realiza girando el objeto alrededor de un eje, modificando as su orientacin en el

    espacio.

    Figura 9. Rotaciones y giros de la imagen

    Para ello se utilizan tranformadas.

    La rotacin de un punto un ngulo alrededor del eje de coordenadas Z se consigue con la transformacin:

    El ngulo de rotacin se mide en el sentido de las agujas del reloj. Esta transformacin afecta nicamente a los valores de las coordenadas x e y.

    La rotacin de un punto un ngulo sobre el eje X se consigue con la transformacin:

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 21

    La rotacin de un punto un ngulo alrededor del eje Y se consigue con la transformacin:

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 22

    2.6. MTODOS DE BINARIZACIN DE IMGENES ESTUDADOS

    La segmentacin de un nivel o binarizacin es una conversin entre una imagen en

    niveles de grises y una imagen monocroma (blanco y negro).

    Dicha imagen monocroma debe contener toda la informacin esencial de la imagen en

    niveles de grises. (mismo nmero de objetos, misma posicin y la misma forma de los

    objetos).

    Al tener solo dos colores (blanco y negro) la cantidad de informacin para representar la

    imagen monocroma es mucho menor.

    Para una mayor comodidad en este he estudio, he dividido estos mtodos en tres

    apartados.

    - Mtodos globales de binarizacin de imgenes

    - Mtodos locales de binarizacin de imgenes

    - Otros mtodos de binarizacin de imgenes

    A continuacin se describe cada uno de estos apartados y los mtodos de binarizacin

    estudiados en cada uno de ellos.

    2.6.1 MTODOS GLOBALES DE BINARIZACIN DE IMGENES

    Estos mtodos se basan en la idea de elegir un valor de umbral para toda la imagen.

    Todos los pxeles de las imgenes en escala de grises con un valor menor se consideran

    negros (0), y todos aquellos cuyo nivel de gris sea igual o superior se consideran

    blancos (1).

    El problema de la segmentacin es elegir ese valor de umbral.

    Segn el nivel de gris de cada pxel, y el umbral elegido, cada pxel va a pertenecer a

    una de los siguientes conjuntos:

    * Conjunto de pxeles negros: Imagen(i,j) < T

    * Conjunto de pxeles blancos: Imagen(i,j) >= T

    Donde T es el valor de umbral elegido.

    2.6.1.1. MTODO VALOR DE NIVEL DE GRIS MEDIO

    El valor de umbral debe determinarse de los valores de los pxeles de la imagen.

    En este mtodo en valor de umbral se determina de una medida del conjunto de

    propiedades de la imagen.

    Un simple ejemplo, no especialmente bueno, es usar el nivel medio de gris de la imagen

    como valor de umbral. El efecto de esto es que casi la mitad de los pxeles sern

    considerados como blancos, y los dems como negros. El algoritmo Nivel de Gris

    Medio muestra este ejemplo.

    Aunque se pudiese fijar dicho valor al 50% de pxeles negros, no sera una buena idea.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 23

    Por ejemplo, en imgenes de texto escaneadas (imgenes que slo contienen texto) el

    porcentaje de pxeles negros vara de un 8% a un 15%. Con un umbral que causase que

    el 15% de pxeles fuesen negros ya se obtendran unos resultados con xitos.

    2.6.1.2 MTODO DE PORCENTAJE DE PXELES NEGROS

    Una forma fcil de encontrar este valor de umbral es usar el histograma de niveles de

    grises de la imagen.

    Dado un histograma, y un porcentaje de pxeles negros deseados, se determina el

    nmero de pxeles negros multiplicando el porcentaje por el nmero total de pxeles.

    A continuacin se cuentan el nmero de pxeles de cada nivel del histograma,

    empezando por el nivel cero, hasta llegar al nmero de pxeles negros deseados.

    El umbral ser el nivel de gris del histograma, en el que la cuenta llegue al nmero de

    pxeles negros deseados.

    Este mtodo es bastante antiguo y a veces es llamado p-tile.

    2.6.1.3. MTODO DE LOS DOS PICOS

    Una observacin practica de estos mtodos es que cuando se encuentra este valor, suele

    aparecer en el punto bajo entre dos picos del histograma.

    Si el histograma muestra dos picos, esta seleccin para valor de umbral puede ser la

    buena.

    El problema de seleccionar el umbral automticamente ahora consiste en:

    Encontrar los dos picos.

    Encontrar el punto bajo entre ellos.

    Encontrar el primer pico es fcil (aquel que tenga el mayor valor). El segundo pico es

    ms difcil de encontrar, ya que el segundo valor ms grande del histograma puede ser

    el que est ms a la derecha del mayor, en vez de ser el segundo pico.

    Una manera simple que suele funcionar para encontrar el segundo pico es multiplicar

    los valores del histograma por el cuadrado de la distancia del primer pico. Esto da

    preferencia a aquellos picos que no estn cercanos al mximo As si el pico ms alto

    est al nivel j en el histograma, debemos seleccionar el segundo pico mediante la

    frmula:

    )}2550(|))max{(( 2 kkhfk

    Donde h representa al histograma, y hay 256 niveles de gris, de 0 a 255.

    La mejor manera de identificar los picos en el histograma es observar que resultan de

    muchas observaciones de niveles de grises que aproximadamente son el mismo excepto

    algunas perturbaciones (ruido). Si el ruido est normalmente distribuido, los picos del

    histograma pueden aproximarse por curvas Gausianas. Dichas curvas pueden ajustarse

    al histograma, y las dos mayores son usadas como los picos ms altos, el umbral debe

    estar comprendido aqu. Esta proposicin es ms costosa y sin compromiso de un mejor

    resultado.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 24

    2.6.1.4. MTODO DE WESKA, 1984. (USANDO PXELES DE BORDE)

    Un pxel de borde debe estar cercano al lmite entre un objeto y el fondo de la imagen, o

    entre dos objetos, por ello se denomina pxel de borde. El resultado de esto es que el

    valor de un pxel de borde puede ser bastante consistente, ya que muchas veces estarn

    dentro del objeto y otras veces un poco fuera debido al contorno. El histograma de

    estos pxeles ser mas regular que el histograma general de la imagen.

    El mtodo buscar un umbral haciendo uso del Laplaciano digital hace uso de esta idea.

    El Laplaciano digital es un operador de deteccin de borde no direccional.

    Dicho valor de umbral se puede encontrar mediante el Laplaciano de la imagen de

    entrada. Un mtodo simple para realizar este proceso es convolucionar la imagen de

    entrada con la siguiente mscara:

    0 1 0

    1 -4 1

    0 1 0

    A partir de ahora el histograma de la imagen original se encuentra considerando solo

    aquellos pxeles que tienen un valor grande de Laplaciano (se considera a partir del

    85%).

    Aquellos pxeles con un Lapaciano superior al 85% tendrn su nivel de gris apareciendo

    en el histograma, mientras aquellos que no superen el 85% no lo tendrn.

    Ahora el umbral es seleccionado usando el histograma as calculado.

    El usar una mejor aproximacin del operador Laplaciano debera dar mejores

    resultados, pero en algunos casos este procedimiento simple puede mostrar mejoras

    sobre otros mtodos.

    2.6.1.5. MTODO DE RIDLER,1978. (SELECCIN ITERATIVA)

    La seleccin iterativa (Ridler 1978) es un proceso en el que la conjetura inicial sobre un

    umbral es refinada a travs de consecutivo pasos por la imagen. Este no usa el

    histograma, pero en cambio usa los umbrales de la imagen del objeto y clases de fondo

    repetidamente, usando los niveles en cada clase para mejorar el umbral.

    La conjetura inicial sobre el umbral es simplemente el nivel medio de gris. Este umbral

    entonces es usado para recoger la estadstica de las regiones en blanco y negro

    obtenidas; el nivel medio de gris para todo los pxeles debajo del umbral es encontrado

    y llamado Tb, y el nivel medio de gris de los pxeles mayor o igual al umbral inicial es

    llamado To. Ahora una estimacin nueva del umbral es calculada como (Tb + To)/2, o

    el promedio de los niveles medios en cada clase de pxel, y el proceso es repetido

    usando este umbral. Cuando ningn cambio del umbral es encontrado en dos,

    consecutivas pasadas por la imagen, el proceso finaliza.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 25

    2.6.1.6. MTODO DE THRUSSELL, 1979. (VARIANTE DE LA SELECCIN

    ITERATIVA DE RIDLER)

    El algoritmo de seleccin iterativa de Ridler est diseado para que funcione bien en

    una implementacin hardware, en la que la estimacin inicial de un umbral asume que

    las cuatro esquinas de la imagen corresponden a regiones de fondo y el resto de la

    imagen es usado como una estimacin de los niveles grises de los objetos. Sin embargo,

    en una implementacin software, el mismo umbral puede ser calculado utilizando el

    histograma. Esto debera ser ms rpido, ya que el histograma es un array

    unidimensional de pequeo tamao fijos.

    Comenzando con la estimacin inicial del umbral To, la estimacin de k-sima del

    umbral es (Thrussel 1979):

    N

    Tj

    N

    Tj

    T

    i

    T

    i

    K

    K

    K

    K

    K

    jh

    jhj

    ih

    ihi

    T

    1

    1

    0

    0

    1

    1

    1

    1

    ][2

    ][

    ][2

    ][

    Donde h es el histograma de los niveles grises en la imagen.

    De nuevo, cuando Tk = Tk+1, entonces Tk es el umbral apropiado.

    2.6.1.7. MTODO DE OTSU, 1978. (HISTOGRAMAS DE NIVEL DE GRIS)

    Los mtodos de obtencin de umbral que estn basados en seleccionar el punto bajo

    entre dos picos de un histograma usan el concepto que los pxeles correspondientes a

    objetos y pxeles correspondientes al fondo de la imagen tienen niveles medios

    diferentes, y son nmeros aleatorios dibujados de una de dos distribuciones normales.

    Estas distribuciones tambin tienen sus propias desviaciones estndar y varianzas,

    donde la varianza es el cuadrado de la desviacin estndar.

    Si hay dos grupos de pxeles en la imagen, entonces esto es una tarea simple calcular lal

    general, o total la varianza de los valores de nivel grises en la imagen, denotado por 2

    t .

    Para cualquier valor t de umbral dado, tambin es posible calcular separadamente la

    varianza de los pxeles de objeto y de los pxeles de fondo; estos representan los

    valores de varianza dentro-de-clases, denotado por 2w .

    Finalmente, la variacin de los valores medio para cada clase del total medio de todos

    los pxeles define una varianza entre-clases, que ser denotada por 2b .

    Esto es el principio de un mtodo estadstico llamado anlisis de varianza.

    La cuestin importante es que un umbral ptimo puede ser encontrado reduciendo al

    mnimo la proporcin de la varianza entre-clases de la varianza total:

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 26

    2

    2

    )(t

    bt

    Esta frmula define el radio necesitado y el valor de t que da el valor ms pequeo para

    , que ser el mejor umbral.

    Como la varianza total 2t es fcil de calcular de la imagen, as como su valor medio

    T . La varianza entre-clases es calculado por:

    2

    1010

    2 )( b

    Donde:

    010

    0 1

    t

    i

    ip

    Con ip siendo la probabilidad de nivel de gris i, o el valor de i en el histograma

    dividido por el nmero total de pxeles. Tambin:

    0

    0

    t

    0

    11

    tT

    t

    i

    it pi0

    .

    Todos estos valores son fciles de obtener del histograma de la imagen. El valor de t

    que minimice (t) ser el valor de umbral ptimo.

    2.6.1.8. MTODO DE KAPUR, 1985. (ENTROPA)

    La entropa es una medida del contenido de la informacin. En trminos de la teora de

    la informacin asumimos que hay n smbolos posibles x (por ejemplo, letras o dgitos) y

    que el smbolo i ocurre con la probabilidad p ( ix ).

    Entonces la entropa asociada con la fuente de los smbolos X es

    ))(log()()(1

    i

    n

    i

    i xpxpXH

    Donde la entropa es medida en bits/smbolos.

    Una imagen puede ser vista como una fuente de smbolos, o como niveles de grises. La

    entropa asociada con los pxeles negro es (Pun, 1981):

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 27

    )log(0

    i

    t

    i

    ib ppH

    Donde la ip es la probabilidad de gris del nivel i. De forma parecida, la entropa de los

    pxeles blancos es:

    )log(255

    1

    i

    ti

    iw ppH

    Para una imagen con niveles de 0 a 255. El algoritmo sugerido intenta encontrar el valor

    de umbral t que maximiza:

    wb HHH

    En el cual Pun nos muestra que es lo mismo que maximizar:

    }),...,log(max{

    )1log(1

    }),...,log(max{

    log)(

    2552110 PPP

    P

    H

    H

    PPP

    P

    H

    Htf

    tt

    t

    T

    t

    t

    t

    T

    t

    Donde:

    i

    t

    i

    it ppH log0

    Es la entropa de los pxeles negros

    i

    i

    iT ppH log255

    0

    Es la entropa total, y

    t

    i

    it pP0

    Es la probabilidad acumulativa hasta el nivel de gris t, o la probabilidad que un

    pxel dado tenga un valor menor o igual que t. Estos tres factores pueden ser calculados

    del histograma de nivel gris, con lo cual la ecuacin

    i

    i

    iT ppH log255

    0

    no depende del valor de t.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 28

    Una variacin sobre este tema (Kapur 1985) intenta definir una distribucin de

    probabilidad de un objeto, A y una distribucin de fondo B de la siguiente manera:

    t

    t

    tt p

    p

    p

    p

    p

    pA ,...,,: 10

    tt

    t

    t

    t

    p

    p

    p

    p

    p

    pB

    1,...,

    1,

    1: 25521

    Ahora la entropa de pxeles en blanco y negro es calculada de un modo similar a

    ecuaciones anteriores, que calculaban bH y wH , pero usando estas distribuciones

    nuevas:

    t

    it

    i t

    ib

    p

    p

    p

    pH log

    0

    t

    i

    ti t

    iw

    p

    p

    p

    pH

    1log

    1

    255

    1

    El umbral ptimo es el valor de t que maximiza

    wb HHH

    Para encontrar este valor, todos los umbrales entre 0 y 255 son intentados, y el que da el

    valor ms grande de H es escogido.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 29

    2.6.1.9. MTODO DE JOHANNSEN,1982. (VARIANTE DE LA ENTROPA DE

    KAPUR)

    Esta variacin del mtodo de Kapur propone dividir los niveles de grises sobre dos

    partes para a minimizar la interdependencia entre ellos (Johannsen 1982). Sin perseguir

    esto en demasiado detalle, el mtodo asciende a la reduccin al mnimo de:

    )()( tStS wb

    Donde:

    )()(1

    )log()(1

    00

    0

    t

    i

    it

    t

    it

    i

    i

    ib pEpE

    p

    ptS

    )()(1

    )log()(255

    1

    255

    255ti

    it

    ti

    ti

    i

    iw pEpE

    p

    ptS

    )log()( xxxE es la funcin de entropa.

    Poniendo en prctica este algoritmo, el gran cuidado debe ser tomado para no

    evaluar )(tSb y )(tSw para los valores de t donde

    2.6.1.10. MTODO DE HUANG, 1995.(CONJUNTOS DIFUSOS)

    En la teora normal de conjuntos, un elemento pertenece o no a un determinado

    conjunto. En los conjuntos difusos (fuzzy) un elemento pertenece a un conjunto con una

    determinad propiedad.

    En este apartado, con objeto de encontrar un umbral para binarizar una imagen, vamos a

    clasificar los pxeles como pertenecientes al conjunto de pxeles de fondo, o como

    pertenecientes al conjunto de pxeles de objeto, y la aplicabilidad de los conjuntos

    difusos a esta problemtica.

    El mtodo descrito a continuacin usa una medida de difusidad, definida como distancia entre la imagen original en niveles de grises y la imagen binarizada mediante

    el uso de un umbral. El objetivo se centra ahora en minimizar esa difusidad, ya que mientras menor sea, ms exacta ser la imagen binarizada de la original en niveles de

    grises.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 30

    Una buena funcin para definir la pertenencia (o probabilidad) de un pxel al conjunto

    de pxeles de fondo o pxeles de objetos es la siguiente:

    )(xux Cx /1

    1

    0 Si x1

    Donde :

    . C es una constante consistente en la diferencia entre el nivel de gris mximo y

    el nivel de gris mnimo de la imagen.

    . 0 es el nivel medio de gris del fondo de la imagen

    . 1 es el nivel medio de gris de los pxeles de objetos de la imagen

    . t es un cierto valor de umbral dado

    Un pxel x pertenecer al conjunto de pxeles de fondo o al conjunto de pxeles de

    objetos dependiendo de la relacin entre el nivel de gris de dicho pxel y el valor de

    umbral t.

    Para un pxel de objeto (x>t), el grado en el cual pertenece al conjunto de pxeles de

    objeto est dado por )(xux , el cual debe ser un valor comprendido entre y 1.

    Una medida de la difusidad est basada en la entropa de conjuntos difusos, que viene dada por la formula:

    )())((1)( ghgHMN

    tE xt

    Donde tH (t) = - x log(x) (1-x) log (1-x) que es la frmula de Shannon.

    Los niveles de grises son g, N y M son el nmero de filas y columnas, respectivamente,

    y h es el histograma de niveles de grises de la imagen.

    Donde el valor de E(t) sea mnimo, tendremos que t es el umbral apropiado que

    minimiza la difusidad.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 31

    2.6.1.11 . MTODO DE YAGGER, 1979. (CONJUNTOS DIFUSOS)

    Otra medida de la difusidad est basada en la idea de que para un conjunto normal A no hay elementos en comn entre A y su complementario, en contraposicin con la

    teora de conjuntos difusos, en los que cada elemento puede pertenecer a un conjunto A

    o su complementario con ciertas probabilidades.

    El grado en el cual A y su complementaria son no distintos es una medida de cmo de

    difuso (fuzzy) es A.

    Ello se puede calcular mediante la siguiente expresin:

    pg xxp

    ggtD/1

    )()()(

    Para niveles g, donde p es un nmero entero y )(1)( gg xx

    El valor de p usado define una medida de la distancia, en nuestro caso usamos p=2 que

    se corresponde con la distancia eucldea.

    Para un valor de umbral t, tenemos los siguientes valores:

    Estimacin de la media de pxeles de fondo

    t

    g

    t

    g

    gh

    ghg

    t

    0

    0

    0

    )(

    )(

    )(

    Estimacin de la media de pxeles objetos

    254

    1

    254

    1

    1

    )(

    )(

    )(

    tg

    tg

    gh

    ghg

    t

    Ahora todo lo necesitado para minimizar la difusidad est conocido, simplemente hay que probar los posibles valores de umbral t y seleccionar aquel que produzca el valor

    mnimo de medida de difusidad.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 32

    2.6.1.12. MTODO DE KITLER, 1986 (UMBRAL DE MNIMO ERROR)

    El histograma de la imagen puede ser pensado como una funcin de densidad de

    probabilidad de las dos distribuciones (pxeles objetos y pxeles de fondo). Estos son

    generalmente, como ha sido hablado, pensados como distribuciones normales, entonces

    el histograma es una aproximacin de :

    22222121 2/

    2

    2/

    1 2

    1

    2

    1)(

    gg eegp

    Donde 1 y 1 1es la desviacin estndar y la media de una de las clases, y 2 y 2 son la desviacin estndar y la media de la otra.

    Despus de tomar logaritmo en ambos lados y reorganizarla, conseguimos una ecuacin

    cuadrtica que podra ser solucionada para g:

    222

    2

    2

    2112

    1

    2

    1 log2log)(

    log2log)(

    Pg

    Pg

    Sin embargo, los valores de , y P no son conocidos, y ellos pueden ser estimados slo con alguna dificultad. En vez de esto, Kittler y Illingworth (Kittler 1986) crearon

    una funcin de criterio nueva para ser minimizada:

    )(log)()(log)(2)(log)()(log)(21)( 22112211 tPtPtPtPttPttPtJ

    Usando frmulas que deberan parecernos familiares:

    t

    g

    ghtp0

    1 )()(

    255

    1

    2 )()(tg

    ghtp

    )(

    )(

    )(1

    0

    1tp

    ghg

    t

    t

    g

    )(

    )(

    )(2

    255

    1

    2tp

    ghg

    ttg

    )(

    ))()((

    )(1

    0

    2

    1

    2

    1tp

    tggh

    t

    t

    g

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 33

    )(

    ))()((

    )(2

    255

    1

    2

    2

    2

    2tp

    tggh

    ttg

    El valor de t que minimiza la J (t) es el mejor umbral. Esto a menudo es mencionado

    como mnimum error thresholding o umbral de mnimo error.

    2.6.2 MTODOS LOCALES DE BINARIZACIN DE IMGENES Se calcula un umbral para cada pxel de la imagen en base a la informacin contenida en

    su vecindario de pxeles, o sub-region de la imagen.

    Cada uno sobre una sub-regin de la imagen. El mximo nmero de subregiones es el

    mismo que el nmero de pxeles de la imagen.

    Algunos mtodos calculan una superficie de binarizacin sobre la imagen completa. Si

    un pxel p(x,y) en la imagen de entrada tuene un nivel de gris mayor que la superficie de

    binarizacin en ese punto, entonces ese pxel es considerado como pxel de fondo,

    blanco, en caso contrario se considerara como pxel de objeto, negro.

    Otros mtodos no usan umbrales explicitos, sino que buscan pxeles pertenecientes a

    objetos en una transformada de la imagen.

    En definitiva, cada mtodo de los aqu presentes de una forma, pero la caracterstica que

    los une es que el umbral en cada pxel se calcula en base a informacin de sus vecinos.

    2.6.2.1. MTODO DE BERNSEN, 1986

    Para cada pxel (x,y), se define el umbral

    2/)(),( highlow zzyxT

    Donde zlow y zhigh representan el valor de nivel de gris ms bajo y ms alto,

    respectivamente, de una matrix de dimensiones r x r de pxeles vecinos centrada en el

    punto (x,y).

    Definimos la medida del contraste de un pixel como:

    )(),( lowhigh zzyxC

    Si )(),( lowhigh zzyxC , donde es un cierto

    valor entero conocido, entonces el vecindario consiste solo en una clase, objeto o fondo

    de imagen.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 34

    En algunas imgenes, como las de mapas, grandes zonas de objetos raramente ocurren,

    por lo que sus pxeles son etiquetados como fondo de imagen en dichos casos.

    Resultados experimentales indican que tomando 15 y 15r se obtienen buenos resultados.

    2.6.2.2. MTODO DE EIKVIL Y OTROS, 1991

    Definimos una pequea ventana (matriz) de pxeles denominada S. Esta ventana est

    incluida en otra mayor llamada L, que es concntrica sobre S.

    El proceso consiste en deslizar las ventanas S y L a travs de la imagen en pasos igual al

    tamao de S. La siguiente figura indica el sentido del movimiento:

    Figura 10. Recorrido de Eikvil

    Un ejemplo comn del tamao de las ventanas S y L es 3 x 3 pxeles para S y de 15 x

    15 pxeles para L.

    En cada paso, a todos los pxeles dentro de la ventana L se les calcula el mtodo de Otsu

    para dividir los pxeles en dos grupos. Cualquier otro mtodo global puede reemplazar

    al de Otsu, aunque ste da muy buenos resultados.

    Si las estimaciones medias de los grupos son 1 y 2 estn ms alejadas que un lmite

    especificado por el usuario 21 , los pxeles dentro de S son binarizados usando

    el valor de umbral T (encontrado por el mtodo de Otsu).

    Por el contrario, si se verifica que 21 todos los pxeles incluidos en S son

    asignados a la clase con el valor medio actualizado ms cercano.

    Un valor usado muy comn para es 15 .

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 35

    2.6.2.3. MTODO DE MARDIA Y HAINSWORTH, 1988

    Este mtodo en un primer momento realiza una binarizacin inicial, usando por ejemplo

    un mtodo de binarizacin global como el mtodo de Otsu, para seguir con varios pasos

    hasta alcanzar la convergencia.

    El primero de estos pasos es calcular el valor medio i y el nmero de pxeles ni de las

    dos regiones de la imagen binaria (objeto y fondo).

    El siguiente paso es obtener un valor de umbral t* basado en estos valores, y para cada

    pxel p(x,y) una media ponderada G de l y sus ocho vecinos es calculada.

    Dado un pxel p(x,y), si cumple que G *t ser considerado como objeto(pxel negro) en caso contrario ser considerado como fondo.

    2.6.2.4. MTODO DE NIBLACK, 1986

    La idea de este mtodo es variar el umbral sobre la imagen, basndose en la media local

    y en la desviacin estndar.

    El umbral en el pxel p(x,y), T(x,y) es calculado como:

    T(x,y) = m(x,y)+ k * s(x,y)

    Donde m(x,y) es la media de la muestra y s(x,y) es la desviacin estndar, ambas de un

    vecindario de pxeles centrados en el pxel (x,y).

    El tamao de este vecindario de pxeles debera ser lo suficientemente pequeo para

    preservar los detalles, y lo suficiente grande como para evitar el ruido.

    El valor de k se usa para ajustar cuanto del lmite del total del objeto es tomado como

    parte del mismo. Un valor de k = -0.2 ofrece a menudo una buena separacin entre

    objetos.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 36

    2.6.2.5. MTODO DE TAXT Y OTROS, 1989

    En este mtodo, la imagen es dividida en ventanas no superpuestas de tamao 32 x 32

    pxeles.

    En cada ventana, el histograma es aproximado por una mezcla de dos distribuciones

    Gausianas. Los parmetros de la mezcla son estimados usando un algoritmo

    denominado Expectation-Maximization (EM). En cada ventana, los pxeles son clasificados mediante el clasificador cuadrtico de Bayes.

    El algoritmo EM requiere valores iniciales para estimar las medias de las clases 1 , 2

    y las varianzas de clases 21 , 2

    2 , y el factor de peso de la mezcla .

    Normalmente se usa un valor de = 0.5 . Los otros 4 parmetros 1 , 2 y 2

    1 , 2

    2

    estimados suelen ser estimados de una agrupacin de 100 pxeles elegidos de forma

    aleatoria.

    El problema de este mtodo es que aparecen cambios bruscos en el borde de la ventana.

    Se puede decir que el citado mtodo de Eikvil y otros es una mejora de ste, ya que:

    Al usar dos ventanas evita estos cambios bruscos en el borde

    El usar el mtodo de Otsu como una aproximacin del algoritmo EM supone una mejora de tiempo respecto as este

    El mtodo de Taxt necesita una mayor ventana que el mtodo de Eikvil ya que hay que realizar la estimacin de cinco parmetros.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 37

    2.6.2.6. MTODO DE YANOWITZ Y BRUCKSTEIN, 1989

    Una superficie potencial que pasa sobre la imagen en los mximos locales del gradiente

    es usada como superficie de binarizacin.

    La magnitud del gradiente es calculada usando el operador de borde de Sobel, aunque

    algunos autores como Jain y Dubuisson han usado el detector de bordes de Canny.

    La imagen es binarizada y adelgazada con lneas de un pxel de anchura para identificar

    los pxeles que forman el borde.

    La imagen de entrada es suavizada mediante un filtro de media 3 x 3. La superficie

    potencial se construye con un esquema de interpolacin iterativa con el objeto de

    hacerla pasar sobre los pxeles de borde de la imagen.

    Una interpolacin residual R(x,y) se calcula para cada pxel que no sea un pxel de

    borde, y el nuevo valor del pxel P(x,y) en la iteracin n+1 se calcula como:

    4

    ),(.),(),( 111

    yxRyxPyxP nnn

    ),(4)1,()1,(),1(),1(),( yxPyxPyxPyxPyxPyxR nnnnnn

    Las recomendaciones de Yanowitz y Bruckstein para el valor de es que permanezca

    dentro del siguiente intervalo 0.20.1 para una rpida convergencia.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 38

    2.6.2.7. MTODO DE WHITE Y ROHRER, 1983

    Un promedio mvil parcial es usado como umbral para cada pxel p(x,y).

    El promedio horizontal en el pxel p(x,y) viene dado por:

    ),1().1(),(.),( yxHfyxZfyxH

    Donde:

    Z(x,y) es la imagen de entrada

    El factor de peso f es una funcin no linear de ),1(),( yxHyxZ , con 0

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 39

    2.6.2.8. MTODO DE PARKER, 1991

    Este mtodo inicialmente detecta bordes, y luego rellena el interior de objetos entre

    bordes.

    Para cada pxel p(x,y) en la imagen de entrada Z(x,y) se calcula:

    )),(),((),(8..1 iii

    yxZyxZyxD min

    Donde:

    p(xi,yi), con i variando de 1 a 8 son los 8 vecinos conectados del punto p(x,y)

    De este modo se calcula el negativo del gradiente en la direccin del pxel vecino con

    ms brillo (luminancia).

    A continuacin se divide D en regiones de tamao r x r y para cada regin se calcula la

    media de la muestra y la desviacin estndar. Ambos valores se suavizan y se interpolan

    bilinearmente para dar lugar a las imgenes M y S, originadas respectivamente de los

    valores de la media y la desviacin.

    Entonces, para un pxel p(x,y) podemos considerar los siguientes casos:

    Si 0),( myxM 0),( syxS el pxel es marcado como parte de una regin

    lisa y permanecer no marcado.

    Si ),(.),(),( yxSkyxMyxD entones el pxel p(x,y) pasa a ser marcado

    como imprimible, pxel que va a pertenecer a un objeto.

    En otro caso el pxel permanece como no marcado.

    La imagen binaria resultante aparece con los bordes muy marcados.

    Seguidamente se le realiza una agregacin de pxeles y pasos de crecimiento de la

    regin para localizar las partes restantes de los objetos que van a ser imprimibles.

    Los siguientes parmetros proporcionan resultados aceptables:

    0.1,0.1,0.1,16 00 ksmr

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 40

    2.6.3. OTROS MTODOS DE BINARIZACIN DE IMGENES En este apartado se estudian aquellos mtodos de binarizacin que por su naturaleza no

    pueden ser considerados como globales ni como locales.

    2.6.3.1. MTODO WELLNER, 1993

    Este mtodo se basa en encontrar un umbral por pxel de una manera rpida, y da

    segmentaciones sorprendentemente buenas. Se disea para imgenes que contienen

    textos (por ejemplo: Textos Escaneados). En este caso la iluminacin puede ser buena,

    como puede ser la calidad de una imagen en general.

    Un promedio mvil es simplemente el significado del nivel de gris de los ltimos n

    pxeles vistos. La imagen puede tratarse como un array mono-dimensional de pxeles,

    que es comn en lenguajes de programacin (como C), y el promedio se calcula

    exactamente o estimado por medio de:

    Mi1 Mi

    Min gi1

    donde Mi+1 es la estimacin del promedio mvil para el pxel i+1 cuyo nivel gris es g i+1

    y Mi es el promedio mvil anterior.

    Cualquier pxel menor a un porcentaje fijo de su promedio mvil pertenece al conjunto

    de pxeles negro; de otra manera al conjunto de blanco. Para evitar una predisposicin

    para un de lado de la imagen sobre el otro.

    Se cruzan pxeles en direcciones opuestas en cada lnea nueva. Esto es, el pxel

    siguiente al ultimo de la fila i es el ltimo en la fila i+1, seguido por el penltimo de la

    fila i+1, y as asta llegar al primer pxel de la fila i+1; este es seguido por el pxel que

    de comienzo de la fila i+2. Esto evita la discontinuidad al final de la lnea que ocurre en

    lenguajes de programacin como C al usar una estructura de array bidimensional.

    El proceso comienza con una estimacin del promedio mvil; un valor de 127 x n se

    selecciona como primer Mi, esto solo afectar los primeros pxeles en la imagen. El

    valor de n usado es el nmero de columnas dividido por 8. Ahora la ecuacin de abajo

    se usa para computar la estimacin del promedio mvil para el prximo pxel (el

    primero), que se usa inmediatamente como un umbral.

    Donde V es el valor que tomar el pxel y pct es el valor del porcentaje fijo; El valor

    ms comn empleado para pct es 15, debido a que este da buenos resultados en general.

    g i

    M in

    100pct

    1000

    si 255 en otro

    caso

    V

    =

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 41

    2.6.3.2. MTODO DE LOS UMBRALES POR REGIONES

    Este mtodo aunque puede ser considerado como mtodo local, lo he puesto en este

    apartado, ya que no pertenece a ningn autor, es un ejemplo que aparece como

    introdcuccin a los mtodos locales en el libro de J.R. Parker.

    Los umbrales regionales son determinados por las regiones que las requieren, y por

    cmo son los tamaos de dichas regiones. Una vez que este terminado, puede que

    previamente se discuta los algoritmos que deben ser usados para conseguir un umbral

    para cada una de las regiones, dichos umbrales simplificarn la realizacin de los

    clculos. El nmero de regiones pueden simplemente ser fijado, al decidir romper la

    imagen original en M subimagenes.

    Este mtodo calcula el umbral usando una seleccin iterativa de 21 x 21 regiones

    centrado en cada pxel. El umbral encontrado en cada regin ser usado solamente

    como umbral del pxel que est en el centro, consiguiendo un umbral por cada pxel. Por

    supuesto, habr 10 pxeles por el margen exterior y por alrededor de la imagen que no

    conseguir calcular el umbral, pero que ser fijado posteriormente.

    Esto es lo menos que puede ser esperado, pero hay una explicacin simple. El

    algoritmo de clculo de umbral aplicado a cada regin intenta dividir los pxeles en dos

    grupos, objetos y fondos, igualados cuanto la regin no contenga ejemplos de ambas

    clases. Cuando la regin consiste solo en pxeles de fondo el algoritmo intenta tambin

    resistirse, y crea dos clases donde solo uno es verdadero. Por consiguiente esto es

    necesario, cuando se usa los mtodos regionales, seguramente al construir cualquiera de

    cada una de las regiones contienen un ejemplo de ambos pxeles, tanto de objetos como

    de fondos, o no se intenta calcular el umbral cuando solo existe una clase de pxel.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 42

    2.7. COMPONENTES CONEXAS DE UNA IMAGEN

    Definicin: Una componente conexa es un conjunto de pxeles tal que para cualquier

    par de pxeles del conjunto, existe un camino digital que los une.

    Recordatorio: 4-Adyacencia

    Si un pxel se encuentra en posicin (x,y), recordemos que sus vecinos pueden ser:

    Figura 11. 4-Adyacencia

    Para el caso de 8-Adyacencia, adems de estos, tambin son vecinos los (x-1,y-1),

    (x+1,y-1), C(x-1,y+1) y D(x+1,y+1).

    2.7.1 ALGORITMO PARA EL ETIQUETADO DE COMPONENTES CONEXAS

    El siguiente algoritmo es uno de los posibles para realizar esta funcin. A continuacin

    lo describo como se hace en la teora de la asignatura Procesamiento de Imgenes Digitales de 5 de Ingeniera Informtica de la Universidad de Sevilla.

    Recorremos la imagen de izquierda a derecha y de arriba a abajo.

    Durante el primer rastreo, para cada punto que tenga valor 1, examinamos a los

    vecinos de arriba y a mano izquierda de P; ntese que si existen, acaban de ser

    visitados por el rastreo, as que si son 1s, ya han sido etiquetados.

    Si ambos son 0s, damos a P una nueva etiqueta;

    si tan slo uno es 0, le damos a P la etiqueta del otro;

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 43

    y si ninguno es 0s, le damos a P (por ejemplo) la etiqueta del de la izquierda, y

    si sus etiquetas son diferentes, registramos el hecho de que son equivalentes,

    i.e., pertenecen a la misma componente.

    Cuando se completa este rastreo, cada 1 tiene una etiqueta, pero puede que se asignen

    muchas etiquetas diferentes a puntos en el mismo componente. Ahora ordenamos las

    parejas equivalentes en clases de equivalencia, y escogemos una etiqueta para

    representar cada clase. Finalmente, realizamos un segundo rastreo de la imagen y

    sustituimos cada etiqueta por el representante de cada clase; cada componente ha sido

    ahora etiquetada de forma nica.

    Si consideramos al 8-adyacencia para negro, para cada pxel P(x,y) en negro,

    examinamos los pxeles superiores A(x+1,y-1), B(x,y-1), C(x-1,y-1) y D(x-1,y).

    Si todos sus vecinos son blancos, damos al actual pxel una etiqueta nueva.

    En otro caso, si uno de sus vecinos es negro, al pxel P le damos la misma

    etiqueta que la del pxel negro.

    Si dos o ms pxeles son negros, le damos a P una de las etiquetas y anotamos

    que dichas etiquetas son equivalentes.

    El proceso de equivalencia y re-etiquetado se realiza como en el caso de 4-adyacencia.

    En la pgina web de la asignatura citada ( http://www.us.es/gtocoma/pid/ ), se detalla

    este algoritmo con un ejemplo prctico.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 44

    2.7.2 COMPONENTES CONEXAS DE N PXELES, Ns(T)

    Definicin: Ns(t) es el nmero de componentes conexas con un tamao de al menos s

    pxeles en una imagen binarizada con umbral t.

    Como umbral, t debe estar comprendido en el intervalo [0, 255].

    s se suele tomar de un conjunto de valores de resoluciones R.

    Esta definicin es importante, ya que permite obtener caractersticas de la imagen .

    Un ejemplo de esto es la granularidad, muy usado en el para imgenes que representan

    texturas.

    Segn esta caracterstica, una imagen se considerar:

    Muy granulosa: Si el nmero de componentes conexas cambia rpidamente cuando tomamos valores umbrales cercanos.

    Poco granulosa: Si el nmero de componentes conexas no vara al ir cogiendo distintos valores umbrales cercanos.

    Con esto vemos que gracias al estudio de las componentes conexas de N pxeles

    podemos obtener un enfoque para caracterizar. En el ejemplo anterior se caracterizaban

    imgenes que representan texturas.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 45

    2.8. VALORES ESTADSTICOS DE UNA IMAGEN EN BLANCO Y NEGRO

    La media de una serie estadstica nos proporciona una idea de sus caractersticas, pero

    esta informacin es insuficiente. Por ejemplo, una imagen puede tener una determinada

    media de pxeles negros pero desigualmente distribuida, con algunas zonas con muchos

    pxeles negros, y otras con apenas alguno. De estas observaciones, surge la necesidad de

    utilizar las medidas de dispersin, las ms importantes son la desviacin media y la

    desviacin cuadrtica media o desviacin estndar.

    Definicin: Media aritmtica

    Una de las medidas que caracterizan a una distribucin es la media aritmtica, que se

    obtiene sumando los valores xi introducidos, y dividiendo entre el nmero total N..

    La media de pxeles negros de una imagen en blanco y negro, se obtendra de la

    siguente forma:

    MN

    jipV

    x

    M

    i

    N

    j

    n*

    )),((1 1

    , siendo N*M las dimensiones de la imagen,

    V(p(i,j)) = 1 si p(i,j) representa a un pxel negro y

    V(p(i,j)) = 0 si p(i,j) representa a un pxel blanco.

    La media de pxeles blancos de una imagen en blanco y negro, se obtendra de la

    siguente forma:

    MN

    jipV

    x

    M

    i

    N

    j

    n*

    )),((1 1

    , siendo N*M las dimensiones de la imagen,

    p(i,j) = 1 si p(i,j) representa a un pxel blanco y

    p(i,j) = 0 si p(i,j) representa a un pxel negro.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 46

    Medidas de dispersin

    Se denomina desviacin, a la diferencia entre un valor y la media aritmtica de la serie

    estadstica, di=xi-. La desviacin media es la media aritmtica de los valores

    absolutos de todas las desviaciones. Su frmula es

    La desviacin media de pxeles negros de una imagen en blanco y negro, se obtendra

    de la siguente forma:

    MN

    pnMediajipV

    x

    M

    i

    N

    j

    n*

    _)),((1 1

    , siendo N*M las dimensiones de la imagen,

    V(p(i,j)) = 1 si p(i,j) representa a un pxel negro y

    V(p(i,j)) = 0 si p(i,j) representa a un pxel blanco.

    La desviacin media de pxeles blancos de una imagen en blanco y negro, se obtendra

    de la siguente forma:

    MN

    pbMediajipV

    x

    M

    i

    N

    j

    n*

    _)),((1 1

    , siendo N*M las dimensiones de la imagen,

    p(i,j) = 1 si p(i,j) representa a un pxel blanco y

    p(i,j) = 0 si p(i,j) representa a un pxel negro.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 47

    La desviacin cuadrtica media es la raz cuadrada de la varianza, es decir, de la media

    aritmtica de los cuadrados de las desviaciones respecto a la media.

    Podemos obtener la varianza de pxeles negros y pxeles blanco a para una imagen a

    partir de esta expresin.

    La varianza de pxeles negros de una imagen en blanco y negro, se obtendra de la

    siguente forma:

    MN

    pnMediajipV

    x

    M

    i

    N

    j

    n*

    _)),((1 1

    2

    , siendo N*M las dimensiones de la

    imagen,

    V(p(i,j)) = 1 si p(i,j) representa a un pxel negro y

    V(p(i,j)) = 0 si p(i,j) representa a un pxel blanco.

    La desviacin media de pxeles blancos de una imagen en blanco y negro, se obtendra

    de la siguente forma:

    MN

    pbMediajipV

    x

    M

    i

    N

    j

    n*

    _)),((1 1

    2

    , siendo N*M las dimensiones de la

    imagen,

    p(i,j) = 1 si p(i,j) representa a un pxel blanco y

    p(i,j) = 0 si p(i,j) representa a un pxel negro.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 48

    3. ANLISIS TEMPORAL Y DE COSTES DE DESARROLLO 3.1. CUADERNO DE TIEMPO SEMANAL

    Semana

    T.

    Total

    T.

    Interr

    T.

    Activo

    T.

    Tutora

    T.

    Desarr.

    T.

    Investig.

    T.

    Memoria

    Descripcin Tareas

    Realizadas

    28 Marzo

    03 Abril

    1:00 0:00 0:00 1:00 0:00 0:00 0:00 Adjudicacin del

    proyecto fin de carrera

    04 Abril 10 Abril

    12:00 2:00 10:00 0:00 10:00 0:00 0:00 Operaciones con

    imgenes en .NET

    11 Abril 17 Abril

    11:00 1:00 10:00 0:00 5:00 0:00 5:00 Modelos de color, de

    color a grises

    18 Abril 24 Abril

    10:00 0:00 10:00 0:00 5:00 0:00 5:00 Modelos de color, de

    color a grises

    25 Abril 01 Mayo

    7:00 0:00 7:00 0:00 0:00 7:00 0:00 Bsqueda de

    informacin

    02 Mayo 08 Mayo

    16:00 3:00 13:00 1:00 10:00 2:00 0:00 Clases implementacin,

    09 Mayo 15 Mayo

    14:45 3:00 11:45 0:00 10:00 1:45 0:00 Clases

    implementacin,Mtod

    os Globales

    16 Mayo 21 Mayo

    13:15 00:15 13:00 0:00 12:00 1:00 0:00 Mtodos Globales,

    Busqueda de

    informacin

    23 Mayo 29 Mayo

    16:00 0:00 16:00 0:00 10:00 6:00 0:00 Mtodos Globales

    30 Mayo 05 Junio

    16:00 1:00 15:00 0:00 10:00 5:00 0:00 Mtodos Globales,

    busqueda de

    informacin

    06 Junio 12 Junio

    15:30 1:30 14:00 0:00 14:00 0:00 0:00 Mtodos Globales

    13 Junio 18 Junio

    11:30 0:30 11:00 0:00 11:00 0:00 0:00 Otros Mtodos

    19 Junio 26 Junio

    12:00 0:00 12:00 0:00 12:00 0:00 0:00

    Mtodos Globales

    27 Junio 03 Julio

    4:00 0:00 4:00 1:00 0:00 3:00 0:00 Operaciones sobre

    imgenes

    04 Julio 10 Julio

    17:45 1:30 16:15 0:00 12:00 00:45 3:30 Mtodos locales,

    Memoria, Estudio

    terico

    11 Julio 17 Julio

    18:00 0:30 17:30 0:00 15:00 0:00 2:30 Mtodos locales,

    Estudio terico

    18 Julio 24 Julio

    17:15 1:00 16:15 0:00 10:15 1:00 5:00 Mtodos locales,

    Estudio terico

    25 Julio 30 Julio

    17:00 2:00 15:00 0:00 6:00 0:00 9:00

    Mtodos locales,

    Estudio terico

    01 Agost

    07 Agost

    24:00 0:00 24:00 1:00 21:00 0:00 2:00 Manual Usuario,

    interfaz grafica

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 49

    08 Agost

    14 Agost

    23:00 2:00 21:00 0:00 15:00 0:00 6:00 Manual Usuario,

    interfaz grafica

    15 Agost

    21 Agost

    20:00 0:00 20:00 0:00 6:00 0:00 14:00 Manual Usuario,

    interfaz grafica

    22 Agost

    28 Agost

    15:00 0:00 15:00 0:00 4:00 0:00 11:00 Manual Usuario,

    interfaz grafica

    29 Agost

    04 Sept

    12:30 0:00 12:30 1:30 4:00 0:00 7:00 Componentes conexas,

    estadsticas

    05 Sept 11 Sept

    11:00 0:00 11:00 0:00 1:00 0:00 10:00 Memoria

    12 Agost

    18 Sept

    16:30 0:00 16:30 0:00 1:30 0:00 15:00 Memoria

    3.2. CUADERNO DE TIEMPO MENSUAL

    Mes

    T.

    Total

    T.

    Interr

    T.

    Activo

    T.

    Tutora

    T.

    Desarr.

    T.

    Investig.

    T.

    Memoria

    Marzo 1:00 0:00 1:00 1:00 0:00 0:00 0:00

    Abril 40:00 3:00 37:00 0:00 20:00 7:00 10:00

    Mayo 60:00 6:15 53:45 1:00 42:00 10:45 0:00

    Junio 55:00 3:00 52:00 0:00 47:00 5:00 0:00

    Julio 74:00 5:00 69:00 1:00 43:15 4:45 20:00

    Agosto 82:00 2:00 80:00 1:00 46:00 0:00 33:00

    Septiembre 40:00 0:00 40:00 1:30 6:30 0:00 32:00

    3.3. CUADERNO DE TIEMPO TOTAL

    Total

    T.

    Total

    T.

    Interr

    T.

    Activo

    T.

    Tutora

    T.

    Desarr.

    T.

    Investig.

    T.

    Memoria

    352 19:15 332:45 5:30 204:45 27:30 95

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 50

    4. ANLISIS DE REQUISITOS, DISEO E IMPLEMENTACIN

    4.1. ANLISIS DE REQUISITOS

    4.1.1 INTRODUCCIN

    Todos los requisitos funcionales y no funcionales especificados en esta memoria han

    sido resueltos en la aplicacin.

    4.1.2 REQUISITOS FUNCIONALES

    El posible cliente de la aplicacin necesitar que se cumplan los siguientes requisitos.

    Aplicacin didctica: La aplicacin no slo debe ser efectiva sino adems didctica. Presentar toda la

    informacin terica y de ayuda al usuario en todas las fases.

    Aplicacin directa: Aparte de la cuestin de que debe ser didctica debe presentar una opcin que

    permita al cliente ejecutar la aplicacin directamente sin pasos previos. Debe tenerse en

    cuenta que el usuario puede ser inexperto as pues este apartado debe ser lo ms sencillo

    posible. La interaccin del usuario con la aplicacin debe ser muy sencilla, es decir, el

    usuario no debe tener que especificar parmetros engorrosos y cada parmetro deber

    estar perfectamente descrito.

    Presentacin de solucin: La solucin debe ser lo ms clara posible. En caso de que cualquier operacin no

    haya sido correcta debe comunicarlo con un mensaje

    Uso del programa por cliente experto: Un cliente que se halla ledo el manual del usuario tiene la posibilidad de cambiar

    los diferentes parmetros que modificarn el comportamiento de la aplicacin,

    mejorando su efectividad.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 51

    4.1.3 REQUISITOS NO FUNCIONALES

    Coste computacional Adems las caractersticas deben contar con otros requerimientos como son que

    tengan un bajo gasto computacional, tanto en tiempo como en complejidad. Debido a

    estos motivos es muy difcil conseguir unas caractersticas ptimas.

    Modulacin: La aplicacin debe estar estructurada modularmente ya que debe permitir la

    incorporacin de nuevos mdulos que extienda su utilizar o su eficiencia. La aplicacin

    estar estructurada en formularios. Cada formulario tendr asociado una o ms clases y

    cada una de las clases podrn delegar en otras clases para realizar su cometido.

    Encapsulacin: La aplicacin estar perfectamente encapsulada de tal forma que sea fcil su

    instalacin. La aplicacin se instalar bajo en directorio que el propio usuario elegir en

    el proceso de instalacin.

    Posibilidad de ampliacin Al estar perfectamente modulada, la aplicacin permitir ampliacin simplemente

    aadiendo nuevos mdulos. Las posibles ampliaciones pueden estar dirigidas a nuevos

    mdulos que implementen otros algoritmos matemticos para la binarizacin de

    imgenes en escalas de grises.

    ROI Esta aplicacin generar un buen ROI (retorno de inversin). En este caso, al ser un

    Proyecto informtico no est orientado para el comercio. Pero siempre cabe la

    posibilidad de un retorno de inversin tecnolgico que permita agrandar la herramienta.

    Cabe tambin la posibilidad de un retorno de inversin financiero una vez que la

    herramienta est ms desarrollada y apetecible para el usuario, ya que hay que recordar que esta versin es una beta destinada al aprendizaje de los mtodos de

    binarizacin existentes.

    Usabilidad Tiene que ser de fcil uso para el cliente. Tiene la posibilidad de dos alternativas

    distintas.

    Cliente inexperto: no tiene por que manejar los distintos factores que modifiquen

    algunos de los mtodos implementados, dejando los valores por defecto de dichos

    mtodos, que suelen dar buenos resultados.

    Cliente experto: Una vez ledo el manual del usuario y con conocimientos sobre

    tratamientos de imgenes, el cliente tiene la capacidad de modificar los distintos

    factores que permitan una binarizacin de la imagen con todo el detalle que desee.

    Integridad: La aplicacin, al basarse en tecnologa .NET presenta una gran integridad y

    facilidad de instalacin. Simplemente deber ejecutarse el instalador para poder instalar

    la aplicacin en el directorio elegido. Ser necesario instalar previamente el framework

    de .NET antes de realizar la instalacin si no se encuentra en el sistema.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 52

    Portabilidad: Estos requisitos definen qu caractersticas deber tener el software para que sea

    fcil utilizarlo en otra mquina o bajo otros sistemas operativos.

    En este caso puede funcionar bajo los siguientes sistemas operativos:

    a. Windows 2000

    b. Windows 2003

    c. Windows XP

    Fiabilidad: Estos requisitos deben establecer los factores que se requieren para la fiabilidad del

    software en tiempo de explotacin.

    Mide la probabilidad del sistema de producir una respuesta satisfactoria a las demandas

    del usuario.

    La tasa de fallos de la aplicacin no podr ser superior a 2 fallos por cada 500 imgenes

    tratadas.

    Eficiencia: Los tratamientos de imgenes deben ser lo ms rpido posible en tiempo de

    ejecucin y con el menor de errores. La eficiencia de las operaciones de binarizacin de

    una imagen en escala de grises est sujeta al mtodo de binarizacin elegido.

    Para los dems algoritmos de la aplicacin, aquellos tratamientos de imgenes que

    no pertenecen a un mtodo de un autor, se han escogidos los ms eficientes posibles

    tanto en rapidez, esfuerzo y efectividad.

    Fcil mantenimiento La modulacin del proyecto permite un fcil mantenimiento por parte de una

    persona ajena a la construccin del mismo. Todas las funciones estn perfectamente

    detalladas y el cdigo fuente tambin contiene breves explicaciones que harn ms fcil

    el mantenimiento.

    Facilidad de prueba: La aplicacin es fcilmente sometible a pruebas por parte de un usuario debido a su

    alta interactividad con el mismo. El poder trabajar con mltiples imgenes al mismo

    tiempo facilita mucho la aplicacin de pruebas con todo tipo de imgenes y la

    comparacin de resultados.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 53

    4.1.4 OTROS REQUISITOS

    Requisitos de interfaz de usuario Este tipo de requisitos especifica las caractersticas que deber tener el sistema en

    su comunicacin con el usuario.

    En la aplicacin lo nico que se pide es que sea sencilla para el manejo del usuario y

    genere resultados correctos. Adems la interfaz de la aplicacin debe ser del tipo MDI

    (Multiple Document Interface) para permitir poder trabajar simultneamente con varios

    documentos.

    Estos requisitos deben establecer los factores que se requieren para la fiabilidad del

    software en tiempo de explotacin.

    Mide la probabilidad del sistema de producir una respuesta satisfactoria a la

    demanda del usuario.

    La tasa de fallos de la aplicacin no podr ser superior a 2 fallos por cada 500 imgenes

    tratadas.

    Requisitos de entorno de desarrollo Este tipo de requisitos especifican si el sistema debe desarrollarse con un producto

    especfico.

    En el caso de la aplicacin necesito en entorno Visual Studio .Net 2.0 o superior.

  • Proyecto Fin de Carrera. Mtodos de Binarizacin de imgenes en niveles de gris

    Jos Manuel Delgado Romero 54

    4.2. DISEO

    4.2.1 OBJETIVOS DEL DISEO

    La idea a la hora de disear la aplicacin es bien simple, partir de una imagen a color y

    convertirla en una imagen en blanco y negro.

    partimos de una imagen en color, a la que se le puede hacer un preprocesamiento y

    seguir siendo una imagen a color o bien haberse convertido en una imagen en escala de

    grises tras haberle aplicado el procesamiento adecuado.

    Una vez estamos trabajando con una imagen en escala de grises, a esta se le pueden

    seguir efectuando operaciones (seguir llamndolas preprocesamiento) mantenindose

    como imagen en escala de grises, o bien realizarle un proceso de binarizacin con lo

    cual la imagen se convertira en una imagen en blanco y negro.

    Con la imagen en blanco y negro, que es nuestro objetivo, podremos realizar ciertas

    operaciones, que llamaremos operaciones de postprocesamiento.

    La siguiente figura explica este proceso vindo