23
UNIVERSIDAD DE CUENCA FACULTAD DE INGENIERIA ESCUELA DE INFORMATICA COMPRESION DE IMÁGENES DIGITALES USANDO REDES NEURONALES ARTIFICIALES Por Jonnathan Ambrosi

Ambrosi jonnathan compresion_imagenes_rna_presentacion

Embed Size (px)

Citation preview

UNIVERSIDAD DE CUENCAFACULTAD DE INGENIERIA

ESCUELA DE INFORMATICA

COMPRESION DE IMÁGENES DIGITALES USANDO REDES NEURONALES ARTIFICIALES

Por Jonnathan Ambrosi

Agenda

Resumen Introducción Planteamiento del problema Red neuronal y Función Objetivo Problemas Descripción de la implementación Resultados Conclusiones Referencias

Resumen

Este video tiene como objetivo dar ha conocer una forma de implementar una aplicación básica capaz de comprimir imágenes usando la teoría de Redes Neuronales Artificiales (RNA) junto con el lenguaje de programación java y además contrastar el rendimiento de esta, con otras aplicaciones del mismo tipo.

Introducción

En el mundo de la informática cada día surgen más aplicaciones en las que las imágenes digitales son de gran importancia, nos encontramos en la llamada sociedad de la información invadidos por innumerables medios, estos manejan múltiples recursos como imágenes que entre toda información son los que más capacidad exigen por lo que la gran tarea es mejorar la eficiencia en su transmisión y posterior almacenamiento.

Introducción

No obstante la capacidad de los dispositivos actuales para el almacenamiento de la información ha crecido de forma exponencial, sin embargo el tamaño, cantidad y calidad de las imágenes también lo que ha, dado lugar al desarrollo de distintas técnicas de compresión de la información.

Planteamiento del problema

Una imagen digital es una matriz que se encuentra almacenada en algún dispositivo, cada componente de esta matriz es denominado como pixel, este alberga un número que representa un determinado color.

Planteamiento del problema

El objetivo es buscar la forma de almacenar la matriz de representación lógica, tratando de disminuir el tamaño necesario para su almacenamiento.Ahora vamos ha analizar la matriz de otra forma un poco más formal.

Representación primer enfoque

Una imagen digital de k=m x n pixeles puede ser descrita mediante una función en un sistema coordenado de dos dimensiones (x, y) en donde x representa los pixeles que necesariamente será un valor entero entre [1, k] e y representa el color correspondiente a cada pixel.

Representación primer enfoque

Lo que nos interesa es encontrar esta función ya que nos permitirá recuperar la imagen digital sin necesidad de tener almacenada la matriz de representación lógica, la siguiente figura se aprecia una representación.

Representación segundo enfoque

También es posible describir la imagen mediante una función en un sistemas de tres dimensiones (x, y, z) en donde x representa el número de fila, y representa el número de columna y z representa el color de pixel dado por (m, n) en la siguiente figura se observa su representación

Representación segundo enfoque

No es nada fácil hallar la ecuación matemática que necesitamos, pero también es una alternativa interpolarla o aproximarla y es aquí donde se puede usar un interpolador de alto nivel como lo es una red neuronal artificial.

Red neuronal y función objetivo

El set de entrenamiento de nuestra red neuronal artificial (RNA) contendrá k entradas con k salidas, esto surge de la representación de la matriz mediante una función, la red será entrenada con el fin de que aprenda la función.

Luego se almacenara una pequeña matriz con los pesos de la red.

Consideraciones

Hay que notar que el dominio de nuestra función se encuentra en [1, k] y además que no nos interesara la salida de la RNA para entradas entre dos número enteros consecutivos que pertenecen al dominio de nuestra función.

Problemas

Al momento nuestro sistemas parece ideal sin embargo se presentan algunos problemas y de la solución de ellos dependerá el éxito o fracaso de esta técnica de compresión de imágenes.

Consumo de tiempo para entrenamiento

Por cada foto que procedamos a comprimirla, nuestra red se deberá entrenar para aprenderla o recordarla, lo cual significa un entrenamiento recurrente no común en los sistemas tradicionales de redes donde primero se entrenan y luego se ponen en marcha por tiempos prolongados.

Arquitectura de la Red Neuronal

Este es el mayor inconveniente la arquitectura de capas-neuronas de una RNA no es nunca constante y en ocasiones no depende del problema pues en la mayoría de las ocasiones es dada por la experiencia del entrenador, además sabemos que el proceso de fijación de la arquitectura es un proceso de intento y error en ocasiones muy tedioso y demorado.

Resultados del compresor de imágenes usando RNALa imagen a comprimir es una imagen de 800x600 píxeles, el consumo inicial de memoria de esta imagen es:

Tamaño en disco: 1.37 MB (1.441.792 bytes). Tamaño en disco Winzip 432 KB (442.368 bytes). Tamaño en disco Winrar 416 KB (425.984 bytes).

En este caso la función objetivo es una función con dominio comprendido entre 0 y 480000 (pixeles) y un rango de 0 y 64000(colores).

Resultado

Imagen Original Imagen recuperada

Diseño de la red neuronal

Diseño de la red neuronal

Arquitectura. Numero de capas 4. Distribución capas 1-100-50-1.Parámetros de la RNA que se almacenaran. cantidad de pesos 100+100*50+50=5150 cantidad de bias 1+100+50+1=152 Total 5150+152=5302 5302 << 800*600

Conclusiones Definitivamente el uso de redes neuronales artificiales

(RNA) en diferentes ámbitos va en aumento debido a sus buenos acercamientos y relativa complejidad, además de las múltiples herramientas que nos permiten la manipulación de estas estructuras.

• En el área de compresión de imágenes se presentan muchas dificultades a la hora de implementar estas aplicaciones principalmente en la definición de los parámetros de la Red neuronal para ello se necesita de un sistema experto en ocasiones el ser humano.

Conclusiones

Sin embargo en cuanto al tiempo necesario para comprimir y descomprimir la imagen digital a partir de los parámetros de la red neuronal esta muy por detrás de las aplicaciones como las mencionadas anteriormente principalmente esto se debe que para cada imagen la RNA se debe reentrenar haciendo de esta característica un gran inconveniente.

Referencias[1] Kaschel C., Héctor, Watkins, Francisco, San Juan U., Enrique.COMPRESIÓN DE VOZ MEDIANTE TÉCNICAS DIGITALES PARA EL PROCESAMIENTO DE SEÑALES YAPLICACIÓN DE FORMATOS DE COMPRESIÓN DE IMÁGENES.Revista Facultad de Ingeniería, Vol. 13, núm. 3, 2005.UNIVERSIDAD DE TARAPACA CHILE.

[2]Roldán Hernández, Álvaro Fernando, Lugo Currea, Néstor Andrés, Gaona Barrera, Andrés Eduardo.ESTUDIO DE DOS ESTRUCTURAS NEURONALES FEED-FORWARD PARA LA COMPRESION DEIMÁGENES DIGITALES.Revista Facultad de Ingeniería, núm. 65, diciembre, 2012.UNIVERSIDAD DE ANTIOQUIA MEDELLIN, COLOMBIA

[3]Serna Encinas, María Trinidad; Gómez Almeida, Guillermo; Rose Gómez, César EnriqueALGORITMO DE COMPRESION DE DATOS PARA LA ARQUITECTURA MOLAPConciencia Tecnológica, núm. 43, enero-junio, 2012.Instituto Tecnológico de AguascalientesAguascalientes, México