31
GESTIÓN DE DOCUMENTOS DIGITALES Elsy Patricia Muñoz Gómez Jeimy Paola Ariza Rodríguez Leonardo Calderón Mejía Carmen Paola Reyes Universidad del Quindío Facultad de Ciencias Humanas y Bellas Artes Ciencia de la Información y la Documentación Bibliotecología y Archivística Bogotá, junio de 2010 Presentado a: Jorge Mario Zuluaga Campuzano

Eje temático 4 Digitalización Definitivo

Embed Size (px)

DESCRIPTION

DigitalizaciónUsosAplicacionesEquipos de captura.

Citation preview

Page 1: Eje temático 4 Digitalización Definitivo

GESTIÓN DE DOCUMENTOS DIGITALES

Elsy Patricia Muñoz GómezJeimy Paola Ariza Rodríguez

Leonardo Calderón Mejía Carmen Paola Reyes

Universidad del Quindío Facultad de Ciencias Humanas y Bellas ArtesCiencia de la Información y la Documentación

Bibliotecología y ArchivísticaBogotá, junio de 2010

Presentado a:

Jorge Mario Zuluaga Campuzano

Page 2: Eje temático 4 Digitalización Definitivo
Page 3: Eje temático 4 Digitalización Definitivo

1.1. ¿QUÉ ES DIGITALIZACIÓN?

Es el proceso de convertir una imagen en papel a una imagen que puede ser reconocida en su totalidad por un computador.

Técnica que permite la reproducción de información que se encuentra de manera analógica (papel, video, sonido, cine, microfilm y otros) en otra, que sólo puede ser leída o interpretada por computador.

Conversión de documentos a formato digital mediante un procedimiento de captura, tratamiento y almacenamiento, con la finalidad de preservar, conservar y difundir la información en ellos contenida.

Page 4: Eje temático 4 Digitalización Definitivo

Elimina el extravío de documentos.

Permite un acceso rápido y fácil a la

información.

Permite almacenar información en

múltiples formatos electrónicos.

Controla el acceso a la información.

Mejora los tiempos de acceso para la

búsqueda de documentos.

Permite simultaneidad de usuarios en el

mismo documento.

1.2. ¿POR QUÉ DIGITALIZAR?

Page 5: Eje temático 4 Digitalización Definitivo

A partir del siglo XV, y gracias a la prensa de tipos móviles inventada por el alemán Johann Gutenberg, la sociedad conoció un espacio antes prácticamente inexistente: la república de las letras, llamada así porque terminó siendo un lugar al que la sociedad comenzó a trasladar sus ideas y conocimientos en forma de letras: los libros. La posibilidad de imprimir muchas copias de libros de manera rápida y relativamente barata generó varios fenómenos.

En primer lugar hizo posible que el conocimiento humano existente hasta ese momento y expresado en unas pocas copias de libros hechas a mano, pudiera difundir a un mayor número de personas impresas. El número de lectores comenzó a crecer. La amplia difusión de conocimientos que posibilitó la imprenta, sirvió de fermento para la generación de nuevos conocimientos, que a su vez quedaron plasmados en nuevos libros.

1.3. HISTORIA

Page 6: Eje temático 4 Digitalización Definitivo

1.4. TIPOS DE DIGITALIZACIÓN

Retrospectiva: tiene como objetivo

garantizar la conservación y

facilitar la difusión en línea de los

documentos de un fondo o

colecciones de archivo y,

generalmente, no coincide con la

eliminación de los originales.

Sistemática: usada por las organizaciones que tienen un sistema de

gestión de documentos electrónicos. Genera una copia de uso

interno del documento recibido, que se puede convertir en una

copia auténtica y sustituir al original mediante el sello o la firma

electrónica.

Page 7: Eje temático 4 Digitalización Definitivo

1.5. APLICACIONES

Velocidad y facilidad de consulta. Distribución en red.

Capacidad de mejorar imágenes de documentos en mal estado.

Versatilidad en el manejo de diferentes tipos de documentación.

Consulta de una misma información por varios usuarios a la vez.

Preservación y conservación documental.

Manipulación y distribución de la información, con facilidad y rapidez

Page 8: Eje temático 4 Digitalización Definitivo
Page 9: Eje temático 4 Digitalización Definitivo

2.1. FASES DE LA DIGITALIZACIÓN

I. PREPARACIÓN DE LA DOCUMENTACIÓN

El procedimiento con la documentación recibida es el siguiente:

• Consideración de la situación legal del documento.• Eliminación de sobres. • Extraer documentación de carpetas o fundas.• Documentación anexa a expurgar. • Eliminación de grapas u otros elementos extraños si dicha documentación va a ser digitalizada. • Clasificación por tipología documental. • Asignar a cada grupo de trabajo su documentación. • Creación de lotes de trabajo.

Page 10: Eje temático 4 Digitalización Definitivo

Mediante este proceso conseguimos la obtención de la imagen del documento físico. Una vez realizado el paso anterior, se procederá a la digitalización de los documentos, mediante escáneres, que según las necesidades del trabajo serán de:

Alta producción. A0, planos.Verticales para documentos

encuadernados en libros.Doble cara, color.

La digitalización le ofrece diferentes posibilidades de tratamientoelectrónico de su documentación:

II. DIGITALIZACIÓN

Page 11: Eje temático 4 Digitalización Definitivo

O.C.R. (reconocimiento óptico de caracteres). Lectura de marcas. Lectura de Códigos de Barra. Lectura por zonas. Generación de ficheros PDF, TIF, JPG, etc. Las imágenes digitalizadas: Pueden ser visualizadas en un monitor. Impresas sobre papel. Enviadas a terminales remotos mediante red interna o externa. Enviadas por correo electrónico. Guardadas en su disco duro para utilizarlas en sus informes o trabajos.

Page 12: Eje temático 4 Digitalización Definitivo

En esta fase se realizan una serie de controles de calidad, habituales, entre estos se encuentran:

Control del número de documentos digitalizados.

Verificación de la calidad de las imágenes.

Proceso de centrado del documento escaneado.

III. CONTROL DE CALIDAD

Page 13: Eje temático 4 Digitalización Definitivo

• En esta fase lo que se hace es grabar una información, acordada previamente con el cliente, a la imagen del documento digitalizado, de forma que permita una búsqueda sencilla por diferentes criterios.

Esta fase no es obligatoria, como hemos comentado en la digitalización.

IV. INDEXACIÓN (grabación de datos)

Page 14: Eje temático 4 Digitalización Definitivo

INDEXACIÓN DE DOCUMENTOS

• Verificación de la grabación Una vez realizada la grabación de los datos del expediente, es aconsejable, para garantizar la calidad de los datos, realizar un proceso de verificación, que consiste en volver a grabar los datos más importantes (índices) para que el sistema compare y comprueba que la información grabada es correcta.

Salida - grabación de imágenes • Una vez realizada la digitalización, y en su

caso la indexación, existen posibilidades de almacenamiento:

• Discos compactos (CD). Magneto ópticos. DVD. Cintas. Discos duros externos. Etc.

Page 15: Eje temático 4 Digitalización Definitivo

2.2. ASPECTOS FUNDAMENTALES DE LA DIGITALIZACIÓN

Formato de las imágenes

Resolución de las imágenes

Calidad de las imágenes

Memoria que ocupa una imagen

Compresión de las Imágenes

OCR: La conversión de documentos escritos a documentos electrónicos

Page 16: Eje temático 4 Digitalización Definitivo

a. Formato de imágenes

Algunos de los factores que se debe tener en cuenta a la hora de elegir un formato de archivo para visualización son los siguientes:

Resolución.Calidad de imagen.Cantidad de memoria que ocupa.Nivel de compresión.

Nombre y versión actual

TIFF 6.0 (Tagged Image File Format)

GIF 89a (Graphics Interchange Format)

JPEG (Joint Photographic Expert Group)JFIF (JPEG File Interchange Format)

Flashpix 1.0.2ImagePac, Photo CD

PNG 1.2 (Portable Network Graphics)

PDF 1.3 (Portable Document Format)

Extensión .tif, .tiff .gif .jpeg, jpg, .jif, .jfif .fpx .pcd .png .pdf

Profundidad de bits

Bitonal a 1 bit, escala de grises o color de paleta de 4 u 8 bits; hasta color de 64 bits

Bitonal, escala de grises o color entre 1 y 8 bits

Escala de grises a 8 bits; color a 24 bits

Escala de grises a 8 bits; color a 24 bits

Color a 24 bits

1-48 bits; color a 8 bits, escala de grises a 16 bits, color a 48 bits

Escala de grises a 4 bits; color a 8 bits; soporta hasta 64 bits para color

* Descomprimido Sin pérdida* Con pérdida: JPEG

* Descomprimido* Con pérdida JPEG

Con pérdida: JPEG

* Descomprimido sin pérdida* Con pérdida: JPEG

Compresión Sin perdida

Con pérdida: Formato patentado por Kodak "Sin

Sin pérdida

Page 17: Eje temático 4 Digitalización Definitivo

b. Resolución de imágenesEs el número de píxeles mostrados en la imagen por las unidades de longitud.Normalmente se mide en Píxeles por Pulgada (ppi), aunque también es muy habitual medirla en Puntos por Pulgada (dpi)La resolución es directamente proporcional al numero de píxeles que se usen para representar cada unidad de área.La resolución, en ocasiones, marca la calidad de la imagen, aunque para determinar la resolución de una imagen hay que tener en cuenta el medio de distribución final.

Imagen de alta resolución

Mayor número de píxeles para representar cada unidad.

Reproduce más detalle Hay transiciones de

color más sutiles.

Imagen de baja resolución

Menor número de píxeles para representar cada unidad.

Reproduce menos detalles. Hay menos transiciones de

color.

Page 18: Eje temático 4 Digitalización Definitivo

c. Calidad de las imágenes

La calidad de las imágenes no siempre viene representada por el uso de una resolución mayor.Para una buena calidad lo primero es tener en cuenta el tipo de documento escaneado.Los píxeles sólo representan la información que tiene el documento. No hay que pensar que a mayor ppp mejor calidad.Actualmente, los software gráficos permiten retocar las imágenes con el finalidad de mejorar los documentos originales: se puede eliminar manchas oscuras, limpiar fondos, dar nitidez al texto.

Page 19: Eje temático 4 Digitalización Definitivo

d. Compresión de las imágenes

Tiene la finalidad de reducir el tamaño de los archivos para facilitar su almacenamiento, procesamiento y transmisión.

Existen técnicas de compresión estándar y patentadas.

Se recomienda usar técnicas estándar porque son totalmente compatibles con cualquier software de recuperación.

Compresión sin pérdida: no desecha información, y por tanto cuando se descomprime la imagen es idéntica al original. (Utilizado para el escaneado bitonal)

Compresión con pérdida: compensa o desecha información menos importante basada en un entendimiento de la percepción visual. (Utilizado para el escaneado tonal).

Page 20: Eje temático 4 Digitalización Definitivo

e. OCR (Optical Character Recognition)

Software de reconocimiento óptico de caracteres que convierte una documento escaneado en texto.

VentajasPosibilita las búsquedas a texto libre por todo el texto del documento. Indización automática: puede directamente capturar información del texto.Se puede manipular, corregir o insertar comentarios, como a cualquier documento de texto normal.

InconvenientesTiene muchas limitaciones.No reconoce documentación escrita, o por lo menos en bajo porcentaje.Necesita un tiempo de entrenamiento bastante importante.El nivel de éxito no es muy alto incluso con software muy potentes.

Page 21: Eje temático 4 Digitalización Definitivo

PROCESO DE LA DIGITALIZACIÓN

Preparación de Documentos

2) Proceso de Escaneo

3)Indización de Documentos

4) Grabación de Imagines

Page 22: Eje temático 4 Digitalización Definitivo
Page 23: Eje temático 4 Digitalización Definitivo

3.1. DISPOSITIVOS DE UN SISTEMA DE DIGITALIZACIÓN

Para un proceso de digitalización se requieren los siguientes componentes:

Computadores conectados en red.

Dispositivos de adquisición de imágenes (escáner).

Software para tratamiento, formateo y compresión de imágenes.

Dispositivos de almacenamiento.

Dispositivos de visualización e impresión.

Page 24: Eje temático 4 Digitalización Definitivo

3.2. ESCÁNER

Estos dispositivos exploran un documento con variado nivel de resolución, digitalizan la imagen y la almacenan para ser tratada por un computador mediante un software.

Para digitalizar la imagen, el escáner traduce los datos de entrada a datos binarios (mapa de bits). Esta es la forma en que la imagen puede ser leída y manipulada por un computador a través de un software de tratamiento de imágenes.

Page 25: Eje temático 4 Digitalización Definitivo

3.3. TIPOS DE ESCÁNER

Escáner Características

Es muy similar en sus características al escáner plano, la gran diferencia es que en el escáner plano la luz viene desde abajo (similar a una fotocopiadora) mientras que en el escaner cenital la luz sale de un elemento superior. Esto es muy recomendable para libros encuadernados.

Cenital

Son escáneres orientados a documentos opacos como son negativos o diapositivas. Estos tipos de escáner pueden obtener resoluciones de 3.000 x 3.000 ppp.

Transparencias

Escáner de rodillo

Son los modelos más versátiles, permitiendo escanear fotografías, hojas sueltas, periódicos, libros encuadernados e incluso transparencias, diapositivas o negativos con los adaptadores adecuados. Dentro de este tipo de escáner exiten distintos tipos los de uso doméstico, los de medio rendimiento y los de alto rendimiento.

Plano

Se basan en un sistema muy similar al de los aparatos de fax: un rodillo de goma arrastra a la hoja haciendola pasar por una rendija donde está situado el elementos capturador de imagen. Esta muy destinado a documentación que se componga de hojas sueltas.

Page 26: Eje temático 4 Digitalización Definitivo
Page 27: Eje temático 4 Digitalización Definitivo

3.4. CARACTERÍSTICAS TÉCNICAS

• Resolución: el estándar (que es a la vez el límite óptico) es de 600 dpi. Por interpolación se pueden obtener hasta 9.600 dpi.

• Profundidad del color: va en función de la cantidad de bits por píxel. Los escáneres estándar manejan 24 bits; otros ofrecen 30 y 36.

• Formato: pueden ser de media página (o de mano) o de página completa. Los de página completa pueden ser “flatbed”, que permiten capturar una imagen desde un soporte rígido (un cartón muy grueso, por ejemplo), o “sheet feed”, que deslizan el documento por una abertura, similar a un fax.

• Interfaz: existen dos tecnologías, con interfaz SCSI y con interfaz paralela.

Page 28: Eje temático 4 Digitalización Definitivo

3.4. EJEMPLOS DE ESCÁNER

Page 29: Eje temático 4 Digitalización Definitivo

4. CONCLUSIONES

• La digitalización es una herramienta muy útil dentro de un Sistema de Gestión Documental.

• Para llevar a cabo la digitalización es necesario realizar un estudio previo que nos permita saber:

Qué es lo que queremos digitalizar (tipos de documentos, tamaños, etc.).

Cómo lo vamos a digitalizar (resolución, formato, calidad, etc.). Para qué vamos a digitalizar (acceso más rápido, archivado

menos costoso, etc.).

Page 30: Eje temático 4 Digitalización Definitivo

5. BIBLIOGRAFÍA

•CASANOVAS, Inés. Gestión de archivos electrónicos. Buenos Aires : Alfagrama, 2007. 246 p.

•DATOS, INFORMACIÓN, CONOCIMIENTO Y BIBLIOTECA : INSUMOS BÁSICOS DE LA ACTIVIDAD ACADÉMICA. [en línea]. [consultado 25 jun. 2010]. Disponible en : http://evirtual.lasalle.edu.co/info_basica/nuevos/guia/GuiaClaseNo.1.pdf

•FERNÁNDEZ HEVIA, José María. Guía de la información electrónica : cómo tratar los datos legibles por máquina y la documentación electrónica. [en línea]. Luxemburgo : Comunidades Europeas, 2000. 60 p. Disponible en : http://www.cornu.eu.org/files/guidelines_ES.pdf

•http://www.hisoft.com.mx/QueeslaDigitalizacion2.htm

Page 31: Eje temático 4 Digitalización Definitivo