View
1.774
Download
0
Category
Preview:
Citation preview
DIGITALIZACIÓN AVANZADA Y
CREACIÓN DE BIBLIOTECAS DIGITALES
Javier Mas García
DIGITALIZACIÓN: CONCEPTOS, CRITERIOS PARA LA DETERMINACIÓN
DE FORMATOS DE DIGITALICIÓN Y USO DE FICHEROS DE IMAGEN,
EQUIPOS Y SOPORTES
• IMAGEN DIGITAL– MAPA DE BITS
– FORMATOS
– RESOLUCIONES
– PROFUNDIDAD DE COLOR
– CONSIDERACIONES Y RECOMENDACIONES PARA LA DIGITALIZACIÓN
• EQUIPOS
– Digitalización de libros y documentos encuadernados
– Digitalización de láminas y fotografías
– Digitalización de planos
– Digitalización de microformas
• ALMACENAMIENTO
• COSTES DE UN PROYECTO DE DIGITALIZACIÓN
Sumario
• Las imágenes digitales se guardan normalmente en forma de mapa de bits o mosaico de píxeles. Cada píxel guarda la información de color de la parte de imagen que ocupa
• Principal inconveniente: la ampliación. Cuando un archivo se amplia mucho, se distorsiona la imagen mostrándose el mosaico con "los píxeles" y una degradación en los colores llegando al efecto pixelación.
DetalleVisualización correcta, imagen al 100% Imagen pixelada
Mapa de bits
Mapa de bits
ELEMENTOS BÁSICOS QUE DEFINEN LA IMAGEN DIGITAL
• Formatos de ficheros de imagen y niveles de compresión• Resolución• Profundidad de color
Consideración general los formatos de mapa de bit y sus resolución
• Calidad máxima: Mayor resolución / menor compresión / mayor profundidad de bits = mayor peso de fichero
VENTAJAS Mayor calidad de imagen Posibilidad de mayor ampliación
DESVENTAJASMayor peso de ficheros y ocupación en soporte de grabaciónMayor tiempo de apertura de la imagenNecesidad de una mayor capacidad de lectura de los equipos y software de lecturaMayores costes de producción
Formatos de Imagen
FORMATOS Y COMPRESIÓN DE FICHEROS.
Formatos de imagen más comunes
FORMATOS SIN COMPRIMIR. - Ficheros mas estables,- Sin pérdida de calidad- Peso de imagen alto
TIFF, Tagged Image File FormatRAW Imagen “en crudo” PSD Photoshop (Ps)BMP BitMaP o Bit Mapped PicturePDF Portable Document Format
FORMATOS COMPRIMIDOS. - Ficheros mas inestables y más facilmente corrompibles. - Con pérdida mayor o menor de calidad. Algunos formatos permiten la compresión sin pérdida. - Peso de imagen bajo, aptos para publicación o intercambio.
JPEG The Joint Photographers Experts GroupGIF Graphics Interchange FormatPNG Portable Network GraphicsPDF Portable Document FormatJPEG 2000 Djvu.
Formatos de Imagen
FORMATOS Y COMPRESIÓN DE FICHEROS. Ejemplo
FORMATOS SIN COMPRIMIR. - Ficheros mas estables,- Sin pérdida de calidad- Peso de imagen alto
TIFF, Tagged Image File FormatRAW Imagen “en crudo” PSD Photoshop (Ps)BMP BitMaP o Bit Mapped PicturePDF Portable Document Format
FORMATOS COMPRIMIDOS. - Ficheros mas inestables y más facilmente corrompibles. - Con pérdida mayor o menor de calidad. Algunos formatos permiten la compresión sin pérdida. - Peso de imagen bajo, aptos para publicación o intercambio.
JPEG The Joint Photographers Experts GroupGIF Graphics Interchange FormatPNG Portable Network GraphicsPDF Portable Document FormatJPEG 2000 Djvu.
Peso de ficheros
sin comprimir: 39,1 Mb
JPEG, comprimido 5%,calidad máxima,13,4 MbJPEG, comprimido 10%, calidad alta, 5 MbJPEG, JPEG, comprimido 50%, calidad media comprimido 50%, calidad media 1,4 Mb1,4 Mb
GIFF, 8 bits, 256 colores, 7,6 Mb
PNG, sin pérdida, no entrelazado: 22,5PNG, sin pérdida, entrelazado: 27,5
PDF, generado desde TIFF, compresión ZIP, sin perdida. 23,1 MbPDF, generado desde JPEG, calidad max., 13,4 MbPDF, generado desde JPEG, calidad media, 1,4 Mb
Imagen: 20 x 27,5 cms, color RGB, 24 bits
Resolución de Imagen
CONCEPTOS
- Resolución, es la cantidad de píxeles o puntos que componen la imagen. La resolución se utiliza también para clasificar casi todos los dispositivos relacionados con las imágenes digitales ya sean escáneres, pantallas de ordenador, cámaras, etc.
- La calidad de resolución de una imagen expresará el número de píxeles que forman la imagen de mapa de bits
- Expresión de la resolución total de una imagen: la resolución o tamaño de una imagen digital se expresa multiplicando su anchura por la altura en pantalla. Por ejemplo la imagen de 1200 x 1200 píxeles = 1.440.000 píxeles, (expresado en Mp megapixel es igual a 1,4 Mp). Conviene tener en cuenta que 1 Megapíxels = 1.000.000 de píxeles.
- La resolución de impresión: define la cantidad de píxeles que contiene una imagen y la dimensión de estos píxeles expresando de qué forma se reparten en el espacio. La resolución expresada en (ppp) o (dpi), son los píxeles por unidad de longitud, es decir, los píxeles por pulgada. (La pulgada mide 2,54 cm).
Así pues, la resolución de impresión es la relación entre las dimensiones digitales (los píxeles) y las físicas; las que tendría una vez impresa sobre papel.
Resolución de Imagen
EJEMPLO DE CALCULO TAMAÑO DE IMPRESIÓN
4285 pixels27,21 cms
5996 pixels38,07 cms
Resolución de imagen: 400 pppTamaño de imágenes: 5996 x 4285(en pixels)
Resolución de impresión
5996/400 = 14,99 pulgadas x 2.54 cms = 38,07 4285/400 = 10,71 pulgadas x 2.54 cms = 27,21
Tamaño de impresión: 38,07 x 27,21 cms
Tamaño de impresión= Número de píxeles/ Resolución (ppp -píxeles por pulgada)
Ejemplo:
Resolución de Imagen
CONSEJOS SOBRE RESOLUCIONES DE IMAGEN ADECUADAS
* Imágenes para visualizar en pantalla ordenador o colgar en Internet en formato de pantalla 72 ppp
* Imágenes ampliables para impresión en impresora de 150 ppp como mínimo, pero se llega hasta los 300 ppp, para dar óptimos resultados imprimiendo con calidad fotográfica a tamaño real (a escala 1:1).
* La resolución fotográfica para obtener un fotolito para imprenta se obtiene igualmente una resolución de imagen de 300 dpi y será este el con una resolución de 300 dpi, tamaño suficiente para generar el proceso de fotomecánica e imprenta.
* Para permitir una cierta ampliación con calidad fotográfica sobre el tamaño original (p.e para ampliar un detalle de una imagen o para facilitar procesos de restauración digital) se suelen emplear resoluciones mayores, por lo que si se desea realizar un proyecto de digitalización con fines de preservación es asconsejable que las imágenes tengan un resolución de 400 ppp
Resolución de Imagen
PIXELACIÓN
La ampliación excesiva de la imagen, producía en la fotografía tradicional un efecto granulado debido a la falta de nitidez. En la fotografía digital el efecto análogo es de una imagen pixelada .
Si reproducimos una imagen con baja resolución quiere decir que el píxel ocupa más espacio y deforma la imagen con el efecto de pixelación, (píxeles de gran tamaño) aportando poca definición a la imagen. En cambio si la resolución en ppp, es más alta, existe más detalle y más definición.
Imagen correcta Imagen pixelada
Profundidad de color
COMO GUARDA EL COLOR EL PÍXEL: EL BIT Y EL COLOR
- La profundidad del BIT, profundidad del píxel o profundidad del color, estima los valores que puede llegar a tener cada píxel que forma la imagen. Si tiene más cantidad de bits por píxel más colores, mayor resolución de imagen y mayor tamaño del archivo
- La profundidad del BIT se puede medir en:
1 bit/pixel BIT, blanco o negro8 bits de color y 256 matices de color, monocromo, escala de grises24 bits de color o colores RGB, imágenes en color. 32 bits CMYK, para impresión de las imágenes
Profundidad de color
Imagen color RGB, 400 ppp 24 bits ; 73,6 Mb
Imagen en Binario
1 bit; 3.0 MbImagen en escala de grises
8bits; 24,6 MbImagen en color CMYK,
32 bits; 98,1 Mb
Imágenes sin compresión
Ficheros comprimidos
TIFF LZW : 700 KbTIFF CCIT-G4: 320 Kb
1 bit
JPEG calidad máxima:13,4 MbJPEG calidad media : 4,5 Mb
8bits
JPEG calidad máxima: 31 MbJPEG calidad media: 6,96 Mb
8bits
COMO GUARDA EL COLOR EL PÍXEL: PESO DE LOS FICHEROS
Recomendaciones generales para la digitalización en la creación de colecciones digitales
1. Establecer los fines y objetivos del proyecto
- preservación del original- impresión (artes gráficas o impresora)- edición en soporte óptico (CD, DVD)- OCR - integración en un repositorio accesible desde Internet- copias accesibles desde el disco duro de nuestro ordenador o servidor dentro de un sistema
de gestión de archivo2.
2. La copia master deberá permitir obtener el resto de copias derivadas . Realizar la captura de imágenes de modo que sea posible utilizarla para satisfacer las distintas necesidades señaladas anteriormente.
3. Analizar el entorno tecnológico y la capacidad de almacenamiento y transferencia de datos de los soportes físicos a utilizar. Los soportes de grabación de las imágenes de preservación (muy pesadas), el entorno de consulta (internet, intranet, DVD, CD), la capacidad de proceso de las imagenes del software de consulta, la velocidad de descarga y de apertura de las imágenes en el entorno de consulta serán condicionantes que determinen los formatos y la resolución que se debe exigir en el proceso de digitalización, teniendo en cuenta la relación: calidad de imagen/peso de ficheros
Recomendaciones generales para la digitalización en la creación de colecciones digitales
4. Normalización que especifique y fije el estándar de imagen elegida
5. Indicaciones y recomendaciones de los grupos de trabajo institucionales nacionales e internacionales afines a nuestro entorno (p.e. los grupos de trabajos de la UNESCO y del Ministerio de Cultura para la creación de colecciones digitales).
6. Estándares dominantes en el mercado y empleo común en repositorios institucionales
7. Presupuesto económico disponible
Recomendaciones generales para la digitalización en la creación de colecciones digitales
Cuadro - resumen
Formatos y resoluciones
Atendiendo al tipo de material a digitalizar existen diferente equipos con prestaciones
específicas adecuadas para cada uno.
• I. Escáneres de libros y documentación histórica
– Luz fría.– Captura cenital.– Posibilidad de trabajar con o sin cristal superpuesto al documento– Base basculante (Bookcradle). Apto para diferentes grosores de libros o
documentos.– Tamaños aptos para distintos tamaños de libros. (A4 x2, A3x2, A2x2,
A1x2).– Captura lineal o matricial.– Opera de forma manual consiguiendo una productividad alta (variable según
marcas y modelos).– Costes variables generalmente elevados (entre 20.000 y 70.000 €), según
tamaños marcas y modelos .
Equipos
• I. Escáneres de libros y documentación histórica
(A1, A0) Muy sofisticados y costosos
Equipos
Proserv ScannTECH A2_A0
Digibook SupraScan I2S A1_A0
Zeutschel OS 10000 A0
• I. Escáneres de libros y documentación histórica
(A3, A2) Sofisticados pero menos costosos
Equipos
MIINOLTA PS5000 C
OS 14000 TTOS 12000 C OS 10000 TT
Zeutschel
Book2net - MicroboxCopybook HD I2S
• I. Escáneres de libros y documentación histórica
(A4, A3) Soluciones menos sofisticadas y más baratas,
Equipos
... y totalmente caseras
ATIZ BookDrive DIY PS5000 C
• II. Escáneres de grandes formatos. A1, A0 o superior
• III. Escáneres de libros automáticos
Equipos
Bookscan APT1200
DL 3000 i2S
SupraScan 10000 RGB i2SProserv ScannTECH A0
Equipos
• IV. Escáneres de microformas. Microfilm / microfichas / tarjetas de apertura
• Manuales.
• Binario/efecto grises por interpolación de puntos
• Automáticos
Binario/escala de grises
ScanPro 2000
MEKEL
SUNRISE
ZEUTSCHEL WICKS & WILSON
OCÉ 3000
NETScan-Eclipse
Equipos
• II. Digitalización de microformas. Microfilm / microfichas / tarjetas de apertura
La digitalización desde microfilm/microficha supone las siguientes
Ventajas:
– Economía de costes, siempre y cuando se pueda trabajar en modo automático. Si implica procesos manuales (por ejemplo recorte manual de imágenes), los costes se equiparan a la digitalización directa
– No se manipula nuevamente el original para su digitalización.
– Permite obtener un copia digital, cuando no se dispone del material original.
Desventajas
- Reproducción de todos los defectos del material original recogidos en el fotograma, manchas, roturas, pliegues, tintas traspasadas, sin posibilidad de corregirlos o atenuarlos.
- La microfilmación no dispone de la imediatez de visualización y control de calidad por lo que, la digitalización desde este soporte añadirá los posibles defectos derivados de este proceso intermedio, tales como:
- Reflejos- Diferencias de iluminación y contraste dentro de la misma imágen - Defectos de la copia utilizada, mancha, rayas, etc. - La ausencia o repetición de imágenes se mantendrá en la copia digital.- Letras empastadas o de trazo debil y difuso (que pueden provocar la ilegibildad del documentos).
Equipos
• II. Digitalización de microformas. Ejemplo de errores arrastrados por falta de calidad de la microfilmación
Problemas
- Manchas producidas por sobreexposición de luz de focos
- Diferencias excesivas de contraste entre claro y oscuro que
impiden hallar una exposición media adecuada para la digitalización
- Exceso de luz y falta de definición en zonas claras
- Exceso de oscuridad con zonas borrosas y empastadas
- En documentos muy grandes, ampliación desenfocada o pixelada
- Hojas delanteras rotas mezclándose imagen de varias páginas
Equipos
• II. Digitalización de microformas. Microfilm / microfichas / tarjetas de apertura
Digitalización desde microfilm o microficha.
Consejos:
1. Digitalizar directamente del original simpre y cuando sea posible. Permite obtener una mayor calidad de imagen y un control de calidad más eficáz
2. Realizar una prueba de calidad con una muestra representativa del material a digitalizar antes de plantearse digitalizar desde este soporte.
3. Digitalizar en escala de grises, especialmente documentos manuscritos, documentación historíca (con tintas traspasadas, manchas de fondo) o documentación policromada
4. Estudiar la posibilidad de automatizar los procesos de la imagen desde este soporte. Posibilidad de recorte automático/manual de las imágenes, calcular el trabajo y el tiempo de indexación, etc), y valorar los tiempos de digitalización de este modo frente a una digitalización directa.
Almacenamiento. Soportes
1. UNIDADES DE CINTA. Para ficheros de preservación y de protección de datos
SDLT
LTO 1
LTO 3
2. DISCO DUROS Externos, conexión USB. Para ficheros de preservación y copias de uso
3. DVD. Solo para copias de uso, miniaturas, ficheros de texto etc, ficheros con poco peso.En desuso para almacenamiento masivo por su limitada capacidad de almacenamiento, inestabilidad y fragilidad del soporte.
Proporcionan escalabilidad, rendimiento y una amplia
interoperabilidad necesaria para los datos críticos y ficheros de
preservación, diseñadas para satisfacer las necesidades de las redes
de almacenamiento de pequeñas y grandes organizaciones.
Costes de un proyecto de digitalización
A. SON EXTREMADAMENTE VARIABLES
B. FACTORES A TENER EN CUENTA :
1. CARACTERÍSTICAS FÍSICAS DEL MATERIAL A TRATAR Soporte, tamaño, encuadernación, estado de conservación
2. RESOLUCIÓN DE ESCANEADO Y EMPLEO DE GRISES o COLOR
3. NIVEL DE INDEXACIÓN DE LA DOCUMENTACIÓN Número de imágenes por unidad documental
4. SEGUIMIENTOS DE PROTOCOLOS DE CALIDAD Y DE EXTRACCIÓN DE METADATOS TÉCNICOS
5. ESPECIFICACIONES ADICIONALES DE POSTPRODUCCIÓN. - Formatos de imagen requeridos, para preservación, uso y publicación - OCR - Retoque fotográfico - Preparación para artes gráficas
7. FORMACIÓN Y ESPECIALIZACIÓN DEL PERSONAL TÉCNICO
Digitalización y creación de Bibliotecas Digitales
FINGRACIAS POR LA ATENCIÓN
Javier Mas GarcíaCoordinador Técnico
Recommended