06/10/2012
1
Preservación digital
Escuela Acad. Prof. Bibliotecología y Ciencias de la Información
Universidad Nacional Mayor de San Marcos
Ciro Llueca. Lima, 22 septiembre 2012
La presente sesión se celebra gracias a la cooperación
entre la Universidad Nacional Mayor de San Marcos
y la Universidad de Barcelona.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
2
Agradecimiento especial del instructor a Sandra Reoyo,
responsable de repositorios del Consorcio de
Bibliotecas Universitarias de Cataluña, y coautora de
los materiales que sirven de base a la sesión en el
Máster online de Documentación Digital de la
Universidad Pompeu Fabra;
así como al Dr. Alonso Estrada, director de la Escuela
de Bibliotecología y Ciencias de la Información de la
UNMSM, que ha facilitado la estancia de
investigación.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
Agradecimiento del instructor a
Alice Keefer y Núria Gallart, autoras de los materiales
docentes de la Universitat Oberta de Catalunya,
fuente de información principal de la sesión, así como
al Dr. Miquel Térmens y al grupo Preserva
(Universidad de Barcelona), por sus aportaciones a
la disciplina de la preservación digital en España.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
3
Agradecimiento del instructor a las personas que han
colaborado en la preparación de la sesión:
Isidro Aguillo (CSIC); Joan Boadas (AMGi);
Cristina Azorín (UAB); Tomàs Baiget (E-LIS);
Isabel Bernal (CSIC); Manuel Bravo (BVMC);
David Iglesias (AMGi); Alejandro López Cobos
(BioMed); Francesca Navarro (BC);
Patricia Russo (COBDC); Eugènia Serra (BC);
Imma Subirats (E-LIS); Meritxell Trullàs (BdG);
Ricard de la Vega (CESCA).
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
Preservación digital
– 09:05h Panorama
Lo digital: mucha información, poca durabilidad
– 09:45h Estrategia
Debemos tomar decisiones difíciles
– 10:45h Táctica
Convirtiendo en fiable a nuestra institución
– 12:00 Cierre de la sesión
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
4
Panorama
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
Panorama (1)
“Año 2054. Mis nietos (que no han nacido) están en el desván de mi
casa (que no he comprado). Descubren una carta de 2007 y un CD-
ROM. La carta dice que el CD tiene un documento en el que se da la
clave para heredar mi fortuna (que no he ganado). Mis nietos
sienten curiosidad, pero nunca han visto un disco compacto, salvo
en viejas películas. Aun cuando localizaran un lector de disco
adecuado, ¿cómo lograrían hacer funcionar los programas
necesarios (como Microsoft Word) para interpretar el contenido?
Si no fuera por la carta, mis nietos no sabrían que deben abrir el CD-
ROM. La carta es legible, sin máquinas ni conocimientos a parte del
propio idioma. Dado el carácter mudable de programas y circuitería,
dentro de 50 años la única información legible será la carta.“
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Jeff Rothenberg. “¿Son perdurables los documentos digitales?”.
Investigación y ciencia, mar 1995). http://www.dfists.ua.es/~gil/articulo.pdf )
06/10/2012
5
Panorama (2)Documentos primitivos: menos información, más duraderos.
Documentos digitales: más información, menos duraderos.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Paul Conway. Preservation in the digital world, 1996).
http://www.clir.org/pubs/reports/conway2 )
Panorama (3)
• Años 80-90: los responsables de preservación
tradicional observan con preocupación el aumento
de recursos digitales en sus fondos.
– Saben cómo preservar documentos analógicos, pero
desconocen qué hacer con los nuevos soportes (CD-ROM,
DVD, acceso en línea) y formatos (texto, imágenes,
hipertexto, multimedia).
“Disponemos de cintas de 1949 que suenan perfectamente, y otras
de 1989 que se han perdido completamente”
(Marc Kirkeby, Sony, en relación al acceso a 600.000 grabaciones
musicales en cintas magnéticas)
Preservación digital UNMSM Ciro Llueca (22 sep 2012)(Keefer & Gallart, 2007)
06/10/2012
6
Panorama (4)
• Bibliotecas, Archivos y Museos no han sido inmunes
a los cambios tecnológicos y la irrupción de Internet:
– Por una parte, deben integrar a sus colecciones recursos
digitales, en formatos y soportes que no están
consolidados. Deben hacerlo a gran escala. Son los
documentos nacidos digitales (born digital).
– Por otra, deben aprovechar las oportunidades del medio
digital, para difundir sus colecciones de documentos
analógicos, y contribuir también a su preservación.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
Integración de los born digital
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
7
Difusión (y preservación) de analógicos
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
Panorama (5)
Preservación digital:
• “Abarca todas las consideraciones relacionadas con la gestión,
administración, financiamiento y recursos humanos tendiendes a
salvaguardar el bienestar de las colecciones de bibliotecas.” (IFLA)
• “Actividades asociadas con el mantenimiento en buenas
condiciones del material de archivo y bibliotecario para su
utilización en forma original.” (ALA)
• “La preservación a largo plazo implica la provisión de acceso
indefinido a los documentos o, como mínimo, al contenido de éstos
(…) . En el documento de archivo, la preservación del contexto y
entorno de creación explicará, complementará y dará valor al
documento.” (Soler, 2009)
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer & Gallart, 2007)
(Soler, 2009)
06/10/2012
8
Panorama (6)
• “Preserving digital information” (Research Libraries Group & Commission on
Preservation and Access, USA, 1996)
– “Digital preservation needs and requirements in RLG member institutions”
(Hedstrom & Montgomery, 1998)
• “Preservation in the digital world” (Yale University, USA, 1996)
• “Long term preservation of electronic materials” (Joint Information Systems
Committee & British Library, UK, 1996)
– CEDARS Digital Preservation Project (Granger et al., 1998-2002)
– CAMALEON (University of Leeds, UK, Rothenberg)
• “PADI: Preserving Access to Digital Information” (National Library of
Australia, 1996)
– “Directrices para la preservación del patrimonio digital” (UNESCO, 2003)
• “NEDLIB”, “E-Depot” & “DIAS” (Koninklijke Bibliotheek, DK, 1998-2000).
• “Kulturarw3” (Kungliga Biblioteket, SE, 1996).
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer & Gallart, 2007)
Panorama (7)
• Tras numerosos informes, estudios y proyectos,
no existe en la actualidad un sistema informático
que garantice la preservación digital a largo plazo.
• Se combinan estrategias a medio plazo y
actividades experimentadas para garantizar el
acceso a los fondos digitales.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
9
Panorama (8)
• Propiedades de la preservación digital:
– Es una serie de actividades, no técnicas
aisladas.
– La finalidad es la utilización futura de los
documentos.
– Se pretende conservar el documento físico,
además de la información que contiene.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer & Gallart, 2007)
Estrategia
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
10
Estrategia (1)
• La preservación de un fondo tradicional se
diseñaba en base al material a conservar y el
tiempo de preservación.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer & Gallart, 2007)
“Homilías de Orgañá”, sermonario en lengua
catalana, fechado en 1150-1204.
Hallado en una pequeña iglesia en 1904, se
conserva en la Biblioteca de Cataluña
(Barcelona, España).
Estrategia (2)
• A diferencia de la actuación tradicional, orientada
a mantener el documento en su estado original,
los documentos digitales deben ser modificados y
transformados continuamente para que
continúen siendo accesibles e inteligibles.
• Se trata de preservación por alteración.
– Además de preservar una versión accesible y legible,
los expertos recomiendan preservar, además, la
cadena de bits original.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer & Gallart, 2007)
06/10/2012
11
Estrategia (3)
• La preservación digital es más compleja que la
analógica:
– ¿Qué recursos debemos preservar?
– ¿Cuándo hay que iniciar el tratamiento?
– ¿Quién se implicará en el proceso de preservación?
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer & Gallart, 2007)
http://www.casadelabiblia.org/
[consulta: sep 2012]
Estrategia (4)
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer & Gallart, 2007)
Preservación tradicional (Baró, 1990) Preservación digital (Jones & Beagrie, 2001)
- Obligación legal
- Valor intrínseco del material
- Pertinencia a los intereses de la institución
- Estado físico
- Uso actual y potencial
- Valor artístico
- Políticas sobre emplazamiento y manipulación
- Disponibilidad en otras bibliotecas
- Coste-Efectidad del tratamiento
- Disponibilidad del personal e instalaciones
- Existencia de soportes alternativos
Las anteriores, y definir si:
- El material se ajusta a la política de selección
- Otra institución ha asumido la responsabilidad
- Hay obligación legal
- El valor del documento justifica la inversión
- La institución puede manipular el documento
- Hay permiso para acceder a ese material
- El recurso es legible hoy, y en el futuro
- El recurso está en un soporte que sirve para
transferir o almecenar los datos
- El recurso dispone de documentación
identificativa, incluyendo metadatos
06/10/2012
12
Estrategia (5)
• Aún existiendo capacidad técnica y voluntad
institucional de preservación digital, los recursos
limitados obligan a las instituciones a establecer
una política:
– Necesidades y recursos de la institución.
– Intereses de sus usuarios.
– Diferentes aspectos físicos e intelectuales.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer & Gallart, 2007)
Estrategia (6)
• La estrategia requiere hallar el equilibrio entre la
importancia relativa del documento y los factores
de riesgo.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer & Gallart, 2007)
06/10/2012
13
Estrategia (7)
• ¿Actuación reactiva o proactiva?
– La solución reactiva no es recomendable para objetos
digitales: al detectar el daño suele ser demasiado
tarde.
– El “largo plazo” en objetos digitales es de 20 años
(Waller & Sharpe, 2006).
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer & Gallart, 2007)
1986 1987 1996 2006
Estrategia (8)
• ¿Actuación esporádica o continuada?
– La solución esporádica permite alargar la vida de los
documentos analógicos, pero difícilmente los
digitales.
– Las intervenciones digitales afectan al documento y a
su descripción.
– La intervención continuada requiere financiación
permanente.
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer &Gallart, 2007)
06/10/2012
14
Estrategia (9)
• ¿Actuación u omisión?
– El abandonamiento benigno (benign reglect) servía en
algunos casos para salvar la vida del documento.
– En el entorno digital, el olvido es letal. Debe ser
legible el formato y también el soporte.
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer & Gallart, 2007)
Wordstar 1992
Estrategia (10)
• ¿Actuación al crear el documento o en caso de
deterioro?
– Es recomendable, a pesar de los retos (creación de
documentos descentralizada, inercia de los autores y
departamentos) marcar pautas en la creación, y
asesorar (selección de formatos, soportes,
metadatos).
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer & Gallart, 2007)
06/10/2012
15
Estrategia (11)
• Debemos decidir:
– Preservar esencialmente el contenido, incluso mejorar
la legibilidad o utilidad mediante las tecnologías
disponibles en el momento de su recuperación.
– Mantener el aspecto y comportamiento original, con
las limitaciones que pueden representar.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer & Gallart, 2007)
Estrategia (12)
• Valores esenciales a preservar en documentos de
archivo:
– Fiabilidad: es posible conocer la trazabilidad, desde que fue
creado por alguien, hasta el presente.
– Autenticidad: dejando claro qué es el máster y qué copias de
difusión, uso, etc.
– Integridad: debe permanecer intacto, y tal como muestren sus
metadatos.
– Identidad: se conocen todas las personas que han creado o
trabajado en el documento.
– Capacidad de uso y acceso para el ojo humano.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Soler, 2009)
(Elvira, 2011)
06/10/2012
16
Estrategia (13)
• Priorizando:
–Documentos nacidos digitales
–Documentos digitalizados sin versión
analógica
–Documentos digitalizados con versión
analógica
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (The Cornell University)
Táctica
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
17
Táctica (1)
• Existen dos acciones básicas de
preservación digital, que habitualmente
actúan combinadas:
–Actualización de los soportes
–Migración de los formatos
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
Táctica (2)
• Actualización / Refreshing
– Transferencia de datos de un soporte a otro.
– No preserva los datos, pero es un paso repetible e
imprescindible para garantizar el acceso a ellos.
– ¿Qué previsión de vida tiene el nuevo soporte?
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer & Gallart, 2007)
06/10/2012
18
Táctica (3)
• Migración
– Transferencia de datos de un formato a otro.
– La estrategia más utilizada, pese a existir riesgo de
perder elementos del documento.
– Es una operación experimentada, que no requiere
conocimientos técnicos especializados, y tiende a la
estandarización del software.
– Es difícil programar la migración en objetos complejos,
altera los documentos, y debe repetirse a lo largo del
tiempo.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer & Gallart, 2007)
Táctica (4)
• Emulación
– Simular el comportamiento del software original.
– La estrategia más respetuosa con el documento
original.
– No requiere un seguimiento continuado del formato,
soluciona la lectura para objetos complejos.
– Existen pocas experiencias reales, los emuladores
deben actualizarse, requiere conocimientos
especializados ahora y en el futuro.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer & Gallart, 2007)
(Rothenberg, 2000)
06/10/2012
19
Táctica (5)
• Acciones complementarias:
– Museo tecnológico, conservar todos los modelos, más
copias y piezas de reparación, para poder emular.
– Replicación, preservar múltiples copias digitales en
línea, en formatos estándares. (Castillo & Jorba, 2008)
– Analogización, apostar por soportes de solvencia
contrastada en preservación: papel, microformas, etc.
– Arqueologia digital, confiar en el futuro.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer, 2012; Serra, 2009)
Táctica (6)
• Amenazas a la longevidad:
– Visualización: en el futuro deberán conocer la
infraestructura original.
– Interferencias: a causa de encriptación o compresión,
la recuperación puede ser problemática.
– Interrelaciones: los enlaces de hipertexto pueden
perderse.
– Custodia: ¿quién se responsabiliza?
– Traducción: salvar el look & feel.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Besser, citado por Keefer, 2012)
06/10/2012
20
El soporte (1)
• Factores de degradación:
– La composición “en capas” de los soportes, en las
cuales se graban (y regraban, y regraban, y regraban)
los datos por medio de un proceso magnético pueden
causar envejecimiento precoz, que puede provocar
errores en la lectura de los datos.
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer, 2012)
El soporte (2)
• Factores de degradación:
– Temperatura y humedad
– Mala calidad de los materiales originales
– Baja calidad del proceso de fabricación
– Falta de controles ambientales en la fabricación,
transporte y almacenamiento
– Proximidad a campos magnéticos
– Suciedad, polvo, en el entorno
– Introducción de bacterias, hongos
– Mal estado de los equipos de grabación y de lectura
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer, 2012)
06/10/2012
21
El soporte (3)
• Algunos factores de degradación son controlables
por la institución:
– Flexibilizando los criterios de compra, que dificultan la
adquisición de material de alta calidad
– Promoviendo el cambio en la inercia o reticencia de
las maneras de trabajar
– Facilitando la capacidad técnica o económica para
efectuar cambios en el entorno físico
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer, 2012)
El soporte (4)
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Síntesis de Jones & Beagrie, 2001, p. 130)
Soporte 25 h.r. / 10 C 40 h.r. / 20 C 50 h.r. / 28 C
D3 cinta magnética 50 años 15 años 1 año
DLT cinta
magnética
75 años 15 años 1 año
CD/DVD 75 años 20 años 2 años
CD-ROM 30 años 3 años 3 años
Esperanza de vida según condiciones ambientales
(humedad relativa y temperatura):
06/10/2012
22
El formato (1)
• La elección de un formato puede condicionar:
– La selección o no del recurso para ser preservado.
– El método usado para su preservación.
– La facilidad de recuperar y visualizar el documento.
– El tipo de uso posible en el futuro.
– El coste de la preservación.
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer, 2012)
El formato (2)
• La importancia de elegir un formato:
– Formato estándar, reconocible por amplia gama de
programas (.txt).
– Formato propietario con gran base de clientes, que
pueden llegar a incentivar económicamente las
soluciones (.doc).
– Formato propietario de difusión limitada (.dxf).
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer & Gallart, 2007)
06/10/2012
23
El formato (3)
• Existen ca. 16.000 formatos (NARA)
– Documento (doc, rtf, pdf, xsd, ps)
– Imagen (jpeg, gif, png, psd, tif)
– Audio (wav, mp3, aac)
– Video (wmv, avi, rm, mpg)
– Hoja de cálculo (xls, xsc)
– Estadística (SPSS)
– Diagrama o diseño (Visio, AutoCAD)
– Bases de datos (SQL, MySQL, Oracle, Access)
– Presentaciones (ppt)
– Páginas web
– Etc.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Bates et al., 2006, citado por Keefer, 2012)
http://www.gdfr.info/
El formato (4)
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Recomendaciones UK data Archive, citado por Keefer & Gallart, 2007)
Formatos Preferido Aceptable Problemático
Datos estadísticos SPSS, por, sav STATA, xport, texto
separado por
tabulación
Texto de anchura
fija (no delimitado)
Base de datos SQL separado por
tabuladores o
comas
ACCESS, dBase,
FilemakerPro,
FoxPro, Paradox
Texto de anchura
fija (no delimitado)
Hoja de cálculo Texto delimitado
separado por
tabuladores
Excel, Lotus,
Quattro Pro
Texto Enriquecido, rtf,
xml, txt
MsWord, HTML,
Wordperfect, papel
CAQDAS, WinMax,
Nudist
Imagen tiff, png gif, bmp Adobe PDF
Video MPEG Quicktime
Sonido mp3 wav
06/10/2012
24
¿Preservamos digitalizando? (1)
• La digitalización se usa como método de
preservación (y difusión) de los documentos
analógicos, puesto que puede promover:
– Búsqueda y opciones de localización más fáciles.
– Acceso sin barreras temporales, físicas o geográficas.
– Más maneras de visualizar el documento.
– Mejor calidad de la imagen y el texto.
– Fácil y rápida reproducción, sin agresiones al original.
– Nuevos usos, como el análisis de imagen y textos,
comparación de documentos alejados, etc.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer, 2012)
¿Preservamos digitalizando? (2)
• Pero lógicamente, la digitalización no substituye a
los procesos de preservación en los documentos
analógicos:
– Baja manipulación.
– Temperatura y humedad constantes.
– Condiciones lumínicas.
– Insectos, desastres naturales, robos o pérdidas,
etc.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)(Keefer, 2012)
06/10/2012
25
¿Preservamos digitalizando? (3)
• ¿Priorizamos?
– Documentos frágiles
– Singularidad
– Interés para la investigación
– Requerimientos de uso
– Completar colecciones
– Frecuencia de uso i consulta
– Dominio público
Preservación digital UNMSM Ciro Llueca (22 sep 2012)(Serra, 2011)
• Preparar el escáner y los documentos:
– Limpieza de las lentes y del entorno del escáner.
– Limpieza y orden de los documentos.
• Ajustar los aspectos técnicos:
– Blanco y negro: mecanuscritos, documentos
impresos.
– Escala de grises: manuscritos, música impresa.
– Color: mapas, fotos, ilustraciones.
Preservación digital UNMSM Ciro Llueca (22 sep 2012) www.digitalpreservation.gov
¿Preservamos digitalizando? (4)
06/10/2012
26
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
Tipo documento Preservación Acceso
Texto impreso
BN/grises (libros,
revistas)
TIFF 300 dpi JPEG, PDF 150 dpi
Texto impreso color
(manuscritos, libros
ilustrados)
TIFF 300 dpi JPEG, PDF 150 dpi
Fotografías, mapas TIFF o JPEG2000 500
dpi
JPEG, PDF 300 dpi
Sonoros WAVE o BWF MP3
Audiovisuales MPEG2 o AVI MPEG2
¿Preservamos digitalizando? (5)
Más concreciones en:
http://www.library.cornell.edu/imls/image%20deposit%20guidelines.pdf
• Acceso y almacenaje:
– Carpetas bien organizadas, estructura arbórea,nombres y fechas claras.
– Un mínimo de 2 copias en dos soportes diferentes,de calidad fiable, alejados entre si.
– Etiquetaje cuidadoso (mínimos: impresión depantalla para obtener un sumario, que acompaña alas copias externas al PC.)
– Almacenaje seguro.
– Nuevas copias cada 5 años, como mínimo.
Preservación digital UNMSM Ciro Llueca (22 sep 2012) www.digitalpreservation.gov
¿Preservamos digitalizando? (6)
06/10/2012
27
Metadatos (1)
• Sin metadatos, el documento “preservado”
digitalmente puede ser ilegible.
– Metadatos generados automáticamente.
– Metadatos generados por los creadores.
– Metadatos generados por el personal de la
biblioteca, archivo, etc.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
Metadatos (2)
• Sin los metadatos no podemos garantizar que
un recurso sea recuperable y usable:
– Sin datos descriptivos, no se podrá localizar.
– Sin datos técnicos, no se podrá visualizar o usar.
– Sin datos administrativos, no se tendrá la garantía
de la integridad ni autenticidad.
– Sin datos legales, los responsables de la custodia
no sabrán qué usos son admisibles o no.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
28
Metadatos (3)
• Metadato es aquella información descriptiva
sobre el contexto, calidad, condición o
características de un recurso documental, dato
u objeto, con el objetivo de facilitar su
recuperación, autenticación, evaluación,
preservación y/o interoperabilidad.
(Wikipedia)
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
Metadatos (4)
• Los documentos que se introduzcan en el
repositorio deberán estar descritos usando un
conjunto de metadatos basados en estándares
internacionales, para facilitar su uso posterior.
• Son, en parte, el equivalente a la descripción
bibliográfica en un catálogo clásico.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
29
Metadatos (5)
• Tipos de metadatos
– Descriptivos: creador, titulo, fecha de publicación,
tipo de documento, etc.
– Administrativos: propiedad, derechos y usos,
equivalente analógico, etc.
– Técnicos y de preservación: formato, resolución,
compresión, dispositivo de captura, estructura del
documento, historial de cambios, etc.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
Metadatos (6)
• Son sistemas estándares de metadatos:– Dublin Core (DC)
– Encoded Archival Description (EAD) > archivos
– MARC 21 > bibliotecas, catálogo local
– Metadata Encoding and Transmission Standard (METS) > técnica, preservación
– Premis > preservación, trazabilidad
– Metadata Object Description Schema (MODS)
– Text Encoding Initiative (TEI)
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
30
Metadatos (7)
• El Dublin Core (1995) es el estándar másutilizado, especialmente su versión cualificada.
• Prácticamente todo el software de repositorioslo incluye, o lo soporta.
• Consta de 15 elementos descriptivos:
– Título, creador, materias y palabras clave,descripción, editor, contribuciones, fecha, tipo derecurso, formato, identificador, fuente, lengua,cobertura, gestión de los derechos.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
Metadatos (8)
• La elección del sistema de metadatos es esencial
para su futura interoperabilidad y visibilidad, más
allá de nuestra propia institución.
• El sistema puro de autoarchivo puede tener
consecuencias en la correcta asignación de
metadatos.
• Habitualmente (autoarchivo) se opta por unos
mínimos (autor, título, fecha, etc.), que
completarán los servicios técnicos.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
31
Repositorio seguro (1)
• La mayoría de repositorios institucionales no
pueden ser considerados como repositorios de
preservación.
• Un repositorio de preservación tiene como
responsabilidad única (o parte de múltiples)
desempeñar la preservación a largo plazo de sus
objetos digitales.
(PREMIS 2008)
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Térmens, 2009)
Repositorio seguro (2)
• Estableciendo un depósito seguro:
– Soportes:
• Almacenar los máster en soportes digitales de alta calidad
• Comprobar la legibilidad de los soportes periódicamente
– Copias de seguridad:
• Copiar los máster y depositar en lugar externo seguro
– Dispositivos de grabación y de lectura
• Seguimiento para asegurar que sean de buena calidad, y
estén en buen estado
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Establishing a central depositoryH, p. 16-17
http://www.library.cornell.edu/imls/image%20deposit%20guidelines.pdf)
06/10/2012
32
Repositorio seguro (3)
• Estableciendo un depósito seguro:
– Almacenamiento:• Guardar en entorno controlado de temperatura y humedad
• Mantener niveles constantes más que seguimiento estricto de niveles
óptimos
• Alejado de campos magnéticos
• Mantener limpio el entorno de operaciones
• Minimizar la manipulación y el uso de los soportes
– Seguridad:• Control de acceso
• Acceso cerrado
• Proteger la autenticidad de los fondos: no romper la cadena
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Establishing a central depositoryH, p. 16-17
http://www.library.cornell.edu/imls/image%20deposit%20guidelines.pdf)
Repositorio seguro (4)
• Estableciendo un depósito seguro:
– Refresh:
• Pase periódico a nuevos soportes (al comprar nuevos
dispositivos de almacenamiento y lectura?)
• Seguir un proceso de verificación (checksum) para garantizar
autenticidad e integridad posterior al refresh
– Documentación
• Explicar por escrito toda acción llevada a cabo durante el
proceso de mantenimiento o refresh
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Establishing a central depositoryH, p. 16-17
http://www.library.cornell.edu/imls/image%20deposit%20guidelines.pdf)
06/10/2012
33
Repositorio seguro (5)
• El modelo OAIS (Open Archival Information
System) fue desarrollado por la NASA, y se
convirtió en la norma ISO 14721:2003.
• Sirve para referirse a conceptos y procesos en
base a una norma compartida.
• No ofrece un diseño específico de arquitectura,
es una hoja de ruta.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)(Keefer &Gallart, 2007)
“Vehículo de cuatro ruedas, capaz de transportar entre
dos y ocho personas con una velocidad posible de 130
km/h y un espacio para equipaje y con prestaciones para
que el viaje sea más agradable (radio, aire climatizado,
asientos cómodos…)” (Gladney 2006)
Repositorio seguro (6)
• El modelo OAIS (Open Archival Information
System, 2000) esbozan una arquitectura para el
paquete de información (objeto+metadatos):
– Ingest, incorporación al repositorio.
– Archival storage, su almacenamiento a largo plazo.
– Data management, su gestión.
– Access/dissemination, su acceso y difusión.
– Preservation planning, preservación planificada.
– Archive administration, gestión del repositorio.
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer & Gallart, 2007)
06/10/2012
34
Repositorio seguro (7)
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
Repositorio seguro (8)
• Las instituciones deben poder ser fiables:
– Garantizar la integridad y autenticidad del recurso.
– Velar por la protección de los derechos.
– Limitar el acceso a usuarios autorizados.
– Mantener las herramientas necesarias para identificar
y recuperar la información.
– Asegurar la presencial de metadatos normalizados.
“Trusted digital respositories: atributes and
responsabilities” (RLG & OCLC, 2002)
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer & Gallart, 2007)
06/10/2012
35
Repositorio seguro (9)
• Los repositorios pueden ser certificados:
– Por ejemplo, en planificación y estrategias de
preservación, el repositorio deberá:
• Tener documentada su estrategia de preservación.
• Realizar estrategias para almacenaje y migración.
• Utilizar información técnica disponible internacionalmente.
• Tener un mecanismo para detectar cuando un formato está
en riesgo de obsolescencia.
• Etc.
“Audit cheklist for the certification of trusted digital
repositories” (RLG & NARA, 2005)
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer, Gallart, 2007)
Repositorio seguro (10)
• Los repositorios pueden ser certificados:
– Organización.
– Gestión del objeto.
– Infraestructura y seguridad.
“Catalogue of crtieria for trusted digital repositories”
(NESTOR, Network of Expertise in Long-Term Storage
of Digital Resources, 2006)
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer, Gallart, 2007)
06/10/2012
36
Repositorio seguro (11)
• Externalización de los servicios de preservación:
– El colectivo bibliotecario acepta como un hecho imposible
que una sola institución pueda hacer frente a todas las
exigencias de la preservación digital.
– Más allá de confiar en la fiabilidad a largo plazo de los
servicios comerciales, se han fomentado la creación de
centros cooperativos, sin ánimo de lucro:
• Digital Preservation, California Digital Library.
• European Archive.
• UK Data Archive.
• Metaarchive.org
Preservación digital UNMSM Ciro Llueca (22 sep 2012) (Keefer, 2012)
Táctica (7)
• Retos, especialmente en las redes sociales:
– Servidores externos.
– Autores múltiples.
– Actualizaciones contínuas.
– Falta de copias máster.
– Información sin contexto.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
(Keefer, 2012)
06/10/2012
37
El Archivo de la Web
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
En síntesis (1)
• Tras numerosos informes, estudios y proyectos,
no existe en la actualidad un sistema informático
que cumpla todos los requerimientos de
preservación digital.
• Se combinan estrategias a medio plazo y
actividades experimentadas para garantizar el
acceso a los fondos digitales.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
38
En síntesis (2)
• A diferencia de la actuación tradicional, orientada
a mantener el documento en su estado original,
los documentos digitales deben ser modificados y
transformados continuamente a lo largo del
tiempo para que continúen siendo accesibles e
inteligibles.
• Se trata de preservación por alteración.
– Además de preservar una versión accesible i legible,
los expertos recomiendan preservar, además, la
cadena de bits original.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
En síntesis (3)
• Aún existiendo capacidad técnica y voluntad
institucional de preservación digital, los recursos
limitados obligan a las instituciones a establecer
una política:
– Necesidades y recursos de la institución.
– Intereses de sus usuarios.
– Diferentes aspectos físicos e intelectuales.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
39
En síntesis (4)
• Existen dos acciones básicas de
preservación digital, que habitualmente
actúan combinadas:
–Actualización de los soportes.
–Migración de los formatos.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
En síntesis (5)
• La elección de un formato puede condicionar:
– La selección o no del recurso para ser preservado.
– El método usado para su preservación.
– La facilidad de recuperar y visualizar el documento.
– El tipo de uso posible en el futuro.
– El coste de la preservación.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
40
En síntesis (6)
• La elección del sistema de metadatos es esencial
para su futura interoperabilidad y visibilidad, más
allá de nuestra propia institución.
• El sistema puro de autoarchivo puede tener
consecuencias en la correcta asignación de
metadatos.
• Habitualmente (autoarchivo) se opta por unos
mínimos (autor, título, fecha, etc.), que
completarán los servicios técnicos.
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
En síntesis (7)
• Las instituciones deben poder ser fiables:
– Garantizar la integridad y autenticidad del recurso.
– Velar por la protección de los derechos.
– Limitar el acceso a usuarios autorizados.
– Mantener las herramientas necesarias para identificar
y recuperar la información.
– Asegurar la presencial de metadatos normalizados.
“Trusted digital respositories: atributes and
responsabilities” (RLG & OCLC, 2002)
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
06/10/2012
41
Bibliografía- Elvira, M., ed. (2011). “Preservación de los documentos digitales: guía para comenzar. ISO/TC 46/SC: versión
española, octubre 2010”. Revista española de documentación científica, 34, 3 (jul-sep).
http://redc.revistas.csic.es/index.php/redc/article/view/708/785
- Harvey, R. (2005). Preserving digital materials. München: KG Saur.
- Hunter, G. S. (2000). Preserving digital information: a how-to-do-it manual. New York: London: Neal-
Schuman.
- Kahn, M.B. (2000). Protecting your library’s digital sources. Chicago: ALA.
- Keefer, A.; Gallart, N. (2007). La preservación de recursos digitales: el reto para las bibliotecas del siglo XXI.
Barcelona: UOC.
- Keefer, A.; Gallart, N. (2012). Preservación de recursos de información digital. [material docente] Barcelona:
UOC.
- Lusenet, Y. de; Wintermans, V., eds. (2007). Preserving the digital heritage: principles and policies. The
Haghe. Netherlands National Commission for UNESCO.
- Soler, J. (2009). La preservación de los documentos electrónicos. Barcelona: UOC.
- Rothernberg, J. (2000). Using emulation to preserve digital documents. The Hague: Koninklijke Bibliotheek.
- Serra, E. (2011). Planificació i disseny d’un projecte de digitalització. [material docente ]. Barcelona:
Biblioteca de Catalunya.
- Térmens, M. (2009). “Investigación y desarrollo en preservación digital: un balance internacional”. El
profesional de la infomación, vol. 18, núm. 6 (Nov-Dic).
http://eprints.rclis.org/bitstream/10760/16218/1/Investigacion-preservacion-EPI.pdf
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
¡Gracias por vuestra participación!
Preservación digital UNMSM Ciro Llueca (22 sep 2012)
Ciro Llueca es bibliotecario y profesor universitario.
Coordinador del PADICAT (Patrimonio Digital de Cataluña) en laBiblioteca de Cataluña (Barcelona, España); es profesor delgrado de Información y Documentación de la Universidad deBarcelona, y del Máster online de Documentación Digital en laUniversidad Pompeu Fabra. Editor para España y coordinadoreditorial para Europa de E-LIS, E-prints in Library and InformationScience. Fue vicepresidente del Colegio Oficial de Bibliotecarios-Documentalistas de Cataluña (2003-2006).
http://bd.ub.es/pub/llueca/Esta presentación se halla en E-LIS y otras
plataformas de difusión en abierto.