12
1 1 Ingeniería aplicada a proyectos de digitalización Alejandro Bia Platas Centro de Investigación Operativa Universidad Miguel Hernández (Elche) [email protected] Las sociedades modernas demandan contenidos digitales y servicios de alta calidad, que dependen cada vez más del software y los métodos de producción empleados. La calidad de la producción de contenidos digitales se ha convertido en un asunto muy importante para las instituciones que los producen, las cuales intentan mejorar los procesos de producción para obtener mejor calidad y mayor cantidad a menor costo. En la ingeniería de software mucho se ha hecho y se está haciendo para mejorar la producción de software. Muchas de estas técnicas se pueden adaptar para aplicarlas a la producción masiva de contenidos. Los pioneros Los ordenadores son muy efectivos a la hora de tratar con problemas bien definidos, pero tratar con el conocimiento humano no es un problema bien definido. Se necesitaron medios eficaces para que los ordenadores pudieran procesar los registros de conocimiento humano. Esto no es nada fácil. De hecho es un tema básico de investigación en bibliotecas digitales. Desde una perspectiva histórica, se suele citar como pioneros 1 en el uso de ordenadores para almacenar, organizar, buscar y recuperar conocimiento humano a: Vannevar Bush 2 : en julio de 1945 escribió un artículo en la revista Atlantic Monthly titulado As we may think 3 , donde describía un sistema de gestión de conocimiento llamado Memex. J.C.R. Licklider 4 : en 1964 escribió Libraries in the future. Theodore Nelson 5 : se lo considera el padre del hipertexto, o al menos fue quien lo bautizó. En 1965 escribió un artículo llamado The Hypertext, publicado en actas del congreso de la World Documentation Federation de ese año. Ted Nelson ideó sistemas hipertextuales para la interconexión de documentos electrónicos, y presentó el proyecto Xanadú 6 que tenía como objetivo principal la construcción de un servidor de hipertexto que permitiera almacenar y enlazar toda la literatura mundial, y que fuera accesible desde cualquier ordenador. 1 http://www.ibiblio.org/pioneers/ 2 http://www.ibiblio.org/pioneers/bush 3 Una copia del artículo As We May Think de Vannevar Bush se puede encontrar en: http://www.theatlantic.com/doc/194507/bush 4 http://www.ibiblio.org/pioneers/licklider.html 5 http://www.ibiblio.org/pioneers/nelson 6 http://www.xanadu.net/

Ingenieria_del_proyecto_de_digitalizacion.pdf

Embed Size (px)

Citation preview

  • 1 1

    Ingeniera aplicada a proyectos de digitalizacin

    Alejandro Bia Platas Centro de Investigacin Operativa

    Universidad Miguel Hernndez (Elche) [email protected]

    Las sociedades modernas demandan contenidos digitales y servicios de alta calidad, que dependen cada vez ms del software y los mtodos de produccin empleados. La calidad de la produccin de contenidos digitales se ha convertido en un asunto muy importante para las instituciones que los producen, las cuales intentan mejorar los procesos de produccin para obtener mejor calidad y mayor cantidad a menor costo. En la ingeniera de software mucho se ha hecho y se est haciendo para mejorar la produccin de software. Muchas de estas tcnicas se pueden adaptar para aplicarlas a la produccin masiva de contenidos.

    Los pioneros Los ordenadores son muy efectivos a la hora de tratar con problemas bien definidos, pero

    tratar con el conocimiento humano no es un problema bien definido. Se necesitaron medios eficaces para que los ordenadores pudieran procesar los registros de conocimiento humano. Esto no es nada fcil. De hecho es un tema bsico de investigacin en bibliotecas digitales.

    Desde una perspectiva histrica, se suele citar como pioneros1 en el uso de ordenadores para almacenar, organizar, buscar y recuperar conocimiento humano a:

    Vannevar Bush2: en julio de 1945 escribi un artculo en la revista Atlantic Monthly titulado As we may think 3, donde describa un sistema de gestin de conocimiento llamado Memex.

    J.C.R. Licklider4: en 1964 escribi Libraries in the future. Theodore Nelson5: se lo considera el padre del hipertexto, o al

    menos fue quien lo bautiz. En 1965 escribi un artculo llamado The Hypertext, publicado en actas del congreso de la World Documentation Federation de ese ao. Ted Nelson ide sistemas hipertextuales para la interconexin de documentos electrnicos, y present el proyecto Xanad 6 que tena como objetivo principal la construccin de un servidor de hipertexto que permitiera almacenar y enlazar toda la literatura mundial, y que fuera accesible desde cualquier ordenador.

    1 http://www.ibiblio.org/pioneers/

    2 http://www.ibiblio.org/pioneers/bush

    3 Una copia del artculo As We May Think de Vannevar Bush se puede encontrar en:

    http://www.theatlantic.com/doc/194507/bush 4 http://www.ibiblio.org/pioneers/licklider.html

    5 http://www.ibiblio.org/pioneers/nelson

    6 http://www.xanadu.net/

  • 2 2

    Tim Berners Lee7: fue el implementador de estas ideas al crear la World Wide Web, un sistema de navegacin de informacin basado en hiperenlaces.

    Los ordenadores se usan en las bibliotecas desde mucho antes de que apareciera la Web, pero la Web permiti la existencia de las bibliotecas digitales al proveer una forma conveniente de distribuir informacin a travs de Internet.

    Tecnologa en proyectos de digitalizacin Los proyectos de digitalizacin incorporan mltiples tecnologas, como por ejemplo:

    Nuevas tecnologas de publicacin hipertextuales: este tipo de proyectos altamente tecnificados, muchas veces basados en la Web, suelen hacer uso de las ms nuevas tecnologas hipertextuales: HTML, XML, XSLT, CSS, Javascript, etc.

    Diseo grfico: se aplica en el diseo de las interfaces grficas, por ejemplo de la pgina principal y de las diferentes secciones del portal Web. Algunos de estos portales muestran un diseo grfico muy elaborado que suma su aporte esttico al contenido cultural.

    Produccin de recursos digitales: las bibliotecas y museos digitales suelen producir sus propios recursos. Esto requiere de mtodos y herramientas especializadas para la produccin de textos, imgenes, video y audio. Comentaremos algunas de ellas ms adelante.

    Servicios de explotacin: para sacar mayor provecho de los recursos digitales, y dar mayor satisfaccin a los usuarios, se suelen ofrecer mltiples servicios donde la tecnologa extrae lo mximo de los recursos disponibles. Hablamos de recursos lingsticos (diccionarios, concordancias), servicios interactivos (foros de discusin, personalizacin de accesos, servicios de consulta y ayuda).

    Bases de datos y buscadores: es necesario proveer mecanismos para localizar los recursos existentes, trtese de catlogos y directorios, o de buscadores de texto. En el primer caso se utilizar una base de datos para buscar y navegar en la metainformacin, y en el segundo caso indexadotes y motores de bsqueda de texto simple o texto marcado, para bsquedas en el cuerpo de documentos.

    Ingeniera Web: la ingeniera Web, un rea de especializacin de la Ingeniera del Software, provee mtodos y disciplina de ingeniera mediante tcnicas prcticas para la gestin de los proyectos, y el anlisis y diseo tecnolgico, que ayudan al mejor desarrollo de estos emprendimientos tecnolgico-culturales.

    Gestin de proyectos: La gestin de proyectos trata de la visin y control global del desarrollo de proyectos tecnolgicos, incluyendo el modelado del proyecto, la eleccin de un proceso de desarrollo adecuado, planificacin, anlisis, prevencin de riesgos, planes de contingencia, estimacin de costes, diseo y control de flujos de trabajo, captura y anlisis de mtricas, sistema de informacin gerencial y de toma de decisiones, entre otros.

    7 http://www.ibiblio.org/pioneers/lee.html

  • 3 3

    Figura 1. Ingeniera de los proyectos de digitalizacin

    Ingeniera de software Cuando hablamos de ingeniera de software, nos referimos a una serie de mtodos,

    tcnicas, y buenas prcticas, cuyo objetivo es crear un marco slido y confiable para el desarrollo tecnolgico. La ingeniera de software pretende emular a otras disciplinas de la ingeniera, imitando sus mtodos con la finalidad de sistematizar y controlar los procesos de desarrollo de software, que por su naturaleza intelectual e intangible tienden a ser ms caticos y anrquicos que los de otras ramas ms tradicionales de ingeniera. Esta disciplina de la ingeniera, ha ayudado a salir de la crisis del software de los aos setenta y ochenta y lograr niveles de calidad y confiabilidad satisfactorios con costos razonables.

    Figura 2. Disciplinas que componen la ingeniera de software

  • 4 4

    Requerimientos de un proyecto de digitalizacin Utilicemos como caso de uso las bibliotecas digitales. Las bibliotecas digitales son proyectos multidisciplinarios donde trabajan juntos: bibliotecarios, fillogos, tcnicos informticos, diseadores grficos, y otros profesionales. El siguiente grfico (ver figura 2) muestra la distribucin de personal en un momento dado, de la biblioteca Virtual Miguel de Cervantes.

    Como los costes de produccin de recursos digitales suelen ser muy altos, es necesario un fuerte apoyo econmico para la creacin y mantenimiento de estos proyectos. Tambin se requiere apoyo poltico para sacarlos adelante. Es tambin esencial la eleccin de las tecnologas ms adecuadas para satisfacer los requisitos del proyecto.

    Los pasos iniciales en la creacin de un proyecto de biblioteca digital consisten, desde un punto de vista global, en la definicin de los mtodos de produccin que conformarn el flujo de trabajo (workflow) y, desde una perspectiva de ms bajo nivel, en la seleccin de la tecnologa, formatos y herramientas para procesar los textos e imgenes.

    Recursos Humanos: 87 personas

    Mantenimiento Informtico

    2%

    Investigacin yDesarrollo Informtico

    7%

    Diseo grfico5%

    Bibliotecarios6%

    Preparacin de textos2%

    Digitalizacin15%

    Correccin yMarcado XML

    60%

    Administracin3%

    Figura 3. Distribucin de personal en una biblioteca digital

    He aqu una lista de cosas a tener en cuenta a la hora de crear una biblioteca digital, que pueden ser perfectamente extrapolables a otros proyectos de digitalizacin.

    Pruebas de factibilidad, costes y pruebas piloto Solicitud de ayudas pblicas y captacin de fondos Gestin de proyectos Diseo de flujos de trabajo (Workflow processes) Seleccin de originales a digitalizar Gestin de derechos de autor Diseo y creacin de metadatos Preparacin de materiales Captura digital Codificacin de textos (marcado) Control de calidad

  • 5 5

    Gestin de almacenamiento Publicacin Web Preservacin a largo plazo

    Anlisis de requerimientos En la ingeniera de software, el anlisis de requerimientos (o de requisitos) comprende todas las tareas relacionadas con la determinacin de las necesidades o de las condiciones a satisfacer en un proyecto software, como es el desarrollo de una biblioteca digital. La ingeniera de requerimientos, provee tcnicas para la correcta captura de los requisitos de los usuarios:

    La IEEE la define como: el proceso de estudio de las necesidades de los usuarios con el objeto de llegar a una definicin del sistema hardware/software.

    Segn Loucopoulos: Trabajo sistemtico de desarrollo de requisitos, a travs de un proceso iterativo y cooperativo de anlisis del problema, documentando los resultados en una variedad de formatos y probando la exactitud del conocimiento adquirido.

    Los requerimientos deben ser medibles, comprobables, sin ambigedades o contradicciones, contrastados con los usuarios o clientes del proyecto, etc.

    Al iniciar un proyecto debemos pensar en: Cul es el problema? Qu detalles presenta el problema? Importancia del problema Cul es la solucin aportada por el usuario? En qu medida ser de ayuda un sistema de informacin? Qu otras personas conocen el problema y se puede contactar?

    Figura 4. Proceso de Ingeniera de Requerimientos

  • 6 6

    La captura y anlisis de requisitos, dar lugar a un documento de requisitos, que nos servir para comprobar el fiel cumplimiento de los mismos al finalizar el proyecto de desarrollo.

    De ms de 40 tcnicas de captura de requerimientos, las ms efectivas son: Entrevistas

    JAD (Joint Application Design) Talleres de Requerimientos (una versin moderna del JAD) Construccin de prototipos Observacin Estudio de documentacin Cuestionarios Listas de verificacin (check-lists): son un ayuda memoria, tiles para muchos

    fines

    Tormenta de ideas (brainstorming) Casos de uso UML (usados adecuadamente) Storyboards Anlisis de interfaces Modelado grfico: elaboracin de diagramas que nos permitan aclarar ideas y

    conceptos mediante una visin de alto nivel y prescindiendo de los detalles. Anlisis de desempeo y capacidad Estudio de escenarios.

    De todos estos, destacamos el mtodo JAD, que consiste en un conjunto de reuniones programadas entre usuarios y tcnicos. Dura entre dos y cuatro das, en los que se aplican tcnicas de dinmica de grupos. Se comienza con un documento de trabajo, y se discute. Al final del JAD se obtiene un documento de requisitos aprobados. Es muy importante que los requisitos se estudien en profundidad, y que queden debidamente documentados. Esto evita costosos cambios y rediseos debidos a errores cometidos por no tener los requisitos claros. El documentarlos debidamente evita posibles malos entendidos, y permite resolver discrepancias futuras.

    Importancia de priorizar los requisitos Una vez que hemos identificado las categoras de los problemas, debemos ordenarlos de

    forma descendente con la categora que causa la mayora de los problemas primero, seguida de la categora con la siguiente tasa de problemas, y as sucesivamente. Esto se llama anlisis de Paretto, y es una tcnica de mejora de calidad muy poderosa. La figura siguiente muestra un ejemplo de diagrama de Paretto.

    A finales de los 1800, Vilfredo Paretto, un economista italiano, dijo que el 80% de la tierra en Italia perteneca al 20% de la poblacin. Esta fue la primera versin de una ley socioeconmica que pronto tendra alcance universal. La ley de Paretto, en su forma general, dice que el 80% de los objetivos, o en general de los efectos, se logran con el 20% de los

  • 7 7

    medios, o de las causas o los agentes. En otras palabras, el costo requerido para ir de un 80% a un 100% de los objetivos es cuatro veces mayor que el requerido para ir del 0% al 80%. El corolario de esto, a los efectos del anlisis de requisitos y la gestin de proyectos, es que si priorizamos adecuadamente los requisitos, poniendo primero los que producirn la mayor parte de los resultados esperados y por ltimo lo que causen menos efecto, tendremos que rpidamente y con un pequeo coste obtendremos la mayor parte de los resultados esperados, para rpida satisfaccin de los usuarios.

    Figura 5. Ejemplo de diagrama de Paretto (Tomado de Ralph Young, The Requirements Engineering Handbook, pag 148, Artech House, 2004)

    Anlisis de riesgos Mientras que es intil intentar eliminar el riesgo y cuestionable el poder minimizarlo, es

    esencial que los riesgos que se tomen sean los riesgos adecuados. Antes de poder identificar los riesgos adecuados a tener en cuenta en un proyecto de software, es importante poder identificar todos los riesgos que sean obvios a jefes de proyecto y profesionales del software. Peter Drucker

    El anlisis y la gestin del riesgo son una serie de pasos que ayudan al equipo del proyecto a comprender y a gestionar la incertidumbre. Un proyecto de software puede estar lleno de problemas. Un riesgo es un problema potencial, es decir, que puede ocurrir o no. Por ello tiene una importancia el identificarlo, evaluar su probabilidad de aparicin, estimar su impacto, y establecer un plan de contingencia por si ocurre el problema.

    El anlisis de riesgos consiste en pensar de antemano y con detenimiento en los posibles factores de riesgo y amenazas que puedan entorpecer o hacer fracasar nuestro proyecto. Consta de las siguientes fases:

    Deteccin de riesgos: consiste en detectar posibles riesgos y amenazas. Una tcnica til para ello puede ser la tormenta de ideas (brainstorming).

    Planes de evitacin o prevencin: consiste en redactar planes para evitar o prevenir los riesgos detectados, con el fin de que no sucedan. Se trata de adoptar una estrategia proactiva en lugar de reactiva.

  • 8 8

    Planes de contingencia: consiste en elaborar planes de accin para minimizar los efectos en caso de que el factor de riesgo se haga realidad. Se trata de una estrategia reactiva a aplicar en los casos en que las estrategias proactivas o de evitacin han fallado.

    Una vez identificados los riesgos, se debe determinar la probabilidad de que suceda, y el impacto que tendra cada riesgo. La probabilidad puede ser muy baja, baja, moderada, alta o muy alta. El efecto del riesgo, es decir, su impacto, podr ser catastrfico, serio, tolerable o insignificante. Con estos elementos se suele hacer una tabla de riesgos, probabilidades e impactos.

    Flujos de trabajo (workflow) y controles de calidad Suele ser ventajoso estudiar el flujo de trabajo (workflow) de un proyecto de digitalizacin

    con el fin de automatizarlo total o parcialmente, y si no podemos automatizarlo, al menos tendremos claros los pasos a seguir. Una forma de abstraccin que nos permite capturar el flujo de trabajo es mediante diagramas. Los diagramas de actividad de UML son muy adecuados para este propsito (ver figura 6).

    En un proyecto de digitalizacin, al igual que en un proyecto software, se debe elaborar un plan de calidad que establezca cules son los objetivos a lograr y que definan los controles de calidad que se van a realizar para obtener una medida de los logros. De esta forma, se establecern puntos en el flujo de trabajo donde se realizarn controles que permitan detectar fallos en la calidad y tomar medidas para corregirlos.

  • 9 9

    Por ejemplo, en un proceso de produccin de textos digitales, debemos verificar varias cosas, entre ellas la calidad del texto digitalizado. Una forma de hacerlo es incluir una instancia de supervisin en el flujo de trabajo, donde los expertos hacen catas de los textos en busca de errores. Si se encuentran, el texto se devuelve a la persona que lo corrigi y maquet, para que lo revise y corrija. Si pasa la prueba, podr ser publicado en la Web (ver figura sobre flujo de trabajo).

    Figura 6. Diagrama de Actividad UML que muestra el flujo de trabajo propuesto para la produccin de libros digitales en una biblioteca digital

  • 10 1

    Control de versiones y cambios Hemos dicho que las bibliotecas digitales suelen producir sus propios recursos.

    Normalmente se producen y almacenan miles de documentos de texto. En tales condiciones, es necesario contar con el apoyo de un sistema de control de versiones y cambios.

    El control de versiones es til cuando tenemos que almacenar documentos que cambian con frecuencia: esto incluye los recursos producidos en un proyecto de digitalizacin (texto, imgenes, audio y vdeo), y en especial el cdigo fuente de los programas y dems ficheros de un proyecto software.

    Un sistema de control de versiones es un software que administra el acceso a un conjunto de ficheros. Consta de una copia maestra en un almacenamiento central, y un programa cliente con el que cada usuario sincroniza su copia local.

    Un sistema de control de versiones tiene dos finalidades principales: 1. Control de acceso concurrente a ficheros: Permite compartir los cambios sobre

    un mismo conjunto de ficheros evitando/previniendo modificaciones simultneas as como la creacin de dobles versiones de un mismo fichero.

    2. Guardar el historial de los cambios realizados: El repositorio guarda registro de todos los cambios realizados por cada usuario, y permite volver a un estado anterior en caso de necesidad. Tambin permite ver las diferencias entre dos versiones cualesquiera de un fichero.

    Existen hoy en da varios productos software para el control de versiones. Algunos de ellos son de uso libre gratuito, y otro de pago. Ejemplos de sistemas de control de versiones son:

    Concurrent Versioning System (CVS): ste su sistema que tiene ya varios aos. No es fcil de instalar o de usar, pero es muy fiable. Es de distribucin gratuita

    SubVersion (SVN): es una versin simplificada y ms reciente del CVS, tambin de distribucin gratuita. Resulta fcil de instalar y de usar, aunque an est en desarrollo y no posee todas las caractersticas deseadas. Al igual que CVS, permite que varios usuarios extraigan el mismo fichero a la vez. Al volver a ingresarlo al sistema, se verifica si hay diferencias entre las copias extradas simultneamente. De esta forma se previene pero no se evita que un usuario destruyera los cambios que hizo otro a un fichero al introducir su copia del mismo. Si el sistema nos avisa que hay diferencias, debemos decidir a mano con que cambios quedarnos.

    MS Visual Source Safe (MS-VSS): es un sistema de la empresa Microsoft, muy fiable, no gratuito, que tiene caractersticas muy interesantes. Este programa poseer diferentes modos de extraer un fichero de su almacn. Siempre podemos extraer una copia de un fichero sin permiso de modificacin. Esto nos permite ver y utilizar el fichero, pero si le hacemos cambios, el sistema no nos dejar ingresarlo de nuevo. Para extraer una copia con permiso de modificacin, debemos realizar un check-out, operacin con la cual el fichero queda bloqueado y nuestro nombre registrado como que le estamos haciendo cambios. Si otro usuario quisiese extraer ese fichero para hacer modificaciones, el sistema le dira que lo tenemos nosotros y que no puede sacarlo hasta que hagamos un check-in, operacin con la cual el fichero que extrajimos es reintegrado al almacn con los cambios que hayamos realizado, y pasa a estar disponible de nuevo para que otro usuario lo saque y modifique. Esta filosofa es claramente diferente a la de CVS o de SVN.

  • 11 1

    Bibliografa [Agosti, M. et al, 2006] Agosti, M., Candela, L., Castelli, D., Ferro, N., Ioannidis, Y.,

    Koutrika, G., Meghini, C., Pagano, P., Ross, S., Schek, H.-J., & Schuldt, H. A Reference Model for DLMSs Interim Report. In L. Candela, & D. Castelli (Eds.), Deliverable D1.4.2 - Reference Model for Digital Library Management Systems [Draft 1]. DELOS, A Network of Excellence on Digital Libraries -- IST-2002-2.3.1.12, Technology-enhanced Learning and Access to Cultural Heritage.

    [Arms, 2000] William Arms, Digital Libraries, chapter 13: Repositories and Archives, pag. 245-262, ISBN 0-262-01880-8, MIT Press, Cambridge, Massachusetts, 2000.

    [Baeza-Yates y Ribeiro-Neto, 1999] Ricardo Baeza-Yates and Berthier Ribeiro-Neto, Modern Information Retrieval, 1st ed., ACM press and Addison Wesley, Edinburgh Gate, Harlow, Essex CM20 2JE, England, 1999, isbn 0-201-39829-X, see http://www.dcc.ufmg.br/irbook or http://sunsite.dcc.uchile.cl/irbook,

    [Bradley et al., 1997] John Bradley, Geoffrey Rockwell and Alex Stevens, TACTweb, an experimental software to access TACT databases through Internet, March 1997. http://tactweb.humanities.mcmaster.ca/index.htm

    [Burnard, 1997] Lou Burnard, The Pizza Chef: a TEI Tag Set Selector, September 1997, (Original version 13 September 1997, updated July 1998; Version 2 released 8 Oct 1999) http://www.hcu.ox.ac.uk/TEI/pizza.html

    [Candela L. et al 2008] L. Candela, D. Castelli, N. Ferro, Y. Ioannidis, G. Koutrika, C. Meghini, P. Pagano, S. Ross, D. Soergel, M. Agosti, M. Dobreva, V. Katifori, H. Schuldt. The DELOS Digital Library Reference Model - Foundations for Digital Libraries. Version 0.98, February 2008. http://www.delos.info/files/pdf/ReferenceModel/DELOS_DLReferenceModel_0.98.pdf

    [Cheney et al., 2001] James Cheney, Carl Lagoze and Peter Botticelli, Towards a Theory of Information Preservation, in Research and Advanced Technology for Digital Libraries: 5th European Conference, proceedings/ECDL 2001, Darmstadt, Germany, 4-9th September 2001, eds. P. Constantopoulos and I.T. Solvberg, Lecture Notes in Computer Science, v. 2163, pag. 340-351, Springer-Verlag, ISBN = 3-540-42537-3, ISSN = 0302-9743

    [Gonalves et al, 2004] Gonalves, M. A., Fox, E. A., Watson, L. T., & Kipp, N. A. Streams, Structures, Spaces, Scenarios, Societies (5S): A Formal Model for Digital Libraries. ACM Transactions on Information Systems (TOIS), 22 (2), 270-312, 2004.

    [Grefenstette, 1999a] Gregory Grefenstette, Using the WWW as a linguistic resource, XV Conferencia de la Sociedad Espaola para el Procesamiento del Lenguaje Natural (SEPLN), Septiembre de 1999, Lleida, Espaa.

    [Grefenstette, 1999b] Gregory Grefenstette, The World Wide Web as a Resource for Example-Based Natural Language Processing Tasks, Xerox Research Centre Europe, Grenoble Laboratory, 6 chemin de Maupertuis 38240 Meylan, France, 1999. http://www.xrce.xerox.com/people/grefenstette/ File: justspan.pdf

    [Harter, 1997] Stephen Harter, Scholarly Communication and the Digital Library: Problems and Issues, JoDI (Journal of Digital information), vol. 1, n. 1, April 1997. An earlier version of this paper was delivered at KOLISS DL '96: International Conference on Digital Libraries and Information Services for the 21st Century, September 10-13, 1996, Seoul, Korea. http://jodi.ecs.soton.ac.uk/Articles/v01/i01/Harter/ (visited July 5th 2000).

    [Kenney, 2003] Anne R. Kenney, Oya Y. Rieger and Richard Entlich, Llevando la Teora a la Prctica: Tutorial de Digitalizacin de Imgenes (captulo 8: Preservacin

  • 12 1

    Digital) / Moving Theory into Practice, Digital Imaging Tutorial (chapter 8: Digital Preservation), Copyright Cornell University Library/Department of Preservation and Conservation, 2000-2003. (disponible en ingls, castellano y francs) http://www.library.cornell.edu/preservation/tutorial/

    [Levy, 1998] David M. Levy, Heroic measures: reflections on the possibility and purpose of digital preservation, Proceedings of the third ACM conference on Digital libraries, pag.152-161, isbn 0-89791-965-3, Pittsburgh, Pennsylvania, United States, 1998, ACM Press. http://doi.acm.org/10.1145/276675.276692

    [Mackenzie, 1986] David Mackenzie. A Manual of Manuscript Transcription for the Dictionary of the old Spanish Language. Edicin de Victoria A. Burrus. Madison, 4 edicin, 1986.

    [Pells y Snchez, 2000] Elena Pells Prez y Manuel Snchez-Quero, Manual de trascripcin de manuscritos para el diccionario de la lengua castellana medieval, 2000, (traduccin de A Manual of Manuscript Transcription for the Dictionary of the old Spanish Language de David Mackenzie, 4 ed.), http://cervantesvirtual.com/research/intranet/madison.pdf.

    [Puig-Bia, 2003] Julia Puig and Alejandro Bia, The Miguel de Cervantes DL's Digital Theses Program, ETD 2003 (Sixth International Symposium On Electronic Theses and Dissertations), Networked Digital Library of Theses and Dissertations (NDLTD), 21-24th May 2003, Humboldt-University, Berlin. http://www.hu-berlin.de/etd2003/

    [Rieger, 2001] Oya Y. Rieger, Libraries'Role in Preserving Digital Collections, Presentation at the Alicante meeting of the META-e Project, February, 2001.

    [Tibbo, 2001] Helen R. Tibbo, Archival Perspectives on the Emerging Digital Library, Communications of the ACM, v. 44, n. 5, pag. 69-60, may 2001.

    [Waugh et al., 2000] Andrew Waugh, Ross Wilkingson, Brendan Hill and Jon Dell'oro, Preserving Digital Information Forever, ACM 2000 Digital Libraries conference (Fifth ACM Conference on Digital Libraries), pag. 175-184, Menger Hotel, San Antonio, Texas, USA, june 2000. http://www.acm.org/jcdl/dl00/

    [Witten et al., 2003] Ian H. Witten and David Bainbridge, How to Build a Digital Library, Elsevier Science (USA), 2003, ISBN 1-55860-790-0.