Los Archivos y Linked Open Data: normativa de Europeana y del W3C, de Xavier Agenjo

Preview:

DESCRIPTION

Ponencia presentada en el ciclo de conferencias "Los archivos diocesanos: nuevos retos ante la era virtual" que tuvo lugar en la Sala de Conferencias de la Facultad de Filosofía y Letras de la Universidad Autónoma de Madrid (Campus de Cantoblanco), durante los días 11 y 12 de diciembre de 2012 y que fueron organizadas por la Universidad Autónoma de Madrid y el Archivo Diocesano de Madrid y patrocinadas por diversas empresas colaboradoras, entre las que figuraba DIGIBÍS.

Citation preview

Los Archivos y Linked Open Data: normativa de Europeana y del W3C

Xavier Agenjo BullónFundación Ignacio Larramendixavier.agenjo@larramendi.es

Los Archivos Diocesanos: nuevos retos ante la era virtualMadrid, 11 y 12 de diciembre de 2012

Universidad Autónoma de Madrid / Archivo Diocesano de Madrid

1

Linked Open Data según la OCLC

3

4

5

6

El Grupo Incubador de Datos Vinculados de Bibliotecas del W3C

mayo de 2010 hasta agosto de 2011

contribuir a incrementar la interoperabilidad global de los datos de las bibliotecas en la Web

reunir a personas implicadas en actividades de la Web Semántica —centradas en los Datos Vinculados— en bibliotecas e instituciones afines

examinar las iniciativas en curso e identificar futuras vías de colaboración

7

8

Informe final

El informe final del Grupo Incubador examina cómo pueden utilizarse las normas de la Web Semántica y los principios de

Datos Vinculados para que los valiosos activos de información que las bibliotecas crean y tratan — recursos tales como datos

bibliográficos, autoridades y esquemas conceptuales — sean más visibles y reutilizables más allá de su contexto bibliotecario

original, en toda la extensión de la Web.

9

Biblioteca

Abarca la gama completa de las instituciones de memoria y de patrimonio cultural, lo que comprende a las bibliotecas, los museos y los archivos.

Hace referencia a tres conceptos distintos, pero relacionados: la colección de objetos físicos o abstractos (incluyendo

potencialmente los "digitales");

el sitio donde se localizan las colecciones;

y el agente que conserva la colección y administra el sitio.

Las colecciones pueden ser públicas o privadas, grandes o pequeñas, y no se limitan a ningún tipo de recurso en particular.

10

Datos de Bibliotecas

El término "Datos de bibliotecas" se refiere a cualquier tipo de información digital producida o conservada por las bibliotecas y que describe recursos o sirve para su localización.

El informe distingue, a efectos prácticos, tres tipos de datos de bibliotecas según su uso habitual:

conjuntos de datos,

conjuntos de elementos

vocabularios de valores

11

Datos vinculados

Datos Vinculados. son datos publicados según los principios establecidos para facilitar el enlace entre conjuntos de datos, conjuntos de elementos y vocabularios de valores [LINKEDDATA].

Los Datos Vinculados utilizan Uniform Resource Identifiers (URIs) como identificadores únicos globales para cualquier clase de recurso, de forma análoga a como se utilizan los identificadores en el tradicional proceso biblioteconómico de control de autoridades [URI].

Los Datos Vinculados se expresan por medio de estándares como Resource Description Framework (RDF)

12

Datos vinculados de bibliotecas

"Datos Vinculados" se refieren a la interoperabilidad técnica de los datos,

"Datos Abiertos" se centran en el aspecto legal de la interoperabilidad. Según las definiciones de Open Bibliographic Data [Datos Bibliográficos Abiertos], los Datos Abiertos son esencialmente algo utilizable libremente, reutilizables y redistribuibles, sujetos, como máximo, a los requisitos de reconocimiento y de compartir igual.

"Datos Vinculados de Bibliotecas" son cualquier tipo de datos de bibliotecas (como se ha definido antes) expresados en forma de Datos Vinculados.

13

Limitaciones de los datostradicionales de bibliotecas

Las normas de las bibliotecas están diseñadas únicamente para la comunidad bibliotecaria

Los datos de bibliotecas se expresan primordialmente en lenguaje natural textual

La comunidad bibliotecaria y la comunidad de la Web Semántica utilizan una terminología diferente para conceptos similares sobre metadatos

Los cambios tecnológicos en las bibliotecas dependen del desarrollo de sistemas comerciales

14

Recomendaciones

Identificar los conjuntos de datos candidatos a exponerse inmediatamente como Datos Vinculados

Fomentar el debate sobre Datos Abiertos y los derechos de propiedad

Incrementar la participación de las bibliotecas en la estandarización de la Web Semántica

Desarrollar normas sobre datos de bibliotecas compatibles con Datos Vinculados

Desarrollar y difundir mejores prácticas en el diseño de modelos ajustadas a Datos Vinculados de bibliotecas

Diseñar y probar servicios para los usuarios basados en las capacidades de Datos Vinculados

15

Recomendaciones

Crear URIs para los ítems de los conjuntos de datos de bibliotecas

Desarrollar políticas de gestión de vocabularios de Datos Vinculados y de sus URIs

Expresar los datos de bibliotecas por medio de la reutilización o del mapeo de vocabularios de Datos Vinculados

Preservar los conjuntos de elementos y los vocabularios de valores de Datos Vinculados

Aplicar la experiencia bibliotecaria en el tratamiento de los conjuntos de datos y su preservación a largo plazo en Datos Vinculados

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

Modelización de EDM para Archivos

41

42

1.4 Ingestion (Annelies van Nispen)

Museums

Li

br

aries

Ar

chi

ves

PublishersCreative Industries

Roundtripping

Objective: to improve the ingestion workflow and to be completely EDM compliant

quality

control

All objects with rights labelsAll objects with preview

UIM

training and infoEDM

UIM and EDM fully implemented in ingestion

workflow

10 training days

43

KPIs

Advocate with the Europeana Network to improve access to cultural heritage material through open--oriented rights--related policies and regulatory initiatives that affect digitisation

Promote adoption of the Europeana licensing framework regarding Open Metadata aamong Europeana’s providers with EA WP5

Together with the Europeana Network and IFS develop advocacy positions to influence rights-related policies that affect mass digitisation and online access to and digital re-use of cultural information

2.2 Advocacy (Georgia Angelaki)

KPI 11: Ensure that all metadata in the Europeana Repository referring to Public Domain objects are correctly labelled

Tasks

KPI 12: The idea of the Cultural Commons has been successfully developed during two Presidency Events

44

45

46

47

48

Lo más importante

• Proporcionar información útil – Cualquier dato en LOD no es bueno por sí mismo: la granularidad

importa

• Incluir vínculos a otras URIs para que se pueden encontrar

más cosas – No se trata de convertir a RDF registros Dublin Core básicos, lo

que realmente son importantes son las relaciones con otros recursos y vocabularios (VIAF, DBpedia, WGS84, etc.).

– Vocabularios locales (LEM, DBpedia.es, GeoLinkedData, etc.

• [Incluir LOD en el proceso real de descripción]

49

50

51

53

54

55

56

57Archivos y gestión de documentos ante la web semántica 57

58

59

60

Archivos y gestión de documentos ante la web semántica

6161

Archivos y gestión de documentos ante la web semántica

62

63

64

65

66

67

68

ArchivosRDF

BibliotecasRDF

MuseosRDF

PUC

Modelo Conceptual Simplificado LOD-LAM

URI

URI

URI

HTTP

HTTP

HTTP

69

LOD-LAM, nuevos objetivos profesionales

70

71

72

73

Los registros de autoridad son la base de LOD y EDM

El proceso de descripción debe cambiar para incorporar LOD

Cómo pasar a EDM y LOD sin perder un solo dato y sin duplicar o triplicar tareas

74

Recommended