41
Abriendo los silos de la información cultural al mundo 24 de Septiembre de 2015 Marta González, Idoia Murua Cristina Gareta, Elena Turienzo, Xabier Molero #ALIADAWS15

Aliada open workshop spain

Embed Size (px)

Citation preview

Page 1: Aliada open workshop spain

Abriendo los silos de la información cultural al mundo

24 de Septiembre de 2015

M arta González,

Idoia M urua

Crist ina Gareta,

Elena Turienzo,

Xabier M olero

#ALIADAWS15

Page 2: Aliada open workshop spain

Agenda

2 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

09:30 - 10:15 ALIADA. Introducción ¿Qué es? ¿Para qué sirve?

10:15 - 11:30 ALIADA. Probemos a utilizar la herramienta.

11:30 - 11:50 Pausa -café

11:50 - 12:30 Recogida de impresiones.

12:30 - 13:30 Presentación ALIADA en inglés

#ALIADAWS15

Page 3: Aliada open workshop spain

3 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

09:30 - 10:15

ALIADA. Introducción ¿Qué es? ¿Para qué sirve?

Marta González

#ALIADAWS15

Page 4: Aliada open workshop spain

Estado actual del acceso a datos culturales

En España existen más de 1.000 museos y más de 6.800 bibliotecas.

Gran parte de dichos museos y bibliotecas tienen su catálogo disponible al público a través de la web.

• Esto nos permite conocer los fondos de los que disponen pero nos obliga a recorrer una gran cantidad de sitios web buscando la información deseada.

• E incluso hemos de acudir de forma personal al museo o biblioteca cuando los fondos no han sido previamente digitalizados, para consultar los mismos.

4 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 5: Aliada open workshop spain

¿Por qué hay que abrir los datos culturales?

¿Lo tenemos claro? Beneficio para el público en general al tener

acceso a nuestras colecciones.

Permitimos una investigación más rica y fomentamos la innovación.

Nos beneficiamos de una mayor exposición y promoción de nuestros contenidos.

5 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 6: Aliada open workshop spain

Imaginemos a un investigador… • persiguiendo el rastro dejado por el

topónimo muelle del cay. – Ambas palabras vienen a significar lo

mismo pero se han utilizado en Santander en diferentes épocas y tienen diferentes orígenes llegando a convivir en un topónimo, hasta la desaparición de cay como acepción de ‘muelle’ en castellano

• Ingente documentación revisada para la redacción del estudio.

• Visitas / llamadas a cada una de las instituciones culturales: documentos, libros, cartografía,…

6 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

© Alberto González Rodríguez

#ALIADAWS15

Page 7: Aliada open workshop spain

7

¿Qué son datos enlazados ó Linked Data- LD?

• Término acuñado por Tim Berners-Lee– inventor de la web y Director del W3C. • Su visión de la web semántica es poner los datos en la web de forma que las

máquinas los pudieran entender de forma natural alcanzando la deseada web de los datos: el paradigma Linked Data proporciona los medios para alcanzar dicho objetivo.

• Método de publicación de datos estructurados para mostrar, intercambiar y conectar datos a través de URIs dereferenciables en la Web.

• Estándares Web: HTTP, RDF, URI. • Datos legibles automáticamente por ordenadores. • Permite conectar y consultar datos de diferentes

fuentes.

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 8: Aliada open workshop spain

8

¿Tu biblioteca o museo publica Linked Open Data?

★ Datos publicados en la web con licencia abierta.

★★ Datos estructurados y legibles por una máquina.

★★★ Formato no propietario.

★★★★ Codificados según estándares abiertos de la W3C (RDF).

★★★★★ Los datos están enlazados con otros datos externos para proporcionar contexto.

http://www.w3.org/DesignIssues/LinkedData.html

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

“Nos estamos moviendo de una web de documentos a una web de los datos”

Page 9: Aliada open workshop spain

9

"Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/"

Linked Data Cloud

Publicaciones

Medios de Comunicación

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 10: Aliada open workshop spain

10

Linked Data Cloud

Medios de Comunicación

¿Quiénes publican?

• New York Times • BBC Music: the portal site to music content across the BBC

website. It is also the location of the BBC's album reviews, covering all major releases in every genre on a monthly basis and written by a wide range of music experts

• Europeana: Europeana datasets. • Last.FM RDFization of Events, Artists, and

Users • DBTune.org Musicbrainz: open music

encyclopedia.

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 11: Aliada open workshop spain

11

Linked Data Cloud

Publicaciones ¿Quiénes están? • Library of Congress Subject Headings • British National Bibliography • Biblioteca Nacional de España • OpenLibrary: One web page for every book

ever published • The Bibliothèque nationale de France • The European Library

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 12: Aliada open workshop spain

12

¿Por qué LOD en bibliotecas y museos?

• Los LD son más perdurables y robustos que los formatos de metadatos que dependen de una estructura de datos particular • Los desarrolladores ya no tendrán que trabajar con

formatos específicos (MARC, LIDO). • Permite consultas más sofisticadas. • Se crean conexiones con otras instituciones culturales y otros

recursos no-culturales. • Esto permite la aparición de nuevos servicios y

aplicaciones. • Mejora de la eficiencia en la catalogación e innovación:

porque podemos reutilizar los datos. • Mejoramos nuestra presencia en la red, porque los

buscadores de información nos encontrarán más fácilmente.

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 13: Aliada open workshop spain

13

¿Cómo publicar LOD en la web?

1. Preparando los datos para publicar, usando esquemas de metadatos normalizados, como MARC, LIDO o Dublin Core.

2. Creando una ontología, basándonos en FRBR, BIBFRAME, CIDOC-CRM….

3. Convirtiendo los metadatos a un conjunto de datos RDF.

4. Creando las URIs dereferenciables. 5. Enlazándonos con otros conjuntos de

datos: DBpedia, Geonames, VIAF, etc. 6. Publicando el conjunto de datos.

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 14: Aliada open workshop spain

14

INNOVATIVE SMEs

LINKED OPEN DATA CLOUD http://lod-cloud.net/

Library Management System (ILS)

Museum Collection Management System (MMS)

Content Management System (CMS)

OBJECTS RICH METADATA CREATORS (librarians, curators)

ALIADA BROWSERS

OTHER CULTURAL AND HERITAGE INSTITUTIONS

O, utilizando

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 15: Aliada open workshop spain

15

• Plugin open source para sistemas de gestión bibliotecaria y de museos.

• Compatible con los estándares de bibliotecas y museos: MARC21, LIDO, DublinCore.

• Transforma de forma automática ficheros de metadatos a tripletas RDF en base a la ontología ALIADA: Ontología basada en los modelos conceptuales FRBR y CIDOC-CRM y en otras ontologías y vocabularios como SKOS y FoaF.

http://aliada-project.eu/2014/aliada-ontology • Enlaza de forma automática los datos transformados con otros

conjuntos de datos en LOD: Europeana, British National Bibliography, Spanish

National Library, Freebase Visual Art, DBpedia, Hungarian National Library, Library of Congress Subject Headings, Lobid, MARC codes list, VIAF Virtual International Authority File or Open Library

• Genera las URIs dereferenciables. • Publica de forma automática en la Linked Open Data Cloud.

http://aliada-project.eu/

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 16: Aliada open workshop spain

16

ALIADA se integra con gestores de contenidos bibliotecarios y de colecciones

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

Integración con ILS (plugin para LibriSuite) Integración con CMS (exportación de registros de TMS) Integración con Gestores de contenidos open source

que exporten DublinCore

#ALIADAWS15

Page 17: Aliada open workshop spain

17

Código fuente: ht tps:/ / github.com/ ALIADA/ aliada-tool/

¿Qué aspecto tiene ALIADA? Accedemos con un navegador web:

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 18: Aliada open workshop spain

18

Y al final, ¿Qué tenemos?

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 19: Aliada open workshop spain

19

¿Quiénes somos?

SCANBIT ILS & Library Services SPAIN

TECNALIA Research & Innovation SPAIN

@CULT Information & Knowledge Management ITALY

ARTIUM Contemporary Art Museum SPAIN

SZEPMUVESZETI MUZEUM Museum of Fine Arts, Budapest HUNGARY

http://www.aliada-project.eu/

https://github.com/ALIADA/aliada-tool/

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 20: Aliada open workshop spain

20 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

Cristina Gareta

10:15 - 11:30

ALIADA. Probemos a utilizar la herramienta.

#ALIADAWS15

Page 21: Aliada open workshop spain

21 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

• Nos repartimos en 5 grupos de 5 a 8 personas cada uno.

• A cada grupo os daremos un conjunto de datos, a elegir entre:

• MARCXML Bib • LIDO

• Y un documento con los diferentes datos/enlaces que necesitáis: 1. Para acceder a ALIADA:

http://aliada.scanbit.net:8080/aliada-user-interface-2.0/

Probando la herramienta

#ALIADAWS15

Page 22: Aliada open workshop spain

22 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

2. Cada grupo utilizará un nombre de usuario y contraseña:

GRUPO 1: Usuario: group1 Contraseña: aliada1 GRUPO 2: Usuario: group2 Contraseña: aliada2 GRUPO 3: Usuario: group3 Contraseña: aliada3 GRUPO 4: Usuario: group4 Contraseña: aliada4 GRUPO 5: Usuario: group5 Contraseña: aliada5

3. Os iremos guiando en el proceso, a la hora de transformar y publicar os iremos indicando a cada grupo cuándo podéis hacerlo.

IMPORTANTE, ESPERAD NUESTRAS INDICACIONES

4. Mientras vamos probando la herramienta nos gustaría que dejarais vuestras opiniones aquí:

https://docs.google.com/forms/d/1X2q12mE-8sFqufXPO4uqoSUzF9KcIqdKakygkqHJerg/viewform

Probando la herramienta II

#ALIADAWS15

Page 23: Aliada open workshop spain

23

Automatic Publication under Linked Data Paradigm of Library Data

Comunidad ALIADA: http://www.aliada-project.eu/getInvolvedAliada

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

M arta González: [email protected]

Cristina Gareta: cgareta@scanbit .net

#ALIADAWS15

Page 24: Aliada open workshop spain

24

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 25: Aliada open workshop spain

25 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

Marta González Cristina Gareta

11:50 - 12:30

Recogida de impresiones.

#ALIADAWS15

Page 26: Aliada open workshop spain

Conclusiones 1.

26 26 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 27: Aliada open workshop spain

27

Automatic Publication under Linked Data Paradigm of Library Data

Comunidad ALIADA: http://www.aliada-project.eu/getInvolvedAliada

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

M arta González: [email protected]

Cristina Gareta: cgareta@scanbit .net

#ALIADAWS15

Page 28: Aliada open workshop spain

Opening the cultural data silos to the World

2015 September, 24th

M arta González,

Idoia M urua

Crist ina Gareta,

Elena Turienzo,

Xabier M olero

#ALIADAWS15

Page 29: Aliada open workshop spain

29 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

ALIADA. Introduction

Marta González

#ALIADAWS15

Page 30: Aliada open workshop spain

How to access cultural data?

Only in Spain you can find more than 1,000 museums and more than 6,800 libraries.

The majority of them provide access to their catalogue through a web page.

• So you can have access to the collections, but you have to navigate web by web.

• Or you need to personally go to the museum or library when the collections have not been digitalized.

30 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 31: Aliada open workshop spain

Why cultural data should be open?

Benefit for the general public because they will have access to our collections.

We allow a richer research and promote innovation.

Our institutions have a major exposition and promotion of our contents.

31 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

#ALIADAWS15

Page 32: Aliada open workshop spain

32

What is Linked Data?

• Tim Berners-Lee, director of the World Wide Web Consortium (W3C),

coined the term in a design note about the Semantic Web project. • Method of publishing structured data so that it can be interlinked

and become more useful. A path to the Web of Data • Standard Web technologies: HTTP, RDF, URI, SPARQL, OWL… • To share information in a way that can be read automatically by

computers. • Enables data from different sources to be connected and queried.

2015 September, 24th

#ALIADAWS15

Page 33: Aliada open workshop spain

33

Are your library or museum Linked Open Data (LOD)?

★ Data published under open license

★★ Machine-readable data

★★★ Non-proprietary format

★★★★ RDF standards

★★★★★

Linked RDF http://www.w3.org/DesignIssues/LinkedData.html

“We’re moving from a web of documents to a web of data”

2015 September, 24th

#ALIADAWS15

Page 34: Aliada open workshop spain

34

Why LOD in libraries and museums?

• A global pool of shared data that can be re-used to describe resources will avoid the redundant effort of the current cataloging processes.

• The use of the Web and Web-based identifiers will make up-to-date resource

descriptions directly citable by catalogers. • Linked Data is more durable and robust than metadata formats that depend

on a particular data structure. • Developers will also no longer have to work with library-specific data formats

(MARC, LIDO). • With Linked Open Data, libraries can increase their presence on the Web,

where most information seekers may be found.

http://www.w3.org/2005/Incubator/lld/wiki/Benefits

2015 September, 24th

#ALIADAWS15

Page 35: Aliada open workshop spain

35

GLAM industry & LOD

2015 September, 24th

#ALIADAWS15

Page 36: Aliada open workshop spain

36

How to publish Linked Open Data?

• Exporting our metadata to standard formats: MARC, LIDO or Dublin Core.

• Defining an ontology according international conceptual models (FRBR, BIBFRAME, CIDOC-CRM, …)

• Transforming the metadata to RDF. • Generating the dereferenciable URIs. • Linking to other datasets. • Publishing the dataset.

“Librarians and curators are experts in cataloguing and make accessible their resources, but they don’t know

about Linked Data, so they need an ally”

2015 September, 24th

#ALIADAWS15

Page 37: Aliada open workshop spain

37

ALIADA, the ‘ally’

• Open source Java application to automatically publish as Linked Data the metadata created by a library or museum management System

• Supported metadata types (types of datasets): bibliographic records, authority

records, and descriptions of museum objects • Compliant with MARC, LIDO and DublinCore formats • Conversion to RDF triples (mapping) according to the ALIADA ontology, mainly

based on FRBRoo, SKOS and FoaF ontologies • Linking to other datasets, such as Europeana, British National Bibliography, Spanish

National Library, Freebase Visual Art, DBpedia, Hungarian National Library, Library of Congress Subject Headings, Lobid, MARC codes list, VIAF Virtual International Authority File or Open Library

• Automatic publication of dumps (URIs) and SPARQL Endpoint on DataHub

2015 September, 24th

#ALIADAWS15

Page 38: Aliada open workshop spain

38

Who is who in ALIADA?

SCANBIT ILS & Library Services SPAIN

TECNALIA Research & Innovation SPAIN

@CULT Information & Knowledge Management ITALY

ARTIUM Contemporary Art Museum SPAIN

SZEPMUVESZETI MUZEUM Museum of Fine Arts, Budapest HUNGARY

http://www.aliada-project.eu/

https://github.com/ALIADA/aliada-tool/

2015 September, 24th

#ALIADAWS15

Page 39: Aliada open workshop spain

39 Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

ALIADA. Demo

Cristina Gareta

#ALIADAWS15

Page 40: Aliada open workshop spain

40

ALIADA, Demo

We have assigned a time slot for an online demo to each of the registered assistants. If you do not have such demo slot, please put in contact with:

[email protected]

With the demo slot you will be provided with a dataset to be published and access to the form where to leave your impressions:

https://docs.google.com/forms/d/1X2q12mE-8sFqufXPO4uqoSUzF9KcIqdKakygkqHJerg/viewform

Also access to a video, that will facilitate the demo:

https://vimeo.com/110897369

2015 September, 24th

#ALIADAWS15

Page 41: Aliada open workshop spain

41

Automatic Publication under Linked Data Paradigm of Library Data

ALIADA Community: http://www.aliada-project.eu/getInvolvedAliada

Abriendo los silos de la información al mundo – 24 de Septiembre de 2015

M arta González: [email protected]

Cristina Gareta: cgareta@scanbit .net

#ALIADAWS15