16
Daniel Vila Suero Ontology Engineering Group Pensando en los datos Cita en la BNE: RDA y Linked Data 15 Abril 2016

Datos.bne.es. Pensando en los datos. Daniel Vila Suero

Embed Size (px)

Citation preview

Page 1: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

Daniel Vila Suero Ontology Engineering Group

Pensando en los datos

Cita en la BNE: RDA y Linked Data15 Abril 2016

Page 2: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

Grupo de investigación dirigido por Asunción Gómez Pérez

Linked Data-based Data Integration

Semantic e-Science

(Social) Semantic

Web

NLP and Multilingualism

Ontological Engineering

1995

1997 2000

2004 2008

Ontology Engineering Group 9

Page 3: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

JSON-LD

SPARQLMotor de búsqueda NoSQL DB

Aplicación + API (Javascript)

Cliente HTTP API

Indexación y ranking

SPARQL endpoint

Ontología BNE

Acceso

Aplicación

JSON-LD

Datos

Page 4: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

• La Web: Javascript + CSS3 + HTML5 + LD

• Crecer: Escalabilidad con el número de usuarios

• Los usuarios: Apps and us

• ”Pensar en los datos”: Datos primero, aplicación después

Arquitectura pensada para..

Page 5: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

¿Pensar en los datos?

JSON-LD

SPARQLMotor de búsqueda NoSQL DB

Aplicación + API (Javascript)

Indexación y ranking

Ontología BNE

Aplicación

JSON-LD

Datos

Problema a resolver

Solución

Solución

“Pensar en los datos”: Abordar las soluciones desde el modelo de datos

(aplicación)

(datos)

Page 6: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

“Pensar en los datos” con un ejemplo

¿De dónde vienen estas sugerencias? (2015)

Page 7: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

Objetivo inicial (2014): Mostrar obras de un mismo tema

¿Cómo hacer esto?

Page 8: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

Objetivo inicial (2014): Mostrar obras de un mismo tema

Page 9: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

Situación inicial (60’s): Los temas están en los bibliográficos

Registros bibliográficos (Ediciones)

Registros autoridad (Obras)

Tema

Tema

Aplicación

Datos

Aplicación

?

Page 10: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

Soluciones (2014): “Clásica” vs. “Pensar en los datos”

?Ediciones

Obras

Aplicación

Temas

Quiero mostrar obras sobre un mismo tema

“Clásica” (1)Pregunto por ediciones sobre el mismo tema

Ediciones

Obras

Aplicación

Temas

Tema = Novelas picarescas

Ediciones (muchas)

Problemas: No es lo que queríamos. ¿cómo presentamos los resultados? (relevancia)

Page 11: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

Soluciones (2014): “Clásica” vs. “Pensar en los datos”

?Ediciones

Obras

Aplicación

Temas

Quiero mostrar obras sobre un mismo tema

“Clásica” (2)Pregunto por ediciones sobre el mismo tema

y por cada edición pregunto por su obra

Ediciones

Obras

Aplicación

Temas

Tema = Novelas picarescas

Enlaces a obras

Problemas: Dos consultas, + costoso, +complejo NO facilmente reutilizable

1

Recuperar obras

2 Obras

1

2

Page 12: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

Pensar en los datos (2014)

?Ediciones

Obras

Aplicación

Temas

Quiero mostrar obras sobre un mismo tema

Pensemos en los datos Obra

Edición Temas

Nueva relación (FRBR, RDA)

Ediciones

Obras

Temas

Nuevos enlaces

Page 13: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

Pensar en los datos (2014)Pregunto por obras sobre el mismo tema

Ediciones

Obras

Aplicación

Temas

Tema = Novelas picarescas

Obras

Ventajas: Aplicación + rápida, menos compleja Beneficia a todo el servicio REUTILIZABLE Mejor presentación de resultados

(relevancia, agregación,

presentación)

Page 14: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

Pensar en los datos (2015): Sugerencias

Misma funcionalidad (usando el buscador) Obras que compartan temas

Obras

Temas

Page 15: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

Pensar en los datos (2016?): Valor añadido

Explotar la misma idea en distintos contextos:

> Obras con temas similares > Autores que hablan de los mismos temas > Temas que coinciden en diferentes obras

Obras

Temas

Page 16: Datos.bne.es. Pensando en los datos. Daniel Vila Suero

• Mayor impacto en todo el servicio: APIs, Motor de búsqueda, algoritmos de relevancia.

• Reutilización de funcionalidades

• El poder de los enlaces (the network effect):

“Cada nuevo enlace representa nuevas posibilidades”

Beneficios de pensar en los datos