Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
NORMALIZACIÓN Y OTROS NUEVOS ESCENARIOS
PARA LA TERMINOLOGÍA
Universidad Carlos III
de Madrid
Dpto. Biblioteconomía y
Documentación
Eva Mª Méndez Rodríguez [email protected] | @evamen
XIV Jornada
Documentación y LOV: Por qué lo llaman vocabulario, cuando quieren decir terminología
X COLOQUIO INTERNACIONAL DE
CIENCIAS DE LA DOCUMENTACIÓN Perspectivas futuras, el presente en perspectiva
Universidad Carlos III
de Madrid
Dpto. Biblioteconomía y
Documentación
Eva Mª Méndez Rodríguez [email protected] | @evamen
DOCUMENTACIÓN Y LOV:
¿Por qué lo llaman vocabulario cuando quieren
decir terminología?
Eva Méndez Documentación y Linked Open Vocabularies
¿De qué va a hablar?
Eva Méndez Documentación y Linked Open Vocabularies
¿De qué va a hablar?
DOCUMENTACIÓN y LOV
Eva Méndez Documentación y Linked Open Vocabularies
¿De qué va a hablar?
NORMALIZACIÓN Y OTROS
NUEVOS ESCENARIOS PARA LA
TERMINOLOGÍA
NORMALIZACIÓN Y OTROS
NUEVOS ESCENARIOS PARA LA
TERMINOLOGÍA
Eva Méndez Documentación y Linked Open Vocabularies
¿De qué va a hablar?
NORMALIZACIÓN Y OTROS
NUEVOS ESCENARIOS PARA LA
TERMINOLOGÍA
NORMALIZACIÓN Y OTROS
NUEVOS ESCENARIOS PARA LA
TERMINOLOGÍA
Eva Méndez Documentación y Linked Open Vocabularies
¿De qué va a hablar?
NORMALIZACIÓN Y OTROS
NUEVOS ESCENARIOS PARA LA
TERMINOLOGÍA
NORMALIZACIÓN Y OTROS
NUEVOS ESCENARIOS PARA LA
TERMINOLOGÍA
UN POCO DE CONTEXTO
De qué hablábamos en 2001
Eva Méndez Documentación y Linked Open Vocabularies
La Web en el FUTURO (2001)
Continuará la mezcla de calidades informativas:
• Se mantendrán sitios personales
• Escaparates comerciales con un propósito real
Los ordenadores utilizarán información estructurada de
forma mucho más eficaz.
Se necesita la integración de datos para permitir el
procesamiento automático
SW (Web Semántica).
“...is an extension of the current Web in
which information is given well-defined
meaning, better enabling computers and
people to work in cooperation”
Tim Berners-Lee, James Hendler, Ora Lassila. The
Semantic Web. Scientific American (Mayo 2001)
De qué hablábamos en 2004
http://www.sedic.es/p_boletinclip41_confirma.htm
http://www.youtube.com</watch?v=P2-ijqZ5jRs&feature=youtu.be
2014
Eva Méndez Documentación y Linked Open Vocabularies
Tim Berners-Lee: 2006, 2009, 2010
http://www.w3.org/DesignIss
ues/LinkedData.html
TED 2010: The year open data
went worldwide http://www.ted.com/talks/tim_berners_lee
_the_year_open_data_went_worldwide.html
TED 2009: On the Next Web http://www.ted.com/talks/tim_berners_lee
_on_the_next_web?%20
Eva Méndez Documentación y Linked Open Vocabularies
De qué hablaba TBL (1989-2014)
WEB
Eva Méndez Documentación y Linked Open Vocabularies
La Web del FUTURO (2007): Web x.0
Eva Méndez Documentación y Linked Open Vocabularies
Web de Documentos / Web de Datos
Web de datos
Web de documentos
Eva Méndez Documentación y Linked Open Vocabularies
Datos y datos por todas partes
Eva Méndez Documentación y Linked Open Vocabularies
…pero los datos están en silos aislados
Christian Bizer, Tom Heath, Tim Berners-Lee: Linking Open Data (2008)
Eva Méndez Documentación y Linked Open Vocabularies
Fuente: Stuart Weibel, Makx Dekkers (DCMI)
La WWW y el documento-e: Universo de información Web (1995…
Datos
científicos
Páginas
Web Empresa
Internet
Biblioteca
eGobierno
Comercio
Cualquiera...
Eva Méndez Documentación y Linked Open Vocabularies
… Y además…
Eva Méndez Documentación y Linked Open Vocabularies
¿Cómo explotar todos esos datos a través de la Web?
Reutilización de datos
APIs de acceso a datos
Vocabularios estándar para describir
datos interconectados
Herramientas
Web Semántica en la práctica
http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html
Reutilización de datos
APIs de acceso a datos
Vocabularios estándar para describir
datos interconectados
Herramientas
Web Semántica en la práctica
eb
Vocabularios EN/PARA la Web
Eva Méndez Documentación y Linked Open Vocabularies
Vocabularios en/para la Web
Usuarios más tradicionales de (KOS)
(“vocabularios controlados”).
Comunidades que crean y utilizan esquemas
(schemas) de metadatos como el Dublin Core,
La web semántica (W3C), que desarrolla y usa
ontologías y vocabularios formalizados.
Desarrolladores que incorporan datos
estructurados que describen o “anotan” como
microformatos, microdatos y RDFa
(Schema.org).
Eva Méndez Documentación y Linked Open Vocabularies
Servicios Terminológicos vs Vocabularios
Terminology Services (TS) are a set of
services that present and apply
vocabularies, both controlled and
uncontrolled, including their member
terms, concepts and relationships. This is
done for purposes of searching, browsing,
discovery, translation, mapping, semantic
reasoning, subject indexing and
classification, harvesting, alerting, etc.
Eva Méndez Documentación y Linked Open Vocabularies
Schema= esquema de estructura/descripción
XML: schema es un documento que describe un
vocabulario XML o RDF
En sentido más genérico un schema ("de
metadatos”) es el conjunto de elementos y las
reglas que constituyen un modelo de
metadatos.
Los esquemas de metadatos son modelos,
formatos, estándares, etc. para
estructurar/describir la información.
Eva Méndez Documentación y Linked Open Vocabularies
Scheme= esquema de contenido
Un scheme es un servicio terminológico
controlado o un “vocabulario” de contenido.
Conjunto normalizado de valores que pueden
tener los elementos de los schemas de
metadatos
Ejemplos de encoding schemes <META NAME="DC.subject" SCHEME="UDC" CONTENT="518.118“/>
<META NAME=“DC.date” SCHEME=“W3CDTF” CONTENT=“2005-04-05”/>
<meta name="DC.date“ scheme="DCTERMS.W3CDTF“ content="2001-07-18" />
Eva Méndez Documentación y Linked Open Vocabularies
Usos genéricos
Creación de datos
Gestión de datos
Dominios GEOESPACIAL
HUMANIDADES
GOBIERNO
IMAGEN
EDUCACIÓN
Rec. de Inf.
Comercio-E
Interoperabilidad
Accesibilidad
Conservación
Valoración
Rec. de Inf.
Papel de los metadatos
Paradigma Metadatos: Efecto “Cepillo de Dientes”
Eva Méndez Documentación y Linked Open Vocabularies
Listas de términos: Anillos de sinónimos (sinsets)
Ficheros de autoridad
Glosarios
Diccionarios Lenguaje Natural Lenguaje controlado
Clasificación &
Categorización: Encabezamientos de materia
Esquemas de clasificación Taxonomías
Esquemas de categorización
Grupos de relaciones: Ontologías
Redes semánticas
Tesauros
Listados Folksonomías
En el paradigma NKOS Basado en Hodge y Zeng
Eva Méndez Documentación y Linked Open Vocabularies
Schema & Scheme= Vocabulary Commons
Vocabularies used in the LOD. (Pierre-Yves Vandenbussche)
Eva Méndez Documentación y Linked Open Vocabularies
Data Cloud (2014)
Eva Méndez Documentación y Linked Open Vocabularies
Hay absolutamente “de todo”, desde datos de programas de TV, radio, hasta información de Censos en diversos países, estadísticas de turismo en Zaragoza, pasando por fuentes de artículos científicos como PubMed o fuentes terminológicas como Agrovoc, y bibliotecas digitales (Europeana)
…Vocabularios en el mundo LOD…
Qué hay en LOD
… Dije que igual hablaba de normalización
1996 1998
2000 2002
2004 2006 2010
2012
W3C Linked
Data Platform
LDP XG
(May2012)
RDF Model & Syntax
1st Draft–Oct97
OIL
DAML
Tim BL Roadmap on
Semantic Web
(Sept1998)
Tim BL
LOD principles
RDF M&S
W3C-REC, Feb2004
Tim BL TED Talks
(Feb 2009 &
Mar 2010)
Tim BL
Linked Data
(July2006)
RDF M&S
W3C-REC, Oct99
Activity starts,
2001
OWL specifications
W3C-REC, Feb2004
W3C-REC
Aug2009
SKOS 1st Draft
(May2005)
OWL2 specifications
W3C-REC, Oct2009
1st LOD Cloud
Cyganiak & Jentzsch
(May2007)
In XHTML
W3C-REC, Oct2008
W3C-REC, Jan2008
2008
Library Linked
Data XG (May
2010)
Final Reports
(Oct2011)
Last LOD Cloud
Cyganiak & Jentzsch
(Nov2011)
Berners Lee, Hendler
& Lassila (May2001)
FOAF Voc. Spec
(May2005)
FOAF
(Early 2000)
MCF Meta Content
Framework–Jun97
RDFS (RDF Schema)
1st Draft –1998
DCMES
(ISO-2003)
DCMI Singapore
Framework
(Aug2007)
PICS W3C-
REC–Oct96 RDFS Vocabulary
Description Language
March, 1989
RDFS (RDF Schema)
W3C-CR, March1998
Evolución de los estándares WWW. Más de 15 años de
metadatos y vocabularios: algunas lecciones aprendidas
Eva Méndez Documentación y Linked Open Vocabularies
Principios de Linked Data
1. Usar URIs como nombres para las cosas.
2. Usar URIs HTTP, de modo que la gente pueda
buscar y localizar esos nombres.
3. Cuando alguien busque empleando un URI,
proporcionar información útil, utilizando estándares
(RDF, SPARQL).
4. Incluir enlaces a otros URIs, para que se puedan
descubrir y localizar más cosas.
Tim Berners-Lee 2007: http://www.w3.org/DesignIssues/LinkedData.html
Eva Méndez Documentación y Linked Open Vocabularies
1. URI
Al nombrar los conceptos o cosas mediante URIs, se ofrece una
abstracción del lenguaje natural, y:
• Se evita ambigüedades
• Se ofrece una forma estándar y unívoca para referirnos a
cualquier recurso.
Eva Méndez Documentación y Linked Open Vocabularies
La información sobre los recursos se representa mediante
descripciones estándares en RDF (Resource Description
Framework).
Las descripciones RDF se basan en tripletas, tres elementos
que se relacionan: sujeto, predicado y objeto.
2. ESTÁNDARES W3C: RDF
Eva Méndez Documentación y Linked Open Vocabularies
Las consultas para localizar los recursos en almacenes
de tripletas RDF se realizan mediante lenguajes de
consulta estándar, como SPARQL, del W3C.
3. ESTÁNDARES W3C: SPARQL
Eva Méndez Documentación y Linked Open Vocabularies
Es necesario enlazar con otros recursos mediante URIs, de
forma que no se queden aislados, se pueda compartir
información con otras fuentes externas, y se ofrezca
información de valor añadido junto a la nuestra.
4. Enlazar con otros IR
Eva Méndez Documentación y Linked Open Vocabularies
Se basa en conceptos identificados con URIs.
Etiquetas preferentes, alternativas y ocultas.
Relaciones semánticas entre conceptos
Relaciones entre etiquetas mediante SKOS-XL.
Colecciones y Esquemas de Conceptos.
Relaciones de mapeado entre conceptos de distintos
esquemas.
Elementos de documentación y Notaciones
SKOS es un vocabulario RDF para representar todo tipo de sistemas de
organización del conocimiento (tesauros, clasificaciones,
encabezamientos de materia)
SKOS (Simple Knowledge Organization Systems)
Eva Méndez Documentación y Linked Open Vocabularies
LOV datasets
Vocabularies used in the LOD. (Pierre-Yves Vandenbussche)
http://lov.okfn.org/dataset/lov/about
Eva Méndez Documentación y Linked Open Vocabularies
Vocabularios en el paradigma LOD
Alineamiento de vocabularios. Agrovoc
http://aims.fao.org/advice/linked-data
Eva Méndez Documentación y Linked Open Vocabularies
Vocabularios en el paradigma LOD
Datos de autoridades. Caso: VIAF
http://viaf.org/viaf/96994048
Conclusiones
Eva Méndez Documentación y Linked Open Vocabularies
Cambio de terminología ;-)
¿Qué necesita el paradigma LOD?
Eva Méndez Documentación y Linked Open Vocabularies
¿Qué necesita el paradigma LOD?
Vocabularios
• Metadatos
• NKOS
Terminologías
Social Tagging
Formalización (RDF, OWL, SKOS)
Nuevas terminologías de URIs / RDF
Estándares
Eva Méndez Documentación y Linked Open Vocabularies
¿Por qué la Documentación (y la web) necesita de la terminología?
Eva Méndez Documentación y Linked Open Vocabularies
¡¡¡Gracias por su atención!!!
¿Discusión? / ¿Preguntas?
Eva Méndez Documentación y Linked Open Vocabularies
@evamen