51
Material del curso sobre Tecnologías Semánticas en la Web de Datos red.es, 29/11/2012 Ontology Engineering Group Asunción GómezPérez, Oscar Corcho García Licencia de uso: Creative Commons Attribution NonCommercialShareAlike 3.0 Unported (CC BYNCSA 3.0) Más información sobre cursos disponible en: http://cursos.oegupm.net/

03. Vocabularios. Tecnologías Semánticas en la Web de Datos

Embed Size (px)

DESCRIPTION

Tercera entrega. Material del curso sobre Linked Data impartido en la entidad pública empresarial Red.es por Asunción Gómez-Pérez y Oscar Corcho (Ontology Engineering Group - Universidad Politécnica de Madrid).

Citation preview

Page 1: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

Material  del  curso  sobre  Tecnologías  Semánticas    en  la  Web  de  Datos  

red.es,  29/11/2012  

Ontology  Engineering  Group  

Asunción  Gómez-­‐Pérez,  Oscar  Corcho  García  

 

Licencia  de  uso:  Creative  Commons  Attribution-­‐NonCommercial-­‐ShareAlike  3.0  Unported  (CC  BY-­‐NC-­‐SA  3.0)  

     Más  información  sobre  cursos  disponible  en:  http://cursos.oeg-­‐upm.net/    

 

Page 2: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

1

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Indice

1.  Web de Linked Data: Conceptos Básicos A. Gómez Pérez (30 min)

2.  RDF, RDF Schema y SPARQL O. Corcho (90 min)

3.  Vocabularios A. Gómez Pérez (90 min)

4.  Herramientas de publicación de datos para portales de datos abiertos

O. Corcho (30 min)

1

Vocabularios

Asunción Gómez-Pérez, Oscar Corcho Facultad de Informática, Universidad Politécnica de Madrid

Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid http://www.oeg-upm.net

[email protected]

Agradecimientos: D. Garijo, R. García, M. Poveda, J.A. Ramos, M.C. Suárez-Figueroa, D. Vila, L. Vilches, B. Villazón

Curso en Red.es. 29 de Noviembre de 2012

Page 3: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

2

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

1.  Introducción 2.  Tipos de vocabularios 3.  Proceso de Construcción 4.  Ejemplos de Vocabularios

•  Personas y Organizaciones: FOAF, vCard, ORG •  Documentos: DC, BIBO •  Geo: puntos, curvas y polígonos •  Estadísticas: Data Cube •  Bibliotecas: FRBR •  Otros vocabularios: sensores, provenance, VOID

5.  Ejemplos de Redes de vocabularios en aplicaciones de datos enlazados •  Instituto Geográfico Nacional

3

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Caso de uso

¿Qué vocabularios debemos utilizar para describir en el formato de datos enlazados el organigrama de los diferentes Ministerios, las personas que forman parte de él y su

ubicación?

Page 4: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

3

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Organigrama diferentes en los Ministerios

5

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Organigramas con diferente terminología

6

Page 5: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

4

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Descripción de los ministros “a la carta”

7

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Diferentes formas de describir la dirección de contacto

8

Page 6: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

5

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

1.  Introducción 2.  Tipos de vocabularios 3.  Proceso de Construcción 4.  Ejemplos de Vocabularios 5.  Ejemplos de Redes de vocabularios en aplicaciones

de datos enlazados 6.  Conclusiones

9

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Clasificacion Informal

Catalogo/ID

Tesauro

Las organizaciones poseen vocabularios

ID   Name  Ve   Vehículo  10.01   Coche  10.02   Motocicleta  10.03   Bicicleta  10.01   Vehículo  10.01.01   Rueda  10.01.02   Asiento  10.01.03   Puerta  

?

?

Conocimiento implícito en los números

XX-YY-ZZ 02-01-02 02: transporte 01: carretera 02: 3 carriles

Page 7: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

6

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Ontología

11

•  Una ontología es: •  Un conjunto de términos consensuados •  Incluye:

•  Conceptos •  Taxonomias de Conceptos •  Propiedades •  Relaciones entre concpetos

•  Visión compartida sobre cómo modelar un dominio de interés

•  Implementadas en OWL o RDF(S) •  Herramientas: Protégé, NeOn Toolkit, Topbraid composer, etc.

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 12

Ejemplos de ontologías

SIOC Ontology

Page 8: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

7

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Ontologías: Conocimientos y Datos

13

13

Ontología

Instancias

Nivel de Conocimientos

Conceptos Taxonomías Relaciones Atributos Axiomas

Nivel de Datos Instancias de conceptos

Instancias de relaciones

Cer El Quijote Cervantes Es creador de

Cer

Obra Persona Es creador de

Es una Es una

Nivel de Conocimientos

Nivel de Datos

Año

Fecha de publicación

1960

Fecha de publicación

Es un

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Ejemplo de ontología

Page 9: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

8

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

1.  Introducción 2.  Tipos de vocabularios 3.  Proceso de Construcción 4.  Ejemplos de Vocabularios 5.  Ejemplos de Redes de vocabularios en aplicaciones

de datos enlazados 6.  Conclusiones

15

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Vocabularios en la Web de datos

16

¿Qué vocabularios son los más utilizados?

Page 10: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

9

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Modelar en la Web de Datos

Especificar

Modelar

RDF Generation

Publication

Links Generation

Exploitation

Misma visión (Shared

understanding)

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Tendencias en la construcción de ontologías

•  Reutilizar recursos ricos en conocimientos •  Construcción de ontologías y vocabularios de forma

colaborativa •  Conectar ontologías y vocabularios en redes

Construcción De ontologías

Page 11: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

10

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Modelar

19

Buscar Ontologías

Linked Open Vocabularies

¿Son apropiados?

Construir el modelo reutilizando vocabularios

existentes

Si

No

Buscar recursos basados en conocimientos

Catálogos Institucionales y estándares

¿Son apropiados?

Transforma el recurso en una ontología

Si

No

Construye desde el principio usando la metodología NeOn

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Búscar vocabularios en LOV

•  Ecosistema de vocabularios utilizados en datos abiertos enlazados (RDFS or OWL ontologies) •  300 vocabularios descritos con metadatos •  Clasificados en espacios (vocabulary spaces) •  Enlazados usando VOAF •  Servicios

•  Consulta •  Búsqueda •  Métricas

20

Linked Open Vocabularies (LOV)

http://labs.mondeca.com/dataset/lov/

Page 12: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

11

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Los espacios en LOV

21

Generales

Bibliotecas

Organizaciones sociales

Espacio Tiempo Eventos

Multimedia

Ciencia

Web

Recomendaciones

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Descripción de vocabularios en LOV

22

Metadatos

Vocabularios que usa

Vocabularios que lo usan

Versiones

Page 13: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

12

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

1.  Introducción 2.  Tipos de vocabularios 3.  Proceso de Construcción 4.  Ejemplos de Vocabularios

•  Personas y Organizaciones: FOAF, vCard, ORG •  Documentos: DC, BIBO •  Geo: puntos, curvas y polígonos •  Estadísticas: Data Cube •  Bibliotecas: FRBR •  Otros vocabularios: sensores, provenance, VOID

5.  Ejemplos de Redes de vocabularios en aplicaciones de datos enlazados •  Instituto Geográfico Nacional

23

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Vocabularios de Personas y Organizaciones

24

Page 14: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

13

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

FOAF– Friend Of A Friend

•  Vocabulario RDF para describir: •  Personas •  Grupos •  Documentos

o  http://www.foaf-project.org/

25

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

FOAF – relación con otros vocabularios

26

Page 15: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

14

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

FOAF - Evolución

27

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

FOAF - El vocabulario

28

Page 16: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

15

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

FOAF - Una parte del modelo

29

Extracto del modelo de FOAF

foaf:Person

foaf:Document

foaf:knows

foaf:Imagefoaf:publications- foaf:firstName- foaf:surname

owl:Thing

foaf:mbox

foaf:Agent

foaf:Group

foaf:Organization

- foaf:familyname

wgs_84:SpatialThing

foaf:based_near

foaf:homepage

foaf:img

foaf:depiction

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

FOAF- modelo e instancias

30

oeg : Asun

foaf : Person

foaf : Document

foaf : knows

foaf : Image foaf : publications - foaf : firstName - foaf : surname

owl : Thing

foaf : mbox

foaf : Agent foaf : Group foaf : Organization

- foaf : familyname

wgs _ 84 : SpatialThing foaf : based _ near

foaf : homepage

foaf : img

oeg : MC foaf : knows

asun @ fi . upm . es

foaf : mbox

http :// oeg - upm . net /

foaf : homepage

foaf : depiction

http ://.../ people / asun _ oeg . png foaf : img

http :// www . springer . com /.../ 978 - 3 - 642 - 24793

foaf : publications foaf : publications

foaf : firstName foaf : surname foaf : firstName

foaf : surname “Mari Carmen”

“Suárez de Figueroa”

“Asunción”

“Gómez-Pérez”

http :// springer . com / … / images / NeOnBook . tif

foaf : depiction

instanceOf instanceOf instanceOf

instanceOf

instanceOf

instanceOf

instanceOf

Page 17: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

16

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

RDF de ejemplo instanciación de Foaf

31

XML

Turtle

V-Card– Tarjetas de presentación

•  vCard automates the exchange of personal and organization information typically found on a traditional business card.

•  RDF Classes: •  Vcard •  Name •  Address •  Organisation, •  Location •  Label •  Tel •  Email.

32

http://www.w3.org/Submission/vcard-rdf/

Page 18: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

17

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Ejemplo instanciación Vcard

33

vcard:Name

vcard:urlvcard:email

- vcard:given-name- vcard:family-name

owl:Thing

vcard:nvcard:VCard

oeg:Asun

[email protected]

vcard:email

http://oeg-upm.net/

vcard:urlvcard:given-name vcard:family-name

“Asunción” “Gómez”

oeg:AsunNamevcard:n

instanceOf

instanceOfinstanceOf

instanceOf

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

RDF de ejemplo instanciación de VCard

34

XML

Turtle

Page 19: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

18

35

foaf:Person

foaf:Document

foaf:knows

foaf:Imagefoaf:publications- foaf:firstName- foaf:surname

owl:Thing

foaf:mbox

foaf:Agent

foaf:Group

foaf:Organization

- foaf:familyname

wgs_84:SpatialThing

foaf:based_near

foaf:homepage

foaf:img

foaf:depiction

vcard:Name

vcard:urlvcard:email

- vcard:given-name- vcard:family-name

owl:Thing

vcard:nvcard:VCard

FOAF VCard

36

vcard:Name

vcard:urlvcard:email

- vcard:given-name- vcard:family-name

owl:Thing

vcard:nvcard:VCard

oeg:Asun

[email protected]

vcard:email

http://oeg-upm.net/

vcard:urlvcard:given-name vcard:family-name

“Asunción” “Gómez”

oeg:AsunNamevcard:n

instanceOfinstanceOf instanceOf

instanceOf

FOAF

VCard

oeg : Asun

foaf : Person foaf : Document

- foaf : firstName - foaf : surname

owl : Thing foaf : mbox

foaf : Agent foaf : Group foaf : Organization

- foaf : familyname

foaf : homepage

asun @ fi . upm . es foaf : mbox

http :// oeg - upm . net / foaf : homepage foaf : firstName foaf : surname

“Asunción”

“Gómez-Pérez”

instanceOf instanceOf

instanceOf

Page 20: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

19

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

ORG: Una ontología de organizaciones (W3C) •  ORG es una ontología para representar datos de

organizaciones. •  Estructura de la organización

•  Noción •  Sub-organizaciones y unidades •  Fin

•  Estructura de reporte •  Miembros •  Roles, •  Relaciones entre miembros

•  Ubicación •  Edificios, direcciones, etc.

•  Historia (fusiones, cambios de nombre)

37

http://www.w3.org/TR/vocab-org/

ORG: Una ontología para organizaciones

38

http://www.w3.org/TR/vocab-org/

Page 21: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

20

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

ORG: Metadatos

39

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

ORG: Relación con otros vocabularios

40

Page 22: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

21

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

ORG - Evolución

41

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

ORG: El vocabulario

42

Page 23: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

22

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

ORG - Una parte del modelo

43

Extracto del modelo de ORG

org:Post

org:hasUnit/unitOforg:Organization

org:OrganizationalUnit

foaf:Agent org:membetOf

org:postIn/hasPost

org:headOf

org:holds/heldBy

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

ORG: modelo e instancias

44

instanceOf

instanceOf

instanceOf

instanceOf

instanceOfoeg:Asun

org:Post

org:hasUnit/unitOforg:Organization

org:OrganizationalUnit

foaf:Agent org:memberOf

org:postIn/hasPost

oeg:MCfoaf:knows

http://.../people/asun_oeg.png

foaf:img

foaf:firstNamefoaf:surname foaf:firstName

foaf:surname

“Mari Carmen”

“Suárez de Figueroa”

“Asunción”

“Gómez”

org:headOf

org:holds/heldBy

univEs:UPM

skos:prefLabel

“Universidad Politécnica de

Madrid”

upm:FI

skos:prefLabel

“Facultad de Informática”

fi:DIA

skos:prefLabel

“Departamento de Inteligencia

Artificial”

org:unitOf

org:unitOf

org:memberOf

org:memberOf

org:memberOf org:memberOf

org:memberOf

org:memberOf

org:headOf

fi:15

skos:prefLabel

“Director de departamento”

org:postIn

org:holds/heldBy

instanceOf

Page 24: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

23

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

ORG: modelo e instancias – Sintaxis Turtle

45

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

ORG: modelo e instancias – Sintaxis RDF/XML

46

Page 25: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

24

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

1.  Introducción 2.  Tipos de vocabularios 3.  Proceso de Construcción 4.  Ejemplos de Vocabularios

•  Personas y Organizaciones: FOAF, vCard, ORG •  Documentos: DC, BIBO •  Geo: puntos, curvas y polígonos •  Estadísticas: Data Cube •  Bibliotecas: FRBR •  Otros vocabularios: sensores, provenance, VOID

5.  Ejemplos de Redes de vocabularios en aplicaciones de datos enlazados •  Instituto Geográfico Nacional

47

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

DC: The Bibliographic Ontology

•  Dublin Core es un ontología para describir recursos mediante metadatos simples y generales (DC terms).

•  Subconjunto de 15 elementos (DC elements) reconocidos por IETF RFC 5013, ANSI/NISO Standard Z39.85-2007 y ISO Standard 15836:2009.

•  Pensado para ser utilizado junto con otros vocabularios especializados de acuerdo a las necesidades de implementación.

48

•  http://dublincore.org/documents/2012/06/14/dcmi-terms/?v=terms

Page 26: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

25

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

DC: Relación con otros vocabularios

49

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

DC: Evolución

50

Page 27: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

26

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

DC: El vocabulario

51

126 Elementos

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

DC: Una parte del modelo

52

Extracto del modelo de DC

dc:BibliographicResource

owl:Thingdc:coverage

dc:Agent

dc:LocationPeriodOrJurisdiction

dc:MediaTypeOrExtent

dc:creatordc:contributordc:publisher

dc:descriptiondc:identifier

dc:format

dc:typedc:rights

dc:relationdc:sourcedc:subject

dc:language

dc:LinguisticSystem

dc:RightsStatement

dc:Class

- dc:title

Page 28: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

27

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

DC: modelo e instancias

53

oeg:MC

http://www.springer.com/.../978-3-642-24793-4

dc:creatoroeg:Asundc:contributor

stl:Aldo

dc:contributor

kmi:Enricodc:contributor

http://dbpedia.org/page/Springer_Publishing

dc:publisher

terms:title

“Ontology Engineering in a Networked World”

terms:identifier

“978-3-642-24794-1”

terms:created“2012”

dc:BibliographicResource

dc:Agent

- dc:titleinstanceOf

instanceOf

instanceOf

instanceOf

instanceOf

instanceOf

dc:creatordc:contributordc:publisher

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

RDF de ejemplo instanciación de Dublin Core

54

XML

Turtle

Page 29: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

28

DC en Protégé

55

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

BIBO: The Bibliographic Ontology

•  Bibliographic Ontology (BIBO) para describir datos bibliográficos en la Web

•  BIBO can be used as •  Ontologia de citas •  Clasificación de documentos

56

•  bibliontology.com/ •  http://purl.org/ontology/bibo/

Page 30: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

29

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

BIBO: Relación con otros vocabularios

57

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

BIBO: Evolución

58

Page 31: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

30

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

BIBO: El vocabulario

59

189 Elementos

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

BIBO: Una parte del modelo

60

Extracto del modelo de BIBO

bibo:Document

bibo:Article

bibo:Agent bibo:editor

equivalentClass

bibo:Book

bibo:Thesis

bibo:Proceedings

foaf:Agent

Page 32: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

31

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

BIBO: modelo e instancias

61

instanceOf

instanceOf

instanceOf

instanceOf

oeg:Asun

bibo:Document

bibo:Articlebibo:Agent

bibo:editor

oeg:MC

http://.../people/asun_oeg.png

foaf:img

foaf:firstNamefoaf:surname

foaf:firstName

foaf:surname

“Mari Carmen”

“Suárez de Figueroa”

“Asunción”

“Gómez”

equivalentClass

springer:978-3-642-24794-1 dc:title“Ontology Engineering in a Networked World”@en

“2012”

bibo:Book

bibo:Thesis

bibo:Proceedings

foaf:Agent

dc:date

“978-3-642-24794-1”

bibo:isbn

“444”

bibo:numPages

kmi:EMotta

foaf:firstName

foaf:surname

“Enrico”

“Motta”

cnr:AGangemi

foaf:firstName

foaf:surname

“Aldo”

“Gangemi”

bibo:editor

bibo:editor bibo:editorbibo:editor

springer:Springer

bibo:publisher

instanceOf

instanceOf

BIBO in Protégé

62

bibliontology.com

Page 33: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

32

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

BIBO: modelo e instancias – Sintaxis RDF/XML

64

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

1.  Introducción 2.  Tipos de vocabularios 3.  Proceso de Construcción 4.  Ejemplos de Vocabularios

•  Personas y Organizaciones: FOAF, vCard, ORG •  Documentos: DC, BIBO •  Geo: puntos, curvas y polígonos •  Estadísticas: Data Cube •  Bibliotecas: FRBR •  Otros vocabularios: sensores, provenance, VOID

5.  Ejemplos de Redes de vocabularios en aplicaciones de datos enlazados •  Instituto Geográfico Nacional

65

Page 34: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

33

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Puntos en cartografía: WGS84

•  Vocabulario para representar Puntos •  latitud •  Longitud •  @en

•  http://www.w3.org/2003/01/geo/

66 Asunción Gómez Pérez

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"> <geo:Point> <geo:lat> 55.701</geo:lat> <geo:long>12.552</geo:long> </geo:Point> </rdf:RDF>

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Geoes: Modelo de Geometria

67

geoes:ontology/Polygon

geoes: http://geo.linkeddata.es/ geo: http://www.w3.org/2003/01/geo/wgs84_pos#

geoes:ontology/Geometry

geoes:ontology/Curve geo:Point

rdfs:subClassOf rdfs:subClassOf

rdfs:subClassOf

geo:lat geo:long Collection of 2 or more geo:Points Collection of 3 or

more geo:Points

Composed by Composed by

Page 35: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

34

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Geoes: curvas

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

69

geoes:resource/Embalse/Embalse%20de%20Orellana

rdf:type

geoes:ontology/Embalse (reservoir)

geo:geometry

otalex:resource/4e994dad1c44d2b50597dd64ddfb

cac30de06d80

-5.498

38.985 geo:lat

geo:long

geoes: http://geo.linkeddata.es/ otalex: http://otalex.linkeddata.es/ geo: http://www.w3.org/2003/01/geo/wgs84_pos#

Embalse de Orellana

rdfs:label

otalex:resource/ 38.984222213320045_-5.49938294416971

otalex:resource/wgs84/38.982575823226234_-5.495821779307

759

geo:

form

adoP

or (c

ompo

sed

by)

otalex:resource/wgs84/38.98531526569159_-5.4985940847130

78

geoes:Polígono (Polygon)

rdf:type

otalex:resource/wgs84/…

69

Geoes: Polígonos

Page 36: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

35

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Ejemplo de RDF

70

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

1.  Introducción 2.  Tipos de vocabularios 3.  Proceso de Construcción 4.  Ejemplos de Vocabularios

•  Personas y Organizaciones: FOAF, vCard, ORG •  Documentos: DC, BIBO •  Geo: puntos, curvas y polígonos •  Bibliotecas: •  Estadísticas: Data Cube •  Descripcion de conjuntos de datos: VOID

5.  Ejemplos de Redes de vocabularios en aplicaciones de datos enlazados

6.  Conclusiones

71

Page 37: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

36

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Bibliotecas: FRBR

Works

Expressions

Manifestations

Obra 1

Obra 2

Obra 3

Expresión1 Expresión 2

Manifestación1 Manifestación2

Specification

Modelling

RDF Generation

Publication

Links Generation

Exploitation

72

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Ontología de la BNE: basada en los vocabularios de FRBR

Page 38: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

37

Marimba genera RDF

BNE

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

1.  Introducción 2.  Tipos de vocabularios 3.  Proceso de Construcción 4.  Ejemplos de Vocabularios

•  Personas y Organizaciones: FOAF, vCard, ORG •  Documentos: DC, BIBO •  Geo: puntos, curvas y polígonos •  Bibliotecas: •  Estadísticas: Data Cube •  Descripcion de conjuntos de datos: VOID

5.  Ejemplos de Redes de vocabularios en aplicaciones de datos enlazados

6.  Conclusiones

75

Page 39: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

38

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Data cubes

•  Un cubo puede se r cons ide rado una ex tens ión multidimensional de tablas 2-D (igual que en geometría un cubo es una extensión tridimensional de un cuadrado)

•  El término hiper-cubo se utiliza, en ocasiones, especialmente para los datos con más de tres dimensiones

•  Cada dimensión representa algún atributo en la base de datos (como las ventas, los beneficios, los gastos, etc.)

•  Las celdas en el cubo de datos representan la medida de interés. Por ejemplo, pueden contener un contador para el número de veces que se produce una combinación de atributo en la base de datos, o el valor mínimo, máximo, la suma o media de algún atributo)

•  Las consultas se realizan en el cubo para recuperar información que sirva de apoyo a las decisiones

76

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Data cubes

78

Cubo

Dimensiones

Celdas

Page 40: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

39

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Example: Desempleo

79

Dim

ensi

ón (C

CA

A)

Dimensión (Año)

Celdas (Datos de paro registrado)

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

RDF Data Cube: Vocabulario

80

Cubo

Celdas (Datos)

Dimensión

Fenómeno Observado

Page 41: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

40

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Ejemplo: Data Cube y Desempleo

81

qb:dataSet qb:dataSet

stats:unemployment/Cantabria_2004

stats:unemployment/Canarias_2008

……

rdf:type rdf:type

qb:Observation

stats:unemployment

rdf:type

qb:DataSet

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

1.  Introducción 2.  Tipos de vocabularios 3.  Proceso de Construcción 4.  Ejemplos de Vocabularios

•  Personas y Organizaciones: FOAF, vCard, ORG •  Documentos: DC, BIBO •  Geo: puntos, curvas y polígonos •  Bibliotecas •  Estadísticas: Data Cube •  Otros Vocabularios: sensores, provenance, VOID,

DCAT, … 5.  Ejemplos de Redes de vocabularios en aplicaciones

de datos enlazados •  Instituto Geográfico Nacional

82

Page 42: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

41

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 83

SSN Ontology with other Ontologies

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Provenance

84

RDF    Store  

PROVENANCE  Model  (RDF(S))  

1

Del proceso •  OPM, Provernir, PM, •  PROV-O @W3C

Filev1.  txt  

Revision  Process  

generatedBy  

File.txt  

used  

Meta-provenance •  DC-PROV @ W3C (ongoing) •  OAI-ORE

Del Recurso •  DC, Premis, SWANL •  EDM (including agregation)

creator  

rights  

creaJonDate  

John  

12-­‐2-­‐1900  

GPL  

Page 43: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

42

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

DCAT: Data Catalog Vocabulary

•  DCAT es un vocabulario para facilitar la interoperabilidad de catálogos de datos publicados en la web.

•  DCAT facilita la tarea de descubrir catálogos de datos y el consumo de metadatos procedentes de distintos catálogos.

•  Los principales conceptos descritos en DCAT son: •  Catálogo •  Record de un catálogo •  Conjunto de datos •  Distribución •  Descarga •  Servicio web

85

•  http://www.w3.org/TR/vocab-dcat/

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

DCAT: El vocabulario

86

Imagen tomada de http://www.w3.org/TR/vocab-dcat/

Page 44: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

43

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

¿Qué es voID?

•  vocabulario en RDFS publicado por el W3C

•  Permite la descripción de un conjunto de datos RDF

•  Facilita el descubrimiento y la utilización del dataset por parte de usuarios potenciales (e.g. agregadores, indexadores, desarrolladores de aplicaciones)

87 Asunción Gómez Pérez

http://www.w3.org/TR/void/

•  Metadatos generales: licencia, autor, temática, número de tripletas...

•  Métodos de acceso: dirección SPARQL endpoint, ficheros descargables..

•  Metadatos de estructura: recursos de ejemplo, patrón de URIs, vocabularios utilizados..

•  Linksets (conjuntos de datos a los que enlaza el dataset): describe la propiedad utilizada (e.g. owl:sameAs, skos:closeMatch), la URI del dataset con el que se enlaza, enlaces de ejemplo…

VOID

88

Page 45: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

44

BNE VOID

89 Asunción Gómez Pérez

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

adms: Asset Description Metadata Schema

•  El vocabulario adms describe conceptos relacionados con la interoperablidiad semántica de recursos.

•  Incluye conceptos como “Repositorio de recursos semanticos”, “Recurso semántico” y “Distribución de recursos semánticos” que son especializaciones de conceptos mas generales: Repositorio y Distribución.

•  El vocabulario adms ha sido creado en el programa de soluciones de interoperabilidad para las administraciones públicas europeas (ISA: Interoperability solutions for European public administrations) de la comisión europea.

90

•  http://www.w3.org/ns/adms#

Page 46: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

45

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

adms: El vocabulario

91

Imagen tomada de http://www.w3.org/ns/adms

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

1.  Introducción 2.  Tipos de vocabularios 3.  Proceso de Construcción 4.  Ejemplos de Vocabularios 5.  Ejemplos de Redes de vocabularios en

aplicaciones de datos enlazados 6.  Conclusiones

92

Page 47: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

46

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Ontologias de geolinkeddata

93

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Acceso uniforme a BD

OMI

NGCE BCN200 NOMGEO

Lago Ontología de fenómenos

Redes de Ontologías

Lago Lago de Agua dulce Lago de agua salada

SPARQL Endpoints URI: http://geo.linkeddata.es/NGCE/resource/Laguna/Tae%C3%B1a%2C%20Laguna%20de URI: http://geo.linkeddata.es/NGCE/resource/Laguna/Tollos%2C%20Laguna%20de%20los […] URI: http://geo.linkeddata.es/NOMGEO/resource/Laguna/Hilejas%2C%20Laguna%20de%20las URI: http://geo.linkeddata.es/NOMGEO/resource/Laguna/Tejo%2C%20Laguna%20del […] URI: http://geo.linkeddata.es/BCN200/resource/Laguna/Laguna%20de%20Paniagua URI: http://geo.linkeddata.es/BCN200/resource/Laguna/Laguna%20Laguna%20 […]

La respuesta final compuesta por 1.806 URI (38 de NGCE, 1.416 de NOMGEO y 406 de BCN200).

?

Page 48: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

47

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

02

-  Tipo •  NDepresión •  Glaciar •  Batimétormal • rica -  Categoría •  Normal •  Maestra •  Auxiliar -  Origen •  Desconocido •  Restitución •  Digitalización •  MDT

0201 Curva de nivel

http://mayor2.dia.fi.upm.es/oeg-upm/files/phenomontology/Phenom4.0.1.owl

Ontología de fenónmenos cartográficos

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Ontología de Hidrología

Nivel superior

Nivel inferior

Page 49: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

48

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Implementación

12

3

4

5

+ Pellet

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Ontologias de Geolinkeddata

hasStatisticalData

on

Ontology

Specification

Legend

hydrOntology

4

FAO

FAO Geopolitical ontology

WGS84

4W3C Vocabulary

GML

4GML Specification

O. Statistics

SCOVO

O. Time

W3C Time

hasLat/Long

hasGeometry

hasLat/Long

hasGeometry

hasLocation/isLocated

Thesaurus

UNESCO

4EGM / ERM

GeoNames…

scv:Dimension scv:Item

scv:Dataset

WGS84 Geo Positioning: an RDF

vocabulary hydrographical

phenomena (rivers, lakes, etc.)

Ontology for OGC Geography Markup Language

Vocabulary for instants, intervals, durations, etc.

Names and international code systems for territories and groups

Following the INSPIRE (INfrastructure for SPatial InfoRmation in Europe) recommendation. hydrOntology,SCOVO, FAO Geopolitcal, WGS84, GML, and Time

Classes 33 33

Object Properties 44 44

Data Properties 318 318

reused

Page 50: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

49

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Ontologías de datos metereológicos

99

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

1.  Introducción 2.  Tipos de vocabularios 3.  Proceso de Construcción 4.  Ejemplos de Vocabularios 5.  Ejemplos de Redes de vocabularios en aplicaciones

de datos enlazados 6.  Conclusiones

100

Page 51: 03. Vocabularios. Tecnologías Semánticas en la Web de Datos

28/11/12

50

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Conclusiones

Las AA.PP. deben consensuar qué

vocabularios van a utilizar para describir sus datos y facilitar la

interoperabilidad semántica

Los vocabularios deben ser multilingües

101 Asunción Gómez Pérez