71
GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES WEB Sesión IV: Metadatos y metainformación GEMA BUENO DE LA FUENTE UNIVERSIDAD CARLOS III DE MADRID

GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

Embed Size (px)

Citation preview

Page 1: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES WEB

Sesión IV:

Metadatos y metainformación

GEMA BUENO DE LA FUENTEUNIVERSIDAD CARLOS III DE MADRID

Page 2: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

METADATOS Y METAINFORMACIÓN EN LA AI

[email protected]

Cualquier repositorio de contenidos Web sin metadatos es como una biblioteca sin un índice. Más que los

usuarios, el personal no sabría dónde poner las cosas y encontrarlas de nuevo. Los metadatos son la clave para conseguir que las máquinas guarden los contenidos y los encuentren cuando sea necesario –abriendo las

puertas al 80% de la información de una organización que no reside en una base de datos. (Interwoven, 2001)

Page 3: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Contenidos

• Metadatos para el diseño de sedes web.• Concepto de metadatos y metainformación.• Marcado procedural y descriptivo.• Metadatos y descripción de los contenidos de la

sede.• Metadatos e indización de contenidos.• Prácticas.

Page 4: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

METADATOS Y METAINFORMACIÓN EN LA AI

Metadatos para el diseño de sedes Web: Implicaciones, concepto y

matices.

Page 5: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

¿Qué son los metadatos/metainformación?

• Meta-datos: 'junto a', 'después de', 'entre' o 'con'.

• Por definición: información descriptiva 'junto a', 'después de', 'entre' o 'con' (incluso, ‘sobre’) los datos.

• Ejemplos tradicionales son: las fichas de catálogo, los registros de una base de datos bibliográfica.

• En la Web: información descriptiva (ej. etiquetas META) del contenido de un recurso electrónico.

• A pesar de la simplicidad de la definición, los metadatos albergan una gran complejidad, dimensiones e importancia en la arquitectura de la información.

Page 6: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos son...

• Datos que soportan operaciones llevadas a cabo con OBJETOS DE INFORMACIÓN de la Red.

• Evitan al usuario la necesidad de tener que poseer un conocimiento completo de las características de los recursos.

• Estructuras de organización de la información legibles por máquina.

• Destinados a ordenar y describir la información contenida en un e-documento.

• Para: hacer útiles los datos.

Page 7: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos son...

... Datos

... Datos sobre datos

... Descripciones estructuradas de un objeto de información.

... Un conjunto de elementos y atributos para caracterizar la información.

... Estándares para describir objetos de datos discretos, que precisan de una semántica y estructura.

Su finalidad es...... Describir y recuperar información Web.... Fundamentar SRI de sistemas y servicios de

información digital.

Page 8: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos ¿por qué?

• Justificación tradicional: – Para describir la información existente. – Para organizar el conocimiento.– Para poder encontrar y utilizar dicha información y/o

conocimiento.

• Justificación en entorno Web:– Gran volumen de información en formato electrónico.– Necesidad de aunar recursos en la Web (verticalización de la

información: Sedes Web especializadas-Modelos de metadatos específicos).

– Valor añadido al Web (AI): Oportunidad de proporcionar a los profesionales servicios de mayor calidad (precisión y relevancía) que Google, etc.

Page 9: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos ¿para qué?

recuperación de recursos

administración de documentos

gestión de derechos

valoración de contenidos

seguridad y

autentificación

estado de

archivo

productos y

servicios

esquemas de

bases de datos

control o

descripción de procesos

Page 10: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos para el diseño de sedes web

• Metaetiquetas HTML (head)• Promoción del Web (mediante software especializado)• Búsqueda all-the-web: dirigidos a buscadores de

carácter global.• Spamming Otras técnicas de cálculo de la relevancia

(Google-page rank)• Análisis cibermétricos• Visibilidad a niveles científicos: OAI

Búsqueda: Visibilidad y posicionamientoBúsqueda: Visibilidad y posicionamiento

Page 11: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos para el diseño de sedes web

• Findability (Facilidad de búsqueda“encontrabilidad”): el arte de conseguir que un usuario encuentre lo que necesita en una web (Rosenfeld)

• Búsqueda interna en una sede Web:– Motor de búsqueda interno– Clasificación automática (elemento de metadatos de

descripción de materias. P. ej. DC.Subject)

• Desarrollo: schema de metadatos-sistema de recuperación cualificado orientado a metadatos

• Complejidad e interrelación de metadatos orientados a la búsqueda (all-the-web y/o Findability): Ej.

Búsqueda: “Findability”Búsqueda: “Findability”

Page 12: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Ejemplo: AVEL http://avel.edu.au

Page 13: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos para el diseño de sedes web

• Objetivo: gestión flexible de contenidos distribuidos.• Precisan el carácter de los contenidos del sitio web o de las

páginas que lo componen:– Alcance– Objetivos particulares de una sede (dominios/comunidades).

Distintos modelos de metadatos (Web disciplinar)– A qué usuarios están dirigidos (valoración)– Descripción multilingüe– Usuarios / utilidad de los datos

• Dos niveles: – Nivel de descripción del recurso: formal– Nivel de descripción temática: ontologías, tesauros

(metadatos dependientes del contenido)

Descripción de contenidosDescripción de contenidos

Page 14: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos para el diseño de sedes web

• Parte de la AI en CMS y Bloggers.• Importancia en la actualización de contenidos. Compartir

información de noticias• RSS (Rich/RDF Site Summary): formato de intercambio

de contenidos para crear canales de publicación que pueden leerse con programas específicos tipo: NewsGator, Freereader (ej.)

• Conlleva otro tipo de “visibilidad” Web.

Agregación y sindicación de contenidosAgregación y sindicación de contenidos

Page 15: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos para el diseño de sedes web

• Los metadatos mejoran la accesibilidad al contenido: – WCAG (Web Content Accesibility Guidelines)

http://www.w3.org/TR/WAI-WEBCONTENT/ Pauta 13: Proporcione mecanismos claros de navegación. Verificación 13.2. Proporcione metadatos para añadir información semántica a las páginas y sitios web. (Nivel AA).

• Acceso vs. Accesibilidad: “estar” accesible (disponible) / “ser” accesible.

AccesibilidadAccesibilidad

Page 16: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos para el diseño de sedes web

• EARL: Evaluation And Report Language 1.0 Schema– Documento de trabajo del W3C: http://www.w3.org/TR/EARL10/– Es un lenguaje (vocabulario RDF Resource Description Framework)

para expresar un tipo de metainformación específica: los resultados de los test de accesibilidad.

– EARL es un lenguaje sencillo que permite establecer resultados de test para cualquier cuestión de accesibilidad analizada (web, herramienta de autor, etc.) según un conjunto de criterios.

– Al igual que otras expresiones RDF está compuesto de tres elementos atributo-propiedad-valor (sujeto-verbo-predicado): Assertor-asserts-assertion.

– Elementos básicos: Assertor, Assertion, TestSubject, TestMode, TestCase, TestResult, ValidityLevel, ConfidenceLevel, Software y WebContent.

AccesibilidadAccesibilidad

Page 17: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos para el diseño de sedes web

• Conjunto de tecnologías para la organización y representación del conocimiento digital.

• Objetivos: – Proporcionar un acceso inteligente a la información heterogénea y

distribuida en la WWW, posibilitando a los agentes de software mediar entre las necesidades de los usuarios y los recursos de información disponibles.

– Creación de una Web de datos con significado, de tal forma que un programa de ordenador pueda aprender tanto acerca de lo que quieren decir los datos, como acerca de la información necesaria para procesarlos.

• Procesamiento global e interoperable de la información Web (marcado semántico XML + estructuras de metadatos).

Web Semántica (SW)Web Semántica (SW) http://www.w3.org/2001/sw/

Page 18: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos para el diseño de sedes web

• Lenguajes formales como: DAML+OIL, RDF, OWL

• Metadatos y esquemas de metadatos (DCMI: infraestructura operacional de la SW).

• Ontologías: – tanto específicas de un dominio, como ontologías de

alto nivel, de tal forma que se proporcionen relaciones entre ontologías para la recuperación, el intercambio y la integración de la información interdisciplinar en la Web

Web Semántica (SW)Web Semántica (SW) http://www.w3.org/2001/sw/

Page 19: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos para el diseño de sedes web

Web Semántica (SW)Web Semántica (SW) http://www.w3.org/2001/sw/

Page 20: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos para el diseño de sedes web

• Los Servicios Web son aplicaciones de software que pueden localizarse y recuperarse, describirse y accederse gracias a XML y a protocolos web normalizados [HTTP y SOAP], a través de intranets, extranets y de Internet.

• Objetivo: permitir que un usuario (humano o aplicación software) pueda lanzar una búsqueda de información sobre gestores de contenidos en un dominio de aplicación (agencias de noticias, portales B2B, etc.).

• Funciones de los metadatos en WS:– Sindicación– Transformación de datos– Traducción a otros idiomas– Creación y autoría de contenidos distribuidos (interoperabilidad).

• XML+distribución de contenidos+gestión de metadatos.

Servicios Web (WS)Servicios Web (WS) http://www.w3.org/2002/ws/

Page 21: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

BACK-END

Contenidos

estructura

navegación

rotulado

búsqueda y feedback

hardware

software

programación

FRONT-END

(Arquitectura de la Información)

Recordemos...DIMENSIONES DEL DISEÑO DE

SEDES WEB

pro

toti

pad

o

Recordemos...DIMENSIONES DEL DISEÑO DE

SEDES WEB

Page 22: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Ejemplo de codificación de metadatos en una sede Web (DCMI)

http://dublincore.org/index.shtml.rdf

Page 23: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Ejemplo de codificación de metadatos en una sede Web (DCMI)

http://dublincore.org/index.shtml.rdf

Page 24: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Ejemplo de codificación de metadatos en una sede Web (DCMI)

Metadatos descriptivos embebidos (HTML)Metadatos descriptivos embebidos (HTML)

Metadatos para la sindicación de noticias (RSS)Metadatos para la sindicación de noticias (RSS)

Metadatos descriptivos (RDF vinculado link rel)Metadatos descriptivos (RDF vinculado link rel)

Page 25: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Ejemplo de codificación de metadatos en una sede Web (DCMI)

http://dublincore.org/news.rss http://dublincore.org/news.rss Metadatos para la sindicación de noticias (RSS)Metadatos para la sindicación de noticias (RSS)

Page 26: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Edición digital:Publicación de

contenidos

Edición digital:Publicación de

contenidosIdentificar y localizar cada

DLO

Identificar y localizar cada

DLO

Organización

de contenidos

Organización

de contenidos

Interoperabilidad entre sistemas

distribuidos

Interoperabilidad entre sistemas

distribuidos

Preservar y conservar el cont. digital

Preservar y conservar el cont. digital

Descripción de DLOs

(Metadatos)

Descripción de DLOs

(Metadatos)

Recuperación de DLOs

Recuperación de DLOs

Facilitar la

accesibilidad

Facilitar la

accesibilidad

Visión particular de la AI y función de los metadatos

Page 27: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Tipos de metadatos

• Clasificación Funcional:• Administrativos• Descriptivos• Conservación• Técnicos• Uso

• Esquema Dublin Core:• Administrativos• Descriptivos• Estructurales

Page 28: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Estado actual de la teoría de metadatos

La estructura y semántica de los modelos de metadatos aplicados a la recuperación es factible, aplicable y operativa en entornos de información abarcables,

definidos y finitos (p. ej. una sede Web).

Page 29: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

3 Niveles de metainformación:– Metadatos recuperación-sistema– Metaetiquetas de búsqueda Web– Metadatos de usuario/servicio

Búsqueda en SRII

Búsqueda global Integrada

Búsqueda local Búsqueda en BD propia

Búsqueda texto completo

Búsqueda global

Definición de tipos de metadatos (finalidad)

Page 30: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

METADATOS Y METAINFORMACIÓN EN LA AI

Marcado semántico y procedural

Page 31: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

WWW: Marcado/edición digital

• Marcado de procedimiento o procesado (procedural): relativo a la apariencia física o de formato, restrictivo a cada sistema de edición electrónica de documentos, que no tiene ninguna implicación expresa para el contenido del documento.

• Marcado descriptivo o declarativo: identifica los elementos estructurales de un documento, determinando su estructura lógica. Se describe la estructura y/o el contenido de un documento– el contenido de los documentos marcados descriptivamente

puede reutilizarse con distintas finalidades (p. ej., la identificación de los elementos que describen un documento desde el punto de vista bibliográfico: título, autor, etc., y/o de contenido= Metadatos: marcado semántico).

Page 32: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metainformación & Marcado

ESTRUCTURALenguajes de marcado:

HTMLXHTML

XMLSMIL/SVG

ESTRUCTURALenguajes de marcado:

HTMLXHTML

XMLSMIL/SVG

PRESENTACIÓN

Hojas de estilo

CSS

XSLT

PRESENTACIÓN

Hojas de estilo

CSS

XSLT

Semántica que no se ve (metadatos)

Semántica que no se ve (metadatos)

Page 33: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

WWW: Lenguajes de marcado

• HTML– Estándar para formatear la información publicada en Ia Web,

distribuida a través de HTTP.– Diseñado principalmente para visualización de datos y se centra

en cómo aparece la información, no en su estructura.– Pobre mecanismo de descripción: metaetiquetas.

• XML– Subconjunto/simplificación de SGML: Lenguaje de marcas que

añade información estructural y semántica (metadatos) a los propios datos.

– Enfocado a la descripción, no a la visualización.– Metalenguaje que sirve para definir otros lenguajes de propósito

específico (v.g., XHTML, WML, XSL, RDF, etc.)– Múltiples representaciones de la información a través de

metadatos.

Page 34: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Modelos/formatos/esquemas... ...estándares de metadatos

RDF: metamodelo de metadatosXMLXMLXMLXML DCMIDCMIDCMIDCMIRDFMS RDFS

Perfiles de aplicación

Metadatos de propósito generalXML autodescriptivo

Etiquetas <meta> HTML

DCMI

Metadatos de propósito específico– TEI-H– Otros esquemas: VRA, DIG35,

MPEG7, EdNA, IMS, AGLS, GILS, FGDC

– DCMI

Page 35: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

METADATOS Y METAINFORMACIÓN EN LA AI

Descripción e indización de contenidos de la sede: DCMI + estructuras de

codificación de metadatos

Page 36: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos de propósito general: DCMI

• Un mecanismo básico de descripción que: – Puede usarse en todos los dominios.– Para todo tipo de recursos.– Es sencillo, pero potente.– Puede extenderse fácilmente.– Puede trabajar conjuntamente con otras soluciones

específicas.

• Para ayudar a la recuperación de información en la Web

Page 37: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Dublin Core - DCMI (1995-2003)

• Nace de la imposibilidad de catalogar la Web.• Para mejorar la recuperación de información a

través de la inclusión de catalogación de metadatos de autor embebidos.

• Inicialmente: 13 elementos para describir recursos / 15 elementos (1996).

• DCq (Dublin Core Qualified)• Integración RDF.

Page 38: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos Dublin Core

• 15 elementos básicos:– Título, Creador, Colaborador, Editor, Fecha de publicación,

Identificador (URI), Materia, Descripción, Cobertura, Tipo de recurso, Idioma, Formato, Fuente, Relación con otros documentos, Derechos.

• Detalles adicionales: Cualificadores– Matizaciones: p.ej. Date.Created (fecha de creación),

Relation.IsPartOf (relacionado por ser parte de)– Vocabularios controlados (p. ej. Encabezamientos de materia

normalizados, clasificaciones, nombres geográficos) – Tipos de datos (formatos de fecha/tiempo, tipos MIME)

Page 39: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Tabla de elementos de Dublin Core

Contenido Propiedad Intelectual TemporalidadEjemplo

Title Creator DateSubject Publisher TypeDescription Contributor FormatSource Rights IdentifierLanguageRelationCoverage

Page 40: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Dublin Core en la Web

• Estándar de metadatos con más éxito en la Web• Uso creciente en dominios específicos:

– Información del Sector Público y del Estado– Gestión del conocimiento corporativo

• Fundamento esencial en la Web Semántica

Page 41: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

• Motores de búsqueda no soportan DC (sólo algunos search engines)

• Falta de reglas y principios directores que aseguren la calidad del contenido.

• No responsabilidad formal.• Ausencia de masa crítica.

Críticas al DC (1997-98)

Page 42: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

• Simplicidad.• Responsabilidad formal consorciada: DCMI• Independencia sintáctica.

– Integración en la nueva estructuración de la información (XML/RDF)

• Norma ANSI/NISO Z39.85-2001.• Norma ISO 15836-2003 (08/04).• PNE 15836-2005 (Aenor, en español)

Fortalezas del DC (2000-05)

Page 43: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Actividades de la DCMI

• Desarrollar y mantener estándares.• Dar soporte al desarrollo de herramientas,

servicios e infraestructuras.• Establecer un gran alcance educativo.• Establecer relaciones entre comunidades de

información (interoperabilidad).

Page 44: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Principales temas

• Expresar metadatos Dublin Core metadata en (X)HTML, XML, RDF/XML, etc.

• Extensión y uso del DC a dominios específicos de información (Perfiles de aplicación).

• El Registro del esquema DCMI (diccionario).• Citación, Agentes, Colecciones.• Soporte para el desarrollo de herramientas.

Page 45: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Relaciones de la DCMI

• IMS y IEEE/Learning Object Metadata– Discutiendo la cooperación y armonización

• MARC y MODS– Discutiendo la transformación-compatibilidad [mapping]

de estándares

• OAI (Iniciativa de Archivos Abiertos)– Coordinando especificaciones y guías

• Instituciones de normalización formal: ISO, NISO, CEN

Page 46: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Información útil

• Especificaciones– Conjunto de elementos, calificadores, vocabularios

• Guías de uso General – “Utilización del Dublin Core”

• Guías de codificación– (X)HTML, RFC2413 (en revisión)– XML, Recomendación de la DCMI, Abril 2003– RDF, Recomendación de la DCMI, Julio de 2002

DCMI: http://dublincore.org

Mirror en español: http://es.dublincore.org

Lista DCMI-ES: http://www.rediris.es/list/info/dcmi-es.es.html

DCMI: http://dublincore.org

Mirror en español: http://es.dublincore.org

Lista DCMI-ES: http://www.rediris.es/list/info/dcmi-es.es.html

Page 47: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

DC-Lib: Perfil de aplicación de Dublin Core para bibliotecas

• Un perfil de aplicación es un esquema (schema) de metadatos que consiste en un conjunto de elementos trazados o seleccionados a partir de uno o varios espacios de nombres (namespaces), combinados por los desarrolladores de un determinado formato (como el DC) y optimizados para una aplicación particular, como por ejemplo las bibliotecas (library application profile) DC-Lib

• Usos posibles DC-Lib:– servir de formato de intercambio entre diversos sistemas que empleen

estándares de metadatos distintos– recolectar metadatos de fuentes de datos dentro y fuera del ámbito bibliotecario– apoyar la creación simple de registros catalográficos de la biblioteca para

recursos de una variedad de sistemas– exponer datos MARC a otras comunidades (con conversión a DC)– permitir la adquisición de metadatos de identificación de recursos para creadores

no bibliotecarios que usen DC.

Perfil de Aplicación (AP):Perfil de Aplicación (AP):

Page 48: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

DC-Lib: Perfil de aplicación de Dublin Core para bibliotecas

• DC-Lib se compone de varios namespaces: – Dublin Core Metadata Element Set, Versión 1.1

[http://purl.org/dc/elements/1.1/] – Cualificadores Dublin Core [http://purl.org/dc/terms/] – Dublin Core Type Vocabulary

[http://dublincore.org/usage/terms/dcmitype/] – Dublin Core schemes de codificación– [http://dublincore.org/usage/terms/dc/current-schemes/] – Elementos MODS (Metadata Objects Description Schema)

[http://www.loc.gov/mods] : Location y Edition– Elementos DC-Ed (Perfil de Aplicación de DC para Educación)

[http://dublincore.org/groups/education/]: Audience.

Page 49: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos: propósito específico

• Algunos dominios científicos (Internet communities) tienen mecanismos de descripción sofisticados, que plasman en sus sedes Web:– Bibliotecas (MARC, Z39.50)– Archivos (EAD)– Educación (IMS, IEEE/LOM)– Información Geográfica (FGDC, ISO19115)

• Estos estándares específicos pueden transformarse al Dublin Core (p. ej. OAI)

Page 50: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECASPapel de los metadatos

Tipos de esquemas de metadatos (dominio)

Usos genéricosUsos genéricos

Creación de datos

Gestión de datos

DominiosDominios GEOESPACIAL

HUMANIDADES

GOBIERNO

IMAGEN

EDUCACIÓN

Rec. de Inf.

Comercio-E

Interoperabilidad

Accesibilidad

Conservación

Valoración

Rec. de Rec. de I Infnf..Rec. de Rec. de I Infnf..

Page 51: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Basado en XML (eXtensible Mark-up Language)

Más que un mero formato de metadatos. Infraestructura de Descripción de recursos. RDF propone un modelo de datos coherente y un

marco sintáctico para los distintos modelos (ej. MARC, DC, TEI, GILS, EAD...etc.)

Resource Description Framework

RDF: http://www.w3.org/RDF RDF: http://www.w3.org/RDF

Page 52: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

• El modelo de datos que propone RDF consiste en tres tipos de objetos:

Recursos

Tipos de propiedades

Descripciones

Recurso VALORTIPO DE

PROPIEDAD

Propiedad / descripción

RDF: Modelo de datos

Page 53: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

DC en RDF

<?xml version="1.0" ?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://dublincore.org/">  <dc:title>Dublin Core Metadata Initiative (DCMI) Home Page</dc:title>   <dc:description>The Dublin Core Metadata Initiative is an open forum

engaged in the development of interoperable online metadata standards that support a broad range of purposes and business models. DCMI's activities include consensus-driven working groups, global workshops, conferences, standards liaison, and educational efforts to promote widespread acceptance of metadata standards and practices.</dc:description>  

<dc:date>2003-11-03</dc:date>   <dc:format>text/html</dc:format><dc:language>en</dc:language> <dc:contributor>Dublin Core Metadata Initiative</dc:contributor>  </rdf:Description></rdf:RDF>

Page 54: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

DC en XML

<?xml version="1.0"?> <metadata xmlns="http://example.org/myapp/"

xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://example.org/myapp/ http://example.org/myapp/schema.xsd" xmlns:dc="http://purl.org/dc/elements/1.1/">

<dc:title> UKOLN </dc:title> <dc:description> UKOLN is a national focus of expertise in digital

information management. It provides policy, research and awareness services to the UK library, information and cultural heritage communities. UKOLN is based at the University of Bath. </dc:description>

<dc:publisher> UKOLN, University of Bath </dc:publisher><dc:identifier> http://www.ukoln.ac.uk/ </dc:identifier></metadata>

Page 55: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

DC en HTML/XHTML

<head profile="http://dublincore.org/documents/dcq-html/"> <title>Expressing Dublin Core in HTML/XHTML meta and link elements</title> <link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" /> <link rel="schema.DCTERMS" href="http://purl.org/dc/terms/" /> <meta name="DC.title" lang="en" content="Expressing Dublin Core in

HTML/XHTML meta and link elements" /> <meta name="DC.creator" content="Andy Powell, UKOLN, University of Bath" /> <meta name="DCTERMS.issued" scheme="DCTERMS.W3CDTF" content="2003-

11-01" /> <meta name="DC.identifier" scheme="DCTERMS.URI"

content="http://dublincore.org/documents/dcq-html/" /><link rel="DCTERMS.replaces" hreflang="en"

href="http://dublincore.org/documents/2000/08/15/dcq-html/" /> <meta name="DCTERMS.abstract" content="This document describes how

qualified Dublin Core metadata can be encoded in HTML/XHTML &lt;meta&gt; elements" />

<meta name="DC.format" scheme="DCTERMS.IMT" content="text/html" /><meta name="DC.type" scheme="DCTERMS.DCMIType" content="Text" /></head>

Page 56: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

METADATOS Y METAINFORMACIÓN EN LA AI

Metadatos en la Indización de contenidos

(Software y ejemplos)

Page 57: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Metadatos para la indización

1. Indización genérica: promoción del Web (metaetiquetas): embebida en el código fuente HTML/XHTML

2. Indización de un sitio o sede web (conjunto finito de DLOs): Portales, Pasarelas temáticas (subject gateways), Sitios web institucionales, Servicios web (comercio electrónico, etc.) – Sistema de indización propietario (parte del CMS)– Distintos tipos de almacenamiento:

• Indización embebida• Indización externa

– Ficheros externos XML– Elemento link– Bases de datos, etc.

Page 58: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

• Proceso sencillo de incorporación de etiquetas <META>

• Sintaxis HTML– Descriptores libres (keywords)– Resumen de autor (description)– Semántica DC en el <HEAD>

• Finalidad: aumentar la visibilidad de los recursos... poco útil

Edición de metaetiquetas

Page 59: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Edición de metaetiquetas: TagGen 4.5

Page 60: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Edición de metaetiquetas + indización automática: AutoMetatags

Indización automática sobre el documento Web

Título automático

Page 61: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Realidad de las metaetiquetas en los Sistemas de búsqueda

• Muchos de ellos no las tienen en cuenta para el cálculo de la relevancia

– AltaVista: las metatags oportunidad para el abuso y el spamming.

– Excite: <META NAME="description"> para ofrecer el resumen de los resultados.

• Otros sistemas alternativos: page rank Google

Page 62: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Edición de metadatos

• Proceso complejo que requiere una planificación a distintos niveles:

– Entorno informativo (selección/producción de documento-e)

– Sintaxis XML/SGML– Modelo o schema– Almacenamiento– Vocabulario o scheme

• Finalidad: Crear sistemas de información• Herramientas (edición de esquemas): Reggie,

Mantis, Metabrowser

Page 63: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

Realidad de los metadadatos en los Sistemas de indización y búsqueda

• Dublin Core:– Ultraseek (Verity)– Swish-E– Microsoft's Index Server– Blue Angel Technologies MetaStar– Verity Search97 Information Server

http://www.lii.org/

Page 64: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

METADATOS Y METAINFORMACIÓN EN LA AI

Para saber más...

Page 65: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

• AGLS Australian Government Locator Service: http://www.naa.gov.au/recordkeeping/gov_online/agls/summary.html

• CIMI Consortium for the Computer Interchange of Museums Information http://www.cimi.org/publications.html

• DCMI Dublin Core Metadata Initiative: http://www.dublincore.org• DCMI-ES Mirror en español de la DCMI: http://es.dublincore.org • DCMES Dublin Core Metadata Element Set (ISO 15836-2003):

http://www.niso.org/international/SC4/n515.pdf• e-GMS e-Government Metadata Standard• http://www.govtalk.gov.uk/schemasstandards/metadata.asp • EAD Encoded Archival Description: http://www.loc.gov/ead • EdNA Educational Network Australia: http://www.edna.edu.au/metadata• FGDC Federal Geographic Data Committee: http://www.fgdc.gov• GEM Gateway to Educational Materials:http://www.thegateway.org/ • GILS Global Information Locator Service: http://

www.gils.net/standards.html

Sobre esquemas de metadatos...

Page 66: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

• IEEE/LOM Learning Object Metadata: http://ltsc.ieee.org/wg12 • IMS Instructional Management Systems: http://www.imsproject.org• MODS Metadata Object Description Schema: http://

www.loc.gov/standards/mods • NDLTD Networked Digital Library of Theses and Dissertations: http://

www.theses.org • NZGLS New Zealand Government Locator Service:

http://www.e-government.govt.nz/nzgls • OAI Open Archives Initiative: http://www.openarchives.org • ONIX Online Information eXchange: http://www.editeur.org/onix.html • PADI Preserving Access to Digital Information: http://www.nla.gov.au/padi• RDF Resource Description Framework: http://www.w3.org/RDF • SW Semantic Web (W3C): http://www.w3.org/2001/sw • TEI Text Encoding Initiative: http://www.tei-c.org • W3C World-Wide Web Consortium: http://www.w3.org• XML eXtensible Markup Language: http://www.w3.org/XML

Sobre esquemas de metadatos...

Page 67: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

• ADAM Art, Design, Architecture & Media Information Gateway: http://www.adam.ac.uk

• ADL Alexandria Digital Library: http://www.alexandria.ucsb.edu• ADT Australian Digital Theses Project: http://adt.caul.edu.au• AER Archivos Españoles en Red: http://aer.mcu.es/sgae/index_aer.jsp • AGNIC, Agriculture Network Information Center: http://www.agnic.org• AGRIGATE Agriculture Information Gateway for Australian Researchers:

http://www.agrigate.edu.au • ASGF Australian Subject Gateways Forum http://

www.nla.gov.au/initiatives/sg/gateways.html• AHDS, Arts and Humanities Data Service: http://ahds.ac.uk• AVEL Australian Virtual Engineering Library: http://avel.edu.au• EELS Engineering E-Library, Sweden: http://eels.lub.lu.se• EEVL Edinburgh Engineering Virtual Library: http://www.eevl.ac.uk• ELISE Electronic Library Image Service for Europe

http://nile.dmu.ac.uk/elise/e2_intro.html

Sobre sistemas de información Web...

Page 68: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

• FEDORA Flexible and Extensible Digital Object and Repository Architecture: http://www.fedora.info

• GTEL Georgia Tech Electronic Library: http://www.library.gatech.edu• LETRS Library Electronic Text Resource Service http://

www.letrs.indiana.edu• MOA The Making Of America: http://moa.umdl.umich.edu; http://

moa.cit.cornell.edu/moa/index.html; • MOA II http://sunsite.berkeley.edu/moa2• NZGP New Zealand Government Portal: http://www.govt.nz• OMNI Organising Medical Networked Information: http://omni.ac.uk• ROADS Resource Organisation And Discovery in Subject-based Services

http://www.ilrt.bris.ac.uk/roads• SOSIG Social Science Information Gateway: http://sosig.ac.uk• VADS Visual Arts Data Service: http://vads.ahds.ac.uk ; http://

vads.ahds.ac.uk/search.html

Sobre sistemas de información Web...

Page 69: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

• AAT Arts & Architecture Thesaurus: http://www.getty.edu/research/tools/vocabulary/aat

• AGIFT Australian Governments' Interactiva Functional Thesaurus http://www.naa.gov.au/recordkeeping/gov_online/agift/summary.html

• TGN Thesaurus of Geographical Names: http://www.getty.edu/research/tools/vocabulary/tgn

• ULAN: Union List of Artist Names http://www.getty.edu/research/tools/vocabulary/ulan

• Proyecto SKOS: Simple Knowledge Organisation Systems: http://www.w3.org/2001/sw/Europe/reports/thes/1.0/guide

Algunos schemes de contenido...

Page 70: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

• AHMED, Kal, et al. Professional XML Meta Data. Birmingham: Wrox Press, 2001.

• BACA, Murtha (ed.). Introducción a los Metadatos: vías a la información digital. Los Angeles: J. Paul Getty Trust, 1999

• BERNERS-LEE, Tim. Tejiendo la red: el inventor del World Wide Web nos descubre su origen. Madrid: Siglo veintiuno, 2000.

• CAPLAN, Priscilla. Metadata Fundamentals for All Librarians. Chicago: ALA, 2003.

• CATALOGING the Web: Metadata, AACR, and MARC 21. Wayne Jones, Judith R. Ahronheim, and Josephine Crawford, eds. Lanham: Scarecrow Press, 2002.

• GREENBERG, Jane (ed.). Metadata and Organizing Educational Resources on the Internet. New York, London, Oxford: The Harworth Information Press, 2000.

• DACONTA, Michael C., Leo J. Obrst, Kevin T. Smith. The Semantic Web: A Guide to the Future of XML, Web Services, and Knowledge Management. New York, etc.: Wiley Computer Publishing, John Wiley & Sons, 2003

Recursos bibliográficos

Page 71: GEMA BUENO DE LA FUENTEARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES

GEMA BUENO DE LA FUENTE ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SITIOS WEB DE BIBLIOTECAS

• HEERY, Rachel, Manjula Patel. Application profiles: mixing and matching metadata schemas. [En línea] Ariadne Issue 25, 2000. Disponible en: http://www.ariadne.ac.uk/issue25/app-profiles. [Consulta: 12/05/2005]

• HJELM, Johan. Creating the Semantic Web with RDF: Professional Developer's Guide. New York, etc.: Wiley Computer Publishing, John Wiley & Sons, 2001.

• HUDGINS, Jean, Grace Agnew, Elizabeth Brown. Getting Mileage out of Metadata: Applications for the Library. Chicago: ALA, 1999.

• MÉNDEZ RODRÍGUEZ, Eva Mª. Metadatos y recuperación de información: estándares, problemas y aplicabilidad en bibliotecas digitales. Gijón: Trea, 2002.

• TANNENBAUM, Adrienne. Metadata Solutions: Using Metamodels, Repositories, XML, and Enterprise Portals to Generate Information on Demand. Addison-Wesley, 2001.

Recursos bibliográficos