74
Dublin Core Théorie et applications Formation “Métadonnées” MEDIATIX Saint-Cloud, 16-17 sept. 2009 Catherine Morel-Pair, INIST-CNRS [email protected] partageable sous Licence Creative Commons

Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

Dublin Core

Théorie et applications Formation “Métadonnées” MEDIATIX

Saint-Cloud, 16-17 sept. 2009

Catherine Morel-Pair, INIST-CNRS

[email protected] partageable sous Licence Creative Commons

Page 2: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Introduction Les éléments Dublin Core et leur implémentation

Modules Dublin Core Formats d’écriture

Outils et applications Outils de formation … Archives ouvertes et protocole OAI-PMH ; TEF … Web sémantique et Web 2.0

Page 3: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Dublin Core Metadata InitiativeObjectif

“Pallier les insuffisances des métadonnées HTML” pour donner une sémantique au Web Métadonnées HTML insuffisamment définies et

utilisées … Par un standard généraliste pour le Web,

une “description bibliographique simplifiée” pour décrire tout type de ressource … et améliorer la “resource discovery”

Page 4: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Métadonnées (X)HTML ? Embarquées, dans l’en-tête <head> de la page

Dans le navigateur : “Affichage”, “Source” Ou : clic droit, informations sur la page Ex : http://www.loc.gov/index.html

Métadonnées descriptives du contenu<title><meta name=“keywords” ou “description”

Métadonnées sur les droits - PI<meta name=“author”, “publisher” ou “copyright”+ Fichier robots.txt + ACAP

Métadonnées techniques et de relation/structure<meta content=“text/html” charset=“UTF-8”<link rel=“stylesheet” ou “alternate”

Page 5: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Métadonnées HTML, limites Peu de documentation d’accompagnement :

DTD seule HTML est un format d’affichage pour le Web

Peu de structuration logique du document, et de description Décrit des pages HTML … seulement “Détournement” de métadonnées …

Utilisation insuffisante par les producteurs de sites … et par les moteurs

“Alternatives” Développement du Dublin Core Autres métadonnées HTML spécifiques Structuration accrue des pages “référencement naturel”

Page 6: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Dublin Core Metadata Initiative

Atelier à Dublin (Ohio) en 1995 (“OCLC/NCSA Metadata Workshop”) DCMI, Dublin Core Metadata Initiative Devenu une “fondation”

Normalisation internationale ISO 15836-2003, http://www.niso.org/standards/resources/Z39-85.pdf

Groupes de travail thématiques évolutifs, workshop annuel

http://www.dublincore.org acteurs et activités documentation et recommandations logiciels et outils …

Page 7: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

I - Dublin Core, modules DC simple

15 éléments caractérisés par 10 propriétés Norme ISO 15836-2003, RFC 5013, ANSI-NISO 39.85

DC qualifié + “qualificatifs” (DCTERMS, “refinements, qualifiers, extensions”)

caractérisés DC étendu :

+ éléments issus d’autres standards (Learning Object Metadata, IEEE-LOM)

+ éléments récents : gestion de collections …

“Encoding schemes”, standardisation des valeurs des éléments : ressources reconnues

Page 8: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Dublin Core, des éléments bien définis

Chacun des 15/16 éléments est défini par 10 propriétés (norme ISO/IEC 11179 - registres de métadonnées) Name (identifiant invariable) et Label(traductions

possibles) Définition et Commentaire Version (1.1 actuelle) Autorité de gestion (DCMI) Langue de l’identifiant (anglais) Obligation et Occurrence de l’élément

tous sont facultatifs et répétables Type de son contenu (tous = texte)Voir en Français :http://www-rocq.inria.fr/~vercoust/METADATA/DC-fr.1.1.html

5 propriétés pour chaque qualificatif

Page 9: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Dublin Core simple, les 15 éléments

Descriptifs du contenu Title, Description, Subject, Coverage Type, Language Relation

Description des droits Creator, Contributor, Publisher Rights Source

Techniques - structure Date, Format, Identifier Relation

un exemple en HTML www.inist.fr

Page 10: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

DC simple, éléments1 - description du contenu

Title : nom donné à la ressource Exemple : titre d’un article, nom d’une œuvre d’art …

Description : description du contenu de la ressource Exemple : résumé, table des matières, texte libre

Subject : sujet du contenu de la ressource Mots-clés, classification Recommandation : issus d’une “source reconnue”

Coverage : portée ou couverture spatio-temporelle de la ressource Période de temps ; entité ou position géographique ; juridiction

administrative Recommandation

Vocabulaire contrôlé (ex : TGN) Modèles de valeurs si numériques (DCMI Box, Point, Period) …)

Exemple : couverture d’une base de données

Page 11: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

DC simple, éléments1 - description du contenu

Relation : référence à une autre ressource qui a un rapport avec la ressource décrite (rapport logique, ici ) R. : système formel d’identification (ex. URL, DOI …)

Type : nature ou genre du contenu Décrit des catégories, fonctions ou genres généraux du contenu R. : vocabulaire contrôlé, exemple : vocabulaire DCMItype

12 valeurs : Text, Event, Dataset, Service, Moving image … NB : autres vocabulaires, ex. CRGI (Canada)

Language : langue du contenu intellectuel de la ressource Valeurs conformes à RFC 3066

code langue à 2 ou 3 caractères (normes ISO 639) éventuellement suivi d'un code à deux lettres pour le pays (norme ISO

3166)

Page 12: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

DC simple, éléments2 - description des droits

Creator : entité principale responsable de la création du contenu de la ressource … auteur, compositeur … Personne, collectivité ou service

Contributor : entité qui a contribué à la création du contenu de la ressource ; personne, collectivité ou service

Publisher : entité responsable de la diffusion de la ressource dans sa forme actuelle, Personne, collectivité ou service : département universitaire,

entreprise … Source : référence à une ressource dont la ressource actuelle

dérive en totalité ou en partie ex : BD statistiques rapport Recom. : système formel d’identification

Rights : droits sur la ressource Propriété intellectuelle, droits à gérer cette ressource, droits d’usage

Page 13: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

DC simple, éléments3 – description technique

Date : une date associée avec un événement dans le cycle de vie de la ressource Exemple : date de création, modification, publication R. : norme ISO 8601 (W3CDTF), AAAA-MM-JJ

Identifier : référence non ambiguë à la ressource dans un contexte donné R : système formel d’identifiants uniques (URI)

dont URL, DOI, ISSN …

Format : décrit la matérialisation physique ou digitale de la ressource Support, média, dimensions (taille, durée …)

Éventuellement, logiciel ou matériel indispensable R : vocabulaire contrôlé de type MIME

Relation … dans ses aspects techniques - structure

Page 14: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Dublin Core étendu : des éléments complémentaires

audience

instructional method

Groupe de personnes à qui le document est destiné.

Méthode d’apprentissage

provenanceChangements signifiants pour authenticité, intégrité, interprétation depuis création : propriétaire, dépôt …

accrualMediumaccrualPeriodicityaccrualPolicy

(évolution collections)Méthode d’ajouts de nouveaux itemsFréquence des ajoutsPolitique d’accroissement

Page 15: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

DC qualifié : plus de précision

Exemples

TitleNom donné à la ressource, titre du document

alternative : autre titre (traduit, abrégé …)

Subject

Mots-clés, codes de classement, sujet.Utilisation de vocabulaires ou classifications contrôlés recommandée (LCC, UDC,DDC LCSH, Mesh)

DescriptionDescription du document, résumé, table des matières, texte libre

abstracttableOfContents

Page 16: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

DC qualifié, exemples élément “relation”

Relation

Lien vers une ressource liée.Il est recommandé d'utiliser une dénomination formelle des ressources (URI)

Qualificatifs

isFormatOf / hasFormatisVersionOf / hasVersionisReplacedBy / replacesisPartOf / hasPartisReferencedBy / referencesisRequiredBy / requiresconformsTo

Page 17: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

DC qualifié, exempleélément “date”

Date Date d'un évènement dans le cycle de vie du document. Recommandation : format W3CDTF (AAAA-MM-JJ), norme ISO et Period (DCMI).

Qualificatifs created : date de créationvalid : date ou période de validitéavailable : date/période de mise à dispositionissued : date de publicationmodified : date de modificationdateAccepted : date d'acceptation (thèse, article…)dateCopyrighted : date du copyright dateSubmitted : date de soumission (article...)

Page 18: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Les schémas d’encodage “sémantiques” et “syntaxiques”

Pour l’homogénéisation et la non-ambiguïté du contenu des éléments Valeurs basée sur des ressources reconnues

Thésaurus, classements et ontologies… DC : LCSH, MESH, LCC, DDC, TGN, DCMItype

Listes d’autorité personnes ou organismes Codes ISO, RFC …

DC : codes langues et pays Modèles de valeurs attendues

Ex : structure d’un ISSN, d’une date + DC : zone géographique, périodes de temps …

Identifiants uniques des ressources : URI

Page 19: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Dublin Core, intérêt et limites

Consensus international et interprofessionnel Sémantique “commune” interdisciplinaire ; “multilinguisme” Simplicité – 2 niveaux d’usage Extensibilité et flexibilité Normalisation ET évolutivité

largement adopté aujourd’hui

Description généraliste pour la recherche d’informations Ressource plutôt électronique et isolée Métadonnées techniques et administratives limitées Architecture peu contraignante

… en association avec d’autres éléments

Page 20: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Dublin Core, plus d’info … Métadonnées et Dublin Core, OpenWeb group

http://www.openweb.eu.org/articles/dublin_core/… tous les éléments, qualificatifs, schémas d’encodage

Liste de discussion francophone Dublin Core http://listserv.inist.fr/wwsympa.fcgi/info/dcmi-fr

Site officiel DCMI, http://dublincore.org Guide d’usage “Using Dublin Core” ,

http://dublincore.org/documents/usageguide/ Généralités - Syntaxes – liens vers documents spécifiques

Bonnes traductions de documents du DCMI http://www.yoyodesign.org/doc/dcmi/

Page 21: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

TP: éléments Dublin Core Objectif : découvrir les éléments Dublin Core

en décrivant une ressource Ouvrir crozat_notice.htm avec un navigateur

= notice de thèse en HTML contenant les informations à récupérer

Ouvrir crozat_DC.xls et renseigner la “notice” Dublin Core simple ou qualifié Tous les éléments sont facultatifs et répétables Préciser la valeur avec un “attribut” ???

Disponibles : langue … type (DC qualifié slt) Conclusions

Page 22: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

II - Dublin Core, syntaxes d’écriture

Pages HTML, XHTML : métadonnées dans la ressource<meta name=“dc.creator” content=“Dupond Marc”>Un exemple : site INIST

Fichier XML : métadonnées dans un autre fichier En RDF : les 2 possibilités

Flexibilité : éléments et qualificatifs facultatifs et répétables, formats divers

Extensivité : association possible avec des métadonnées d’autres origines

NB : “modèle abstrait” 2008 évolutions en cours

Page 23: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

1 - Dublin Core, HTML et Internet Non pris en compte

par les “grands” moteurs !

Espoirs … Moteurs spécialisés Sites professionnels +++ Logiciels Web2 (Zotero …) Intérêt des webmasters

« la question que doivent se poser les webmestres à cet instant est : les « grands » moteurs de recherche comprennent-ils le Dublin Core ? Non. La question qui suit, logiquement est : et donc, par rapport aux meta-tags classiques, que m'apporte leDublin Core ? Rien. »

« Mais l’ensemble des dysfonctionnements d’Internet réside surtout dans l’absence de structuration et de classement des données présentes sur le réseau, ce qui empêche le repérage de l’information et l’accès au document. Pourtant, l'utilisation de données sur les données - les Métadonnées - a été prévu par les concepteurs du Web »

« cependant, il est deux choses à rendre en compte : - le Dublin Core est un standard et plus ce standard

sera accepté, plus il sera employé, et par les webmestres et par les moteurs de recherche,

- dans le cas de sites intranet, il existe des outils qui prennent en compte les balises Dublin Core. Si les balises sont bien renseignées, ces outils sont d'une redoutable efficacité ! »« C’est ainsi que deux mondes distincts – celui de l’Internet et celui de la bibliothéconomie – se sont rencontrés et ont travaillé ensemble à l’amélioration de la technique des métadonnées. L’initiative du Dublin Core est une bonne illustration de cette collaboration »

Page 24: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

2 – DC en XMLXML et métadonnées …

XML est le format d’implémentation de

beaucoup de jeux de métadonnées

RDF et RSS sont des schémas XML

particuliers

Méta-formatsMETS …

ImagesXMPMIX

Domaines FGDC, LOM,

Métiers MARC-XML, MODS

EAD-EACONIX

Applis DC

PREMIS

Page 25: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Fichier Dublin Core en XML Déclaration des “espaces de nom”

<metadata […] xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms=http://purl.org/dc/terms/ …>( fait par l‘éditeur XML)

Dublin Core simple

<dc:language>fr</dc:language> <dc:subject>Recherche d’information</dc:subject>

Dublin Core qualifié<dcterms:available>2002-06</dcterms:available><dctems:alternative xml:lang=“eng”>Numeric… …</dcterms:alternative> Plus “pro” : plus d’attributs et de valeurs contrôlées

Page 26: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Dublin Core simple en XML

<metadata> <oai_dc:dc xmlns:oai_dc=http://www.openarchives.org/OAI/2.0/oai_dc/ xmlns:dc="http://purl.org/dc/elements/1.1/" …> <dc:title>Recherche d’information dans …</dc:title> <dc:creator>Chartron, Ghislaine </dc:creator> <dc:description>Dans une …</dc:description> <dc:language>fr</dc:language> <dc:subject> nformation retrieval</dc:subject> <dc:subject>Electronic publishing</dc:subject> <dc:date>2002-03-25</dc:date> <dc:identifier> http://archivesic.ccsd.cnrs.fr/sic_00000025.en.html

</dc:identifier> <dc:type>Text</dc:type> </oai_dc:dc> </metadata>

Page 27: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Dublin Core qualifié en XML[espaces de nom …]<dc:title>UKOLN</dc:title><dcterms:alternative>UK Office for Library and Information

Networking</dcterms:alternative><dc:subject xml:lang=“en”>national centre, network information

support, library,community, […]</dc:subject> <dc:subject xsi:type="dcterms:DDC">062</dc:subject><dc:subject xsi:type="dcterms:UDC">061(410)</dc:subject><dcterms:isPartOf xsi:type="dcterms:URI">

http://www.bath.ac.uk</dcterms:isPartOf> <dc:identifier

xsi:type="dcterms:URI">http://www.ukoln.ac.uk/</dc:identifier><dcterms:modified xsi:type="dcterms:W3CDTF">2001-07-18

</dcterms:modified>

Page 28: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

III - Quelques outils d’implémentation

Voir http://dublincore.org, Tools and Software (sous Firefox) … et ailleurs … !

1 - des outils d’aide à la découverte/création Aide-mémoire DC-assist add-on Firefox d’affichage des métadonnées DC

“Firefox Dublin Core Viewer Extension”

Page 29: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Dublin Core, affichage Mozilla

Page 30: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

DC, outils 2 - Convertisseurs

Exemple : DC-Dot, Dublin Core Metadata Editor Des métadonnées (X)HTML

… vers des métadonnées DC en (X)HTML, XML, RDF Et vers d’autres jeux d’éléments : MARC, TEI …

Convertisseur + formulaire de saisie + « extracteur » TP

Entrer une URL, ex. http://www.loc.gov/index.html Regarder le résultat généré ; compléter les métadonnées

dans le formulaire, soumettre à nouveau Utilisation des métadonnées DC générées

En HTML : coller dans la page HTML Autres : “notice”pour catalogue, portail …

Page 31: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Dublin Core, outils (3)Autres

3 - Des “templates”, formulaires de saisie DC-Dot Interface des systèmes de gestion de bases de données

4 - Des “extracteurs” Besoin de structure … cf Lodel

5 - Des outils intégrés à des applications Content Management System comme MKdoc Outils OAI-PMH et archives ouvertes Plateformes éditoriales : Lodel, Dspace … … … Logiciels documentaires – fonction portail …

Page 32: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Lodel et Dublin Core Lodel : plate-forme éditoriale développée par

Revues.org Revues SHS

Présentation paramétrable Voir www.revues.org et http://lodel.demo.inist.fr

Organisation arborescente revue, année, numéro … par exemple

D’un document Word ou Open Office à la mise en ligne en format XHTML Publication document et extraction des métadonnées Contrainte : documents stylés selon le modèle Lodel

Préparation : stylage/marquage des éléments du .doc Soumission, publication

Page 33: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

D’un article publié ailleurs à la publication avec Lodel …

Page 34: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Article stylé selon le modèle Lodel

Page 35: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Lodel, soumission

Page 36: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Lodel, soumission (2)

Page 37: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Résultat

Page 38: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

L’article dans Lodel, la source du document

[en-tête : métadonnées de type HTML puis DC : ]

<meta name="DC.Format" content="text/html" /> <meta name="DC.Language" content="fr" /> <meta name="DC.Identifier" content="http://lodel.demo.inist.fr/formation/document.php?id=202" />

<meta name="DC.Title" content="Métadonnées et XML Des standards efficients de l’environnement numérique" /> <meta name="DC.Subject" content="ressources électroniques" /> [ autres DC.* …]

[Puis corps du texte]… Voir les sources d’articles de Revues.org

Page 39: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

IV - Applications …Archives ouvertes

et protocole OAI-PMH

Bibliothèques numériques(profil libraries)

eBooks : standard ePUB

Corpus Recherche (OLAC …)

Thèses Electroniques Fr

Répertoires et portails des informations

publiques

Annuaires et portails

XMP et images / pdfWeb sémantique

Applications Web 2.0

Profils d’applications

Z39.50OpenURL

Page 40: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

1 - Accès libre, archives ouvertesprotocole OAI-PMH

Un principe : le libre accès à l’information scientifique et technique Intérêt :

Accessibilité, visibilité, impact Modèle économique et social alternatif

Des pionniers, 1990-93 : ArXiv, WoPEc, ADS astrophysique, CogPrints

Conférences/conventions de Budapest, Bethesda, Berlin, Genève…: Le libre accès aux résultats de la recherche devient un postulat Différents pays et institutions adhèrent formellement à ce principe Distinctions formelles

revue libre accès / archive ouverte archive thématique / institutionnelle

Voir http://openaccess.inist.fr/

Page 41: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Archives ouvertes, protocole OAI-PMH

Extension rapide du mouvement BioMedCentral, PLoS…, serveurs du CCSD (HAL …), Plus de 2200 archives répertoriées, contenant plus de 20

millions de ressources http://gita.grainger.uiuc.edu/registry/ (1850 en 2008) http://www.opendoar.org/index.html (1200)

http://roar.eprints.org/ (940, 2008) Protocole OAI-PMH, 2001 : protocole de structuration et

d’interrogation des entrepôts de métadonnées pour l’interopérabilité HTTP, XML, Dublin Core Acteurs : data providers et service provider “verbes” de requête

Page 42: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

OAI-PMH du côté utilisateurs Recherche dans un ensemble d’archives avec des

moteurs spécialisés, “moissonneurs” http://oaister.umdl.umich.edu/o/oaister/

nov. 2005 : 477 archives, 5 277 000 enregistrementsjanvier 2008 : 14 673 000 enregistrements

http://citebase.eprints.org/cgi-bin/search (facteur d’impact”) Ordre : descending, citations

http://www.scientificcommons.org (2007: 898 archives, 16M enr.)

Auto-archivage exemple dans HAL, Hyper Articles on Line, CCSD-CNRS

http://hal.archives-ouvertes.fr

Page 43: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Résultat requête OAIster

Page 44: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

HAL, soumettre

Page 45: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

OAI-PMH

?

Fournisseur de données

Fournisseur

de services

Page 46: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

OAI-PMH, les entrepôts Contenu minimal d’un entrepôt de

métadonnées Enregistrements compatible OAI-PMH

Dublin Core – XML Dans une base de données (*SQL, ODBC …)

Autres formats moissonnables MARC-XML et MODS METS, EAD … Tout format XML de métadonnées

Page 47: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

OAI-PMH, enregistrement minimal

<record><header>identifiant, date, setSpec</header><metadata>

<oai_dc:dc xmlns:oai_dc=http://www.openarchives.org/OAI/2.0/oai_dc/ xmlns:dc="http://purl.org/dc/elements/1.1/" …>

<dc:title> Recherche d’information dans … </dc:title> <dc:creator>Chartron, Ghislaine </dc:creator>

<dc:description>Dans une …</dc:description> <dc:language>fr</dc:language> <dc:subject>Information retrieval</dc:subject> <dc:subject>Electronic publishing</dc:subject> <dc:date>2002-03-25</dc:date> <dc:identifier> http://archivesic.ccsd.cnrs.fr/sic_00000025.en.html </dc:identifier> <dc:type>Text</dc:type></oai_dc:dc> </metadata></record>

Page 48: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

De la base de donnée interne d’une application à l’entrepôt OAI-PMH

La base de données interne à l’application gère ses propres éléments Ex. application INIST I-Revues, http://irevues.inist.fr

DSpace, MIT cf revue Hermès, 2005, 42, une notice détaillée

Profil d’application Dublin Core qualifié

… et les expose dans l’entrepôt OAI-PMH Ex : l’entrepôt de I-revues, requête sur Hermès,num 42

Idem pour toutes les archives ouvertes et beaucoup de logiciels doc-bib-archivistique

Page 49: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

2 -TEF, thèses électroniques françaises

Projet ministériel de valorisation et pérennisation Circulaire, directives Visant une diffusion accrue et des échanges

Accès en ligne Signalement mutualisable dépassant le cadre des bibliothèques

AFNOR CG 46 / CN 357, métadonnées des thèses Vers une chaîne de production unique et automatisée

document électronique – métadonnées … … … Métadonnées : compatibilité OAI-PMH + richesse description

SUDOC Descriptives, version 1 2005 : DC Autres, version 2, 2006

Plateforme de saisie STAR ABES-CINES http://www.abes.fr/abes/page,428,star.html

Page 50: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Métadonnées TEF Espace de nom TEF

Un “profil d’application” Dublin Core et/puis METS Version 1 : Dublin Core qualifié + MODS et ETD-MS Version 2, mai 2006 : encapsulation METS + droits METS

Valeurs contrôlées : vocabulaires, autorités MADS…

“Les métadonnées des thèses électronique françaises, TEF”, groupe AFNOR CG46/CN357/GE5, V1 http://www.abes.fr/abes/documents/tef/recommandation/tef_01.pdf V2 http://www.abes.fr/abes/page,403,tef.html

Journée d’étude sur les thèses électroniques, 26 mars 2009, Médial, Nancy, http://www.univ-nancy2.fr/medial/docligne.html?depuis_id=1093 Diapos suivantes : Isabelle Mauger Perez - ABES

Page 51: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10

STAR

imports de données et/ou du document thèse

Ce qui rentre dans STAR

EPrints,Cyberthèses,ORI-OAI, Apogée…

2. Star : comment on s’en sert ?

formulaires web de STAR

5. Star : comment on s’en sert ?

Éviter la double saisie !

Page 52: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10

STAR

Archivage pérenne *

Signalement *

URL pérenne *

Diffusion

Entrepôts national, international…

Ce qui sort de STAR chaque établissement de soutenance *

serveur OAI

3. Star : à quoi ça sert ? * obligatoire

Page 53: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

TEF V1 … V2Un coup d’œil ?

TEF V1 Le registre

http://www.abes.fr/abes/documents/tef/recommandation/tef_01.pdf

Dans Demos/TEF, au choix Description minimale, tef_01_exemple_minimal.xml Description complète, tef_01_exemple_riche.xml Le schéma, tef_schema_01.xsl

TEF V2 http://www.abes.fr/abes/DesktopDefault.aspx?tabindex=4&tabid=403

, ‘Exemples’ (en bas)

Page 54: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

4- eBooks : ePub, OPF et métadonnées sur la publication

<package version="2.0" xmlns="http://www.idpf.org/2007/opf" unique-identifier="BookId">

<metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:opf="http://www.idpf.org/2007/opf">

<dc:title>Alice in Wonderland</dc:title><dc:language>en</dc:language><dc:identifier id="BookId" opf:scheme="ISBN">

123456789X </dc:identifier><dc:creator opf:role="aut">Lewis Carroll</dc:creator>…

</metadata>

<manifest> … </manifest> …</package>

http://www.openebook.org/2007/opf/OPF_2.0_final_spec.html

Page 55: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

5 – Logiciels documentaires et DC Dans beaucoup de logiciels aujourd’hui

Exports XML variés des éléments Exposition et moissonnage OAI-PMH via la fonction portail

Plus … Koha, SIM couches internes XML, avec Dublin Core + autres

standards … Logiciels de gestion de références bibliographiques

Endnote exporte du XML maison Zotero, Web 2

Reconnaît et importe les métadonnées DC des pages HTML (entre autres …)

Exporte du DC (entre autres …) Couche interne RDF + DC + FOAF …

Page 56: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

V - RDF Ressource Description Framework

Modèle et cadre syntaxique Pour formaliser des connaissances sur/dans des ”ressources”

très hétérogènes Objets physiques et numériques … Personnes, réseaux, lieux, événements … … Concepts

Intégrant des ensembles d’éléments divers Toute connaissance = triplet “ressource - propriété – valeur” Ecriture : graphes, n3 … – XML

Lisible par machines indépendamment du contexte

Page 57: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

le “Web sémantique”

Un Web de données interconnectées et interprétablles par les machines Echange de données et

création de connaissances “inférence”

Structuration et granularité du contenu

Des standards d’écriture et de requête universels : RDF, OWL, SPARQL

… le “Web 2.0” (accessoirement)

Relie des personnes : “tous acteurs”

Via l’utilisation d’outils simples et collaboratifs

Blogs, wikis … Bibliothèques,

photothèques partagées Réseaux sociaux Plate-formes de “widgets”

Certains : RDF, métadonnées std

RDF pour

Page 58: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

RDF, syntaxe

<rdf:RDF> <rdf:Description about="http://www.bnf.fr/index.html">

<s:Titre>BNF</s:Titre> <s:Auteur>Jean Gagnon</s:Auteur> </rdf:Description>

</rdf:RDF> Aujourd’hui : plus de 10 milliards de triplés RDF sur le Web !

Page 59: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

RDF et Dublin Core Quelques exemples …

Dublin Core a “sa place” pour décrire/structurer des ressources

… parmi d’autres standards et de nouveaux éléments …

Page 60: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

1 – métadonnées “XMP” dans un

PDF ou une image

“Fichier,

Propriétés”

Page 61: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Document pdf et XMP

“métadonnées supplémentaires, description

Page 62: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Document pdf et XMP De nombreux espaces de nom

“propriétés, avancé”

Page 63: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

XMP : du RDF extrait : partie Dublin Core

[…]<rdf:Description rdf:about=" http://...

xmlns:dc="http://purl.org/dc/elements/1.1/"><dc:format>application/pdf</dc:format><dc:title>

<rdf:Alt><rdf:li xml:lang="fr">Le texte de présentation du projet de centre de compétences</rdf:li></rdf:Alt></dc:title>

<dc:creator><rdf:Seq><rdf:li>Stéphane Pouyllau</rdf:li></rdf:Seq>

</dc:creator><dc:subject>

<rdf:Bag> <rdf:li>CNRS</rdf:li>

<rdf:li>pôle de compétences</rdf:li> […]

Export ouvert avec éditeur XML … ou pdf ouvert dans le bloc note

Page 64: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

2 - Zotero, TP Add-on Firefox de gestion de références

bibliographiques https://addons.mozilla.org/fr/firefox/

Ouvrir Firefox puis Zotero Regarder cadres et boutons …

Aller sur un site interopérable avec Zotero Revues.org un article Catalogue du Sudoc une page de résultats ou un article Article de Peccatte sur métadonnées … Flick’R …

Si oui : icône dans la barre d’URL

Page 65: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Zotero, TP (suite) Importer les métadonnées correspondantes

dans Zotero : Clic sur l’icône de Zotero dans la barre d’adresse

Intégration dans une collection Zotero Enrichissement possible

Onglets à droite Exporter des métadonnées :

Clic droit sur une collection ou une description “Créer une bibliographie” ( texte stylé) OU

exporter ( XML-RDF) Choix du format des éléments et de la localisation du

fichier : DC, Zotero …

Page 66: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

3 - Logiciel dédié recherche : myExperiment

Page 67: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

myExperiment, architecture Gestion et annotation de contenu et work-flow + réseau social

via une ontologie RDF / SPARQL, avec Dublin Core, FOAF et SIOC, OAI-ORE, Creative

Commons, URI

Page 68: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

4 - LIBRIS, catalogue collectif suédoisRDF, DC et autres …

Source : http://blog.libris.kb.se/semweb/?p=7

Page 69: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

5 - RDFa et la “valorisation sémantique des publications”

Travail de recherche : structurer un texte pour lui donner une sémantique machine

Voir et naviguer http://imageweb.zoo.ox.ac.uk/pub/2008/plospaper/latest/

Afficher la source Cet article contient des éléments sémantiques balisés, et

utilise de nombreux espaces de nom, dont DC …

L’article expliquant l’expérience : ... semantic enhancement of a research article ... Une tendance actuelle // XML

Page 70: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

6 - DC dans un moteur RDF, Sindice

Page 71: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

VI - Un dernier effort …DCMI Abstract Model

Modèlisation abstraite des entités Dublin Core et de leurs relations DCAM, 2007-2008

DC devient une ontologie, vocabulaire de termes Propriétés (= éléments et raffinements) Schémas d’encodage syntaxiques et sémantiques Classes

Avec des relations entre termes sur le modèle RDF

Et un seul espace de noms : http://purl.org/dc/terms

Page 72: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

DCAM, quelques précisions Ressources

Traductions fr : http://www.yoyodesign.org/doc/dcmi/abstract-model/index.html http://www.yoyodesign.org/doc/dcmi/dcmi-terms/index.html

Registre-outil, http://dcmi.kc.tsukuba.ac.jp/dcregistry/

Syntaxe XML :<dcds:description dcds:resourceURI="http://url_ressource_decrite <dcds:statement dcds:propertyURI="title">

<dcds:literalValueString>"le itre"</dcds:literalValueString> </dcds:statement> <dcds:statement dcds:propertyURI="creator">

<dcds:valueString> Dupond, D</dcds:valueString> </dcds:statement></dcds:description>

Page 73: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Dublin Core, conclusion Un jeu d’éléments généraliste

Pour décrire tous types/formats de ressources De façon simple ou plus complète Orienté description du contenu intellectuel

Contexte Web Norme et standard - Flexibilité et évolutivité Documentation abondante

De plus en plus d’applications Intégré dans des protocoles d’échange de (méta)données Profils d’application spécifiques adaptés Une place dans le Web sémantique, dans le Web 2

Des outils d’implémentation “Basiques” Développés dans le cadre d’applications

Page 74: Dublin Core - Paris Nanterre University€¦ · - le Dublin Core est un standard et plus ce standard sera accepté, plus il sera employé, et par les webmestres et par les moteurs

20/10/10 C. Morel-Pair

Merci de votre attention !

Pour toute question ultérieure :

[email protected]