45
Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau ([email protected] ) Grainger Engineering Library University of Illinois at Urbana-Champaign Novembre 2005 – Grenoble

Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau ([email protected])[email protected]

Embed Size (px)

Citation preview

Page 1: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Environnements numériques de travail

Portails, bibliothèques numériques et intégration de ressources

documentaires

Muriel Foulonneau ([email protected])

Grainger Engineering LibraryUniversity of Illinois at Urbana-Champaign

Novembre 2005 – Grenoble

Page 2: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 2

Portails de ressources distribuées et bibliothèques

numériques

Page 3: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 3

Des réseaux

Des collections hétérogènes Fonds de bibliothèques, d’archives, de musées, bases

d’articles L’organisation de l’information, l’accès, le contexte,

les services

Les architectures distribuées Des réseaux d’établissements régionaux ou

professionnels Aux réseaux thématiques hétérogènes

Granularité et contextualisation de l’information

Page 4: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 4

Valorisation des sources documentaires

La National Science Digital Library Création des sources documentaires ou valorisation de

bases existantes dans un portail national American Memory

Valorisation de collections d’Americanas IMLS digital collections

Les fonds numérisés avec le financement de l’IMLS UCAI - Union Catalog of Art Images

Des bases de pré-publications et archives institutionnelles

Page 5: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 5

Des collaborations régionales

Colorado Digitization Project California digital library American South CIC metadata portal

Ressources hétérogènes, y compris fonds d’archives

Page 6: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 6

Problématiques documentaires

L’interopérabilité technique Les formats de métadonnées La gestion des processus d’agrégation, de

diffusion et d’archivage Une politique de développement de collections

agrégées Comment inciter les producteurs à participer Quels services?

Page 7: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 7

Fonctions

Retrouver, Identifier, Obtenir, Sélectionner, Grouper, Interpréter

Sélectionner / Interpréter

Grouper

Obtenir

Page 8: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 8

Interopérabilité technique

De VEL au CIC metadata portal Le protocole OAI - PMH

Page 9: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 9

Partage de métadonnées – la fédération

L’utilisateur lance une recherche sur “moulin”, quelle que soit la base

moulin?

<title>My resource</title><date>04

<title>My resource</title><date>04

<title>My resource</title><date>04

Ex. Z39.50, SRU/SRW

Page 10: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 10

L’agrégation de métadonnées

Divise le monde entre fournisseurs de données et fournisseurs de services

Modèle asynchrone

Moteurs de recherche, catalogues collectifs, OAI

<title>My resource</title><date>04

Page 11: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 11

Niveaux d’interopérabilité

<title>My resource</title><date>04

<title>My resource</title><date>04

<title>My resource</title><date>04

Protocole:les ordinateurs se parlent

Organisation:Les sources de données

Documentaire:Les contenus sont présentés de manière cohérente

Page 12: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 12

Encourager les établissements à partager

Conclusions des expérimentations de la Fondation Mellon

Le partage des données n’est pas une priorité – peut suivre le rythme de renouvellement des infrastructures

La partie technique est légère mais nécessite des compétences

Le rôle décisif de projets collaboratifs avec la formation de centres de compétences

Progression continue du nombre d’entrepôts Les solutions clef – en – main se sont multipliées Les logiciels ePrints et archives institutionnelles ont un

accès OAI activé par défaut

Page 13: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 13

Amélioration de la qualité

La qualité des entrepôts La qualité des données La qualité des services

La certification qualité des entrepôts de publications électroniques

DINI - Deutsche Initiative für Netzwerkinformation

Les meilleures pratiques OAI et métadonnées « partageables » de la Digital Library Federation et la National Science Digital Library

Page 14: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 14

Les meilleures pratiques OAI et métadonnées

« partageables »

Page 15: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 15

L’initiative DLF / NSDL

Sur la base de projets existantsMetascholar, American South, American West,

California Digital Library, CIC metadata portal, IMLS registry of digital collections, OAIster …

Et de fournisseurs de données importantsIndiana University, Bibliothèque du Congrès, Université

du Michigan …

Et de créateurs de modulesDSpace, OAICat

Page 16: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 16

Juillet 2004 – Oakland

Des problématiques documentaires

Des implémentations techniques

Des questions politiques

Page 17: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 17

Les principales problématiques

Dialogue fournisseurs de données - fournisseurs de services

Repenser les métadonnées pour qu’elles soient utiles aux fournisseurs de services

Formats Encodage Contexte

Les caractéristiques techniques des implémentations 10% des fournisseurs de données ont des problèmes de

compatibilité XML

Plus de services – les obligations des fournisseurs de services

Page 18: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 18

Les formats

DC, QDC, ETDMS, MODS, MARC, EAD, CCO-Light?

Contraintes de schémas XML

Expérimentation avec des contenus MPEG21, METS

Page 19: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 19

Localisation d’une ressource

Problème de la contextualisation / interprétation des ressources

Qu’est-ce qu’un service (ex Thumbgrabber) ou un moteur doit indexer?

Page 20: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 20

Problématiques de granularité

Quel est le bon niveau de granularité pour rechercher et représenter des ressources?

Service généraliste / spécialisé

Le cas des documents EAD

Qu’est-ce qu’un site Internet? La collection Charles Cushman

Qu’est-ce qu’un doublon? Doublon pour une fonction

Page 21: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 21

Contexte de l’information

« avec son chien Flip », « sur un cheval »

Page 22: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 22

Les implémentations

½ développements spécifiques

½ modules et systèmes clef en main OAICat, VTOAI, DLESE, CWIS, ContentDM

[étude menée avec la NSDL]

http://nsdl.comm.nsdl.org/meeting/session_docs/2004/2620_National_Science_Digital_Library_Conference.doc

et http://oai-best.comm.nsdl.org/

Page 23: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 23

Utilisation de paramètres optionnels

OAI ensembles OAI<50%

entre 1 et 175

Plusieurs formats de métadonnées

>50%15 schémas différents, 6 non standards

Resumption token (envoi par tranches) et nombre d’enregistrements 85%

Gestion des enregistrements supprimés

20% persistent, 20% transient

Granularité de la date des enregistrements 25% à la secondeDescription des ensembles OAI : 14% dans l’annuaire

UIUC des entrepôts

Page 24: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 24

Besoins identifiés

Favoriser le dialogue entre fournisseurs de données et fournisseurs de services

Définir des bonnes pratiques Des métadonnées partageables Des implémentations techniques

Page 25: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 25

Plus de besoins identifiés

Partager des outils Annuaire de collections et services Référentiel sur les applications existantes de

fournisseurs de données Outils de normalisation Outils de transformation de données Annuaire de schémas

Influencer les implémentations clef-en-main Rencontre avec des éditeurs de logiciels

Page 26: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 26

Des métadonnées « partageables »

Des critères de qualité La représentation des ressources Des formats multiples La granularité des descriptions La logique de transformation des données L’encodage d’informations (titre, dates …) Des schémas XML

http://oai-best.comm.nsdl.org/cgi-bin/wiki.pl?PublicTOC

Page 27: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 27

Guide des implémentations

Le cycle de vie d’un entrepôt Validation, enregistrement

Les identifiants

Description des entrepôts

Ensembles OAI

http://oai-best.comm.nsdl.org/cgi-bin/wiki.pl?DataProviderPractices

Page 28: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 28

DLF-Aquifer

Les établissements DLF … et agrégateurs régionaux?

Collections Annuaire de collections, Profil MODS, URLs multiples –

METS?, Agrégation de métadonnées Services

Annuaire de services, Classification automatique, Normalisation, Mapping, Génération de métadonnées, Terminologies ?

Page 29: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 29

Aquifer suite

Réseau de portails et de services Annuaires de collections et de services Agrégation avec accès multiples Données patrimoniales – facettes

Politique de développement de collections numériques

Americanas – construction collective d’une collection avec une « masse critique »

Réutilisation des ressources Notamment dans des environnements numériques

plus larges

Page 30: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 30

Des outils

Annuaire de collections IMLS, Aquifer, Michael, Cornucopia, Catalogue des

fonds numérisés du ministère de la culture français, Enrich UK, …. Australie, Canada

Annuaire de services OKHAM, annuaires de services JISC pour machines

et humains

Page 31: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 31

Annuaire de services

http://gita.grainger.uiuc.edu/registry/

Page 32: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 32

Annuaire de collections

Registry of digital collections [IMLS registry]

http://imlsdcc.grainger.uiuc.edu/collections/index.htm

Page 33: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 33

Coexistence de différents services

Plein texte

Métadonnées

Desc. collections

Métadonnées et ressources

Métadonnées

Métadonnées et ressources

Page 34: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 34

L’agrégation de contenus

en pratique

Page 35: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 35

L’évolution des sources de données

0 1 2 3 4 5 6 7 8

1

Increa

se m

ode

Number of repositories

By collection + regular increase

By collection only

Regular increase

No change

Dead

Page 36: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 36

Processus: 3 flux

moisson

archivage

switch

normalisation

Base SQL

Reconstruction tables et index

Organis.

fichiers

Etablissement / entrepôtEtablissement / type

Etablissement/ collectionRessources numériques

Deconstruction index DLXS

Page 37: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 37

1 flux supplémentaire pour les collections

Moisson de descriptions sets

Collections.xml

Enregistrements MARC

Bases items

enrichissement

DC Coll.

Génère des vignettes

fusion

DLXS

Base SQL

Page 38: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 38

Normalisation des données

Concept % enregistrements CIC

Type 99%

Format 66%

Language 60%

Collection 100%

Resource URL 72%

Date : 71% Localisation : 21%

Page 39: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 39

Problématiques de qualité des métadonnées

Exhaustivité de l’information Contexte

Accessibilité Audience?

Humain, moteur de recherche, application

DC:Type = Identification photographsDC:Type = StillImageDC:Type = Image

Page 40: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 40

Service d’agrégation de données

Métas enrichies

Moissons

InterfaceSRU

Interface OAI

InterfaceWeb

Services de méta-recherche

Services OAI

Utilisateurs

Agrégation Transformation Partage Public

interface RSS

Services

Page 41: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 41

Le réseau du CIC

3 nouveaux membres 4 nouveaux entrepôts OAI Des vignettes Analyse des métadonnées Plus de formats de métadonnées Des descriptions d’ensembles OAI et de collections Participation aux meilleures pratiques DLF-NSDL

Assister les établissements, Etudier les solutions Montrer l’impact d’une modification

Page 42: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 42

Le blues du catalogueur

L’XML

L’XML souvent me prend comme une merVers ma pâle étoile,

Sous des nuages d’octets ou dans un vaste éther,Je mets à la voile;

La souris en main et les poumons gonflésComme de la toile

J'escalade le mont des metadonnéesQue l’écran me dévoile;

Je sens vibrer en moi toutes les passionsD'un catalogueur qui souffre;

Les DTDs, MARC et ses conversionsSur l'interopérable gouffre

Me bercent. D'autres fois, non validé, grand miroirDe mon désespoir !

Jeff Edmunds

Page 43: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 43

Le fournisseur de service

Un processus [semi] automatisé Moisson de descriptions d’ensembles OAI La gestion des enregistrements supprimés Les métadonnées et les ressources Les métadonnées et les descriptions de

collections Différents essais de présentation

Page 44: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 44

Quelques orientations

Contenus Différents types de données

Créées par différents acteurs, formats multiples, enrichis

Plein texte - Ex. ePrints Différents niveaux de granularité

Services Classification automatique et génération de métadonnées Service d’agrégation de métadonnées et / ou réseaux

pour orienter et faciliter le partage de données Organisation personnelle de l’information

Réseaux Annuaires de fonds et de services

Page 45: Environnements numériques de travail Portails, bibliothèques numériques et intégration de ressources documentaires Muriel Foulonneau (mfoulonn@uiuc.edu)mfoulonn@uiuc.edu

Novembre 2005

[email protected] of Illinois at UC 45

Références

Les meilleures pratiques OAI et métadonnées partageables DLF/NSDL http://oai-best.comm.nsdl.org/cgi-bin/wiki.pl?PublicTOC

ECDL 2005 - Vienna: Strategies for reprocessing aggregated metadata

JCDL 2005 – Denver : Using Collection Descriptions to Enhance an Aggregation of Harvested Item-Level Metadata

CIC metadata portal http://cicharvest.grainger.uiuc.edu/

Christine Aubry et Joanna Janik, Les Archives Ouvertes : enjeux et pratiques, ed. ADBS, 2005