Bibliothèques numériquesLes réservoirs de textes numériques
2ème partie
Alain JacquessonBibliothèque publique et
universitaireVille de Genève
Avril 2001Vers 1.01
Réservoirs / Jacquesson / Avril 2001
2
EDT – Electronic Thesis and Dissertations (Univ. of Virginia)
Thèses et travaux de diplôme Accès en ligne et déchargement Restrictions d‘accès et déchargement pour
certains textes Directives précises données aux étudiants et
aux chercheurs Fourniture d‘une DTD générique pour
l‘Université
Réservoirs / Jacquesson / Avril 2001
4
OTAOxford Text Archives (UK)
Fondées en 1976 par Lou Burnand 2‘000 textes grecs, latins, anglais et 12 autres
langues Textes libres et payants Respectent la norme TEI, mais livrables en
Ascii simple Programmes de manipulation de textes
Réservoirs / Jacquesson / Avril 2001
7
Bibliothèque universelle de l‘Université de Carnegie Mellon
Amorcer un mouvement qui rendrait disponible sur Internet les grandes oeuvres de l‘humanité
Tout type de déchargement possible :– Ascii, RTF, PostScript, HTML, images GIF
A obtenu les droits sur des oeuvres récentes Tous les domaines du savoir http://www.ulib.org/first.htm
Réservoirs / Jacquesson / Avril 2001
9
CETH – Center for electronic Texts in the Humanities
Dès 1991 entre Princeton et Rudgers
Cours pour promouvoir l‘encadage de textes
en sciences humaines
SGML et TEI
Pour débutants et chercheurs avancés
http://www.ceth.rutgers.edu/
Réservoirs / Jacquesson / Avril 2001
11
ARTFL – American and French Research on the Treasury of the French Language
Université de Chicago, en collaboration avec l‘InaLF à Nancy (CNRS)
Plus de 2‘000 textes disponibles, mais payants Fonds ayant servi à l‘élaboration du „Trésor de
la langue française“ Logiciel „PhiloLogic“ http://humanities.uchicago.edu/ARTFL/
Réservoirs / Jacquesson / Avril 2001
13
CETL – Center for Electronic Texts in Law
Bibliothèque de droit de Cincinnati (1993) Deux bases principales :
– Droit humanitaires– Commerce
Lois et textes associés SGML et TEI, mais RTF pour les étudiants http://www.law.uc.edu/CETL/
Réservoirs / Jacquesson / Avril 2001
15
Frantext
Conçu à l‘INaLF de Nancy 3‘400 oeuvres d‘abord destinées à la
conception de dictionnaires „Trésor de la langue française“, 16 volumes Le réservoir n‘est donc qu‘un sous-produit Sur abonnement http://www.inalf.cnrs.fr/
Réservoirs / Jacquesson / Avril 2001
17
Gallica – Bibliothèque nationale de France
Volet numérique de la BNF Environ 80‘000 textes En mode „image“ pour l‘essentiel En mode „texte“ pour une partie (Chargement
de Frantext) Faisant partie du domaine public
– Gros problèmes avec les droits d‘auteur Egalement collection d‘images
Réservoirs / Jacquesson / Avril 2001
18
Gallica - Collaborations
Bibliothèques en sciences– Musée de l‘homme, Muséum d‘histoire naturelle– Orsay, Polytechnique
INaLF– Frantext
Bibliopolis– Secteur privé : textes classiques ‚érudition– Patrologie latine
Réservoirs / Jacquesson / Avril 2001
22
La Bibliothèque électronique de Lisieux (Ouverte en 1996)
BM de Lisieux (grand comme Nyon) Plusieurs rayons vituels (450 titres au total) :
– Théophile Gautier, Charles Nodier, etc.– Rayon documentaire : textes des XVIII et XIXe – Fonds local
Collaborare avec des lycées Saisie par des bénévoles Réalisation de très grande qualité http://www.bmlisieux.com/
25 Réservoirs / Jacquesson / Avril 2001
Réservoirs / Jacquesson / Avril 2001
26
Lisieux
Montre ce que l‘on peut faire d‘intelligent en
lecture publique
Ne cherche pas à imiter les grands sites
universitaires ou nationaux
D‘abord des idées...
... ensuite l‘argent et la technique
Réservoirs / Jacquesson / Avril 2001
27
Développement des réservoirs de textes (1)
La liste présentée n‘est de loin pas exhaustive Il y en a dans tous les pays Il y en a dans toutes les langues ... y compris les langues mortes Il y a des sites spécialisés, consacrés à un
auteur, à une période, à un seul texte Pas (encore) de catalogues collectifs, malgré
des liens nombreux et bien utiles
Réservoirs / Jacquesson / Avril 2001
28
Développement des réservoirs de textes (2)
Les outils de recherche fonctionnnent mal...– Sur Yahoo, les sites „Voltaire“ les plus nombreux
sont des hôtels !!!
Les catalogues collectifs spécifiques sont à créer
La recherche de textes numérisés est une recherche documentaire difficile
Réservoirs / Jacquesson / Avril 2001
29
Avertissement !!!
Cette présentation n‘aborde pas toutes les catagories des textes numériques
On a volontairement écartés – L‘auto-édition– Les prétirages (preprints)– Les articles scientifiques et les serveurs d‘institution
qui constituent des problématiques spécifiques
Réservoirs / Jacquesson / Avril 2001
30
Conclusions (1)
Les réservoirs de textes électroniques touchent
d‘abord les sciences humaines
Ils concernent d‘abord les textes anciens
Ils n‘ont pas été créés dans les bibliothèques
Elles ne commencent que seulement à en
prendre conscience.
Réservoirs / Jacquesson / Avril 2001
31
Conclusions (2)
Une solution parfaite pour distribuer des textes anciens, mal réédités
Les solutions les plus avancées offriront le texte et l‘image
Les textes électroniques vont nécessiter de nouveaux outils de traitement pas encore connus des bibliothécaires :– Analyse linguistique, statistique, annotation, etc.
Réservoirs / Jacquesson / Avril 2001
32
Conclusions (3)
Les réservoirs de textes électroniques sont
actuellement totalement occultés par la
focalisation des chercheurs et des
bibliothécaires sur les périodiques
électroniques
C‘est certainemment le prochain grand
développement des bibliothèques numériques