27
COMME UN KALÉIDOSCOPE… Construire l’édition électronique du second volume de Bouvard et Pécuchet de Flaubert L’édition critique, de l’imprimé au numérique : François Mauriac et les autres… 24 e colloque international François Mauriac - Université d’Exeter, Grande-Bretagne, 2-4 Emmanuelle Morlock-Gerstenkorn (CNRS – Service d’ingénierie documentaire de l’ISH – UMS 1798) Stéphanie Dord-Crouslé (CNRS – Laboratoire LIRE – UMR 5611)

2010 09 06_construire-edition-electronqiue-vol-2-bouvard-et-pecuchet-colloque-mauriac-exeter

Embed Size (px)

Citation preview

COMME UN KALÉIDOSCOPE…

Construire l’édition électronique du second volume de Bouvard et Pécuchet de Flaubert

L’édition critique, de l’imprimé au numérique : François Mauriac et les autres…

24e colloque international François Mauriac - Université d’Exeter, Grande-Bretagne, 2-4 septembre 2010

Emmanuelle Morlock-Gerstenkorn (CNRS – Service d’ingénierie documentaire de l’ISH – UMS 1798)

Stéphanie Dord-Crouslé (CNRS – Laboratoire LIRE – UMR 5611)

Le projet Bouvard

C’est un projet de recherche porté par Stéphanie Dord-Crouslé, chercheur au LIRE (UMR 5611).

Lancé en juin 2005, le projet a obtenu un financement de l’ANR (2008-2001) au titre de l'appel à projets « Corpus » 2007. La participation du service d’ingénierie documentaire de l’ISH au projet s’inscrit dans ce cadre :• Accompagnement à la gestion de projet

• Veille technologique et expertise TEI

• Coordination technique (Raphaël Tournoy)

Plan

1. Une édition nécessairement électronique

2. Contraintes et apports de l’encodage

3. L’enjeu interface

UNE ÉDITION NÉCESSAIREMENT ÉLECTRONIQUE

Un véritable « chantier documentaire »…Le manuscrit conservé à la bibliothèque municipale de Rouen :• 8 gros recueils de documents divers

• 2 recueils pour le Dictionnaire des idées reçues)

Caractéristiques :• taille imposante (2300 feuillets)

• hétérogénéité matérielle et typologique

• classement patrimonial sujet à caution

…pour lequel le support électronique est seul adapté• Navigation multicritères dans les 10 volumes : • patrimoniale (volume, dossier, cote)

• par type

• par date

• par scripteur

• Accès direct à toutes les pages

• Mise en regard du fac-simile image et de la transcription

• Moteur de recherche

• Liens directs vers les ouvrages cités disponibles en ligne

• Etc.

Le site de travailhttp://dossiers-flaubert.ish-lyon.cnrs.fr/

Un second volume au périmètre et à l’organisation flousUn « texte » composé de fragments –citations et extraits d’œuvres - dont les unités sont le plus souvent impossibles à identifier et à classer avec certitude…

« Ces notes, dans son projet, devaient être reliées, soudées ensemble, par des morceaux de récit qui remettaient en scène les deux commis, et par des morceaux de dialogues, formant les commentaires de leurs lectures et de leurs copies. Ces parties, je ne puis me permettre de les faire, et, sans elles, le livre est illisible : il ne forme plus qu'une agglomération, qu'un amas de citations sans ordre, dont le sens même échappera très souvent au lecteur. »

Maupassant - lettre du 30 juillet 1881 à la nièce de Flaubert

roc oc o

Sty le médica l

da nge rs du c hoc o la t .

http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_7_f_014__r____http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_3_f_128__r____

Un processus de composition complexe

A partir de l’analyse matérielle et typologique du corpus, un classement se dessine :

Notes de lecture (NL) Notes de lectures annotées de marques de

sélection (NLM) Listes récapitulatives de recopiages ou

« todo lists » (PR) Les pages préparées par Laporte (PP1)

pour le 2nd volume Les montages de morceaux de PP1 réalisés

par Flaubert et annotés de marques de sélection (PP2)

Les pages de la main de Flaubert préparées pour le 2nd volume, pendant la

collaboration et après la brouille (PP3)

Mais ce n’est pas une chronologie ni un processus complet : les PP n’ont pas vocation à passer par ces 3 stades ! 2nd volume achevé = PP1+ PP2 + PP3

http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_7_f_012__r____http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_6_f_192__r____http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_3_f_134__r____

CONTRAINTES ET APPORTS DE L’ENCOCAGE

Structuration du corpus et numérisation du texte : choix de la TEILa Text Encoding Initiative est un consortium international d’universitaires qui développe un standard d’encodage depuis le début des années 90 :

les « Guidelines »

= cadre de description très générique pour l’encodage structuré de textes de natures variées, en vue de leur échange et de leur exploitation.

Le format TEI est choisi pour le projet Bouvard suite à une « étude de faisabilité », menée dans le cadre du stage de fin d’étude d’un master 2 professionnel.

Des contraintes fortes

Un balisage descriptif privilégiant la « logique » textuelle (sur sa présentation matérielle)

Une structure arborescente hiérarchique unique (interdiction des chevauchements de balises en XML)

L’encodage manuel est une tâche longue (donc coûteuse), pour lequel il faut être (bien) formé…

Transcription diplomatiqu

e traditionnell

e

Pré-balisage

EncodageContrôle et enrichissem

ent

Supervision scientifique

Macro-Structuratio

n en <teiCorpus>

Indexation sémantique

Intégration dans

l'interface d'édition

Le « workflow » TEI du projet

1

2

3

4

5

Mais une solution au problème de l’extraction des fragments textuelsComment gérer la saisie de toutes les relations possibles entre un fragment et ses classements :

• prévus• probables• potentiels• abandonnés• etc.

sur plus de 3500 pages ?Fragmen

t 1

Littérature de

Jocrisses

vérités

jocrisses

imbécilles

Fragment 2

Littérature de

Jocrisses

Fragment 3

Littérature de

Jocrisses

jocrisse

Fragment 4

Littérature de

Jocrisses

Fragment 5

Littérature de

Jocrisses

Littérature de

jocrisses

Véritésjocrisses

imbécilles

Fragment 1

Fragment2 Jocrisses

Fragment 3

Fragment 4

Fragment 5

Exemple de hiérarchie logique d’une page

http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_1_f_082__r____

« Littérature de Jocrisses »

en <head> (titre de liste)

= s’applique à tous les items

de la liste (fragments)

« jocrisse »placé dans le <label>

(étiquette d’item) est redoublé pour le troisième <item>

(fragment) et uniquement lui

Littérature de jocrisses<head>

Véritésjocrisses

imbécilles<label>

Fragment 1<item>

Fragment2<item>

Jocrisses<label>

Fragment 3<item>

Fragment 4<item>

Fragment 5<item>

Le même exemple avec les balises TEI choisies

http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_1_f_082__r____

L’ ENJEU INTERFACE

Un cahier des charges ambitieux

Reconstitutions conjecturales :•Parcours figés •Mode simple• Mode expert

Représentation des fragments et des catégories de classement• Degré de certitude par rapport au 2nd volume• Orientation dans l’éventail des mobilités possibles

Édition de la transcription textuelle• Exploiter les possibilités du support électronique• Respect si possible des conventions traditionnelles d’édition critique

• Ergonomie de la présentation de l’appareil critique• Lisibilité et utilisabilité

Deux interfaces clés

1. La « matrice »

Une représentation visuelle simplifiée permettant d’éditer facilement une première base de travail à partir :

• des grandes sections thématiques

• de la typologie des fragments

2. L’interface de lecture et de reclassement

Suggérer des reclassements en exploitant les métadonnées enregistrées dans la base de données….

1. La « matrice »

« J’édite mon Second volume de Bouvard et Pécuchet »…

  Typologie des fragments

Catégories de classement PR NL avec marque(s) de sélectionNL sans marque

de sélection Doc préparat Doc provis.

    croix

catégorie croix et catégorie

soulignement ou trait vertical      

Annonces, réclames, circulaires       

       

Nomenclatures et bizarreries       

       

Spécimens de style

   

   

       Scientifiques

Ecclésiastiques       

       

Grands Écrivains       

       

Romantiques       

       

Dramatiques       

       

Révolutionnaires       

       

Réaliste, populaire, cavalier, des propriétaires    

   

       

Officiels, Souverains       

       

Nomenclatures et bizarreries

Spécimens de style

Esthétique et Critique

Haine des romans

Classiques corrigés

Histoire et Idées scientifiques

Contradictions de la science

Philosophie

Religion. Mysticisme. Prophéties

Grands Hommes

Exaltation du Bas

Beautés

Injures. Sottises. Lâchetés. Amour. Palinodies

0% 20% 40% 60% 80%100%

Page préparéePage récapitulativeNote de lecture avec marques de sélectionNote de lecture sans marqueDossier de Jules DuplanDocumentation provi-sionnelle brute

Ajuster le curseurPar exemple + ou – de notes

de lectures avec marques

Sections thématique

s

Types génétiqu

es

2. L’interface de lecture et de reclassement des fragments

Spécimens de style

• Style scientifique• Style agricole

• Arbres enfants• Valets de comédie• Gamins • Vertueux• Belle pensée

• Les jésuites ont rendu des services éminents à la littérature et à l’instruction publique. (…)

• Grande pensée• Style rococo• (…)

La lecture de la reconstitution s’effectue en dépliant ou repliant les catégories…

Section thématique Fragment

Catégorie

Plusieurs modes de lecture combinés…

• Style agricole • Après Canova*• Belle pensée

3-135-f5

• ce qui couronne la gloire des jésuites

C3-136-f2

Spécimens de style

• Style scientifique• Style agricole

• Arbres enfants• Valets de comédie• Gamins • Vertueux• Belle pensée

• Les jésuites ont rendu des services éminents à la littérature et à l’instruction publique. (…)

• Grande pensée• Style rococo• (…)

Transcriptions Diplomatique Semi-

diplomatique Normalisée

Référence bibliographiqueImage de la page complèteSéquenceDossierEtc.

Le guidage des reclassements éventuels

Catégories proches

• spécimens de style

• périphrases• ethnographique

Catégories plus lointaine s (vedettes

associées à toutes les autres

citations du même auteur

• idées scientifiques•sciences d'avant le déluge

•sciences de l’Egypte•Moïse infaillible•astronomie•exaltation du Bas• la philosophie de notre siècle

•philosophies du 18e siècle

•tous coquins•Locke•Grands hommes •Voltaire

Catégories très éloignées

• Gallilée• Locke• etc.

Reclasser ?

Catégories extraites de la base

de données

Histoire et idées

scientifiques

•(…)•Histoire• Idées scientifiques• linguistique•Si on avait un dictionnaire des langues sauvages on y trouverait des restes évidents d’une langue antérieure parlée par un peuple éclairé, et quand même nous ne les trouverions pas, il en résulterait seulement que la dégradation est arrivée au point d’effacer ces derniers restes.

•4-48-f-•(…)

De Maistre, Les Soirées de Saint-Pétersbourg, 2e entretien

Comparer visuellement les reconstitutions ?Si créer une reconstitution, c’est « remplir le tableau », il est facile d’en proposer une représentation visuelle et graphique et de comparer ainsi plusieurs reconstitutions entre elles…La métaphore du

kaléidoscope :«  Cette image permet (…) d'illustrer un propos soutenant que ce ne sont pas les éléments qui font le tout, mais la forme que prend leur combinaison : le tout n'est pas réductible à la somme de ses parties. »

Wikipédia, consulté le 31 août 2010

Nomenclatures et bizarreries

Spécimens de style

Esthétique et Critique

Haine des romans

Classiques corrigés

Histoire et Idées scientifiquesContradictions de la

science

Philosophie

Religion. Mysticisme. Prophéties

Grands Hommes

Exaltation du Bas

Beautés

Injures. Sottises. Lâchetés. Amour. Palinodies

Reconstitution de Léa Caminiti

Nomenclatures et bizarreries

Spécimens de style

Esthétique et Critique

Haine des romans

Classiques corrigés

Histoire et Idées scientifiques

Contradictions de la sciencePhilosophie

Religion. Mysticisme. Prophéties

Grands Hommes

Exaltation du Bas

Beautés

Injures. Sottises. Lâchetés. Amour. Palinodies

0

100

200

PPPRNLMNLDUPBRUT

Merci pour votre attention !

http://dossiers-flaubert.ish-lyon.cnrs.fr/

stephanie.dordcrousle

@ens-lyon.fr

[email protected]

Des questions ?