Grammaire.pdf

Embed Size (px)

Citation preview

  • Grammaire du francais

    Version : Decembre 2006

    Marie-Laure Guenot

    Cette ressource est mise a` disposition sous un contrat Creative Commons (Paternite / Partage des conditionsinitiales a` lidentique 2.0 France) : http://creativecommons.org/licenses/by-sa/2.0/fr/

  • Mis en page avec la classe thlpl.

  • Table des matires

    I Prrequis thoriques et formels 1

    1 Positionnement thorique 3

    1 Une approche non-gnrative . . . . . . . . . . . . . . . . . . . . . . . . . . 4

    2 Une grammaire non-prsomptive . . . . . . . . . . . . . . . . . . . . . . . . 6

    3 Un traitement non-modulaire . . . . . . . . . . . . . . . . . . . . . . . . . . 10

    4 Une analyse multi-dimensionnelle . . . . . . . . . . . . . . . . . . . . . . . . 16

    2 Architecture du formalisme 19

    1 Grammaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

    2 Spcification des proprits . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

    3 Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    3 Notre modle de grammaire 45

    1 Structuration des informations intrinsques . . . . . . . . . . . . . . . . . . 45

    2 Proprits et spcification . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

    II Grammaire du franais 65

    Introduction 67

    1 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

    2 Notations simplifies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

    3 Organisation de la partie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

    4 Constructions de base 75

    1 Hirarchie gnrale des constructions . . . . . . . . . . . . . . . . . . . . . . 75

    2 Constructions de Base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

    i

  • Table des matires

    5 Constructions nominales 85

    1 Noms construits (N) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

    2 Syntagmes Nominaux (SN) . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

    6 Constructions verbales 97

    1 Verbes construits (V) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

    2 Syntagmes Verbaux (SV) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

    7 Constructions propositionnelles 133

    1 Propositions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

    8 Constructions de subordination 143

    1 Subordonnants (Sub) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

    2 Conjoints de subordination (Conj-s) . . . . . . . . . . . . . . . . . . . . . . 148

    9 Constructions adjectivales 155

    1 Adjectifs construits (Adj) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

    10 Entassements paradigmatiques 161

    1 Entassement Paradigmatique (EP) . . . . . . . . . . . . . . . . . . . . . . . 164

    2 Coordination (EP-c) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

    3 Disfluence (EP-c) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

    4 Prcisions des descriptions . . . . . . . . . . . . . . . . . . . . . . . . . . . 185

    Conclusion 189

    III Exemples danalyses 193

    Introduction 195

    1 Structure produite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

    2 Analyse vs. Parsing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196

    11 Un nonc simple 199

    1 Dbut de lanalyse : Informations disponibles . . . . . . . . . . . . . . . . . 199

    2 Premier niveau danalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200

    3 Deuxime niveau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203

    4 Troisime niveau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206

    ii

  • 12 Constructions verbales 209

    1 Diffrentes constructions verbales . . . . . . . . . . . . . . . . . . . . . . . . 209

    2 Sujet plein vs. sujet clitique . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

    3 Clitiques non-nominatifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224

    13 Coordinations 233

    1 Coordination de catgories diffrentes . . . . . . . . . . . . . . . . . . . . . 233

    2 Coordination elliptique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237

    Conclusion 245

    Table des figures 247

    Bibliographie 253

    iii

  • Table des matires

    iv

  • Premire partie

    Prrequis thoriques et formels

    1

  • Chapitre 1

    Positionnement thorique

    Le modle que nous prsentons en deuxime partie est base sur deux choses : tout dabord unensemble de postions thoriques dont la conjonction fait loriginalit, et qui sont loriginedu contenu des lments de grammaire ; ensuite, un formalisme dans lequel nous pouvonsreprsenter ce modle, lui apportant rgularit et validation de lexpression. Nous prsentonsdans ce chapitre les positions thoriques qui sont lorigine de notre proposition. On peut larsumer quatre positions-cls mises en vidence au fur et mesure de nos recherches, et quien rsument les ides principales :

    La premire position est celle du non gnrativisme (1) : Le courant dans lequel nousnous inscrivons sloigne en de nombreux points des axiomes des thories gnratives, no-tamment en ce qui concerne la dfinition dune grammaire, et qui portent des implicationsprofondes tant sur le contenu que sur la forme des descriptions.

    La deuxime position est celle de la non-prsomption (2) : On cherche distinguer claire-ment et systmatiquement, pour une unit linguistique donne, les informations concernantsa constitution de celles concernant son utilisation. Refusant danticiper des relations quuneunit entretiendra avec les autres au sein mme de sa description interne, alors, par exemple,on ne reprsente pas dinformations syntaxiques dans un objet dont les constituants nen-tretiennent pas de relations syntaxiques ; en cela, on se distingue des grammaires diteslexicalises.

    La troisime position est celle de la non modularit (3) : On se base ici sur lide selonlaquelle linformation linguistique est parse et inconstante dans les productions, et loncherche en tenir compte ds le dpart, sans postuler danalyses spares puis de mca-nismes dinterfaage entre les rsultats, ni mme de reprsentations distinctes des diffrentsdomaines lies par un mcanisme de liage.

    Enfin, la quatrime position est celle de la multi-dimensionnalit (4) : On pose que lastructuration linguistique 1 sopre suivant deux axes, syntagmatique et paradigmatique.Cette remarque nest pas aussi triviale quon pourrait le penser, puisquelle implique de1Plus exactement, nous nous contentons ici de faire reposer notre ide de multi-dimensionnalit sur la

    syntaxe, bien que nous nexcluons pas quelle puisse sappliquer dautres domaines.

    3

  • Chapitre 1. Positionnement thorique

    prendre pleinement en compte ces deux dimensions dans lanalyse syntaxique, et non sim-plement la premire comme cest si souvent le cas.

    Lorganisation selon ces quatre axes a progressivement merg de nos recherches tant du pointde vue strictement thorique, que de celles portant sur le modle ou sur le formalisme. Il sagitici de proposer une synthse des positions que lon tient par la suite, mais qui na videmmentpas vocation constituer une thorie complte de la langue. Ici lon naborde volontairementpas un certain nombre de points thoriques, tels que par exemple la question des universauxlinguistiques, celle de la relation entre oral et crit, etc. Nous nous concentrons exclusivementsur ce qui constitue un pr-requis la lecture des parties suivantes.

    1 Une approche non-gnrative

    Selon les thories linguistiques gnratives, une grammaire est un mcanisme permettant dedfinir une langue naturelle. Lide sous-jacente est plus prcisment de considrer la gram-maire comme un processus numratif partir duquel on peut driver strictement un langage,et par consquent comme un mcanisme utilis pour vrifier si une entre donne appartientou non une langue, en fonction de la possibilit ou non de construire une structure y corres-pondant. Mais cette conception est trs restrictive pour plusieurs raisons.

    Filtrage des entres. Premirement, cela a des consquences considrables sur la faonde reprsenter linformation linguistique, qui est alors exprime de faon exclure les occur-rences considres comme non-grammaticales. Ceci est particulirement clair dans la Thoriede lOptimalit (ci-aprs OT, [Prince & Smolensky, 1993]), dans laquelle les contraintes (consi-dres comme universelles) sont stipules prcisment dans cet objectif de filtrage. On retrouvele mme mcanisme dans les Mtagrammaires (ci-aprs MG, [Candito, 1999]) qui font usagede contraintes pour liminer des arbres gnrs partir de la grammaire ([Crabb & Duchier,2004]).

    Grammaticalit. Deuximement, considrer une grammaire comme un moyen de dfi-nir une langue se base sur une dichotomie claire entre productions grammaticales et non-grammaticales, alors mme que [Chomsky, 1961] ou [Ziff, 1964] avaient dj not quune telledistinction ne correspondait pas la ralit de la langue, pour un certain nombre de raisons.La linguistique de corpus (p.ex. [Deulofeu, 1982], [McEnery & Wilson, 1996], [Bilger, 2000],etc.) nous montre depuis des annes et plus concrtement quel point les productions peuventtre loignes des descriptions gnrativistes, malgr la finesse vers laquelle certaines tendent,et ceci concerne tout aussi bien les productions orales qucrites.

    Couverture. De plus, la notion de grammaticalit ncessite une couverture totale de lalangue : lincertitude, lambigut, lincompltude, lhtrognit nont pas leur place dans detelles approches. Lobjectif (thorique) des analyses gnratives est de reconstituer une struc-ture englobant la totalit dun nonc, se basant sur le postulat de lexistence systmatiquedune telle structure (do le symbole initial de ces grammaires). Or la quantit dinforma-

    4

  • 1. Une approche non-gnrative

    tions disponibles dans un nonc est trs variable (de mme que la qualit et la finesse), etpeut ne pas suffire pour reconstruire une structure gnrale.

    Prenons un exemple concernant la syntaxe. Un nonc tel que (1) prsente une structurationsyntaxique facilement identifiable, des informations en quantit suffisante pour en donner uneanalyse complte et sans conteste grammaticalement conforme.

    (1) Deux scientifiques travaillent actuellement sur un matriau quils ont baptis "claytronics", qui sera composde nano-machines capables de sorganiser pour reproduire distance en 3D, et via internet, nimporte quelleforme, y compris la vtre. 2

    Toutefois les productions effectives sloignent rapidement de ce repre canonique, et peuventrclamer un certain degr de tolrance ([Pullum & Scholz, 2003]) pour tre analyses. On doitpar exemple pouvoir traiter des phnomnes lintersection de plusieurs domaines, et dont lasyntaxe elle seule ne peut rendre compte (2).

    (2) les Anglais qui ont quand-mme beaucoup dhumour euh les journaux anglais enfin les mdias britanniquesont fini par rpondre 3

    On doit galement pouvoir analyser des noncs qui prsentent des carts la grammaire,quils soient volontaires et accepts (3a) ou non (3b), sans que lesdits carts ne rendent latotalit de lanalyse impossible.

    (3) a. Toccupe !

    b. cest parcequon est 3 bosser sur le site et que le troisime casser son portable alors la com passemal ! 4

    Enfin, on doit pouvoir traiter les noncs qui ne contiennent quasiment pas dinformationssyntaxiques (cf. p.ex. [Deulofeu, 2005]) (et dont le manque dinformations de ce domaineest souvent compens par une augmentation des informations dautres domaines, prosodienotamment pour loral) (4) .

    (4) a. lundi lavage mardi repassage mercredi repos 5

    b. il y a mon frre sa moto le guidon eh ben compltement naze quoi 6

    Une ressource descriptive. Pour ces raisons, nous pensons quune grammaire ne doit pastre restreinte tre un mcanisme dfinitoire : la question fondamentale nest pas de savoirsi un nonc appartient ou non une langue mais bien dextraire linformation de cet nonc.Nous nous basons donc sur une conception plus gnrale selon laquelle une grammaire estune ressource rellement descriptive contenant toutes les informations partir desquelleslanalyse (et linterprtation) dune entre (rellement produite) peut tre construite, quelleque soit sa forme.

    2fr.sci.philo, 21 septembre 2006.3[Blanche-Benveniste et al., 1990].4http ://www.onpeutlefaire.com/forum/index.php ?showtopic=6164, 26 juillet 2006.5[Mertens, 1993].6[Cappeau & Deulofeu, 2001], daprs A. Cuiloli.

    5

  • Chapitre 1. Positionnement thorique

    Il sagit dun point de vue partag par des approches trs diverses, telles que Dynamic Syn-tax (DS, [Tugwell, 2000], [Kempson et al., 2001]), les Grammaires de Construction (CxG,[Goldberg, 1995]), ou lApproche Pronominale (AP, [Blanche-Benveniste et al., 1990]).

    Non-drivationnalit. De mme que Role and Reference Grammar (RRG, [Van Valin& LaPolla, 1997], ou [Bentley, 2003] sur ce point), CxG ([Kay & Fillmore, 1999]), Lexical-Functional Grammar (LFG, [Bresnan, 2001]) ou Word Grammar ([Hudson, 1984]), lapprocheque lon propose est non-drivationnelle : nous ne faisons pas usage de la notion de dpla-cement / mouvement (movement) du Programme Minimaliste ni de celle de promotionvs. dgradation (demotion) de la Grammaire Relationnelle (RG, [Blake, 1990]).

    Pas de structure initiale. En outre et comme on la vu prcdemment, dans la plupartdes cas les autres approches considrent que tout nonc de la langue doit pouvoir faire lobjetdune structure lenglobant compltement :

    A candidate sentence is licensed as a sentence of the language if and only if there exists in thegrammar of that language a set of constructions which can be combined in such a way as toproduce a representation of that sentence. ([Kay, 1995, pp. 172-173], propos de CxG)

    Nous refusons de considrer que la compltude dune structure puisse tre une conditionsine qua non la grammaticalit dun nonc 7, et notre modle ne ncessite donc pas unecouverture complte et permet de construire si cela se justifie des structures partielles,non-connectes, selon les donnes fournies (et la couverture de la grammaire).

    2 Une grammaire non-prsomptive

    La raisonnement qui nous a conduite adopter cette position repose sur une rflexion proposdes grammaires dites lexicalises. Nous commenons par prsenter ceci avant de gnralisernotre propos la structuration de linformation.

    2.1 Lexicalisation et non-lexicalisation

    2.1.1 Grammaires dites lexicalises

    Lexique et grammaire dans les modles linguistiques formels. La plupart desmodles de description linguistique courants font partie de ce quon appelle les grammaireslexicalises. Des grammaires telles que TAG ou HPSG sont caractrises par lintgration, au

    7Ne serait-ce que parce que pour que ce soit le cas, il faudrait pouvoir envisager quune grammaire puisse treexhaustive ; or nous pensons que ce point nest quun objectif vers lequel le dveloppement de grammaire tend,mais sans pouvoir latteindre concrtement. La consquence de cela est que quoi quil en soit, une grammairene pouvant rellement pas tre tout fait complte, on ne peut la considrer comme un outil de jugementdappartenance dnoncs la langue.

    6

  • 2. Une grammaire non-prsomptive

    sein mme de la reprsentation dune unit lexicale (au mme titre que celle dun syntagme), la fois dinformations qui dfinissent lobjet en tant que partie du systme lexical de lalangue, et dinformations qui le dfinissent en tant que partie du systme grammatical dela langue. Pour preuve de la distinction ncessaire des deux systmes pourtant, le recoursdans ces modles des rgles de drivation lexicale pour obtenir les variantes grammaticalespossibles de chaque objet lexical.

    Daprs [Kahane, 2006], la justification de lapproche lexicaliste tient au fait que la reprsen-tation syntagmatique masque les relations (parfois distantes entre des objets de profondeursvariables) entre mots (ou morphmes) :

    (...) the recourse to phrasal description masks what combinations of words are involved in extrac-tion. From a theoretical point of view, we think that purely linguistic data might be introduced inword descriptions and that phrasal schemata might only encode how subphrases combine together.

    Selon ce point de vue, la grammaire est rduite une procdure de formation de syntagmes(ou dautres objets ou relations), i.e. un mcanisme de reprsentation des informationslinguistiques qui, elles, sont toutes rassembles dans le lexique 8. Pourtant la faon dont lesobjets se combinent fait bien lobjet de la syntaxe, et il sagit donc dinformation linguistiqueau mme titre que les autres informations auxquelles lauteur se rfre.

    Lexiques procduraux. Dans les approches dites lexicalistes, on mle donc dans uneseule classe dobjets (les objets lexicaux) des informations concernant deux systmes, certesinterdpendants, nanmoins distincts. A tel point que dans des formalismes tels que celui desGrammaires Catgorielles (p.ex. [Steedman, 1996]) qui se dfinit lui-mme comme extrme-ment lexicalis (extreme lexicalization, [Kruijff, 2004]) , le Programme Minimaliste commeon la vu, ou encore Dynamic Syntax, ce sont les objets du lexique eux-mmes, dfinis sousla forme de procdures danalyse, qui contiennent toutes les informations grammaticales desmodles. En effet dans ce cas il nexiste pas de grammaire distincte, toute ou partie, du lexiquelui-mme (pas de description dautres objets), mis part quelques principes gnraux qui r-gissent les combinaisons possibles et qui permettent donc de driver partir de ces unitslexicales la structure linguistique dun nonc sans passer par des descriptions de syntagmes(ni de dpendances syntaxiques). Les informations proprement lexicales des units sont ex-primes de manire implicite lintrieur mme de leur description procdurale (qui est unensemble dinformations explicitement grammaticales puisquelles expriment des procduresde construction de structure). Ici le lexique est vritablement la grammaire, et vice versa, etles deux sont confondus comme une seule et mme entit.

    Pas disolation des informations. Toutes ces grammaires, comme la en partie montr[Kahane, 2004], ont en outre ceci de commun que les objets quelles manipulent sont inter-prtables comme tant soit des ressources soit des besoins, soit des ensembles ressources-besoins (o chaque partie de lunit peut tre lun ou lautre). En revanche il est impossiblede ne prendre en considration dans ces modles quune partie des ressources et/ou des

    8Lauteur voque la question des constructions dans lesquelles linformation linguistique ne peut tre rappor-te un mot, mais il nexplique pas clairement comment ces types dobjets pourraient tre traits lgammentet logiquement par une telle grammaire lexicalise.

    7

  • Chapitre 1. Positionnement thorique

    besoins des units, sparment du reste ; en dautres termes, il est impossible de manipulerdes sous-ensembles variables (do la possibilit de les reprsenter sous forme de systmespolariss, dans lesquels chaque unit a une charge donne, dfinie dans le lexique, et dont laneutralisation revient la prise en considration, cest--dire lanalyse de lunit).

    Grammaires lexicalises ou lexiques grammaticaliss ?. On peut penser quil est as-sez curieux davoir nomm grammaire lexicalise lapproche consistant intgrer au lexiquedes informations grammaticales, puisque littralement il sagirait plutt de lexiques gram-maticaliss. Comme on la dit dans les divers exemples prcdents, cest pourtant le lexiquequi fait office de grammaire dans ces approches, que ce soit totalement (approches totalementlexicalises comme CG) ou en partie (approches semi-lexicalises comme HPSG qui combineun lexique grammaticalis et un ensemble de principes et de mcanismes de constitution desyntagmes).

    Si lon accepte cette remarque, alors linverse, la position que lon adopte ici correspondraitplus rigoureusement ce que pourrait tre une grammaire lexicalise en un sens littral, puis-quau contraire de ces approches, on intgre vritablement le lexique dans la grammaire et nonle contraire. Toutefois, pour viter la confusion invitable, nous nous gardons bien de qualifiernotre approche de lexicalise, et au contraire, afin de montrer notre opposition aux gram-maires habituellement appeles lexicalises nous appelons notre position non-lexicalisation.

    2.1.2 La non-lexicalisation de notre modle

    Pour notre part, nous postulons que ce nest pas toujours lunit lexicale considre dans saglobalit, en tant que partie du discours, qui contient les informations sur ses relations avecle reste de lnonc. En effet, les tudes menes par exemple sur ce qui est appel la non-compositionnalit de nombreuses constructions linguistiques que lon ne saurait rduire auxseuls phnomnes de figement 9 (p.ex. [Kay & Fillmore, 1999], [Kracht, 2005a], etc.) montrentbien quil est parfois ncessaire de pouvoir prendre en considration uniquement une partiede lensemble dinformations constituant une unit afin de lintgrer la construction dunestructure plus grande. Par exemple, on fera usage de lensemble des informations contenuesdans lunit lexicale terre pour lintgrer en tant que constituant de syntagme dans (5a), alorsquon devra en liminer une certaine partie dans lanalyse de (5b) qui est une expression semi-fige dans laquelle le morphme ne conserve pas la totalit de son contenu smantique ainsique sa capacit recevoir des complments ; enfin, dans (5c) o lunit est employe dans uneexpression fige (un mot complexe non construit selon lexpression de [Corbin, 1987]), terreperd compltement son statut de morphme et donc toute une partie de son statut.

    (5) a. Voici la terre sous lpanchement des premiers feux de laube 10

    b. Que faisaient les techniciens qui nous avait inform la veille aux infos du tremblement de terre demagnitude 8.5 en pleine mer ? 11

    9Et quand bien mme on ne considrerait que les phnomnes de figement comme des constructions ditesnon-compositionnelles, ceci demande aux approches dites lexicalises pour les prendre en compte de traiterceci comme une exception leur rgle lexicaliste, donc comme une limite leur modle.

    10fr.lettres.ecriture - 10 nov 2002.11fr.soc.religion - 29 dcembre 2004.

    8

  • 2. Une grammaire non-prsomptive

    c. Le tatin de pommes de terre, cest ca ? 12

    Pourtant, dans les trois cas une partie (variable et plus ou moins large) de lunit reste stable,ce qui justifie selon nous de pouvoir sparer ces informations-ci de ce qui concerne lemploi delunit en tant que constituant de structure plus grande.

    Cest l lune des raisons pour lesquelles on tient ne pas prsumer de lutilisation dun objetau sein mme de sa description. Consquence de cela, on cherche effectuer une distinction 13

    claire entre le systme lexical et le systme grammatical, sans avoir passer par des rglesqui ont pour charge de modifier le contenu de base des units lexicales (i.e., de changer lagrammaire contenue dans le lexique) 14. Selon ce postulat les informations grammaticales(concernant les relations entre objets dun nonc) peuvent tre exprimes de manire rgulireen fonction dun ensemble dinformations dont la constitution est variable volont, pouvantcontenir des caractristiques provenant de domaines diffrents (morphologie, syntaxe, sman-tique, prosodie, pragmatique). Cela signifie que ces ensembles manipuls dans la grammaire necorrespondent pas forcment toujours des units lexicales, mais peuvent pointer des objetsplus larges ou plus fins, en fonction des descriptions effectues.

    La frontire que nous posons ici a pour consquence que de nombreuses informations de sous-catgorisation que lon trouve habituellement mentionnes dans le lexique, font dans notremodle lobjet de constructions grammaticales. Nous faisons par exemple une diffrence detraitement entre valence et transitivit. Nous reprsentons la valence dans les units lexicalesparce quil sagit dune information de smantique lexicale, stable pour chacune de ces entres,mais nous reprsentons la transitivit dans la grammaire parce quelle dpend des occurrencesproduites (Cf. chapitre 6 pour une discussion ce propos).

    2.2 Une grammaire non-prsomptive

    Dun point de vue plus gnral, cette position concernant la lexicalisation des grammairesest en ralit lune des manifestations dun choix selon lequel on refuse de faire figurer dansune construction donne des informations portant sur la structure (de quelque domaine quece soit) dans laquelle elle est susceptible dentrer. Concernant le lexique, cela signifie quon nefait pas figurer dinformations syntaxiques dans les units lexicales (ce sont les constructionssyntaxiques qui pourront contenir des restrictions plus ou moins fines et pouvant mentionnerdes informations lexicales), mais ceci ne sapplique pas uniquement la relation entre lexiqueet grammaire.

    12fr.rec.cuisine - 28 jan 2000.13Soulignons que nous parlons ici de distinction thorique, et non formelle.14On cherche galement ne pas avoir recours ce type de rgles parce que cela nous demanderait dutiliser

    un mcanisme diffrent de ceux que lon utilise dj.

    9

  • Chapitre 1. Positionnement thorique

    3 Un traitement non-modulaire

    3.1 Deux acceptions de la modularit

    Dans tous les cas, il sagit disoler des parties dun ensemble (et de convenir de mthodespour les combiner par la suite) ; mais suivant la nature de lensemble que lon considre, ilsensuit deux utilisations possibles de la notion : reprsentation modulaire de la structurationdes objets, ou analyse modulaire.

    3.1.1 Modularit des objets

    Reprsentations modulaires. Selon un premier point de vue, la modularisation consiste scinder le contenu des objets linguistiques en sous-parties. Cest typiquement le cas dela Grammaire Lexicale-Fonctionnelle (LFG, [Kaplan & Bresnan, 1982], [Bresnan, 2001]), olanalyse se base sur une ressource grammaticale unique qui contient toutes les informations n-cessaires la construction dune double reprsentation (au moins : c-structure et f-structure),lesquelles informations sont reprsentes au sein des mmes objets selon des conventions dif-frentes, et mises en relation entre elles via un mcanisme de projection (linking) issue dela thorie du mme nom (linking theory, ou lexical mapping theory, [Levin, 1986], [Bresnan &Zaenen, 1990]). (fig. 1 15).

    la : Det, (Genre)=fm, (Num)=sing, (Def)=df

    souris : N, (Genre)=fm, (Num)=sing, (Pred)=souris

    donne : V, (Mod)=ind, (Temps)=prs, (Suj Num)=sing,(Suj Pers)=3, (Pred)=donner,

    Fig. 1 Reprsentation modulaire des units en LFG.

    Les Grammaires dAdjonction dArbres (TAG, [Joshi et al., 1975], [Joshi & Schabs, 1997])utilisent elles aussi la thorie de la projection : quand elles ne distinguent pas entre arbredriv (structure syntaxique) et arbre de drivation (structure de combinaison des arbres)([Vijay-Shanker, 1987]) pour calculer partir de cette dernire les reprsentations smantiques,leurs units grammaticales sont reprsentes sous une forme modulaire constitue dune di-mension 16 syntaxique (un arbre lmentaire) et une dimension smantique (une prdicationlmentaire) 17 ([Gardent & Kallmeyer, 2003]) (fig. 2 18).

    On peut rapprocher cette modularisation des informations lies entre elles par un mcanismede mise en correspondance, de la rule-to-rule hypothesis de [Montague, 1974] selon laquelle

    15Tire de [Vilnat, 2005].16Le terme de dimension ici fait rfrence un niveau ; il est utilis de la mme faon en Multi-Modal

    Combinatory Categorial Grammars ([Kruijff, 2004]).17Le nombre de dimensions adoptes par la suite dpend des thories ; [Crabb, 2005a] p.ex. en dfinit

    trois : un niveau smantique, un niveau syntaxique et un niveau dinterface entre les deux.18Tire de [Crabb, 2005b]

    10

  • 3. Un traitement non-modulaire

    Nj

    Jean

    S

    HHHH

    N?y Vvoit

    N?xNm

    Marie

    Jean(j) voit( ?x, ?y) Marie(m)

    Fig. 2 Reprsentation modulaire des objets linguistiques en TAG.

    chaque structure syntaxique doit correspondre une structure smantique, laquelle hypothseobit au principe de compositionnalit de Frege, posant que la valeur smantique dune ex-pression complexe dpend fonctionnellement des valeurs smantiques de ses constituants.

    Dans une moindre mesure, Head-Driven Phrase-Structure Grammar (HPSG, [Pollard & Sag,1994]) utilise aussi un mode de reprsentation modulaire des objets, les structures de traitstant organises en fonction des domaines dappartenance de chaque information (fig. 3 19).266666666666666666666666666664

    phonDlitE

    synsem

    26666666666666666666666664

    loc

    2666666666666666666666664

    cat

    266666666666664

    tteverbe

    "maj Vvform tens

    #

    valence

    26664suj*

    1SN 3hsing,3

    i+comps

    D2SN 4

    E37775

    s-argD

    1 , 2E

    377777777777775

    cont

    2664quants

    nucleuslire

    "lecteur 3lu 4

    #3775

    3777777777777777777777775

    37777777777777777777777775

    377777777777777777777777777775Fig. 3 Reprsentation modulaire des objets linguistiques en HPSG.

    On commence par sparer les informations phonologiques des informations syntaxico-smantiques,qui sont elles-mmes dcoupes plus loin en catgorie et contenu, la catgorie ayant unette, une valence et une liste de sous-arguments, etc.

    Reprsentations non-modulaires. Ce type de reprsentation soppose p.ex. celle deDynamic Syntax dont les auteurs considrent que ce qui importe dans une analyse nest pasle rsultat lui-mme mais la faon dont on construit ce rsultat :

    The emphasis is on the process of establishing some structure as interpretation, rather than justspecifying the result, which is the structure itself. [Kempson et al., 2001]

    19Tire de [Blache, 2001].

    11

  • Chapitre 1. Positionnement thorique

    et cette fin adoptent une reprsentation typiquement procdurale des units (fig. 4 20).

    IF ?Ty(e) holds for description { 0Tn(a), ?Ty(e), },THEN add Fo(John), Ty(e) and [] to the description,ELSE ABORT.

    Fig. 4 Reprsentation procdurale des objets linguistiques en DS.

    Ici la description de lunit (en loccurrence la fig. 4 reprsente une entre pour John) consiste dire : au moment o je lis John dans mon entre analyser, SI au niveau de larbre o jesuis ce moment-l 21 je vois la description { 0Tn(a), ?Ty(e), } 22 ALORS jajoute cette description les informations Fo(John) et Ty(e) 23, SINON je ne fais RIEN. On na iciaucune mention du domaine linguistique dappartenance des informations donnes dans lesdescriptions, on ne fait que les manipuler, en en ajoutant et en se dplaant dans la structureque lon construit.

    Dune manire comparable, les units des Grammaires Minimalistes (fig. 5 24) sont lobjetdune reprsentation en termes de configuration, cest--dire que leur contenu et leur ordre,certes ne font pas rfrence des actions effectuer, mais toutefois dpendent directement dumcanisme de parsing (qui lit, et donc utilise, ces informations dans un ordre donn).

    Fig. 5 Reprsentation procdurale des objets linguistiques dans une Grammaire Minimaliste.

    Dans la figure 5 par exemple, on voit que chaque unit lexicale est multiplie par le nombrede configurations possibles lors de son analyse : chaque ligne de lextrait correspond uneforme lexicale, laquelle on fait correspondre un ensemble dinformations dont le contenu etlordre correspond une suite diffrente dactions effectuer et dinformations ajouter dansla structure que lon est en train de construire.

    20Tire de [Kempson et al., 2001].21En Dynamic Syntax lanalyse consiste construire un arbre et le complter progressivement en se dplaant

    sur ses branches. Une entre lexicale peut donc aussi bien ajouter de linformation un noeud que commanderle dplacement du pointeur dans larbre.

    22Cette description signifie peu prs Je suis le premier argument (0) du noeud initial (Tn(a)), jexistemais je ne sais pas quoi je corresponds dans lnonc ( ?Ty(e)), et je porte le pointeur ().

    23Je suis de la forme John (Fo(John)) et Je sais qui je corresponds dans lnonc (Ty(e)).24Il sagit dun extrait du lexique propos dans [Amblard, 2006] pour la reconnaissance des clitiques.

    12

  • 3. Un traitement non-modulaire

    3.1.2 Modularit des analyses

    La seconde acception possible de la modularit consiste en le dcoupage, non pas des uni-ts de la grammaire, mais des analyses. Cest typiquement le cas de la Thorie Sens Texte(TST, [Meluk, 1997]) au sein de laquelle on distingue quatre niveaux standards (smantique,puis syntaxique, morphologique et phonologique de surface) et trois niveaux intermdiaires(syntaxique, morphologique et phonologique profonds) (fig. 6 25). Ces niveaux sont ordonnset leur succession fournit autant danalyses et de reprsentations diffrentes, aux extrmitsdesquelles se trouvent le Sens (la signification, linterprtation) dune part et le Texte (laproduction graphique ou phonique) dautre part.

    Fig. 6 Reprsentation modulaire des analyses en TST.

    Cest le cas aussi de la conception de TAG que lon a voque prcdemment, selon laquelleon calcule les reprsentations smantiques des noncs partir de larbre de drivation obtenu

    25Tire de [Polgure, 1998].

    13

  • Chapitre 1. Positionnement thorique

    lors de lanalyse syntaxique (p.ex. [Schabs & Shieber, 1994], [Candito & Kahane, 1998],[Kallmeyer, 2002]).

    Cest galement le cas du systme FIPS ([Laenzlinger & Wehrli, 1991]) qui utilise une gram-maire du franais inspire du modle Gouvernement et Liage. Cet analyseur, entirementtudi pour permettre limplmentation de la thorie chomskyenne, est constitu dun en-semble ordonn de composants (modules) qui rpondent chacun des processus particuliers,allant des structures lexicales aux structures smantico-pragmatiques (cf. fig. 7).

    Analyse lexicale

    Projection syntagmatique (X-barre)

    Attachements

    Traitement des chanes

    Filtrage (cas et rles thmatiques)

    Interprtation / interaction

    Fig. 7 Reprsentation modulaire des analyses en GB dans FIPS.

    3.2 La non-modularit de notre modle

    De ce qui prcde nous retenons une distinction entre ce que lon appelle modles modulaireset qui font une distinction de notation entre les domaines, en faisant des systmes autonomes,et ce que lon appelle les modles non-modulaires qui, mme sils peuvent sparer les infor-mations des diffrents domaines, les reprsentent toutefois en une mme entit si bien quilest possible denvisager des interactions de toutes sortes, y compris de bas niveau, entre lesdomaines, de mme que denvisager une reprsentation avec partage dinformation entre do-maines. Dans le premier groupe on fait figurer LFG, TAG et la TST ; dans le second, HPSG,DS et GM. Nous nous plaons pour notre part aux ct des seconds.

    Plus prcisment, en reprenant ces interprtations possibles de la modularit, on peut direque notre modle adopte une reprsentation modulaire de ses objets la manire de HPSG,mais les rassemble au sein dune grammaire non-modulaire (3.2.1), qui effectue des analysesnon-modulaires (cf. 3.2.2).

    3.2.1 Grammaire non-modulaire

    Dans notre conception, une grammaire est un ensemble dassociations dinformations indiquantles interactions entre diffrents objets. Lide est de rassembler plusieurs sources dinforma-

    14

  • 3. Un traitement non-modulaire

    tion sitt quelles ont une consquence remarquable sur (la construction de) linterprtation,quelles que soient leur nature et leur importance. Cette conception est celle des Grammairesde Construction (sur ce point, cf. p.ex. [Kay & Fillmore, 1999]), qui a t intgre notrepropre cadre de travail ([Blache, 2004a]).

    Reprsentation homogne. Contrairement aux approches qui font usage de la linkingtheory, en GP la totalit des informations que nous reprsentons lest sous une unique forme,stable et homogne : quel que soit leur domaine dappartenance, nous utilisons une uniqueformalisation, ce qui permet ces informations dtre mises en relation ds leur expressiondans la grammaire, et sans recours lexpression dun mode dinterfaage spcifique. Celasignifie galement que nous nintroduisons pas de hirarchie entre les diffrents domainesdinformation, la diffrence des approches telles que la TST. En outre, cela permet galementde ne pas avoir prciser le domaine dappartenance dune information, et donc de pouvoirprciser tout aussi directement des relations existant entre des lments de domaines diffrents(la simultanit dun geste et un son dans une analyse multimodale p.ex.).

    Toutefois, permettre une interaction de bas niveau entre les diffrents domaines oprant ausein mme des descriptions grammaticales, ne signifie pas que toutes ces informations sontconfondues en un seul et mme systme (au sens de [De Saussure, 1916]). En effet, mlerles diffrents domaines en une unique ressource requiert avant tout dtre mme de poserune diffrence claire entre chacun deux, afin den cerner les besoins propres, les mcanismesspcifiques et les caractristiques remarquables 26. Aussi nous concentrons-nous ici unique-ment sur les caractristiques strictement syntaxiques des phnomnes tudis, parce que notreparticipation llaboration de cette grammaire se situe prcisment ce niveau. Par ailleursce sera une occasion de montrer que mme pour effectuer une analyse syntaxique (i.e., pourobtenir une structure syntaxique en guise de rsultat danalyse), lensemble des informationssyntaxiques, toutes fines quelles puissent tre, ne sont bien souvent pas suffisantes.

    Ce nest donc pas la mme conception de la non-modularit que celles des thories fonction-nelles (comme p.ex. [Givn, 1984], la Cognitive Grammar de [Langacker, 1987], la SystemicFunctional Grammar de [Halliday, 1985], la Functional Grammar de [Dik, 1989], etc.), quicertes associent chaque objet linguistique un couple forme-sens tout comme cest le cas ici,mais ne reprsentent pas explicitement les informations linguistiques constituant les objets ;ils prfrent cela reprsenter une sorte de synthse fonctionnelle de ces informations.

    3.2.2 Analyse non-modulaire

    Monostratalit. Les rsultats danalyse que lon construit se prsentent sous une formemonostratale : toutes les informations que lon peut extraire des noncs donnent lieu unestructure unique les rassemblant. En outre, de la mme faon que dans la grammaire, toutesces informations sont reprsentes sous une forme homogne, ce qui permet la mme flexibilitdexpression.

    26Par exemple, nous rejoignons [Kracht, 2005b] sur ce point, qui explique notamment que les notions dindice,dordre et de multiplicit ne font pas partie de la smantique.

    15

  • Chapitre 1. Positionnement thorique

    Ceci nous permet de ne pas sur-analyser de domaine, en ne nous demandant pas dy ajouterdes rgles de structuration pour tenir compte des cas o il manque des informations de ceniveau prcis afin de pouvoir malgr tout produire une structure pour ce niveau, laquellestructure devra servir dentre lanalyse du niveau suprieur dans la hirarchie.

    4 Une analyse multi-dimensionnelle

    Depuis [De Saussure, 1916] il est admis que lanalyse linguistique sarticule selon deux axes,syntagmatique et paradigmatique. Or limmense majorit des thories linguistiques ne consi-drent que le premier de ces axes pour laborer leurs grammaires (cest notamment ce queconstate [Deulofeu, 2003]). Ce que nous proposons, travers lide de multi-dimensionnalitde lanalyse, est de proposer un traitement qui tienne compte des deux axes la fois.

    Ceci remet en question une grande partie des lments qui sont souvent considrs commedes invariants de lanalyse syntaxique (notamment), et pour en mesurer les consquences ilconvient de revenir un peu plus prcisment sur la notion de paradigme. [Dubois et al., 1994]en dit la chose suivante :

    (...) un paradigme est constitu par lensemble des units entretenant entre elles un rapport virtuelde substituabilit. F. de Saussure retient surtout le caractre virtuel de ces paradigmes. En effet,la ralisation dun terme (= sa formulation dans lnonc) exclut la ralisation concomitante desautres termes. A ct des rapports in prsentia, les phnomnes du langage impliquent galementdes rapports in absentia, virtuels. On dira ainsi que les units a, b, c, ...n appartiennent au mmeparadigme si elles sont susceptibles de se substituer les unes aux autres dans le mme cadre typique(syntagme, phrase, morphme).

    Si effectivement la mise en relation dobjets sur laxe paradigmatique restait virtuelle dans lesproductions alors on naurait pas besoin den tenir compte dans une analyse. Mais il arrivepourtant que plusieurs objets occupent le mme paradigme, comme cela a t montr parClaire Blanche-Benveniste (cf. p.ex. [Blanche-Benveniste, 1987]), et il est donc ncessaire depouvoir le reprsenter et en tenir compte. Voil pourquoi nous posons que la reprsentationdes relations paradigmatiques revt la mme importance que celle des relations syntaxiquesdans notre grammaire, et voil pourquoi nous posons que notre grammaire doit tre multi-dimensionnelle.

    Dun certain point de vue, cette position rejoint celles de [Meillet, 1924] opposant syntaxede rection et syntaxe de parataxe, de [Bally, 1965] opposant syntaxe lie (ou dictum)et syntaxe segmente (ou modus), de [Perrot, 1994] opposant syntaxe de lnonc commephrase et comme message, de [Blanche-Benveniste, 1997] opposant microsyntaxe et ma-crosyntaxe, ou encore de [Deulofeu, 2006] suivant cette dernire et opposant dtachementet rattachement. La diffrence existant entre ces approches (et notamment lapproche ma-crosyntaxique) et la ntre est que les deux dimensions sur lesquelles nous nous reposons nesont pas les mmes : l o [Deulofeu, 2003] p.ex. oppose deux modules 27 syntaxiques,

    27Module est ici employ au sens de [Nlke, 1994], et se rapproche peu prs de ce que lon appelle icidomaine, i.e. un ensemble de phnomnes que lon peut tudier en utilisant un ensemble de mthodes dedescription homogne.

    16

  • 4. Une analyse multi-dimensionnelle

    lun micro (relations syntaxiques de rection) et lautre macro (relations syntaxiques au-delde la rection), nous opposons deux dimensions syntaxiques, lune syntagmatique (quirassemble, en fait, une partie des relations micro- et macrosyntaxiques sous lensemble des re-lations hypotactiques) et lautre paradigmatique (qui rassemble lautre partie, i.e. les relationsparatactiques). Lun des points essentiels avec lesquels la sparation entre notre propositionet lapproche macrosyntaxique est notable, cest ce qui concerne la relation entre les domainesdanalyse : l o la macrosyntaxe va user dindices p.ex. prosodiques pour justifier dune struc-turaction (macro)syntaxique, nous pourrons utiliser cet indice pour proposer une constructiongrammaticale, mais sans ncessairement rapporter celui-ci une dimension syntaxique. Au-trement dit, nous posons que dans (6),

    (6) lundi lavage mardi repassage mercredi repos

    lundi lavage et mardi repassage, p.ex., nentretiennent simplement pas de relation syntaxique(ni micro, ni macro).

    Dans notre proposition, nous posons que les deux dimensions, quoique coexistantes et in-tgres la grammaire sur un pied dgalit (ce qui signifie que la grammaire contiendraune structure syntagmatique et une structure paradigmatique), nentretiennent pas les mmesrelations ; ainsi, les constructions syntagmatiques pourront intgrer des constituants paradig-matiques et inversement, mais un objet donn pourra tre constituant la fois dune structuresyntagmatique et dune structure paradigmatique. Par exemple, dans (7), je et Pierre sontles constituants immdiats dune construction paradigmatique ; paralllement cela, je te voisconstituera un syntagme verbal.

    (7) je te vois et Pierre aussi

    17

  • Chapitre 1. Positionnement thorique

    Rsum

    Dans ce chapitre nous avons prsent les ides directrices de notre position thorique, en nousbasant sur une comparaison avec celles dun certain nombre dautres approches thoriques. De cebilan, nous avons dgag les quatre ides suivantes, dont la conjonction fait loriginalit de notreproposition :

    Le non gnrativisme (1) : Le courant dans lequel nous nous inscrivons sloigne en denombreux points des axiomes des thories gnratives, notamment en ce qui concerne la dfinitionmme dune grammaire, et qui portent des implications profondes tant sur le contenu que sur laforme des descriptions.

    La non-prsomption (2) : On cherche distinguer clairement et systmatiquement, pourune unit linguistique donne, les informations concernant sa constitution de celles concernantson utilisation. Refusant danticiper des relations quune unit entretiendra avec les autres ausein mme de sa description interne, alors, par exemple, on ne reprsente pas dinformationssyntaxiques dans un objet dont les constituants nentretiennent pas eux-mmes de relationssyntaxiques ; en cela, on se distingue des grammaires dites lexicalises.

    La non modularit (3) : On se base ici sur lide selon laquelle linformation linguistiqueest parse et inconstante dans les productions, et lon cherche en tenir compte ds ledpart, sans postuler danalyses spares puis de mcanismes dinterfaage entre les rsultats,ni mme de reprsentations distinctes des diffrents domaines associes par un mcanisme de liage.

    La multi-dimensionnalit (4) : On pose que la structuration linguistique sopre suivantdeux axes, syntagmatique et paradigmatique. Ceci implique de prendre pleinement en compteces deux dimensions dans lanalyse, et non simplement la premire comme cest si souvent le cas.

    18

  • Chapitre 2

    Architecture du formalisme

    Les grands principes de larchitecture de GP ont t largement introduits dans [Blache, 2001].Ils sont initialement issus dun ensemble de postulats thoriques et dobjectifs dapplicationsau TALN. Cependant une exploration linguistique fine du formalisme tait ncessaire. Cestainsi quen commenant manipuler lesquisse de grammaire existante 28 pour la tester etlamliorer, nous avons vu merger un certain nombre de caractristiques du modle qui notre connaissance navaient pas t soulignes auparavant (ceci tant sans doute d ladiffrence de perspective). Nous avons alors tent de formaliser divers types de reprsentation,diffrentes sortes de relations possibles, afin de vrifier si ce qui nous apparaissait conservaitsa pertinence linguistique, tout en restant satisfaisant du point de vue du modle. A lissue dececi nous tions capable de prsenter le formalisme dans une formulation destine montrercomment un linguiste peut reprsenter les diffrents types dinformations sous forme de GP.Cest ce que nous proposons dans ce chapitre. Cette prsentation tche de mettre en videnceles caractristiques notables du point de vue du dveloppement de grammaire, cest--dire la fois larchitecture gnrale du formalisme telle que propose par Philippe Blache 29 dansses diverses publications ce propos, ainsi que les complments apports et les aspects mis envidence partir de manipulations diverses 30.

    Architecture gnrale. (fig. 8) Dune manire gnrale, GP est constitue de deuxressources de base, une grammaire (1) et une spcification des proprits (2). Ces deuxressources permettent deffectuer lanalyse dnoncs, en produisant des caractrisations (3)selon un mcanisme de satisfaction de contraintes.

    Un couple grammaire - spcification des proprits constitue un module danalyse. Cela signifieque dans une perspective non-modulaire comme la ntre il ne figurera quun seul couple, et

    28Celle propose dans [Blache, 2001].29Ainsi que Gabriel Bs dans les premires prsentations du formalisme, cf. par exemple [Bs & Blache,

    1999].30Cela signifie donc que cette prsentation vient en complment des autres coexistantes. Cette remarque est

    valable galement pour les dveloppements les plus rcents du formalisme, dont on na pu tenir compte pourdes raisons de chronologie (on pense notamment [Blache et al., 2006]), mais qui ne sopposent pas ce quelon prsente ici.

    19

  • Chapitre 2. Architecture du formalisme

    Caractrisation

    Analyse

    Grammaire Spcification des Proprits

    Fig. 8 Architecture gnrale du formalisme.

    dans une perspective modulaire il pourra exister autant de couples que de modules 31.

    1 Grammaire

    La grammaire est la ressource qui contient les descriptions des objets linguistiques. Ces ob-jets qui la constituent sont nomms constructions (1.1), et chacune de ces constructionsest elle-mme constitue dun identifiant (1.2), dinformations intrinsques (1.3) etextrinsques (1.4) (fig. 9).

    Grammaire

    Construction

    Informationsintrinsques

    Informations extrinsquesIdentifiant

    autres constructions...

    Fig. 9 Architecture de la grammaire.

    31Cest par exemple le cas de la Grammaire dUnification Sens-Texte (GUST) que lon a reprsente auchapitre ?? ?? : ce modle prsente une srie de grammaires qui se succdent les unes aux autres, et en GPcela se traduit par autant de couples grammaire - spcification quil y a danalyses successives dans la GUST.

    20

  • 1. Grammaire

    1.1 Constructions

    1.1.1 Dfinition

    Chaque objet manipul dans notre grammaire est appel construction au sens de CxG (cf.par exemple [Goldberg, 1995]), cest--dire que chaque objet est considr comme un patronplus ou moins complexe, plus ou moins gnral, faisant rfrence un ensemble de caractris-tiques pouvant tre mixte, et qui constitue avec les autres un rseau complexe de descriptionslinguistiques.

    Cela signifie plusieurs choses. Tout dabord, chaque construction est le reflet dune rgularitstructurelle observe, exprime sous la forme dun ensemble dindices remarquables permet-tant de postuler la dfinition dun objet linguistique donn, constitu des lments mis enrelation au sein de cette construction.

    Lensemble dindices utilis peut tre plus ou moins prcis, sa prcision dpendant dela finesse de la structure au sein du systme grammatical. Par exemple on peut facilementenvisager quune construction trs gnrale telle quun SV, dont la ralisation linguistique estdune considrable variabilit, sera dfinie par un ensemble dindices nettement moins prcisque la construction dcrivant une construction verbale trs fige telle que tant donn ou cefaisant. La construction trs gnrale du SV devra en effet contenir toutes, mais uniquementles caractristiques que lon peut retrouver dans tous les SV possibles quelle que soit leurforme, alors que les constructions figes pourront bnficier de descriptions dautant plus finesque leur forme est contrainte.

    Enfin, cet ensemble dindices caractrisant une construction peut tremixte. Cela signifie queles constructions ne sont pas uniquement des objets rpondant des indices syntaxiques et/oulexicaux, mais peuvent galement rpondre des caractristiques smantiques, prosodiques ouautres, suivant le type dinformations que lon souhaite observer, et qui nous sont accessibleslors de lanalyse.

    Concrtement, cela ne signifie pas que toutes les constructions doivent systmatiquementrecevoir une dfinition la fois syntaxique et smantique et prosodique mme si certainesdentre elles ne prsentent pas dindices pertinents dans lun ou lautre domaine ; cela signifieque par exemple, si lon a accs aux informations prosodiques et que lon observe quuneconstruction donne est remarquable par son contour intonatif rgulier, alors on pourra fairefigurer cette information dans la description de ladite construction, sans ncessiter pour autantque le contour intonatif soit pris en considration dans tous les autres cas.

    Hritage. Les constructions, dans une grammaire, sont lies entre elles par un rseaudhritage. En effet, dans la mesure o les constructions peuvent tre plus ou moins prciseset que plus elles sont fines, plus elles reoivent de contraintes, on peut les organiser entreelles en permettant chacune delles dhriter des caractristiques dune ou plusieurs autresconstructions, plus gnrales. Pour reprendre notre exemple prcdent, on peut imaginer queles constructions verbales figes ce faisant ou tant donn hritent (chacune sparment) dela construction qui dcrit les SV, ce qui signifie quelles rcuprent les contraintes gnrales

    21

  • Chapitre 2. Architecture du formalisme

    du SV, auxquelles elles ajoutent dautres contraintes qui leur sont propres.

    Informations intrinsques et extrinsques. Chaque construction que nous manipulonsdans notre grammaire rassemble daprs ce quon vient de voir un ensemble dinformations,pertinentes une rgularit structurelle observe. Cette rgularit structurelle est elle-mmeconstitue de deux types dinformations, que nous appelons informations intrinsques et in-formations extrinsques 32, et qui sopposent par leur nature.

    Si lon sappuie sur la dfinition donne par le TLF-i 33, est intrinsque ce qui

    [...] est inhrent, indpendamment de tous les facteurs extrieurs [...] qui appartient un objet[...] en lui-mme et non dans ses relations lautre.

    En se rfrant [Lalande, 1972], on peut ajouter qu

    [...] une chose est dite en particulier avoir une valeur intrinsque [...] si elle possde cette valeurpar sa propre nature, et non pas en tant quelle est le signe ou le moyen dautre chose.

    A linverse, dans le TLF-i sera considr comme extrinsque ce qui

    [...] est extrieur lobjet que lon considre, qui ne lui appartient pas mais dpend des circons-tances, des faits accessoires.

    Appliquant cette opposition aux caractristiques dune construction, on considrera commeintrinsques les informations qui sont propres la construction en tant quelle-mme, commepar exemple le fait quelle porte un genre ou un mode ou la faon dont est construite sasignification, parce que ces caractristiques ne dpendent pas des objets qui constituent laconstruction mais de sa nature propre. A loppos, on considrera comme extrinsques lesinformations qui concernent la mise en relation des objets entrant dans la constitution duneinstance de la construction dans une production donne. On se place dans une perspectiveo les constituants et la construction, chacun en tant quobjets, entretiennent une formespcifique de relation, qui peut se raliser sous la forme de diverses occurrences possibles de laconstruction (et de ses constituants donns dans un nonc donn). Par exemple, le fait quunaccord en genre entre un nom et un adjectif soit lune des caractristiques notables dun SN(entre autres) est extrinsque au SN puisque cela concerne les qualits de ses constituants.

    Lune des consquences notables de cette distinction est que les caractristiques intrinsquessont parfaitement rgulires aux constructions (un SN a toujours un genre, un SV a tou-jours un mode), alors que les caractristiques extrinsques sont variables en fonction desoccurrences (un certain SN peut tre introduit grce un ensemble donn dindices dont parexemple laccord en genre entre nom et adjectif, alors quune autre instance de SN peut treintroduite sans que cet indice ne soit relev, par exemple si ce dernier SN ne contient pasdadjectif). Pour tre plus prcise, ce ne sont pas les caractristiques extrinsques elles-mmes

    32Cette terminologie est introduite dans [Gunot, 2005a] ; on trouve chez dautres auteurs ce mme proposmention dune opposition entre informations statiques et dynamiques, entre traits et proprits, maisnous avons estim que les termes intrinsque et extrinsque rpondaient plus prcisment cette dichotomie.

    33http ://atilf.atilf.fr

    22

  • 1. Grammaire

    qui sont variables dans une construction, mais cest leur instanciation qui dpend des donnesproduites analyser.

    Autrement dit, on fera une distinction au sein des constructions entre leurs caractristiquesintrinsques, qui sont stables et inhrentes leur nature, et leurs caractristiques extrinsques,qui sont variables et dpendent de la nature de leurs constituants et des relations quils entre-tiennent.

    1.1.2 Reprsentation

    Comme lillustre la fig. 10, chaque construction est reprsente sous la forme dune bote, quiporte un cartouche contenant son identifiant permettant de la situer de faon unique dans lagrammaire, et est organise en deux parties, la manire de la reprsentation traditionnellede CxG (p.ex. dans [Mathieu, 2003] ou [Kay & Fillmore, 1999]), lgrement adapte. Le blocsuprieur de la bote contient les informations intrinsques, et le bloc infrieur les informationsextrinsques. Lhritage (indiqu dans lidentifiant) fait rfrence la (aux) construction(s)dont la prsente hrite en mentionnant son (ses) tiquette(s), et sopre par unification ducontenu des constructions.

    Informationsintrinsques

    Informations extrinsques

    Identifiant

    Fig. 10 Forme de base de la reprsentation dune construction dans la grammaire.

    1.1.3 Exemple

    Prenons un exemple de la grammaire prsente en partie 2 : la construction reprsentant leSyntagme Nominal dtermin (fig. 11).

    23

  • Chapitre 2. Architecture du formalisme

    SN-dHerit SN-x

    intr.

    26666666666664

    id

    266664c.i. 1 , 2

    traits

    264genre1 .genre unionsq 2 .genre

    nombre

    1 .nombre unionsq 2 .nombre

    375377775

    syn

    "spcifieur 2tte 1

    #

    37777777777775Majeur 2DetPrcdence 2 1Adjacence 2 1Accord 1 .genre ; 2 .genre

    1 .nombre ; 2 .nombre

    Fig. 11 Exemple de construction : Le Syntagme Nominal dtermin.

    On voit que cette construction est organise en trois parties : le cartouche en haut gauche quipermet didentifier la construction, puis les deux blocs qui reoivent les informations intrin-sques, et les informations extrinsques de la construction. Nous laissons de ct pour linstantce qui concerne la forme et le contenu prcis de ces blocs, nous y reviendrons dans les sectionsqui suivent.

    1.2 Identifiant

    1.2.1 Dfinition

    Lidentifiant est lensemble dinformations qui permet de dsigner dune manire unique et deplacer chaque construction dans la grammaire. Il est constitu de deux informations :

    Ltiquette de la construction (son nom en quelque sorte),

    Lhritage de la construction dans la hirarchie de la grammaire.

    Cest lensemble constitu de ces deux informations qui doit permettre de dsigner lobjet sousune forme unique, et non sa seule tiquette. Par exemple, on pourra avoir deux constructionspartageant une mme tiquette (p.ex. un nom lexical et un nom syntaxiquement construitcomme on le verra dans nos lments de grammaire en partie 2) mais nayant pas le mmehritage (et vice versa, bien entendu).

    1.2.2 Reprsentation

    Comme on la dit plus haut, lidentifiant prend la forme dun cartouche accol aux deuxblocs de la construction contenant ses informations intrinsques et extrinsques. La liste des

    24

  • 1. Grammaire

    constructions hrites est prcde de lattribut herit, et les objets de la liste sont lis pardes et logiques ().

    1.2.3 Exemple

    Si lon reprend lexemple prcdent (fig. 11), on peut y voir que la construction a reu lti-quette SN-d, et quelle hrite dune autre construction dont ltiquette est SN-x (ce qui signifieque les informations dfinissant SN-x seront unifies avec celles prsentes ici). On reproduit ledtail de lidentifiant en fig. 12.

    SN-dHerit SN-x

    Fig. 12 Exemple didentifiant dans le Syntagme Nominal dtermin.

    1.3 Informations intrinsques

    1.3.1 Dfinition

    Les informations intrinsques sont constitues, comme on vient de le voir, de lensemble descaractristiques inhrentes la construction dfinie. Elles ont pour spcificit dtre stables,cest--dire rgulires indpendamment de leur formes effectives possibles.

    1.3.2 Reprsentation

    Les informations intrinsques sont reprsentes sous la forme dune structure de traits, tout fait classique et telle que prsente par exemple dans [Abeill, 1993]. Lorganisation desinformations au sein de cette structure de traits dpend non pas du formalisme, mais de lagrammaire 34.

    Les structures peuvent tre rentrantes, ce qui sera reprsent par des index selon la conventionen usage en HPSG notamment, sous la forme 1 , 2 , etc. Ces index peuvent galement treutiliss dans les informations extrinsques de la construction.

    Chaque attribut peut recevoir une valeur atomique ou complexe. La valeur dun trait peut enoutre tre le rsultat dune opration, dans laquelle il est possible dutiliser lun des oprateurssuivants :

    Loprateur de slection, symbolis par le point ., comme par exemple dans

    Adj.genre

    34Nous dtaillons lorganisation qui concerne la grammaire prsente ici au chapitre 3 1.

    25

  • Chapitre 2. Architecture du formalisme

    qui fait rfrence au trait de genre dun objet de catgorie Adj, ou dans

    N.[type propre]

    qui fait rfrence un objet de catgorie N et dont le type de valeur propre.

    La ngation, symbolise par . Par exemple,

    Adj

    fait rfrence un objet dont la catgorie nest pas Adj.

    Le et logique, symbolis par . Par exemple,

    [genre masculin] [nombre singulier]

    fait rfrence un objet dont le genre est masculin et le nombre est singulier.

    Le ou exclusif symbolis par w. Par exemple,

    [genre masculin]w[nombre singulier]

    fait rfrence un objet dont le genre est masculin ou bien dont le nombre est singulier,mais qui ne porte pas ces deux caractristiques la fois.

    Le ou inclusif symbolis par ou par le point-virgule ;. Par exemple,

    [genre masculin] [nombre singulier]

    fait rfrence un objet dont le genre est masculin ou dont le nombre est singulier, ouencore qui porte ces deux caractristiques.

    Loprateur dunification 35 reprsent par unionsq. Par exemple,

    [genre masculin ; fminin] unionsq [genre masculin]

    produira[genre masculin]

    alors que pour[genre masculin] unionsq [genre fminin]

    lunification chouera.

    Enfin, nous avons ajout un oprateur binaire que nous appelons dalternative, symbolispar ? : . Il sagit dune notation choisie en rfrence lopration ternaire correspondantepar exemple en C/C++, qui se note

    x = a ? b : c35Telle que dfini par [Colmerauer, 1975], [Kay, 1979].

    26

  • 1. Grammaire

    et se lit si a est vrai alors x = b, sinon x = c. Pour ce qui nous intresse, x est un attribut,et a ? b : c est la valeur qui lui est affecte. Nous lavons rduit un oprateur binaire parceque dans notre cas, a quivaut b existe, et on en a donc fait une opration binaire pourde simples raisons de lisibilit afin dviter les rptitions sous la forme b ? b : c. Dans cecas donc, b est la fois une condition de vrit et une valeur affecter. Lalternative sert exprimer, par exemple dans

    x =?b : c

    que lon affecte x la valeur de b la condition que b existe, et dans le cas contraire on affecte x la valeur de c. Si c non plus nexiste pas, alors x recevra une valeur indtermine : ilsera sous-spcifi. Par exemple, dans la description du syntagme verbal attribut de lobjet(chapitre 6 2.3.1), on voit que la valeur du dpendant de la relation objet direct (obj-dir)de la construction est

    ? 2 : 1 .obj-dir|dpendant

    Cela signifie que si lobjet index 2 fait rfrence un objet prsent alors lattribut d-pendant le prendra pour valeur, mais sil ne fait pas rfrence un objet prsent alors ilprendra pour valeur une rfrence au dpendant de lobj-dir de lobjet index 1 . Si cedernier nexiste pas non plus, alors notre trait ne sera pas spcifi.

    1.3.3 Exemple

    Reprenons lexemple du SN dtermin prsent en fig. 11 ; on en reproduit les informationsintrinsques en fig. 13.

    intr.

    26666666666664

    nature

    266664c.i. 1 2

    traits

    264genre1 .genre unionsq 2 .genre

    nombre

    1 .nombre unionsq 2 .nombre

    375377775

    syn

    "spcifieur 2tte 1

    #

    37777777777775Fig. 13 Exemple dinformations intrinsques dans le Syntagme Nominal dtermin.

    On y voit que les informations intrinsques (intr.) cette construction sont organises endeux parties : dune part sous un attribut id (pour identit), dautre part sous un attributsyn (pour syntaxe) 36. La valeur de chacun deux est complexe. Dans les traits did, laconstruction reoit deux informations, une premire dont lattribut est c.i. (pour constituantsimmdiats) et qui a pour valeur une liste dindex (qui font en loccurrence rfrence desobjets indiqus dans les informations extrinsques), et une seconde dont lattribut est traitset dont la valeur, complexe, est forme dun genre dont la valeur est le rsultat de lunificationdes valeurs de genre des deux objets indexs 1 et 2 , et dun nombre dont la valeur est le

    36Les choix concernant lorganisation de la structure de traits sont prsents au chapitre 3 1 ; ce nest paslobjet du prsent chapitre de les expliquer.

    27

  • Chapitre 2. Architecture du formalisme

    rsultat de lunification des valeurs de nombre de ces mmes objets. Enfin, sous lattributsyn figure un attribut tte qui a pour valeur lindex 2 et un autre spcifieur qui a pourvaleur lindex 2 .

    1.4 Informations extrinsques

    1.4.1 Dfinition

    Comme on la vu plus haut, les informations extrinsques sont celles qui correspondent lamise en relation dobjets permettant dintroduire une construction donne dont ils sont lesconstituants. Elles forment le pivot de la grammaire puisque ce sont elles qui vont permettrelanalyse des noncs. Et cest la faon dont les objets sont mis en relation via lexpression deces informations extrinsques qui constitue lune des caractristiques fondamentales, sinon lacaractristique centrale, de GP.

    Proprits. Dans le formalisme, les informations relationnelles ne consistent pas sim-plement en lexpression de la constituance ou de la dpendance, considrs comme des blocshomognes 37. Il sagit ici de pouvoir isoler au sein de ces deux notions chacun des indices quipermettent de dduire lune ou lautre, et de regrouper ces indices possibles en relations-types,que lon appelle proprits. Cest ce que [Blache, 2001] appelle lencapsulation de linforma-tion linguistique. Il sagit du mme principe que celui de la dissociation des rgles de rcritureglobales en dominance immdiate dune part et prcdence linaire dautre part qui a tpropose en GPSG par [Gazdar et al., 1985], mais cette dissociation est ici applique dautresrelations existantes que ces deux-l. On va pouvoir utiliser un ensemble de proprits de diverstypes (notamment de constituance, de cooccurrence, de position et de dpendance 38) afin dedcrire avec prcision chacun des indices caractrisant une construction.

    Les diffrents types de proprits ne sont pas hirarchiss entre eux (et les proprits ne sontpas non plus hirarchises entre elles), ou tout au moins ne le sont pas a priori (nanmoinson peut imaginer assez facilement quils gagneraient pouvoir ltre, et comme le montrent[Blache et al., 2006] il semble que certains types de relations soient plus importants que dautrespour lanalyse dune production linguistique par un locuteur). Toutefois, si la possibilit dunehirarchisation des types de proprits (et/ou des proprits elles-mmes) relve du formalismeGP, le contenu de la hirarchie dpendra de la thorie formalise ( chaque grammaire formellecorrespond un jeu de types de proprits qui sorganisent en un systme, et les poids relatifsde chacun des types dpend directement de lensemble).

    Cette faon dexprimer les relations entre objets constitue selon nous une approche tout faitdistincte des autres modes de reprsentation de la structure linguistique que lon a pu rencon-

    37Quoique lon pourrait les exprimer ainsi si telle le voulait une thorie donne.38Initialement, [Bs & Blache, 1999] classaient les proprits en trois grands types : existence ( les pices

    qui [...] composent un nonc - cela correspond notre constituance et la dominance immdiate de[Gazdar et al., 1985]), linarit ( leur ordre notre position, et la prcdence linaire de [Gazdar et al.,1985]) et flchage ( les liens entre les pices). Nous considrons que la notion de lien est bien trop floue(toute relation est un lien) et prfrons distinguer les deux autres sortes que lon propose : dpendance dunepart, cooccurrence dautre part.

    28

  • 1. Grammaire

    trer, et cest prcisment cette particularit qui confre GP sa grande flexibilit dexpressionmais aussi danalyse, en permettant de prendre en compte tous les indices disponibles, quelleque soit leur quantit.

    1.4.2 Reprsentation

    A une grammaire donne correspond un ensemble de proprits dfini au dpart. En effet, ilappartient chaque grammaire choisir les relations quelle souhaite pouvoir exprimer entreles objets, ainsi que la faon dont ces relations fonctionnent (ce dernier point fait lobjet de laspcification, cf. 2). Elles sont en revanche toujours exprimes sous la mme forme : dans untableau dont la premire colonne indique le type de proprit et dont la seconde indique lesproprits correspondant ce type et impliquant des constituants possibles de la construction.

    Une construction donne ne doit pas ncessairement contenir des proprits de tous les typespossibles de la grammaire, et pour chaque construction il peut figurer plusieurs proprits dumme type, sans limitation de nombre. Les proprits ne sont pas ordonnes entre elles, demme que les types de proprits entre eux. Les objets mentionns dans les proprits peuventtre indexs ( 1 , 2 ,...), auquel cas ils font rfrence aux mmes objets que dans les propritsintrinsques de la construction.

    1.4.3 Exemple

    Intressons-nous une nouvelle fois lexemple du SN dtermin (fig. 11) : nous reproduisonsle contenu de ses informations extrinsques ci-dessous en fig. 14.

    Majeur 2DetPrcdence 2 1Adjacence 2 1Accord 1 .genre ; 2 .genre

    1 .nombre ; 2 .nombre

    Fig. 14 Exemple dinformations extrinsques dans le Syntagme Nominal dtermin.

    Sans entrer dans le dtail de la signification de ces proprits 39, on remarque que cetteconstruction prsente des proprits de quatre types : Majeur, Prcdence, Adjacence et Ac-cord. Les trois premiers types portent chacun une proprit, et le quatrime en porte deux.En outre, la premire proprit ne mentionne quun seul objet, alors que les suivantes enmentionnent chacune deux. Toutes ces proprits font rfrence des objets en utilisant leursindex, et lon voit dans la proprit Majeur que lobjet index 2 correspond un Det (pourdterminant). On voit galement que les deux proprits dAccord sintressent une sous-partie des objets auxquels ils font rfrence : les traits de genre pour la premire, ceux denombre pour la seconde.

    En plus de la reprsentation formelle des proprits au sein des constructions, on a besoin39Elles sont dfinies dans la prsentation du modle qui en fait usage, chapitre 3 2.

    29

  • Chapitre 2. Architecture du formalisme

    pour en connatre le fonctionnement de faire rfrence leur spcification. Cest ce que lonprsente dans la section qui suit.

    2 Spcification des proprits

    La mise en place de la spcification des proprits, initialement prsente dans [Vanrullen et al.,2003], est issue de deux origines. La premire est un travail de systmatisation de lexpressiondes proprits afin de pouvoir rpondre des questions comme Est-ce que le jeu de propritspropos dans [Blache, 2001] est le seul possible ? , Quest-ce qui justifie que lon introduiseune nouvelle proprit ? , Sur quoi se base-t-on pour dfinir une nouvelle proprit ? , etc. Atravers une srie de tests sur les caractristiques de chacun des types de proprits (combien demembres mettent-ils en jeu, est-ce que les objets sont ordonns ou pas, est-ce que la ngationde la proprit a un sens, comment value-t-on chacun des types et quoi se rfre-t-on, peut-on exprimer la mme chose diffremment et alors sous quelle forme, etc.), on a progressivementdgag un certain nombre dinvariants des diffrents types de proprits. A la suite de cela ona pu dfinir avec plus de prcision les critres selon lesquels la dfinition dun type de propritest ncessaire, de remettre en question sur cette base la dfinition des proprits initialementutilises dans les premires applications de GP, et finalement de dfinir une srie de nouvellesproprits 40.

    La seconde origine est un travail que nous avons men en coopration avec Tristan Vanrullen,visant concevoir une implmentation de GP qui exploite rellement les capacits du forma-lisme et soit utilisable et intressante aussi bien du point de vue informatique que du pointde vue linguistique. En loccurrence, il sagissait de rendre rellement possible dimplanter desgrammaires issues de modles linguistiques diffrents dans un mme parseur. A cette fin il at ncessaire de commencer par isoler les informations qui devaient faire lobjet dun dve-loppement linguistique, et qui devaient donc rester accessibles et modifiables lors de chaqueimplantation de grammaire, des informations qui relevaient du mcanisme danalyse gnralet qui devaient rester stables dune utilisation lautre. Il ne sagit pas l dune questiontriviale, puisque lenjeu tait de permettre une implantation simple et systmatise des diff-rentes grammaires GP et ainsi den permettre, notamment, une valuation et une comparaisonsimplifies 41.

    Architecture gnrale. La spcification des proprits est une seconde ressource, sparede la premire (la grammaire) mais qui y est directement lie. Elle permet de dfinir lidentitet le fonctionnement de chacun des types de proprits utiliss dans la grammaire laquelleelle correspond.

    Cette spcification rend possible de faire varier le fonctionnement (et donc linterprtation,

    40Elles sont utilises en Partie 2 et prsentes au chapitre 3 2.41Lobjectif a t en grande partie rempli par lanalyseur SeedParser (cf. [Vanrullen, 2005]) et de lenvi-

    ronnement de dveloppement de grammaire associ Accolade (cf. [Gunot & Vanrullen, 2003]) dans lesquelson a pu implanter un certain nombre de grammaires relevant de thories fort diffrentes, dont notamment uncertain nombre de versions de celle prsente en partie 2, ainsi que la grammaire ralise pour les besoins dela campagne EASY (cf. annexe ??) qui prsente des caractristiques tout fait diffrentes du prsent travail.

    30

  • 2. Spcification des proprits

    la signification) de chaque type de proprit en fonction des besoins, tout comme de crer denouveaux types, en utilisant un attirail formel ddi. La ressource se prsente sous la formedun ensemble de dfinitions de type de proprit (2.1), qui sont chacune constitues dedeux parties : on commence par donner lidentit et la forme du type de proprit (2.2),puis on donne ses conditions de disponibilit et de satisfaction (2.3). On donne une vuedensemble de cette organisation en fig. 15.

    Spcification

    Forme et Identit Conditions

    Dfinition de type de proprit

    Nom

    Symbole

    Termes CapacitCondition d'valuation

    Condition de satisfactionCommutativitRflexivit

    autresdfinitions...

    Fig. 15 Architecture la spcification des proprits.

    2.1 Dfinition de type de proprit

    2.1.1 Dfinition

    A chaque relation-type que lon souhaite utiliser dans une grammaire donne, on fait corres-pondre une dfinition de type de proprit. Celle-ci renferme toutes les informations permet-tant de lire et dcrire des proprits dans la grammaire (dans les informations extrinsquesdes constructions) et dutiliser ces proprits pour effectuer des analyses de productions.

    On introduit dans une spcification autant de dfinitions de type de proprit que lon utilisede types de proprits dans la grammaire laquelle la prsente ressource est lie. En fait onpeut tout fait y faire figurer plus de dfinitions de type de proprit diffrentes quon nutilisede types de proprits dans la grammaire, mais ceci naurait que peu dintrt. A linverse onne peut pas utiliser de type de proprit dans la grammaire qui nait pas reu de dfinitiondans la spcification correspondante.

    31

  • Chapitre 2. Architecture du formalisme

    Les indications fournies dans les dfinitions servant lire et crire des proprits figurentdans un ensemble dinformations que lon appelle forme et identit (2.2), celles servant dfinir leur comportement figurent dans un autre ensemble dinformations que lon appelleconditions (2.3).

    2.1.2 Reprsentation

    Dans la spcification, chaque dfinition de type de proprit prend la forme dune bote danslaquelle on fait figurer lensemble des informations ncessaires sa dfinition, comme pr-sent en fig. 16. Toutes ces informations doivent obligatoirement apparatre dans chacune desdfinitions.

    Nom du type de propritSymbole Symbole utilisTermes Liste des termesRflexivit Obligatoire Y Autorise Y InterditeCommutativit Vrai Y FauxDisponibilit Condition de disponibilit des proprits du typeSatisfaction Condition de satisfaction des proprits du typeCapacit Capacit des proprits du type

    Fig. 16 Forme de base dune dfinition de type de proprit dans la spcification.

    Comme on le voit en fig. 16, le nom du type de proprit est mis en exergue dans un cartoucheau-dessus du reste des informations (bien quil fasse partie du bloc du dessous en ralit).Suit un tableau en deux parties, contenant dabord les informations de forme et didentit dutype de proprit, ensuite ses conditions. Nous voyons dans ce qui suit le dtail de contenu dechacun.

    2.1.3 Exemple

    Pour illustrer notre propos, prenons lexemple de la proprit de Prcdence que lon dfinitdans la spcification correspondant la grammaire prsente en Partie 2 (fig. 17).

    PrcdenceSymbole Termes 1Construction 2ConstructionRflexivit InterditeCommutativit FauxDisponibilit 1 = disponible 2 = disponibleSatisfaction 1 .index.debut < 2 .index.debutCapacit

    Fig. 17 Exemple de dfinition de type de proprit : la Prcdence.

    Sans entrer dans le dtail de la signification des informations (qui font lobjet des sections quisuivent), on peut y lire que cet objet est une dfinition dun type de proprit dont le nom

    32

  • 2. Spcification des proprits

    est Prcdence, et quelle est effectivement dfinie par lensemble complet des informationsfigurant dans la structure de base des dfinitions de type de proprit (fig. 16).

    2.2 Forme et identit

    2.2.1 Dfinition

    Cette premire partie de la spcification introduit les informations qui permettent de recon-natre un type de proprit au sein de lensemble quils constituent et de le reprsenter dansla grammaire (cest--dire de pouvoir crire et lire des proprits dans la grammaire). On ymentionne les informations suivantes :

    Son nom, qui doit tre unique pour un jeu de proprits donn puisque cest lui qui permetdidentifier le type parmi les autres. P.ex. Prcdence ou Exigence.

    Le symbole utilis pour reprsenter les proprits de ce type (qui doit lui aussi tre uniquepour un jeu de proprits), p.ex. pour la Prcdence ou pour lExigence.

    La liste des termes utiliss dans chaque proprit de type. Cette liste indique la fois lenombre dobjets que la proprit manipule ( travers le nombre dobjets figurant dans laliste) ainsi que leur identit : les proprits peuvent faire rfrence soit des informationsextrinsques (i.e. des proprits), soit des informations intrinsques (i.e. des structures detraits), soit des constructions compltes (i.e. des ensembles intrinsques + extrinsques).Pour chacune de ces possibilits, les termes peuvent faire rfrence soit une partie delobjet (p.ex. le trait de genre dun N), soit un objet complet (p.ex. les SN), soit encore un ensemble dobjets (p.ex. les objets dont le nombre est pluriel, ou alors une liste comme(SN Y N Y Adj)).

    On ajoute la liste prcdente une information qui permet de savoir si les termes quelon a introduits peuvent faire rfrence un mme objet ou non, cest--dire si les termespeuvent (voire, doivent) tre rflexifs ou pas. Par exemple, on peut avoir besoin dans unegrammaire dexprimer des proprits dExclusion qui prendraient la forme 1V 6 1 .temps,ce qui signifierait que le Verbe index 1 ne peut porter de trait de temps. A linverse, dansune autre grammaire les proprits dExclusion pourraient interdire la rflexivit des termes,de manire ce quune proprit telle que 1V 6temps permette dexprimer que le Verbeindex 1 exclut la prsence dobjets portant un trait de temps lexception de lui-mme(qui peut en porter un).

    Enfin, on indique si les termes sont ordonns entre eux ou non, i.e. si la proprit estcommutative ou pas. P.ex. les termes dune proprit de Prcdence sont ordonns puisqueDet N (le Dterminant prcde le Nom) et N Det (Le Nom prcde le Dterminant)nont pas la mme interprtation, alors que ceux dune proprit dAdjacence ne le sont paspuisque Det N (le Dterminant est adjacent au Nom) signifie, tout comme N Det(le Nom est adjacent au Dterminant), que Det et N doivent tre contigus, quel que soitleur ordre relatif.

    33

  • Chapitre 2. Architecture du formalisme

    La position relative des termes peut avoir une pertinence linguistique sans avoir de signifi-cation formelle. Par exemple, lordre dune proprit dAccord nest pas important pour sonvaluation (il sagit de vrifier la correspondance de valeurs de traits entre deux objets), maiselle a un sens en linguistique : on dit que cest ladjectif qui saccorde avec le nom et non lecontraire. On a convenu dordonner donc les termes des proprits dAccord, le premier tantcelui qui pose la valeur et le second celui qui doit saccorder (i.e., on note par exemple N ;Adj pour signifier que cest ladjectif qui saccorde avec le nom 42 (ou, en dautres termes, quecest le nom qui impose ses marques ladjectif do le sens de la flche symbolisant larelation).

    2.2.2 Reprsentation

    Comme on la vu en fig. 16, les informations de forme et didentit se prsentent dans lareprsentation sous la forme dun tableau dans lequel figurent en colonne de gauche le nomde linformation (symbole, termes, etc.) et dans cette de droite les valeurs propres chacunede ces informations pour le type qui nous intresse. Seule exception ceci, le nom du type deproprit, qui est mis en exergue dans un cartouche en haut gauche de la boite reprsentantla dfinition. Voyons plus prcisment quelle est la forme de chacune de ces valeurs :

    Le nom du type de proprit permet de lidentifier de manire unique dans la spcification.La plupart du temps on sefforce dattribuer aux types de proprits qui noms qui sefforcentdindiquer de quelle relation il sagit.

    Le symbole doit tre un symbole qui nest pas utilis par ailleurs (p.ex. il ne peut tre le quon utilise pour exprimer le et logique), et doit tre galement spcifique chaque typede proprit 43.

    Les termes se prsentent sous la forme dune liste dobjets lis entre eux par des . Chacunde ces termes reoit deux informations : dune part un index (de la mme forme que les in-dex dans la grammaire, i.e. 1 , 2 , etc. mais ces index-l ne font pas rfrence aux mmesindex que ceux de le grammaire) et dautre part la spcification de la nature des objetspouvant tre impliqus dans la relation qui nous intresse. Cette nature peut tre, commeon la dit prcdemment, Construction quand les objets manipuls sont des constructionscompltes, Intrinsque quand les objets sont exclusivement des informations intrinsques, ouExtrinsque quand les objets sont exclusivement des informations extrinsques. La mentionde Construction indique que lon peut faire rfrence aux trois types : soit des construc-tions entires (en mentionnant leur tiquette), soit des informations intrinsques, soit desinformations extrinsques.

    42Mais cet ordre na pas de valeur formelle, et dans la pratique si lon crit N; Adj ou Adj; N lvaluationsera la mme.

    43Rien ne ly contraint formellement, mais cest prfrable pour dvidentes raisons de lisibilit des pro-prits. On peut toutefois imaginer surcharger un symbole tout comme on surchargerait une fonction enprogrammation, en utilisant un mme symbole pour deux proprits dont la signification linguistique seraitproche, mais les dfinitions diffrentes (p.ex. entre une proprit dExclusion Absolue qui mentionnerait unterme unique, et une autre dExclusion Relative qui mentionnerait des restrictions de cooccurrence relatives certains constituants prsents, donc deux termes.)

    34

  • 2. Spcification des proprits

    La rflexivit peut prendre trois valeurs : Obligatoire, Autorise ou Interdite, chacun deces termes explicitant clairement leur signification. Concrtement, une rflexivit obliga-toire impose que les valeurs dindex des termes soient gales (cest--dire que n .index =n+1 .index) ainsi que les valeurs dtiquette (cest--dire que n .etiq = n+1 .etiq) 44, unerflexivit interdite impose que ces mmes valeurs soient diffrentes dun terme lautre(cest--dire que n .index 6= n+1 .index) ainsi que les valeurs dtiquette (cest--dire quen .etiq 6= n+1 .etiq) 45, et une rflexivit autorise nimpose aucune contrainte ce propos.

    Ajoutons cela que dans une proprit plusieurs termes, on pose que tn 6= tn+1. Cela signifienon pas que les deux termes doivent tre de nature diffrente (ils peuvent tous deux tre desSN, p.ex.), mais quils ne doivent pas correspondre un mme objet, ce qui revient dire que(tn.index 6= tn+1.index) (tn.etiquette 6= tn+1.etiquette).

    La commutativit, enfin, porte la valeur Vrai quand les termes ne sont pas ordonns entreeux, et Faux quand il sont ordonns.

    2.2.3 Exemple

    Reprenons notre exemple de Prcdence prsent en fig. 17 : nous rappelons le dtail de sesinformations de forme et didentit en fig. 18.

    PrcdenceSymbole Termes 1Construction 2ConstructionRflexivit InterditeCommutativit Faux

    Fig. 18 Dfinition de type de proprit : forme et identit dune proprit de Prcdence.

    On y voit que le nom de la proprit est Prcdence comme on lavait vu plus haut ; on yvoit galement que le symbole utilis pour reprsenter des proprits de ce type sera , queles proprits compteront deux termes qui seront chacun des rfrences des constructionsdistinctes (puisque la rflexivit est interdite), et dont lordre sera pertinent (puisque le typenest pas commutatif).

    44Si 1 et 2 ont le mme index et deux tiquettes diffrentes il sagit de deux objets linguistiques simultans(dans le cas dune analyse multimodale p.ex.) ; sils ont la mme tiquette et des index diffrents il sagit dedeux objets successifs (comme les deux adjectifs dans (9)) ; la conjonction des deux diffrences de valeurs rendimpossible que les deux membres fassent rfrence au mme objet.

    45Cest la conjonction de ces deux diffrences qui importe : on ninterdit pas les termes portant la mmetiquette mais des index diffrents, ou le mme index mais des tiquettes diffrentes.

    35

  • Chapitre 2. Architecture du formalisme

    2.3 Conditions

    2.3.1 Dfinition

    Ce que lon rassemble dans les conditions sont les informations qui permettent non pasdcrire (et de lire), mais dinterprter les proprits, cest--dire ce qui concerne leur fonc-tionnement. On y indique trois informations :

    La condition de disponibilit dtermine les conditions dans lesquelles une proprit dutype donn peut tre value ou non, tant donne une entre observe. Par exemple, dans ladescription du SN dune grammaire figure une proprit dAccord entre le nom et ladjectif(qualificatif) ; or dans une entre telle que (8),(8) la maison de mon frre

    il figure bel et bien un nom, mais pas dadjectif : la proprit dAccord sus-cite nest doncpas pertinente pour la caractrisation du SN, ce qui se traduit formellement par le faitquelle ne remplit pas la condition de disponibilit pour lentre observe.

    La disponibilit dune proprit dpend directement de la disponibilit des termes qui lacomposent : pour quune proprit remplisse sa condition de disponibilit, il faut que le (oules) membre(s) ncessaire(s) son valuation soi(en)t lui-mme (eux-mmes) disponible(s),i.e., prsent(s). Tous les termes dune proprit nont pas forcment tre disponibles pourque la proprit elle-mme soit disponible : pour quune contrainte dAccord soit disponible ilfaut effectivement que les deux termes soit prsents, mais pour quune contrainte dExigence(par exemple N Det) soit disponible, seul le premier terme de la proprit (N) doit tredisponible ; de la prsence ou labsence du second (Det) dpendra sa satisfaction, mais sadisponibilit est dj tablie par la prsence du premier.

    La condition de satisfaction, comme son nom lindique, permet quant elle de signifierquelles conditions doivent tre remplies pour quune proprit du type donn soit satisfaite(pour reprendre lexemple de lAccord, sil est vrifi), sinon viole (si les objets ne sac-cordent pas). Lors dune analyse, elle nest videmment observe que pour les propritsqui ont rempli leur condition de disponibilit (lAccord entre adjectif et nom ne peut treni satisfait ni viol pour (8) puisquil ny a pas dadjectif).

    Elle peut elle-mme porter soit sur la disponibilit dun terme (p.ex. la satisfaction duneproprit dExigence dpend de la disponibilit de son second terme : sil est prsent alorselle est satisfaite, sil ne lest pas alors elle est viole), soit sur tout ou partie des informa-tions correspondant aux objets auxquels les termes font rfrence (p.ex. les index pour unePrcdence).

    Enfin, la capacit indique le nombre de fois quune mme proprit du type concern peuttre value pour une mme construction caractrise. P.ex. dans un SN tel qu