9
L'ANALYSE FACTORIELLE DANS L'ÉLABORATION DE,S ENTRÉES DE DICTIONNAIRE UGO BERNI CANANI Je vous ai parlé précédemment d'une curiosité liée à la série de Waring; je vous en présenterai maintenant une autre liée à l'analyse factorielle. Il s'agit d'une application de cette technique en vue de la rédaction d'articles de dictionnaire. Supposons que nous ayons un ensemble de mots associés d'une façon paradigmatique au mot devant faire l'objet de l'ar- ticle. On peut les représenter comm-e les noeuds d'un graphe en reliant entre eux ceux entre lesquels il y a une relation paradig- matique. S'il y a beaucoup de mots et beaucoup d'associations le résultat sera un graphe assez compliqué. Le problème est de le dessiner de la façon la plus claire possible, en essayant de mini- miser les enchevêtrements, de façon à mettre en évidence les différentes aires sémantiques qui peuvent exister dans l'ensemble. Ce n'est pas simple. Il y a un article d'un illustre spécia- liste d'analyse combinatoire, W.T. Tutte, intitulé Comment des- siner un graphe. Or l'analyse factorielle se révèle justement un instrument très utile pour donner une bonne représentation des. graphes. Voici quelques exemples. Le premier est constitué par un ensemble de termes associés à la notion de droit. Le graphe correspondant a été traité avec deux méthodes d'analyse facto- rielle: l'analyse des correspondances et l'analyse en composantes principales. Sur la planche 1 on peut voir le résultat obtenu

L'ANALYSE FACTORIELLE DANS L'ÉLABORATION DES ENTRÉES …

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: L'ANALYSE FACTORIELLE DANS L'ÉLABORATION DES ENTRÉES …

L'ANALYSE FACTORIELLE DANS L'ÉLABORATION DE,S ENTRÉES DE DICTIONNAIRE

UGO BERNI CANANI

Je vous ai parlé précédemment d'une curiosité liée à la série de Waring; je vous en présenterai maintenant une autre liée à l'analyse factorielle. Il s'agit d'une application de cette technique en vue de la rédaction d'articles de dictionnaire.

Supposons que nous ayons un ensemble de mots associés d'une façon paradigmatique au mot devant faire l'objet de l'ar­ticle. On peut les représenter comm-e les noeuds d'un graphe en reliant entre eux ceux entre lesquels il y a une relation paradig­matique. S'il y a beaucoup de mots et beaucoup d'associations le résultat sera un graphe assez compliqué. Le problème est de le dessiner de la façon la plus claire possible, en essayant de mini­miser les enchevêtrements, de façon à mettre en évidence les différentes aires sémantiques qui peuvent exister dans l'ensemble. Ce n'est pas simple. Il y a mêm~e un article d'un illustre spécia­liste d'analyse combinatoire, W.T. Tutte, intitulé Comment des­siner un graphe. Or l'analyse factorielle se révèle justement un instrument très utile pour donner une bonne représentation des. graphes. Voici quelques exemples. Le premier est constitué par un ensemble de termes associés à la notion de droit. Le graphe correspondant a été traité avec deux méthodes d'analyse facto­rielle: l'analyse des correspondances et l'analyse en composantes principales. Sur la planche 1 on peut voir le résultat obtenu

Page 2: L'ANALYSE FACTORIELLE DANS L'ÉLABORATION DES ENTRÉES …

80 U go Berni Canani

avec l'analyse des correspondances sur le plan déterminé par les deux premiers axes factoriels. On distingue tJ;ès bien sur le côté droit une région formée par les termes giuridico, jus, legge, norma, legittimità, illegittimità, puis fatto et merita; en haut une autre où apparaissent les mots competenza, interesse, potere; sur la gauche les mots onorario, parcella, compensa; enfin des termes comme credita, bene, casa. On a un dessin qui se présente souvent dans ce type d'analyse et qu'on pourrait appeler une méduse vertébrée. En effet, d'une masse, d'un squelette central, partent plusieurs tentacules. La deuxième planche montre une analyse en composantes principales du même graphe. J'y vois encore sur le premier plan factoriel une méduse, mais cette fois une méduse crustacée: les noeuds les plus denses forment un cercle et les tentacules sont dirigées vers l'intérieur. On peut y retrouver les mêmes régions que dans la première planche. Le graphe qu'on a vu était peut-être trop simple. Passons à un autre plus compliqué. Il s'agit d'un ensemble de mots associés au mot contralto. J'ai réussi, après pas mal d'efforts, à dessiner le graphe que vous voyez sur la planche 3. J'ai même sauté quelques mots pour ne pas le rendre illisible. On peut y voir quand même une région formée par des termes tels que negozio, negoziale, contrattuale, preliminare; une autre où le sens de contralto tend vers les notions de atto à travers accord o, patta, rapporta; encore une autre région où sont représentés des con­trats spécifiques etc. Je voulais séparer ces différentes régions et j'ai essayé de traduire ce que j'aurais fait de façon intuitive. Je tne suis dit: «dans ce dessin je peux voir une sorte de saucisson dont on a relié les deux extrémités par erreur »; un saucisson n'est peut-être pas l'itnage la meilleure, peut-être vaudrait-il mieux parler d'un rôti de veau, d'un rosbif mal ficelé. Il y a en effet une ficelle qui relie deux points qui, dans le morceau/ sont à l'opposé: atto et compravendita. Je voudrais mettre en évidence cette ficelle qui me semble le premier obstacle pour une bonne

Page 3: L'ANALYSE FACTORIELLE DANS L'ÉLABORATION DES ENTRÉES …

A nalyse factorielle et dictionnaires 81

séparation des régions. Le premier essai (planche 4) est fait avec l'analyse des correspondances. On retrouve la méduse vertébrée. Les mots sont représentés par des chiffres: ceux qui sont le plus fortement reliés entre eux se trouvent au centre d'où partent quelques filaments vers des mots périphériques (testamento, com­missione, agenzia etc.). Atto et compravendita sont, hélas, dans la région centrale représentés respectivement par les numéros 7 et 11. Pour les mettre en évidence je devrais couper les filaments périphériques et répéter l'analyse sur la seule masse centrale. Sur la planche 5 on voit le résultat de l'analyse en composantes principales. On a, comme on pouvait s'y attendre, une méduse crustacée où tous les points importants sont sur la surface exté­rieure, les tentacules tendant vers l'intérieur. Le chemin le plus long est exactement celui que je voulais couper: il va du noeud 7 au noeud 11. Si on coupe ce lien et qu'on réitère ce procédé on arrivera à simuler automatiquement la répartition que j'aurais faite intuitivement du rosbif. Avec un procédé un peu plus com­pliqué on peut forcer la situation. Si on applique l'analyse à une matrice dont les lignes représentent les noeuds du graphe et les colonnes les composantes complètes maximales auxquelles ils appartiennent, on a avec l'analyse en composantes principales le résultat figurant sur la planche 6. Le chemin qui relie le point 7 au point 11 est nettement séparé de tous les autres.

Sans doute s'agit-il de 'bricolage' factoriel. Mais il me semble que l'utilisation de procédures automatiques de ce genre pourrait faciliter la tâche de celui qui avec l'analyse de groupes de mots ou de contextes doit rédiger les articles d'un dictionnaire.

Page 4: L'ANALYSE FACTORIELLE DANS L'ÉLABORATION DES ENTRÉES …

PLANCHE 1.

20

0 1 NT ER ESSE.

POTERE 19

13 COMPETENZA

ONORARIO ~161

PARCE LLA17

COMPENSO

PENSIONE: 18

INDENNITA'

5 CREOITO

1 BE:NE:

MERJTO

rATTO l E G 1 T T J M.J TA'

NORMA 1Sg' ILLE:CITTIMJTA'

LECGE~2

1 us 11

CIURIDICO

~

~ c bJ ~ ""t ~ ~.

() ~ ~ ~ ~ ....

Page 5: L'ANALYSE FACTORIELLE DANS L'ÉLABORATION DES ENTRÉES …

MERITO

13

12 LECCE

PLANCHE 2.

COMPETENZA 3

OJ 1 N T E R E S S E 9 POTERE

16 0 N 0 RA RIO

FATTO LE G 1 TT 1 t~ 1 TA'

Il L E C 1 T T 1 M 1 TA' 15

NORMA

20

GIURIDICO -7

1 -lUS

PARCELLA

COMPENSO

PENSfONE 18

INOENNITA'

4 COSA .........

BENE .S .. CREDITO ,$ 1 ..,~

~ ..... "' ~ ~

'< V)

~

--~ ~

"""" 0 -...z ~.

~ ~ ~

~

~

"""" ~ -· ~ """" -· 0 ~ ~ $::1 -· ~ ~ V)

00 \,),)

Page 6: L'ANALYSE FACTORIELLE DANS L'ÉLABORATION DES ENTRÉES …

:s

\.N •

ART ICOLO LEe cr

NOR MA

Tl TOLO

TES MEN TO CLAU SOLA

STABILIRE

PATTUIRE

PArr

TRATT.ARE

CoNTRATTo

rArro

PROCEOIMENTO

ATTO

RAPPORTa

CONVE:NZIONE

COMPRAVENDITA

ACENZI /

OM Mt SSt E

' 1RATTATIVA ACCORoo

,. ~APP~LTO

ACQUISTO

ONTRATTUALE CONTRA

VENDITA NEC OZ JO

ALIENAZIOHE ...__.,

~·z IALE · ,

PRELIMINARE: C OMPROM ESSO

Page 7: L'ANALYSE FACTORIELLE DANS L'ÉLABORATION DES ENTRÉES …

Analyse factorielle et dictionnaires

2

PLANCHE 4.

4

3

5

3

10

13

85

14

Page 8: L'ANALYSE FACTORIELLE DANS L'ÉLABORATION DES ENTRÉES …

S.6

PLANCHE 5.

0 C')

0 7 • •

U go Berni Canani

(\.f N

Page 9: L'ANALYSE FACTORIELLE DANS L'ÉLABORATION DES ENTRÉES …

Analyse factorielle et dictionnaires 87

C') C')

.... ....

lD 1 ~

N~ ....

N

PLANCHE 6.