Reconnaissance de motifs dialogiques approchésasi.insa-rouen.fr/enseignants/~apauchet/Files/Publications/MFI11.pdfCe procédé a été mis en pratique par la recherche de mo-tifs

Reconnaissance de motifs dialogiques approchés

Zacharie Alès†[email protected]

Alexandre Pauchet†[email protected]

† INSA-Rouen, LITIS EA 4108,BP 08 - 76801 Saint-Étienne-du-Rouvray, France

Résumé :Dans le cadre de la modélisation du dialogue, nous pré-sentons une méthode générique permettant l’alignementde motifs approchés en deux dimensions appliquée à desmatrices d’annotations codant des dialogues. L’approcheutilisée, basée sur un algorithme de programmation dyna-mique et une mesure de similarité, permet l’identificationde motifs similaires à un motif de référence.Ce procédé a été mis en pratique par la recherche de mo-tifs récurrents dans des annotations de dialogues entreparents et enfants, lors de la narration d’histoires enfan-tines. Les motifs de référence utilisés sont issus d’un pré-cédent travail [12]. Nous présentons brièvement quelquesexemples d’alignements obtenus à partir d’un motif.Mots-clés : Modélisation du dialogue, reconnaissance demotifs, identification de régularités, programmation dy-namique

1 Introduction

Les systèmes interactifs existants, et plus parti-culièrement ceux intégrant une dimension dia-logique, sont relativement robustes mais peuconviviaux. L’utilisateur doit souvent s’adap-ter à la machine, car les interfaces ne tiennentpas compte de certaines caractéristiques spéci-fiques aux interactions humaines. La difficultémajeure dans la conception de systèmes dialo-giques agréables vient de la modélisation in-adaptée des comportements humains à partir del’analyse de situations réelles.

La problématique est en réalité plus large que lasimple conception d’interfaces dialogiques. Eneffet, la modélisation du dialogue sous toutesses modalités est un domaine dont les champsd’applications sont nombreux et pluridiscipli-naires : informatique (interfaces dialogiques enlangue naturelle, systèmes multi-agents hété-rogènes, jeux vidéo), psychologie (développe-ment socio-cognitif de l’enfant, pragmatiquesdéveloppementales, apprentissage dans l’inter-action), sciences humaines et sociales (forma-tion aux entretiens, à la négociation), biologieet santé (détection de l’autisme, évaluation dela douleur), etc. Cependant, bien que les outilsutilisés diffèrent selon le domaine d’application,la modélisation du dialogue s’appuie en généralsur un corpus de dialogues annotés, dont l’ana-lyse vise à repérer un ensemble de comporte-

ments récurrents significatifs, afin d’être en me-sure de les expliquer (i.e. fournir un modèle).

L’approche adoptée pour étudier ces dialoguesest alors similaire dans la plupart des domaines :

1. Collecte d’un corpus de dialogues en situa-tion, sous forme audio, ou vidéo si la sourced’information multimodale doit être priseen compte. Habituellement, cette collecte sefait au cours d’une expérimentation conçuespécifiquement. Les dialogues sont alors fi-nalisés, et le cadre d’application du modèleest restreint à une tâche.

2. Retranscription des dialogues sous formenumérique, de façon à ce qu’ils soient ar-chivés et puissent être analysés ultérieure-ment. Cette retranscription peut être plus oumoins fine selon les besoins (tours de pa-role, énoncés, onomatopées, pauses, etc.).

3. Annotation des dialogues selon des critèresspécifiques, définis par un schéma de co-dage. Chaque énoncé est décrit par une co-dification prédéfinie (ex : force illocutoireappliquée à une proposition en théorie desactes de langage, grille spécifique en psy-chologie, inflexions de voix, ton, prosodie,mimiques, attitudes, postures, gestes, re-gards, émotions, etc.). En pratique, ce pro-cessus est souvent effectué manuellement.

4. Extraction d’informations à partir des an-notations, consistant souvent à une re-cherche de régularités ou de répétitions,pouvant se faire de manière manuelle, semi-automatique ou automatique. Cette phaseintègre parfois des connaissances spéci-fiques au type de dialogues étudiés.

5. Le modèle des dialogues s’appuie sur les ré-gularités repérées lors de la phase d’extrac-tion d’informations. Il peut être vu commeune banque de motifs caractéristiques repré-sentés sous une forme exploitable informa-tiquement (ex : automates, réseaux de Petri,ensemble de règles, etc.).

6. L’exploitation du modèle, dépend alors dudomaine d’application.

Avec la multiplication des éléments pris encompte par les modèles de dialogues, lesannotations sont maintenant le plus souventmulti-dimensionnelles ([1, 10, 11] présententdes exemples de schémas de codages multi-dimensionnels). Cet article fait suite à un travailprécédent visant à extraire des régularités dansdes annotations multi-dimensionnelles de dia-logues par programmation dynamique [12], cor-respondant à l’extraction d’informations (étape4). Nous nous intéressons ici à la concep-tion d’un algorithme de reconnaissance de mo-tifs dialogiques approchés (collection d’annota-tions multi-dimensionnelles codant chacune unénoncé). L’intérêt de ce travail est double : 1)permettre la recherche d’un motif dialogiquedans un corpus de dialogues et faciliter ainsila conception d’une banque de motifs caracté-ristiques des interactions dialogiques dans uncontexte donné (étape 5) et 2) disposer d’un al-gorithme de reconnaissance de situation dialo-gique (détection de motif) pouvant être intégréà un agent logiciel (étape 6).

Dans la suite de cet article, nous allons toutd’abord donner, en section 2, une description duproblème et du projet dans lequel s’insèrent cestravaux. La section 3 présente un aperçu non ex-haustif des différents modèles de dialogues etnous citerons plusieurs méthodes de reconnais-sance de motifs. La section 4 décrit ensuite laméthode que nous avons développée spécifique-ment pour répondre à notre problème. Dans lasection 5, nous présenterons les résultats obte-nus. Enfin, nous conclurons cet article en don-nant quelques perspectives pour ces travaux.

2 Description du problème

Cet article s’inscrit dans le cadre d’un projet vi-sant à mettre en place un système permettantd’automatiser ou de semi-automatiser les dif-férentes étapes d’analyse d’un corpus de dia-logues : retranscription automatique des énon-cés, annotations semi-automatique suivant dif-férents schémas de codage, extraction de régu-larités dans les annotations et création d’unebanque de motifs dialogiques caractéristiquesd’un corpus de dialogues annotés.

Notre approche se veut générique afin de défi-nir un ensemble d’algorithmes indépendants ducorpus de dialogues étudié et du type d’anno-tations utilisées. Chaque énoncé de chaque dia-logue analysé est codé par un vecteur d’annota-tions, dont les composantes correspondent aux

différents espaces de codage à appliquer auxdialogues. Ainsi, un dialogue sera représenté parune matrice : une ligne par énoncé (tempora-lité verticale), une colonne par espace de codage(dimensionalité horizontale).

Afin d’illustrer cette représentation matricielle,considérons un dialogue fictif entre un guiche-tier et un client dans une gare (voir figure 1).

G Bonjour, que puis-je pour vous ? E I VC Bonjour, un Paris-Rouen. D I MC Vite, s’il vous plait ! D PG Je vérifie... E AG Il y en a un dans 10mn. A AG Je vous sors un billet ? E V

FIGURE 1 – Exemple d’annotations sur trois co-lonnes d’un dialogue fictif guichetier/client

Chaque énoncé est caractérisé par son locuteur(G : guichetier, C : client), une retranscription(ici en énoncés et non en tours de parole) et soncodage suivant 3 colonnes :– La première colonne code l’énoncé par un

type d’acte de langage (E : engageant, D : di-rectif et A : assertif) [31].

– La seconde colonne code la présence d’unélément de nature sociale (I : bonjour/au re-voir, P : politesse).

– La troisème colonne code le regard (M :contact visuel mutuel, V : regard unilatéralvers le visage de l’interlocuteur, A : regardvers un autre élément identifié).

Contrairement à la colonne 1, les colonnes 2 et3 peuvent, pour un énoncé donné, ne conteniraucun élément codant. Cette matrice de codagepourrait aisément être complétée afin d’obtenirune analyse plus fine du dialogue, en intégrantpar exemple une dimension émotionnelle ou desinformations de référenciation.

Une telle représentation matricielle permet defaire apparaître les liens existants entre les dif-férentes dimensions codées, sous la forme demotifs dialogiques. Un motif est défini commeun ensemble d’annotations dont la dispositionse retrouve - de manière exacte ou approchée- dans plusieurs dialogues. Aucune contraintestructurelle n’est imposée : un motif peut êtrecomposé d’annotations non adjacentes en ligneou en colonne (i.e. il peut contenir des "trous").L’exemple de la figure 2 illustre ce propos.

A partir d’un corpus de dialogues annotés sousune forme matricielle similaire à celle précé-demment décrite, l’objectif est de construire unebanque de motifs caractéristiques des interac-tions dialogiques. L’intérêt d’une telle banque

FIGURE 2 – Exemple de motifs similaires pré-sents dans deux dialogues, A et B, différents.Le codage matricielle comporte n colonnes.Chaque colonne possède un alphabet qui lui estpropre. L’alphabet d’une colonne correspond àl’ensemble des annotations susceptibles de setrouver dans cette colonne. En bleu sont repré-sentés les deux versions du motif.

de motifs est de pouvoir être intégrée à un sys-tème de dialogues ou à un agent conversation-nel afin d’en améliorer l’efficacité. La créationd’une banque de motifs passe par une phase derecherche de motifs similaires dans les matricescodant les dialogues étudiés. Dans cette optique,un algorithme d’alignement de matrices par pro-grammation dynamique a été développé durantun travail précédent [12]. Ce dernier retourneune liste de paires de motifs similaires, ordon-née suivant une mesure de similarité (distanced’édition). L’algorithme a donné lieu à un dépôtlogiciel sur sourceforge d’APSAD, dont l’inter-face est présentée figure 3 1. Chaque motif dechaque paire retournée doit alors faire l’objetd’une recherche dans l’intégralité du corpus afinde constituer la banque de motifs. L’algorithmede reconnaissance de motifs approchés, objet duprésent article, est utilisé à cette occasion.

3 Dialogues et motifs dialogiques

Dans cette section, nous présentons tout d’abordun ensemble de modèle de dialogues afin demettre en avant la pertinence d’une approche

1. http://sourceforge.net/projects/apsad/

fondée sur la reconnaissance de motifs pour lessystèmes de dialogues et agents conversation-nels. Puis nous introduisons différents travauxsur la reconnaissance de motifs en deux dimen-sions (ou alignement de matrices), avec pourperspective de pouvoir les utiliser sur les anno-tations codant les dialogues d’un corpus.

3.1 Modélisation du dialogue

La théorie des actes de langage est la théoriedominante en informatique pour identifier lesénoncés selon leur caractère performatif [31].L’intérêt de la communauté informatique pourla théorie des actes de langage est né des avan-tages que la logique illocutoire apportait [30].En prolongeant la théorie des actes de langageaux conversations, Vanderveken dégage une lo-gique du discours [35] et introduit comme unitésde base du raisonnement les états mentaux.

Les travaux de Grosz et Sidner font glisser lemodèle du dialogue s’appuyant sur des relationsentre énoncés vers un modèle reposant sur unensemble de relations entre les intentions [20].Ils distinguent la structure linguistique décou-pée en segments dialogiques. Selon ces auteurs[19], le dialogue est une collaboration entre lespartenaires, la modélisation du dialogue à partirde structures de plans partagés sera donc privi-légiée. Clark et Schaeffer ont décrypté ce pro-cessus de partage de connaissances communes[13]. Tout d’abord, A fait une proposition à B,puis B accepte l’énoncé en témoignant de sacompréhension, l’énoncé prenant alors le statutde terrain commun. Il s’agit là, même si celan’a pas été formalisé comme tel par les auteurs,d’un motif dialogique linéaire basique.

Le modèle de Roulet [15] tente de rassemblerdans un modèle fédérateur plusieurs théories(actes de langage, théorie de l’argumentation etéléments d’analyse conversationnelle). Le mo-dèle a comme avantage de rendre compte de lastructure hiérarchique du dialogue en construi-sant une représentation des liens entre les diffé-rents énoncés. Souhaitant préciser les relationsrhétoriques entre les diverses parties du dia-logue, la RST (Rhethoric Structure Theory) [24]propose une vingtaine de relations permettantainsi de compléter le modèle de Roulet. Les re-lations ainsi caractérisées deviennent un moyend’étudier l’intentionnalité. La SDRT (Segmen-ted Discourse Representation Theory) [6], ter-minera de démontrer que le dialogue n’est pluscomposé d’une suite d’actes de langage maisde segments reliés entre eux par des relations

FIGURE 3 – Logiciel APSAD permettant l’extraction de motifs dans des annotations de dialogues. (1)Liste des alignements trouvés. (2) Alignement sélectionné par l’utilisateur. (3) Visualisation de l’ali-gnement sélectionné. (4) Annotations du premier dialogue faisant partie de l’alignement sélectionné.(5) Annotations du second dialogue faisant partie de l’alignement sélectionné.

de discours. Nous considérons que ces relationspermettent de former des motifs dialogiques,cette fois en deux dimensions, représentatifs dela structure hiérarchique du dialogue.

Le système TRAINS est l’un des premiers à dia-loguer avec un humain, dans le cadre de la réso-lution collaborative de problèmes [17]. L’ana-lyse de corpus de dialogues oraux orientés tâchea conduit à la conception de différents systèmespour interroger en langue naturelle une basede données contenant des horaires de trains.TRIPS, successeur de TRAINS, permet en plusde communiquer par des graphiques afin d’amé-liorer la compréhension mutuelle [16]. Ces tra-vaux ont mené jusqu’à une architecture d’agentpour la planification collaborative. Il génère desactes de résolution collaborative de problèmesque les agents reconnaissent et utilisent pourcoordonner leurs actions individuelles. Le mo-dule de communication est similaire à celui deTraum [34]. Il est fondé sur la planification eta pour but de reconnaître le plan de l’interlo-cuteur pour émettre une réponse appropriée. Leprojet COLLAGEN a pour but de développer unagent en charge des communications, indépen-dant de l’application, pour faciliter les interac-

tions collaboratives entre agents logiciels et uti-lisateurs [29]. COLLAGEN utilise la notion deplans partagés de [19], pour modéliser les dia-logues humains. Les énoncés et actions à effec-tuer sont sélectionnés selon leur contribution audialogue. Les projets TRAINS et COLLAGENont une approche du dialogue identique, baséesur la planification. La structure de plan regrou-pant les différents actes communicatifs sont, unefois encore, similaires à des motifs dialogiques.

Enfin, la théorie QUD est une théorie conven-tionnelle du dialogue fondé sur une séman-tique formelle des questions et d’un tableauconversationnel structuré. Son but est de dé-terminer les proprietés des couples Question-Réponse (Q-R) et plus particulièrement les ef-fets qu’ont les questions et les assertions sur letableau conversationnel. En s’appuyant sur uneapproche ISU (Information State Update) [23],Ginzburg conçoit le dialogue en termes de coupsdans un jeu. Il est possible de définir des re-lations intentionnelles entre jeux de dialogues[25, 26] ainsi que des relations sémantiques.Cette théorie a conduit à une implémentationd’un système, GoDIS [22], qui englobe certainsprincipes de la planification du dialogue [28, 34]

tels que les plans partagés [19], ainsi que la priseen compte du principe d’accommodation [14].De plus, le dialogue peut s’éloigner de la tâchepour introduire une digression ou une explica-tion, notamment dans le cadre d’une clarifica-tion ou de l’établissement du terrain commun.

Chacun des modèles précédemment cités est, enréalité, conçu à partir d’une collection de mo-tifs reliant différents niveaux (pragmatique lo-cale du dialogue, plans, etc.), et peut se struc-turer suivant différents axes (actes de dialogue,gestion des émotions, etc.). Un dialogue peutêtre modélisé par une structure matricielle dontchaque colonne représente un des axes de co-dage du dialogue. Fournir un modèle dialogiquepour un corpus de dialogues donné revient doncà établir un ensemble de régularités (les motifs)dans les matrices codant le corpus.

3.2 Reconnaissance de motifs

Pour de nombreuses problématiques, la recon-naissance de motifs se limite à une seule dimen-sion et peut être assimilée à un problème d’ali-gnements de séquences de caractères : recherchede texte, traitements audios, reconnaissance deformes, alignement de séquences ADN, ... Dansce cadre, la distance d’edition ed (ou distance deLevenshtein) entre deux chaînes de caractèress1 et s2 est parfaitment adaptée. Elle est définiecomme le coût minimal des opérations d’éditionpermettant de passer de s1 à s2. Les trois opéra-tions possibles sont la suppression et l’insertiond’un caractère (Del, Ins) ainsi que la substitu-tion d’un caractère par un autre (Sub). Dans unalphabet Σ de taille σ, à chaque caractère seraassocié σ + 1 coûts (1 insertion, 1 suppressionet σ−1 substitutions). Un exemple d’alignementest présenté figure 4.

FIGURE 4 – Alignement obtenu lors du calculde la distance de Levenshtein entre les chaînesde caractères ACTATT et TCAATTA. Ici le coûtde substitution d’un caractère par lui-même estfixé à 0 tandis que toute autre opération d’édi-tion coûte 1. Le coût total de cet alignement estégal à 4 (deux insertions, une suppression et unesubstitution d’un caractère par un autre).

Considérons un motif P [1..m] et un texteT [1..n]. L’alignement de chaînes de caractèresapprochées peut se définir comme la recherche

de segments de T dont la distance d’édition àP est au maximum égale à un entier k donné.Plus formellement, un alignement sera reportéen position j de T si

led(T [1 . . j], P [1 . .m]) ≤ k

avec led(T [i . . j], P [1..m]) = mins∈i..j

ed(T [s..j],

P [1 . .m]).

La reconnaissance de motifs dialogiques dansdes annotation de dialogues s’apparente plutôtà la recherche de motifs approchés en deux di-mensions (ou alignement de matrices). Elle né-cessite la définition d’une métrique permettantd’évaluer la similarité entre deux tableaux decaractères. Krithivasan et Sitalakshmi (KS) ontproposé pour cela une extension de la distanced’édition [33]. Ainsi, deux tableaux de tailleidentique seront comparés en utilisant la sommede la distance d’édition de chacune des lignescorrespondantes. Cette définition est pertinentedans des contextes où les suppressions et in-sertions de lignes sont impossibles. L’insertiond’un caractère ne permettra, par exemple, pas dedécaler tous les caractères d’une colonne d’uneposition vers le bas. De même, la suppression detous les éléments d’une ligne n’entraînera pas dedécalage dans les lignes suivantes.

De nombreuses méthodes utilisant cette mé-trique ont été développées. Certaines imposentde fortes contraintes à la forme des motifs.En effet, il est parfois nécessaire que ceux-cisoient rectangulaires [21] ou mi-rectangulaires[4]. D’autres approches se restreignent à dessous-problèmes afin d’obtenir de meilleuresperformances. Bird [9] et Baeza-Yates [8], entreautres, se focalisent sur le cas particulier k = 0.Similairement, Amir et Landau [5] présententune méthode où la substitution est la seule opé-ration d’édition autorisée. Baeza-Yates et Na-varro [7] ont développés un algorithme général,acceptant les trois types d’opérations d’éditionet n’imposant pas de conditions sur la forme desmotifs. Cette méthode a par la suite été amélio-rée pour qu’il soit possible de l’appliquer dansdes contextes plus spécifiques. Amir et Eranl’ont, par exemple, utilisée pour l’alignement demotifs pouvant subir des mises à l’échelle [3].De même, elle a été adaptée au cas de motifscomprenant plus de deux dimensions [27] oupouvant subir des rotations [18].

Dans cet article, nous présentons une heuris-tique de reconnaissance de motifs en adaptantl’approche de Baeza-Yates et Navarro [7].

4 Reconnaissance de motifs dialo-giques approchés par program-mation dynamique

Considérons un motif P = [1 . .m, 1 . . l] et untexte annoté T = T [1 . . n, 1 . . l], de taille res-pective M = m × l et N = n × l. Notons Σl’alphabet étudié.

Nous souhaitons déterminer les zones de T pourlesquelles la distance d’édition à P est infé-rieure à un entier k donné. En d’autres termes,nous effectuons un alignement global du motifet un alignement local du texte.

Nous nous plaçons dans le contexte de KS encolonne, pour lequel les insertions ou suppres-sions de colonnes ne sont pas permises. Cecise justifie par la structure même des matricesd’annotations. En effet, chaque colonne repré-sente un axe de codage, tandis que les lignes re-présentent les énoncés successifs du dialogue.L’insertion ou la suppression d’énoncés est né-cessaire pour permettre une plus grande sou-plesse dans la représentativité des dialogues.En revanche, chaque annotation étant relative àune colonne donnée, l’insertion ou la suppres-sion d’un élément dans une colonne aurait pourconséquence le décalage des annotations sui-vante sur la ligne dans une colonne ne corres-pondant par à leur dimension de codage.

T et P ayant le même nombre de colonnes,leur correspondance est immédiate. Pour chaquecouple de colonnes P [1 . .m, j], T [1 . . n, j], j ∈J1, lK ainsi formés, nous déterminons les aligne-ments compatibles ainsi que leurs coûts. Pour cefaire, un algorithme d’alignement de séquences(alignements en une dimension) est appliqué àchacune des l colonnes, suivant un ordre spéci-fique.

4.1 Alignement de séquences

De nombreux algorithmes en une dimensionpermettent de déterminer les alignements pos-sibles entre deux chaînes de caractères. Le choixd’une méthode, dans un contexte donné, dépendprincipalement du coût maximal k et de la tailledu motif m. Le lecteur peut se référer à [7] pourde plus amples informations. Afin de permettreune grande variabilité à m et k, nous avonschoisi d’utiliser un algorithme de programma-tion dynamique classique, similaire à [32].

Considérons deux chaînes de caractères s1 et s2,

de taille respective t1 et t2. L’algorithme permet-tant de calculer un alignement global de s1 et s2,consiste à calculer une matrice C[0 . . t1, 0 . . t2]telle que C[i, j] = ed(s1(1 . . i), s2(1 . . j)). Lecoût de l’alignement est alors égal à C[t1, t2](voir FIG. 5 pour le détail de l’algorithme).

Entree :s1[1..t1], s2[1..t2] : chaines de caracteres

Sortie :C[t1, t2]

DebutPour j = 0 a t2C[0, j] = j

Pour i = 1 a t1C[i, 0] = i

Pour i = 1 a t1Pour j = 1 a t2C[i, j] = min(C[i-1, j] + Del(s1[i]), _

C[i, j-1] + Ins(s2[j]), _C[i-1, j-1] + Sub(s1[i], s2[j]))

FIGURE 5 – Alignement global en une dimen-sion. Del et Ins sont les matrices des coûts desupression et d’insertion d’un caractère et Subest la matrice des coûts de substitution d’un ca-ractère par un autre.

Afin que l’alignement soit local uniquement parrapport au texte, seule la première colonne de Cest initialisée à 0 (un alignement local par rap-port au motif simultanément nécessiterait éga-lement une initialisation de la première lignede C à 0). La chaîne s2 peut donc débuteren n’importe quelle position avec un coût nul.Un alignement sera détecté pour tout i tel queC[i, t2] ≤ k. Un algorithme de tracé arrièreà partir de la position correspondante permetd’identifier l’ensemble des alignements.

Les motifs annotés que nous cherchons, ne sontpas nécessairement de forme pleine ou rectan-gulaire. Il nous faut donc définir un caractèreε représentant une annotation non renseignée.Le coût de substitution de ce caractère par unautre sera nul. Son coût d’insertion sera égal àmaxσ∈Σ

Ins(σ), puisqu’insérer un ε revient à insé-

rer n’importe quelle annotation. Il n’est pas né-cessaire de définir un coût de suppression car letexte ne contiendra aucun ε.

4.2 Alignement de motifs

L’ordre dans lequel sont effectuées les aligne-ments de séquences et plus particulièrement lechoix de la première colonne testée, influe surle temps d’exécution. Soit cj ∈ J1, lK, j ∈

J1, lK, la jème colonne testée par l’algorithme.Tout d’abord, des alignements sont cherchés surl’ensemble de c1, ce qui nous fourni une listede solutions candidates. Ces dernières seront,par la suite, développées ou rejetées lors du testdes autres colonnes. Idéalement, la première co-lonne sera celle fournissant un nombre de candi-dats minimal. Dans cette optique nous choisis-sons la colonne dont le motif comporte le plusgrand nombre de caractères.

Un ou plusieurs alignements seront reportéspour c1, en position i si

led(T [i−m−b kimc+1 . . i, c1], P [1 . .m, c1]) ≤ k

avec im = minσ∈Σ

Ins(σ).

Il est nécessaire que la zone de recherche ait unelongueur supérieure à celle du motif, afin de per-mettre d’éventuelles insertions de caractères dutexte. Pour déterminer le nombre maximal decaractères pouvant être insérés, nous considé-rons ceux dont le coût d’insertion est minimal(i.e. égal à im). En prenant la partie entière de ladivision entre k et im, nous obtenons le nombremaximal d’insertions possibles.

Les autres colonnes seront testées localement enfonction de la position des solutions candidatesrestantes. Pour chaque position i, solution dutest de cj−1, j ∈ J2, lK, un ou plusieurs aligne-ments seront reportés pour cj si

led(T [i−m−dj+1 . . i+dj, cj], P [1 . .m, cj]) ≤ k

avec dj = bk−k̂jimc, k̂j =

j−1∑t=1

kt et kt le coût

des erreurs en ct pour la solution considérée.

L’augmentation de k̂j au fil des colonnes, per-met une meilleure restriction des zones testées.

Ainsi, les solutions fournies par le test de cl sontdes alignements de P sur une sous-partie de Tdont le coût est inférieur à k.

5 Application

5.1 Contexte applicatif

Comme déjà mentionné, cet article s’inscritdans la continuité d’un travail antérieur permet-tant, à partir d’un corpus de dialogues anno-tés, d’extraire un ensemble de couples de mo-tifs dialogiques similaires (alignements locaux

intra-dialogue et inter-dialogues, valués par unemesure de similarité) [12].

Afin de la valider, cette méthode a été appli-quée à un corpus de dialogues annotés, issusd’interactions entre parents et enfants d’âge va-riable. La grille utilisée pour coder les énon-cés comporte 5 colonnes, et a pour but de per-mettre l’étude des caractéristiques dialogiques,sémantiques et pragmatiques du discours queproposent les adultes pour expliquer le compor-tement d’un personnage soumis à une faussecroyance [11]. Chaque colonne comporte entredeux et sept codages :– Les annotations de la première colonne carac-

térisent la nature de l’énoncé. Ce dernier peutêtre une question (q, Q) ou une affirmation (a,A). L’état de majuscule (A, Q) dénote la pré-sence d’un état mental. L’énoncé peut aussicorrespondre à une demande d’attention surl’histoire (AH) ou une demande d’attentiongénérale (AG).

– La colonne suivante permet de coder la ré-férenciation de l’énoncé. Ce dernier peut seréfèrer à un personnage (P), à l’interlocuteur(H) ou au locuteur (R). Un codage n’est effec-tué dans cette colonne qu’en cas de présenced’un état mental.

– La troisième colonne permet de préciser lesétats mentaux. Les différentes annotationspossibles sont l’émotion (E), la volition (V),la cognition observable (B) ou non observable(N), l’épistémie (K), l’hypothèse (Y) et la sur-prise (S). La surprise est ici distinguée desautres émotions en raison de ses liens avec lacroyance dont elle est issue.

– Les deux dernières colonnes sont consacréesaux justification par cause / conséquence (C)ou par opposition (O) qui peuvent être appli-quées soit pour expliquer l’histoire (J), soitpour expliquer une situation par l’évocationd’un contexte personnel (CP).

Les annotations de type parenthèses accoladeset crochets ([, {, ), ]) sont utilisées pour signifierl’absence d’indice dans une colonne donnée.

La figure 6 présente un des motifs issus de laliste d’alignements effectués à partir d’APSAD,sur le corpus de dialogues précédemment décrit.Dans cet exemple, l’avant dernier énoncé ("pourlui une surprise en réalité.") a été codé de lamanière suivante. Cet énoncé est une affirma-tion concernant un personnage et sera par consé-quent codée A et P dans les deux premières co-lonne. L’état mental relatif au personnage de ceténoncé est la surprise, une annotation S appa-raît donc en troisième colonne. Enfin l’expres-

Babar remarque Cornélius donner un paquer à l’intrus. A P B ) ]

Qu’est-ce qui peut y avoir dedans ? q [ { ) ]

Mais qui est donc cet individu masqué q [ { ) ]

qui a volé la couronne ? q [ { ) ]

Babar la démasque ! A P B ) ]

C’est la reine Céleste. a [ { ) ]

Il se pose bien des questions. A P N ) ]

Pourquoi donc la reine Céleste s’est déguisée ? q [ { ) ]Babar va donc chez la vieille dame lui demander. a [ { ) ]

Oui. a [ { ) ]

La vieille dame ne veut pas qu’il rentre ! A P V ) ]

Mais derrière se cachait A P B O Jpour lui une surprise en réalité. A P S O J

Puis Babar rentra chez lui. a [ { ) ]

FIGURE 6 – Motif de référence issu du dialogue 1-b9, obtenu à l’aide du logiciel APSAD

sion "en réalité" dénote une justification par op-position permettant l’explication de l’histoire.Les deux dernières colonnes d’annotations decet énoncé comportent donc les codages O et J.

L’extraction de régularités sur les dialogues an-notés selon cette grille a permis de mettre enévidence un ensemble de motifs similaires appa-raissant dans des paires de dialogues. Ce sont lesmotifs issus de ces alignements que nous avonsutilisés comme références, à rechercher dansl’intégralité des dialogues, pour l’évaluation denotre méthode de reconnaissance de motifs ap-prochés. Le but de cette démarche est de déter-miner s’ils n’apparaîssent que dans deux dia-logues ou s’ils sont bien récurrents, et peuventdonc être intégrés à une banque de motifs.

5.2 Résultats

Les résultats figurant dans la suite de cet articlecorrespondent à la recherche du motif de réfé-rence présenté figure 6. Les annotations ainsique la matrice de substitution utilisés (voir fi-gure 7) ont été conçus spécifiquement pourcette application, et contient des coûts dont lavaleur varie entre 1 et 10. Le coût maximal k aété fixé empiriquement à 50. Cette valeur per-met de limiter le nombre de substitutions lesplus coûteuses au sein d’un alignement, tout enpermettant une certaine diversité. Nous avonsappliqué notre méthode sur les 70 dialogues an-notés du corpus. Au total, 27 instances diffé-rentes du motifs ont été reportées (voir exemplesfigure 8 et figure 9). Le coût moyen obtenu pources instances est égal à 42.

Ces résultats sont encourageants, puisqu’ils per-mettent de confirmer le caractère récurrent decertains motifs dialogiques. Dans l’exempledonné, le motif correspond à une stratégie dialo-gique utilisée par les parents pour expliquer unefausse croyance à leur enfant.

6 Conclusion et perspectives

Nous avons présenté une méthode génériquepermettant l’alignement global d’un motif endeux dimensions sur une partie locale d’untexte. Cette méthode est utilisée dans notrecadre à la reconnaissance de motifs dialogiquesdans un corpus de dialogues. Pour cela, chaquedialogue est codé à l’aide d’une matrice pour la-quelle une ligne correspond à un énoncé et unecolonne à un espace de codage.

Du point de vue algorithmique, plusieurs amé-liorations sont envisageables. Il serait toutd’abord judicieux d’adapter la méthode à l’ali-gnement local de motifs. Ceci pourrait facili-ter la détermination de motifs "consensuels" re-présentatifs d’un ensemble de motifs. En effet,il serait alors possible de ne conserver que lesparties les plus représentatives d’un motif (i.e.celles qui apparaissent régulièrement dans lesalignements locaux), ou bien seulement les par-ties communes à un ensemble de motifs. Pourréaliser des alignements locaux, il serait néces-saire de modifier l’algorithme de programma-tion dynamique, comme décrit dans [12], enpassant de la minimisation d’un coût à la maxi-misation d’un gain. Cette modification ne serapas immédiate puisqu’elle aura un impact surla définition des zones de recherches d’une co-

a q A Q G D P R H C O M J F E B N V K Y Sa 10q 9 10A 10 9 10Q 9 10 9 10G 2 8 2 8 10D 2 8 2 8 10 10P 0 0 0 0 0 0 10R 0 0 0 0 0 0 9 10H 0 0 0 0 0 0 7 8 10C 0 0 0 0 0 0 2 2 2 10O 0 0 0 0 0 0 2 2 2 9 10M 0 0 0 0 0 0 2 8 2 8 8 10J 0 0 0 0 0 0 7 4 3 1 1 2 10F 0 0 0 0 0 0 4 7 3 1 1 7 9 10E 0 0 0 0 0 0 5 7 5 3 3 8 2 4 10B 0 0 0 0 0 0 5 5 5 3 3 3 4 4 8 10N 0 0 0 0 0 0 5 5 5 3 3 3 4 4 8 10 10V 0 0 0 0 0 0 5 5 5 3 3 3 2 4 9 7 7 10K 0 0 0 0 0 0 7 5 5 3 6 3 4 4 8 7 8 7 10Y 0 0 0 0 0 0 5 5 5 4 3 3 4 4 8 7 8 7 9 10S 0 0 0 0 0 0 5 5 5 3 3 6 3 4 9 7 7 7 9 8 10

FIGURE 7 – Matrice de substitution dans le cas d’une maximisation des coûts

Donc là ils se cachent. A P B ) ]

Ils cherchent a [ { ) ]

qui pourrait avoir pris la couronne ? q [ { ) ]

elle est dedans, elle est dedans la couronne. a [ { ) ]

Donc ils suspectent plein de monde, Cornélius, Céleste, la vieille dame. A P Y C JQui a bien pu prendre la couronne ? q [ { ) ]

La couronne, elle est dedans. a [ { ) JTu crois ? Q H K ) ]

Oui. a [ { ) ]

Mais Babar il ne sait pas qu’elle est dedans. A P N O JDonc il se dit que c’est une bombe, la couronne A P N C J

ou je ne sais quoi. A R N ) ]La couronne a [ { ) ]

FIGURE 8 – Alignement issu du dialogue 1-b7 (coût 25)

Regardez A P B ) ]

C’est un bateau ! a [ { ) ]

Il le prend a [ { ) ]

et il le pose sur l’eau. a [ { ) ]

Alors les cannetons tout contents montent dans le bateau, A P E C JLe bébé cygne voudrait bien monter dans le pot. A P V ) ]

Et le pot coule. a [ { ) ]

Parce qu’il est trop gros, A P { C Jalors la maman cygne arrive, A P { C J

elle veut aller chercher le pot au fond de l’eau A P V ) ]elle veut le manger A P V ) ]

non elle veut juste le rattraper mais avec son bec, A P V ) ]les cygnes n’ont pas de mains a [ { ) ]

FIGURE 9 – Alignement issu du dialogue 2-a2 (coût 25)

lonne à l’autre. Le temps d’exécution pourraitlui aussi être amélioré, en mettant en place unemémorisation des zones testées par l’algorithmeen une dimension.

En revanche, certaines problématiques n’ont, àce jour, pas trouvées de solutions pleinementsatisfaisantes. L’ordre dans lequel les colonnessont testées, par exemple, est présentement dé-terminé par le nombre d’annotations non videsque contient le motif dans chacune d’entre elles.Ceci ne permet pas une minimisation systéma-tique du nombre de candidats. De même, leparamètre k, qui représente le nombre maxi-mal d’erreurs, est actuellement fixé manuelle-ment, de manière empirique. Il sera important,à terme, qu’il soit défini automatiquement enfonction de paramètres tels que la taille ou lecontenu du motif considéré. Enfin, une gestionde la cohérence intra-colonnes des alignementsdoit être mise en place. Nous définissons, ac-tuellement, pour chaque colonne une zone danslaquelle le motif sera recherché. Cependant laposition d’un alignement dans cette zone n’in-fluence pas le coût des solutions. Une méthodepermettant de pénaliser les alignements, dont laforme s’éloigne de celle du motif de référence,reste à déterminer. Nous pourrions, par exemple,ajouter à la somme des distances d’éditions descolonnes, un coût représentatif de la déforma-tion du motif.

À moyen terme, ce projet pourrait permettre,d’une manière similaire à BLAST [2], la créa-tion d’une banque de motifs sur laquelle il se-rait rapidement possible d’effectuer des aligne-ments. Cela offrirait la possibilité à un agentconversationnel intégrant notre heuristique dereconnaissance de motifs, d’accomplir des ana-lyses de dialogues en temps réel. Durant unéchange, l’agent pourrait réaliser dans un pre-mier temps une phase d’identification des carac-téristiques dialogiques de son interlocuteur, enfonction des motifs utilisés. Cette opération se-rait effectuée en alignant les annotations du dia-logue courant avec un sous-ensemble de motifsde la banque. Au fil des échanges, le nombre demotifs alignés augmentant, l’analyse s’en trou-vera affinée. Ainsi, l’agent pourrait adapter soncomportement en vu de répondre le plus effica-cement possible à sa fonction.

Références[1] J. Allen and M. Core. DAMSL : Dialog act

markup in several layers. Draft of manual,1997.

[2] S. F. Altschul, W. Gish, W. Miller, E. W.Myers, and D. J. Lipman. A basic lo-cal alignment search tool. J. Mol. Biol.,215 :403–410, 1990.

[3] A. Amir and E. Chencinski. Faster two di-mensional scaled matching. Algorithmica,56(2) :214–234, 2010.

[4] A. Amir and M. Farach. Efficient2-dimensional approximate matching ofnon-rectangular figures. In Proceedings ofthe second annual ACM-SIAM symposiumon Discrete algorithms, pages 212–223.Society for Industrial and Applied Mathe-matics, 1991.

[5] M. Amir Gad et al. Fast parallel andserial multidimensional approximate arraymatching. Theoretical Computer Science,81(1) :97–115, 1991.

[6] N. Asher. Reference to abstract objects indiscourse. Kluwer Academic Publishers,Dordrecht, 1993.

[7] G. Baeza-Yates, R. & Navarro. Fasttwo-dimensional approximate pattern mat-ching. In Clàudio Lucchesi and Ar-naldo Moura, editors, LATIN’98 : Theore-tical Informatics, volume 1380 of LectureNotes in Computer Science, pages 341–351. Springer Berlin / Heidelberg, 1998.

[8] R.A. Baeza-Yates and M. Régnier. Fasttwo-dimensional pattern matching. Infor-mation Processing Letters, 45(1) :51–57,1993.

[9] R. S. Bird. Two-dimensional pattern mat-ching. Information Processing Letters,6(5) :168–170, October 1977.

[10] H. Bunt. The DIT++ taxonomy for func-tional dialogue markup. In AAMAS 2009Workshop, Towards a Standard MarkupLanguage for Embodied Dialogue Acts,pages 13–24, 2009.

[11] É. Chanoni. Comment les mères racontentune histoire de fausses croyances à leur en-fant de 3 à 5 ans ? Enfance, (2), 2009.

[12] É. Chanoni, T. Lecroq, and A. Pauchet. Ex-traction de motifs dans des dialogues an-notés par programmation dynamique. InPY. & Guyomard M. Maudet, N. & Schob-bens, editor, Modèles Formels de l’Interac-tion (MFI’09), pages 101 – 112, 2009.

[13] E.F. Clark, H.H. & Schaefer. Contribu-ting to discourse* 1. Cognitive science,13(2) :259–294, 1989.

[14] H. Clark. Using Language. CambridgeUniversity Press, Cambridge, 1996.

[15] J. Moeschler C. Rubattel & M. SchellingE. Roulet, A. Auchlin. L’articulation dudiscours en français. Berne, Peter Lang,page 272, 1985.

[16] J.F. Ferguson, G. & Allen. TRIPS : An in-tegrated intelligent problem-solving assis-tant. In Proceedings of the National Confe-rence on Artificial Intelligence, pages 567–573. JOHN WILEY & SONS LTD, 1998.

[17] J. F. Allen & Bradford W. Miller Fergu-son G. TRAINS-95 : Towards a mixed-initiative planning assistant. In AIPS,pages 70–77, 1996.

[18] K. Fredriksson, G. Navarro, and E. Uk-konen. Optimal exact and fast approxi-mate two dimensional pattern matching al-lowing rotations. In Combinatorial PatternMatching, pages 235–248. Springer, 2002.

[19] C. L. Grosz, B. J. & Sidner. Plans for dis-course. In J. L. Morgan & M. E. PollackP. R. Cohen, editor, Intentions in Commu-nication. Bradford Books at MIT Press,1990.

[20] C.L. Grosz, B.J. & Sidner. Attention, in-tentions, and the structure of discourse.Computational linguistics, 12(3) :175–204, 1986.

[21] R. Krithivasan et al. Efficient two-dimensional pattern matching in the pre-sence of errors* 1. Information Sciences,43(3) :169–184, 1987.

[22] S. Larsson. Issue-Based Dialogue Ma-nagement. Ph.d. dissertation, Departmentof Linguistics, Göteborg University, Göte-borg, 2002.

[23] S. Larsson and D.R. Traum. Infor-mation state and dialogue managementin the TRINDI dialogue move enginetoolkit. Natural language engineering,6(3&4) :323–340, 2000.

[24] S.A. Mann, W.C. & Thompson. Rhe-torical structure theory : Toward a func-tional theory of text organization. Text-Interdisciplinary Journal for the Study ofDiscourse, 8(3) :243–281, 1988.

[25] N. Maudet. Modéliser les conventions desinteractions langagières : la contributiondes jeux de dialogue. Thèse de doctorat,Université Paul Sabatier, Toulouse, France,mai 2001.

[26] J. A. Levin & J. A. Moore. Dialogue-games : Meta-communication structuresfor natural language interaction. CognitiveScience, 1(4) :395–420, 1977.

[27] G. Navarro and R. Baeza-Yates. Fastmulti-dimensional approximate patternmatching. In Combinatorial PatternMatching, pages 243–257. Springer, 1999.

[28] J. F. Allen & C. Raymond Perrault. Analy-zing intention in utterances. Artificial In-telligence, 15(3) :143–178, 1980.

[29] C.L. Rich, C. & Sidner. COLLAGEN :A collaboration manager for software in-terface agents. User Modeling and User-Adapted Interaction, 8(3) :315–350, 1998.

[30] D. Searle, J.R. & Vanderveken. Founda-tions of illocutionary logic. CambridgeUniv Pr, 1985.

[31] J.R. Searle. Speech acts : An essay in thephilosophy of language. Cambridge uni-versity press, 1970.

[32] P. H. Sellers. The theory and computationof evolutionary distances : Pattern recog-nition. Journal of Algorithms, 1(4) :359 –373, 1980.

[33] Krithivasan & Sitalakshmi. Efficient two-dimensional pattern matching in the pre-sence of errors. INFSCIENCES : Informa-tion Sciences, 43, 1987.

[34] D.R. Traum. A computational theory ofgrounding in natural language conversa-tion. PhD thesis, University of Rochester,1994.

[35] D. Vanderveken. Illocutionary logic anddiscourse typology. Revue internationalede philosophie, (2) :243–255, 2001.

Documents

Reconnaissance de motifs dialogiques approchésasi.insa-rouen.fr/enseignants/~apauchet/Files/Publications/MFI11.pdfCe procédé a été mis en pratique par la recherche de mo-tifs