28
Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Embed Size (px)

Citation preview

Page 1: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Analisi del discorso

Maria Teresa PAZIENZAa.a. 2007-08

Page 2: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Analisi del discorso

Il discorso consiste di più frasi tra loro coerentemente correlate in uno schema di comunicazione. L’analisi del discorso consiste nel riconoscimento di eventi descritti in più segmenti di frase.

• Monologo (la comunicazione fluisce in una sola direzione)

• Dialogo (comunicazione bidirezionale con frasi con direzione di comunicazione alternata: domande, risposte...)

• Human Computer Interaction (HCI – dialogo limitato dalle capacità del sistema di sostenere una conversazione; strategia per limitare la conversazione e permettere di capire le espressioni dell’utente in un contesto limitato di interpretazioni )

Page 3: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Dialogo vs. MonologoMonologo e dialogo richiedono la risoluzione di alcuni

fenomeni: – Stato dell’informazione (precedentemente fornita o

meno) – Problemi di coerenza – Risoluzione dei riferimenti– Implicazioni sottintese, intenzioni

Dialogo richiede la gestione del riconoscimento di– Alternanza del parlante – Conoscenze di base (eventualmente condivisa)– Riconoscimento e correzione di interpretazioni erronee

– Strategie nell’interazione – Modello mentale di ciascun parlante (modello del

discorso)

Page 4: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Dialogo (Messaggio pubblicitario)

Desidera?Un biglietto per MilanoA partire da…A partire da 12 euro, come

dite voi nella pubblicità

Page 5: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Analisi del discorso

Il discorso consiste di • più frasi tra loro coerentemente

correlate • in uno schema di comunicazione, ma

Cosa (quali fenomeni) rende coerente un discorso?

Come riconoscerne i fenomeni?Come analizzarli?

Page 6: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Cosa rende coerente un testo?

• Un uso appropriato di relazioni di coerenza tra parti del discorso - strutture retoriche

• Una sequenza appropriata di parti del discorso - struttura del discorso, articolazione degli argomenti

• Un uso appropriato di espressioni referenziali

Page 7: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Teoria delle strutture retoriche

Teoria della struttura del discorso basata sull’identificazione di relazioni tra parti di testo

Si considerino due frasi il cui significato sia espresso da S1 ed S2, alcune relazioni retoriche sono:

• Elaborazione (set/member, class/instance, whole/part…) inferire la stessa proposizione P dalle asserzioni S1 ed S2 (in particolare, in aggiunta,..)

• Risultato: inferire che lo stato o l’evento asserito da S1 causi o potrebbe causare lo stato o l’evento asserito da S2

• Spiegazione: inferire che lo stato o l’evento asserito da S2 causi o potrebbe aver causato lo stato o l’evento asserito da S1

• …

Page 8: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Identificazione automatica di relazioni retoriche Applicazione di approcci di ML noti…

– Identificazione di un gruppo di annotatori per assegnare un set di relazioni retoriche ad un testo

– Estrazione dal testo di un set di features superficiali che possa indicare la presenza di relazioni retoriche in quello specifico testo

– Addestramento di un sistema di ML supervisionato basato sul training set

Page 9: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Quali feature?

• Marcatori espliciti quali: perchè, però, quindi, allora, etc.

• Tendenza di certe strutture sintattiche a segnalare alcune relazioni: le infinitive spesso sono usate per indicare relazioni di scopo: Usa rm per cancellare files.

• Ordinamento • Uso dei tempi• Intonazione (nel dialogo)• …

Page 10: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Alcuni problemi con le relazioni retoriche

• Quante relazioni retoriche esistono? Sono indipendenti dal linguaggio?

• Possiamo usare le stesse relazioni retoriche nel dialogo e nel monologo?

• Le relazioni retoriche non modellano completamente la struttura del discorso.

• Difficoltà nel trovare annotatori che siano concordi nell’annotare lo stesso testo

Page 11: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Espressioni di riferimento

Le espressioni di riferimento sono parole o frasi la cui interpretazione semantica è una entità del discorso (detta anche referente)

– Le entità del discorso sono oggetti semantici e possono avere più espressioni sintattiche all’interno di un testo

Le espressioni di riferimento forniscono un collante ulteriore che rende il testo coeso.

Page 12: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Espressioni di riferimento

A pretty woman entered the restaurant. She sat at the table next to mine and only then I recognized her. This was Amy Garcia, my next door neighbor from 10 years ago. The woman has totally changed! Amy was at the time shy…

Page 13: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Pronomi vs. Full NP

A pretty woman entered the restaurant. She sat at the table next to mine and only then I recognized her. This was Amy Garcia, my next door neighbor from 10 years ago. The woman has totally changed! Amy was at the time shy…

Page 14: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Definite vs. Indefinite NPs

A pretty woman entered the restaurant. She sat at the table next to mine and only then I recognized her. This was Amy Garcia, my next door neighbor from 10 years ago. The woman has totally changed! Amy was at the time shy…

Page 15: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Common Noun vs. Proper Noun

A pretty woman entered the restaurant. She sat at the table next to mine and only then I recognized her. This was Amy Garcia, my next door neighbor from 10 years ago. The woman has totally changed! Amy was at the time shy…

Page 16: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Modified vs. head NP

A pretty woman entered the restaurant. She sat at the table next to mine and only then I recognized her. This was Amy Garcia, my next door neighbor from 10 years ago. The woman has totally changed! Amy was at the time shy…

Page 17: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Premodified vs. postmodified

A pretty woman entered the restaurant. She sat at the table next to mine and only then I recognized her. This was Amy Garcia, my next door neighbor from 10 years ago. The woman has totally changed! Amy was at the time shy…

Page 18: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Altri tipi di NP

• Capaci di generare inferenze– Sally ha comprato un’auto usata. Le

gomme devono essere cambiate.

• Con discontinuità– John ha conosciuto Bill molti anni fa.

Loro fanno spesso insieme delle escursioni in montagna.

Page 19: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Anafora

L’anafora è il riferimento ad una entità che appare precedentemente nel discorso

L’espressione di riferimento usata si dice espressione anaforica

Le espressioni anaforiche possono essere di diversa tipologia e dipendono dal contesto del discorso (articoli, pronomi, espressioni nominali,…)

Page 20: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Risoluzione dell’anafora

Trovare in un testo tutte le espressioni di riferimento che hanno la stessa denotazione

– Risoluzione dell’anafora pronominale – Risoluzione dell’anafora tra entità

nominali – Risoluzione di frasi nominali anaforiche – …

Page 21: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Risoluzione dell’anafora

I sistemi possono mantenere una sorta di history list delle entità presenti nel discorso.

Per risolvere una anafora, cercare l’history list dell’entità più vicina che soddisfa i vincoli.

Page 22: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Conoscenza di supporto

Per l’analisi del discorso è necessario utilizzare anche conoscenza di supporto del tipo:

• Obiettivi e piani• Esistenza di eventuali frame o script• Presupposizioni• Regole del discorso

Page 23: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Obiettivi e piani

Se si conoscono quali sono gli obiettivi della comunicazione, così come il piano del comunicatore, è possibile limitare il numero di interpretazioni possibili

Es. se in una e-mail si richiede un incontro, la risposta potrebbe

accettare, modificare,rifiutare la richiesta.

Page 24: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Esistenza di eventuali frame o script

Qualora si possa descrivere l’uso del linguaggio in termini di frames (ovvero la descrizione di un oggetto) o con degli scripts (come il canovaccio di un’opera teatrale) che noi possiamo utilizzare, allora potremmo confrontare il linguaggio naturale con questi oggetti cognitivi e quindi gestire anche le aspettative in un discorso

Page 25: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Presupposizioni

Il linguaggio naturale fa riferimento spesso ad informazioni comunemente note e non espresse

Si può usare l’inferenza per identificare l’informazione sottaciuta.

Es. oggi la temperatura ha superato i 37 gradi. Nei giornali radio si raccomanda agli anziani di andare almeno per un paio d’ore in un supermercato ogni giorno.

Page 26: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Regole del discorso

Si può ottenere informazione sapendo che, a meno di essere in situazioni facete, in genere si usa il linguaggio naturale in alcuni modi predefiniti. Per esempio a meno che si voglia mentire, si dice la verità.

Queste regole ci permettono di verificare se le regole sono state seguite, oppure determinare le situazioni di discontinuità.

Page 27: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Argomenti trattati in questa lezione

• Tipologie di comunicazione nel discorso • Teoria delle strutture retoriche• Espressioni di riferimento• Anafora• Conoscenza di supporto• Obiettivi e piani• Presupposizioni

Page 28: Analisi del discorso Maria Teresa PAZIENZA a.a. 2007-08

Elaborazione del linguaggio naturale

Le presentazioni sugli argomenti di elaborazione del linguaggio naturale fanno in alcuni passi riferimento ad alcune presentazioni dei colleghi prof. Fabio Massimo Zanzotto e dottor Marco Pennacchiotti, del dottor Patrick Pantel (ISI-USC), oltre che ad alcune parti del libro: Speech and Language Processing, Prentice Hall, 2000, autori D.Jurafsky, J. H. Martin.