Form und Funktion
prosodischer Grenzen
in deutscher Spontansprache
Modul H2
Benno Peters - IPDS Kiel
15. Mai 2008
Einleitung
• Zwei DFG-Projekte:
– Lautmuster deutscher Spontansprache
– Prosodische Phrasierung in deutscher
Spontansprache
• Empirische Untersuchungen zur internen
phonetischen Struktur prosodischer Phrasen
und zu deren Delimitation
• Die phonetische Form der syntagmatischen
Gliederung in prosodische Phrasen ist durch
zwei phonetische Mechanismen bestimmt:
– phonetische Kohäsion im Inneren von Phrasen
– phonetische Separierung zwischen
prosodischen Phrasen
• Kohäsive Merkmale (interne Struktur)
– globale melodische Muster (Hutmuster,
Downstep/Deklination)
– Kontinuität von Phonation, Register
Sprechgeschwindigkeit
• Separierende Merkmale (Delimitation)
– melodische Brüche / starke melodische
Bewegungen
– Pausen/Atmen
– F0-Reset
– segmentelle Längung
– Änderung von Phonationstyp
Sprechgeschwindigkeit, Register
• Prosodische Grenzen in natürlichen
Gesprächen sind in drei funktionalen
Zusammenhängen beobachtbar
– im Inneren von Redebeiträgen als Ausdruck der
inhaltlich und syntaktisch motivierten
Gliederung von Äußerungen
– am Ende von Redebeiträgen, oft mit einer auf
die Sprecher-Hörer-Interaktion ausgerichteten
phonetischen Struktur
– bei unflüssiger Sprechweise entstehen oft starke
prosodische Einschnitte, die Planungsvorgänge
seitens des Sprechers widerspiegeln
Grundfragen der Untersuchung
• Welche phonetischen Merkmale finden sich
an prosodischen Grenzen?
• Können phonetische Klassen prosodischer
Grenzen herausgearbeitet werden?
• Können diese phonetischen Klassen mit
funktionalen Klassen assoziiert werden?
Grundfragen der Untersuchung
• Welche Rolle spielen phonetische
Merkmale an prosodischen Grenzen bei der
Einschätzung des Gesprächsfortgangs durch
Hörer?
• Gibt es eine Korrelation zwischen der
Stärke der phonetischen Separierung und
inhaltlich-pragmatischen Strukturen?
(z.B. starke Separierung am Ende
inhaltlicher Blöcke oder am Ende von
Redebeiträgen)
Grundfragen der Untersuchung
• Es werden also Bezüge hergestellt zwischen
– der phonetischen Struktur von
Produktionsdaten
– der inhaltlich-pragmatischen Struktur der
Produktionsdaten
– der Wahrnehmung und funktionalen
Einordnung durch Hörer
Ziel
Klassifikationssystem für Phrasen-
grenzen unterschiedlicher phonetischer
Ausprägung, das eine Form-Funktions-
Beziehung widerspiegelt
Methoden I - Die Datenbasis
• Terminabsprachen des Kiel Corpus
(11 Dialogsitzungen mit 22 Sprechern,
2,5 Stunden, 25.000 Wörter)
• Video-Task (6 Dialoge mit 12
Sprechern, 1,5 Stunden, 13.500
Wörter)
Methoden I
Video-Task oder das Daily Soap Szenario
• Vorteile
– hohe akustische Qualität, Kanaltrennung
– VP realisieren nicht, dass das Ziel des Versuchs
die Sprachdatenerhebung ist
– keine Eingriffe durch Versuchsleiter in die Dialoge
– Alltagssprache mit großer Natürlichkeit, komplexe
Interaktion
• Nachteil
– wenig Kontrolle über linguistische Strukturen in
den Daten
Methoden I
Video-Task oder das Daily Soap Szenario
• Hörbeispiel 1
• Hörbeispiel 2
• Hörbeispiel 3
Methoden II
Phonetische Analyse der Produktionsdaten
Methoden II
Phonetische Analyse der Produktionsdaten
• Was kann labelbasiert analysiert werden?
– Melodische Muster (KIM/PROLAB)
– F0-Reset an prosodischen Grenzen
– Pausen/Atmungsphasen und deren Dauer
– Segmentdauern an Phrasengrenzen werden mit
Segmentdauern in phrasenfinalen Reinem
verglichen
Methoden II
Phonetische Analyse der Produktionsdaten
• Ableitung phonetischer Merkmalsbündel für
jede etikettierte prosodische Grenze im
Korpus
• Beispiel: 2._P250_+R_L3
– 2. = stark fallende melodische Bewegung
– P250 = Pause von 250ms
– +R = F0-Reset
– L3 = Längungsstufe des phrasenfinalen
Reims
Methoden III
Funktionale Zuordnung
phonetischer Merkmale
• Grundfrage: Wie komme ich von der
formalen Beschreibung der phonetischen
Merkmale zu einer funktionalen
Zuordnung?
• Zwei sich ergänzende Verfahren:
– funktionale Interpretation der Korpusdaten
– Perzeptionsexperimente
Methoden III
Interpretation der Produktionsdaten
• Steht die prosodische Grenze am Ende eines
inhaltlichen Abschnitts oder innerhalb eines
inhaltlichen Abschnitts?
Methoden III
Perzeptionsexperimente
• Nachbildung der phonetischen Variabilität
über Resynthesen
• Funktionale Bewertungen durch naive
Hörer
• Kontextfreie Präsentation soll Effekte des
phonetischen Signalisierungssystems
„freilegen“
Methoden III
Perzeptionsexperimente
• Übertragung der im Korpus beobachteten
phonetischen Merkmale in Stimuli für
Perzeptionsexperimente
• Ausgangssatz:
„Das ist ja nun nicht so angenehm.“
• Zwei Parameter gehen in die Resynthesen ein:
– melodische Bewegung am Phrasenende
– Längung am Phrasenende
Methoden III
Perzeptionsexperimente
Methoden III
Perzeptionsexperimente
• Welche Fragen sollen den
Versuchspersonen gestellt werden?
– Sprecherwechsel
–Wird der Sprecher nach der Äußerung
noch weiter sprechen?
– Sprechflüssigkeit
–Hört sich die Äußerung zögerlich an?
Methoden III
Perzeptionsexperimente
• Welche Fragen sollen den
Versuchspersonen gestellt werden?
– Sprecherwechsel
–Wird der Sprecher nach der Äußerung
noch weiter sprechen?
– Sprechflüssigkeit
–Hört sich die Äußerung zögerlich an?
Methoden III
Perzeptionsexperimente
• Wie können die Urteile der VP erhoben
werden?
– forced choice?
– Antwortskalen?
• Equal Appearing Interval Scale
(Thurston 1929)
• Visual Analogue Scale (Maxwell 1978)
Methoden III
Perzeptionsexperimente
0 1 2 3 4 5 6
0 1 2 3 4 5 6
Hört sich die Äußerung zögerlich an?
Ja Nein
Wird der Sprecher nach dem Satz noch
weitersprechen?
Ja Nein
Methoden IV
Zusammenfassung
• Datenerhebung
• Labelbasierte phonetische/akustische
Korpusanalyse
• Interpretation einer großen Anzahl von
Redebeiträgen
• Perzeptionsexperimente
• Enges Netzwerk in der Konzeption der
Arbeitsschritte und in der Interpretation der
gesamten Ergebnisse
Exkurs Sprechflussstörungen
Der Entstehung von Sprechflussstörungen
liegen unterschiedliche Ursachen zugrunde.
Folgende Probleme können zu einer
unflüssigen Sprechweise führen:
● Phonetische Versprecher: Während des
Sprechens kann es zu Lautvertauschungen,
Fehlartikulationen und anderen
artikulatorischen Problemen kommen.
Exkurs Sprechflussstörungen
● Syntaktische Versprecher: Ein bereits zum
Teil ausgesprochener Satz enthält
agrammatische Strukturen oder lässt sich
nicht sinnvoll ohne eine Verletzung
grammatischer Regeln fortsetzen.
Exkurs Sprechflussstörungen
● Inhaltliche Versprecher: Ein Wort, das nicht
der Intention des Sprechers entspricht, wird
versehentlich ganz oder zum Teil
ausgesprochen und eine Korrektur wird
notwendig. In diese Kategorie fallen auch
die sog. Freudschen Versprecher (Freud
1901/1971).
Exkurs Sprechflussstörungen
● Wortfindungsprobleme: Ein Wort, das
eigentlich bekannt ist, kann nicht rechtzeitig
aus dem Gedächtnis abgerufen werden.
● Syntaktische Planungsprobleme: Eine
korrekte syntaktische Fortsetzung kann
nicht so schnell geplant werden, dass die
derzeitige Äußerung flüssig fortgesetzt
werden kann.
Ergebnisse I
Labelbasierte Korpusanalyse
• In 93% aller analysierten turninternen
Phrasengrenzen konnte mindestens eines der
folgenden Merkmale automatisch extrahiert
werden
– phrasenfinale Längung (66,2%)
– F0-Reset (63%)
– Pause oder Atmen (38,3%)
– stark fallende oder starke steigende melodische
Bewegung (36% stark fallend, 2% stark
steigend)
Ergebnisse I
Labelbasierte Korpusanalyse
• In mehr als 55% aller Fälle treten zwei oder mehr
Merkmale gemeinsam auf.
• Die häufigsten Kombinationen sind:
– Längung + F0-Reset
– Längung + Pause + F0-Reset
– Längung + Pause + starke tonale Bewegung
Ergebnisse I
Labelbasierte Korpusanalyse
• Turnfinale prosodische Grenzen zeigen zu 63,8%
stark fallende melodische Bewegungen und zu
10,3% stark steigende Konturen
• Phrasenfinale Längung tritt in 74,3% der Fälle auf
(turnintern: 66,2%)
• Hauptunterschied zwischen turnintern und
turnfinal liegt im Parameter melodische
Bewegung. Aber: auch turnintern viele stark
fallende Konturen
Ergebnisse II
Interpretation
• Vergleich der phonetischen Merkmale an
turninternen Grenzen im Inneren und am
Ende inhaltlicher Blöcke
– Pausen
• innerhalb: 26,6%
• am Ende: 68,8%
– Starke tonale Bewegungen
• innerhalb: 20%
• am Ende: 75%
Ergebnisse II
Interpretation
• Das Auftreten von Längung und F0-Reset
unterscheidet sich kaum zwischen
prosodischen Grenzen innerhalb und am
Ende inhaltlicher Blöcke
– Längung: 80% vs. 73,4%
– F0-Reset: 66,7% vs. 75%
Ergebnisse II
Interpretation
• Ergebnis: In den Korpusdaten gibt es einen
Zusammenhang zwischen phonetischer und
inhaltlicher Kohäsion.
• Prototypische prosodische Grenzen im
Inneren inhaltlicher Blöcke haben als
separierende Merkmale finale Längung und
F0-Reset. Prototypische Grenzen am Ende
inhaltlicher Blöcke weisen zusätzlich noch
eine Pause und eine starke tonale Bewegung
auf.
Ergebnisse II
Interpretation
• Damit gleicht die typische prosodische
Grenze am Ende inhaltlicher Blöcke in ihrer
phonetischen Struktur der turnfinalen
prosodischen Grenze.
Ergebnisse III
Perzeptionstests
Ergebnisse III
Perzeptionstests
Ergebnisse III
Perzeptionstests
Turnübergabeerwartung
0
1
2
3
4
5
6
-8ht -4ht -0ht +4ht +8ht
Faktor 0
Faktor 1,4
Faktor 1,8
Faktor 2,2
Ergebnisse III
Perzeptionstests
Wahrgenommene Sprechflüssigkeit
0
1
2
3
4
5
6
-8ht -4ht -0ht +4ht +8ht
Faktor 0
Faktor 1,4
Faktor 1,8
Faktor 2,2
Ergebnisse III
Perzeptionstests
• Deutliche funktionale Bindung der Kontur für
die Signalisierung von Turnübergaben
• Kaum funktionale Bindung der Dauerstruktur
in diesem Bereich
• Aber: große Sensibilität der VP für
Dauerstruktur
• Segmentelle Längungen werden mit
unflüssiger Sprechweise assoziiert. D.h. es gibt
eine funktionale Bindung von Längung bei der
Signalisierung von Sprechflussstörungen
Zusammenfassung
• Große Variabilität
• Starke Überschneidungen in der
phonetischen Form der funktionalen
Klassen
• Keine 1:1-Beziehungen von Form und
Funktion
• Aber: funktionale Bindung der melodischen
Muster sowohl in Bezug auf inhaltliche
Gliederung, als auch hinsichtlich der damit
eng verbundenen Dialogsteuerung.
Zusammenfassung
• Es können prototypische phonetische
Realisierungen für die verschiedenen
Funktionen herausgearbeitet werden
• Das phonetische System funktioniert immer
in Ergänzug durch syntaktische und
inhaltliche Informationen
• Erweitertetes Konzept der
Merkmalsbündelung
Klassifikationssysteme
• Erstellung eines funktional orientierten
Klassifiktionssystems auf der Basis von
prototypischen phonetischen Strukturen für
die Bereiche• turninterne prosodische Grenzen
• turnfinale prosodische Grenzen
• prosodische Grenzen in unflüssiger Sprache
Dem phonetischen Signalisierungssystem liegt
kein striktes 1:1-Verhältnis zwischen Form
und Funktion zugrunde.
Die Ergebnisse deuten eher auf eine
unterstützende Funktion der phonetischen
Komponente hin, die erst in Kombination mit
syntaktischen und semantischen Strukturen zu
eindeutigen interaktionalen
Funktionalisierungen führt.
Turninterne prosodische Grenzen
Ausblick
Turnfinale prosodische Grenzen