Upload
beate-ragle
View
109
Download
0
Embed Size (px)
Citation preview
Entwicklung eines Systems zur Diskurstranskription auf
dem ComputerThomas Schmidt,
SFB ‚Mehrsprachigkeit‘, Hamburg
syncWritersyncWriter-Daten(binär)
Grafik(umg. Partitur)
Segmentliste
MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------
TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------
MIA (v) : Er hat schon recht, Tom.
NN (nv): ---------------------------------- Telefon klingelt ------------------------------------
Datentypen: Transkript
MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------
TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------
MIA (v) : Er hat schon recht, Tom.
NN (nv): ---------------------------------- Telefon klingelt ------------------------------------
Datentypen: Transkript Äußerungsdatenbank
?
MAX: [gestikuliert] Du fällst mir immer <ins Wort>1.TOM: [grinst] <Stimmt ja>1 wohl gar nicht.MAX: [schlägt die Hände vors Gesicht]
((1 sec)) Siehst Du, Du hast es schon <wieder getan>2.MIA: <Er hat schon>2 recht, Tom.
Darstellungstypen: vertikale Darstellung
MAX: [gestikuliert] Du fällst mir immer <ins Wort>1.TOM: [grinst] <Stimmt ja>1 wohl gar nicht.MAX: [schlägt die Hände vors Gesicht]
((1 sec)) Siehst Du, Du hast es schon <wieder getan>2.MIA: <Er hat schon>2 recht, Tom.
Darstellungstypen: vertikale Darstellung Spaltendarstellung
?
MAX TOM MIA NNDu fällst mirimmerins Wort
gestiku-liert
Stimmt jawohl gar nicht
grinst
((1sec)) SiehstDu, Du hast esschonwieder getan
schlägt dieHände vorsGesicht
Er hat schonrecht, Tom
Telefonklingelt
Darstellungstypen: Spaltendarstellung Partiturdarstellung
MAX TOM MIA NNDu fällst mirimmerins Wort
gestiku-liert
Stimmt jawohl gar nicht
grinst
((1sec)) SiehstDu, Du hast esschonwieder getan
schlägt dieHände vorsGesicht
Er hat schonrecht, Tom
Telefonklingelt
MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------
TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------
MIA (v) : Er hat schon recht, Tom.
NN (nv): ---------------------------------- Telefon klingelt ------------------------------------
?
Darstellungsformate: HTML
Darstellungsformate: HTML --> RTF
?
syncWritersyncWriter-Daten(binär)
Grafik(umg. Partitur)
Segmentliste
syncWritersyncWriter-Daten(binär)
Grafik(umg. Partitur)
Segmentliste
andere Werkzeuge
syncWritersyncWriter-Daten(binär)
Grafik(umg. Partitur)
Segmentliste
andere Werkzeuge andere Datenformate
syncWritersyncWriter-Daten(binär)
Grafik(umg. Partitur)
Segmentliste
andere Werkzeuge andere Datenformate andere Betriebssysteme
syncWritersyncWriter-Daten(binär)
Grafik(umg. Partitur)
Segmentliste
andere Werkzeuge andere Datenformate andere Betriebssysteme
?
vertikale Eingabe
Spalten-Eingabe
Partitur-Eingabe
...
vertikale Darstellung: RTF
Spalten-Darstellung: HTML
Partitur-Darstellung: PDF
...
andere Transkriptionsformate Datenbank
andere Werkzeuge
(XML)-Datenformat
„Single Source, Multiple Targets“
t0 t1 t2 t3
MAX / v / „Du fällst mir immer“ MAX / v / „ins Wort“
MAX / nv / „gestikuliert“
TOM / v / „Stimmt ja“ TOM / v / „wohl gar nicht.“
TOM / nv / „grinst.“
Bird / Liberman: ANNOTATION GRAPHS
Struktur einer Diskurstranskription:Zeitachse und Ereignisse
e t(e)Ereignis Sprecher Start Ende Kategorie symbolische Beschreibunge1 Max t0 t1 verbal Du fällst mir immere2 Max t1 t2 verbal ins Wort.e3 Max t0 t2 non-verbal gestikulierte4 Tom t1 t2 verbal Stimmt jae5 Tom t2 t3 verbal wohl gar nicht.e6 Tom t1 t3 non-verbal grinste7 Max t3 t4 verbal ((1 sec)) Siehst Du, Du hast es schone8 Max t4 t5 verbal wieder getan.e9 Max t3 t5 non-verbal Schlägt die Hände vors Gesichte10 Mia t4 t5 verbal Er hat schone11 Mia t5 t6 verbal recht, Tom.e12 NN t1 t6 non-verbal Telefon klingelt
t0 < t1 < t2 < t3 < t4 < t5 < t6
Ereignis Sprecher Start Ende Kategorie symbolische Beschreibunge1 Max t0 t1 verbal Du fällst mir immere2 Max t1 t2 verbal ins Wort.e3 Max t0 t2 non-verbal gestikuliert... ... ... ... ... ...
Ereignis Sprecher Start Ende Kategorie symbolische Beschreibunge1 Max t0 t1 verbal Du fällst mir immere2 Max t1 t2 verbal ins Wort.e3 Max t0 t2 non-verbal gestikuliert... ... ... ... ... ...
MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------
TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------
MIA (v) : Er hat schon recht, Tom.
NN (nv): ---------------------------------- Telefon klingelt ------------------------------------
Ereignis Sprecher Start Ende Kategorie symbolische Beschreibunge1 Max t0 t1 verbal Du fällst mir immere2 Max t1 t2 verbal ins Wort.e3 Max t0 t2 non-verbal gestikuliert... ... ... ... ... ...
Technologien zur Implementierung
• Problem: „Sprachabhängigkeit“
– sprachspezifische lateinische Zeichen:deutsch: Ä Ö Ü ß
französisch: ç è é ê ëschwedisch: å æ ø [...]
– nicht-lateinische Alphabetekyrillisch: Љ Ћ юgriechisch: α β γ θIPA [...]
– CJK-Schriftsysteme– ...
Technologien zur Implementierung
• Problem: „Sprachabhängigkeit“ UNICODE
Technologien zur Implementierung
• Problem: „Sprachabhängigkeit“ UNICODE
• Problem: „Softwareabhängigkeit“
Technologien zur Implementierung
• Problem: „Sprachabhängigkeit“ UNICODE
• Problem: „Softwareabhängigkeit“ XML
Technologien zur Implementierung
• Problem: „Sprachabhängigkeit“ UNICODE
• Problem: „Softwareabhängigkeit“ XML
• Problem: „Plattformabhängigkeit“
Technologien zur Implementierung
• Problem: „Sprachabhängigkeit“ UNICODE
• Problem: „Softwareabhängigkeit“ XML
• Problem: „Plattformabhängigkeit“ JAVA
XML-Datenformat
XML-Datenformat
Eingabe-Schnittstelle
XML-Datenformat
Eingabe-Schnittstelle
HTML RTF
XML-Datenformat
Eingabe-Schnittstelle
HTML RTF
XML-Datenformat
Eingabe-Schnittstelle
HTML RTF
andere Anwendungen
XML-Datenformat
Eingabe-Schnittstelle
HTML RTF
andere Anwendungen
(Partitur-)Transkriptionseditor