35
ПРОБЛЕМА СЕГМЕНТАЦИИ УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ СИСТЕМА ГОВОРЯЩЕГО SEGMENTATION OF SPOKEN DISCOURSE AND THE SPEAKER’S COGNITIVE SYSTEM

ПРОБЛЕМА СЕГМЕНТАЦИИ УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ СИСТЕМА ГОВОРЯЩЕГО

  • Upload
    teness

  • View
    58

  • Download
    1

Embed Size (px)

DESCRIPTION

ПРОБЛЕМА СЕГМЕНТАЦИИ УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ СИСТЕМА ГОВОРЯЩЕГО. S EGMENTATION OF SPOKEN DISCOURSE AND THE SPEAKER’S COGNITIVE SYSTEM. А.А.Кибрик (Институт языкознания РАН) В.И.Подлесская (РГГУ) Ю.В.Дараган (МГУ) З.В.Ефимова (РГГУ) Н.А.Коротаев (РГГУ) А.О.Литвиненко (МГУ) - PowerPoint PPT Presentation

Citation preview

Page 1: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

ПРОБЛЕМА СЕГМЕНТАЦИИ УСТНОГО ДИСКУРСАИ

КОГНИТИВНАЯ СИСТЕМА ГОВОРЯЩЕГО

SEGMENTATION

OF SPOKEN DISCOURSE AND

THE SPEAKER’S COGNITIVE SYSTEM

Page 2: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Авторы Authors

А.А.Кибрик (Институт языкознания РАН)

В.И.Подлесская (РГГУ) Ю.В.Дараган (МГУ) З.В.Ефимова (РГГУ) Н.А.Коротаев (РГГУ) А.О.Литвиненко (МГУ) В.Л.Цуканова (РГГУ)

A.A.Kibrik (Institute of Linguistics, RAN)

V.I.Podlesskaya (RSUH)

Ju.V. Daragan (MSU) Z.V. Efimova (RSUH) N.A.Korotaev (RSUH) A.O.Litvinenko (MSU) V.L.Cukanova (RSUH)

Page 3: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Дискурс Discourse

Дискурс - это процесс употребления языка

Синонимы: речь, диалог, коммуникация

В данном докладе - устный дискурс

Жанр - рассказ Корпус детских

рассказов о сновидениях

Discourse is the process of language use

Synonyms: speech, dialogue, communication

In this study: spoken discourse

The genre : story A corpus of children’s

night dream stories

Page 4: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Проблема устного дискурсаThe problem of spoken discourse

Устный дискурс является первичной формой существования языка: в филогенезе в онтогенезе для многих языков -

единственная форма даже для наиболее

письменных языков - самая частотная форма

Spoken discourse is the primary form of language existence: in phylogenesis in onthogenesis for many languages

is the only variety even for the most

written languages is the most frequent variety

Page 5: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Проблема репрезентацииThe problem of representation

Чтобы быть объектом научного изучения, устный дискурс должен быть репрезентирован

Естественная форма репрезентации - графическое представление (транскрипция)

In order to be an object of scientific analysis, spoken discourse needs to be represented

The natural form of representation is a graphic representation, that is, a transcription

Page 6: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Проблема транскрипцииThe problem of transcription

Необходима систематическая, последовательная транскрипционная система позволяющая разным

транскрайберам принимать идентичные решения

имеющая оптимальный уровень детализации

A systematic, consistent system of transcription is in order, such that: different

transcribers would make identical decisions

an optimal level of detail is chosen

Page 7: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Проблема сегментацииThe problem of segmentation

Дискурс - это один из основных видов человеческого поведения

Любое целенаправленное поведение имеет структуру, в частности, состоит из сегментов

Между соседними сегментами нужно уметь провести границу

Discourse is among the main kinds of human behavior

Any goal-oriented behavior has a structure, in particular, consists of segments

Boundaries between adjacent segments need to be identified

Page 8: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Сегментация дискурсаDiscourse segmentation

Дискурс порождается не в виде плавного потока, а как серия толчков, пульсаций, квантов (Chafe 1994)

Мы называем такие кванты элементарными дискурсивными единицами (ЭДЕ)

Discourse is produced not as a smooth flow but as a series of pulses, or quanta (Chafe 1994)

We call these quanta Elementary Discourse Units (EDUs)

Page 9: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Критерии единства ЭДЕCriteria of the unity of an EDU

Когнитивный (Chafe 1994): ЭДЕ отражает фокус

сознания говорящего, т.е. объем информации, которую говорящий может одновременно поддерживать в активном состоянии

Семантико-синтаксический: ЭДЕ типично (но не всегда!)

соответствует одной предикации

Просодический: ЭДЕ оформляется как

просодическая единица - с точки зрения тона, громкости, паузации и т.д.

Cognitively (Chafe 1994): An EDU represents the

speaker’s focus of consciousness, that is, the amount of information the speaker is able to maintain activated at one time

Semantically and grammatically: an EDU typically (but not

always!) corresponds to one clause

Prosodically: an EDU is shaped as a

prosodic unit in terms of intonation, loudness, pausing, etc.

Page 10: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Исследовательские вопросыResearch questions

Каковы классы случаев, в которых ЭДЕ не совпадают с предикациями?

Как можно объяснить такие случае рассогласования?

What are the classes of instances when EDUs do not coincide with clauses?

How can one explain these cases of disagreement?

Page 11: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Классы ЭДЕ, не равных предикацииClasses of EDUs differing from clauses

В нашем корпусе от 2/3 до 3/4 ЭДЕ совпадают с предикациями

Однако есть несколько классов ЭДЕ, меньших или больших, чем предикация

Мы остановимся на «малых» ЭДЕ

Мы обсудим основные их типы и предложим для каждого из них интерпретацию - лежащие в основе когнитивные процессы говорящего

In our corpus, 2/3 to 3/4 of all EDUs coincide with clauses

But there are several classes of EDUs that are either smaller or larger than a clause

We are going to focus on “small” EDUs

We are going to discuss their major types and offer an interpretation of the speaker’s underlying cognitive processes

Page 12: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

ЭДЕ, меньшие чем предикация

EDUs smaller than a clause

Page 13: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

1. Вынесенный топикLeft-dislocated topic

z26:27-28....(1.7) А с= || ...(0.5) /двойняшки,

And the twins, ....(2.0) /они’ ..(0.2) \’огораживали,

they were fencing,

Page 14: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Когнитивная интерпретацияA cognitive interpretation

Говорящий намеревается одновременно активировать новый референт и новое событие

Ограничение одной новой идеи (Chafe 1994) диктует, что эти два элемента должны быть помещены в разные ЭДЕ

The speaker intends to simultaneously activate a new referent and a new event

The One-New-Idea-Constraint (Chafe 1994) dictates that they must be put in different EDUs

Page 15: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

2. ПарцелляцияParcellation

z21: 1-4 /Мне /приснилось,

I dreamed, что /я /ехала на \поезде.

that I was riding in a train. В котором /была ...(0.6) зелёная \–поля‑ана,

In which there was a green meadow,с‑c /гриба‑ами и ..(0.2) \пнями всякими.

with mushrooms and various stumps.

Page 16: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Когнитивная интерпретацияA cognitive interpretation

На планируемую предикацию приходится слишком много новой информации

Говорящий отделяет обстоятельство, определение или сочиненную ИГ в особую постпозитивную ЭДЕ

Это запланированная парцелляция

There is too much new information per clause

The speaker chops off an adjunct NP, a coordinate NP, or an attributive element into a separate postposed EDU

This is planned parcellation

Page 17: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

2'. Спонтанная парцелляция Improvised parcellation (afterthought)z51:15-16 ..(0.4) и мн= || и /мне нужно было /зайти значит

в \номер.and I needed to enter the room.

мм(0.4) Для-а \чего-то. For something.

....(1.1) Ну я даже не \знаю для \чего.Well I don’t even know what for.

....(1.1) \Гостиничный.Of the hotel.

Page 18: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Типичная просодическая особенностьA typical prosodic feature

Начальная ЭДЕ интонационно оформлена как завершенная и часто имеет интонацию конца предложения

The initial EDU is intonationally complete and often has a sentence-final intonation

Page 19: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Когнитивная интерпретацияA cognitive interpretation

После завершения ЭДЕ-предикации говорящий обнаруживает, что необходимо добавить к данной предикации еще какой-то элемент информации

Морфосинтаксическая структура этой уже готовой ЭДЕ позволяет говорящему добавить запоздалое приложение, как если бы оно было изначально запланировано

After finishing a clausal EDU, the speaker finds it important to add another piece of information to that clause

The morphosyntactic structure of the already completed EDU allows the speaker to add an afterthought appendix “as if” it was planned originally

Page 20: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

3. Разрыв Split

z49:1-4 Один раз ..(0.2) /\мы-ы —

One time we — ..(0.3) ''(0.1) <мм(0.1)> ...(0.6) три /брата,

three brothers, –Серёжка –Лёшка и /я,

Serezhka, Leshka, and myself, — ..(0.5) с дядей /Сашей поехали на \рыбалку.

— with uncle Sasha went fishing.

Page 21: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Когнитивная интерпретацияA cognitive interpretation

Формулируя ЭДЕ, говорящий обнаруживает, что некоторые из ее элементов могут быть непонятны адресату

В этом случае он вставляет дополнительную ЭДЕ после уже произнесенной части первой ЭДЕ

Такая вставная ЭДЕ бывает предикацией, а бывает и меньше предикации

While formulating an EDU the speaker finds out that some of its elements may be unintelligible to the addressee

Then s/he can wedge an extra EDU after the already uttered part of the first EDU

Such an inset EDU can be a clause, but also can be smaller than a clause

Page 22: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

4. (Cильный) фальстарт (Strong) false start

n32:29-30..(0.4) ’И подх= ==

And appro= ==И-и ..(0.2) /’он ’’(0.3) спускается ко

\мне.And he comes down to me.

Page 23: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Когнитивная интерпретацияA cognitive interpretation

Начав порождение ЭДЕ, говорящий осознает, что выбранная вербализация неточна

Он бросает начатую ЭДЕ и начинает формулировать ЭДЕ заново

Это локальный фальстарт

After having begun producing an EDU, the speaker realizes that the chosen verbalization does not fit

S/he gives up, and begins the formulation of the EDU from scratch

This is a local false start

Page 24: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

4'. Фальстарт планированияFalse start – timing error

z56:1-5/Мы с мамой поех= ==

I and mom wen= == …(0.8) \Это,

Okay, /мы с мамой поехали в ==

I and mom went to == …(0.5) Мне приснился /сон,

I dreamed, будто мы с \мамой поехали в \Аме-ерику.

that I and mom went to America.

Page 25: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Когнитивная интерпретацияA cognitive interpretation

Говорящий начинает формулировать ЭДЕ, но до ее завершения осознает, что данная ЭДЕ преждевременна, и другая информация должна быть сказана раньше

Таким образом, ЭДЕ не впишется в семантическую структуру дискурса, если будет сказана в данном месте

Говорящий бросает ЭДЕ, порождает одну или более других ЭДЕ, и после этого вербализует данное содержание в новой ЭДЕ

The speaker begins to formulate an EDU, but before it is completed s/he realizes that it is premature and some other information is in order

Therefore, the EDU would not fit into the semantic structure of discourse at this point

The speaker gives up, proceeds with one or more other EDUs, and later on verbalizes the given content in a different EDU

Page 26: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

5. Дискурсивные маркерыDiscourse markers

n57: 1-6 ээ(0.3) К /нам домой позвонила-а учительница по /русскому,

To our home called the teacher of Russian,..(0.3) \вот,

okay, и-и /спросила,

and asked, /приедем мы,

if we come, ..(0.1) ’или \нет.

or not..... (1.2) –Вот.

Okay.

Page 27: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Когнитивная интерпретацияA cognitive interpretation

ЭДЕ не содержит пропозиционального содержания, а является сигналом: Динамики порождения

дискурса, например завершения фрагмента дискурса и готовности перейти к следующему (вот)

Текущего ментального состояния говорящего, например неготовности выбрать вербализацию (это)

Текущей эмоции говорящего, например удивления

The speaker does not provide any propositional information but rather signals: Dynamics of discourse

production, e.g. completion of a chunk and readiness to proceed

His/her current mental condition, such as being unready to choose verbalization

His/her sudden emotion, such as surprise

Page 28: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

ЭДЕ, большие чем предикация

EDUs larger than a clause

Page 29: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

(а) Ослабленный (б) Сериализацияглавный глагол Attenuated Serialization main verb

n67: 22-23 ..(0.1) ну вот ..(0.3) /подойти <по-

моему> \меня она /попросила,so I guess she asked me to come up,

...(0.4) говорит «/Пойди \помоги ей¡». says “Go help her”.

Page 30: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Количественные данныеQuantitative data

Количество ЭДЕ в корпусе: 3480Number of EDUs in corpus: 3480

ЭДЕ = пред.EDU = clause

ЭДЕ < пред.EDU < clause

ЭДЕ > пред.EDU > clause

71% 22% 7%

Page 31: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Количество типов малых ЭДЕQuantity of small EDUs by type

тип type %

Топики Topics 0.5

Парцелляции Parcellations 5

Разрывы Splits 0.5

Фальстарты False starts 6

Дискурсивные маркеры Discourse markers

4

Прочее Other 6

ИТОГО TOTAL 22

Page 32: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Выводы Conclusions

ЭДЕ типично совпадают с предикациями

Есть, однако, несколько частотных классов случаев, когда такое соответствие нарушается

В этом случае ЭДЕ могут оказываться как меньше, так и больше предикации

EDUs typically coincide with clauses

However, there are several common classes of cases when such correspondence is not there

An EDU can both be smaller and larger than a clause

Page 33: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Выводы Conclusions(продолжение) (continued)

Каждый из таких классов случаев адекватно регистрируется благодаря систематической транскрипции русского устного дискурса

Each such class of cases is aptly registered by the systematic transcription of spoken Russian discourse

Page 34: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Выводы Conclusions(окончание) (completed)

Каждый из таких классов случаев получает когнитивное объяснение в терминах намерений говорящего, его планов и ожиданий, временной динамики, модели адресата, процессов активации и эмоций

Each such class of cases can receive a cognitive explanation in terms of the speaker’s intentions, planning, expectations, temporal dynamics, modeling the addressee, activation processes, and emotions

Page 35: ПРОБЛЕМА СЕГМЕНТАЦИИ  УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ  СИСТЕМА  ГОВОРЯЩЕГО

Спасибо за внимание.Как и за другие Ваши когнитивные процессы

Thank you for your attention. As well as for your other cognitive processes