26
言言言言言言言言言言言言言言言言言言 言言言言言言言言言言言 : 2010 言 3 言 9 言 言言言言言言 言 16 言 言言言言 言 言言言言 言言言言言言言言言言言言言言言 言言 言言 言言言言言言言言言

Nlp16 thematic session

Embed Size (px)

Citation preview

Page 1: Nlp16 thematic session

言語を社会知として見た時何が言えるか

社会的圧力が形作る文法 :

2010 年 3 月 9日 言語処理学会 第 16 回 年次大会  於 東京大学

「言語表現」と「言語」のあいだ

吉川 正人 慶應義塾大学大学院

Page 2: Nlp16 thematic session

1. はじめにIntroduction

Page 3: Nlp16 thematic session

1.1. 「社会」への回帰

チョムスキー以来、 ( 理論 ) 言語学は認知科学に しかし : 言語には個体の認知に還元できない諸性質が備

わっている ( マクロ ) 社会言語学・言語 / 文化人類学の示す通り

ここで今一度、言語を「ヒト」から「社会」に返す必要があるのでは ? その一つの契機が「複雑適応系としての言語」観の提唱 (Beckner

et al. 2009)

言語を話者というエージェントが複雑な社会ネットワークによって結びついた「複雑適応系」と看做す

3

NLP2010

Page 4: Nlp16 thematic session

NLP2010

1.2. 「社会的圧力」と文法

本発表では : 言語を「社会知」とみなした場合、 「文法」は一体どのような姿になるのか ?

ということを考えてみる 結論 :

我々の言語行動は「社会的圧力」によって制約されており、 「文法」を形作っているのはそのような社会的圧力である

つまり : 文法 = ある言語コミュニティ内で通用する社会的規範

4

Page 5: Nlp16 thematic session

NLP2010

1.3. 本発表の構成

2 節 : 言語・文法の 社会性」を示す議論の提示「 1) 「事例基盤 (exemplar-based) 」論者の議論 2) 「文法の進化」の議論

3 節 : 社会的圧力が文法を形作るという主張の展開 1) 文法を構成する三要素「言語事例記憶 E 」 , 「運用システム

M 」 , 「社会的圧力 S 」の素描 2) 定型表現の重要性の議論 時間があれば

• 補足 1: 多重文法仮説との関連 ; 補足 2: 参考データ

4 節 : 結語 まとめと展望

5

Page 6: Nlp16 thematic session

2. 背景Background

Page 7: Nlp16 thematic session

NLP2010

2.1. 事例基盤論者の議論 1

Port (2007, et seq) の“ Rich Phonology” 言語記憶 = 具体的・エピソード的な事例記憶の集合体 抽象知識 : 事例を構成する特性の「計算」による派生物

• 「音素」 ( など抽象的な ) は知識は心的には実在しない

事例基盤のモデルがなぜ「社会性」に結びつく ? 事例記憶 ≈「無知性」な記憶

本当に抽象的・体系的な構造が得られる ??

考えられる可能性 :

• 「言語構造」 = 社会的な構築物• ヒトの個体は社会的な要因に敏感であるだけ

7

Page 8: Nlp16 thematic session

NLP2010

2.1. 事例基盤論者の議論 2

Port の議論の新奇性 Tomasello (1999, 2003) の議論・言語 / 文化人類学の議論 (e.g.,

Enfield 2002) と何が違う ?

答え :

• トマセロ : 最終的に習得の過程で幼児は言語を内在化させる• 言語 / 文化人類学 : ヒト個体の知識構造にはあまり関心がない

Port は• 1) ヒト個体の持つ言語知識・処理機構と

2) 社会的な言語構造とを「二つの異なる複雑系」と断言 (Port 2009)

8

Page 9: Nlp16 thematic session

NLP2010

2.2. 文法の「進化」と社会的要因 1

Kirby ら (e.g., Kirby & Hurford 2002) の研究 「繰り返し学習 (iterated learning) 」モデルにより言語進化を

シミュレート 世代間の「継承」を通して「徐々に単純化される」文法進化の道筋を提示

Wray & Perkin (2005) の主張 : 文法の単純化は「見知らぬ人と話す」ことの帰結

• 「ソト向け (exoteric) 」な言語ほど単純化しやすい• 非母語話者の学習の容易性にも貢献

Kirby らの研究の結果を説明する要因では ?

• 繰り返し学習モデルでは「社会 / 文化的圧力」が未知• その場合言語は「ソト向け」になる

9

Page 10: Nlp16 thematic session

NLP2010

2.2. 文法の「進化」と社会的要因 2

Batali (2002) の研究 多重エージェントモデルを用い「再帰的 (recursive) 」な文法の創発をシミュレート

エージェント間の交渉により再帰的な文法の創発を実現• 各エージェントは事例記憶 + 単純な記号操作能力しか持たない

「交渉」は「処理コスト」ベースに行われた• コストは既に知っている = 「誰か」が一度でも用いた表現を利用する

場合最小• 「社会的圧力」をうまく取り込むことに成功

注意 : Batali (2002) のシミュレーションで再帰的な文法を獲得したのは

エージェント個人ではなくそのコミュニティ全体

10

Page 11: Nlp16 thematic session

3. 議論Discussion

Page 12: Nlp16 thematic session

NLP2010

3.1. 提案

言語の「創造性」の起源 言語能力としての計算機構 = 文法 ?

社会要因への敏感さ = 社会認知能力 ? (Cf. Tomasello 2003)

提案 文法は、 1) 言語事例 E 、 2) 言語運用システム M 、 3) 社会的圧

力 S  によって形作られている• E と M は言語活動の可能性を提供し、 S が適切性を提供する• S に対する一定の感度はみな持ち合わせているという仮定の下

E, M の想定は目新しくないかもしれないが、 S の導入に新奇性がある

12

Page 13: Nlp16 thematic session

NLP2010

3.2. 言語事例記憶 E

言語事例記憶 E の中身 言語表現 f とその使用された状況 s との対 (f, s) の膨大なデー

タベース (黒田 2007)

• 恐らくエピソード記憶 (e.g., Tulving 2002) と同一視可能 (f, s) を構成する「部分」はその「索引」として機能

• 膨大なデータベースからの情報の取り出し (= 思い出し ) を効率化するのに貢献

• 「語」や「構文」、「概念」は事例記憶の索引として再解釈

E から見た「文法」≈ 「統語論」 言語事例に付与された文レベルの索引の体系

• その実体としては黒田・長谷部 (2009) の「パターンラティスモデル (PLM) 」を想定

13

Page 14: Nlp16 thematic session

NLP2010

3.3. 運用システム M

運用システム M の働き E を、何らかの外部要因に基づいて運用するシステム 「創造性」の大元はここにある

• 基本的なメカニズムは恐らくアナロジー

ただし M は無限の創造性を「無制限には」許さない M はバイアスに基づく保守的なシステム

• 日常の言語活動の即時性を鑑みるとそう考えてしかるべき 従って : M は (所謂 ) 「文法」そのものではない

• M はある言語 L の「全体像」を知らない

14

Page 15: Nlp16 thematic session

NLP2010

3.4. 社会的圧力 S [1]

社会的圧力 S とは : コミュニケーションの達成確率最大化のため、「なるべく他人と同じように話す」ように働く力

事実上、言語行動の「規範」として働く• ヒトは言語活動の場において、「どのように話すのがその場で最も適切か」= 「規範」を推察できる

規範は選択される

なぜ S が重要なのか ? 誰でも初めはどうやったらことばが通じるのかを知らない 言語は常に他者からやって来る

= とりあえず他者の「真似」をすることが最も安全

15

Page 16: Nlp16 thematic session

NLP2010

3.4. 社会的圧力 S [2]

S の観点から説明可能な言語事実 表現の適切性が場面によって異なること

• 選択される規範によって変化する• この判断は豊かな事例記憶を基に達成される

「ソト向け言語」の単純化 (Wray & Perkins 2005)

• 「ソト向け」 = 「規範の推察が困難 /不可能」 規則的な振る舞いの出現

↑の帰結 1: 「規則的な話し方」は負荷が高い ↑の帰結 2: S の非常に低い状況では「独特」な話し方になる

注意 Batali (2002) の言う「社会的圧力」と S とは若干趣が異なる

16

Page 17: Nlp16 thematic session

NLP2010

3.5. 定型表現の重要性

S の下で「継承」されるのは何か ? 明らかに : 社会 / 文化的に重要な表現 (パターン ) = 「定型表現」

• 抽象的・一般的な「規則」それ自体の継承は保証されない

定型表現や「一定の話し方」の継承の道筋 コミュニケーション上有用なものは生き残り、そうでないものは淘汰される• 数の原理・社会言語学的要因に左右される

「発話淘汰モデル (Utterance Selection Model) 」(e.g., Baxter et al. 2006; Blythe & Croft 2009) で表現可能

17

Page 18: Nlp16 thematic session

NLP2010

18

3.x. 創発文法と多重文法仮説

「創発文法 (Emergent Grammar) 」 (Hopper 1998) との関わり 会話の場で動的に文法が構築されるという観点は文法の「起源」

の説明として想定する

創発文法の派生形としての「多重文法仮説 (Multiple-Grammar Hypothesis) 」 (岩崎勝一氏 ) 多重文法仮説 (MGH) は本発表の主張とかなりの部分で共通 ただし : 「小文法」と文法全体 ( 大文法 ?) との関係に対する想定

は異なる• MGH では小文法は文法全体を「構成する」と看做される• ここでは「文法全体」のようなものを想定しない

Page 19: Nlp16 thematic session

19

3.y. 社会的圧力の実体 ?

Eve: Mommy letter .

Eve: Kathy letter ?

Mother: what did you say ?

Eve: Kathy letter ?

Mother: Kathy doesn't want a letter .

Mother: no .

Eve: no # no .

Eve: a little pencil .

Eve: that .

Mother: what is that ?

語結合 (逸脱? )

語結合 (逸脱? )

困惑?

否定

否定

語結合 (逸脱? )

唐突な発言

困惑?

CHILDES (MacWhinney 2000) 内のコーパス (Brown 1973) より

間接否定証拠か? 女児 Eve, 1歳 6ヶ月

Page 20: Nlp16 thematic session

4. 結語Concluding Remarks

Page 21: Nlp16 thematic session

NLP2010

4.1. 議論のまとめ

本発表では 言語を社会知として見た時、 「文法」とは使用者が従う「規範」であり、 それを形作っているのは「他人と同じように話す」ように働く力

= 「社会的圧力」 S である

という仮説を提案 その際

話者個人が持つのは具体的な言語事例の記憶 E とその運用システム M のみであり、

それに S が加わることで文法が形作られる

と主張

21

Page 22: Nlp16 thematic session

NLP2010

4.2. 展望

それで、我々は何をどうすればいいか ? この大仮説を実証に落とし込むのは大仕事 案 1: ジャンル毎のコーパス分析

• 無理に一般化を計らずに、共通点と差異とを分析 (BCCWJ は有用 )

案 2: ヒト個体の知識の探求• 習得データ (e.g., CHILDES, MacWhinney 2000) などを利用• これも無理な一般化を目指さない

案 3: 発話淘汰モデル等を用いた言語変化の分析• 社会的変数を取り込んだ動的な分析へ

22

Page 23: Nlp16 thematic session

謝辞と参考文献

Page 24: Nlp16 thematic session

NLP2010

謝辞

以下の方々からのコメントが本発表の準備にあたって参考になりました 黒田 航氏  (情報通信研究機構 )

井上 逸兵教授 ( 慶應義塾大学 )

久保田ひろい氏 ( 慶應義塾大学大学院 )

この場を借りて謝意を表します

24

Page 25: Nlp16 thematic session

NLP2010

参考文献 ( 発表論文未掲載のもの )

Brown, R. W. 1973. A first language: The early stages. Cambridge, MA.: Harvard University Press.

Enfield, N. (ed.) 2002. Ethnosyntax: Explorations in grammar and culture. Oxford: Oxford University Press.

Hopper, P. 1998. Emergent grammar. In Tomasello, M. (ed.) The new psychology of language (pp. 155-175). Mahwah, N.J.: Lawrence Erlbaum Associates.

MacWhinney, B. 2000. The CHILDES Project: Tools for analyzing talk. Mahwah: Lawrence Erlbaum Associates.

Port, R. 2009. The dynamics of language. In Myers, R. (ed.) Encyclopedia of complexity and systems science (pp. 2310–2323). London: Springer.

Tomasello, M. 2003. Constructing a language: A usage-based theory of language acquisition. Cambridge, MA.: Harvard University Press.

Tulving, E. 2002. Episodic memory: From mind to brain. Annual Review of Psychology, 53, 1–25.

25

Page 26: Nlp16 thematic session

ご清聴有難うございました。Thank you for your attention.