Araki Lab - 顔文字と日本語オノマトペの...

Preview:

Citation preview

顔文字と日本語オノマトペの関連性分析

石井 直人 桝井 文人 Michal Ptaszynski 北見工業大学

1

はじめに

文字による情報伝達が発達

2

はじめに

文字による情報伝達が発達

3

はじめに

4

今日は楽しかった

今日は楽しかった😊

今日は楽しかった(*^◯^*)るんるん

はじめに

5

今日は楽しかった

今日は楽しかった😊

今日は楽しかった(*^◯^*)るんるん合わせて使われる例も存在する

はじめに

6

顔文字の構成

(*^◯^*)輪郭

口 目頬

はじめに

7

顔文字の構成

(*^◯^*)輪郭

口 目頬

顔文字とオノマトペの関連性についてはまだ解明されていない

はじめに

顔文字だけではニュアンスが十分に伝わらない

→誤解を生じることがある8

はじめに

オノマトペに当てはまる顔文字がわからない9

るんるんしてる 顔文字を探したい

るんるん

はじめに

顔文字にオノマトペを用いた説明を付与する

10

はじめに

オノマトペに当てはまる顔文字を抽出する

11

るんるん

(*^◯^*)

目的顔文字+オノマトペ

→文字による情報伝達をより円滑にする

12

顔文字-オノマトペ翻訳システムの作成

目的顔文字+オノマトペ

→文字による情報伝達をより円滑にする

13

顔文字-オノマトペ翻訳システムの作成

両者の関連性を調べるため アンケートによる予備調査を行った

予備調査

14

アンケートの設問

次の顔文字を見て,どのようなオノマトペが浮かびますか. 浮かばない場合は「わかりません」と答えてください.

次のオノマトペを見て,どのような顔文字が浮かびますか. 浮かばない場合は「わかりません」と答えてください.

設問1

設問2

両者の関連性の調査

15kaomoji.uunyan.com

アンケートの設問

次の顔文字を見て,どのようなオノマトペが浮かびますか. 浮かばない場合は「わかりません」と答えてください.

次のオノマトペを見て,どのような顔文字が浮かびますか. 浮かばない場合は「わかりません」と答えてください.

設問1

設問2

両者の関連性の調査

16kaomoji.uunyan.com

アンケートの設問

次の顔文字を見て,どのようなオノマトペが浮かびますか. 浮かばない場合は「わかりません」と答えてください.

次のオノマトペを見て,どのような顔文字が浮かびますか. 浮かばない場合は「わかりません」と答えてください.

設問1

設問2

両者の関連性の調査

17kaomoji.uunyan.com

アンケートの実施

アンケートの対象者 • 男性8名

• 女性5名

合計13名

18

回答結果設問1(9) (;゚Д゚) (10) Σ(゚д゚lll)項目「ガーン」が1票ずつ入っていた

設問2(1)ガーン10票のうち7票が д゚ と゚いう目と口を表現

д゚ →゚ ガーンというオノマトペで一致

19

回答結果設問1(3) (=з=)

怒りの感情を表す「むー」「ブーブー」と 愛好の感情を表す「ちゅー」が混在

意見が一致していない

顔文字は多義である20

回答結果顔文字→オノマトペ「まじ!」「しまった」

オノマトペではない単語が混在

顔文字の持つニュアンスの曖昧性を示唆

21

考察• 顔文字とオノマトペは感情表現の一種

• 顔文字は多義である

• 顔文字は曖昧性の高い表現である

顔文字とオノマトペは1対1対応ではない

22

予備調査の問題点

割合における平均

顔文字→オノマトペ 0.34オノマトペ→顔文字 0.44

「わかりません」の割合における平均

選択肢がなければ回答が困難23

アンケート再設計

24

アンケートの再設計✦感情を基にした両者の関連性の調査

CAOシステム:20件

オノマトペDB:20件

語群の設置

1. 中村明:感情表現辞典,東京堂出版,1993 2. Ptaszynski, M., Maciejewski, J., Dybala, P., Rzepka, R. and Araki, K. : CAO : A Fully Automatic Emoticon Analysis System, In Proc. of

The 24th AAAI Conference on Artificial Intelligence (AAAI-10), pp.1026-1032. 3. 内田ゆず,荒木健治,米山淳:複数評価者による感情を表す日本語オノマトペの分類,言語処理学会 第18回年次大会 発表論文集,2012年3月

25

アンケートの再設計✦感情を基にした両者の関連性の調査

CAOシステム:20件

オノマトペDB:20件

語群の設置

1. 中村明:感情表現辞典,東京堂出版,1993 2. Ptaszynski, M., Maciejewski, J., Dybala, P., Rzepka, R. and Araki, K. : CAO : A Fully Automatic Emoticon Analysis System, In Proc. of

The 24th AAAI Conference on Artificial Intelligence (AAAI-10), pp.1026-1032. 3. 内田ゆず,荒木健治,米山淳:複数評価者による感情を表す日本語オノマトペの分類,言語処理学会 第18回年次大会 発表論文集,2012年3月

26

アンケートの再設計✦感情を基にした両者の関連性の調査

CAOシステム:20件

オノマトペDB:20件

語群の設置

1. 中村明:感情表現辞典,東京堂出版,1993 2. Ptaszynski, M., Maciejewski, J., Dybala, P., Rzepka, R. and Araki, K. : CAO : A Fully Automatic Emoticon Analysis System, In Proc. of

The 24th AAAI Conference on Artificial Intelligence (AAAI-10), pp.1026-1032. 3. 内田ゆず,荒木健治,米山淳:複数評価者による感情を表す日本語オノマトペの分類,言語処理学会 第18回年次大会 発表論文集,2012年3月

27

アンケートの設問次の顔文字を最も適切に表しているオノマトペを下の語群から

選んでください(複数回答・無回答も可とする)

28

アンケートの実施

アンケートの対象者 • 男性91名

• 女性16名

合計107名

29

一致度の検証

投票率:a,無回答の回答率:b,順位:x,

最下位の順位:y,項目数:z

Σ{a×(y-x+1)}/(z+b)

1. 各顔文字のオノマトペへの投票率を求める 2. 投票率を順位で重み付けした数値を求める 3. 全項目の和を項目数と無回答の回答率の和で割る

30

検証結果

31

検証結果

32

1つのオノマトペに意見が集中

検証結果

33

無回答に意見が集中

様々なオノマトペが 想起される

記号による顔文字の分類(́・з-)ノ (=з=)

「ちゅー」と「ぶーぶー」の 投票率が高かった

“з”という記号から意味を想起

34

記号による顔文字の分類

(́・д・`):げんなり,くよくよ

(`Д́):むすっ,ぶーぶー

(ノд・。):しくしく,くよくよ

“д”→ネガティブな感情を想起

35

記号による顔文字の分類

• “з” →「ちゅー」「ぶーぶー」

• “д” → ネガティブな感情

記号により大まかに分類できる例もある

36

記号による顔文字の分類

• “з” →「ちゅー」「ぶーぶー」

• “д” → ネガティブな感情

記号により大まかに分類できる例もある

37

→文脈に依存するものとそうでないものが存在する

記号による解釈の差異(^д^*)

喜び?安心? 怒り?恥?

38

むすっ てれっ るんるん ほっ

記号による解釈の差異(^д^*)

喜び?安心? 怒り?恥?

39

むすっ てれっ るんるん ほっ

記号による解釈の差異(^д^*)

喜び?安心? 怒り?恥?

40

むすっ てれっ るんるん ほっ

記号による解釈の差異(^д^*)

喜び?安心? 怒り?恥?

41

むすっ てれっ るんるん ほっ

記号による解釈の差異(^д^*)

喜び?安心? 怒り?恥?

着目する記号により想起される意味が変わる

42

むすっ てれっ るんるん ほっ

オノマトペについての考察語群に使用したオノマトペについて

以下の数値を調査した投票数 ブログコーパスにおける出現頻度

被験者のオノマトペに対する理解度の検証Michal Ptaszynski, Pawel Dybala, Rafal Rzepka, Kenji Araki and Yoshio Momouchi: YACIS: A Five-Billion-Word Corpus of Japanese Blogs

Fully Annotated with Syntactic and Affective Information, In Proceedings of The AISB/IACAP World Congress 2012 in Honour of Alan Turing, 2nd Symposium on Linguistic and Cognitive Approaches To Dialog Agents (LaCATODA 2012), pp. 40-49, 2-6 July 2012,

43

オノマトペについての考察

44Michal Ptaszynski, Pawel Dybala, Rafal Rzepka, Kenji Araki and Yoshio Momouchi: YACIS: A Five-Billion-Word Corpus of Japanese Blogs

Fully Annotated with Syntactic and Affective Information, In Proceedings of The AISB/IACAP World Congress 2012 in Honour of Alan Turing, 2nd Symposium on Linguistic and Cognitive Approaches To Dialog Agents (LaCATODA 2012), pp. 40-49, 2-6 July 2012,

*

*

オノマトペについての考察

45Michal Ptaszynski, Pawel Dybala, Rafal Rzepka, Kenji Araki and Yoshio Momouchi: YACIS: A Five-Billion-Word Corpus of Japanese Blogs

Fully Annotated with Syntactic and Affective Information, In Proceedings of The AISB/IACAP World Congress 2012 in Honour of Alan Turing, 2nd Symposium on Linguistic and Cognitive Approaches To Dialog Agents (LaCATODA 2012), pp. 40-49, 2-6 July 2012,

*

*

投票数の多いオノマトペの方が出現頻度が高め

投票数の少ないオノマトペの方が出現頻度が低め

オノマトペについての考察

46Michal Ptaszynski, Pawel Dybala, Rafal Rzepka, Kenji Araki and Yoshio Momouchi: YACIS: A Five-Billion-Word Corpus of Japanese Blogs

Fully Annotated with Syntactic and Affective Information, In Proceedings of The AISB/IACAP World Congress 2012 in Honour of Alan Turing, 2nd Symposium on Linguistic and Cognitive Approaches To Dialog Agents (LaCATODA 2012), pp. 40-49, 2-6 July 2012,

*

*

オノマトペについての考察

47Michal Ptaszynski, Pawel Dybala, Rafal Rzepka, Kenji Araki and Yoshio Momouchi: YACIS: A Five-Billion-Word Corpus of Japanese Blogs

Fully Annotated with Syntactic and Affective Information, In Proceedings of The AISB/IACAP World Congress 2012 in Honour of Alan Turing, 2nd Symposium on Linguistic and Cognitive Approaches To Dialog Agents (LaCATODA 2012), pp. 40-49, 2-6 July 2012,

*

*

うっとりしている顔文字がない

再調査の考察✦顔文字に関する考察

顔文字毎にその理解度は異なる

記号によって顔文字を分類することが可能

文脈に依存するものとそうでないものが存在する

✦オノマトペに関する考察

日常的な使用頻度と被験者の投票数には何らかの相関がある可能性がある

48

再調査の問題点

1. 顔文字に当てはまるオノマトペを選ぶ

→顔文字についての考察に偏ってしまった

2.20語の語群から選択

→回答を選択するのに手間取ってしまう

49

解決策

ぎくっ A:(-д-;) B:(>ω<、) C:(=◇=;) D:その他( )

1. オノマトペに当てはまる顔文字を選ぶ設問を追加する 2. 3つの選択肢+「その他」の4択にする

50

まとめ

51

まとめ

• 記号により顔文字を分類することが可能

• 文脈に依存する顔文字とそうでない顔文字が存在する

アンケート調査を基に,顔文字とオノマトペの関連性について調査した

52顔文字の曖昧性を解消できる可能性がある

今後の予定• 記号による一致度の検証 • 文脈による対応付け • 2つの課題を解決し,アンケートの再実施

顔文字-オノマトペ翻訳システムの作成

53

今日は楽しかった(*^◯^*)         るんるん

ご清聴ありがとうございました

54

予備調査の設問

男女別平均回答率

顔文字→オノマトペ オノマトペ→顔文字

男性 0.50 0.50

女性 0.90 0.75

再調査の設問(=з=) (‾▽‾*)

(ノд・。) ( ; _ ; )

(゚ロ゚屮)屮 (́・з-)ノ

(●゚v゚) ∑(゚д゚;)

\(>o<)/ (ノ≧∀≦)ノ

(゜∀゜) ε-(;-ω-`A)

(́・д・`) ρ(ーoー)♪

(^2^) ((o(。・ω・。)o))

(*ノ▽ノ) f(^^;)

(`Д́) (^д^*)

むすっ ちゅー くよくよ ぎゃー おろおろ

るんるん うきうき うじうじ ほっ もじもじ

ぶーぶー にやにや しくしく どきっ わいわい

わくわく げんなり やれやれ てれっ うっとり

感情表現辞典見出語

• 怒 • 好 • 哀 • 驚 • 怖

• 喜 • 昂 • 厭 • 安 • 恥

中村明:感情表現辞典,東京堂出版,1993

オノマトペDB

内田ゆず,荒木健治,米山淳:複数評価者による感情を表す日本語オノマトペの分類, 言語処理学会 第18回年次大会 発表論文集,2012年3月

がさがさかつんきゅっきゅっくしゃっくしゅんこちんころころせかせかせこせこそそくさつくづくどたばたばたばたぴーんぴぴっぴんぴんぴんぶすりほいほいぼさっむくむくむっつりめーめーもぞもぞわさわさ

あっはっは にこりあはあは にたっあはは にたにたいひひ にっうっしっし にっこにこうはうは にっこりうひひ にやっうひょうひょ にやにやうふっ にやりうふふ にんまりえへへ はっはっおほほ はははがはは ひっひっきゃーきゃー ひひひきゃっきゃっ ぷっぎゃはは ふっふっくすり ふふくっくっ へっへっけたけた へへへけらけら ほっほっげらげら ほほほにーっ らんらんにかっ るんるんにこっ わーわーにこにこ わはは

うきうきうずうずわくわく

あわわおどおどおろおろぞっはらはらひーびくびくひっひやり

うぎゃー きょとんおーおー げっがーん どきっがびーん どきどきがびょーん どきりぎく どっきりぎくっ ぱちくりぎくり はっきゃー びくっぎゃー びくりきゃっ びっくらぎゃっ びっくりぎゃふん わーっぎょえー わっぎょぎょ あわわぎょっ

いじいじうじうじぎゃーぎゃーぐだぐだげーずきっそわそわたじたじひーひーもやもややきもきぎゃーげんなり

うっとりにたりにたりあっはっはうっしっしうはうはうひょうひょがははけらけらげらげらにーっにたっにたにたにやにや

いらいらかーっかちんかっがみがみかりかりかんかんきっきりきりつんつんけんつんつんぷいぷーぶすっぷりぷりぷんむーっむかっむかむかむしゃくしゃむすっむっ

うえんうえん しくしくうるうる しゅんうるっ しょぼしょぼうるるん しょぼっうわーん しょぼんえーん しょんぼりえんえん しんみりおんおん とぼとぼがっかり とほほがっくり べそべそぐさっ ほろっぐすぐす ぽろぽろぐすっ ほろりぐすりぐすり ほろりほろりくすん ぽろりぽろりぐすん めそめそぐっすん わーんくよくよ わんわんげっそり がーんげんなり

あんあんいけつんつんかんらかんらきろきろくさくさげたげたげたっけちょんこせこせしっちゃこっちゃしぼしぼつっけんどんふくふくへどもどもだもだ

ラッセルの感情円環モデル

Russell.J.A: A circumplex model of affect. 1980,Journal of Personality and Social Psychology, 39, 1161-1178.

順位の付け方順位

1

2

2

3 一つ上の順位+1

61

(=з=)の一致度の検証順位:x オノマトペ 投票率:a a×(y-x+1)

1 ぶーぶー 0.4677 2.33872 むすっ 0.2339 0.93553 ちゅー 0.2016 0.60484 うじうじ 0.0161 0.03235 てれっ 0.0081 0.00815 うっとり 0.0081 0.00815 やれやれ 0.0081 0.0081

5:y げんなり 0.0081 0.0081項目数z:8 無回答 0.0484:b 総和:3.9435

Σ{a×(y-x+1)}/(z+b)=49.00(%)

オノマトペについての考察

63

Michal Ptaszynski, Pawel Dybala, Rafal Rzepka, Kenji Araki and Yoshio Momouchi: YACIS: A Five-Billion-Word Corpus of Japanese Blogs Fully Annotated with Syntactic and Affective Information, In Proceedings of The AISB/IACAP World Congress 2012 in Honour of Alan

Turing, 2nd Symposium on Linguistic and Cognitive Approaches To Dialog Agents (LaCATODA 2012), pp. 40-49, 2-6 July 2012,

*

*

Recommended