32
発言の感情的分析の研究 冗談のタイミングを正確に決定するために ミハウ・プタシンスキ(発表者) パヴェウ・ディバワ 施文翰 ラファウ・ジェプカ 荒木健治 北海道大学大学院情報科学研究科メディアネットワーク専攻 情報メディア学講座言語メディア学研究室 2007.10.18 映像情報メディア学会研究会

発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

発 言 の 感 情 的 分 析 の 研 究冗談のタイミングを正確に決定するために

ミハウ・プタシンスキ(発表者) パヴェウ・ディバワ 施文翰

ラファウ・ジェプカ 荒木健治

北海道大学大学院情報科学研究科メディアネットワーク専攻

情報メディア学講座言語メディア学研究室2007.10.18

映像情報メディア学会研究会

Page 2: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

感情における従来研究

感情及びその表現の研究

行動科学(Darwin),認知科学(Ortony),構造主義,社会科学など(Frijda,Izard).

C. R. Darwin, The Expression of the Emotions in Man and Animals, Oxford University Press, New York (1998)

N. H. Frijda, The Emotions, Cambridge University Press, Cambridge (1987)

Ortony, G. L. Clore, A. Collins, The Cognitive Structure of Emotions, Cambridge University Press, Cambridge (1988)

E. Izard, Human Emotions, Springer (1977)

N. Nakayama, K. Eguchi, N. Kando, A Proposal for Extraction of Emotional Expression, (in: IEICE Technical Report, vol. 104, no. 416, (2004), pp.13-18)

R. W. Picard, Affective Computing, The MIT Press, Cambridge (1997)

人工知能研究,自然言語処理へ挿入の試み(Picard, Nakayama)

感情分析の一般的手法:名詞,動詞などへの統計的なアプローチ

例:りんごが赤い. → “りんご”と“赤い”の感情極性を量る(WWWでtrigram検索など).

Page 3: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

感情における従来研究

感情及びその表現の研究

行動科学(Darwin),認知科学(Ortony),構造主義,社会科学など(Frijda,Izard).

C. R. Darwin, The Expression of the Emotions in Man and Animals, Oxford University Press, New York (1998)

N. H. Frijda, The Emotions, Cambridge University Press, Cambridge (1987)

Ortony, G. L. Clore, A. Collins, The Cognitive Structure of Emotions, Cambridge University Press, Cambridge (1988)

E. Izard, Human Emotions, Springer (1977)

N. Nakayama, K. Eguchi, N. Kando, A Proposal for Extraction of Emotional Expression, (in: IEICE Technical Report, vol. 104, no. 416, (2004), pp.13-18)

R. W. Picard, Affective Computing, The MIT Press, Cambridge (1997)

人工知能研究,自然言語処理へ挿入の試み(Picard, Nakayama)

感情分析の一般的手法:名詞,動詞などへの統計的なアプローチ

例:りんごが赤い. → “りんご”と“赤い”の感情極性を量る(WWWでtrigram検索など).

Page 4: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

我々のアプローチ

• 立場感情の表現方法:言語,身振り,しぐさ,姿勢,表情,音調など.本研究:テクスト処理に限る(言語学的な立場,辞書的なアプローチ)

• 目的冗談を繰り出すための適切なタイミングを決定

(非公式な場面の認知)

• 発言のコンテクストから発言の感情性を決定 → 精神状態を予測

J. L. Austin, How to do things with Words, Harvard University Press, Cambridge (1975)

J. R. Searl Speech Acts: An Essay in the Philosophy of language, Cambridge University Press, Cambridge (1969)

E. T. Hall, The Hidden Dimension, Double Day New York (1966)

W. Ruch, The Sense of Humor: Explorations of a Personality Characteristic, Mouton de Gruyter, Berlin, New York (1998)

Page 5: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

感情的分析

間投詞・感嘆文

擬態語

愛称

すげぇ,うおぉ,やったな,なんという~,なんて~  等

ワクワク,ドキドキ,(胸が)ぐじゃぐじゃ(する) 等

ようちゃん(良子),黒ちゃん(黒川など) 等

くだけた言い方・卑語

音声的な要素

~してるぜ,分からねえ,よく降りやがるな 等

音の延長,「!」,「??」,それらの複数使用 等

感情の語彙目録 (名)喜ぶ,悲しむ,むかつく(形)嬉しい,悔しい 等

感情の表出においてのみ現われる品詞(感情的要素)

Page 6: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

感情的分析

間投詞・感嘆文

擬態語

愛称

すげぇ,うおぉ,やったな,なんという~,なんて~  等

ワクワク,ドキドキ,(胸が)ぐじゃぐじゃ(する) 等

ようちゃん(良子),黒ちゃん(黒川など) 等

くだけた言い方・卑語

音声的な要素

~してるぜ,分からねえ,よく降りやがるな 等

音の延長,「!」,「??」,それらの複数使用 等

感情の語彙目録 (動)喜ぶ,悲しむ,むかつく(形)嬉しい,悔しい 等

感情の表出においてのみ現われる品詞(感情的要素)

Page 7: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

感情的分析

1.言語の感情的要素のデーターベースを作成

2.ユーザの発言をデーターベースと照合

3.感情的要素の抽出

4.感情的値(感情要素個別的計算方法*)要素1つ=1点上位制限=5点

{ 要素 無し:感情性=0要素 有り:感情性>0

*)感情要素種類的計算方法によっての評価も行なったが結果が低かった.

Page 8: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

感情を含まない発言• A :この本はとても怖いです。感情的要素:無感情性:NO感情的値=0

感情を含む発言• A‘:この本さー、すげーやばかったよ。まじ怖すぎ。

感情的要素:さー,すげー,よ,まじ感情性:YES感情的値=4

感情的分析の実例

Page 9: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

評価実験 I. 感情性(定量分析)

• 実験素材収集.発言提供者10人(女性2人,男性8人;20~34歳)

感情を含む発言30

感情を含まない発言30

• システムの評価

発言提供者の発言の感情性を当てる

• 結果

システムによる感情性の決定の正確さ=88%

}意味的に似ている

Page 10: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

•人間評価者による再評価 評価者8人(女性2人,

 男性6人;20~30歳)

•評価結果の比較図:

System=システム

Eva01~08=人間評価者

    (Evaluators) 1~8

評価実験 I. 感情性(定量分析)

Page 11: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

評価実験 II. 感情的値(定性分析)

値={0~5}点/発言

評価者感情的値の評価についてのそれぞれの同意割合の平均

条件:ほぼパーフェクトマッチ;値の評価=±1点の誤差を許可)

人間内の同意割合(平均)=60発言内42

システム人間評価者全員とは同意不可能(42発言が望ましい).評価者それぞれとの同意割合(平均)=60発言内32(人間

評価者同意割合の77%)

結果システムの感情的値の正確さ=77%

Page 12: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

結論

感情性は,計算できることが確認できた.言語学的なレベルだけでも,発言の感情性は,人間評価者よりも正確に(88%)決定できるようにシステムのデザインが可能.感情的値(0~5)は,人間評価者と比較の上,決定正確さ=77%.非公式な場面を機械的認知が可能.冗談のための適切なタイミング認知が可能.

Page 13: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

応用の計画

☑ 駄洒落生成システムPUNDAの研究

☐ 非タスク的対話システム

☐ 忘却に基づく対話システム用のデータベース管理システムの研究

Page 14: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

システムの展開

現在のデータベースのノイズ → 修正

感情性の決定正確さ,感情的値の決定正確さをUP

現在のシステムの基に,意味的,連想的分析も可能(感情的値の極性(+/‐),感情分類の判断)

対話システムに導入(分析用の発言を収集)

他の感情認知システムで有効的な応用可能

視覚的~,聴覚的~ など

Page 15: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

ご清聴どうもありがとうございました.

Page 16: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,
Page 17: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,
Page 18: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,
Page 19: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,
Page 20: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

ノイズの記述

データベースの中の要素の重なりノイズこの本さー、すげーやばかったよ。まじ怖すぎ。

感情の要素:さー,すげー,げー,よ ,まじ感情性:YES感情的値=5(4なはずだった)

データベースの中の要素の誤りノイズあそこに小さい鳥がいます。

感情の要素:あそこ(卑語として認知)感情性:YES(NOなはずだった)感情的値=1(0なはずだった)

Page 21: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,
Page 22: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

PUN DA駄洒落理解・生成システム

PUNDA Projectとは?

Page 23: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

駄洒落タイプセットの抽出

• ディバワの今までの研究に基づく *

• 駄洒落の音声的な分類

 収集した駄洒落の実例を音声的な作成法によって12のグループに分類した

 その基準はモーラ(日本語の音韻体系で も適切な単位)  * *

* ディバワパヴェウ『駄洒落 - 日本語における同音異義に基づく言語遊戯』2006年、ヤギェウオ大学

** 窪薗晴夫『日本語の音声』岩波書店、1999

Page 24: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

1.同音2.モーラの追加

2.1前に追加2.2後に追加2.3中に挿入

3.モーラの脱落3.1後のモーラの脱落3.2語中のモーラの脱

4.モーラの変化4.1子音交換4.2母音交換

5.音の並べ替え6.漢字の読み替え7.語の並べ替え8.混合9.分離10.クイズ11.外国語と日本語のミックス12.句読点(ポーズ)の移動

ディバワパヴェウ『駄洒落 - 日本語における同音異義に基づく言語遊戯』2006年、ヤギェウオ大学

駄洒落の音声的な分類

本研究段階の対象

Page 25: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

駄洒落の音声的な分類

1.同音サルが去るサルガサル[saru ga saru]

2.モーラの追加2.1 前に追加

ゴキブリの動きぶりゴキブリのウゴキブリ[gokiburi no ugokiburi]

2.2 後に追加眼鏡に目がねえメガネニメガネエ[megane ni me ga nee]

2.3 中に挿入きちんと片付いたキッチンキチントカタヅイタキッチン[kitin to kataduita kittin]

3.2語中のモーラの脱落ステーキは素敵ステエキハステキ[suteeki wa suteki]

3.モーラの脱落3.1後のモーラの脱落

スキー が好きスキイガスキ[sukii ga suki]

Page 26: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

駄洒落の音声的候補抽出

今の段階では:グループ1-3に限る

音声距離:1モーラ 

文章中の一般名詞を抽出し、駄洒落の音声的候補を抽出する

収集した駄洒落のコーパスでは、駄洒落の元のフレーズの69%は一般名詞

サル が 去る

蛙 が 帰る

サッカー をする 作家

リコーダー は 利口だ

元のフレーズ

一般名詞

Page 27: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

システムの仕組み

文:  ......一般名詞 ............

いっぱんめいし イッパンメイシ

1.どうおん (いっぱんめいし、イッパンメイシ)2.前に追加 (あいっぱんめいし、いいっぱんめいし…)3.後に追加 (いっぱんめいしあ、いっぱんめいしい…)4.中に挿入 (いあっぱんめいし、いっぱあんめいし…)

5.後ろの脱落 (いっぱんめい)6.中の脱落 (いぱんめいし、いっぱんめし…)

駄洒落生成パターン

Googleでの検索:10 000以上から音声的候補抽出

Page 28: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

発言: 昨日 新しい テント を 買ったよ。

てんと テント

一般名詞

同音

てんとテント 前に追加

あてんといてんとうてんと

...

後に追加

てんとあてんといてんとう

...

中に挿入

てあんとてんあとていんと

...

後の脱落

てんテン

中の脱落

てとテト

Googleでの検索:10 000以上から音声的候補抽出

システムの仕組み

Page 29: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

実験

駄洒落: テント が 転倒 した。駄洒落の元

前に追加 いてんと おてんと してんと みてんと んてんと  かテント けテント しテント たテント てテント とテント なテント にテント のテント はテント もテント やテント をテント がテント ずテント だテント でテント ばテント アテント ステント パテント

後に追加 てんとう てんとし てんとち てんとな てんとに てんとね てんとは てんとん  テントか テントと テントに テントのテントは テントへ テントも テントや テントが テントだ テントで テントを テントっ テントウ

後の脱落 てん テン中の脱落 てと テト中に挿入 ていんと てうんと てくんと てこんと てんこと てんしと てたんとて 

ちゃんと てなんと てんなと てにんと てのんと てんのと てはんと てへんと てほんと てまんとてみんと てるんと てぐんと てごんと てだんと てんだと てでんと てどんと てんばと てぴんと てぽんと てんじゃと てっんと てんっと  テンプト テナント

マッチ!

Page 30: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

結果・問題点

システムの候補と人間生成の駄洒落における言葉のマッチ率: 79%

問題点:

・ 「変わった」言い方(異常がないじょう など)

・ 候補が多すぎる場合も多い

‐ Googleヒット数を単語の長さによって上げることも可能

‐ 短い単語には「脱落」の候補を抽出しない

‐ 文法の関係で候補数を絞る

Page 31: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

前に追加 いてんと おてんと してんと みてんと んてんと  かテント けテント しテント たテント てテント とテント なテント にテント のテント はテント もテント やテント をテント がテント ずテント だテント でテント ばテント アテント ステント パテント

後に追加 てんとう てんとし てんとち てんとな てんとに てんとね てんとは てんとん  テントか テントと テントに テントの テントは テントへ テントも テントや テントが テントだ テントで テントを テントっ テントウ

後の脱落 てん テン中の脱落 てと テト中に挿入 ていんと てうんと てくんと てこんと てんこと てんしと てたんとて 

ちゃんと てなんと てんなと てにんと てのんと てんのと てはんと てへんと てほんと てまんとてみんと てるんと てぐんと てごんと てだんと てんだと てでんと てどんと てんばと てぴんと てぽんと てんじゃと てっんと てんっと  テンプト テナント

文法の関係で候補数を絞る

助詞・動詞の活用形を含まれる候補の消却

Page 32: 発言の感情的分析の研究 - Araki Labarakilab.media.eng.hokudai.ac.jp/~ptaszynski/data/2007...2007/10/18  · J. R. Searl Speech Acts: An Essay in the Philosophy of language,

次のステップ

他の音声パターンの導入 (モーラの変化、並べ替えなど)

2パターン以上の可能性 (マルチパターンジョーク)

1モーラ以上の変化も可能

一般名詞だけではなく、他の品詞に対する候補の抽出

音声的な候補から元のフレーズと違う意味を持つものの抽出

駄洒落のタイミングの研究:

・ ML-ASK 感情分析システムに基づくこと