15
文献紹介 長岡技術科学大学 修士 1 松本

Predicting Power Relations between Participants in Written Dialog from a Single Thread

Embed Size (px)

DESCRIPTION

summary of Predicting Power Relations between Participants in Written Dialog from a Single Thread

Citation preview

Page 1: Predicting Power Relations between Participants in Written Dialog from a Single Thread

文献紹介長岡技術科学大学 修士1年

松本 宏

Page 2: Predicting Power Relations between Participants in Written Dialog from a Single Thread

PREDICTING POWER RELATIONS BETWEEN PARTICIPANTS IN WRITTEN

DIALOG AUTHORS Prabhakaran, Vinodkumar and Rambow, Owen

Columbia Univeristy, New York, NY

BOOKTITLE Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics

YEAR 2014

PAGES 339-344

Page 3: Predicting Power Relations between Participants in Written Dialog from a Single Thread

概要• email ログ中の人物の力の上下関係の特定

• 上司と部下の関係として話す

• 階層地位関係での特定

• スレッドから抽出された素性のみの利用

• スレッド: 一連のemailの送受信

• 新しい素性の紹介: 上下関係を示すユーザの特徴を捉える

Page 4: Predicting Power Relations between Participants in Written Dialog from a Single Thread

関連研究• 関連研究:

• 語彙情報による特定:多くのデータが必要

• 少ないデータしかない者は非対象とした

• 前研究:

• スレッド上で力を有している人物の特定

• 中間層者がノイズ

Page 5: Predicting Power Relations between Participants in Written Dialog from a Single Thread

データ• Enron emailコーパス:

• 36,615 email スレッド

• 平均約3email/スレッド

• Enron Gold:

• 階層的に構築されたもの

• 1,518 employees / 13,724 ペア

• ここから対象とする2人ペアの主従関係を調べる

Page 6: Predicting Power Relations between Participants in Written Dialog from a Single Thread

素性• 4つの素性グループ

• THR

• DIA

• THR — 提案素性グループ

• LEX — 語彙素性グループ: (Bramsen et al., 2011; Gilbert, 2012)

• THR: メッセージ構造素性

• DIA: 対話素性

} (Prabhakaran and Rambow, 2013)

NEW

PR

PR

Page 7: Predicting Power Relations between Participants in Written Dialog from a Single Thread

THR• メタデータ素性: 位置と冗長性

• 位置:

• 対象者pの最初と最後のメッセージ位置

• 冗長性

• 発言カウント, 発言率

• トークン数, トークン率, 発言トークン率

PR

Page 8: Predicting Power Relations between Participants in Written Dialog from a Single Thread

DIA

• 以前の研究での自動タグ付けを利用

• Dialog Acts (DA):

• 行動要求, 報告要求, 報告, 習慣のどれかを判断

• Overt Displays of Power (ODP): 力の明示

• 応答への付加制約の判断

PR

Page 9: Predicting Power Relations between Participants in Written Dialog from a Single Thread

THR

• 受信者数 ( 平均受信者数: To, CC、指定受信者数: To )

• 指定送信宛先から返事が来た割合

• 返信非対象者: 返信時に追加/削除されたか

• 平均返信受取数

NEW

Page 10: Predicting Power Relations between Participants in Written Dialog from a Single Thread

素性の有効性テスト/結果• テスト:各素性の平均値を比較のスチューデントのt検定

• 結果

1. 上司は多人数へメールを送信、返信も多い

2. 上司による要求数、ODPが俄然多い

3. 部下は報告や未対応要求が少ない

4. 上司からのやりとり開始が多い

5. 上司は短文であるがトークン数は多い

Page 11: Predicting Power Relations between Participants in Written Dialog from a Single Thread

LEX• (Bramsen et al., 2011; Gilbert, 2012) より

• 有効性は示されている 

• 語彙素性

• 語彙 n-gram, POS n-gram, 混合 n-gram

• 混合 n-gram: オープンクラスの単語はPOSタグに入れ替え

• unigram と bigramが有効

Page 12: Predicting Power Relations between Participants in Written Dialog from a Single Thread

実験

• BASELINE:

• 全て上司と判定

• n-gram素性を利用した分類器

• 先の素性の組み合わせでSVMをつかって2値分類(superior, subordinate)

Page 13: Predicting Power Relations between Participants in Written Dialog from a Single Thread

結果

Page 14: Predicting Power Relations between Participants in Written Dialog from a Single Thread

結果

Page 15: Predicting Power Relations between Participants in Written Dialog from a Single Thread

まとめ

• 前研究より上回る結果

• 今回の提案素性が大きく寄与

• 今回は上司と部下の間も考慮された

• しかし、同僚は?