16
スライド中の図は論⽂から引⽤ Kiran Garimella, Aalto University Gianmarco De Francisci Morales, Aalto University Aristides Gionis, Aalto University Michael Mathioudakis, HIIT

WSDM勉強会発表資料(2016/3/19)

Embed Size (px)

Citation preview

Page 1: WSDM勉強会発表資料(2016/3/19)

スライド中の図は論⽂から引⽤

Kiran Garimella, Aalto University

Gianmarco De Francisci Morales, Aalto University

Aristides Gionis, Aalto University

Michael Mathioudakis, HIIT

Page 2: WSDM勉強会発表資料(2016/3/19)

2何をした論⽂︖

- ︓激しい論争が起きている- ︓論争がほとんど起きていない

Page 3: WSDM勉強会発表資料(2016/3/19)

3先⾏研究との違いは︖

Page 4: WSDM勉強会発表資料(2016/3/19)

4⼿法の流れ

ユーザをノードとして2回以上Retweetし合っているユーザ間にエッジを作成

Twitterのハッシュタグを使⽤(e.g. #indiana)

論争における⽴場の違いが表現されるようにノードを2種類に分割

グラフ上のランダムウォークを利⽤して#indianaの論争度=0.82と算出

Page 5: WSDM勉強会発表資料(2016/3/19)

5⼿法の流れ

ユーザをノードとして2回以上Retweetし合っているユーザ間にエッジを作成

Twitterのハッシュタグを使⽤(e.g. #indiana)

論争における⽴場の違いが表現されるようにノードを2種類に分割

グラフ上のランダムウォークを利⽤して#indianaの論争度=0.82と算出

Page 6: WSDM勉強会発表資料(2016/3/19)

6グラフの構築

- #indiana︓116,379ツイート、2,467ユーザ

- #indiana︓3,143エッジ

Page 7: WSDM勉強会発表資料(2016/3/19)

7⼿法の流れ

ユーザをノードとして2回以上Retweetし合っているユーザ間にエッジを作成

Twitterのハッシュタグを使⽤(e.g. #indiana)

論争における⽴場の違いが表現されるようにノードを2種類に分割

グラフ上のランダムウォークを利⽤して#indianaの論争度=0.82と算出

Page 8: WSDM勉強会発表資料(2016/3/19)

8グラフの分割

METIS

Controversial query#russia_march

Non-controversial query#germanwings

Controversial

Page 9: WSDM勉強会発表資料(2016/3/19)

9⼿法の流れ

ユーザをノードとして2回以上Retweetし合っているユーザ間にエッジを作成

Twitterのハッシュタグを使⽤(e.g. #indiana)

論争における⽴場の違いが表現されるようにノードを2種類に分割

グラフ上のランダムウォークを利⽤して#indianaの論争度=0.82と算出

Page 10: WSDM勉強会発表資料(2016/3/19)

10論争度の計算|基本的な考え方

Controvercialなトピックでは赤 → 赤⻘ → ⻘

赤 → ⻘⻘ → 赤

の遷移確率は高い

の遷移確率は低い

Non-controvercialなトピックでは

赤 → ⻘⻘ → 赤

の遷移確率はほぼ同じ赤 → 赤⻘ → ⻘

Page 11: WSDM勉強会発表資料(2016/3/19)

11論争度の計算|もう少し具体的な説明

Controvercialなトピックでは

Non-controvercialなトピックでは

k

赤赤 ⻘⻘ 赤⻘ ⻘赤

赤赤 ⻘⻘ 赤⻘ ⻘赤

Page 12: WSDM勉強会発表資料(2016/3/19)

12評価実験|データセット

Controversial#beefban, #nemtsov, #netanyahuspeech,

#russia_march, #indiasdaughter, #baltimoreriots, #indiana, #ukraine, #gunsense, #leadersdebate

Non-controversial#sxsw, #1dfamheretostay, #germanwings,

#mothersday, #nepal, #ultalive, #FF,#jurassicworld, #wcw, #nationalkissingday

Page 13: WSDM勉強会発表資料(2016/3/19)

13評価実験|結果1

#indiana

#ukraine

#ultalive

#sxsw

Controversial 0.5

Non-controversial 0.5

Page 14: WSDM勉強会発表資料(2016/3/19)

14評価実験|結果2

ノード間のパス⻑を利⽤した⼿法(EC)や隣接するノードが属するグループの種類を利⽤した⼿法(GMCK)よりもランダムウォークを利⽤した⼿法が高い精度

Page 15: WSDM勉強会発表資料(2016/3/19)

15評価実験|結果3

� 56

� Hugo Chavez

Hugo Chavez⼤統領死亡

Page 16: WSDM勉強会発表資料(2016/3/19)

16まとめ

ユーザをノードとして2回以上Retweetし合っているユーザ間にエッジを作成

Twitterのハッシュタグを使⽤(e.g. #indiana)

論争における⽴場の違いが表現されるようにノードを2種類に分割

グラフ上のランダムウォークを利⽤して#indianaの論争度=0.82と算出

� 20個のクエリを⽤いて論争度の計算精度を定量的に評価� 特定トピックの⽇々の論争度の変化を定性的に評価

評価実験