18
ネットワークの特徴量で Twitter 友達リストを分析する Karubi Namuru Aug 22nd, 2010

ネットワークマイニング(グラフ構造分析)

Embed Size (px)

Citation preview

Page 1: ネットワークマイニング(グラフ構造分析)

ネットワークの特徴量で Twitterの友達リストを分析する

Karubi NamuruAug 22nd, 2010

Page 2: ネットワークマイニング(グラフ構造分析)

自己紹介

● Karubi Namuru

● 博士(理学)● Kauli 株式会社,代表● オンライン広告配信技術● Twitter: @karubi● Facebook: http://facebook.com/karubi

● 出身:広島 , 居住:東京 , Seongnam

Page 3: ネットワークマイニング(グラフ構造分析)

学生時代の話

● 在学中の研究● 統計的手法による日常行動分析

– 実世界:ライフログ– ウェブ:閲覧, clicks

0

20

40

60

80

100

120

140

160

180

200

0

20

40

60

80

100

120

140

160

180

200

Page 4: ネットワークマイニング(グラフ構造分析)

今日の内容

● モチベーション● 複数の方からグラフの話を聞きたいと DM が来た● 初心者でも分かりやすい話がききたい

● ネット上の資源で遊ぶ Part II● グラフの基礎● 分析方法の紹介● 分析結果の一例

Page 5: ネットワークマイニング(グラフ構造分析)

グラフの概要

● ある対象について,関連する事柄や出来事の関係をあらわしたもの

● 数学的にはグラフ理論であつかわれている

Page 6: ネットワークマイニング(グラフ構造分析)

数学的なグラフ

● 構成要素● ノード

– 頂点や節点で表現できる● エッジ

– 枝や辺で表現できる

引用: http://ja.wikipedia.org/wiki/%E3%82%B0%E3%83%A9%E3%83%95%E7%90%86%E8%AB%96

Page 7: ネットワークマイニング(グラフ構造分析)

辺の向き

● 問題によっては辺の向きを考慮する場合もあ● ノード同士の繋がりのみを考慮する

– →  向きが無いので「無向」● ノード同士について,どちらがどちらに繋がっているかどうかも考慮する– →  向きがあるので「有向」

Page 8: ネットワークマイニング(グラフ構造分析)

グラフ構造

● グラフをコンピュータで扱えるようにする● お絵かきした図については,人間が解釈できるがコンピュータが解釈できない表現

● グラフ構造:データ構造としてグラフを表現● コンピュータが解釈できる表現● 一定の形式を導入する● データ処理をおこなう際に,もっともやりやすくすることが目的(深い話につながるのでここまで)

Page 9: ネットワークマイニング(グラフ構造分析)

グラフ構造で記述できるもの

● 生活中のさまざまな自然現象● 日常生活で形成した知り合いの関係● 人の興味・嗜好と買い物の関係● 目的地までの移動方法

● インターネット内の現象● ウェブページ同士の繋がり● ウェブページの HTML コンテンツの配置● 電子メールの送受信履歴

Page 10: ネットワークマイニング(グラフ構造分析)

グラフ構造の分析

● グラフ構造を処理することで問題を解決する● グラフ内の要素を分析する場合

– 個々の頂点で,最も多くの辺が張られる頂点はどれか● グラフ同士を分析する場合

– ふたつのグラフが似ているかどうか

引用: http://www.weblio.jp/content/%E4%B8%80%E7%AD%86%E6%9B%B8%E3%81%8D

Page 11: ネットワークマイニング(グラフ構造分析)

グラフの分析例

● たとえば一筆書きの例● ケーニヒスベルクという大きな町● この町の中央にプレーゲル川という大きな川● 七つの橋が架けられている● あるとき町の人が「この 7 つの橋を 2 度通らず,全て渡って,元の所に帰ってくることができるか

引用: http://www.weblio.jp/content/%E4%B8%80%E7%AD%86%E6%9B%B8%E3%81%8D

Page 12: ネットワークマイニング(グラフ構造分析)

グラフマイニング

● 主にグラフに埋もれた知識や知見を発見するためのグラフ構造の分析● 大量のデータ● データ構造● 計算方法● 豊富な計算能力

Page 13: ネットワークマイニング(グラフ構造分析)

実際にマイニング

● 友達関係を分析してみる● 問題

– 自分の友達のなかで,注目に値する友達を誰か特定したい

● たとえば,このように考えてみる– もっとも話をする友達が一番注目に値する!

● TopTwitterFriend

Page 14: ネットワークマイニング(グラフ構造分析)

マイニングの一例

参照: http://businessspeak.wordpress.com/2009/03/27/top-twitter-friends-map-brian-solis-pr-20

Page 15: ネットワークマイニング(グラフ構造分析)

Karubi の考え

● 友達同士の繋がりに注目● 注目に値する友達は,自分の知っている友達が多く友達関係をもちかけている人

● もちろん友達関係をもちかけられる数が多ければ多いほど,注目に値するのはないか

● ただし,一方的に見ず知らずの人でも,なんでもかんでも友人関係を大量にいろんな人にもちかけている人は注目に値しない

Page 16: ネットワークマイニング(グラフ構造分析)

実際に分析してみる

● PageRank● 考え方:論文の引用関係のように,重要なウェブページがリンクを集める

● 計算方法は割愛;;● ネットで調べればいくらでも出てきますよ

Page 17: ネットワークマイニング(グラフ構造分析)

実際に分析してみる

Page 18: ネットワークマイニング(グラフ構造分析)

まとめ

● グラフマイニングの概要● Twitter の Following で実験● 人選はランダムなので結果は気にしないで☆● ご質問ございましたらメールください

[email protected] まで