Upload
satoru-mikami
View
3.078
Download
2
Embed Size (px)
Citation preview
バイラルメディアの可視化 第40回 データマイニング+WEB@東京
三上 悟
1
Who am I
• @saicologic
• デザイン工学部
• 仕事:何でも屋(アーキテクト、インフラ周り担当)
• 興味:機械学習、自然言語処理、いろんな数値のモニタリング
2
アジェンダ•バイラルメディアとは?
•調査について
•分析
•ディスカッション
バイラルメディアとは?
話題性のある動画や画像を中心とした記事に、短期間で爆発的なトラフィックを集めることを目的としたブログメディア
http://news.mynavi.jp/news/2014/08/01/051/
http://matome.naver.jp/odai/2139012994512952101/2140401540237604603
6
海外Buzzfeed(バズフィード) 2006年スタート 元ハフィントン・ポストKen Lerer氏が共同創業者 で話題に。世界で断トツの集客力 !
訪問者 :1億5000万人以上/月 調達金額:2億ドル !
エンターテイメント、クイズ、ビデオが中心
国内Spotlight whats CuRAZY Amp dropout … 35くらいあるらしい。 基本的には海外や国内で流行ってるサイトの紹介ページ 急成長とか超儲かっているという話はきかない
国内Spotlight(スポットライト) !
株式会社サイバーエージェントが運営 !
訪問者数や規模は不明 ニュース、エンタメ、旅行、感動が中心 !
大手メディアでかつよく炎上しているのできっと 一番流行ってるはず !
調査について
はじめに
バイラルメディアについての話ですが、 今回はバイラル的な話題(感染、情報拡散、貢献等) はしません !
バイラルメディアとそれ以外のメディアを比較して バイラルメディアの記事にはどんな特徴がありそうか に調査したことを話します
13
ハフィントン・ポスト
Spotlight TABI LABO R25
運営会社 ハフィントン・ポスト
株式会社 サイバー
エージェント
株式会社TABILABO
ヤフー
メディア種別 ニュース バイラル キュレーション ポータル
調査記事数 7,070 1,000 1,755 15,480
調査について調査データ: タイトルのみ !
調査項目: ・タイトルの長さ ・?が含まれるタイトルの割合 ・!が含まれるタイトルの割合 ・数字が含まれるタイトルの割合 ・特定のキーワードの利用率
分析
15
タイトルの長さ
16
17
ハフィントン・ポスト Spotlight TABI LABO R25
mean 36 36 33 22
std 12 8 5 5
50% 34 36 33 22
max 109 60 55 67
調査記事数 7,070本 1,000本 1,755本 15,480本
ハフィントンポスト
Spotlight
TABI LABO
R25
!?数字が含まれる タイトルの割合
22
23
ハフィントン・ポスト
Spotlight TABI LABO R25
! 9.9% 66.2% 51.7% 12.6%
? 10.8% 26.4% 25.4% 18.4%
数字 31.5% 23.2% 35.6% 0%
調査記事数 7,070本 1,000本 1,755本 15,480本
特定のキーワードの 利用率
25
ハフィントン・ポスト
Spotlight TABI LABO R25
動画 5.2% 1.7% 20.5% 0.4%
画像 7.2% 1.0% 0.6% 0.1%
猫 2.0% 3.4% 0.5% 0.2%
話題 0.4% 6.6% 4.3% 1.2%
人気 0.6% 2.5% 1.2% 2.0%
世界 4.3% 6.3% 16.4% 2.5%
調査記事数 7,070本 1,000本 1,755本 15,480本
最後に
ソーシャルカウントを取得して拡散度とか、メディアの貢献度とか計算したいメディア分類器つくりたい
やってみたいこと
情報拡散について !
twitterの情報拡散(retweet数予測モデル)に関する研究 http://kensuke-mi.xyz/kensuke-mi_diary/2014/08/twitterretweet.html !
A stochastic model of the tweet diffusion on the Twitter network http://arxiv.org/abs/1209.5599 !
Viral spreading of daily information in online social networks http://arxiv.org/abs/1211.2555