26
Modeling and Predicting the Growth and Death of Membership-based Websites WWW 2014 輪輪輪輪輪輪 : 輪輪 輪輪 Kimitaka Asatani 2014/05/31

Tori lab 輪読会 WWW 2014 - Modeling and predicting the growth and death

Embed Size (px)

Citation preview

Page 1: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Modeling and Predicting the Growth and Death of

Membership-based WebsitesWWW 2014 輪講会 発表者 :  浅谷 公威 Kimitaka Asatani

2014/05/31

Page 2: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

ABSTRACT

• 様々な種類の22個の Website の DAU(Daily Active User) を調べる• Online social networks, grass root movements, online forums and

membership only Internet stores.

• Reaction diffusion decay プロセスを用いて、 DAU をフィッティング• 今後の DAU を予測• Classify Community

• Self-sustainable vs un-un sustainable• Classify Startup Process

• Marketing or word of month adoption

Page 3: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

DAU(Daily Active User)

• これまでの研究は Number of members を使って Web サイトを評価• DAU は以下を示す指標として Number of members より優れてい

る• Social impact• Potential of revenue

• DAU のデータを入手し予測する• 生涯にわたって不変なダイナミクスを検出する• メンバー情報とかの特性をインプットとしない

Page 4: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Reaction diffusion decay equations

• Attention seeking interactions between • active members• In-active members• No Yet members

• Take into account • web サイトによるユーザーの興味を惹きつけようとする企画を実施• ユーザー間の相互作用で、ユーザーがアクティブになる

Page 5: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

In an information-rich world our attention is bound to become one of our most scarce, important and vied-for resources. (Herbert. A. Simon 1971)

注 :近年では、インフォーメーションの欠乏ではなく注意の欠乏が問題情報のフィルターをシステムとして実現しなければならない (Herbert. A. Simon 1996)

Page 6: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

目次• Sec. 2 presents the related work.• Sec. 3 presents our proposed model and the algorithm to fit its

parameters to the datasets. • Sec. 4 fits the parameters to the datasets and present the fit and

prediction results. • Sec. 5 presents our conclusions.

Page 7: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Related works

• Adoption model (ユーザーの状態遷移のモデル)1. Network effect adoption models

• Individual Rationality and adoption cost in game theoretic framework• E.g. K – core network analysis on Friendster network• They do not consider Role of user activity

2. Threshold adoption models• An individual adopts if enough of his or her friends are adopters.• E.g. Product adoption on network • Only local view of network is considered

Page 8: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Related works

• Adoption model (ユーザーの状態遷移のモデル)3. Diffusion of innovation models

• Influence others to adopt through word-of-mouth, marketing…• Demand forecasting at the aggregate level. • Various type of S –shaped curve of number of adopters.

4. Adoption models from influence and network structure• Considering the roles of edge on network.• E.g. the probability of non-member user joins the network increase linearly with the

number of invitations.  我々のモデルに有用

Page 9: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Related works

• 先行研究は total number of user について議論• DAU を議論する必要がある• そのためには、 attention-seeking interaction between active /

inactive users についてモデル化する必要がある• Facebook は他のユーザーのアクティビティを表示し、ユーザーを

incites→Active member の活動が in active member の active さへ影響を与えているといえる • また、 news サイト等は、他のメンバーがコンテンツに惹かれて

やってくる→Non member の活動も考慮する必要がある

Page 10: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Proposed Model

• Chemical Reaction Process• Molecules

• A: active user • I: in-active user• U: Non member

• Reaction• A + I → 2A    (α)• A → I       (β)• A + U → 2A   (γ)• U → A      (λ)

• Under the condition of• A(t) + I(t) + U(t) = C. • As C is the fraction of active Internet population

Page 11: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Long time evolution

After a certain – possibly large – time t, the website nearly exhausts its pool of non-members

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Page 12: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Long time evolution

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Page 13: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Signature of growth

Media and marketing intensive

Word-of-mouth intensive

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Page 14: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Signature of growth

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Page 15: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Fit the parameter to Dataset

• Dataset• 22 web sites from 2007 to 2013

• Online social networks, grass root movements, online forums and membership only Internet stores.

• Automatic parameter fit

局所最適解の集合  α, β, λ, γ, and C

初期パラメータ :   α, β, λ, γ, and C時系列データ

一番よい局所最適解  α, β, λ, γ, and C

k-medoids clustering Levenberg-Marquardtalgorithm

Page 16: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Levenberg-Marquardt algorithm

• 目的 : 非線形最小二乗法を解く• 与えられたモデル関数 y = f (x , β) が m 個のデータ点 {(xi , yi ); i =

1, ... , m } に最もよくフィットするような n 個のパラメータ β = (β1 , ... , βn ) を見つける

• Gauss-Newton 法の拡張• 初期推定値からの解の乖離や、非線形性による不安定性を回避

• 具体的な方法• モデル関数とデータ点の差異を二階微分した点が零になる場所を探す• ステップ

• (a) 二階微分を一回微分の二乗で近似する (Gauss-Newton 法 )• (b) 安定性の向上の工夫を入れる (Levenberg-Marquardt 法の独自 )

Page 17: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

K-medoids によるクラスタリング • K-medoids• クラスタリング手法• K-means に比べ、ロバスト、ノイ

ズの影響を受けない• 今回は• K-medoids を用いてクラスタリン

グ• 3つ以上の要素を含むクラスタの

中で、最も高いフィッティング精度を持っているものを抽出

K-medoidsクラスタ内のデータ点で,その点以外のクラスタ内の点でまでの非類似度の総和が最小になる点

K-means1. 各点にランダムにクラスタを割当2. クラスタの重心の点を計算3. 点のクラスタを、一番近い重心のクラスタに変

更4. 変化がなければ終了。あれば 2. に戻る

Page 18: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Long-term DAU sustainability• Self-Sustaining

• Huffingtonpost• Facebook 等は意外とこの傾向が強くない

• Unsustainable• Party website• Fads (12second.tv)• Dating(true.com)

• 中間• (Immoral dating)MarriedSecrets,

AshleyMadison

• 一般的な認識と一致

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Page 19: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Signatures of growth• Media and campaign

• Ebay, theblaze(保守系ニュース )

• Word of mouth• Others

• 基本的には口コミによって広がっていくと言える• Theblaze がメディア・キャンペーンなのに、 Huffingtonpostと Daily News が口コミであることが不明

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Page 20: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Predicting future trends

• First Few Years のみのデータをインプットして、パラメータをフィッティング• その後の DAU の時系列をシミュレートし、実際のデータと比較

する

Page 21: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Predicting future trendsUnsustainable

• フィッティング出来たと著者は主張

• Inaccurate• True.com Adaptu.com.

• strong competitor• Brandstack.com

• Change the policy

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Page 22: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Predicting future trendsSelf - sustainable

• Good result• Facebook.com

• Changing the growth strategy during the period• TheHuffingtonPost.com

• Unpredictable spike• TheBlaze.com

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Page 23: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

Conclusion

• Through reaction – decay - diffusion process, we model the dynamics of websites.• Predict the trend

• DAU signatures of growth• media & marketing versus word-of-mouth

• DAU signatures of long term stability • self-sustaining versus unsustainable

• Future work • tailor the above reaction-diffusion-decay dynamics to specific types of websites and

changing environments (e.g., new technologies and competition)• Modeling a broad range of dynamics of societal movements

Page 24: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

感想• モデルについて

• モデルは単純なので他に応用可能• 問題点

• パラメータは時系列で変化するのでは?• 反応方程式のように各状態のユーザーの量に比例した確率でいいの?• β>>α でないと最終的に収束する過程は観測できない• Exogenous な効果はあつかえない

• Sir モデルとの対比• ネットワークが存在しない• I -> A が繰り返し起き、現実に近い• パラメータ数が多くフィッティングしやすい

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Page 25: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death

何に使えるか• 局所最適解の集合をクラスタリングし最適解を導出する手法は勉強になった• 今後つかうとしたら• Nifty のデータに適応可能• Self-sustaining / unsustainable と  word-to-mouth / media-and-campaign

という分類をつかう

ReactionA + I → 2A    (α)A → I       (β)A + U → 2A   (γ)U → A      (λ)

Page 26: Tori lab 輪読会 WWW 2014 - Modeling and predicting  the growth and death