13
データ解析のための 統計モデリング入門 11 章後半 @yamakatu 2014/10/21 # みどりぼん 11th

#みどりぼん 11章「空間構造のある階層ベイズモデル」後半

Embed Size (px)

DESCRIPTION

データ解析のための統計モデリング入門読書会 最終回 11章「空間構造のある階層ベイズモデル」後半 2014/10/21

Citation preview

Page 1: #みどりぼん 11章「空間構造のある階層ベイズモデル」後半

データ解析のための  統計モデリング入門  11章後半    @yamakatu  2014/10/21  #みどりぼん  11th

Page 2: #みどりぼん 11章「空間構造のある階層ベイズモデル」後半

ざっくり前半の話

•  場所差が独立に決まる(10章)のでなく、空間相関がある場合のGLMMを考える  

•  空間相関:「近くは似てて、遠くは似てない」とか(今回は一次元)  

•  場所差を表すパラメータrj  の階層事前分布(正規分布)のパラメータ平均μを、両隣のrj  の平均値とすることで、相互作用を表現  

•  このような自己回帰する事前分布をCARモデルと呼ぶ  •  今回はその中でも色々制約ついたintrinsic  gaussian  CARモデル  

•  そんな感じの階層ベイズモデルをつくってみたら上手くいった  

Page 3: #みどりぼん 11章「空間構造のある階層ベイズモデル」後半

11.4  空間統計モデルが作り出す確率場 •  相互作用する確率変数で埋め尽くされた空間を確率場(random  field)と呼ぶ  

•  本章前半で利用したrjも確率場の一種  •  rj  の階層事前分布(正規分布)のパラメータ平均μjは  

 なので相互作用している  

•  rj  の階層事前分布は正規分布なので、確率場の中でもガウス確率場と呼ばれる

µ j =rj−1 + rj+12

Page 4: #みどりぼん 11章「空間構造のある階層ベイズモデル」後半

•  11章前半で定義  •  ポアソン分布+対数リンク関数  •  λj  =  exp(β  +  rj)  •  rjの階層事前分布は正規分布で  

•  平均    

•  標準偏差    

•  パラメータはβとsの二つ  •  パラメータβを固定(β  =  2.27)してみる  •  ここでsを{0.0316,  0.224,  10.0}と変えてみる  

確率場{rj}に対するsの影響を見てみる

µ j =rj−1 + rj+12

s = snj

Page 5: #みどりぼん 11章「空間構造のある階層ベイズモデル」後半

sが小さい程、rjは両隣と似ている値になる  

s  =  0.0316

s  =  0.224

s  =  10.0

sが大きい程、rjは両隣の値と関係ない値をとる

Page 6: #みどりぼん 11章「空間構造のある階層ベイズモデル」後半

つまり

•  この確率場は少数の大域的パラメータ(今回はsのみ)にコントロールされていると言える。  

Page 7: #みどりぼん 11章「空間構造のある階層ベイズモデル」後半

11.5  空間相関モデルと欠測のある観測データ •  空間相関を組み込んだ階層ベイズモデルの強み  •  パラメータの推定がより正確になる(前半の話)  •  欠測のあるデータに対してより良い予測が得られることがある(←イマココ)

Page 8: #みどりぼん 11章「空間構造のある階層ベイズモデル」後半

欠測しちゃった

•  上:前半で利用した観測値  

•  下:上の観測値から意図的にいくつかを欠測させた(黒点が欠測値)  

Page 9: #みどりぼん 11章「空間構造のある階層ベイズモデル」後半

vs.  欠測データ •  このような欠測があるデータに対する、あてはまりの良さを、  •  空間相関モデル  •  空間相関を無視した階層ベイズモデル  

•  で比較するお  

Page 10: #みどりぼん 11章「空間構造のある階層ベイズモデル」後半

•  左:空間相関を考慮しているモデル(空間相関モデル)  •  右:空間相関を考慮していないモデル  

•  空間相関を考慮したモデルの方がより欠測データが正しく予測できている  •  予測区間の狭さ  •  局所密度のなめらかさ

結果

Page 11: #みどりぼん 11章「空間構造のある階層ベイズモデル」後半

空間相関モデルの場合  

•  パラメータrjの階層事前分布(正規分布)で、隣同士のrjの値を利用している  

•  結果、欠測がない場合とかなり近い分布になった  •  左:欠測データなし(P.250  図11.4)  •  右:欠測データあり  

Page 12: #みどりぼん 11章「空間構造のある階層ベイズモデル」後半

空間相関を考慮しないモデルの場合 •  (10章と同じく)パラメータrj  の階層事前分布(正規分布)は平均0、標準偏差sの正規分布  •  ➡手がかりがない  

•  その結果、  •  yiに合わせようとするので、局所密度はギザギザになる  •  予測区間の範囲が広くなってしまう

さーせん。この表現は  イマイチ良くわかんなかった

Page 13: #みどりぼん 11章「空間構造のある階層ベイズモデル」後半

11.6  まとめ •  前半  •  空間構造のあるデータをモデル化する場合、空間相関を考慮する  

•  空間相関のある場所差を生成するには intrincsic  gaussian  CARモデルを使う  

•  後半  •  空間相関のある場所差は確率場を使って表現できる  •  空間相関を考慮した階層ベイズモデルは、観測データの欠測部分を予測するような用途にも使える。