Upload
katsushi-yamashita
View
1.298
Download
2
Embed Size (px)
DESCRIPTION
データ解析のための統計モデリング入門読書会 最終回 11章「空間構造のある階層ベイズモデル」後半 2014/10/21
Citation preview
データ解析のための 統計モデリング入門 11章後半 @yamakatu 2014/10/21 #みどりぼん 11th
ざっくり前半の話
• 場所差が独立に決まる(10章)のでなく、空間相関がある場合のGLMMを考える
• 空間相関:「近くは似てて、遠くは似てない」とか(今回は一次元)
• 場所差を表すパラメータrj の階層事前分布(正規分布)のパラメータ平均μを、両隣のrj の平均値とすることで、相互作用を表現
• このような自己回帰する事前分布をCARモデルと呼ぶ • 今回はその中でも色々制約ついたintrinsic gaussian CARモデル
• そんな感じの階層ベイズモデルをつくってみたら上手くいった
11.4 空間統計モデルが作り出す確率場 • 相互作用する確率変数で埋め尽くされた空間を確率場(random field)と呼ぶ
• 本章前半で利用したrjも確率場の一種 • rj の階層事前分布(正規分布)のパラメータ平均μjは
なので相互作用している
• rj の階層事前分布は正規分布なので、確率場の中でもガウス確率場と呼ばれる
µ j =rj−1 + rj+12
• 11章前半で定義 • ポアソン分布+対数リンク関数 • λj = exp(β + rj) • rjの階層事前分布は正規分布で
• 平均
• 標準偏差
• パラメータはβとsの二つ • パラメータβを固定(β = 2.27)してみる • ここでsを{0.0316, 0.224, 10.0}と変えてみる
確率場{rj}に対するsの影響を見てみる
µ j =rj−1 + rj+12
s = snj
sが小さい程、rjは両隣と似ている値になる
s = 0.0316
s = 0.224
s = 10.0
sが大きい程、rjは両隣の値と関係ない値をとる
つまり
• この確率場は少数の大域的パラメータ(今回はsのみ)にコントロールされていると言える。
11.5 空間相関モデルと欠測のある観測データ • 空間相関を組み込んだ階層ベイズモデルの強み • パラメータの推定がより正確になる(前半の話) • 欠測のあるデータに対してより良い予測が得られることがある(←イマココ)
欠測しちゃった
• 上:前半で利用した観測値
• 下:上の観測値から意図的にいくつかを欠測させた(黒点が欠測値)
vs. 欠測データ • このような欠測があるデータに対する、あてはまりの良さを、 • 空間相関モデル • 空間相関を無視した階層ベイズモデル
• で比較するお
• 左:空間相関を考慮しているモデル(空間相関モデル) • 右:空間相関を考慮していないモデル
• 空間相関を考慮したモデルの方がより欠測データが正しく予測できている • 予測区間の狭さ • 局所密度のなめらかさ
結果
空間相関モデルの場合
• パラメータrjの階層事前分布(正規分布)で、隣同士のrjの値を利用している
• 結果、欠測がない場合とかなり近い分布になった • 左:欠測データなし(P.250 図11.4) • 右:欠測データあり
空間相関を考慮しないモデルの場合 • (10章と同じく)パラメータrj の階層事前分布(正規分布)は平均0、標準偏差sの正規分布 • ➡手がかりがない
• その結果、 • yiに合わせようとするので、局所密度はギザギザになる • 予測区間の範囲が広くなってしまう
さーせん。この表現は イマイチ良くわかんなかった
11.6 まとめ • 前半 • 空間構造のあるデータをモデル化する場合、空間相関を考慮する
• 空間相関のある場所差を生成するには intrincsic gaussian CARモデルを使う
• 後半 • 空間相関のある場所差は確率場を使って表現できる • 空間相関を考慮した階層ベイズモデルは、観測データの欠測部分を予測するような用途にも使える。