#みどりぼん 11章「空間構造のある階層ベイズモデル」後半

データ解析のための統計モデリング入門 11章後半 @yamakatu 2014/10/21 #みどりぼん 11th

ざっくり前半の話

•  場所差が独立に決まる（10章）のでなく、空間相関がある場合のGLMMを考える

•  空間相関：「近くは似てて、遠くは似てない」とか（今回は一次元）

•  場所差を表すパラメータrj の階層事前分布（正規分布）のパラメータ平均μを、両隣のrj の平均値とすることで、相互作用を表現

•  このような自己回帰する事前分布をCARモデルと呼ぶ •  今回はその中でも色々制約ついたintrinsic gaussian CARモデル

•  そんな感じの階層ベイズモデルをつくってみたら上手くいった

11.4 空間統計モデルが作り出す確率場 •  相互作用する確率変数で埋め尽くされた空間を確率場（random field）と呼ぶ

•  本章前半で利用したrjも確率場の一種 •  rj の階層事前分布（正規分布）のパラメータ平均μjは

なので相互作用している

•  rj の階層事前分布は正規分布なので、確率場の中でもガウス確率場と呼ばれる

µ j =rj−1 + rj+12

•  11章前半で定義 •  ポアソン分布+対数リンク関数 •  λj = exp(β + rj) •  rjの階層事前分布は正規分布で

•  平均

•  標準偏差

•  パラメータはβとsの二つ •  パラメータβを固定（β = 2.27）してみる •  ここでsを{0.0316, 0.224, 10.0}と変えてみる

確率場{rj}に対するsの影響を見てみる

µ j =rj−1 + rj+12

s = snj

sが小さい程、rjは両隣と似ている値になる

s = 0.0316

s = 0.224

s = 10.0

sが大きい程、rjは両隣の値と関係ない値をとる

つまり

•  この確率場は少数の大域的パラメータ（今回はsのみ）にコントロールされていると言える。

11.5 空間相関モデルと欠測のある観測データ •  空間相関を組み込んだ階層ベイズモデルの強み •  パラメータの推定がより正確になる（前半の話） •  欠測のあるデータに対してより良い予測が得られることがある（←イマココ）

欠測しちゃった

•  上：前半で利用した観測値

•  下：上の観測値から意図的にいくつかを欠測させた（黒点が欠測値）

vs. 欠測データ •  このような欠測があるデータに対する、あてはまりの良さを、 •  空間相関モデル •  空間相関を無視した階層ベイズモデル

•  で比較するお

•  左：空間相関を考慮しているモデル（空間相関モデル） •  右：空間相関を考慮していないモデル

•  空間相関を考慮したモデルの方がより欠測データが正しく予測できている •  予測区間の狭さ •  局所密度のなめらかさ

結果

空間相関モデルの場合

•  パラメータrjの階層事前分布（正規分布）で、隣同士のrjの値を利用している

•  結果、欠測がない場合とかなり近い分布になった •  左：欠測データなし（P.250 図11.4） •  右：欠測データあり

空間相関を考慮しないモデルの場合 •  （10章と同じく）パラメータrj の階層事前分布（正規分布）は平均0、標準偏差sの正規分布 •  ➡手がかりがない

•  その結果、 •  yiに合わせようとするので、局所密度はギザギザになる •  予測区間の範囲が広くなってしまう

さーせん。この表現はイマイチ良くわかんなかった

11.6 まとめ •  前半 •  空間構造のあるデータをモデル化する場合、空間相関を考慮する

•  空間相関のある場所差を生成するには intrincsic gaussian CARモデルを使う

•  後半 •  空間相関のある場所差は確率場を使って表現できる •  空間相関を考慮した階層ベイズモデルは、観測データの欠測部分を予測するような用途にも使える。

Science

#みどりぼん 11章「空間構造のある階層ベイズモデル」後半