14
en.newikipedia.org (@niam) 11.1.4 重重重重重重重重 11.1.5 SIR 11.1.6 重重重重重重重 EM 重重重重重重 2010/5/8 重重 重 PRML 重重重 1

Prml 11.1.4 重点サンプリング

Embed Size (px)

Citation preview

Page 1: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

1

11.1.4  重点サンプリング11.1.5   SIR11.1.6  サンプリングと EM アルゴリズム

2010/5/8江原 遥

PRML 読書会

Page 2: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

2

11.1.4 重点サンプリング一様サンプリング:

この方法の問題点:• L を次元に対して指数関数的に大きくする必要• 多くの場合, z 空間の比較的小さい領域に大き

な確率が集中している– (特に高次元ではそう. c.f. 球面集中現象)

理想的には: p(z)f(z) が大きな領域を重視したい⇒ 重点サンプリング

1

1[ ]

L

E f p fL z z

11.18

Page 3: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

3

11.1.4 重点サンプリング11.18

1

1

1[ ]

[ ] d

d

1

{ } ~

L

L

E f p fL

E f f p

pf q

q

pf

L q

q

z z

z z z

zz z z

z

zz

z

z

11.19

やりたかったこと: p(z)f(z) が大きな領域を重視したいやったこと:提案分布 q(z) を持ってきて, q(z) が大きいところを重点的にサンプリングする.棄却サンプリングとの違い:棄却しない.サンプルは常に使うz

pr

q

z

z

重要度重み(importance weight)

Page 4: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

4

正規化定数の計算が難しい場合

1

/[ ] ,

/

L

m m

m

p qE f w f w

p q

z zz

z z

pp

p

pp Z p

Z

Z

z

z z

で,正規化定数 の計算は難しいが は簡単に計算できる場合,

を計算しなくても重点サンプリングは可能.

どうやるか:

1

1

1 1 1

1 1

1[ ] d d

1 1 1d d d d

d d

1 1 1[ ]

1

Lq q

p p

Lp

q q

L Lq

L Lp

Z ZpE f f p f q r f

Z q Z L

pr

q

Z p q pp p q r

Z Z q q Lq q

Z rE f r f r f f

Z L Lr rL

zz z z z z z z

z

z

z

z z zz z z z z z z

z zz z z z

z z z

と定義すると,

1

/ // /

/ // /

L L

q

m m m mm mmm qm mm

w f

p q Zp q p qrw

r p q p qp q Z

z

z zz z z z

z z z zz z

11.20

11.21

11.22

11.23

Page 5: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

5

重点サンプリングの欠点• いくらでも大きな誤差のある結果を生成する可能

性があるが,それを診断するための指標が得られない.

→ おそらく, MCMC では,このように山を忘れたりすると不変分布(定常分布)に収束していないことになるので,不変分布にどれだけ近づいているかがこの指標になっている?

もし q(z) が紫だったら…

↑ この山を忘れていることが分からない

Page 6: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

6

一様サンプリング (uniform sampling)

グラフィカルモデルで定義された分布には重点サンプリングの技術を適用できる.先程の一様サンプリングとの違い:観測された変数については観測値を用いている.

1 1

| pa | | pa ,

|

|

|

M M

i i i ii i

p p p p

p

p p

pr p

q

z z z x z x

z x x

z z x

z xz

z

は, の省略表記.

事後分布 からサンプリングしたい. は観測された変数.

観測されている変数:観測値を設定観測されていない変数:定義域内で一様にサンプリングつまり,観測されていない変数だけを一様分布から

サンプルすることにする. の省略表記は だったから,

となる.が,実際には,この |p z xアプローチは,事後分布

(の観測されていない変数の分布)が一様分布から離れている時はうまく行かない.

Page 7: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

7

尤度重み付きサンプリング先程の一様サンプリングは,観測されていない変数

については一様分布からサンプリング尤度重み付きサンプリングは,これを, p(zi|pai) から

サンプル. pai にも観測されていない変数が含まれていたら,とりあえず今のサンプリングの値を設定しておく.

この場合の重要度重みは:

:

| pa | pa| pa

| pa 1i i i

i i i ii i

i i

pr

q

p pr p

p

z e z e z e

e

zz

z

z zz z

z

観測された変数の集合(証拠集合)

Page 8: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

8

重点サンプリングまとめ必要なもの:提案分布 q ,重要度重み r利点:一様サンプリングよりはマシ欠点:提案分布 q は p に近くないと使えない(特に高次元)いくらでも大きな誤差のある結果を生成する

可能性があるが,それを診断するための指標が得られない.

→ たぶん MCMC だと不変分布に収束させることで,この問題が(部分的に)解決されているのでは.

Page 9: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

9

11.1.5 SIR

11.1.2 の棄却サンプリングの問題点:本当に上から抑えるような k を設定しようと思うと,

受理率が非常に小さくなる.SIR:   k を設定しなくてもすむ方法

1

11

, , ~

/

/

0 1 1

, , , ,

L

m mmm m

LL

w

p qrw

r p q

w

w

q

w

w

z z

z z

z z

z z

z

第一段階:

第二段階:重み を計算

, だから,確率だと思える.

に従う確率で からさらにサンプルする.

Sampling

Importance

Resampling

Page 10: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

10

11.1.5 SIRq(z) からサンプルしているのに重点度重みを挟んでリサンプル

したらいつの間にか p(z) からサンプルできていた.特にL→∞ では本当に p(z) からのサンプリングになっている.

理由:一次元の時,サンプル値の累積分布が一致することを示す

: :

1

z a z a

m

m m

p zI z a

p q zp z a w

p q p z

q q z

I L

p zI z a q z dz

I z a p z dzq zp z a

p z pI

z dzq z dz

p d

q

z a z z

z

z

z z

z

は定義関数. とすると,

11.25

11.26

p(z) の累積分布関数の定義そのまま

/

/m m

m

p qw

p q

z z

z z

Page 11: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

11

11.1.5 SIR11.27 は単なる注意書き.直接サンプル出来ない p(z) から近似的にサンプルする方法と

して SIR を説明したけど,もし, p(z) のモーメント(平均,分散)だけが欲しいのなら,直接求められる.

1

[ / ] d[ ] d

[ / ] d

/

/

L

m m

m

f p q qE f f p w f

p q q

p qw

p q

z z z z zz z z z z

z z z z

z z

z z

11.27

Page 12: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

12

11.1.6 サンプリングと EM アルゴリズムEM アルゴリズムの E-step をサンプリングで解いてや

る:モンテカルロ EM

確率的 EM :p が混合モデルで Z がクラス, L=1 の場合

old old

1

old

, | , ln , | d

1ln , |

{ } ~ | ,

L

Q p p

pL

p

θ θ Z X θ Z X θ Z

Z X θ

Z Z X θ

11.2811.29

Page 13: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

13

11.1.6 IP アルゴリズム

1

1

1

, |

| , :

:

| | , | d

, , ~ |

, , ~ | ,

:

| | , | d

1| ,

L

L

L

p

p

I step

p p p

p

p

P step

p p p

pL

θ Z X

θ Z X

Z X Z θ X θ X θ

θ θ θ X

Z Z Z θ X

θ X θ Z X Z X Z

θ Z X

:サンプルが難しい

サンプルが簡単

11.30

11.31

11.32

Page 14: Prml 11.1.4 重点サンプリング

en.newikipedia.org (@niam)

14

ご清聴ありがとうございました