143
Monte Carlo Yöntemleri Sinan Yıldırım MDBF, Sabancı Üniversitesi September 29, 2017

Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Monte Carlo Yöntemleri

Sinan Yıldırım

MDBF, Sabancı Üniversitesi

September 29, 2017

Page 2: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

İçindekiler

GirişBuffon’un iğnesiÖrneklerin ortalamasıMonte Carlo

Kesin örnekleme yöntemleriTersini alma yöntemiDönüştürme yöntemiBirleştirme yöntemiReddetme örneklemesi

Önem örneklemesiMarkov zinciri Monte Carlo

Metropolis-HastingsGibbs örneklemesi

Sıralı Monte CarloSıralı önem örneklemesiParçacık süzgeci

Page 3: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Giriş

Page 4: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Buffon’un iğnesi

Page 5: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Buffon’un iğnesi

Eşit aralıklı (1 cm) paralel çizgileri olan bir masaya 1 cm’lik bir iğne rastgeleatılıyor.

İğnenin masadaki çizgilerden birini kesmesi ihtimali nedir?

0 2 4 6 8 10

-2

0

2

4

6

8

10

12

Page 6: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Buffon’un iğnesi

Bu olasılık kesin olarak hesaplanabilir:I İğnenin ortasının en yakın çizgiye uzaklığı d olsun.I İğnenin çizgilerle yaptığı küçük açı θ ∈ (0, π/2) olsun.

İğnenin çizgilerden birini kesmesi şu şartla olur:

d

sin θ<

12

(1)

0 0.5 1 1.50

0.1

0.2

0.3

0.4 d > sin(θ)/2

θ

d

d < sin(θ)/2

Page 7: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Buffon’un iğnesi

0 0.5 1 1.50

0.1

0.2

0.3

0.4 d > sin(θ)/2

θ

d

d < sin(θ)/2

d , θ bağımsız ve d ∈ [0, 1/2] ve θ ∈ [0, π/2] arasında homojen dağılır:

p(d , θ) =

{4π, (d , θ) ∈ [0, 1/2]× [0, π/2]

0, else

A = {(d , θ) : d/ sin θ < 1/2} = {(d , θ) : d < sin θ/2} kümesi, figürdeki eğrininaltındaki alana karşılık gelir. X = (d , θ) dersek, bu kümenin olasılığı

P(X ∈ A) =

∫ ∫A

p(r , θ)drdθ =2π

Page 8: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Buffon’un iğnesi - Monte Carlo yaklaşımı

P(X ∈ A)’ı yaklaşık hesaplamak için Monte Carlo deneyi:

X (i) = (d (i), θ(i)), i = 1, . . . ,N örnekleri üretilir:

d (i) ∼ Unif(0, 1/2), θ(i) ∼ Unif(0, π/2),

P(X ∈ A) olasılığı aşağıdaki gibi kestirilir:

P(X ∈ A) ≈ 1N

N∑i=1

IA(X (i))

=1N

N∑i=1

I(d (i) < sin(θ(i))/2)

Page 9: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Buffon’un iğnesi - Monte Carlo yaklaşımı

N = 100 atış ve karşılık geldikleri d , θ değereri.

0 2 4 6 8 10

-2

0

2

4

6

8

10

12

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6

θ

0

0.1

0.2

0.3

0.4

0.5

d

Buffon's needle, N = 100. The estimated prob is 0.6700. True value is 0.6366

P(X ∈ A) ≈ number of red dotstotal number of dots

.

Page 10: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Buffon’un iğnesi - Monte Carlo yaklaşımı

Büyük sayılar kanunu N arttıkça kestirimin 2/π’ye yaklaştığını öngörür.

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6

θ

0

0.1

0.2

0.3

0.4

0.5

dBuffon's needle, N = 1000. The estimated prob is 0.6590. True value is 0.6366

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6

θ

0

0.1

0.2

0.3

0.4

0.5

d

Buffon's needle, N = 10000. The estimated prob is 0.6378. True value is 0.6366

Page 11: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

π’nin kestirimi

π ile P(X ∈ A) arasındaki ilişki:

π =2

P(X ∈ A),

π’nin Monte Carlo kestirimi:

π ≈ 2× N∑Ni=1 I(d (i) < sin(θ(i))/2)

= 2× toplam nokta sayısıkırmızı nokta sayısı

0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

N

2.6

2.8

3

3.2

3.4

3.6

3.8

estim

ate

of π

Buffon's needle experiment to approximate π

Page 12: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örneklerin ortalaması

Page 13: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örneklerin Ortalaması

Bir X ⊂ Rdx , dx ≥ 1 kümesinden N ≥ 1 tane rassal örnek verilmiş olsun:

X (1), . . . ,X (N).

Örneklerin bağımsız ve özdeş dağılımlı olduğunu ve π olasılık dağılımındangeldiğini varsayalım:

X1, . . . ,XNi.i.d.∼ π.

Ayrıca π dağılımı bilinmiyor olsun.

Page 14: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

π’ye göre ortalama değer

X ’in π dağılımına göre beklentisini X (1:N) örneklerini kullanarak yaklaşık olaraknasıl hesaplayabiliriz?

π(x) olasılık yoğunluk fonksiyonu ise:

Eπ(X ) =

∫Xxπ(x)dx .

π(x) olasılık kütle fonksiyonu ve X , x1, x2, . . . değerlerini alıyorsa:

Eπ(X ) =∑i

xiπ(xi ).

Makul bir kestirim:

Eπ(X ) ≈ 1N

N∑i=1

X (i).

Page 15: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Genel fonksiyonların beklenti değeri

Şimdi de ϕ : X → R fonksiyonunun π’ye göre beklentisini inceleyelim.

π(ϕ) := Eπ(ϕ(X )) =

∫Xϕ(x)π(x)dx .

Bu beklentinin kestirimi:

Eπ(ϕ(X )) ≈ 1N

N∑i=1

ϕ(X (i)).

Örnek: ϕ(x) = x2, ϕ(x) = log x , vs.

ϕ(X ) = X bizi ilk probleme geri götürür.

Page 16: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Bir kümenin olasılığıA ⊆ X şeklinde bir küme verilmiş olsun.

π(A) := P(X ∈ A)

İşaret fonksiyonu: IA : X → {0, 1}

IA(x) =

{1, x ∈ A

0, x /∈ A

Üstteki olasılık ϕ = IA fonksiyonunun beklenti değeri olur:

Eπ(IA(X )) =

∫XIA(x)π(x)dx

=

∫A

π(x)dx

= P(X ∈ A).

Bu olasılığa örnekler kullanılarak

P(X ∈ A) ≈ 1N

N∑i=1

IA(X (i)).

şeklinde yaklaşılabilir.

Page 17: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Monte Carlo

Page 18: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Monte Carlo: Ana fikir

Şimdi şu senaryoyu düşünelim: π dağılımını biliyoruz, ama π’den gelenörneklerimiz yok.

I π’den istediğimiz kadar bağımsız örnek üretebiliyoruz.I π(ϕ)’yi hesaplayamıyoruz.

Bu durumda π(ϕ)’ye nasıl yaklaşılabilir?

Eğer X (1), . . . ,X (N) ∼ π örneklerini kendimiz üretirsek, ilk probleme geridöneriz.

Bu basit fikir, Monte Carlo yöntemlerinin ana fikridir.

Page 19: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Monte Carlo’nun gerekçelendirilmesi - yansızlık

π(ϕ)’nin Monte Carlo kestirimini πNMC(ϕ) ile gösterelim:

πNMC(ϕ) =

1N

N∑i=1

ϕ(X (i)).

Herhangi bir N ≥ 1 için, πNMC(ϕ)’nın beklenti değeri:

E(πNMC(ϕ)

)= E

(1N

N∑i=1

ϕ(X (i))

).

=1N

N∑i=1

Eπ(ϕ(X (i)))

=1NNEπ(ϕ(X ))

= Eπ(ϕ(X )) = π(ϕ).

Ancak, yansızlık tek başına yeterli bir özellik değildir.

Page 20: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Monte Carlo’nun gerekçelendirilmesi - Büyük sayılar kanunu

πNMC(ϕ) =

1N

N∑i=1

ϕ(X (i)).

Büyük sayılar kanunu: Eğer |π(ϕ)| <∞ ise πNMC(ϕ)’nin π(ϕ)’ye yakınsar:

πNMC(ϕ)

a.s.→ π(ϕ), as N →∞.

Page 21: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Monte Carlo’nun gerekçelendirilmesi - Merkezi limit teoremi

πNMC(ϕ)’nin varyansı:

V[πNMC(ϕ)

]=

1N2

N∑i=1

Vπ[ϕ(X (i))

]=

1NVπ [ϕ(X )] .

Buradan, Vπ [ϕ(X )] sonlu olduğu sürece πNMC(ϕ)’nin doğruluğunun N ile arttığı

söylenebilir.

Merkezi limit teoremi: Eğer Vπ [ϕ(X )] <∞ ise√N[πNMC (ϕ)− π(ϕ)

]d→ N (0,Vπ [ϕ(X )]) as N →∞.

Page 22: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Monte Carlo gerekçelendirilmesi - Deterministik integraller

π(ϕ)’nin hesaplanması için bir takım belirlemeci integral teknikleri de vardır;

Ancak bu teknikler X ’in boyutu dx büyüdükçe kötüleşir.

Monte Carlo yaklaşımının başarımı dx ’ten bağımsızdır.

V[πNMC(ϕ)

]=

1NVπ [ϕ(X )] .

Page 23: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

İleri yöntemlere ihtiyaç

Çoğu problemde, tek sorun integralin alınamazlığı değil.I π’den örnekleme yapmak homojen dağılım kadar kolay olmayabilir.

Bunun için bir takım kesin örnekleme yöntemleri geliştirilmiştir. Örnek:tersini alma yöntemi, reddetme örneklemesi, kompozisyon, vs

I π’den örnekleme yapmak imkansız olabilir.

Örnek: Bayesçi çıkarımdaki sonsal dağılım: X bilinmeyen değişkeninininY = y verisi verildiğindeki sonsal dağılımı

π(x) := pX |Y (x |y) =pX (x)pY |X (y |x)∫

pX (x ′)pY |X (y |x ′)dx ′=

pX ,Y (x , y)∫pX ,Y (x ′, y)dx ′

∝ pX (x)pY |X (y |x)

Bu tür dağılımlardan yaklaşık örnekler elde etmek için yazında bir çokyöntem var, örn: Markov zinciri Monte Carlo, Sıralı Monte Carlo, vs.

Page 24: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Kesin örnekleme yöntemleri

Page 25: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Sözde-rassal sayı

Çıkış noktası olarak, bilgisayarımızın homojen dağılımdan örnekler üretebildiğinivarsayacağız.

U ∼ Unif(0, 1)

Bu üretilen sayılar belirlenimci yöntemlerle üretilir; bu sebeple bu sayılarasözde-rassal sayı denir.

Soru: Elimizde Unif(0, 1) dağılımından gelen sayılar olsun. Bu sayılarıkullanarak herhangi bir π dağılımından nasıl örnek üretebiliriz?

Page 26: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Tersini alma yöntemi

Page 27: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Tersini alma yöntemi

X ∼ π rassal değişkeninin kümülatif dağılım fonksiyonu:

F (x) = P(X ≤ x), x ∈ R.

F ’nin genelleştirilmiş tersi:

G(u) := inf{x ∈ X : F (x) ≥ u}.

Homojen dağılmış sayılar ve G kullanılarak X ∼ π elde edilebilir.

U ∼ Unif(0, 1)⇒ G(U) ∼ π

Page 28: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Tersini alma yöntemi

F ’nin genelleştirilmiş tersi:

G(u) := inf{x ∈ X : F (x) ≥ u}.

X ayrık ise ve x1, x2, . . . değerlerini alıyorsa:

G(u) = xi∗ , i∗ = min{i : F (xi ) ≥ u} ⇔ F (xi∗−1) < u ≤ F (xi∗)

X sürekli ise ve π(x) > 0 şeklinde bir olasılık yoğunluk fonksiyonu varsa (F ’tesıçrama ve düz alanlar yok), F monoton artandır ve tersi G = F−1 alınabilir.

G(u) = F−1(u)

Page 29: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Üssel dağılım

X ∼ Exp(λ), λ > 0, olasılık yoğunluk dağılımı

π(x) =

{λe−λx , x ≥ 00, else

, u = F (x) =

{∫ x

0 λe−λtdt = 1− e−λx , x ≥ 0

0, else.

0 1 2 3 4 5 6 7 8 9 10

x

0

0.2

0.4

0.6

0.8

1

1.2Exp(1) : sampling via the method of inversion

G(u)

u

pdf

cdf

O halde, Exp(λ)’dan U ∼ Unif(0, 1) ve X = − log(1− U)/λ şeklinde örneküretebiliriz.

Page 30: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Geometrik dağılım

X ∼ Geo(ρ), olasılık kütle fonksiyonu

π(x) = (1− ρ)xρ, x = 0, 1, 2 . . . , F (x) = 1− (1− ρ)x+1.

0 1 2 3 4 5 6 7 8 9 10

x

0

0.2

0.4

0.6

0.8

1

1.2Geo(0.3): sampling via the method of inversion

G(u)

u

pmf

cdf

O halde, Geo(ρ)’dan U ∼ Unif(0, 1) ve X =⌈log(1−U)log(1−ρ)

− 1⌉şeklinde örnek

üretilebilir.

Page 31: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Dönüştürme yöntemi

Page 32: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Dönüştürme yöntemi: basit durum

Tersini alma yöntemi U’dan X = G(U)’ya bir çeşit dönüştürme olarakgörülebilir.

Daha genel olarak, uygun bir g fonksiyonuyla bir dağılımdan diğerine geçilebilir.

Basit örnek: X ∼ Unif(a, b) üretmek için, U ∼ Unif(0, 1) üretip U’yu

X = g(U) := (b − a)U + a.

şeklinde dönüştürebiliriz.

Page 33: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Dönüştürme yöntemi: genel

Elimizde olasılık yoğunluk fonksiyonu pX (x) olan m boyutlu X ∈ X ⊆ Rm rassaldeğişkeni olsun.

Tersi alınabilir bir g : X → Y ⊆ Rm kullanarak X ’i dönüştürelim:

Y = (Y1, . . . ,Ym) = g(X1, . . . ,Xm)

Soru: Y ’nin olasılık yoğunluk dağılımı pY (y) ne olur?

y = (y1, . . . , ym) = g(x1, . . . , xm) kullanarak, Jakobian’ı tanımlayalım

J(y) = det∂g−1(y)

∂y= det

∂x

∂y= det

∂(x1, . . . , xm)

∂(y1, . . . , ym)= det

∂x1/∂y1 . . . ∂x1/∂ym...

. . ....

∂xm/∂y1 . . . ∂xm/∂ym

Y ’nin olasılık yoğunluk fonsiyonu:

pY (y) := pX (g−1(y)) |J(y)|

Page 34: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Uygulama: N (0, 1) için Box-Muller yöntemi

Standart Gauss dağılımı (normal dağılım) N (0, 1)’ın olasılık yoğunlukfonksiyonu

φ(x ;µ, σ) =1√2πσ2

e−1

2σ2 (x−µ)2

Kümülatif dağılım fonksiyonunun tersini almak kolay değil. Alternatif olarak,dönüştürme kullanacağız

İlk önce

R ∼ Exp(1/2), Θ ∼ Unif(0, 2π).

üretilir, sonra

X1 =√R cos(Θ), X2 =

√R sin(Θ)

dönüşümü ile X1,X2i.i.d.∼ N (0, 1) elde edilir.

Page 35: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Box-Muller yöntemi: Kanıt

Bu yöntem doğrudan değişkenlerin dönüştürülmesine dayanır:

(R,Θ) = (X 21 + X 2

2 , arctan(X2/X1)))

Jakobian’ın (r , θ) = (x21 + x22 , arctan(x2/x1))’deki değeri

J(r , θ) =

∣∣∣∣∂r/∂x1 ∂r/∂x2∂θ/∂x1 ∂θ/∂x2

∣∣∣∣ =

∣∣∣∣∣ 2x1 2x21

1+(y2/y1)2−y2y21

11+(y2/y1)2

1y1

∣∣∣∣∣ = 2

(X1,X2)’nin olasılık yoğunluk fonksiyonu, formülü kullanarak,

pX1,X2(x1, x2) = pR(r)pΘ(θ)|J(r , θ)|

= pR(x21 + x22 )pΘ(arctan(x2/x1))|J(r , θ)|

=12e−

12 (x2

1 +x22 ) 12π

2

=1√2π

e−12 x2

11√2π

e−12 x2

2

= φ(x1; 0, 1)φ(x2; 0, 1)

olarak bulunabilir, ki bu da iki Gauss dağılımının çarpımı olduğu içinX1,X2

i.i.d.∼ N (0, 1) olduğu görülür.

Page 36: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Çokdeğişkenli Gauss dağılım

n× 1 boyutlu çok değişkenli Gauss dağılımını X ∼ N (µ,Σ) şeklinde gösterelim.

µ = E(X ), n × 1 ortalama vektörüdür.

Σ = Cov(X ) = E[(X − µ)(X − µ)T ]

ise n × n simetrik ve kesin artı kovaryansa matrisidir. Bu matrisin (i , j)’incielemanı

σij = Cov(Xi ,Xj) = E[(Xi − µi )(Xj − µj)] = E(XiXj)− µiµj

Olasılık yoğunluk fonksiyonu

φ(x ;µ,Σ) =1|2πΣ| exp

{−12

(x − µ)TΣ−1(x − µ)

}Burada, | · | determinantı simgeler.

Page 37: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Çokdeğişkenli Gauss dağılımıVarsayalım ki X = (X1, . . . ,Xn)T ∼ N (µ,Σ) olsun.

Kertesi m ≤ n olan m × n bir matris ve bir m × 1 η vektörünü kullanarak X ’i

Y = AX + η

şeklinde dönüştürelim.

Y , X ’in doğrusal dönüştürülmüş hali olduğu için Y de Gauss dağılımınasahiptir.

E(Y ) = E(AX + η)

= AE(X ) + η

= Aµ+ η

Cov(Y ) = E([Y − E(Y )][Y − E(Y )]T )

= E([AX + η − (Aµ+ η)][AX + η − (Aµ+ η)]T )

= E(A(X − µ)(X − µ)TAT ) = ACov(X )AT

= AΣAT

Sonuç olarak, Y ∼ N (Aµ+ η,AΣAT ) yazabiliriz.

Page 38: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Çokdeğişkenli Gauss dağılımı: örnekleme

n× 1 boyutlu µ vektörü ve n× n kesin artı Σ matrisi verildiğinde, X ∼ N (µ,Σ)nasıl üretilir?

Önce R1, . . . ,Rni.i.d.∼ N (0, 1) üretilir böylece

R = (R1, . . . ,Rn) ∼ N (0n, In)

sağlanmış olur.

Sonra, Cholesky ayrıştırması kullanılarak

Σ = AAT

eşitliğini sağlayan A matrisi bulunur.

Son olarakX = AR + µ

değişkeni üretilir.

Page 39: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Birleştirme yöntemi

Page 40: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Birleştirme yöntemi: Sıradüzenli modeller

Z kümesinden değer alan ve Z ∼ α(·) rassal değişkenimiz olsun.

Z = z verildiğinde X |Z = z ∼ pz(·) olsun.

Bu durumda, X ∼ P’in marginal (tekil) dağılımı bir karışım dağılımıdır.

π(x) =

{∫pz(x)α(z)dz , α(z) olasılık yoğunluk fonksiyonu ise∑z pz(x)α(z)dz , α(z) olasılık kütle fonksiyonu ise

X ∼ π nasıl üretilebilir?

Page 41: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Birleştirme yöntemi

X ∼ π nasıl üretilebilir?

π(x) =

{∫pz(x)α(z)dz , α(z) olasılık yoğunluk fonksiyonu ise∑z pz(x)α(z)dz , α(z) olasılık kütle fonksiyonu ise

Doğrudan P’den örnekleme çok zor olabilir, ancak Π ve Pz ’den örneklemeyapmak kolaysa, birleştirme yöntemi kullanılabilir:

1. Z ∼ α(·) üretilir,

2. X ∼ pZ (·), üretilir3. Z atılır ve X tutulur.

Bu şekilde üretilen X kesin olarak π’den gelir.

Page 42: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Karışım Gauss dağılımı

K bileşeni olan, bileşenlerininI ortalama değerleri ve varyansları: (µ1, σ

21), . . . , (µK , σ

2K )

I karışımdaki olasılık ağırlıkları w1, . . . ,wK (w1 + · · ·+ wK = 1 olacakşekilde)

olan karışım Gauss dağılımının yoğunluk fonksiyonu

π(x) =K∑

k=1

wkφ(x ;µk , σ2k ).

Bu dağılımdan örnekleme yapmak için

1. wk olasılıkla k üretilir,

2. X ∼ N (µk , σ2k ) üretilir,

3. k atılır ve X tutulur.

Page 43: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Mahremiyet gözeten veri paylaşımı

Bir şirket D olan aylık talep miktarını mahremiyet sebebiyle gürültü olarak Xşeklinde paylaşıyor.

Paylaşılan X ’in dağılımı

π(x) =∑d

[e−λλd

d!

] [12b

exp(−|x − d |

b

)]Bu paylaşım sürecinin Monte Carlo ile benzetimini yapmak istiyoruz. X ∼ πnasıl üretilir?

Toplamdaki ilk terim PO(λ)’nin olasılık kütle fonksiyonunun d ’deki değeri,diğeri de Laplace(d , b)’nin olasılık dağılım fonksiyonunun x ’teki değeri.

1. D ∼ PO(λ) üretilir,

2. X ∼ Laplace(D, b) üretilir (veya V ∼ Laplace(0, b) ve X = D + V .).

3. D atılır X tutulur.

Page 44: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Reddetme örneklemesi

Page 45: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Reddetme örneklemesi

Sık kullanılan bir başka yöntem.

Şu şartları sağlayan bir q(x) dağılımı gerekir.I π(x) > 0 ise q(x) > 0 olmalıI Her x ∈ X için π(x) ≤ Mq(x)’yi sağlayacak bir M > 0 olması.

Reddetme örneklemesi:

1. X ′ ∼ q(·) ve U ∼ Unif(0, 1) üretilir.

2. U ≤ π(X ′)Mq(X ′) , ise X = X ′ alınır; değilse 1.’e geri dönülür.

Page 46: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Reddetme örneklemesi: Kabul olasılığı

1. X ′ ∼ q(·) ve U ∼ Unif(0, 1) üretilir.

2. U ≤ π(X ′)Mq(X ′) , ise X = X ′ alınır; değilse 1.’e geri dönülür.

Bir döngüde kabul etme olasılığı

P(Kabul) =

∫P(Kabul|X ′ = x)pX ′(x)dx

=

∫π(x)

Mq(x)q(x)dx

=1M

∫π(x)dx

=1M, (2)

Dolayısıyla q(x)’i π(x)’e olabildiğince yakın seçmek ve M = supx π(x)/q(x)almak makuldür.

Page 47: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Reddetme örneklemesi: Neden çalışır?

1. X ′ ∼ q(·) ve U ∼ Unif(0, 1) üretilir.

2. U ≤ π(X ′)Mq(X ′) , ise X = X ′ alınır; değilse 1.’e geri dönülür.

Yöntemin doğruluğunu göstermek için, üretilen X ’in dağılımının π olduğunugöstermek gerekir.

Bayes’ teoremini kullanarak,

pX (x) = pX ′(x |Kabul) =pX ′(x)P(Kabul|X ′ = x)

P(Kabul)

=q(x) 1

Mπ(x)q(x)

1/M

= π(x).

Page 48: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Gamma dağılımıÖrneklenecek dağılım: X ∼ Γ(α, 1), α > 1. Olasılık yoğunluk fonksiyonu:

π(x) =xα−1e−x

Γ(α), x > 0.

Aracı dağılım olarak qλ = Exp(λ), 0 < λ < 1, seçelim.

qλ(x) = λe−λx , x > 0.

Bütün x ∈ X için π(x) ≤ Mq(x)’i sağlayacak M bulunmalı:

π(x)

qλ(x)=

xα−1e(λ−1)x

λΓ(α)

x = (α− 1)/(1− λ)’de enbüyütülür, dolayısıyla

Mλ =

(α−11−λ

)α−1e−(α−1)

λΓ(α)

alınabilir. Kabul olasılığı

π(x)

qλ(x)Mλ=

(x(1− λ)

α− 1

)α−1e(λ−1)x+α−1

Page 49: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Gamma dağılımı

Kabul olasılığı 1/Mλ, Mλ’yı önceden bulmuştuk:

Mλ =

(α−11−λ

)α−1e−(α−1)

λΓ(α)

Şimdi de Mλ’yı enküçültecek λ’yı seçelim. Mλ, λ∗ = 1/α’da enküçültülür ve

M∗ =ααe−(α−1)

Γ(α).

elde edilir. Sonuç olarak Γ(α, β)’dan örnekleme yapmak için,

1. X ′ ∼ Exp(1/α) ve U ∼ Unif(0, 1) örneklenir.

2. If U ≤ (x/α)α−1e(1/α−1)x+α−1, ise X = X ′ alınır, değilse 1’e gidilir.

Page 50: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Gamma dağılımı

0 2 4 6 8 10

x

0

0.2

0.4

0.6

0.8

1

1.2rejection sampling for Γ (2, 1) with optimal choice for λ

p(x)

M∗qλ∗(x)

Mqλ∗(x) when M = 1.5 M∗

0 2 4 6 8 10

x

0

0.2

0.4

0.6

0.8

1

1.2

1.4rejection sampling for Γ (2, 1) with different values of λ

p(x)

lambda = 0.50

lambda = 0.10

lambda = 0.70

0 2 4 6 8 10 12 14

x

0

2000

4000

6000

8000

fre

qu

en

cy

histogram of samples generated using λ = 0.5

0 2 4 6 8 10 12

x

0

50

100

150

200

250histogram of samples generated using λ = 0.01

Page 51: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

π(x) tam olarak bilinmediğinde

Diyelim ki π(x)’in sadece bilinmeyen bir sabit çarpanla çarpılmış haldekideğerini biliyoruz:

π(x) =π̂(x)

Zπ, Zπ =

∫π̂(x)dx

Reddetme örneklemesi, bütün x ∈ X için π̂(x) ≤ Mq(x)’i sağlayan bir M ilehala uygulanabilir.

1. X ′ ∼ q(·) ve U ∼ Unif(0, 1) üretilir.

2. U ≤ π̂(X ′)Mq(X ′) ise, X = X ′ alınır; değilse 1.’e gidilir.

Kabul olasılığı: 1MZπ.

Page 52: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

π(x) tam olarak bilinmediğinde: Bayesci çıkarım örneği

Bilinmeyen sabit sorunu Bayesci çıkarımda sıklıkla karşımıza çıkar.

Bayesci çıkarımda amaç sonsal dağılımı bulmaktır.

Hesaplanamayan sonsal dağılımlardan örnekleme yapılabilir.

X ’in Y = y verildiğindeki sonsal dağılımı

π(x) := pX |Y (x |y) ∝ pX (x)pY |X (y |x) = π̂(x)

Çarpımsal (ve çoğunlukla hesaplanamayan) sabit:

pY (y) =

∫pX (x)pY |X (y |x)dx

Page 53: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Bilinmeyen sabite örnek: Bayesci çıkarım

X ’in Y = y verildiğindeki sonsal dağılımı

pX |Y (x |y) ∝ pX (x)pY |X (y |x)

Çarpımsal (ve çoğunlukla hesaplanamayan) sabit:

pY (y) =

∫pX (x)pY |X (y |x)dx

π(x) = pX |Y (x |y)’dan örnekleme için reddetme örneklemesi kullanılabilir.

Örnek: Eğer bütün x ∈ X için pY |X (y |x) ≤ M’i sağlayacak bir M varsa,reddetme örneklemesi bu M ile ve q(x) = pX (x) ile kullanılabilir:

1. X ′ ∼ q(·) ve U ∼ Unif(0, 1) üretilir,

2. Eğer U ≤ pY |X (y |X ′)/M ise X = X ′ alınır; değilse 1.’e gidilir.

Page 54: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Bayesci çıkarım örneği: Hedef yer saptamasıKoordinatlarını saptamak istediğimiz bir hedef (source) X = (X (1),X (2)):

-3 -2 -1 0 1 2 3

x(1)

-3

-2

-1

0

1

2

3

x(2

)

source

sensor 1

sensor 2

sensor 3

r1

r2

r3

s1, s2, s3 noktalarındaki üç sensör hedefe olan uzaklıklarını ölçüyor:

ri = [(X (1)− si (1))2 + (X (2)− si (2))2]1/2, i = 1, 2, 3

Ölçümler Y = (Y1,Y2,Y3) gürültülü:

Yi = ri + Vi , Vi ∼ N (0, σ2y ), i = 1, 2, 3.

Page 55: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Bayesci çıkarım örneği: Hedef yer saptaması

Koordinatla ilgili önsel kanı:

X ∼ N (02, σ2x I2), σ2x � 1

Amaç: Y = y = (y1, y2, y3) verildiğinde E(X |Y = y)’yi hesaplamak.

π(x) := pX |Y (x |y) ∝ pX (x)pY |X (y |x)︸ ︷︷ ︸π̂(x)

= φ(x ; 02, σ2x I2)︸ ︷︷ ︸pX (x)

3∏i=1

φ(yi ; ri , σ2y )︸ ︷︷ ︸

pY |X (y|x)

Reddetme örneklemesi q(x) = pX (x) alınarak yapılabilir:

π̂(x)

q(x)= pY |X (y |x) =

3∏i=1

φ(yi ; ri , σ2y ) =

1(2πσ2y )3/2

e−12∑3

i=1(yi−ri )2≤ 1

(2πσ2y )3/2

O halde, M = 1(2πσ2

y )3/2seçilmelidir.

Page 56: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Hedef yer saptaması - dağılımlar, σ2x = 100, σ2

y = 1

Likelihood term p(y1 | x)

-5 0 5

x(2)

-6

-4

-2

0

2

4

6

x(1

)

Likelihood term p(y2 | x)

-5 0 5

x(2)

-6

-4

-2

0

2

4

6

x(1

)

Likelihood term p(y3 | x)

-5 0 5

x(2)

-6

-4

-2

0

2

4

6

x(1

)

Prior pX(x)

-5 0 5

x(2)

-6

-4

-2

0

2

4

6

x(1

)

posterior ∝ prior x likelihood

-2 0 2

x(2)

-3

-2

-1

0

1

2

3

x(1

)

2

4

6

8

10×10 -9

Page 57: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Hedef yer saptaması - reddetme örneklemesi σ2x = 100,

σ2y = 1

-0.9 -0.8 -0.7 -0.6 -0.5 -0.4

estimated values

0

200

400

600

800hist of 10000 rej samp estimates for E(X(1) | y)

-0.3 -0.2 -0.1 0 0.1 0.2

estimated values

0

200

400

600

800hist of 10000 rej samp estimates for E(X(2) | y)

0 5 10 15 20 25 30

number of accepted samples

0

200

400

600

800

1000

1200histogram of number of samples out of 10000 iterations

Page 58: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Önem örneklemesi

Page 59: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Önem örneklemesi: Motivasyon

Yola çıkarkenki problemimiz: yaklaşık hesaplamak istediğimiz beklenti değeri

π(ϕ) = Eπ(ϕ(X )) =

∫Xϕ(x)π(x)dx .

π(ϕ)’nin Monte Carlo kestirimi

πNMC(ϕ) =

1N

N∑i=1

ϕ(X (i)), X (i) ∼ π, i = 1, . . . ,N,

için π’den örnekleme yapmamız gerekiyor.

Bir çok durumda X ∼ π örneklemesi çok zor, çok pahalı veya imkansız olabilir.

Page 60: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Önem örneklemesi

Yine, π(x) > 0 ise q(x) > 0 şartını sağlayan bir yardımcı dağılımımız olsun.

π(x) ve q(x) verildiğinde, önem fonksiyonunu tanımlayalım w : X → R

w(x) :=

{π(x)/q(x), q(x) > 0,0 q(x) = 0.

Önem örneklemesine temel oluşturan bağlantı:

π(ϕ) = Eπ(ϕ(X )) =

∫Xϕ(x)π(x)dx

=

∫Xϕ(x)

π(x)

q(x)q(x)dx

=

∫Xϕ(x)w(x)q(x)dx

= Eq(ϕ(X )w(X ))

Page 61: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Önem örneklemesi

Eğer q(x)’ten örnekleme yapmak kolay ise, π(ϕ)’ye yaklaşmak için önemörneklemesi yapılabilir.

1. X (1), . . . ,X (N) i.i.d.∼ q(·) örneklenir.

2. π(ϕ)’ye şu şekilde yaklaşılır:

πNIS(ϕ) :=

1N

N∑i=1

ϕ(X (i))w(X (i)).

Page 62: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Önem örneklemesi: Örnek

(X ,Y ) ∈ X × Y değişkenlerinin ortak dağılımının yoğunluk fonksiyonupX ,Y (x , y) olsun

pX ,Y (x , y) = pX (x)pY |X (y |x)

Bazı durumlarda pY (y) hesaplanmak istenebilir:

pY (y) =

∫XpX ,Y (x , y)dx =

∫XpX (x)pY |X (y |x)dx = EPX (pY |X (y |X ))

Standard Monte Carlo kestirimi:

pY (y) ≈ 1N

N∑i=1

pY |X (y |X (i)), X (1), . . . ,X (N) ∼ pX (x).

Önem örneklemesi ile kestirim:

pY (y) ≈ 1N

N∑i=1

pX (X (i))

q(X (i))pY |X (y |X (i)), X (1), . . . ,X (N) ∼ q(x).

Page 63: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Önem örneklemesi: en iyi q(x)

q(x)’yu seçme özgürlüğümüz var, o halde en iyileştirmeye çalışalım.

Vq

[πNIS(ϕ)

]=

1NVq [w(X )ϕ(X )]

Varyansı en küçük yapacak q(x)

q(x) = π(x)|ϕ(x)|π(|ϕ|)

Bu tercih ile elde edilen varyans:

minq

Vq

[πNIS(ϕ)

]=

1N

([π(|ϕ|)]2 − [π(ϕ)]2

).

Page 64: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Öz-düzgeleyici önem örneklemesi

Önem örneklemesi π(x) = π̂(x)Zp

olduğunda ve sadece π̂(x) bilindiğinde yineuygulanabilir.

Önem fonksiyonu

w(x) :=

{π̂(x)q(x)

, q(x) > 00, q̂(x) = 0,

E(w(X )) =

∫π̂(x)

q(x)q(x)dx =

∫π(x)Zπq(x)

q(x)dx = Zπ.

E(w(X )ϕ(X )) =

∫π̂(x)

q(x)ϕ(x)q(x)dx =

∫π(x)Zπq(x)

ϕ(x)q(x)dx = π(ϕ)Zπ.

İki ifadeyi birbirine bölersek

π(ϕ) =E(w(X )ϕ(X ))

Zπ=

E(w(X )ϕ(X ))

E(w(X )).

Page 65: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Öz-düzgeleyici önem örneklemesi

π(ϕ) =E(w(X )ϕ(X ))

Zπ=

E(w(X )ϕ(X ))

E(w(X )).

Hem pay hem payda için aynı örnekler kullanarak önem örneklemesi yapılabilir.

πNIS(ϕ) =

1N

∑Ni=1 ϕ(X (i))w(X (i))1N

∑Ni=1 w(X (i))

, X (1), . . . ,X (N) ∼ q(·).

Öz-düzgeleyici önem ağırlıkları:

W (i) =w(X (i))∑Nj=1 w(X (j))

Öz-düzgeleyici önem örneklemesi

1. i = 1, . . . ,N için; X (i) ∼ q(·) üretilir ve w(X (i)) = π̂(X (i))

q(X (i))hesaplanır.

2. i = 1, . . . ,N için W (i) = w(X (i))∑Nj=1 w(X (j))

hesaplanır.

3. πNIS(ϕ) =

∑Ni=1 W

(i)ϕ(X (i)) hesaplanır.

Page 66: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Öz-düzgeleyici önem örneklemesi: Bayesci çıkarım

Sonsal dağılım:π(x) = pX |Y (x |y) ∝ pX (x)pY |X (y |x)

Hesaplanmak istenen beklenti değeri

E(ϕ(X )|Y = y) =

∫pX |Y (x |y)ϕ(x)dx .

Öz-düzgeleyici önem örneklemesi:

1. i = 1, . . . ,N için; X (i) ∼ q(·) örneklenir ve önem ağırlıkları hesaplanır

w(X (i)) =pX (X (i))pY |X (y |X (i))

q(X (i)).

2. i = 1, . . . ,N için; W (i) = w(X (i))∑Nj=1 w(X (j))

hesaplanır.

3. E(ϕ(X )|Y = y) ≈∑N

i=1 W(i)ϕ(X (i)) hesaplanır.

Eğer q(x) = pX (x) seçilirse, önem fonksiyonu w(x) = pY |X (y |x) olur.

Page 67: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Bayesci çıkarım örneği: Hedef yer saptamasıKoordinatlarını saptamak istediğimiz bir hedef (source) X = (X (1),X (2)):

-3 -2 -1 0 1 2 3

x(1)

-3

-2

-1

0

1

2

3

x(2

)

source

sensor 1

sensor 2

sensor 3

r1

r2

r3

s1, s2, s3 noktalarındaki üç sensör hedefe olan uzaklıklarını ölçüyor:

ri = [(X (1)− si (1))2 + (X (2)− si (2))2]1/2, i = 1, 2, 3

Ölçümler Y = (Y1,Y2,Y3) gürültülü:

Yi = ri + Vi , Vi ∼ N (0, σ2y ), i = 1, 2, 3.

Page 68: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Bayesci çıkarım örneği: Hedef yer saptaması

Koordinatla ilgili önsel kanı:

X ∼ N (02, σ2x I2), σ2x � 1

Amaç: Y = y = (y1, y2, y3) verildiğinde pX |Y (x |y)’i bulmak ve E(X |Y = y)’yihesaplamak.

π(x) = pX |Y (x |y) ∝ pX (x)pY |X (y |x)︸ ︷︷ ︸π̂(x)

= φ(x ; 02, σ2x I2)︸ ︷︷ ︸pX (x)

3∏i=1

φ(yi ; ri , σ2y )︸ ︷︷ ︸

pY |X (y|x)

Öz-düzgeleyici önem örneklemesi q(x) = pX (x) alınarak yapılabilir:

w(x) =π̂(x)

q(x)=

pX (x)pY |X (y |x)

pX (x)= pY |X (y |x) =

3∏i=1

φ(yi ; ri , σ2y )

Page 69: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Hedef yer saptaması - dağılımlar, σ2x = 100, σ2

y = 1

Likelihood term p(y1 | x)

-5 0 5

x(2)

-6

-4

-2

0

2

4

6

x(1

)

Likelihood term p(y2 | x)

-5 0 5

x(2)

-6

-4

-2

0

2

4

6

x(1

)

Likelihood term p(y3 | x)

-5 0 5

x(2)

-6

-4

-2

0

2

4

6

x(1

)

Prior pX(x)

-5 0 5

x(2)

-6

-4

-2

0

2

4

6

x(1

)

posterior ∝ prior x likelihood

-2 0 2

x(2)

-3

-2

-1

0

1

2

3

x(1

)

2

4

6

8

10×10 -9

Page 70: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Hedef yer saptaması

-0.9 -0.8 -0.7 -0.6 -0.5 -0.4

estimated values

0

100

200

300

400

500

600

700histogram of 10000 importance sampling estimates for E(X(1) | y)

-0.25 -0.2 -0.15 -0.1 -0.05 0 0.05 0.1 0.15

estimated values

0

100

200

300

400

500

600

700histogram of 10000 importance sampling estimates for E(X(2) | y)

Page 71: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Öz-düzgeleyici önem örneklemesi: q(x)’in seçiminin önemiBir başka Bayesci çıkarım örneği:

X ∼ N (µ, σ2), Y1, . . . ,Yn|X = xi.i.d.∼ Unif(x − a, x + a).

Sonsal dağılım:

π(x) = pX |Y (x |y) ∝ φ(x ;µ, σ2)︸ ︷︷ ︸pX (x)

1(2a)n

n∏i=1

I(x−a,x+a)(yi )︸ ︷︷ ︸pY |X (y|x)

Öncül ve sonsal dağılımlar (n = 10, a = 2, µ = 0, σ2 = 10):

-20 -10 0 10 20

x

0

0.02

0.04

0.06

0.08

0.1

pX(x)

pX(x)

y1, ..., y

10

3 4 5 6

x

0

1

2

3

4

5

6×10

-8 pX, Y

(x, y) = pX(x)p

Y |X(y | x)

pX, Y

(x, y)

y1, ..., y

10

Page 72: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Öz-düzgeleyici önem örneklemesi: q(x)’in seçiminin önemi

Sonsal dağılım:

π(x) = pX |Y (x |y) ∝ φ(x ;µ, σ2)︸ ︷︷ ︸pX (x)

1(2a)n

n∏i=1

I(x−a,x+a)(yi )︸ ︷︷ ︸pY |X (y|x)

Öz-düzgeleyici önem örneklemesi E(X |Y = y)’ı kestirmek için kullanılabilir.

q(x) için ilk seçim: öncül dağılım q(x) = φ(x ;µ, σ2).

Bu geçerli bir seçimdir, ama a küçük ve σ2 büyük ise önem fonksiyonu

w(x) =1

(2a)n

n∏i=1

I(x−a,x+a)(yi ).

çoğu örnek için 0, çok az örnek için 1(2a)n

olacaktır. Bu da varyansın fazlaolmasına sebep olur.

Page 73: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Öz-düzgeleyici önem örneklemesi: q(x)’in seçiminin önemi

Daha akıllı bir seçim sonsal dağılıma bakılarak yapılabilir.

ymax = maxi yi ve ymin = mini yi olsun.

x ∈ (ymax − a, ymin + a)⇔ x − a < yi < x + a, ∀i = 1, . . . , n

Dolayısıyla, (ymax − a, ymin + a) aralığının dışında vakit harcamamıza gerek yok.

Mantıklı bir seçim: q(x) = Unif(x ; ymax − a, ymin + a).

Bu seçimle

w(x) =

φ(x ;µ,σ2) 1

(2a)n

1/(2a+ymin−ymax), x ∈ (ymax − a, ymin + a)

0, else

Page 74: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Öz-düzgeleyici önem örneklemesi: q(x)’in seçiminin önemi

4.6 4.65 4.7 4.75 4.8 4.85

estimated posterior mean

0

100

200

300

400

500

600

700importance distribution is prior: variance: 0.00089

4.7 4.71 4.72 4.73 4.74 4.75

estimated posterior mean

0

100

200

300

400

500

600

700importance distribution is uniform: variance: 0.00002

Page 75: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Markov zinciri Monte Carlo

Page 76: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ayrık zamanlı Markov zinciri

Başlangıç yoğunluk/kütle fonksiyonu ve geçiş olasılık çekirdeği yoğunluk/kütlefonksiyonu sırasıyla η(x) ve M(x ′|x) olan bir Markov zinciri {Xt}t≥1:

p(x1:n) = η(x1)M(x2|x1) . . .M(xn|xn−1)

= η(x1)n∏

t=2

M(xt |xt−1)

Geçmiş değerler verildiğinde, Markov zincirinin n zamanındaki değeri sadecen − 1 zamandaki değerine bağlıdır.

p(xn|x1:n−1) = p(xn|xn−1)

= M(xn|xn−1).

Page 77: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Değişimsiz dağılım ve durağan dağılım

Xn’in marjinal dağılımını özyinelemeli olarak yazabiliriz

π1(x) := η(x)

πn(x) :=

∫M(x |x ′)πn−1(x ′)dx ′

Eğer verilen bir π(x) dağılımı

π(x) =

∫M(x |x ′)π(x ′)dx ′

şartını sağlıyorsa “π(x), M’ye göre değişimsizdir” denir ve M’nin belli şartlarısağlaması durumunda

I π(x), M’nin tek değişimsiz dağılımıdır,I π(x), M’nin durağan dağılımıdır, yani

limn→∞

πn → π

Page 78: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Metropolis-Hastings

Page 79: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Markov zinciri Monte Carlo

Örnekleme problemi: π(x) dağılımından örnekleme yapmak.

Markov zinciri Monte Carlo (MZMC) yöntemleri, durağan dağılımı π olan birMarkov zincirinin tasarımına dayanır.

Bu zincir yeterince uzun zaman çalıştırıldığında (mesela bir tb zamanındansonra) zincirin üretilen değerlerinin Xtb+1,Xtb+2, . . . ,XT yaklaşık olarak π’dengeldiği kabul edilir.

Bu değerler, π dağılıma göre olan beklenti değerlerini hesaplamaya yarar.

π(ϕ) ≈ 1T − tb

T∑t=tb+1

ϕ(Xt)

Page 80: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Metropolis-Hastings

En çok kullanılan MZMC yöntemlerinden biri Metropolis-Hastings yöntemidir.

Xn−1 = x verildiğinde yeni değer için q(·|x) koşullu dağılımından çekilen birörnek yeni değer olarak önerilir, bu değer belli bir olasılığa göre kabul edilir,edilmezse eski değerde kalınır.

Xn−1 = x verildiğinde,I Yeni değer için x ′ ∼ q(·|x) önerilir.I Xn’in değeri

α(x , x ′) = min{1,π(x ′)q(x |x ′)π(x)q(x ′|x)

}olasılıkla Xn = x ′ alınır, yoksa önerilen değer reddedilir ve Xn = x alınır.

Page 81: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Metropolis-Hastings: doğruluk

Metropolis-Hastings’in geçiş matrisi (çekirdeği):

M(x ′|x) = q(x ′|x)α(x , x ′) +

[1−

∫Xq(x ′|x)α(x , x ′)

]︸ ︷︷ ︸

x’te reddetme olasılığı

δx(x ′).

π, M için ayrıntılı denge koşulunu sağlar: Herhangi A,B ⊆ X kümeleri için∫A

∫B

M(x ′|x)π(x)dxdx ′ =

∫B

∫A

M(x ′|x)π(x)dxdx ′

(X ayrıksa, her x , x ′ için M(x ′|x)π(x) = M(x |x ′)π(x ′).)

π, M için ayrıntılı denge koşulunu sağlarsa,I M tersinebilirdir veI π, M’in değişimsiz dağılımıdır.

Page 82: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Bayesci çıkarım örneği: Hedef yer saptamasıKoordinatlarını saptamak istediğimiz bir hedef (source) X = (X (1),X (2)):

-3 -2 -1 0 1 2 3

x(1)

-3

-2

-1

0

1

2

3

x(2

)

source

sensor 1

sensor 2

sensor 3

r1

r2

r3

s1, s2, s3 noktalarındaki üç sensör hedefe olan uzaklıklarını ölçüyor:

ri = [(X (1)− si (1))2 + (X (2)− si (2))2]1/2, i = 1, 2, 3

Ölçümler Y = (Y1,Y2,Y3) gürültülü:

Yi = ri + Vi , Vi ∼ N (0, σ2y ), i = 1, 2, 3.

Page 83: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Bayesci çıkarım örneği: Hedef yer saptaması

Koordinatla ilgili önsel kanı:

X ∼ N (02, σ2x I2), σ2x � 1

Amaç: Y = y = (y1, y2, y3) verildiğinde pX |Y (x |y)’i bulmak ve E(X |Y = y)’yihesaplamak.

π(x) = pX |Y (x |y) ∝ pX (x)pY |X (y |x)︸ ︷︷ ︸π̂(x)

= φ(x ; 02, σ2x I2)︸ ︷︷ ︸pX (x)

3∏i=1

φ(yi ; ri , σ2y )︸ ︷︷ ︸

pY |X (y|x)

Metropolis-Hastings algoritması q(x ′|x) = φ(x ′; x , σ2q I2) alınarak yapılabilir:

α(x , x ′) = min{1,

pX (x ′)pY |X (y |x ′)q(x |x ′)pX (x)pY |X (y |x)q(x ′|x)

}= min

{1,

pX (x ′)pY |X (y |x ′)pX (x)pY |X (y |x)

}

Page 84: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Hedef yer saptaması - dağılımlar, σ2x = 100, σ2

y = 1

Likelihood term p(y1 | x)

-5 0 5

x(2)

-6

-4

-2

0

2

4

6

x(1

)

Likelihood term p(y2 | x)

-5 0 5

x(2)

-6

-4

-2

0

2

4

6

x(1

)

Likelihood term p(y3 | x)

-5 0 5

x(2)

-6

-4

-2

0

2

4

6

x(1

)

Prior pX(x)

-5 0 5

x(2)

-6

-4

-2

0

2

4

6

x(1

)

posterior ∝ prior x likelihood

-2 0 2

x(2)

-3

-2

-1

0

1

2

3

x(1

)

2

4

6

8

10×10 -9

Page 85: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Hedef yer saptaması için Metropolis-Hastings: örnekler

0 2000 4000 6000 8000 10000

iterations

-4

-2

0

2

4

6X

t(1)

Samples for X(1)

0 2000 4000 6000 8000 10000

iterations

-4

-2

0

2

4

6

Xt(2

)

Samples for X(2)

-4 -2 0 2 4 6

x

0

200

400

600

800

1000Histogram of samples for X(1)

-4 -2 0 2 4 6

x

0

200

400

600

800

1000Histogram of samples for X(2)

Page 86: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Hedef yer saptaması için Metropolis-Hastings: ilk 200 örnek

first 200 samples

-6 -4 -2 0 2 4 6

x(2)

-6

-4

-2

0

2

4

6

x(1

)

Page 87: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Gibbs örneklemesi

Page 88: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Gibbs örneklemesi

Bir diğer çok sık kullanılan MZMC yöntemi de Gibbs örneklemesidir.

Uygulanması içinI X = (X (1), . . . ,X (d)) değişkeni çok boyutlu olmalı,I tam koşullu πk (·|X (1), . . .X (k − 1),X (k + 1), . . . ,X (d)) dağılımlarından

örnekleme yapılabilmeli.

Gibbs örneklemesi:X1 = (X1(1), . . . ,X1(d)) ile başla.

n = 2, 3, . . . için,

k = 1, . . . , d için

Xn(k) ∼ πk(·|Xn(1), . . . ,Xn(k − 1),Xn−1(k + 1), . . . ,Xn−1(n)).

Page 89: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Gibbs örneklemesi: doğruluk

Gibbs örneklemesi:X1 = (X1(1), . . . ,X1(d)) ile başla. n = 2, 3, . . . için,

k = 1, . . . , d için

Xn(k) ∼ πk(·|Xn(1), . . . ,Xn(k − 1),Xn−1(k + 1), . . . ,Xn−1(n)).

Bu algoritmanın döngüsünün k’ıncı adımına karşılık gelen geçiş matrisi(çekirdeği) Mk :

Mk(x , y) = πk(yk |x−k)δx−k (y−k)

Burada x−k = (x1:k−1, xk+1:d) y−k = (y1:k−1, yk+1:d).

Bütün bür döngüye karşılık gelen geçiş matrisi (çekirdeği)

M = M1M2 . . .Md

Her bir Mk ’nın ayrıntılı denge koşulunu sağladığı ve π’ye göre tersinirliğigösterilebilir.

Page 90: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Sıralı Monte Carlo

Page 91: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Büyüyen boyutlarda sıralı çıkarım

{Xn}n≥1, her biri X ’ten değer alan rassal değişkenler dizisi olsun.

X1:n için {πn(x1:n)}n≥1 dağılım dizisi verilmiş olsun.

Her biri ϕn : X n → R olan bir {ϕn}n≥1 fonksiyon dizisi verilsin.

Amaç: Sıralı çıkarım

πn(ϕn) = Eπn [ϕn(X1:n)] =

∫πn(x1:n)ϕn(x1:n)dx1:n, n = 1, 2, . . .

integrallerine sıralı bir şekilde nasıl yaklaşabiliriz?

Page 92: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örnek: Saklı Markov modelleri (SMM)

SMM, biri gizli ve Markov zinciri olan, diğeri gözlenen iki süreçten oluşur.

{Xt ∈ X ,Yt ∈ Y}t≥1

{Xt}t≥1 başlangıç ve geçiş yoğunlukları η(x) ve f (x ′|x) olan saklı Markov zinciri

X1 ∼ η(x), Xt |(X1:t−1 = x1:t−1) ∼ f (·|xt−1),

{Yt}t≥1, {Xt}t≥1’ye koşullu bağımsız süreç:

Yt |({Xi}i≥1 = {xi}i≥1, {Yi}i 6=t = {yi}i 6=t) ∼ g(·|xt).

Page 93: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Örneğe örnek: Hedef takip

I Vt = (Vt(1),Vt(2)): t anındaki hız vektörüI Pt = (Pt(1),Pt(2)): t anındaki pozisyon vektörüI Xt = (Vt ,Pt): t anındaki hız ve pozisyonI Yt ∼ N ((||S1 − Pt ||, ||S2 − Pt ||, ||S3 − Pt ||), σ2y I3): 3 sensörlerden alınan

gürültülü uzaklık ölçümleri.

Xt bir Markov zinciri olarak modellenebilir. Bu durumda {Xt ,Yt} bir SMMoluşturur.

Page 94: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

SMM: hedef sonsal dağılımlar

Ortak dağlım:

p(x1:n, y1:n) = η(x1)n∏

t=2

f (xt |xt−1)n∏

t=1

g(yt |xt)

Gözlemlerin marjinal (tekil) dağılımı

p(y1:n) =

∫X n

p(x1:n, y1:n)dx1:n.

x1:n’nin y1:n’e olan sonsal dağılımı:

p(x1:n|y1:n) =p(x1:n, y1:n)

p(y1:n)∝ p(x1:n, y1:n)

Amaç: πn(x1:n) = p(x1:n|y1:n) ve Eπn [ϕn(X1:n)]’e yaklaşmak.

Page 95: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Sıralı önem örneklemesi

Page 96: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Sıralı önem örneklemesiEπn [ϕn(X1:n)] için önem örneklemesi yapmak istiyoruz.

Bunun için qn(x1:n)’ye ihtiyacımız var, bu durumda ağırlık fonksiyonları

wn(x1:n) =πn(x1:n)

qn(x1:n).

qn’yi sıralı olarak oluşturabiliriz:

qn(x1:n) = q1(dx1)n∏

i=1

qi (xi |x1:i−1)

Bu durumda ağırlık fonksiyonları özyinelemeli olarak yazılabilir:

wn(x1:n) = wn−1(x1:n−1)πn(x1:n)

πn−1(x1:n−1)qn(xn|x1:n−1)︸ ︷︷ ︸wn|n−1(x1:n)

.

πn(x1:n) = π̂n(x1:n)/Zn ve π̂n(x1:n) biliniyorsa,

W (i)n =

wn(X(i)1:n)∑N

i=1 wn(X(i)1:n)

.

Page 97: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Sıralı (öz-düzgeleyici) önem örneklemesi

Diyelim ki πn(x1:n) = π̂n(x1:n)/Zn ve π̂n(x1:n) biliniyor.

Öz-düzgeleyici önem örneklemesi sıralı bir şekilde uygulanabilir:

n = 1, 2, . . . için;

I i = 1, . . . ,N için,

I n = 1 ise X(i)1 ∼ q1(·) üretilir, w1(X

(i)1 ) =

π1(X(i)1 )

q1(X(i)1 )

hesaplanır.

I n ≥ 2 ise X(i)n ∼ qn(·|X (i)

1:n−1) üretilir, X (i)1:n = (X

(i)1:n−1,X

(i)n )

oluşturulur, ve

wn(X(i)1:n) = wn−1(X

(i)1:n−1)

π̂n(x1:n)

π̂n−1(x1:n−1)qn(X(i)n |X (i)

1:n−1).

I Öz-düzgeleyici önem ağırlıkları: i = 1, . . . ,N için

W (i)n =

wn(X(i)1:n)∑N

i=1 wn(X(i)1:n)

.

Page 98: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

SMM için sıralı önem örnekleyicisi

Hedef dağılımlar: πn(x1:n) ∝ π̂n(x1:n) = p(x1:n, y1:n)

p(x1:n, y1:n) = η(x1)g(y1|x1)n∏

t=2

f (xt |xt−1)g(yt |xt)

p(x1:n|y1:n) özyinelemeli olarak yazılabilir:

p(x1:n, y1:n) = p(x1:n−1, y1:n−1)f (xn|xn−1)g(yn|xn)

qn sıralı olarak gözlemlere göre ayarlanabiliir. Örneğin,

qn(x1:n|y1:n) = q(x1|y1)n∏

t=2

q(xt |xt−1, yt)

= qn−1(x1:n−1|y1:n−1)q(xn|xn−1, yn)

Önem ağırlıkları:

wn(x1:n) = wn−1(x1:n−1)f (xn|xn−1)g(yn|xn)

q(xn|xn−1, yn).

Page 99: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

Page 100: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu

n arttıkça çok az sayıda X(i)1:n’nin önem ağırlıkları wn(X

(i)1:n) diğerlerininkine göre

çok büyük olacaktır.

Dolayısıla, W (i)n öz-düzgelenmiş ağırlıkarindan çok azı 1’e yakın olacak, diğerleri

0’a yaklaşacaktır.

Limitte, W (i)n ’lerden bir tanesi 1, diğerleri 0 olacaktır.

Bu soruna, ağırlık bozulması sorunu denir.

Page 101: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - before weighting: t = 1

Page 102: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - after weighting, t = 1

Page 103: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - before weighting: t = 2

Page 104: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - after weighting, t = 2

Page 105: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - before weighting: t = 3

Page 106: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - after weighting, t = 3

Page 107: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - before weighting: t = 4

Page 108: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - after weighting, t = 4

Page 109: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - before weighting: t = 5

Page 110: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - after weighting, t = 5

Page 111: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - before weighting: t = 6

Page 112: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - after weighting, t = 6

Page 113: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - before weighting: t = 7

Page 114: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - after weighting, t = 7

Page 115: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - before weighting: t = 8

Page 116: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - after weighting, t = 8

Page 117: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - before weighting: t = 9

Page 118: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - after weighting, t = 9

Page 119: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - before weighting: t = 10

Page 120: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Ağırlık bozulması sorunu: ÖrnekDoğrusal Gauss saklı Markov modeli

η(x) = φ(x ; 0, σ20), f (x ′|x) = φ(x ′; ax , σ2x ), g(y |x) = φ(y ; bx , σ2y )

0 1 2 3 4 5 6 7 8 9 10 11

time step

-6

-4

-2

0

2

4

6

8

sam

ple

valu

es

Sequential importance sampling - after weighting, t = 10

Page 121: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Yeniden örnekleme → Parçacık süzgeciAğırlık bozulması sorununu önlemek için, sıralı önem örneklemesinin her biradımına yeniden örnekleme uygulanır.

CHAPTER 6. SEQUENTIAL MONTE CARLO 80

6.3 Sequential importance sampling resampling

Weight degeneracy: The SIS method is an e�cient way of implementing importancesampling sequentially. However; unless the proposal distribution is very close to the truedistribution, the importance weight step will lead over a number of iterations to a smallnumber of particles with very large weights compared to the rest of the particles. Thiswill eventually result in one of the normalised weights to being ⇡ 1 and the others being⇡ 0, e↵ectively leading to a particle approximation with a single particle, see Kong et al.(1994) and Doucet et al. (2000b). This problem is called the weight degeneracy problem.

Resampling: In order to address the weight degeneracy problem, a resampling step isintroduced at iterations of the SIS method, leading to the sequential importance samplingresampling (SISR) algorithm.

Generally, we can describe resampling as a method by which a weighted empiricaldistribution is replaced with an equally weighted distribution, where the samples of theequally weighted distribution are drawn from the weighted empirical distribution.

X(i)1:n−1

X̃(i)1:n−1

i = 1 i = 2 i = 3 i = 4 i = 5 i = 6

Figure 6.1: Resampling in SISR. Circle sizes represent weights.

In sequential Monte Carlo for {⇡n(x1:n)}n�1, resampling is applied to ⇡Nn�1(x1:n�1) before

proceeding to approximate ⇡n(x1:n). Assume, again, that ⇡n�1(x1:n�1) is approximated by

⇡Nn�1(x1:n�1) =

NX

i=1

W(i)n�1�X

(i)1:n�1

(x1:n�1),

We draw N independent samples eX(i)1:n�1, i = 1, . . . , N from ⇡N

n�1, such that

P( eX(i)1:n�1 = X

(j)1:n�1) = W

(j)n�1, i, j = 1, . . . , N.

Obviously, this corresponds to drawing N independent samples from a multinomial distri-bution, therefore this particular resampling scheme is called multinomial resampling. Nowthe resampled particles form an equally weighted discrete distribution

⇡̃Nn�1(x1:n�1) =

1

N

NX

i=1

� eX(i)1:n�1

(x1:n�1),

Diyelim ki n − 1 zamanında X(1)1:n−1, . . . ,X

(N)1:n−1 örneklerimiz var ve bunların

öz-düzgelenmiş ağırlıkları W (1)n−1, . . . ,W

(N)n−1.

Bu örneklerden, ağırlıkları olasılıklarıyla N kere bağımsız örnekler çekilir:

P(X̃(i)1:n−1 = X

(j)1:n−1) = W

(j)n−1, i , j = 1, . . . ,N.

Artık yolumuza 1/N eşit ağırlıklı X̃ (1)1:n−1, . . . , X̃

(N)1:n−1 ile devam ediyoruz.

Parçacık süzgeci: Sıralı örnekleme yöntemine yeniden örnekleme adımınıneklenmesiyle elde edilen yönteme denir.

Page 122: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

SMM için parçacık süzgeciHedef dağılımlar: πn(x1:n) ∝ π̂n(x1:n) = p(x1:n, y1:n)

p(x1:n, y1:n) = η(x1)g(y1|x1)n∏

t=2

f (xt |xt−1)g(yt |xt)

Parçacık süzgeci:n = 1 için;

i = 1, . . . ,N için X(i)1 ∼ q(·|y1) örneklenir ve W

(i)1 ∝

η(X(i)1 )g(y1|X (i)

1 )

q(X(i)1 |y1)

hesaplanır.

n = 2, 3, . . . için,I Yeniden örnekleme ile X̃

(1)1:n−1, . . . , X̃

(N)1:n−1 üretilir:

P(X̃(i)1:n−1 = X

(j)1:n−1) = W

(j)n−1, i , j = 1, . . . ,N.

I i = 1, . . . ,N için, X (i)n ∼ qn(·|X̃ (i)

n−1, yn) örneklenir, X (i)1:n = (X̃

(i)1:n−1,X

(i)n )

oluşturulur.I Bu parçacıkların ağırlıkları

W (i)n ∝

f (X(i)n |X̃ (i)

n−1)g(yn|X (i)n )

q(X(i)n |X̃ (i)

n−1, yn).

Page 123: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, before weighting t = 1

Page 124: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, after weighting t = 1

Page 125: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, before weighting t = 2

Page 126: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, after weighting t = 2

Page 127: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, before weighting t = 3

Page 128: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, after weighting t = 3

Page 129: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, before weighting t = 4

Page 130: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, after weighting t = 4

Page 131: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, before weighting t = 5

Page 132: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, after weighting t = 5

Page 133: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, before weighting t = 6

Page 134: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, after weighting t = 6

Page 135: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, before weighting t = 7

Page 136: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, after weighting t = 7

Page 137: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, before weighting t = 8

Page 138: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, after weighting t = 8

Page 139: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, before weighting t = 9

Page 140: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, after weighting t = 9

Page 141: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, before weighting t = 10

Page 142: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Parçacık süzgeci

0 1 2 3 4 5 6 7 8 9 10 11

time step

-7

-6

-5

-4

-3

-2

-1

0

1

2

3sam

ple

valu

es

Sequential importance sampling - resampling, after weighting t = 10

Page 143: Monte Carlo Yöntemleri - Sabancı Üniversitesipeople.sabanciuniv.edu/~sinanyildirim/Matematik_koyu_sunum_Turkce_v3.pdf · Örnek: Buffon’uniğnesi-MonteCarloyaklaşımı BüyüksayılarkanunuN

Yeniden örnekleme: Yol bozulması sorunu

Ağırlık bozulması sorununu yeniden örnekleme ile giderilebilir.

Ancak yeniden örnekleme yol bozulması sorunu yaratır.

Art arda yeniden örneklemeler sebebiyle önceki zamanlara ait parçacık sayısıgitgide düşer.