16
Vzorčna porazdelitev Naj bo T : R n R cenilka parametra, ki nas zanima. Porazdelitev slučajne spremenljivke T (X 1 , X 2 ,..., X n ) (ki je definirana na prostoru vzorcev velikosti n) se imenuje vzorčna porazdelitev. Zadovoljstvo s storitvami našega zaposlenega Recimo, da je delež storitev, ki so ocenjene kot zadovoljive, natanko p. Kolikšna je verjetnost, da bo v vzorcu n storitev natanko k ocenjenih kot zadovoljivih (tu je k 6 n)? Gre za n k p k (1 - p) n-k . To je binomska porazdelitev. Možne vrednosti vzorčnega povprečja so 0, 1 n , 2 n ,..., n n = 1 in P ( X = k n )= ( n k ) p k (1 - p) n-k . Jaka Smrekar Statistika, PraMat, 27.3.2017

Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Vzorčna porazdelitev

Naj bo T : Rn → R cenilka parametra, ki nas zanima. Porazdelitevslučajne spremenljivke T (X1,X2, . . . ,Xn) (ki je definirana naprostoru vzorcev velikosti n) se imenuje vzorčna porazdelitev.

Zadovoljstvo s storitvami našega zaposlenegaRecimo, da je delež storitev, ki so ocenjene kot zadovoljive,natanko p.Kolikšna je verjetnost, da bo v vzorcu n storitev natanko kocenjenih kot zadovoljivih (tu je k 6 n)?

Gre za(

nk

)pk(1− p)n−k .

To je binomska porazdelitev.Možne vrednosti vzorčnega povprečja so 0, 1

n ,2n , . . . ,

nn = 1 in

P(X = kn ) =

(nk)pk(1− p)n−k .

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 2: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Vzorčna porazdelitev

Kaj pa kavomat?

Ni tako preprostoVsekakor gre za zvezno porazdeljeno slučajno spremenljivko.VeljaP(X ∈ (a, b)

)= P

(X1 + · · ·+ Xn ∈ (na, nb)

)=∫ nb

na g(t)dt,kjer je g(t) porazdelitvena gostota vsote X1 + X2 + · · ·+ Xn.

Izkaže se, da je

g(t) =∫R. . .

∫R

f (x1) · · · f (xn−1)f (t −n−1∑i=1

xi)dx1x2 . . . xn−1.

Če je X normalno porazdeljena slučajna spremenljivka,X ∼ N(µ, σ), je X1 + X2 + · · ·+ Xn ∼ N(nµ, σ

√n) in

X ∼ N(µ, σ/√

n).

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 3: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Intervali zaupanja

Intervalska ocena pričakovane vrednostiRecimo, da ocenjujemo E (X ) na podlagi vzorca.Intervalska ocena je metoda oziroma napoved oblike:Predvidevamo, da je E (X ) ∈ [L(vzorec),U(vzorec)], kjer sta Lin U odvisna od vzorca.

Intervalska ocena v splošnemRecimo, da je c karakteristika (parameter) slučajne spremenljivke,ki nas zanima (na primer pričakovana vrednost, disperzija, ...)Tedaj je intervalska ocena za c metoda, ki vzorcu priredi napoved(predvidevanje):

c ∈ [L(vzorec),U(vzorec)].

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 4: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Intervali zaupanjaZgled: interval zaupanja za delež

ProblemZaposleni v podpori. Ocena za delež storitev, ki jih opravizadovoljivo.

ModelX : {storitve} → {0, 1}.Za neki p ∈ (0, 1) velja P(X = 1) = p.Iščemo ta p, ki je hkrati E (X ).Kaj je vzorec velikosti n?Vsa možna zaporedja oblike (1, 0, 1, 1, . . . , 1︸ ︷︷ ︸

n

).

Kakšna bo smiselna intervalska ocena?Na primer: če je k število enic, ocenimop ∈

[k/n − nekaj, k/n + nekaj

].

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 5: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Intervali zaupanjaNaivni interval zaupanja za delež

Konstrukcija za vzorec velikosti 10Naj bo k število „ugodnih“ izidov. Naša intervalska ocena se glasi:Ocenjujemo, da iskani delež pripada intervalu

[ k10 −

110 ,

k10 + 1

10].

Kaj želimo vedeti?Kako „točna“ je naša napoved.

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 6: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Intervali zaupanjaNaivni interval zaupanja za delež: stopnja zaupanja

Stopnja zaupanja?k interval p = 0.1 p = 0.25 p = 0.5 p = 0.75 p = 0.90 [−.1, .1] 0.349 0.056 0.000 0.000 0.0001 [0, .2] 0.387 0.188 0.010 0.000 0.0002 [.1, .3] 0.194 0.282 0.044 0.000 0.0003 [.2, .4] 0.057 0.250 0.117 0.003 0.0004 [.3, .5] 0.011 0.146 0.205 0.016 0.0005 [.4, .6] 0.001 0.058 0.246 0.058 0.0016 [.5, .7] 0.000 0.016 0.205 0.146 0.0117 [.6, .8] 0.000 0.003 0.117 0.250 0.0578 [.7, .9] 0.000 0.000 0.044 0.282 0.1949 [.8, 1] 0.000 0.000 0.010 0.188 0.38710 [.9, 1.1] 0.000 0.000 0.000 0.056 0.349

pokritost 0.930 0.532 0.656 0.532 0.930

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 7: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Intervali zaupanjaNaivni interval zaupanja za delež: pokritost

Graf pokritosti

231

512= 0.451172

110

15

310

25

12

35

710

45

910

1p

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 8: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Intervali zaupanja: formalizacija

Stopnja zaupanjaNaj bo β ∈ (0, 1) stopnja zaupanja.To je mera za „kvaliteto intervala zaupanja“. Tipično je blizu 1.Za nas bo standardna izbira β = 0.95.

Interval zaupanjaNaj bo še:

c karakteristika, ki nas zanima inn velikost vzorca.

Interval zaupanja za c stopnje zaupanja β za vzorec velikosti nsestoji iz funkcij, odvisnih od (dejanskega) vzorca velikosti n,imenujemo ju L in U, za kateri je verjetnost tistih vzorcev, zakatere interval [L(vzorec),U(vzorec)] vsebuje c, večja ali enaka β.S simboli:

P(L(X1,X2, . . . ,Xn) 6 c 6 U(X1,X2, . . . ,Xn)

)> β.

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 9: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Intervali zaupanjaClopper-Pearsonov eksaktni interval zaupanja za delež

Naj bo n velikost vzorca in β ∈ (0, 1). Pišimo α = 1− β.Naj k označuje število enic v vzorcu.

L(k) ={

Beta(k, n − k + 1)−α/2, k > 1,0, k = 0.

U(k) ={

Beta(k + 1, n − k)α/2, k < n,1, k = n.

Tu sta Beta(a, b)α/2 oziroma Beta(a, b)−α/2 zgornji oziromaspodnji α/2-percentil porazdelitve Beta(a, b).

Funkciji L in U podajata interval zaupanja za delež stopnjezaupanja > β.

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 10: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Intervali zaupanjaClopper-Pearsonov eksaktni interval zaupanja za delež: pokritost

Graf pokritosti za vzorec velikosti 10, β = 0.95

0.0 0.2 0.4 0.6 0.8 1.0

0.95

0.96

0.97

0.98

0.99

1.00

1.01

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 11: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Intervali zaupanjaClopper-Pearsonov eksaktni interval zaupanja za delež: pokritost

Graf pokritosti za vzorec velikosti 100, β = 0.95

0.0 0.2 0.4 0.6 0.8 1.0

0.95

0.96

0.97

0.98

0.99

1.00

1.01

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 12: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Družina porazdelitev beta

DefinicijaNaj bosta a in b pozitivni realni števili.Porazdelitev beta s parametroma a in b je zvezna porazdelitev, kijo označimo Beta(a, b), s porazdelitveno gostoto

f (x) = f (x ; a, b) =

1

B(a,b)xa−1(1− x)b−1, x ∈ (0, 1),0, x /∈ (0, 1).

Opomba

Velja Beta(a, b) = Γ(a)Γ(b)Γ(a+b) =

∫ 10 xa−1(1− x)b−1dx .

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 13: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Porazdelitvena gostota porazdelitve beta

Beta(2, 5)

0.2 0.4 0.6 0.8 1.0

0.5

1.0

1.5

2.0

2.5

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 14: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Porazdelitvena gostota porazdelitve beta

Beta(3, 4)

0.2 0.4 0.6 0.8 1.0

0.5

1.0

1.5

2.0

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 15: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Porazdelitvena gostota porazdelitve beta

Beta(4, 3)

0.2 0.4 0.6 0.8 1.0

0.5

1.0

1.5

2.0

Jaka Smrekar Statistika, PraMat, 27.3.2017

Page 16: Statistika, PraMat, 27.3 - FMFsmrekar/IZ_1.pdf · 2017. 3. 27. · Recimo,dajec karakteristika(parameter)slučajnespremenljivke, kinaszanima(naprimerpričakovanavrednost,disperzija,...)

Porazdelitvena gostota porazdelitve beta

Beta(5, 2)

0.2 0.4 0.6 0.8 1.0

0.5

1.0

1.5

2.0

2.5

Jaka Smrekar Statistika, PraMat, 27.3.2017