Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
Vzorčna porazdelitev
Naj bo T : Rn → R cenilka parametra, ki nas zanima. Porazdelitevslučajne spremenljivke T (X1,X2, . . . ,Xn) (ki je definirana naprostoru vzorcev velikosti n) se imenuje vzorčna porazdelitev.
Zadovoljstvo s storitvami našega zaposlenegaRecimo, da je delež storitev, ki so ocenjene kot zadovoljive,natanko p.Kolikšna je verjetnost, da bo v vzorcu n storitev natanko kocenjenih kot zadovoljivih (tu je k 6 n)?
Gre za(
nk
)pk(1− p)n−k .
To je binomska porazdelitev.Možne vrednosti vzorčnega povprečja so 0, 1
n ,2n , . . . ,
nn = 1 in
P(X = kn ) =
(nk)pk(1− p)n−k .
Jaka Smrekar Statistika, PraMat, 27.3.2017
Vzorčna porazdelitev
Kaj pa kavomat?
Ni tako preprostoVsekakor gre za zvezno porazdeljeno slučajno spremenljivko.VeljaP(X ∈ (a, b)
)= P
(X1 + · · ·+ Xn ∈ (na, nb)
)=∫ nb
na g(t)dt,kjer je g(t) porazdelitvena gostota vsote X1 + X2 + · · ·+ Xn.
Izkaže se, da je
g(t) =∫R. . .
∫R
f (x1) · · · f (xn−1)f (t −n−1∑i=1
xi)dx1x2 . . . xn−1.
Če je X normalno porazdeljena slučajna spremenljivka,X ∼ N(µ, σ), je X1 + X2 + · · ·+ Xn ∼ N(nµ, σ
√n) in
X ∼ N(µ, σ/√
n).
Jaka Smrekar Statistika, PraMat, 27.3.2017
Intervali zaupanja
Intervalska ocena pričakovane vrednostiRecimo, da ocenjujemo E (X ) na podlagi vzorca.Intervalska ocena je metoda oziroma napoved oblike:Predvidevamo, da je E (X ) ∈ [L(vzorec),U(vzorec)], kjer sta Lin U odvisna od vzorca.
Intervalska ocena v splošnemRecimo, da je c karakteristika (parameter) slučajne spremenljivke,ki nas zanima (na primer pričakovana vrednost, disperzija, ...)Tedaj je intervalska ocena za c metoda, ki vzorcu priredi napoved(predvidevanje):
c ∈ [L(vzorec),U(vzorec)].
Jaka Smrekar Statistika, PraMat, 27.3.2017
Intervali zaupanjaZgled: interval zaupanja za delež
ProblemZaposleni v podpori. Ocena za delež storitev, ki jih opravizadovoljivo.
ModelX : {storitve} → {0, 1}.Za neki p ∈ (0, 1) velja P(X = 1) = p.Iščemo ta p, ki je hkrati E (X ).Kaj je vzorec velikosti n?Vsa možna zaporedja oblike (1, 0, 1, 1, . . . , 1︸ ︷︷ ︸
n
).
Kakšna bo smiselna intervalska ocena?Na primer: če je k število enic, ocenimop ∈
[k/n − nekaj, k/n + nekaj
].
Jaka Smrekar Statistika, PraMat, 27.3.2017
Intervali zaupanjaNaivni interval zaupanja za delež
Konstrukcija za vzorec velikosti 10Naj bo k število „ugodnih“ izidov. Naša intervalska ocena se glasi:Ocenjujemo, da iskani delež pripada intervalu
[ k10 −
110 ,
k10 + 1
10].
Kaj želimo vedeti?Kako „točna“ je naša napoved.
Jaka Smrekar Statistika, PraMat, 27.3.2017
Intervali zaupanjaNaivni interval zaupanja za delež: stopnja zaupanja
Stopnja zaupanja?k interval p = 0.1 p = 0.25 p = 0.5 p = 0.75 p = 0.90 [−.1, .1] 0.349 0.056 0.000 0.000 0.0001 [0, .2] 0.387 0.188 0.010 0.000 0.0002 [.1, .3] 0.194 0.282 0.044 0.000 0.0003 [.2, .4] 0.057 0.250 0.117 0.003 0.0004 [.3, .5] 0.011 0.146 0.205 0.016 0.0005 [.4, .6] 0.001 0.058 0.246 0.058 0.0016 [.5, .7] 0.000 0.016 0.205 0.146 0.0117 [.6, .8] 0.000 0.003 0.117 0.250 0.0578 [.7, .9] 0.000 0.000 0.044 0.282 0.1949 [.8, 1] 0.000 0.000 0.010 0.188 0.38710 [.9, 1.1] 0.000 0.000 0.000 0.056 0.349
pokritost 0.930 0.532 0.656 0.532 0.930
Jaka Smrekar Statistika, PraMat, 27.3.2017
Intervali zaupanjaNaivni interval zaupanja za delež: pokritost
Graf pokritosti
231
512= 0.451172
110
15
310
25
12
35
710
45
910
1p
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.
Jaka Smrekar Statistika, PraMat, 27.3.2017
Intervali zaupanja: formalizacija
Stopnja zaupanjaNaj bo β ∈ (0, 1) stopnja zaupanja.To je mera za „kvaliteto intervala zaupanja“. Tipično je blizu 1.Za nas bo standardna izbira β = 0.95.
Interval zaupanjaNaj bo še:
c karakteristika, ki nas zanima inn velikost vzorca.
Interval zaupanja za c stopnje zaupanja β za vzorec velikosti nsestoji iz funkcij, odvisnih od (dejanskega) vzorca velikosti n,imenujemo ju L in U, za kateri je verjetnost tistih vzorcev, zakatere interval [L(vzorec),U(vzorec)] vsebuje c, večja ali enaka β.S simboli:
P(L(X1,X2, . . . ,Xn) 6 c 6 U(X1,X2, . . . ,Xn)
)> β.
Jaka Smrekar Statistika, PraMat, 27.3.2017
Intervali zaupanjaClopper-Pearsonov eksaktni interval zaupanja za delež
Naj bo n velikost vzorca in β ∈ (0, 1). Pišimo α = 1− β.Naj k označuje število enic v vzorcu.
L(k) ={
Beta(k, n − k + 1)−α/2, k > 1,0, k = 0.
U(k) ={
Beta(k + 1, n − k)α/2, k < n,1, k = n.
Tu sta Beta(a, b)α/2 oziroma Beta(a, b)−α/2 zgornji oziromaspodnji α/2-percentil porazdelitve Beta(a, b).
Funkciji L in U podajata interval zaupanja za delež stopnjezaupanja > β.
Jaka Smrekar Statistika, PraMat, 27.3.2017
Intervali zaupanjaClopper-Pearsonov eksaktni interval zaupanja za delež: pokritost
Graf pokritosti za vzorec velikosti 10, β = 0.95
0.0 0.2 0.4 0.6 0.8 1.0
0.95
0.96
0.97
0.98
0.99
1.00
1.01
Jaka Smrekar Statistika, PraMat, 27.3.2017
Intervali zaupanjaClopper-Pearsonov eksaktni interval zaupanja za delež: pokritost
Graf pokritosti za vzorec velikosti 100, β = 0.95
0.0 0.2 0.4 0.6 0.8 1.0
0.95
0.96
0.97
0.98
0.99
1.00
1.01
Jaka Smrekar Statistika, PraMat, 27.3.2017
Družina porazdelitev beta
DefinicijaNaj bosta a in b pozitivni realni števili.Porazdelitev beta s parametroma a in b je zvezna porazdelitev, kijo označimo Beta(a, b), s porazdelitveno gostoto
f (x) = f (x ; a, b) =
1
B(a,b)xa−1(1− x)b−1, x ∈ (0, 1),0, x /∈ (0, 1).
Opomba
Velja Beta(a, b) = Γ(a)Γ(b)Γ(a+b) =
∫ 10 xa−1(1− x)b−1dx .
Jaka Smrekar Statistika, PraMat, 27.3.2017
Porazdelitvena gostota porazdelitve beta
Beta(2, 5)
0.2 0.4 0.6 0.8 1.0
0.5
1.0
1.5
2.0
2.5
Jaka Smrekar Statistika, PraMat, 27.3.2017
Porazdelitvena gostota porazdelitve beta
Beta(3, 4)
0.2 0.4 0.6 0.8 1.0
0.5
1.0
1.5
2.0
Jaka Smrekar Statistika, PraMat, 27.3.2017
Porazdelitvena gostota porazdelitve beta
Beta(4, 3)
0.2 0.4 0.6 0.8 1.0
0.5
1.0
1.5
2.0
Jaka Smrekar Statistika, PraMat, 27.3.2017
Porazdelitvena gostota porazdelitve beta
Beta(5, 2)
0.2 0.4 0.6 0.8 1.0
0.5
1.0
1.5
2.0
2.5
Jaka Smrekar Statistika, PraMat, 27.3.2017