View
41
Download
3
Category
Preview:
DESCRIPTION
chování výběrového průměru. nechť X 1 , X 2 ,…, X n jsou nezávislé náhodné veličiny s libovolným rozdělením se střední hodnotou a rozptylem 2 – náhodný výběr z onoho rozdělení pro průměr z těchto veličin platí průměr má tedy rozptyl n -krát menší, než jednotlivá pozorování - PowerPoint PPT Presentation
Citation preview
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
1
chování výběrového průměru nechť X1, X2,…,Xn jsou nezávislé náhodné
veličiny s libovolným rozdělením se střední hodnotou a rozptylem 2 – náhodný výběr z onoho rozdělení
pro průměr z těchto veličin platí
průměr má tedy rozptyl n-krát menší, než jednotlivá pozorování
střední chyba průměru = směrodatná odchylka průměru
n
iiX X
nX
1
1EE
n
XES..
nX
22
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
2
chování výběrového průměru nechť X1, X2,…,Xn jsou nezávislé
náhodné veličiny s rozdělením N(, 2) – náhodný výběr z N(, 2)
pro průměr z těchto veličin platí
střední chyba průměru = směrodatná odchylka průměru
proto
n
ii nNX
nX
1
2
,~1
n
XES..
1,0~ NnX
Z
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
3
příklad: věk matek veliká populace rodičů (11 tisíc)
Populace 10 812 matek
vek
Frequency
15 20 25 30 35 40 45
05001000
2000
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
4
příklad: věk matek vybráno 100 matek
n=1
15 25 35 45
05101520253035
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
5
příklad: věk matek vybráno 100 krát n=10 matek, průměry:
n=10
15 25 35 45
0510152025
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
6
příklad: věk matek vybráno 100 krát n=100 matek, průměry:
n=100
15253545
05101520253035
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
7
příklad: věk matek veliká populace rodičů (11 tisíc) náhodně vybráno 100 matek (vlastně
průměry výběrů rozsahu n = 1), histogram 100 krát náhodně vybráno vždy n = 10
matek, spočítán průměr, histogram průměrů 100 krát náhodně vybráno vždy n = 100
matek, spočítán průměr, histogram průměrů očekáváme, že každý následující rozptyl ze
100 hodnot (průměrů) bude asi 10 krát menší skutečnost: 18,9; 1,9, 0,2
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
8
příklad: věk matek (shodné měřítko)
n=100
15253545
05
1015
2025
3035
n=1
15 25 35 45
05
1015
2025
3035
n=10
15 25 35 45
05
1015
2025
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
9
centrální limitní věta nechť X1, X2,…,Xn jsou nezávislé náhodné
veličiny se stejným rozdělením, se střední hodnotou a rozptylem 2>0. Potom pro velké n má průměr z nich rozdělení N(, 2/n).
prakticky: pro dost velká n má průměr normální rozdělení
příklad: průměrný věk matek z velkých výběrů už (téměř) normální rozdělení
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
10
příklad: věk matek
n=100
24.0 25.0 26.0 27.0
05
1015
2025
3035
n=1
15 20 25 30 35 40
05
1015
2025
3035
n=10
22 24 26 28 30
05
1015
2025
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
11
interval spolehlivosti (1) pro X ~ N(,2) platí P(|X - | < 1,96 ) = 0,95 tj. 95 % protože je ~ N(,2/n) , platí,
tedy
dostali jsme 95% interval spolehlivosti
X
95,096,1
nX
P
95,096,196,1
nX
nX
P
Xn
X
96,1n
X
96,1
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
12
interval spolehlivosti (2) 95% interval spolehlivosti překryje s
pravděpodobností 95 % neznámé kdybychom postup prováděli
opakovaně, pak asi v 95 % případů překryjeme skutečnou hodnotu , ve zbylých asi 5 % zůstane skutečné mimo interval spol.
pro velké n lze nahradit pomocí sx
pro obecné :
122 z
nXz
nXP
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
13
interval spolehlivosti (3) pro malé n (do ~ 50 i více) a Xi s
normálním rozdělením raději použít kritické hodnoty Studentova t-rozdělení:
interval spolehlivosti se počítá i pro jiné parametry, vždy interval, který s požadovanou pravděpodobností překryje odhadovaný parametr = intervalový odhad
111 n
xn
x tns
Xtns
XP
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
14
příklad: věk matek 95% interval pro populační průměr věku
všech matek na základě výběru 99 matek
99% interval pro populační průměr věku všech matek na základě výběru 99 matek bude užší nebo širší?
větší jistota větší šířka
5,26;9,2498,1991,4
7,25;98,1991,4
7,25
8,26;6,2463,2991,4
7,25;63,2991,4
7,25
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
15
příklad: věk matky, výběry n = 100
0 20 40 60 80 100
23
24
25
26
27
28
celkem 100 95% intervalů spol. pro (=25,4), 7 nepřekrylo
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
16
centrální limitní věta pro četnosti Nechť X1, X2,…,Xn jsou nezávislé náhodné
veličiny se stejným rozdělením, se střední hodnotou a rozptylem 2>0. Potom pro velké n má průměr z nich rozdělení N(, 2/n).
absolutní četnost Y součet veličin s alternativním rozdělením Y ~ bi(n,) , přibližně Y ~N(n, n(1-))
relativní četnost f = Y / n f - průměr veličin s alternativním rozdělením f ~ N( , (1-)/n)
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
17
interval spolehlivosti pro podíl (1) populace: podíl prvků s danou vlastností je to pravděpodobnost, že vlastnost má
náhodně vybraný prvek výběr: relativní četnost ve výběru relativní četnost je průměr nula-jedničkové
veličiny – pro velké n má přibližně normální rozdělení
nula-jedničková veličina má rozptyl (1- ) relativní četnost (=průměr) má rozptyl
n 1
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
18
interval spolehlivosti pro podíl (2) střední chyba relativní četnosti je
odmocnina z jejího rozptylu, je tedy
pravděpodobnost neznáme, odhadneme pomocí relativní četnosti f
odtud 95% interval spolehlivosti pro
existuje přesnější (pracnější) metoda
n
1
96,1
1;96,1
1nff
fnff
f
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
19
příklad: hody hrací kostkou odhadujeme pravděpodobnost šestky kostka A: n = 100, nA = 17, fA = 0,17
kostka B: n = 100, nB = 41, fB = 0,41
důležitý rozdíl: v prvním případě patří 1/6=0,167 do intervalu spolehlivosti, ve druhém případě nikoliv
24,0;10,096,1100
83,017,017,0;96,1
10083,017,0
17,0
51,0;31,096,1100
59,041,041,0;96,1
10059,041,0
41,0
8. listopadu 2004 Statistika (D360P03Z) 6. předn.
20
proč testování hypotéz nelze bezpečně poznat, že kostka B je
falešná nebo že kostka A není falešná intervaly spolehlivosti vymezily rozmezí,
kde by skutečná pravděpodobnost šestky měla být, jejich spolehlivost je velká, ale omezená
znamená něco, když 1/6 neleží v 95% intervalu spolehlivosti?
musíme připustit, že jsme mohli mít smůlu, že se v našich pokusech náhodou realizovaly málo pravděpodobné možnosti, přestože k takové smůle dochází jen zřídka
Recommended