20
8. listopadu 200 4 Statistika (D360P03Z) 6. předn. 1 chování výběrového průměru nechť X 1 , X 2 ,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením se střední hodnotou a rozptylem 2 náhodný výběr z onoho rozdělení pro průměr z těchto veličin platí průměr má tedy rozptyl n-krát menší, než jednotlivá pozorování střední chyba průměru = směrodatná odchylka průměru n i i X X n X 1 1 E E n X E S . . n X 2 2

chování výběrového průměru

  • Upload
    akio

  • View
    41

  • Download
    3

Embed Size (px)

DESCRIPTION

chování výběrového průměru. nechť X 1 , X 2 ,…, X n jsou nezávislé náhodné veličiny s libovolným rozdělením se střední hodnotou  a rozptylem  2 – náhodný výběr z onoho rozdělení pro průměr z těchto veličin platí průměr má tedy rozptyl n -krát menší, než jednotlivá pozorování - PowerPoint PPT Presentation

Citation preview

Page 1: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

1

chování výběrového průměru nechť X1, X2,…,Xn jsou nezávislé náhodné

veličiny s libovolným rozdělením se střední hodnotou a rozptylem 2 – náhodný výběr z onoho rozdělení

pro průměr z těchto veličin platí

průměr má tedy rozptyl n-krát menší, než jednotlivá pozorování

střední chyba průměru = směrodatná odchylka průměru

n

iiX X

nX

1

1EE

n

XES..

nX

22

Page 2: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

2

chování výběrového průměru nechť X1, X2,…,Xn jsou nezávislé

náhodné veličiny s rozdělením N(, 2) – náhodný výběr z N(, 2)

pro průměr z těchto veličin platí

střední chyba průměru = směrodatná odchylka průměru

proto

n

ii nNX

nX

1

2

,~1

n

XES..

1,0~ NnX

Z

Page 3: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

3

příklad: věk matek veliká populace rodičů (11 tisíc)

Populace 10 812 matek

vek

Frequency

15 20 25 30 35 40 45

05001000

2000

Page 4: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

4

příklad: věk matek vybráno 100 matek

n=1

15 25 35 45

05101520253035

Page 5: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

5

příklad: věk matek vybráno 100 krát n=10 matek, průměry:

n=10

15 25 35 45

0510152025

Page 6: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

6

příklad: věk matek vybráno 100 krát n=100 matek, průměry:

n=100

15253545

05101520253035

Page 7: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

7

příklad: věk matek veliká populace rodičů (11 tisíc) náhodně vybráno 100 matek (vlastně

průměry výběrů rozsahu n = 1), histogram 100 krát náhodně vybráno vždy n = 10

matek, spočítán průměr, histogram průměrů 100 krát náhodně vybráno vždy n = 100

matek, spočítán průměr, histogram průměrů očekáváme, že každý následující rozptyl ze

100 hodnot (průměrů) bude asi 10 krát menší skutečnost: 18,9; 1,9, 0,2

Page 8: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

8

příklad: věk matek (shodné měřítko)

n=100

15253545

05

1015

2025

3035

n=1

15 25 35 45

05

1015

2025

3035

n=10

15 25 35 45

05

1015

2025

Page 9: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

9

centrální limitní věta nechť X1, X2,…,Xn jsou nezávislé náhodné

veličiny se stejným rozdělením, se střední hodnotou a rozptylem 2>0. Potom pro velké n má průměr z nich rozdělení N(, 2/n).

prakticky: pro dost velká n má průměr normální rozdělení

příklad: průměrný věk matek z velkých výběrů už (téměř) normální rozdělení

Page 10: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

10

příklad: věk matek

n=100

24.0 25.0 26.0 27.0

05

1015

2025

3035

n=1

15 20 25 30 35 40

05

1015

2025

3035

n=10

22 24 26 28 30

05

1015

2025

Page 11: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

11

interval spolehlivosti (1) pro X ~ N(,2) platí P(|X - | < 1,96 ) = 0,95 tj. 95 % protože je ~ N(,2/n) , platí,

tedy

dostali jsme 95% interval spolehlivosti

X

95,096,1

nX

P

95,096,196,1

nX

nX

P

Xn

X

96,1n

X

96,1

Page 12: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

12

interval spolehlivosti (2) 95% interval spolehlivosti překryje s

pravděpodobností 95 % neznámé kdybychom postup prováděli

opakovaně, pak asi v 95 % případů překryjeme skutečnou hodnotu , ve zbylých asi 5 % zůstane skutečné mimo interval spol.

pro velké n lze nahradit pomocí sx

pro obecné :

122 z

nXz

nXP

Page 13: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

13

interval spolehlivosti (3) pro malé n (do ~ 50 i více) a Xi s

normálním rozdělením raději použít kritické hodnoty Studentova t-rozdělení:

interval spolehlivosti se počítá i pro jiné parametry, vždy interval, který s požadovanou pravděpodobností překryje odhadovaný parametr = intervalový odhad

111 n

xn

x tns

Xtns

XP

Page 14: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

14

příklad: věk matek 95% interval pro populační průměr věku

všech matek na základě výběru 99 matek

99% interval pro populační průměr věku všech matek na základě výběru 99 matek bude užší nebo širší?

větší jistota větší šířka

5,26;9,2498,1991,4

7,25;98,1991,4

7,25

8,26;6,2463,2991,4

7,25;63,2991,4

7,25

Page 15: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

15

příklad: věk matky, výběry n = 100

0 20 40 60 80 100

23

24

25

26

27

28

celkem 100 95% intervalů spol. pro (=25,4), 7 nepřekrylo

Page 16: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

16

centrální limitní věta pro četnosti Nechť X1, X2,…,Xn jsou nezávislé náhodné

veličiny se stejným rozdělením, se střední hodnotou a rozptylem 2>0. Potom pro velké n má průměr z nich rozdělení N(, 2/n).

absolutní četnost Y součet veličin s alternativním rozdělením Y ~ bi(n,) , přibližně Y ~N(n, n(1-))

relativní četnost f = Y / n f - průměr veličin s alternativním rozdělením f ~ N( , (1-)/n)

Page 17: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

17

interval spolehlivosti pro podíl (1) populace: podíl prvků s danou vlastností je to pravděpodobnost, že vlastnost má

náhodně vybraný prvek výběr: relativní četnost ve výběru relativní četnost je průměr nula-jedničkové

veličiny – pro velké n má přibližně normální rozdělení

nula-jedničková veličina má rozptyl (1- ) relativní četnost (=průměr) má rozptyl

n 1

Page 18: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

18

interval spolehlivosti pro podíl (2) střední chyba relativní četnosti je

odmocnina z jejího rozptylu, je tedy

pravděpodobnost neznáme, odhadneme pomocí relativní četnosti f

odtud 95% interval spolehlivosti pro

existuje přesnější (pracnější) metoda

n

1

96,1

1;96,1

1nff

fnff

f

Page 19: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

19

příklad: hody hrací kostkou odhadujeme pravděpodobnost šestky kostka A: n = 100, nA = 17, fA = 0,17

kostka B: n = 100, nB = 41, fB = 0,41

důležitý rozdíl: v prvním případě patří 1/6=0,167 do intervalu spolehlivosti, ve druhém případě nikoliv

24,0;10,096,1100

83,017,017,0;96,1

10083,017,0

17,0

51,0;31,096,1100

59,041,041,0;96,1

10059,041,0

41,0

Page 20: chování výběrového průměru

8. listopadu 2004 Statistika (D360P03Z) 6. předn.

20

proč testování hypotéz nelze bezpečně poznat, že kostka B je

falešná nebo že kostka A není falešná intervaly spolehlivosti vymezily rozmezí,

kde by skutečná pravděpodobnost šestky měla být, jejich spolehlivost je velká, ale omezená

znamená něco, když 1/6 neleží v 95% intervalu spolehlivosti?

musíme připustit, že jsme mohli mít smůlu, že se v našich pokusech náhodou realizovaly málo pravděpodobné možnosti, přestože k takové smůle dochází jen zřídka