24
Testování hypotéz 4. přednáška 6. 3. 2010

Testování hypotéz

Embed Size (px)

DESCRIPTION

Testování hypotéz. 4. přednáška 6. 3. 2010. Základní pojmy. Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo ne. Nulová hypotéza H 0 Hypotéza, jejíž platnost ověřujeme. Značíme je H 0. - PowerPoint PPT Presentation

Citation preview

Testování hypotéz

4. přednáška6. 3. 2010

Základní pojmy• Statistická hypotéza• Je tvrzení o vlastnostech základního souboru, • o jehož pravdivosti se chceme přesvědčit.• Předem nevíme, zda je pravdivé nebo ne.

• Nulová hypotéza H0 • Hypotéza, jejíž platnost ověřujeme.• Značíme je H0.

• Alternativní hypotéza H1Říká, co bude platit,

• když nebude platit nulová hypotéza H0.• Říkáme, že testujeme H0 proti H1.

Základní pojmy

Testy jednostranné a dvoustranné záleží na formulaci alternativní hypotézy

Nulová hypotéza H0: A = B

Dvourstranná H1:

Jednostranná H1:

H1:

Základní pojmy• Statistický test• Jednoznačné pravidlo, • které určuje podmínky, za kterých hypotézu H0

– zamítneme nebo nezamítneme.

• Testovací kritérium (Z)• Je funkce náhodného výběru, • jejíž tvar je závislý na:

– testované hypotéze a – rozdělení pravděpodobností základního souboru.

• Kritická oblasti (KO)• Je množina hodnot testovacího kritéria, které neptaří do oblasti přípustných

hodnot.

• Oblast přípustných hodnot (OPH)• Je množina hodnot testovacího kritéria, které nepatří do kritické oblasti.

Základní pojmy• Kritická hranice (KH)• Odděluje kritickou oblast od oblasti přípustných hodnot.• • Hladina významnosti testu• Je pravděpodobnost kritické oblasti • Postup testování hypotézy1. získání údajů (například měřením),2. stanovení statistického testu s příslušnou kritickou oblastí,3. dosazení údajů do vzorce testovacího kritéria a výpočet hodnoty

testovacího kritéria Z4. zjistíme, kam padla hodnota testovacího kritéria:5. zda do kritické oblasti nebo6. do oblasti přípustných hodnot.

Postup testování hypotéz1. získání údajů (například měřením),

2. stanovení statistického testu s příslušnou kritickou oblastí,

3. dosazení údajů do vzorce testovacího kritéria a výpočet hodnoty testovacího kritéria Z

4. zjistíme, kam padla hodnota testovacího kritéria:

– zda do kritické oblasti nebo= nulovou hypotézu zamítáme

– do oblasti přípustných hodnot.= nulovou hypotézu nezamítáme

Postup testování hypotéz• Pokud Z KO ……… hypotéza H0 se

zamítáŘíkáme: pokud hodnota testovacího kritéria padne do kritické oblasti, hypotézu H0 zamítáme.

• Pokud Z KO ……… hypotéza H0 se nezamítá

Říkáme: pokud hodnota testovacího kritéria padne oblasti přípustných hodnot, hypotézu H0 nezamítáme.

Dělení testů hypotéz podle toho zda známe RP

• Parametrické testy– Rozdělení pravděpodobností základního souboru je

známé.

– Testování se týká pouze hodnot parametrů.

– Jsou spojovány s testováním parametrů normálního rozdělení pravděpodobností.

• Neparametrické testy– Neznáme rozdělení pravděpodobností

Dělení testů hypotéz• Testy významnosti

Rozdělení pravděpodobností je známé.Testované hypotézy se týkají pouze parametrů základního souboru.– Jednovýb. testy významnosti pro střední hodnotu N-RP

• Známe δ,• Neznáme δ.

– Jednovýb. Testy významnosti pro rozptyl • Testy shody

Týkají se typu rozdělení pravděpodobností základního souboru.

Test pro střední hodnotu pokud: známe δ a soubor má normální RP

• Testovací kritérium

• = aritmetický průměr náhodného výběru• n = rozsah náhodného výběru• k = střední hodnota (konstanta)• δ = směrodatná odchylka náhodného výběru

Test pro střední hodnotu pokud: známe δ a soubor má normální RP

• Kritická oblasta) dvoustranná alternativní hypotéza H0: EX= k proti H1: EX k

W =

Příklad Podle jízdního řádu je jízdní doba nedělního posilového spoje číslo 13 mezi

Strakonicemi a Prahou 100 minut. Po deset neděl byl sledován příjezd tohoto spoje do Prahy a za předpokladu,

že autobus vyjel ze Strakonic včas, byly zaznamenány tyto jízdní doby:

Na hladině významnosti testujete, zda jízdní doba uvedená v jízdním řádu odpovídá skutečnosti, jestliže víte, že hodnoty pocházejí ze základního souboru s normálním rozložením pravděpodobností se směrodatnou odchylkou δ = 10,3.

Datum 7.3. 14.3. 21.3. 28.3 4.4. 11.4. 18.4. 25.4. 2.5. 9.5.

Doba 90 112 103 86 98 100 120 89 95 100

Test pro střední hodnotu pokud: neznáme δ, studentovo RP

• Testovací kritérium

• = aritmetický průměr náhodného výběru• n = rozsah náhodného výběru• k = střední hodnota (konstanta)• s = směrodatná odchylka náhodného výběru

(musí se dopočítat)

Test pro střední hodnotu pokud: neznáme δ, studentovo RP

• Kritická oblasta) dvoustranná alternativní hypotéza H0: EX= k proti H1: EX k

W =

Příklad

10 majitelů vozů Škoda Octavia sledovalo spotřebu paliva, hodnoty jejich měření jsou uvedeny v tabulce. Výrobce udává průměrnou spotřebu tohoto typu automobilu Octavita 8,9 l/100km. Předpokládejme, že spotřeba má normální rozdělení pravděpodobnosti.

• a) Otestuje na hladině významnosti 0,05, zda se liší spotřeba naměřená majiteli vozů od střední hodnoty dané výrobcem.

• b) Otestujte na hladině významnosti 0,05, zda je spotřeba naměřená

majiteli vozů významně vyšší než hodnota udaná výrobcem.

•Majitel 1 2 3 4 5 6 7 8 9 10

Spotř. 10,0 9,3 8,8 9,0 8,85 9,05 9,05 8,9 8,95 10,2

Test pro rozptyl

• Testovací kritérium

• = rozptyl daný v zadání• = výběrový rozptyl

Test pro rozptyl

• Kritická oblasta) dvoustranná alternativní hypotéza H0: DX= k2 proti H1: DX k2

W =

Příklad

• Automat vyrábí pístové kroužky o daném průměru. Výrobce udává, že směrodatná odchylka průměru kroužků je 0,05 mm. K ověření této informace bylo vybráno náhodně 80 kroužků a vypočtena směrodatná odchylka jejich průměru s = 0,04 mm.

• Lze tento rozdíl považovat za významný?

• Na 5% hladině významnosti testujte hypotézu, že směrodatná odchylka průměru kroužků je rovna 0,05 mm.