51
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ HELENA KOUTKOVÁ PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA MODUL GA03 M3 ZÁKLADY TEORIE ODHADU STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMY S KOMBINOVANOU FORMOU STUDIA

PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚFAKULTA STAVEBNÍ

HELENA KOUTKOVÁ

PRAVDĚPODOBNOSTA MATEMATICKÁ

STATISTIKAMODUL GA03 M3

ZÁKLADY TEORIE ODHADU

STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMYS KOMBINOVANOU FORMOU STUDIA

Page 2: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

c© Helena Koutková, Brno 2004

Page 3: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

Obsah

Úvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4Označení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1 Náhodný výběr a statistiky 61.1 Náhodný výběr . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.1.1 Rozdělení četností a jejich znázornění . . . . . . . . . . . 91.2 Statistiky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.3 Kontrolní otázky . . . . . . . . . . . . . . . . . . . . . . . . . . 151.4 Cvičení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.5 Klíč a výsledky cvičení . . . . . . . . . . . . . . . . . . . . . . . 17

2 Bodový odhad 182.1 Vlastnosti odhadů . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.1.1 Nestranný odhad . . . . . . . . . . . . . . . . . . . . . . 202.1.2 Nejlepší nestranný odhad . . . . . . . . . . . . . . . . . . 212.1.3 Střední kvadratická chyba . . . . . . . . . . . . . . . . . 222.1.4 Konzistentní odhad . . . . . . . . . . . . . . . . . . . . . 23

2.2 Kontrolní otázky . . . . . . . . . . . . . . . . . . . . . . . . . . 262.3 Cvičení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.4 Klíč a výsledky cvičení . . . . . . . . . . . . . . . . . . . . . . . 27

3 Intervalový odhad 283.1 Intervalové odhady parametrů normálního rozdělení . . . . . . . 30

3.1.1 Intervalový odhad střední hodnoty . . . . . . . . . . . . 333.1.2 Intervalový odhad rozptylu . . . . . . . . . . . . . . . . . 40

3.2 Kontrolní otázky . . . . . . . . . . . . . . . . . . . . . . . . . . 433.3 Cvičení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443.4 Klíč a výsledky cvičení . . . . . . . . . . . . . . . . . . . . . . . 45

A Tabulky 46

Literatura 51

Page 4: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

ÚvodV tomto modulu se seznámíte se základy teorie odhadu, která je částí ma-tematické statistiky. V teorii pravděpodobnosti jste předpokládali, že máte onáhodné veličině z pravděpodobnostního hlediska úplnou informaci, tj. předpo-kládali jste, že znáte rozdělení pravděpodobnosti náhodné veličiny a zabývalijste se studiem jeho vlastností. Úlohou teorie odhadu je určit (odhadnout)rozdělení sledované náhodné veličiny, a to na základě jejích napozorovanýchhodnot. Známe-li typ rozdělení náhodné veličiny, omezuje se úloha teorie od-hadu na určení (odhad) parametrů nebo určitých funkcí parametrů tohoto typurozdělení.

Modul je rozdělen na tři kapitoly. V kapitole 2 a 3 předpokládáme, že jeznám typ rozdělení náhodné veličiny.

Kapitola 1 je určena k zavední základních pojmů, ze kterých vychází nejenteorie odhadu, ale celá matematická statistika. Dozvíte se, jaké napozo-rované hodnoty sledované veličiny máme na mysli a jakým způsobem lzetyto hodnoty popsat.

Kapitola 2 je věnována bodovému odhadu a jeho vlastnostem. Ze zjištěnýchhodnot náhodné veličiny budeme chtít vypočítat jediné číslo, které bu-deme považovat za odhad parametru nebo funkce parametrů rozdělenítéto náhodné veličiny. Samozřejmě budeme požadovat, aby tento odhadměl nějaké rozumné vlastnosti.

Kapitola 3 je věnována kvalitativně vyššímu typu odhadu. Zde budeme hle-dat interval, který bude s předem danou vysokou pravděpodobností ob-sahovat skutečnou hodnotu parametru nebo funkce parametrů rozdělení.V tomto případě budeme hovořit o intervalovém odhadu.

V jednotlivých kapitolách jsou řešené příklady bezprostředně navazující naprobírané učivo. Na konci každé kapitoly jsou uvedeny podkapitoly Kontrolníotázky, Cvičení a Klíč a výsledky cvičení. Pro další procvičení látky probíranév tomto a následujícím modulu autorka doporučuje literaturu [9].

Požadované znalostiPro studium a pochopení tohoto modulu potřebujete znát základy teorie prav-děpodobnosti a to především pojmy: náhodná veličina a vektor, obor hod-not náhodné veličiny a vektoru, pravděpodobnost, rozdělení pravděpodobnosti,rozdělovací funkce - hustota a pravděpodobnostní funkce, distribuční funkce,střední hodnota, rozptyl, směrodatná odchylka a kvantil rozdělení, nezávislostnáhodných veličin. Dále byste měli znát základní informace o následujících ty-pech rozdělení: normálním rozdělení s parametry µ a σ2, t-rozdělení s n stupnivolnosti a χ2- rozdělení s n stupni volnosti (včetně tvarů jejich grafů), alter-nativním rozdělení s parametrem p, Poissonově rozdělení s parametrem λ.

Autorka děkuje RNDr. Marii Budíkové, Dr. z PřF MU v Brně a svémukolegovi RNDr. Oldřichu Dlouhému za přečtení textu a cenné připomínky.

Page 5: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

Označení

R množina reálných číselA1 × A2 × · · · × An ∗ kartézský součin množin A1, A2, . . . , An

An A× A× · · · × A︸ ︷︷ ︸

n−krátexp(x) ex

E(X) střední hodnota náhodné veličiny XD(X) rozptyl náhodné veličiny Xx(α) 100 α procentní kvantil náhodné veličiny XN(µ, σ2) normální rozdělení s parametry µ, σ2

Φ distribuční funkce N(0, 1)ϕ hustota N(0, 1)u(α) 100 α procentní kvantil N(0, 1)χ2(n) χ2 - rozdělení [Pearsonovo rozdělení] s n stupni

volnostiχ2(n; α) 100 α procentní kvantil χ2(n)t(n) t - rozdělení [Studentovo rozdělení] s n stupni

volnostit(n; α) 100 α procentní kvantil t(n)

∗ Kartézský součin množin

Jsou-li A1, A2, . . . , An libovolné neprázdné množiny, potom A1×A2×· · ·×Anje množina, jejíž prvky jsou všechny možné n-tice vytvořené tak, že první členn-tice je prvek množiny A1, druhý člen n-tice je prvek množiny A2, . . ., n-týčlen n-tice je prvek množiny An. Zapsáno formálně

A1 ×A2 × · · · ×An =

(a1, a2, . . . , an); a1 ∈ A1, a2 ∈ A2, . . . an ∈ An

.

Např.〈0, 1〉 × 〈0, 2〉 =

(x, y); x ∈ 〈0, 1〉 , y ∈ 〈0, 2〉

.

∗ Disjunktní množiny

Množiny A1, A2, . . . , An se nazývají disjunktní, jestliže každé dvě různé mno-žiny nemají společné prvky, tj. jestliže

Ai ∩Aj = ∅ pro každé i 6= j; i, j = 1, 2, . . . n.

Např. množiny(−∞, 1〉 , (1, 2〉 , (2, 3〉

jsou disjunktní a množiny

(−∞, 1〉 , 〈1, 2〉 , (2, 3〉

nejsou disjunktní.

Page 6: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

Kapitola 1

Náhodný výběr a statistiky

CílePo přečtení a nastudování této kapitoly budete:

• znát, co je náhodný výběr z rozdělení X a jeho realizace;

• umět realizaci náhodného výběru z X roztřídit do tříd tak, aby byla pře-hlednější. Dále pak stanovit četnosti těchto tříd a znázornit je graficky;

• vědět, co to je statistika a naučíte se počítat nejjednodušší výběrovécharakteristiky - výběrový průměr, rozptyl a směrodatnou odchylku.

Doba potřebná ke studiuK nastudování a pochopení této kapitoly byste měli potřebovat asi 3 hodiny.

Klíčová slovaNáhodný výběr a jeho realizace, rozsah výběru, rozdělení četností, úsečkovýdiagram, histogram, statistika, výběrový průměr, výběrový rozptyl, výběrovásměrodatná odchylka.

1.1 Náhodný výběrV praxi nebývá rozdělení náhodné veličiny jako je např. hmotnost dávky, pev-nost materiálu, životnost výrobku, počet vozidel čekajících na „zelenouÿ apod.známé. Abychom o něm získali další informace, budeme opakovat pokus (mě-ření, pozorování), jehož neznámým výsledkem je sledovaná náhodná veličina.Tak např. pro zjištění hmotnosti dávky z konkrétního dávkovače, který pracujeza ustálených provozních podmínek, náhodně vybereme n dávek (tj. tak, abykaždá dávka měla stejnou pravděpodobnost, že bude zahrnuta do výběru) azvážíme je. Při zjišťování krychelné pevnosti betonu vyrobeného na určité be-tonárce za daných podmínek budeme měřit pevnost na n zkušebních kostkáchz téhož betonu.

Budeme tedy obecně n-krát opakovat pokus, ve kterém pozorujeme sledo-vanou náhodnou veličinu. Uvědomme si, že před tím, než pokus provedeme

Page 7: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

1.1 Náhodný výběr 7

a zapíšeme výsledek, je výsledek pokusu náhodná veličina s určitým typemrozdělení. Když pokus zrealizujeme a zapíšeme výsledek, dostaneme konkrétníčíselnou hodnotu (tj. realizaci) této náhodné veličiny.

Pokusme se nyní naše úvahy o opakování pokusu upřesnit.Uvažujme náhodný pokus, jehož neznámým výsledkem je náhodná veličinaX s určitým typem rozdělení pravděpodobnosti a uvažujme n (n ≥ 1) ne-závislých opakování tohoto pokusu. Označme pro i = 1, 2 . . . , n jako Xi ne-známý výsledek i-tého opakování pokusu. Dostaneme náhodný vektor XXX =(X1, X2, . . . , Xn), jehož složky X1, X2, . . . , Xn jsou nezávislé náhodné veličiny.Jestliže během celého experimentu, tj. během n opakování pokusu, nedojde kezměně podmínek, které pokus definují, budou mít složky X1, X2, . . . , Xn ná-hodného vektoru XXX stejné rozdělení jako veličina X. Náhodný vektor s těmitodvěmi vlastnostmi nazýváme náhodný výběr z rozdělení X o rozsahun, někdy pak stručněji náhodný výběr z daného rozdělení nebo náhodný vý-běr z X. Provedeme-li celý experiment a zapíšeme výsledek, dostaneme n-ticireálných čísel (x1, x2, . . . , xn) - tzv. realizaci náhodného výběru. Tedy xi

je známý výsledek i-tého opakování pokusu (i = 1, . . . , n). Množinu všechmožných realizací náhodného výběru, tj. množinu všech možných hodnot ná-hodného vektoru XXX, nazýváme výběrový prostor a značíme V .

Je-li Ω obor hodnot náhodné veličiny X a je-li (X1, X2, . . . , Xn) náhodnývýběr z X, potom výběrový prostor je množina Ωn.

Příklad 1.1:Označme X neznámý výsledek měření vzálenosti d konkrétním měřicím pří-strojem, který nevykazuje systematickou chybu (tj. náhodné chyby měřeníkolísají okolo nuly). Změříme-li n-krát tuto vzdálenost za stejných podmí-nek (tj. nestane-li se nic, co by ovlivnilo „kvalituÿ měřicího přístroje) azapíšeme výsledek, dostaneme realizaci (x1, x2, . . . , xn) náhodného výběru(X1, X2, . . . , Xn) z X.

Příklad 1.2:Označme V počet vozidel, které projedou konkrétním místem dálnice mezisedmou a osmou hodinou ranní pracovního dne zimního období. Jestližeběhem n dní, které vyhovují výše uvedeným podmínkám, budeme na danémmístě dálnice pozorovat počet projíždějících vozidel a zapisovat výsledky,dostaneme realizaci náhodného výběru z V o rozsahu n. Všimněte si všechvyjmenovaných podmínek! Spojit např. pozorování v zimním a letním obdobíza jinak stejných výše uvedených podmínek, by znamenalo porušení stálostipodmínek. Pozorování by byla sice nezávislá, ale neměla by stejné rozdělení,protože charakter provozu je v zimě jiný než v létě. Jednalo by se o dvanáhodné výběry z téhož typu rozdělení ale s různými hodnotymi parametrů.

Z realizace náhodného výběru můžeme vypočítat průměrnou hodnotu, zjis-tit minimální a maximální hodnotu a různým jiným způsobem realizaci popsat.Takto pracuje popisná statistika. Budeme-li chtít např. v příkladě 1.1 odhad-nout skutečnou vzdálenost d, měl by asi každý tendenci za odhad vzít právěprůměrnou hodnotu měření, tj. číslo x = 1

n

∑ni=1 xi. Provedeme-li ale celý

Page 8: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

8 Náhodný výběr a statistiky

experiment znovu, tj. znovu n-krát změříme vzdálenost d, dostaneme jinourealizaci náhodného výběru a tedy i jinou hodnotu průměru. Vidíme tedy, žei sám průměr je náhodná veličina, jejíž realizace kolísají od jednoho výběruk druhému. Před provedením experimentu pak můžeme odhad d psát ve tvaruX = 1

n

∑ni=1 Xi , tj. jako funkci náhodného výběru - takovou funkci budeme

nazývat statistikou. Při našem odhadování se můžeme dopustit chyby, jejíž ve-likost lze vyjádřit jako vzdálenost průměru od měřené vzdálenosti d. Chceme-linapř. zjistit, zda je námi zvolený odhad nejlepším možným odhadem (viz ka-pitola 2), nebo ohodnotit přesnost a spolehlivost odhadu (viz kapitola 3), tj.stanovit hranice, které chyba odhadu nepřekročí s vysokou pravděpodobností,musíme využít teorii pravděpodobnosti. K tomu potřebujeme obecně znát typrozdělení, z něchož výběr pochází. V našem případě je známo, že se jedná o ná-hodný výběr z rozdělení N(µ, σ2), kde µ = d je skutečná vzdálenost a rozptylσ2 charakterizuje přesnost měřícího přístroje. Chtěli jsme tedy ve skutečnostiodhadnout parametr µ, tj. střední hodnotu normálního rozdělení.

Věnujme se ještě rozdělení náhodného výběru. Vzhledem k tomu, že jsousložky X1, X2, . . . , Xn náhodného výběru (X1, X2, . . . , Xn) z rozdělení X ne-závislé a mají stejné rozdělení jako veličina X, dostáváme:

Tvrzení 1.1: Rozdělení náhodného výběru

Má-li náhodná veličina X distribuční funkci G, potom má náhodný výběr(X1, X2, . . . , Xn) z X distribuční funkci

H(x1, x2, . . . , xn) = G(x1) ·G(x2) · . . . ·G(xn).

Má-li náhodná veličina X rozdělovací funkci g, potom má náhodný výběr(X1, X2, . . . , Xn) z X rozdělovací funkci

h(x1, x2, . . . , xn) = g(x1) · g(x2) · . . . · g(xn).

Odtud plyne:Známe-li typ rozdělení náhodné veličiny X, pak známe i typ rozdělení ná-

hodného výběru z X.Jestliže rozdělení náhodné veličiny X závisí na nějakých neznámých kon-

stantách (parametrech), pak na těchto parametrech závisí i rozdělení náhod-ného výběru z X.

Příklad 1.3:Určete rozdělovací funkci náhodného výběru (X1, X2, . . . , Xn) z normálníhorozdělení.Řešení : Hustota f náhodné veličiny X ∼ N(µ, σ2) je pro x ∈ R

f = f(x; µ, σ2) =1√2πσ

exp[

− 12σ2 (x− µ)2

]

,

kde (µ, σ2) ∈ (−∞,∞)× (0,∞) .

Page 9: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

1.1 Náhodný výběr 9

Obor hodnot Ω náhodné veličiny X je R. Je-li (X1, X2, . . . , Xn) náhodnývýběr z rozdělení X, potom je výběrový prostor množina Rn. Hustota s ná-hodného výběru (X1, X2, . . . , Xn) z X je pro (x1, x2, . . . , xn) ∈ Rn

s = s(x1, x2, . . . , xn; µ, σ2) = f(x1; µ, σ2) · f(x2; µ, σ2) · . . . · f(xn; µ, σ2)

=1

(√

2πσ)nexp

[

− 12σ2

[

(x1 − µ)2 + (x2 − µ)2 + · · ·+ (xn − µ)2]

]

,

kde (µ, σ2) ∈ (−∞,∞)× (0,∞).

1.1.1 Rozdělení četností a jejich znázorněníJe-li rozsah n realizace (x1, x2, . . . , xn) náhodného výběru z X velký, potompro větší přehlednost a další analýzu hodnoty x1, x2, . . . , xn roztřídíme do kdisjunktních tříd Ωj, j = 1, 2, . . . , k, a to zpravidla následovně:

1. Je-li mezi zjištěnými hodnotami jen malý počet navzájem různých hod-not, volíme každou hodnotu za třídu Ωj. Mluvíme o tzv. prostém tří-dění.

2. Je-li mezi zjištěnými hodnotami značně velký počet různých hodnot, vo-líme za třídy Ωj intervaly. Mluvíme o tzv. skupinovém třídění.

Toto třídění je subjektivní, i když existují určitá objektivní pravidla. Např.se doporučuje, aby počet k tříd byl 5−20 podle rozsahu výběru n nebo k .=

√n

nebo k .= 1 + 3.3 log10 n. Při skupinovém třídění se pak často doporučuje, aby:1. délka intervalů byla stejná;2. hranice a středy intervalů byly pokud možno zaokrouhlená čísla.Postup při třídění si ukážeme na příkladech, ale před tím zavedeme ještě

další pojmy.Označme

nj tzv. absolutní četnost j-té třídy Ωj, tj. počet výsledků,které padly do j-té třídy Ωj, pro j = 1, 2 . . . , k;

fj =nj

ntzv. relativní četnost j-té třídy Ωj, tj. podíl absolutní čet-nosti nj a rozsahu výběru n, pro j = 1, 2 . . . , k.

Relativní četnost fj aproximuje pravděpodobnost, že náhodná veličina X na-bude hodnoty z třídy Ωj pro j = 1, 2 . . . , k. Pro četnosti zřejmě platí

n1 + n2 + · · ·+ nk = n,

f1 + f2 + · · ·+ fk = 1.

Výsledky třídění shrnujeme do tzv. tabulky rozdělení četností, ve kteréjsou uvedeny třídy s příslušnými absolutními, resp. relativními četnostmi av případě skupinového třídění středy intervalů.

Page 10: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

10 Náhodný výběr a statistiky

Příklad 1.4:Při kontrole vytíženosti vjezdu do určité křižovatky byly zjištěny následujícípočty vozidel, čekajících ve frontě u semaforu:

5, 1, 2, 5, 2, 5, 9, 5, 2, 5, 2, 3, 4, 7, 4, 5, 1, 3, 8, 5, 2, 6, 5, 8, 6, 7, 4, 1,1, 4, 2, 3, 3, 3, 5, 6, 2, 4, 1, 3, 4, 5, 6, 4, 9, 6, 5, 2, 1, 6, 6, 2, 6, 2, 7, 6,7, 6, 3, 7, 3, 6, 1, 2, 4, 4, 3, 3, 5, 3, 5, 4, 6, 3, 3, 4, 3, 5, 3, 1, 1, 1, 4.

Setavte tabulku rozdělení četností počtu čekajících vozidel.Řešení: Označme X počet vozidel čekajících na zelenou. Máme k dispozicirealizaci (x1, x2, . . . , xn) náhodného výběru z diskrétního rozdělení o rozsahun = 83. Mezi zjištěnými hodnotami se vyskytují pouze celá čísla 1 až 9.Zvolme tato čísla za třídy Ωj (j = 1, 2, . . . , 9). Pro určení absolutních čet-ností tříd Ωj musíme zjistit, kolikrát se v realizaci vyskytlo číslo j. Bezvyužití výpočetní techniky postupujeme pomocí čárkovací metody tak, že po-stupně čteme hodnoty z realizace a každou z nich zařadíme do příslušné třídynapsáním čárky. Přitom píšeme vždy čtyři čárky svisle, každou pátou čárkoučtveřici přeškrtneme (u nás podtrhneme). Výsledky jsou uvedeny v tabulce1.1. Tento postup je pracný a asi by jej dnes již nikdo nepoužíval a pro tří-dění by použil např. EXCEL nebo nějaký statistický software. Seřadíme-linapř. v Excelu hodnoty realizace vzestupně, není již problém zjistit abso-lutní četnosti jednotlivých tříd. Navíc můžeme využít nabídku Nástroje −→Analýza dat −→ Histogram. Pomocí této nabídky získáme tabulku rozděleníabsolutních četností a tzv. histogram absolutních četností, o kterém budemehovořit později. Musíme ale zadat horní hranice tříd (u nás čísla 1 až 9).

Tabulka 1.1: Rozdělení četností počtu vozidel čekajících na zelenou

Počet Absolutní Relativnívozidel četnost četnost

j nj fj

1 |||| |||| 10 0.1205

2 |||| |||| | 11 0.1325

3 |||| |||| |||| 15 0.1807

4 |||| |||| || 12 0.1446

5 |||| |||| |||| 14 0.1687

6 |||| |||| || 12 0.1446

7 |||| 5 0.0602

8 || 2 0.0241

9 || 2 0.0241

Součet 83 1.0000

V případě skupinového třídění, tj. především v případě realizace náhod-ného výběru ze spojitého rozdělení, kdy za třídy Ωj volíme intervaly, můžemepostupovat např. následovně.

Page 11: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

1.1 Náhodný výběr 11

Z realizace (x1, x2, . . . , xn) náhodného výběru z X o rozsahu n zjistímenejmenší hodnotu xmin a největší hodnotu xmax. Zřejmě xi ∈ 〈xmin, xmax〉 prokaždé i = 1, 2, . . . , n. Interval 〈xmin, xmax〉 nazýváme variační obor realizace.Vhodně zvolíme interval 〈a, b〉 ⊃ 〈xmin, xmax〉. Interval 〈a, b〉 rozdělíme stejněvzdálenými body t0, t1, . . . , tk takovými, že a = t0 < t1 < · · · < tk = b na kpodintervalů Ωj = (tj−1, tj〉 stejné délky d = tj− tj−1 (j = 1, 2, . . . , k). Číslo tjse nazývá horní hranice třídy Ωj, číslo tj−1 se nazývá dolní hranice třídyΩj. Střed třídy Ωj značíme xj. Zřejmě xj = (tj−1 + tj)/2 pro j = 1, 2, . . . , k.

Příklad 1.5: oPři stavbě betonové konstrukce bylo odebráno 40 vzorků betonové směsi. Po28 dnech vykázaly kostky tuto krychelnou pevnost v MPa:

23.5, 28.0, 25.1, 30.8, 27.1, 29.3, 32.5, 33.8, 30.4, 26.2,30.8, 29.2, 30.9, 28.6, 27.5, 28.0, 31.2, 28.2, 30.7, 28.8,32.7, 29.0, 31.9, 25.4, 32.6, 27.4, 33.1, 29.6, 29.7, 30.3,26.8, 30.4, 25.6, 34.0, 34.8, 27.2, 31.5, 32.3, 29.7, 32.4.

Sestavte tabulku rozdělení četností pevnosti betonu.

Řešení: Náhodnou veličinou X je zde pevnost betonu. Máme k dispozicirealizaci (x1, x2, . . . , xn) náhodného výběru z X o rozsahu n = 40. Vzhledemk tomu, že se jedná o náhodný výběr ze spojitého rozdělení, roztřídíme rea-lizaci náhodného výběru do k intervalů Ωj = (tj−1, tj〉 (j = 1, . . . , k) stejnédélky d. Počet k intervalů zvolíme k .=

√n =

√40 .= 6. Nejprve zjistíme

nejmenší hodnotu xmin a největší hodnotu xmax. Dostaneme xmin = 23.5 axmax = 34.8. Zřejmě 〈23, 35〉 ⊃ 〈23.5, 34.8〉. Rozdělme interval 〈23, 35〉 došesti tříd. Potom pro délku d intervalů dostaneme d = 35−23

6 = 2. Výsledektřídění pak ukazuje tabulka 1.2.

Tabulka 1.2: Rozdělení četností pevnosti betonu

Pevnost Absolutní Relativní StředTřída betonu četnost četnost třídy

j (tj−1, tj〉 nj fj xj

Ω1 23− 25 1 0.025 24

Ω2 25− 27 5 0.125 26

Ω3 27− 29 10 0.250 28

Ω4 29− 31 12 0.300 30

Ω5 31− 33 8 0.200 32

Ω6 33− 35 4 0.100 34

Součet 40 1.000

Názornější než tabulka rozdělení četností je grafické zobrazení četností,které samozřejmě z této tabulky vychází. Zmíníme se zde pouze o úsečkovémdiagramu rozdělení četností a histogramu rozdělení četností.

Page 12: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

12 Náhodný výběr a statistiky

Připomeňme, že jsme v případě skupinového třídění označili střed j-té třídyΩj jako xj. V případě prostého třídění je xj přímo roven j-té nejmenší zjištěnéhodnotě.

Úsečkový diagram rozdělení absolutních, popř. relativních četností do-staneme tak, že na osu x zobrazíme středy jednotlivých tříd xj a v každémz nich sestrojíme úsečku v kladném směru osy y o délce rovné příslušné abso-lutní, resp. relativní četnosti, tj. nj, resp. fj.

V případě skupinového třídění používáme častěji histogram rozdělení ab-solutních, resp. relativních četností. Dostaneme jej tak, že na osu x vynášímeopět středy jednotlivých tříd xj a nad každou úsečkou zobrazující třídu Ωj

sestrojíme obdélník o výšce rovné příslušné absolutní, resp. realitvní četnosti,tj. nj, resp. fj. Horní obrys obdélníků pak nazýváme histogram relativních,resp. absolutních četností.

Příklad 1.6:Sestrojte úsečkový diagram rozdělení absolutních četností v příkladu 1.4 ahistogram rozdělení relativních četností v příkladu 1.5.Řešení: Výsledné grafy jsou na obrázku 1.1 a na obrázku 1.2.

Obrázek 1.1: Úsečkový diagram rozdělení absolutníchčetností počtu vozidel čekajících na zelenou

Obrázek 1.2: Histogram rozdělení relativních četností pevnosti betonu

Page 13: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

1.2 Statistiky 13

Histogram (resp. úsečkový diagram) relativních a absolutních četností majístejný tvar a aproximují tvar rozdělovací funkce náhodné veličiny X.

1.2 StatistikyV předchozích příkladech jsme naznačili, že kromě náhodného výběru budouhrát v teorii odhadu důležitou roli tzv. statistiky, tj. funkce náhodného výběru.Pomocí nich se snažíme z náhodného výběru získat nějaké další informace.Upřesněme nyní tento pojem z matematického hlediska.

Definice 1.1: Statistika

Je-li (X1, X2, . . . , Xn) náhodný výběr z rozdělení X, V výběrový prostor aT (x1, x2, . . . , xn) reálná funkce n reálných proměnných definovaná na výbě-rovém prostoru V , potom se náhodná veličina

T = T (X1, X2, . . . , Xn)

nazývá statistika. Dosadíme-li do statistiky T realizaci (x1, x2, . . . , xn) ná-hodného výběru z X, dostaneme číslo

t = T (x1, x2, . . . , xn),

tzv. realizaci statistiky.

S příklady realizací statistik jste se již setkali při třídění. Najděte alespoňčtyři!

K nejčastěji používaným statistikám patří tzv. výběrové charakteris-tiky, které - jak poznáme později - používáme pro odhad číselných charakte-ristik náhodných veličin. Nejpoužívanějšími výběrovými charakteristikami jsou

X =1n

n∑

i=1

Xi tzv. výběrový průměr ; (1.1)

S2 =1

n− 1

n∑

i=1

(Xi −X)2 tzv. výběrový rozptyl . (1.2)

Statistika S =√

S2 se nazývá výběrová směrodatná odchylka. Vý-hodou výběrové směrodatné odchylky je, že má stejné jednotky jako měřenáveličina.

Je-li (x1, x2, . . . , xn) realizace náhodného výběru z X, pak ze vztahů (1.1)a (1.2) lze usuzovat, že x je mírou polohy (těžištěm) hodnot x1, x2, . . . , xn, s2

a s jsou mírami rozptýlenosti těchto hodnot okolo x. Čím jsou realizace s2 atedy i s větší, tím jsou hodnoty x1, x2, . . . , xn rozptýlenější.

Uvědomme si, že střední hodnota E(X), resp. rozptyl D(X) a směrodatnáodchylka

D(X) náhodné veličiny X, které patří k charakteristikám polohy,

Page 14: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

14 Náhodný výběr a statistiky

resp. rozptýlenosti náhodné veličiny X, jsou konstantami. Na rozdíl od nichjsou výběrové charakteristiky X, S2 a S náhodné veličiny. Pro konkrétní re-alizaci (x1, x2, . . . , xn) náhodného výběru z X dostaneme konkrétní realizace(hodnoty) x a s2 statistik X a S2. Pro jinou realizaci náhodného výběru z téhožrozdělení dostaneme jiné hodnoty statistik X a S2.

∇ Výpočet realizací x a s2 statistik X a S2

Při výpočtu realizací x a s2 statistik X a S2 můžeme postupovat následovně:1. Dosadíme realizaci (x1, x2, . . . , xn) náhodného výběru z X do vztahů

(1.1) a (1.2).2. Pro výpočet realizací x a s2 lze použít jakýkoliv statistický software

nebo EXCEL bez dosazování do vzorcu. Na nižší úrovni pak kalkulačky, kteréumožňují statistické výpočty. Realizaci x spočítáme pomocí programu na vý-počet x. Na některých kalkulačkách se vyskytuje dvojice s a σ, na některýchσn−1 a σn. Platí pro ně následující vztahy

s = σn−1 =

1n− 1

n∑

i=1

(xi − x)2,

σ = σn =

1n

n∑

i=1

(xi − x)2 (= +√

m).

O statistice M = 1n

∑ni=1(Xi −X)2 budeme mluvit v následující kapitole.

3. Při výpočtu realizací výběrového průměru a výběrového rozptylu v pří-padě realizace (x1, x2, . . . , xn) náhodného výběru z X roztříděného do k třídΩj (j = 1, 2, . . . , k) postupujeme tak, že hodnoty, které padly do j-té třídynahradíme středem xj této třídy. Potom

x =1n

n∑

i=1

xi.=

1n

k∑

j=1

njxj, (1.3)

s2 =1

n− 1

n∑

i=1

(xi − x)2 .=1

n− 1

k∑

j=1

nj(xj − x)2, (1.4)

Příklad 1.7:Při měření veličiny konstantní délky byly zjištěny následující chyby měřenív mm:

1, −2, −1, 0, 1, 2, −1, −1, 1, −1.Určete realizace x a s2.

Řešení: Náhodnou veličinou X je zde náhodná chyba měření. K dispozicimáme realizaci náhodného výběru z X o rozsahu n = 10. Podle vztahů (1.1)

Page 15: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

1.3 Kontrolní otázky 15

a (1.2) dostaneme

x =110

10∑

i=1

xi =110

(x1 + x2 + · · ·+ x10) = −0.10 [mm],

s2 =19

10∑

i=1

(xi + 0.1)2 =19

[(x1 + 0.1)2 + · · ·+ (x10 + 0.1)2] .= 1.66 [mm2].

Přímo (tj. bez dosazování) s využitím kalkulačky

x = −0.10 [mm],s = σn−1

.= 1.29 [mm] ⇒ s2 .= 1.66 [mm2].

Příklad 1.8:Vypočtěte realizaci výběrového průměru a výběrové směrodatné odchylkyv příkladě 1.5.

Řešení: V příkladě 1.5 jsmě měli realizaci (x1, x2, . . . , xn) o rozsahu n =40. Tuto realizaci jsme roztřídíli do k = 6 tříd. Podle vztahů (1.3) a (1.4)dostaneme

x .=140

6∑

j=1

njxj =140

(1 · 24 + 5 · 26 + · · ·+ 4 · 34) = 29.650 [MPa],

s2 .=139

6∑

j=1

nj(xj − 29.65)2 =139

[1(24− 29.65)2 + · · ·+ 4(34− 29.65)2)]

.= 6.336 [MPa2] ⇒ σ = s .= 2.517 [MPa].

Stejně jako v předchozím příkladě můžeme využít statistické výpočty na kal-kulačce. Hodnotu xj uložíme nj-krát na většině kalkulaček tak, že xj × nj

uložíme pomocí nabídky DATA.

1.3 Kontrolní otázky

1. Jaké vlastnosti musí mít složky náhodného výběru z rozdělení X?

2. Uveďte příklad náhodného výběru ze spojitého a diskrétního rozdělení.

3. Jak postupujeme při třídění realizace náhodného výběru z X?

4. Co jsou relativní a absolutní četnosti a jaké vlastnosti pro ně platí?

5. Co to je statistika?

6. Jak je definován a co udává výběrový průměr, rozptyl a směrodatná od-chylka?

Page 16: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

16 Náhodný výběr a statistiky

1.4 Cvičení1. Mezi deseti výrobky je jeden vadný. Z těchto výrobků náhodně vybereme

dva. Označme Xi počet vadných výrobků v i-tém tahu (i = 1, 2).

a) Výběr provádíme tak, že výrobek po vytažení a zjištění, zda je vadný,vrátíme zpět, takže může být opět vybrán.

b) Výběr provádíme tak, že výrobky nevracíme zpět.

Jaké rozdělení budou mít veličiny X1 a X2? Je (X1, X2) náhodný výběr?

2. (Pro zájemce.) Uvažujme velkou dodávku N výrobků, z nichž je M vad-ných. Předpokládejme, že z těchto N výrobků budeme náhodně vybíratn výrobků, kde n je relativně malé číslo vzhledem k N . Označme opětXi počet vadných výrobků v i-tém tahu (i = 1, . . . , n). Dejme tomu, žeN = 500 a n = 10. Lze v tomto případě při výběru bez vracení považovatnáhodný vektor (X1, . . . , X10) za náhodný výběr z rozdělení A(M/N)?

3. Průměr z pěti měření je 10. Jak se změní, když

a) jsme se spletli a místo výsledku 3 jsme zapsali výsledek 2;

b) získáme jako další výsledek číslo 1.

4. Předpokládejme, že (x1, . . . , xn) je realizace náhodného výběru z X.

a) Proč nemůže být h = 1n−1

∑ni=1(xi − x) mírou variability hodnot

x1, . . . , xn?

b) Ukažte, že platín∑

i=1(xi − x)2 =

n∑

i=1x2

i − nx2

a tedy s2 = 1n−1

( n∑

i=1x2

i − nx2)

.

5. Předpokládejme, že (X1, . . . , Xn) je náhodný výběr z X a náhodná ve-ličina Y vznikla lineární transformací náhodné veličiny X, tj. Y =aX + b, kde a, b ∈ R, a 6= 0. Ukažte, že

a) (Y1, . . . , Yn) = (aX1 + b, . . . , aXn + b) je náhodný výběr z Y ;

b) Y = aX + b, kde Y , resp. X je výběrový průměr příslušný veličiněY , resp. veličině X;

c) S2Y = a2S2

X , kde S2Y , resp. S2

X je výběrový rozptyl příslušný veličiněY , resp. veličině X.

6. Bylo odzkoušeno 10 náhodně vybraných ocelových tyčí k určení meze prů-tažnosti s těmito výsledky v MPa:

277, 280, 291, 263, 277, 286, 281, 305, 290, 291.

Vypočtěte realizaci výběrového průměru a výběrového rozptylu meze prů-tažnosti oceli.

Page 17: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

1.5 Klíč a výsledky cvičení 17

7. Určete realizaci výběrového průměru, rozptylu a směrodatné odchylkymnožství ročních srážek v mm v Brně v období 1981-2000:

718.5, 492.3, 431.5, 540.5, 514.7, 548.0, 385.0, 532.0, 531.0, 578.3,

551.9, 613.6, 476.0, 661.3, 518.0, 508.5, 488.7, 494.9, 544.6, 673.5.

8. Při zkouškách vlhkosti stavebního materiálu Hobrex byla změřena pro-centa vlhkosti u 100 vzorků. Výsledky jsou uvedeny v tabulce:

Třída Vlhkost v % nj Třída Vlhkost v % ni

1. 19.75 - 20.75 5 4. 22.75 - 23.75 202. 20.75 - 21.75 27 5. 23.75 - 24.75 23. 21.75 - 22.75 46

Určete realizaci výběrového průměru a směrodatné odchylky vlhkosti. Na-kreslete histogram rozdělení relativních četností.

9. Zvážením 50 součástek vyrobených za ustálených výrobních podmínekjsme dostali tyto výsledky (při měřicí jednotce gram)83, 85, 81, 82, 84, 82, 79, 84, 80, 81, 82, 82, 80, 82, 80, 82, 83, 84, 79, 79, 83,82, 83, 85, 82, 82, 81, 80, 82, 82, 83, 80, 82, 85, 81, 83, 81, 81, 83, 82, 81, 85,83, 79, 81, 85, 81, 84, 81, 82.

Sestavte tabulku rozdělení četností. Nakreslete úsečkový diagram a histo-gram relativních a absolutních četností. Vypočítejte realizaci výběrovéhoprůměru a výběrové směrodatné odchylky hmotnosti součástek.

1.5 Klíč a výsledky cvičení

Cvičení:1. V případě a) i b) budou mít obě náhodné veličiny alternativní rozdělení

s parametrem 1/10. V případě a) jsou veličiny nezávislé a jedná se onáhodný výběr z rozdělení A(1/10). V případě b) jsou závislé a nejednáse o náhodný výběr.

2. Ano - Veličiny X1, . . . , Xn mají rozdělení A(M/N). Navíc vybíráme-liz velkého počtu N relativně malý počet n, změní se podmínky zcela ne-patrně a veličiny X1, X2, . . . , Xn můžeme považovat za nezávislé.

3. a) x = 51/5; b) x = 51/6.

4. a) Protože h = 0.

6. x = 284.100 MPa, s2 .= 126.989 MPa2.

7. x = 540.140 mm, s2 .= 6347.592 mm2, s .= 79.672 mm.

8. x = 22.12%, s .= 0.86%.

9. Volíme-li 9 tříd o délce d = 1 se středy 79 až 85, dostaneme x =81.98 g, s .= 1.66 g.

Page 18: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

Kapitola 2

Bodový odhad

CílePo přečtení a nastudování této kapitoly budete:

• vědět, co to je bodový odhad parametrické funkce;

• znát některé důležité vlastnosti bodových odhadů a umět je posoudit.

Doba potřebná ke studiuPro zvládnutí této kapitoly budete potřebovat asi 3 hodiny studia.

Klíčová slovaBodový odhad, realizace bodového odhadu, nestranný odhad, nejlepší ne-stranný odhad, střední čtvercová chyba, konzistentní odhad.

V této a následující kapitole budeme předpokládat, že známe typ rozdě-lení (tzv. statistický model), ze kterého náhodný výběr pochází. Pokud ne-známe typ rozdělení, z něhož výběr pochází (v minulosti nebyly prováděnyexperimenty daného druhu a rozdělení nelze odvodit ani na základě teoretickéúvahy), vybíráme vhodný typ rozdělení např. na základě posouzení tvaru his-togramu rozdělení četností a další analýzy realizace náhodného výběru (vizposlední kapitola následujícího modulu). Je-li např. jako vhodný model rozdě-lení zvolen model normálního rozdělení, známe typ rozdělení obecně až na dvaparametry µ a σ2. Je-li jako vhodný model zvolen model Poissonova rozdělení,známe typ rozdělení až na jediný parametr λ. Budeme tedy předpokládat, žeznáme typ rozdělení sledované náhodné veličiny X až na m parametrů (ne-známých konstant), m ≥ 1. Tyto parametry budeme značit ϑ1, ϑ2, . . . , ϑm.Označme pro ϑϑϑ = (ϑ1, ϑ2, . . . , ϑm) jako ΘΘΘ množinu všech přípustných hodnotvektorového parametru ϑϑϑ, kterou nazýváme parametrický prostor.

Ke stanovení rozdělení pak stačí odhadnout parametry tohoto rozdělení.Někdy ale nemáme tak velké požadavky a zajímá nás pouze odhad ur-čité funkce parametrů rozdělení - např. střední hodnoty. Označme τ(ϑϑϑ) =τ(ϑ1, ϑ2, . . . , ϑm) určitou reálnou funkci vektorového parametru ϑϑϑ definovanouna parametrickém prostoru ΘΘΘ. Funkci τ(ϑϑϑ) nazýváme parametrická funkce.

Page 19: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

19

Protože parametr ϑi, tj. i-tá složka vektorového parametru ϑϑϑ, je speciálním pří-padem funkce τ(ϑϑϑ), budeme se zabývat odhadem funkce τ(ϑϑϑ).

Příklad 2.1:Při měření vzdálenosti konkrétním přístrojem, který nevykazuje systema-tickou chybu (tj. náhodné chyby kolísají okolo nuly), je výsledek pokusu Xnormální náhodná veličina s neznámou střední hodnotou µ - skutečnou vzdá-leností a (většinou) známým rozptylem σ2 (vyjadřujícím přesnost přístroje).Potom pro hustotu f náhodné veličiny X platí

f = f(x; µ) =1√2πσ

exp[

− 12σ2 (x− µ)2

]

pro x ∈ R,

kde µ ∈ (0,∞) . Známe tedy typ rozdělení až na jeden parametr µ, tj ϑϑϑ =ϑ1 = ϑ = µ, ΘΘΘ = (0,∞) .

Při měření neodzkoušeným přístrojem bude neznámý i rozptyl, potom

f = f(x; µ, σ2) =1√2πσ

exp[

− 12σ2 (x− µ)2

]

pro x ∈ R,

kde (µ, σ2) ∈ (0,∞)× (0,∞) . Známe typ rozdělení až na dva parametry µa σ2, tedy ϑϑϑ = (ϑ1, ϑ2) = (µ, σ2) a ΘΘΘ = (0,∞)× (0,∞) .

Příklady parametrických funkcí τ(ϑϑϑ) = τ(µ, σ2) jsou v případě N(µ, σ2)při obou neznámých parametrech funkce:

τ(µ, σ2) = µ střední hodnota rozdělení,τ(µ, σ2) = σ2 rozptyl rozdělení,τ(µ, σ2) = σ směrodatná odchylka rozdělení,τ(µ, σ2) = µ + u(α)σ 100α procentní kvantil rozdělení,τ(µ, σ2) = Φ((x− µ)/σ) hodnota distribuční funkce v bodě x.

Vraťme se zpět k našemu odhadování. Na základě realizace náhodného vý-běru (X1, X2, . . . , Xn) z X budeme chtít odhadnout skutečnou hodnotu para-metrické funkce τ(ϑϑϑ) pomocí jediného reálného čísla. Je tedy zřejmé, že tímtočíslem bude funkce realizace náhodného výběru z X, tj. realizace statistiky.

Definice 2.1: Bodový oddhad

Statistiku, kterou používáme pro odhad parametrické funkce τ(ϑϑϑ), budemenazývat (bodovým) odhadem funkce τ(ϑϑϑ) a její realizaci realizací (bo-dového) odhadu τ(ϑϑϑ).

Prakticky se snažíme za odhad τ(ϑϑϑ) volit takový odhad, tj. takovou statis-tiku, jejíž hodnoty v nějaké smyslu co nejlépe aproximují skutečnou hodnotuτ(ϑϑϑ). Chceme-li tedy, aby byl odhad kvalitní, měl by mít určité vlastnosti. Myse zde budeme zabývat pouze tzv. nestrannými, nejlepšími nestrannými a kon-zistentními odhady. Ideální by bylo, kdyby odhadová statistika měla všechnyvýše uvedené vlastnosti. Toho ale nelze běžně dosáhnout.

Pro hledání bodových odhadů existují různé metody, které zajišťují dobrévlastnosti odhadů (např. metoda maximální věrohodnosti), těmi se zde alezabývat nebudeme.

Page 20: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

20 Bodový odhad

2.1 Vlastnosti odhadů

2.1.1 Nestranný odhad

Uvědomme si, že odhad T parametrické funkce τ(ϑϑϑ) je náhodná veličina.V technické praxi nás samozřejmě zajímá číselná hodnota odhadu, tj. realizaceodhadu. Z každé realizace náhodného výběru můžeme obecně dostat jinou re-alizaci odhadu, tj. jinou číselnou hodnotu. Nejčastěji se vyskytuje požadavek,aby realizace t odhadu T parametrické funkce τ(ϑϑϑ) kolísaly okolo skutečné hod-noty této funkce, tj. aby byl odhad T funkce τ(ϑϑϑ) nestranný (nevychýlený).Uvědomíme-li si nyní, že realizace náhodné veličiny T kolísají okolo její středníhodnoty (pokud existuje), budeme požadovat, aby střední hodnota odhadu Tbyla rovna skutečné hodnotě parametrické funkce τ(ϑϑϑ). Protože neznáme sku-tečnou hodnotu vektorového parametru ϑϑϑ ∈ ΘΘΘ, budeme chtít, aby požadovanárovnost platila, ať je skutečná hodnota ϑϑϑ kdekoliv v ΘΘΘ, tj. pro každé ϑϑϑ ∈ ΘΘΘ.

Definice 2.2: Nestranný odhad

Řekneme, že statistika T je nestranným nebo nevychýleným odhademparametrické funkce τ(ϑϑϑ), když pro každé ϑϑϑ ∈ ΘΘΘ platí

E(T ) = τ(ϑϑϑ).

Neplatí-li tato rovnost, pak odhad nazýváme vychýleným a rozdíl B(ϑϑϑ) =E(T )− τ(ϑϑϑ) je vychýlení odhadu T .

Příklad 2.2:Předpokládejme, že je (X1, X2, . . . , Xn) náhodný výběr z rozdělení s koneč-nou střední hodnotou µ a konečným rozptylem σ2. Zjistěte, zda je výběrovýprůměr X nestranným odhadem µ a určete jeho rozptyl.Řešení: V tomto případě je τ(ϑϑϑ) = µ. Výběrový průměr X je nevychýlenýmodhadem střední hodnoty µ, když pro každé ϑϑϑ ∈ ΘΘΘ platí

E(X) = µ.

Protože náhodné veličiny X1, X2, . . . , Xn mají stejné rozdělení jako náhodnáveličina X, platí

E(Xi) = µ,D(Xi) = σ2 pro i = 1, 2, . . . , n.

Potom

E(X) = E( 1

n

n∑

i=1

Xi

)

=1n

n∑

i=1

E(Xi) =1n

n∑

i=1

µ = µ. (2.1)

Výběrový průměr X je nestranným odhadem střední hodnoty µ rozdělení,z něhož výběr pochází (ať známe nebo neznáme σ2).

Page 21: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

2.1 Vlastnosti odhadů 21

Vzhledem k tomu, že jsou veličiny X1, X2, . . . , Xn stochasticky nezávislé,je

D(X) = D( 1

n

n∑

i=1

Xi

)

=1n2

n∑

i=1

D(Xi) =1n2

n∑

i=1

σ2 =σ2

n. (2.2)

Rozptyl výběrového průměru klesá s rostoucím rozsahem n výběru.

Zabývejme se nyní další důležitou číselnou charakteristikou rozdělení X,z něhož výběr pochází. Podobně (jenom složitěji) jako v příkladu 2.2 lze ukázat,že pro výběrový rozptyl S2 platí E(S2) = σ2. Tedy statistika S2 je nestrannýmodhadem rozptylu σ2. Výběrová směrodatná odchylka S ale není nestrannýmodhadem směrodatné odchylky σ. Kdyby byla, muselo by platit

D(S2) = E(S2)− [E(S)]2 = σ2 − σ2 = 0,

což by znamenalo, že výběrový rozptyl S2 je konstantní.V případě, že známe střední hodnotu µ rozdělení X, ze kterého výběr po-

chází, nebudeme ji samozřejmě odhadovat a je škoda tuto informaci nevyužíti při odhadu rozptylu σ2. Označme

S20 =

1n

n∑

i=1

(Xi − µ)2.

Potom lze ukázat, že E(S20) = σ2. Tedy S2

0 je nestranným odhadem rozptyluσ2 v případě známé střední hodnoty µ.

Vraťme se ještě ke statistice M = 1n

∑ni=1(Xi − X)2, o které jsme mluvili

v minulé kapitole. Zřejmě

M =n− 1

nS2 =⇒ E(M) =

n− 1n

E(S2) =n− 1

nσ2 = σ2 − 1

nσ2.

Statististika M je tedy vychýlený odhad rozptylu σ2.

2.1.2 Nejlepší nestranný odhadV některých případech lze najít více statistik, které jsou nestrannými odhadyfunkce τ(ϑϑϑ). Tak např. výběrový průměr X = 1

n

∑ni=1 Xi a náhodná veličina

X1 jsou nestranné odhady střední hodnoty µ rozdělení, z něhož výběr pochází.Přitom nejsou stejně vhodné. Nestrannost těchto odhadů sice zaručuje, že jejichrealizace kolísají okolo skutečné střední hodnoty µ, ale samozřejmě vhodnostnestranného odhadu µ závisí na tom, jaká je rozptýlenost jeho realizací okoloskutečné hodnoty µ. V našem případě máme D(X) = σ2

n a D(X1) = σ2.Výběrový průměr je tedy vhodnější odhad střední hodnoty µ (pro n > 1).

Existují-li nestranné odhady parametrické funkce τ(ϑϑϑ), pak samozřejmě bu-deme chtít použít ten nestranný odhad, který má ze všech nestranných odhadůparametrické funkce τ(ϑϑϑ) nejmenší rozptyl. Takový odhad (pokud existuje) bu-deme nazývat nejlepší nestranný odhad funkce τ(ϑϑϑ).

Page 22: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

22 Bodový odhad

Definice 2.3: Nejlepší nestranný odhad

Je-li T = T (X1, X2, . . . , Xn) nestranný odhad parametrické funkce τ(ϑϑϑ) ajestliže pro každý jiný nestranný odhad T ∗ = T ∗(X1, . . . , Xn) funkce τ(ϑϑϑ)platí

D(T ) ≤ D(T ∗) pro každé ϑϑϑ ∈ ΘΘΘ,

nazývá se statistika T nejlepší nestranný odhad funkce τ(ϑϑϑ).

2.1.3 Střední kvadratická chyba

Uvažujme nyní tři odhady T , U a V parametrické funkce τ(ϑϑϑ), jejichž hustotyh(t), g(u) a s(v) mají tvar jako na obrázku 2.1. V tomto případě vidíme, žeodhad T je sice nevychýlený, ale má příliš velký rozptyl. Odhad U má sicenejmenší rozptyl, ale je příliš vychýlený. Jako nejvhodnější se jeví odhad V ,který má nejlepší kombinaci malého vychýlení a malého rozptylu. Vidíme tedy,že dalším měřítkem kvality odhadu, by měl být ukazatel, který měří právětuto kombinaci. Tímto ukazatelem je, jak ukážeme, střední hodnota čtverceodchylky odhadu od skutečné hodnoty odhadované parametrické funkce.

Obrázek 2.1: Odhad V s nejlepší kombinací malého rozptýlenía malého vychýlení

Definice 2.4: Střední kvadratická chyba

Střední kvadratická chyba K(ϑϑϑ) odhadu T parametrické funkce τ(ϑϑϑ)je definována jako

K(ϑϑϑ) = E[T − τ(ϑϑϑ)]2.

Page 23: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

2.1 Vlastnosti odhadů 23

Protože platí

D(T ) = D[(T − τ(ϑϑϑ)] = E[T − τ(ϑϑϑ)]2 − E[T − τ(ϑϑϑ)]2

= K(ϑϑϑ)− [E(T )− τ(ϑϑϑ)]2

= K(ϑϑϑ)−B2(ϑϑϑ),

dostávámeK(ϑϑϑ) = D(T ) + B2(ϑϑϑ).

Kvadratická chyba odhadu je tedy rovna součtu rozptylu odhadu a čtverci vy-chýlení odhadu. Budeme-li dva odhady funkce τ(ϑϑϑ) posuzovat z hlediska K(ϑϑϑ)a vybereme ten, který má K(ϑϑϑ) menší, dostaneme ten, který má lepší kombi-naci rozptylu a vychýlení. Konkrétně ze dvou nevychýlených odhadů vyberemeten, který má menší rozptyl a ze dvou odhadů se stejným rozptylem vyberemeten, který má menší vychýlení. Je-li statistika T nestranným odhadem funkceτ(ϑϑϑ), je střední kvadratická chyba K(ϑϑϑ) = D(T ).

Lze ukázat, že pro střední kvadratickou chybu odhadů S2 a M rozptylu σ2

v případě výběru z normálního rozdělení platí:

E[(S2 − σ2)2] =2

n− 1σ4,

E[(M − σ2)2] =2n− 1

n2 σ4.

Protože platí 2n−1n2 < 2

n−1 , má statistika M menší střední kvadratickou chybunež statistika S2. Tedy každý z těchto odhadů je lepší v jiném smyslu.

2.1.4 Konzistentní odhadK další často požadované vlastnosti odhadu patří tzv. konzistence odhadu, tazhruba řečeno znamená, že čím větší bude rozsah výběru n, tím bude realizaceodhadu blíž ke skutečné hodnotě odhadované parametrické funkce. Abychomzdůraznili, že zpracováváme náhodný výběr o rozsahu n, budeme odhad značitTn místo T .

Definice 2.5: Konzistentní odhad

Odhad Tn parametrické funkce τ(ϑϑϑ) nazýváme konzistentní odhadfunkce τ(ϑϑϑ), jestliže pro každé ε > 0 a pro každé ϑϑϑ ∈ ΘΘΘ platí

limn→∞

P(

|Tn − τ(ϑϑϑ)| < ε)

= 1.

Zřejmě platí

P(

|Tn − τ(ϑϑϑ)| < ε)

= P(

τ(ϑϑϑ)− ε < Tn < τ(ϑϑϑ) + ε)

Je-li tedy Tn konzistentní odhad funkce τ(ϑϑϑ), potom s rostoucím rozsahemvýběru n roste pravděpodobnost, že tento odhad nabude hodnoty libovolněblízké skutečné hodnotě odhadované funkce τ(ϑϑϑ).

Ověření konzistence odhadu nám usnadní následující tvrzení.

Page 24: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

24 Bodový odhad

Tvrzení 2.1: Nutná podmínka konzistence

Odhad Tn parametrické funkce τ(ϑϑϑ) je konzistentní odhad funkce τ(ϑϑϑ),jestliže pro každé ϑϑϑ ∈ ΘΘΘ platí

limn→∞

E(Tn) = τ(ϑϑϑ), (2.3)

limn→∞

D(Tn) = 0. (2.4)

Vztah (2.3) je triviálně splněn pro nestranné odhady. Vztah (2.4) říká, že ses rostoucím n zužuje rozdělení odhadu Tn kolem skutečné hodnoty funkce τ(ϑϑϑ).

Příklad 2.3:Při stejných podmínkách jako v příkladu 2.2 zjistěte, zda je výběrový průměrX konzistentním odhadem střední hodnoty µ.Řešení: Označme

Tn = X =1n

n∑

i=1

Xi pro n = 1, 2, . . . .

Protože platí

E(Tn) = E(X) = µ, D(Tn) = D(X) =σ2

npro n = 1, 2, . . . ,

dostávámelim

n→∞E(Tn) = lim

n→∞E(X) = lim

n→∞µ = µ,

limn→∞

D(Tn) = limn→∞

D(X) = limn→∞

σ2

n= 0.

Tedy X je konzistentní odhad střední hodnoty µ.

Tuto kapitolu uzavřeme tvrzením, které shrnuje některé ukázané poznatkya některé další o odhadu střední hodnoty a rozptylu náhodné veličiny X.

Tvrzení 2.2: Odhady střední hodnoty a rozptylu

Pro náhodný výběr z rozdělení N(µ, σ2) platí:

1. Nejlepším nestranným a konzistentním odhadem střední hodnoty µ jevýběrový průměr X.

2. Nejlepším nestranným a konzistentním odhadem rozptylu σ2 je:

• výběrový rozptyl S2 v případě, že neznáme střední hodnotu µ;• statistika S2

0 v případě, že známe střední hodnotu µ.

Pro náhodný výběr z jiného rozdělení s konečnou střední hodnotou µ akonečným rozptylem σ2 jsou uvedené odhady nestranné a konzistentní.

Page 25: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

2.1 Vlastnosti odhadů 25

Pro odhad směrodatné odchylky běžně používáme statistiku S, resp. S0v případě, že neznáme, resp. známe střední hodnotu µ, i když se nejedná onestranné odhady.

Příklad 2.4:Vraťte se k příkladu 1.7 a odhadněte:

1. horní hranici náhodné chyby měření, které se můžeme dopustit s pravdě-podobností 0.95. Předpokládejte, že náhodná chyba měření má normálnírozdělení.

2. směrodatnou odchylku náhodné chyby měření, když víte, že měřicí přístojnevykazuje systematickou chybu.

Řešení: Náhodná veličina X v příkladě 1.7 je náhodná chyba měření. Před-pokládáme, že X ∼ N(µ, σ2).

1. Máme odhadnout konstantu k, pro kterou platí

P (X ≤ k) = 0.95.

Požadovanou pravděpodobnost vyjádříme pomocí normované náhodné veli-činy X, tj. pomocí náhodné veličiny U = X−µ

σ , která má rozdělení N(0, 1)Dostaneme

0.95 = P(X − µ

σ≤ k − µ

σ

)

= P(

U ≤ k − µσ

)

.

Číslo k−µσ je tedy 95 procentní kvantil veličiny U , tj. u(0.95). V tab A.3

najdeme u(0.95) = 1.645. Odtud

k − µσ

= 1.645 ⇒ k = µ + 1.645σ.

Odhad k horní hranice k pak dostaneme tak, že najdeme odhad µ středníhodnoty µ a odhad σ směrodatné odchylky σ. V příkladě 1.7 máme

µ = x = −0.10[mm], σ = s .= 1.29[mm].Potom

k = µ + 1.645σ .= 2.02[mm]Realizace odhadu horní hranice chyby měření, které se můžeme dopustits pravděpodobností 0.95, je 2.02 mm.

2. Realizace σ2 odhadu rozptylu σ2 v případě známé střední hodnoty µ je

σ2 = s20 =

1n

n∑

i=1

(xi − µ)2.

Protože přístroj nevykazuje systematické chyby, je µ = 0 a dostáváme tedy

σ2 = s20 =

110

10∑

i=1

x2i = 1.50 ⇒ σ = s0

.= 1.22[mm]

Realizace odhadu směrodatné odchylky chyby měření je 1.22 mm.

Page 26: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

26 Bodový odhad

2.2 Kontrolní otázky1. Vysvětlete, co si představujete pod pojmy: nestranný odhad, nejlepší ne-

stranný odhad, konzistentní odhad.

2. Jak je definována statistika S20? Můžete ji použít pro odhad rozptylu, když

neznáte střední hodnotu?

3. Rozhodněte, která z následujích tvrzení jsou pravdivá?

a) Je-li T nestranný odhad µ, potom E(µ) = T .

b) Máme-li dva nestranné odhady parametrické funkce τ(ϑϑϑ), lepší jeten, který má větší rozptyl.

c) Realizace výběrové směrodatné odchylky kolísají okolo skutečné hod-noty směrodatné odchylky rozdělení, ze kterého výběr pochází.

d) Střední hodnota rozdělení, ze kterého výběr pochází, je X.

e) Je-li odhad nestranný, pak je konzistentní.

2.3 Cvičení1. Předpokládejme, že (X1, X2, X3) je náhodný výběr z alternativního roz-

dělení s parametrem p, tj. A(p). Zjistěte, zda jsou statistiky T1 =X1 + X2 − X3, T2 = 2X1 + X2 − X3 a T3 = 1

3

∑ni=1 Xi = X nestranné

odhady parametru p, určete jejich rozptyl a střední kvadratickou chybu.

2. Předpokládejme, že (X1, . . . , Xn) náhodný výběr z rovnoměrného rozdě-lení s parametry 0, b, b > 0 , tj. X ∼ R(0, b). Ověřte, zda je statistikaT = 2X

a) nestranným odhadem b;

b) konzistentním odhadem b.

3. Dva studenti měřili stejným přístrojem, který nevykazuje systematickouchybu, vzdálenost dvou bodů. Jeden z nich změřil tuto vzdálenost 5 kráta za odhad vzal průměr svých měření. Druhý z nich měřil 10 krát a zaodhad vzal také průměr svých měření. Nemohli se ale domluvit, zda za„společnýÿ odhad vzdálenosti mají vzít

a) průměr svých odhadů;

b) průměr všech měření.

Který postup je lepší?

4. Při sledování doby do poruchy v hodinách určitého zařízení byly získánynásledující údaje: 23, 49, 69, 98, 75, 15. Předpokládejme, že se jedná orealizaci náhodného výběru z exponenciálního rozdělení X s parametremλ, tj. z rozdělení s distribuční funkcí F (x; λ) = 1−exp (−x/λ) pro x ≥ 0,pro jiná x je F (x; λ) = 0. Odhadněte střední dobu životnosti zařízení apravděpodobnost, že zařízení bude fungovat ještě po 70 hodinách.

Page 27: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

2.4 Klíč a výsledky cvičení 27

5. Při měření určité vzdálenosti jsme získali následující výsledky (v km):19.01, 19.02, 18.99, 19.00, 19.05, 19.05, 19.00, 18.98, 18.99, 19.00.

Odhadněte přesnost dálkoměru, jestliže víte, že je skutečná vzdálenost 20km a chyba měření je zatížena systematickou chybou -1 km. Jak se změnívýsledek, když neznáte střední hodnotu náhodné chyby měření?

6. Byly zjištěny odchylky od jmenovité hmotnosti 50 kg. Odhadněte smě-rodatnou odchylku odchylky, když víte, že střední hodnota odchylky je 0kg.

Třída Odchylky v kg nj

1. -0.5 – -0.3 32. -0.3 – -0.1 103. -0.1 – 0.1 204. 0.1 – 0.3 115. 0.3 – 0.5 5

2.4 Klíč a výsledky cvičeníOtázky:

3. a) Ne - E(T ) = µ. b) Ne. c) Ano - jedná se o nestranný odhad. d) Ne- není to nestranný odhad. e) Ne - X je odhad střední hodnoty. f) Ne -nemusí být.

Cvičení:

1. E(T1) = E(T3) = p, E(T2) = 2p; T1 a T3 jsou nestranné odhady. T2není nestranný odhad parametru p. D(T1) = 3p(1− p), D(T2) = 6p(1−p), D(T3) = 1

3p(1− p), KT1(p) = 3p(1− p), KT2(p) = p(6− 5p), KT3(p) =13p(1− p).

2. E(T ) = b, D(T ) = b2

3n . a) Ano. b) Ano.

3. Oba odhady jsou nestranné. Rozptyl odhadu v a) je 340σ

2 a rozptyl od-hadu v b) je 1

15σ2. Postup b) je lepší.

4. x .= 54.833 h, P (X > 70) .= 0.279.

5. σ2 = s20 = 0.00061 km2, σ2 = s2 .= 0.00059 km2.

6. σ = s0.= 0.208 kg.

Page 28: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

Kapitola 3

Intervalový odhad

CílePo přečtení a nastudování této kapitoly budete:

• vědět, co to je intervalový odhad parametrické funkce τ(ϑϑϑ) a proč jejhledáme;

• umět určit realizaci intervalového odhadu střední hodnoty, rozptylu asměrodatné odchylky normálního rozdělení;

• vědět, co je přesnost a spolehlivost odhadu a umět určit rozsah výběrun z normálního rozdělení tak, aby odhad střední hodnoty normálníhorozdělení měl předepsanou přesnost a spolehlivost.

Doba potřebná ke studiuPro zvládnutí této kapitoly budete potřebovat asi 4 hodiny bez řešení příkladůze cvičení.

Klíčová slovaIntervalový odhad, koeficeient spolehlivosti odhadu, spolehlivost odhadu, rizikoodhadu, přesnost odhadu, přípustná chyba odhadu.

V této kapitole (stejně jako v předchozí) budeme předpokládat, že mámenáhodný výběr (X1, X2, . . . , Xn) z rozdělení X, které závisí na vektorovémparametru ϑϑϑ = (ϑ1, ϑ2, . . . , ϑm). O parametru ϑϑϑ víme pouze, že patří do para-metrického prostoru ΘΘΘ.

V předchozí kapitole jsme se zabývali bodovým odhadem T =T (X1, X2, . . . , Xn) parametrické funkce τ(ϑϑϑ) a studiem jeho vlastností. Zdů-razňovali jsme, že bodový odhad T je náhodná veličina, jejíž hodnoty kolísajíod jedné realizace náhodného výběru k druhé. V technických aplikacích nássamozřejmě zajímá číselná hodnota bodového odhadu, a ta se prakticky víceči méně liší od skutečné hodnoty odhadované funkce τ(ϑϑϑ). Při odhadovánípomocí bodového odhadu (ať má sebelepší vlastnosti) nejsme schopni určitpřesnost odhadu, tj. jaké chyby se dopustíme, když skutečnou hodnotu τ(ϑϑϑ)

Page 29: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

29

nahradíme hodnotou bodového odhadu vypočítanou na základě realizace ná-hodného výběru z X. Informaci o přesnosti odhadu můžeme získat pomocítzv. intervalového odhadu. Při konstrukci intervalového odhadu se snažímenajít ne jednu, ale dvě statistiky, dejme tomu TD = TD(X1, X2, . . . , Xn) aTH = TH(X1, X2, . . . , Xn), TD < TH , tak, aby interval 〈TD, TH〉 překryl sku-tečnou hodnotu parametrické funkce τ(ϑϑϑ) s dostatečně velkou pravděpodob-ností.

Definice 3.1: Intervalový odhad, koeficient spolehlivosti, riziko

Jsou-li TD a TH takové statistiky, že pro dané α ∈ (0, 1) a každé ϑϑϑ ∈ ΘΘΘ platí

P (TD ≤ τ(ϑϑϑ) ≤ TH) = 1− α, (3.1)

potom se interval 〈TD, TH〉 nazývá 100(1−α) procentní intervalový odhadparametrické funkce τ(ϑϑϑ).Číslo 1 − α se nazývá koeficient spolehlivosti odhadu, číslo α rizikoodhadu.Nahradíme-li statistiky TD a TH jejich realizacemi tD a tH , vypočítanýmiz jedné realizace náhodného výběru, dostaneme interval 〈tD, tH〉 , který senazývá realizace intervalového odhadu 〈TD, TH〉 .

Intervalový odhad τ(ϑϑϑ) se také někdy nazývá interval spolehlivosti nebokonfidenční interval pro τ(ϑϑϑ).

Někdy nás zajímá pouze největší hodnota τ(ϑϑϑ), se kterou lze při danýchvýsledcích experimentu počítat, nebo naopak pouze nejmenší možná hodnotaτ(ϑϑϑ). V prvním případě hledáme statistiku TH tak, aby platilo

P (TH ≥ τ(ϑϑϑ)) = 1− α pro každé ϑϑϑ ∈ ΘΘΘ. (3.2)

V druhém případě hledáme statistiku TD tak, aby

P (TD ≤ τ(ϑϑϑ)) = 1− α pro každé ϑϑϑ ∈ ΘΘΘ. (3.3)

Dostaneme tzv. 100(1 − α) procentní jednostranné intervalové odhadyparametrické funkce τ(ϑϑϑ). V případě (3.2) budeme mluvit o horním nebopravostranném intervalovém odhadu, v případě (3.3) budeme mluvit odolním nebo levostranném intervalovém odhadu. V těchto případech jepouze jeden kraj intervalového odhadu náhodná veličina. Tak např., víme-li jistě, že τ(ϑϑϑ) musí být větší než číslo a, bude horní intervalový odhad(a, TH〉. Jestliže není hodnota τ(ϑϑϑ) omezena zdola, bude horní intervalovýodhad (−∞, TH〉. Jsou-li oba kraje intervalového odhadu náhodné veličiny,nazýváme jej oboustranný a slovo oboustranný se často vynechává.

Ukážeme, že všechny tyto druhy intervalových odhadů lze získat z intervalu(3.1) vhodným rozdělením rizika α.

∇ Interpretace intervalového odhadu

Je zapotřebí si uvědomit správný výklad intervalového odhadu. Z každé rea-lizace náhodného výběru dostaneme obecně jinou realizaci intervalového od-hadu. Každá z těchto realizací buď τ(ϑϑϑ) překrývá nebo nepřekrývá. Zvolíme-li

Page 30: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

30 Intervalový odhad

např. koeficient spolehlivosti 1−α = 0.99 a vypočteme velký počet realizací 99procentního intervalového odhadu parametrické funkce τ(ϑϑϑ), pak průměrně 99procent těchto realizací překrývá skutečnou hodnotu τ(ϑϑϑ). Volíme-li tedy koefi-ceint spolehlivosti 1− α blízký jedné, je skoro jisté, že realizace intervalovéhoodhadu vypočtená z jedné realizace náhodného výběru překryje skutečnouhodnotu τ(ϑϑϑ).

Dosavadní technické normy vyžadují většinou počítat 99 procentní nebo 95procentní intervaly spolehlivosti (tj. volbu α = 0.01 nebo α = 0.05).

∇ Koeficient spolehlivosti a délka intervalového odhadu

Koeficient spolehlivosti intervalového odhadu udává spolehlivost odhadu, tj.vyjadřuje, s jakou pravděpodobností se můžeme spolehnout na to, že intervalpřekryje skutečnou hodnotu funkce τ(ϑϑϑ). Délka oboustranného intervalovéhoodhadu udává přesnost intervalového odhadu. Čím je tato délka menší,tím je odhad přesnější. Při pevně zvoleném rozsahu náhodného výběru platí,že čím větší koeficient spolehlivosti odhadu zvolíme, tím menší bude přesnostodhadu. Čím více si totiž chceme být jisti, že intervalový odhad překryje sku-tečnou hodnotu τ(ϑϑϑ), tím musí být tento interval širší. Nepřiměřeným zvětšo-váním koeficientu spolehlivosti můžeme dosáhnout tak malou přesnost, tj. takširoký interval, že nebude mít prakticky žádnou vypovídací schopnost. Protose v technických aplikacích doporučuje volit koeficient spolehlivosti odhaduprávě 0.99 nebo 0.95, v některých případech pak 0.90.

∇ Konstrukce intervalového odhadu funkce τ(ϑϑϑ)

Postup, který se zpravidla používá při konstrukci 100(1 − α) procentního in-tervalového odhadu funkce τ(ϑϑϑ), bude uveden na straně 35 až po vyřešeníkonkrétního příkladu.

3.1 Intervalové odhady parametrů normál-ního rozdělení

Dále se budem zabývat intervalovými odhady parametrů µ a σ2 rozděleníN(µ, σ2). Tj. u nás bude τ(ϑϑϑ) = µ v případě našeho zájmu o odhad µ aτ(ϑϑϑ) = σ2 v případě odhadu σ2. Přitom budeme rozlišovat situace, kdy jsouneznámé oba parametry nebo pouze jeden z nich. Předpokládejme tedy, že(X1, X2, . . . , Xn) je náhodný výběr z rozdělení N(µ, σ2).

∇ Rozdělení některých výběrových charakteristik

Při konstrukci intervalových odhadů µ a σ2 vycházíme z bodových odhadůX, S2 a S2

0 těchto parametrů, proto potřebujeme znát jejich rozdělení neborozdělení funkcí těchto odhadů, tzv. výběrová rozdělení.

Page 31: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

3.1 Intervalové odhady parametrů normálního rozdělení 31

Tak např. pro výběrový průměr X platí (viz vztahy (2.1) a (2.2)), že

E(X) = µ,D(X) =σ2

n.

Protože předpokládáme, že výběr pochází z normálního rozdělení, bude mítnormální rozdělení i výběrový průměr X, protože je lineární kombinací nezá-vislých normálních náhodných veličin. Tedy

X ∼ N(µ,σ2

n).

Normováním statistiky X dostaneme veličinu

X − E(X)√

D(X)=

X − µ√

σ2

n

=X − µ

σ√

n,

která má normované normální rozdělení. Máme-li tedy náhodný výběr z roz-dělení N(µ, σ2), má normovaný výběrový průměr rozdělení N(0, 1).

Další výběrová rozdělení, která se používají ke konstrukci intervalových od-hadů parametrů normálního rozdělení a testech hypotéz o parametrech normál-ního rozdělení (viz následující modul), zde nebudeme odvozovat, ale shrnemeje všechny v následujícím tvrzení.

Tvrzení 3.1: Výběrová rozdělení

Je-li (X1, . . . , Xn) náhodný výběr z rozdělení X ∼ N(µ, σ2). Potom

X − µσ

√n ∼ N(0, 1),

X − µS

√n ∼ t(n− 1),

nS20

σ2 ∼ χ2(n),

(n− 1)S2

σ2 ∼ χ2(n− 1).

Při konstrukci i výpočtu intervalových odhadů parametrů µ a σ2 v jed-notlivých situacích budeme potřebovat pracovat s kvantily výše uvedenýchrozdělení.

Úkol 3.1:Zopakujte si z teorie pravděpodobnosti, jak je definován 100γ procentníkvantil rozdělení náhodné veličiny X a co udává. Nakreslete si obrázky.

Page 32: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

32 Intervalový odhad

Poznámka 3.1: Kvantily výběrových rozdělení

Kvantily výběrových rozdělení jsou jednak tabelovány (viz [11] a u násv příloze A), jednak je počítá každý statistický software a můžeme vyu-žít i Excel. 100γ procentní kvantily rozdělení N(0, 1), t(n) a χ2(n) budemepostupně značit u(γ), t(n; γ) a χ2(n; γ). Kvantily u(γ) a t(n; γ) jsou tabelo-vány pro γ ≥ 0.5, pro γ < 0.5 je u(γ) = −u(1− γ) a t(n; γ) = −t(n; 1− γ).Nakreslete si obrázky a přesvědčte se o těchto rovnostech. Pro n > 30 jet(n; γ) .= u(γ). Pro kvantily χ2(n; γ) v tomto případě platí χ2(n; γ) .=12 [√

2n− 1 + u(γ)]2, takže v některých statistických tabulkách jsou tytokvantily tabelovány pro n ≤ 30 .

Úkol 3.2:

1. Jak vypadají tvary hustoty rozdělení N(µ, σ2), t(n) a χ2(n)?

2. Určete následující kvantily:u(0.95), u(0.05), t(10; 0.9), t(15; 0.05), t(31; 0.99),χ2(5; 0.05), χ2(19; 0.99), χ2(100; 0.99), χ2(100; 0.01).

3. K jaké hodnotě se blíží 100γ procentní kvantily rozdělení N(0, 1), t(n) aχ2(n), když se γ blíží k jedné, resp. k nule? Nakreslete si obrázky!

Výsledek:2. 1.645,−1.645, 1.372,−1.753, 2.326, 1.146, 36.19, 135.02, 69.39.3. Když se γ blíží k jedné, blíží se všechny kvantily k ∞. Když se γ blíží

k nule, blíží se kvantily N(0, 1) a t(n) k −∞ a kvantil χ2(n) k nule. Místolimit budeme psát např. u(1) = ∞, u(0) = −∞.

Než přejdeme k intervalovým odhadům parametrů normálního rozdělení,ukážeme využití tvrzení 3.1 při výpočtu pravděpodobnosti.

Příklad 3.1:Při kontrole stejnorodosti dodávky mandarinek balených po 1 kg se odběratelrozhodl zvážit 20 náhodně vybraných balíčků. Dodávku přijme, jestliže budevýběrová směrodatná odchylka nanejvýš 20 g. Jaká je pravděpodobnost při-jetí dodávky, jestliže je známo, že hmotnost balíčků má přibližně rozděleníN(1kg, 0.0262kg2)?Řešení: Odběratel má k dispozici náhodný výběr (X1, . . . , Xn) o rozsahun = 20 z rozdělení N(1kg, 0.0262kg2). Počítáme pravděpodobnost P (S ≤ 0.02).Vyjádříme ji pomocí náhodné veličiny (n−1)S2

σ2 , která má rozdělení χ2(n− 1).

P (S ≤ 0.02) = P((n− 1)S2

σ2 ≤ (n− 1)0.022

σ2

)

= P((n− 1)S2

σ2 ≤ 19 · 0.022

0.0262

)

= P((n− 1)S2

σ2 ≤ 11.24)

.

Tedy číslo 11.24 je 100α procentní kvantil rozdělení χ2(19). Z tabulky A.4 do-staneme, že α .= 0.1. Přijetí dodávky lze očekávat s pravděpodobností 0.1.

Page 33: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

3.1 Intervalové odhady parametrů normálního rozdělení 33

3.1.1 Intervalový odhad střední hodnotyPříklad 3.2:

Určete 100(1−α) procentní intervalový odhad střední hodnoty µ normálníhorozdělení N(µ, σ2) se známým rozptylem σ2.Řešení: Podle definice 3.1 potřebujeme určit statistiky TD a TH tak, abypro každé µ platilo

P (TD ≤ µ ≤ TH) = 1− α. (3.4)

1. Vyjdeme z nejlepšího nestranného odhadu parametru µ, tj. výběrovéhoprůměru X. Hodilo by se nám najít takovou náhodnou veličinu K, kteráje funkcí parametru µ a jeho odhadu X, tj. K = K(µ,X), jejíž rozděleníznáme a nezávisí na µ, tj. je určeno jednoznačně. Takovou veličinou jeveličina

K =X − µ

σ√

n,

která má podle tvrzení 3.1 rozdělení N(0, 1), jehož 100γ procentní kvan-tily u(γ) jsou tabelovány. Všimněte si, že veličina K je skutečně funkcípouze µ a X, protože σ známe a n je daný rozsah výběru.

2. Znalost a jednoznačnost rozdělení K nám umožňuje určit konstanty kD

a kH , kD < kH , takové, že pro každé µ platí

P (kD ≤ K ≤ kH) = 1− α. (3.5)

Když pak za K do vztahu (3.5) dosadíme X−µσ

√n a z nerovnosti uvnitř

kulatých závorek vyjádříme µ, dostaneme hledaný 100(1 − α) procentníintervalový odhad µ. Věnujme se tedy určení konstant kD a kH (viz obr.3.1). Vztah 3.5 patí právě tehdy, když

α = P(

K /∈ 〈kD, kH〉)

= P[

(K < kD) ∪ (K > kH)]

= P (K < kD) + P (K > kH).

Obrázek 3.1: Určení kD a kH

Page 34: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

34 Intervalový odhad

Konstanty kD a kH tedy stačí vybrat tak, aby

P (K > kH) = α1 a P (K < kD) = α2,

kde α1 a α2 jsou dvě nezáporná čísla s vlastností α1 + α2 = α. ZřejměkH = u(1 − α1) a kD = u(α2). Vzhledem k tomu, že α (a tedy i α2)volíme prakticky malé číslo (určitě menší než 0.5), pro práci s tabulkamipotřebujeme převodní vztah u(α2) = −u(1−α2). Potom kD = −u(1−α2).Tedy

P(

−u(1− α2) ≤ K ≤ u(1− α1))

= α.

3. Z nerovnosti

−u(1− α2) ≤ X − µσ

√n ≤ u(1− α1)

(která platí z pravděpodobností 1− α) vyjádříme µ. Dostaneme

X − u(1− α1)σ√n≤ µ ≤ X + u(1− α2)

σ√n

.

Tedy interval

X − u(1− α1)σ√n

, X + u(1− α2)σ√n

(3.6)

je hledaný 100(1− α) procentní intervalový odhad střední hodnoty µ.

Vraťme se zpět k rozdělení rizika α.Jestliže zvolíme α1 = α2, potom α1 = α2 = α

2 au(1− α1) = u(1− α2) = u(1− α

2 ).Dosazením do vztahu (3.6) dostaneme

X − u(1− α2

)σ√n

,X + u(1− α2

)σ√n

,

což je 100(1− α) procentní oboustranný intervalový odhad µ.Jestliže zvolíme α1 = 0, potom α2 = α a

u(1− α1) = u(1) = ∞, u(1− α2) = u(1− α).Dostaneme interval

(

−∞, X + u(1− α)σ√n

,

což je 100(1− α) procentní horní intervalový odhad µ.Podobně při volbě α1 = α, α2 = 0 dostaneme interval

X − u(1− α)σ√n

,∞)

,

který je 100(1− α) procentním dolním intervalovým odhadem µ.

Postup, který jsme použili v příkladu 3.2 ke konstrukci intervalového od-hadu parametru µ normálního rozdělení se známým rozptylem σ2, lze zobecnitna konstrukci intervalového odhadu parametrické funkce τ(ϑϑϑ).

Page 35: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

3.1 Intervalové odhady parametrů normálního rozdělení 35

∇ Konstrukce intervalového odhadu funkce τ(ϑϑϑ)

Při konstrukci 100(1 − α) procentního intervalového odhadu funkce τ(ϑϑϑ) sezpravidla postupuje následovně:

1. Vyjdeme z nejlepšího nestranného odhadu T parametrické funkce τ(ϑϑϑ).Najdeme náhodnou veličinu K takovou, že K = K(τ(ϑϑϑ), T ), tj. K jefunkcí τ(ϑϑϑ) a jejího odhadu T, jejíž rozdělení známe a nezávisí na ϑϑϑ.

2. Pomocí tohoto rozdělení určíme konstanty kD a kH , kD < kH , takové, že

P (kD ≤ K ≤ kH) = 1− α (3.7)

K tomu stačí konstanty kD a kH vybrat tak, aby

P (K > kH) = α1 a P (K < kD) = α2, (3.8)

kde α1 a α2 jsou dvě nezáporná čísla s vlastností α1 + α2 = α.

3. Nerovnost kD ≤ K ≤ kH pak převedeme na ekvivalentní nerovnostTD ≤ τ(ϑϑϑ) ≤ TH (v případech, které zde budeme uvažovat, to budevždy možné), takže platí

P (kD ≤ K ≤ kH) = P (TD ≤ τ(ϑϑϑ) ≤ TH) = 1− α

pro každé ϑϑϑ, protože rozdělení náhodné veličiny K nezávisí na ϑϑϑ. Tj.interval 〈TD, TH〉 je 100(1−α) procentní intervalový odhad parametrickéfunkce τ(ϑϑϑ).

Poznámka 3.2: Rozdělení rizika α

Riziko α lze rozdělit na nezáporná čísla α1 a α2 nekonečně mnoha způsoby.Běžně se používají (stejně jako v příkladu 3.2) pouze tři:

1. α1 = α2 = α2 ,

2. α1 = 0, α2 = α,3. α1 = α, α2 = 0.

Je-li α1 > 0 a α2 > 0 dostaneme oboustranný intervalový odhad. Při prv-ním způsobu rozdělení rizika tedy dostaneme oboustranný intervalový od-had. Dále budeme pod oboustranným intervalovým odhadem rozumět právětento interval. Jestliže volíme druhý nebo třetí způsob, pak dostaneme jed-nostranné intervalové odhady.

Vraťme se zpět k normálnímu rozdělení. Jestliže potřebujeme najít inter-valový odhad střední hodnoty µ normálního rozdělení s neznámým rozptylemσ2 (což je jistě častější situace), nemůžeme použít intervalový odhad (3.6).Nejlepším nestranným odhadem µ zůstavá X, ale pro konstrukci intervalovéhoodhadu µ zde nemůžeme použít veličinu X−µ

σ

√n, protože neznáme σ. V tomto

případě pracujeme s veličinou K = X−µS

√n z tvrzení 3.1, kdy neznámé σ na-

hradíme odhadem S. Náhodná veličina K má rozdělení t(n − 1), jehož tvarhustoty je podobný tvaru hustoty rozdělení N(0, 1) v tom smyslu, že je sy-metrický podle osy y. Hledaný intervalový odhad bychom dostali analogicky

Page 36: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

36 Intervalový odhad

jako v příkladu 3.2. Od intervalového odhadu (3.6) se bude lišit tím, že místo skvantily rozdělení N(0, 1) musíme pracovat s kvantily rozdělení t(n− 1) a ne-známou směrodatnou odchylku σ nahradit jejím odhadem S. Výsledky shrnujenásledující tvrzení.

Tvrzení 3.2: Intervalový odhad parametru µ

Máme-li náhodný výběr o rozsahu n z rozdělení N(µ, σ2), potom 100(1−α),tj. 100[1− (α1 + α2)], procentní intervalový odhad střední hodnoty µ je:

1. v případě známého rozptylu σ2 interval⟨

X − u(1− α1)σ√n

,X + u(1− α2)σ√n

;

2. v případě neznámého rozptylu σ2 interval⟨

X − t(n− 1; 1− α1)S√n

,X + t(n− 1; 1− α2)S√n

.

Rozdělení rizika α na α1 a α2 je dáno v poznámce 3.2. Při druhém, resp.třetím způsobu rozdělení rizika dostaneme horní, resp. dolní intervalovýodhad.

Poznámka 3.3: Intervalový odhad střední hodnoty

Intervalové odhady z tvzení 3.1 můžeme použít i pro intervalový odhadstřední hodnoty E(X) náhodné veličiny X, která nemá normální rozdělení.Rozsah náhodného výběru z rozdělení X má být v tomto případě větší než30. Spolehlivost odhadu je pak přibližně 1− α.

Příklad 3.3:Z produkce konkrétní cihelny bylo náhodně vybráno osm cihel pá-lených plných a byla změřena jejich délka v mm. Výsledky meření byly:

290, 287, 289, 292, 293, 291, 286, 291.Předpokládáme, že délka cihly je normální náhodná veličina. Určete realizaci95 procentního

a) oboustranného intervalového odhadu střední hodnoty délky cihly;b) dolního intervalového odhadu střední hodnoty délky cihly.

Řešení: Máme realizaci náhodného výběru z rozdělení X ∼ N(µ, σ2) orozsahu n = 8, kde neznáme ani jeden z parametrů µ a σ2.

1. 100(1− α) procentní intervalový odhad střední hodnoty µ délky cihlyje podle tvzení 3.2 interval

X − t(n− 1; 1− α1)S√n

,X + t(n− 1; 1− α2)S√n

.

2. Hledáme 95 procentní intervalový odhad µ, tj.

Page 37: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

3.1 Intervalové odhady parametrů normálního rozdělení 37

100(1− α) = 95 ⇒ 1− α = 0.95 ⇒ α = 0.05.Rozdělme riziko α (viz poznámka 3.2):

a) α1 = α2 = α2 = 0.025.

Odtudt(n− 1; 1− α1) = t(7; 0.975) = 2.365,t(n− 1; 1− α2) = t(7; 0.975) = 2.365.

b) α1 = α = 0.05, α2 = 0.Odtud

t(n− 1; 1− α1) = t(n− 1; 1− α) = t(7; 0.95) = 1.895,t(n− 1; 1− α2) = t(n− 1; 1) = ∞.

3. Vypočteme realizaci µ odhadu střední hodnoty µ a realizaci σ odhadusměrodatné odchylky σ, dosteneme µ = x = 289.875, σ = s .= 2.416.

4. Výsledky dosadíme do krajů intervalového odhadu v bodě 1, dostanemea)

289.875− 2.3652.416√8 , 289.875 + 2.3652.416√

8

⟩ .= 〈287.855, 291.895〉 ;

b)⟨

289.875− 1.8952.416√8 ,∞

) .= 〈288.256,∞) .Realizace 95 procentního oboustranného intervalového odhadu střední hod-noty délky cihly je 〈287.855 mm, 291.895 mm〉, realizace 95 procentního dol-ního intervalového odhadu střední hodnoty délky cihly je 〈288.256 mm,∞) .Můžeme se tedy na 95 procent spolehnout, že střední hodnota délky cihly jev rozmezí 287.855 mm až 291.895 mm a že střední hodnota délky cihly je sestejnou spolehlivostí větší než 288.256 mm.

Úkol 3.3:Řešte příklad 3.3 při koeficientu spolehlivosti 0.99 a výsledky porovnejte.Výsledek: a) 〈286.885 mm, 292.865 mm〉, b) 〈287.314 mm,∞). Obou-stranný intervalový odhad má v tomto případě větší délku a dolní hranicedolního intervalového odhadu je menší, protože jsme požadovali větší spo-lehlivost.

Úkol 3.4:Jak by se změnil postup v příkladu 3.3, kdyby z předchozích měření byloznámo, že směrodatná odchylka délky cihly je 2 mm?Výsledek: a) 〈288.489 mm, 291.261 mm〉 , b) 〈288.712 mm,∞) .

∇ Rozsah výběru pro odhad střední hodnoty µ

Konstrukci intervalového odhadu střední hodnoty µ jsme již vysvětlili. Vraťmese ještě k přesnosti odhadu µ. Často se požaduje, aby měl odhad µ při danéspolehlivosti danou přesnost. Oboustranný intervalový odhad střední hodnotyµ je symetrický podle X (viz tvrzení 3.2 a poznámka (3.2)), tj. můžeme jejzapsat ve tvaru

X −∆, X + ∆⟩

.

Potom je délka intervalového odhadu odhadu µ rovna 2∆. Lze tedy přesnostodhadu µ vyjádřit pomocí ∆, tzv. přípustné chyby odhadu.

Page 38: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

38 Intervalový odhad

Definice 3.2: Přípustná chyba odhadu µ

Přípustná chyba ∆ odhadu X parametru µ je polovina délky oboustran-ného intervalového odhadu µ .

V případě, že náhodný výběr pochází z rozdělení N(µ, σ2) se známým roz-ptylem σ2, platí:

P(

X − u(1− α2

)σ√n≤ µ ≤ X + u(1− α

2)

σ√n

)

= 1− α.

Odtud plyne, že přípustná chyba ∆ odhadu µ je

∆ = u(1− α2

)σ√n

(3.9)

a

P (|X − µ| ≤ ∆) = 1− α. (3.10)

Potom:

1. Ze vztahu (3.9) dostáváme, že přípustná chyba ∆ odhadu X parametru µse při daném koeficientu spolehlivosti 1−α bude zmenšovat s rostoucímrozsahem výběru n.

2. Ze vztahu (3.10) plyne, že přípustná chyba ∆ odhadu µ je horní hra-nice absolutní hodnoty chyby odhadu µ, tj. |X−µ|, které se dopus-tíme s pravděpodobností 1− α.

3. Je-li zadán nejen koeficient spolehlivosti odhadu, ale i přípustná chybaodhadu, pak můžeme určit minimální rozsah nmin výběru tak, aby bylydodrženy oba požadavky současně. Stačí z nerovnice

u(1− α2

)σ√n≤ ∆

vyjádřit n. Dostaneme

n ≥

[

u(1− α2 )σ

]2

. (3.11)

Za nmin pak vezmeme dolní hranici řešení (3.11) zaokrouhlenou nahoruna nejbližší celé číslo. Potom rozsah nmin výběru zaručuje, že bude dodr-žena předepsaná spolehlivost 1−α i přesnost odhadu, vyjádřená přípust-nou chybou odhadu ∆. Přípustná chyba odhadu bude maximálně rovnapožadované.

Page 39: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

3.1 Intervalové odhady parametrů normálního rozdělení 39

V případě neznámého rozptylu pro přípustnou chybu ∆ odhadu µ platí

∆ = t(n− 1; 1− α2

)S√n

. (3.12)

Tedy na rozdíl od přípustné chyby střední hodnoty µ při známém rozptyluσ2 je ∆ náhodná veličina. V tomto případě lze postupovat pomocí tzv. předvý-běru, kdy nejprve provedeme náhodný výběr o rozsahu n1. Z realizace výběruvypočteme realizaci výběrového rozptylu

s21 =

1n1 − 1

n1∑

i=1

(xi − x)2

a z nerovnicet(n1 − 1; 1− α

2)

s1√n≤ ∆

vyjádříme n. Dostaneme

n ≥

[

t(n1 − 1; 1− α2 )s1

]2

. (3.13)

Za nmin pak opět stačí vzít dolní hranici řešení (3.13) zaokrouhlenou nahoruna nejbližší celé číslo. Náhodný výběr o rozsahu nmin už pak dává dostatečněpřesný a spolehlivý odhad. Vysvětlení tohoto postupu přesahuje rámec našehotextu (viz např. [4]).

Je-li n1 ≥ nmin je už v předvýběru splněna požadovaná spolehlivost apřesnost.

Je-li n1 < nmin, doplní se výběr o dalších nmin − n1 pozorování.

Příklad 3.4:Za odhad vzdálenosti se bere průměr měření této vzdálenosti. Náhodné chybyměření mají normální rozdělení se střední hodnotou nula. Kolik měření jetřeba provést, aby přípustná chyba při určování vzdálenosti nepřekročila 0.05cm s pravděpodobností 0.95, jestliže směrodatná odchylka náhodné chybyměření:

1. je 0.1 cm;2. není známá a z pěti meření byla vypočtena hodnota výběrové směrodatné

odchylky 0.1 cm.

Řešení: Označme µ neznámou vzdálenost a Y náhodnou chybu měření,potom pro neznámý výsledek měření X platí X = µ+Y a tedy X ∼ N(µ, σ2).Požadujeme, aby přípustná chyba odhadu ∆ byla maximálně 0.05 cm přikoeficientu spolehlivosti 1− α = 0.95.

Page 40: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

40 Intervalový odhad

1. Ze vztahu (3.11) dostáváme

n ≥

[

u(1− α2 )σ

]2

=

[

u(0.975) · 0.10.05

]2.= 15.4 =⇒ n ≥ 16.

2. Naše měření budeme považovat za předvýběr, máme n1 = 5, s1 = 0.1.Potom podle vztahu (3.13) dostaneme

n ≥

[

t(n1 − 1; 1− α2 )s1

]2

=

[

t(4; 0.975) · 0.10.05

]2.= 30.8 =⇒ n ≥ 31.

Při známém rozptylu stačí provést 16 měření, při neznámém rozptylu mu-síme předvýběr doplnit o dalších 26 měření. Potom se můžeme na 95% spo-lehnout, že skutečná vzdálenost µ je v intervalu 〈x− 0.05, x + 0.05〉. Tedyprůměrně v 95% případů bude pro průměrnou vzdálenost vypočítanou z 16,resp. z 31 doplněných měření platit |x− µ| ≤ 0.05.

3.1.2 Intervalový odhad rozptyluPříklad 3.5:

Určete 100(1− α) procentní intervalový odhad rozptylu σ2 normálního roz-dělení N(µ, σ2) se známou střední hodnotou µ.Řešení:

1. Vyjdeme z nejlepšího nestranného odhadu parametru σ2 v případě známéstřední hodnoty µ, tj. statistiky S2

0 . Potřebujeme najít náhodnou veličinuK tak, že K je funkcí rozptylu σ2 a jeho odhadu S2

0 , jejíž rozdělení známea nezávisí na σ2. Podle tvrzení 3.1 lze za K zvolit náhodnou veličinu

K =nS2

0

σ2 ,

která má rozdělení χ2(n), jehož 100γ procentní kvantily χ2(n; γ) jsoutabelovány.

2. Určíme konstanty kD a kH , kD < kH , tak, aby

P (kD ≤ K ≤ kh) = 1− α.

K tomu stačí vybrat konstanty kD a kH tak, aby platilo (viz obr. 3.2)

P (K > kH) = α1 a P (K < kD) = α2,

kde α1 a α2 jsou dvě nezáporná čísla s vlastností α1 + α2 = α. ZřejměkH = χ2(n; 1− α1) a kD = χ2(n; α2). Potom

P(

χ2(n; α2) ≤ K ≤ χ2(n; 1− α1))

= 1− α.

Page 41: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

3.1 Intervalové odhady parametrů normálního rozdělení 41

Obrázek 3.2: Určení kD a kH

3. Z nerovnostiχ2(n; α2) ≤ nS2

0

σ2 ≤ χ2(n; 1− α1)

vyjádříme σ2, dostaneme

nS20

χ2(n; 1− α1)≤ σ2 ≤ nS2

0

χ2(n; α2).

Tedy⟨ nS2

0

χ2(n; 1− α1),

nS20

χ2(n; α2)

. (3.14)

je hledaný 100(1− α) procentní intervalový odhad rozptylu σ2.

Při 1. způsobu dělení rizika α z poznámky 3.2 dostanemeχ2(n; 1− α1) = χ2(n; 1− α

2 ), χ2(n; α2) = χ2(n; α2 )

a tedy interval⟨ nS2

0

χ2(n; 1− α2 )

,nS2

0

χ2(n; α2 )

je 100(1− α) procentní oboustranný intervalový odhad σ2.Při 2. způsobu dělení dostanemeχ2(n; 1− α1) = χ2(n; 1) = ∞, χ2(n; α2) = χ2(α)

a intervalový odhad(

0,nS2

0

χ2(n; α)

je horní intervalový odhad σ2.Ve třetím případě, pak zcela analogicky dostáváme dolní intervalový od-

had σ2⟨ nS2

0

χ2(n; 1− α),∞

)

.

Jestliže potřebujeme najít intervalový odhad rozptylu σ2 normálního roz-dělení s neznámou střední hodnotou µ, nemůžeme použít intervalový odhad(3.14). Nestranným odhadem σ2 je v tomto případě výběrový rozptyl S2 apro konstrukci intervalového odhadu σ2 použijeme veličinu K = (n−1)S2

σ2 , kterámá podle tvrzení 3.1 rozdělení χ2(n− 1). Hledaný intervalový odhad bychomdostali analogicky jako v příkladu 3.5. Výsledky shrnuje následující tvrzení.

Page 42: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

42 Intervalový odhad

Tvrzení 3.3: Intervalový odhad parametru σ2

Máme-li náhodný výběr o rozsahu n z rozdělení N(µ, σ2), potom 100(1−α),tj. 100[1− (α1 + α2)], procentní intervalový odhad rozptylu σ2 je:

1. v případě známé střední hodnoty µ interval

⟨ nS20

χ2(n; 1− α1),

nS20

χ2(n; α2)

;

2. v případě neznámé střední hodnoty µ interval

⟨ (n− 1)S2

χ2(n− 1; 1− α1),

(n− 1)S2

χ2(n− 1; α2)

.

Rozdělení rizika α na α1 a α2 je dáno v poznámce 3.2. Horní, resp. dolníintervalový odhad dostaneme při druhém, resp. třetím způsobu rozdělenírizika.

Poznámka 3.4: Intervalový odhad σ

100(1 − α) procentní intervalový odhad směrodatné odchylky σ rozděleníN(µ, σ2) dostaneme z intervalových odhadů v tvrzení 3.3 tak, že kraje pří-slušných intervalových odhadů odmocníme.

Poznámka 3.5: Intervalový odhad rozptylu

Intervalové odhady rozptylu z tvrzení 3.3 můžeme na rozdíl od intervalovýchodhadů střední hodnoty použít pouze v případě, že máme náhodný výběrz rozdělení N(µ, σ2) .

Příklad 3.6:Vraťte se k příkladu 3.3 a určete realizaci 99 procentního oboustrannéhointervalového odhadu směrodatné odchylky délky cihly.Řešení: Máme realizaci náhodného výběru z rozdělení X ∼ N(µ, σ2) o roz-sahu n = 8, kde ani jeden z parametrů neznáme. Nejprve určíme intervalovýodhad rozptylu.

1. 100(1−α) procentní intervalový odhad rozptylu σ2 délky cihly je podletvzení 3.3 interval

⟨ (n− 1)S2

χ2(n− 1; 1− α1),

(n− 1)S2

χ2(n− 1; α2)

.

2. Hledáme 99 procentní intervalový odhad σ2, tj.100(1− α) = 99 ⇒ 1− α = 0.99 ⇒ α = 0.01

Rozdělme riziko α (viz poznámka 3.2):α1 = α2 = α

2 = 0.005.Odtud

Page 43: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

3.2 Kontrolní otázky 43

χ2(n− 1; 1− α1) = χ2(7; 0.995) = 20.28,χ2(n− 1; α2) = χ2(7; 0.005)) = 0.989.

3. Z příkladu 3.3 máme σ = s = 2.416.4. Výsledky dosadíme do krajů intervalového odhadu v bodě 1, dostaneme

7 · 2.4162

20.28,7 · 2.4162

0.989

.= 〈2.015, 41.314〉 .Realizace 99 procentního oboustranného intervalového odhadu rozptylu

délky cihly je 〈2.015 mm2, 41.314 mm2〉 a tedy realizace 99 procentníhooboustranného intervalového odhadu směrodatné odchylky délky cihly je(1.420 mm, 6.428 mm).

V technických aplikacích se většinou 100(1− α) procentní intervalové od-hady neznámých parametrů nebo funkcí těchto parametrů neodvozují, ale stačíje najít v příslušné statistické nebo technické literatuře. Pro výpočet realizaceintervalového odhadu pak stačí zvolit koeficient spolehlivost odhadu 1 − α,vypočítat realizace příslušných statistik v intervalových odhadech se vyskytu-jících a potřebné kvantily najít ve statistických tabulkách.

Realizace intervalových odhadů střední hodnoty a rozptylu normální ná-hodné veličiny při obou neznámých parametrech počítá STATGRAPHICSv nabídce Describe 7−→ Numeric Data 7−→ One-Sample Analysis. EXCEL po-čítá realizaci intervalového odhadu střední hodnoty normálního rozdělení seznámým rozptylem v nabídce průvodce funkcí fx 7−→ funkce statistické 7−→CONFIDENCE.

3.2 Kontrolní otázky1. Vlastními slovy řekněte, co si představujete pod 100(1 − α) procentním

intervalovým odhadem funkce τ(ϑϑϑ).

2. Musí realizace 90 procentního intervalového odhadu parametrické funkceτ(ϑϑϑ) obsahovat skutečnou hodnotu této funkce?

3. Ze 100 realizací náhodného výběru sestrojíme 100 realizací 80 procent-ního intervalového odhadu funkce τ(ϑϑϑ), musí každá z těchto realizací ob-sahovat skutečnou hodnotu této funkce?

4. Jaké druhy intervalových odhadů rozlišujeme?

5. Z realiazce náhodného výběru z normálního rozdělení o rozsahu n = 5určíme realizaci výběrového rozptylu s2 a průměru x a vypočteme realizaciintervalového odhadu střední hodnoty µ tak, žea) s2 považujeme za odhad σ2;b) s2 považujeme za skutečnou hodnotu σ2.

Čím se tyto intervaly liší a který postup je správný?

6. Rozhodněte, které tvrzení platí:Přesnost odhadu střední hodnoty µ normálního rozdělení se při známémσ2 zvětší, když:

Page 44: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

44 Intervalový odhad

a) zvětšíme rozsah výběru;

b) zvětšíme koeficient spolehlivosti;

c) když se zmenší rozptyl.

3.3 Cvičení1. Hmotnost jedné porce kávy má přibližně normální rozdělení se střední

hodnotou 7 g a směrodatnou odchylkou 0.4 g. Jaká je pravděpodobnost,že k přípravě 14 porcí bude stačit jeden 100 g balíček?

2. Teplota, při které se mění kvalita povrchu dřevotřískových desek, je nor-mální náhodná veličina se střední hodnotou 104C a směrodatnou odchyl-kou 8C. Náhodně bylo vybráno 25 desek. V jakém intervalu lze očekávatX,S2 a S s pravděpodobností 0.99, mají-li se hodnoty veličin X, S2 a Svyskytovat se stejnou pravděpodobností nad horní a pod dolní mezí?

3. Najděte realizace 90 procentních horních intervalových odhadů nezná-mých parametrů v příkladě 6 ze cvičení 1.4. Předpokládejte, že má mezprůtažnosti oceli přibližně normální rozdělení.

4. Sledovaný rozměr součástky má normální rozdělení se směrodatnou od-chylkou 0.15 mm. Určete realizace 99 procentního oboustranného, hor-ního a dolního intervalového odhadu střední hodnoty sledovaného roz-měru, jestliže byl na základě měření osmi náhodně vybraných součástekvypočten průměr 110.2 mm. V případě, že není přípustná chyba odhadumenší než 0.1 mm, určete rozsah n výběru tak, aby byla dodržena přede-psaná přesnost.

5. Opakovaným meřením rychlosti vody v potrubí jsme získali následujícívýsledky v m/s: 4.20, 4.28, 4.27, 4.18. Předpokládejme, že naměřené hod-noty lze považovat za realizaci náhodného výběru z normálního rozdělení.

a) Najděte realizaci 95 procentního intervalového odhadu střední hod-noty a směrodatné odchylky rychlosti.

b) V případě, že není přípustná chyba odhadu střední hodnoty menšínež 0.05, určete rozsah výběru tak, aby byla zaručena předepsanápřesnost.

6. Průměrná hodnota vzdálenosti k orientačnímu bodu, získaná ze 4 nezá-vislých měření, je 2 250 m. Chyba měřicího přístroje je normální náhodnáveličina s parametry 10 m a 50 m2. Určete realizaci 99 a 95 procentníhointervalového odhadu měřené veličiny.

7. Má se určit střední hodnota doby, která je potřebná k vykonání určitéčinnosti. Byl měřen čas u 40 dělníků a vypočtena průměrná hodnota 42.5minut a odhad směrodatné odchylky 3.8 minut. Jaké maximální chybyse dopustíme s pravděpodobností 0.99, když za odhad střední hodnotyvezmeme 42.5 minut?

Page 45: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

3.4 Klíč a výsledky cvičení 45

8. Vypočtěte realizace 95 procentních oboustranných intervalových odhadůneznámých parametrů v příkladě 6 ze cvičení 2.3 Předpokládejte, že sle-dovaná náhodná veličina má normální rozdělení.

9. Během 21 dnů byly v určitém regionu registrovány počty nehod za den.Výsledky jsou v následující tabulce:

Počet nehod 0 1 2 3 4 5nj 4 8 5 1 2 1

Určete:a) realizaci bodového odhadu střední hodnoty a směrodatné odchylky po-čtu nehod za den;b) realizaci 99 procentního horního odhadu střední hodnoty poču nehodza den, je-li známo, že počet nehod za den má přibližně Poissonovo roz-dělení.

3.4 Klíč a výsledky cvičení

Cvičení:1. S pravděpodobností 0.9099.

2. 99.8784 ≤ X ≤ 108.1216, 26.3653 ≤ S2 ≤ 121.4933, 5.1347 ≤ S ≤11.0224.

3. µ ≤ 289.028 MPa, σ2 ≤ 274.208 MPa2.

4. 110.063 mm ≤ µ ≤ 110.337 mm, µ ≤ 110.323 mm, µ ≥ 110.077 mm. Jetřeba provést 15 měření.

5. a) µ = 4.2325 m/s, σ .= 0.0499 m/s, 4.1531 m/s ≤ µ ≤ 4.3119 m/s,0.0283 m/s ≤ σ ≤ 0.1860 m/s. b) Výběr je nutné doplnit o alespoň 7měření.

6. 2230.892 m ≤ µ ≤ 2249.108 m, 2233.070 m ≤ µ ≤ 2246.930 m.

7. Maximální chyba je 1.548 minut.

8. 0.030 kg2 ≤ σ2 ≤ 0.068 kg2.

9. a) E(X) = x .= 1.619, √

D(X) = s .= 1.396. b) Náhodná veličinaX nemá normální rozdělení a rozsah výběru není vetší než 30, nemů-žeme tedy použít intervalový odhad střední hodnoty normálního rozdě-lení. Pro Poissonovo rozdělení s parametrem λ platí, že E(X) = λ a100(1 − α) procentní intervalový odhad parametru λ je (viz např. [12])interval

χ2(2nX;α1)2n , χ2(2nX+2;1−α2)

2n

, kde rozdělení rizika α na α1 a α2

je dáno v poznámce 3.2. Realizace hledaného intervalového odhadu je(0, 2.372〉 (χ2(70; 0.99) .= 99.628). Tedy střední hodnota počtu nehod zaden je téměř jistě nejvýše 2.372 nehod.

Page 46: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

Příloha A

Tabulky

Page 47: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

47

Tabulka A.1: Hodnoty distribuční funkce Φ(x)Φ(x)Φ(x)normované normální náhodné veličiny

x Φ(x)0.00 0.50000.01 0.50400.02 0.50800.03 0.51200.04 0.51600.05 0.51990.06 0.52390.07 0.52790.08 0.53190.09 0.53590.10 0.53980.11 0.54380.12 0.54780.13 0.55170.14 0.55570.15 0.55960.16 0.56360.17 0.56750.18 0.57140.19 0.57530.20 0.57930.21 0.58320.22 0.58710.23 0.59100.24 0.59480.25 0.59870.26 0.60260.27 0.60640.28 0.61030.29 0.61410.30 0.61790.31 0.62170.32 0.62550.33 0.62930.34 0.63310.35 0.63680.36 0.64060.37 0.64430.38 0.64800.39 0.6517

x Φ(x)0.40 0.65540.41 0.65910.42 0.66280.43 0.66640.44 0.67000.45 0.67360.46 0.67720.47 0.68080.48 0.68440.49 0.68790.50 0.69150.51 0.69500.52 0.69850.53 0.70190.54 0.70540.55 0.70880.56 0.71230.57 0.71570.58 0.71900.59 0.72240.60 0.72570.61 0.72910.62 0.73240.63 0.73570.64 0.73890.65 0.74220.66 0.74540.67 0.74860.68 0.75170.69 0.75490.70 0.75800.71 0.76110.72 0.76420.73 0.76730.74 0.77040.75 0.77340.76 0.77640.77 0.77940.78 0.78230.79 0.7852

x Φ(x)0.80 0.78810.81 0.79100.82 0.79390.83 0.79670.84 0.79950.85 0.80230.86 0.80510.87 0.80790.88 0.81060.89 0.81330.90 0.81590.91 0.81860.92 0.82120.93 0.82380.94 0.82640.95 0.82890.96 0.83150.97 0.83400.98 0.83650.99 0.83891.00 0.84131.01 0.84381.02 0.84611.03 0.84851.04 0.85081.05 0.85311.06 0.85541.07 0.85771.08 0.85991.09 0.86211.10 0.86431.11 0.86651.12 0.86861.13 0.87081.14 0.87291.15 0.87491.16 0.87701.17 0.87901.18 0.88101.19 0.8830

x Φ(x)1.20 0.88491.21 0.88691.22 0.88881.23 0.89071.24 0.89251.25 0.89441.26 0.89621.27 0.89801.28 0.89971.29 0.90151.30 0.90321.31 0.90491.32 0.90661.33 0.90821.34 0.90991.35 0.91151.36 0.91311.37 0.91471.38 0.91621.39 0.91771.40 0.91921.41 0.92071.42 0.92221.43 0.92361.44 0.92511.45 0.92651.46 0.92791.47 0.92921.48 0.93061.49 0.93191.50 0.93321.51 0.93451.52 0.93571.53 0.93701.54 0.93821.55 0.93941.56 0.94061.57 0.94181.58 0.94291.59 0.9441

x Φ(x)1.60 0.94521.61 0.94631.62 0.94741.63 0.94841.64 0.94951.65 0.95051.66 0.95151.67 0.95251.68 0.95351.69 0.95451.70 0.95541.71 0.95641.72 0.95731.73 0.95821.74 0.95911.75 0.95991.76 0.96081.77 0.96161.78 0.96251.79 0.96331.80 0.96411.81 0.96491.82 0.96561.83 0.96641.84 0.96711.85 0.96781.86 0.96861.87 0.96931.88 0.96991.89 0.97061.90 0.97121.91 0.97191.92 0.97261.93 0.97321.94 0.97381.95 0.97441.96 0.97501.97 0.97561.98 0.97611.99 0.9767

Page 48: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

48 Tabulky

Tabulka A.2: Hodnoty distribuční funkce Φ(x)Φ(x)Φ(x)normované normální náhodné veličiny

x Φ(x)2.00 0.97732.01 0.97782.02 0.97832.03 0.97882.04 0.97932.05 0.97982.06 0.98032.07 0.98082.08 0.98122.09 0.98172.10 0.98212.11 0.98262.12 0.98302.13 0.98342.14 0.98382.15 0.98422.16 0.98462.17 0.98502.18 0.98542.19 0.98572.20 0.98612.21 0.98642.22 0.98682.23 0.98712.24 0.98752.25 0.98782.26 0.98812.27 0.98842.28 0.98872.29 0.98902.30 0.98932.31 0.98962.32 0.98982.33 0.99012.34 0.99042.35 0.99062.36 0.99092.37 0.99112.38 0.99132.39 0.9916

x Φ(x)2.40 0.99182.41 0.99202.42 0.99222.43 0.99252.44 0.99272.45 0.99292.46 0.99312.47 0.99322.48 0.99342.49 0.99362.50 0.99382.51 0.99402.52 0.99412.53 0.99432.54 0.99452.55 0.99462.56 0.99482.57 0.99492.58 0.99512.59 0.99522.60 0.99532.61 0.99552.62 0.99562.63 0.99572.64 0.99592.65 0.99602.66 0.99612.67 0.99622.68 0.99632.69 0.99642.70 0.99652.71 0.99662.72 0.99672.73 0.99682.74 0.99692.75 0.99702.76 0.99712.77 0.99722.78 0.99732.79 0.9974

x Φ(x)2.80 0.99742.81 0.99752.82 0.99762.83 0.99772.84 0.99772.85 0.99782.86 0.99792.87 0.99792.88 0.99802.89 0.99812.90 0.99812.91 0.99822.92 0.99832.93 0.99832.94 0.99842.95 0.99842.96 0.99852.97 0.99852.98 0.99862.99 0.99863.00 0.99873.01 0.99873.02 0.99873.03 0.99883.04 0.99883.05 0.99893.06 0.99893.07 0.99893.08 0.99903.09 0.99903.10 0.99903.11 0.99913.12 0.99913.13 0.99913.14 0.99923.15 0.99923.16 0.99923.17 0.99923.18 0.99933.19 0.9993

x Φ(x)3.20 0.99933.21 0.99933.22 0.99943.23 0.99943.24 0.99943.25 0.99943.26 0.99943.27 0.99953.28 0.99953.29 0.99953.30 0.99953.31 0.99953.32 0.99963.33 0.99963.34 0.99963.35 0.99963.36 0.99963.37 0.99963.38 0.99963.39 0.99973.40 0.99973.41 0.99973.42 0.99973.43 0.99973.44 0.99973.45 0.99973.46 0.99973.47 0.99973.48 0.99973.49 0.99983.50 0.99983.51 0.99983.52 0.99983.53 0.99983.54 0.99983.55 0.99983.56 0.99983.57 0.99983.58 0.99983.59 0.9998

x Φ(x)3.60 0.99983.61 0.99983.62 0.99993.63 0.99993.64 0.99993.65 0.99993.66 0.99993.67 0.99993.68 0.99993.69 0.99993.70 0.99993.71 0.99993.72 0.99993.73 0.99993.74 0.99993.75 0.99993.76 0.99993.77 0.99993.78 0.99993.79 0.99993.80 0.99993.81 0.99993.82 0.99993.83 0.99993.84 0.99993.85 0.99993.86 0.99993.87 0.99993.88 0.99993.89 1.00003.90 1.00003.91 1.00003.92 1.00003.93 1.00003.94 1.00003.95 1.00003.96 1.00003.97 1.00003.98 1.00003.99 1.0000

Tabulka A.3: Kvantily u(α)u(α)u(α) normované normální náhodné veličiny

α 0.900 0.950 0.975 0.990 0.995u(α) 1.282 1.645 1.960 2.326 2.576

Page 49: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

49

Tabulka A.4: Kvantily χ2(n; α)χ2(n; α)χ2(n; α) rozdělení χ2(n)χ2(n)χ2(n)

n\α 0.005 0.010 0.025 0.050 0.100 0.900 0.950 0.975 0.990 0.9951 0.000 0.000 0.001 0.004 0.016 2.706 3.842 5.024 6.635 7.8792 0.010 0.020 0.051 0.103 0.211 4.605 5.992 7.378 9.210 10.603 0.072 0.115 0.216 0.352 0.584 6.251 7.815 9.348 11.35 12.844 0.207 0.292 0.484 0.711 1.064 7.779 9.488 11.14 13.28 14.865 0.412 0.554 0.831 1.146 1.610 9.236 11.07 12.83 15.09 16.756 0.676 0.872 1.237 1.635 2.204 10.65 12.59 14.45 16.81 18.557 0.989 1.239 1.690 2.167 2.833 12.02 14.07 16.01 18.48 20.288 1.344 1.647 2.180 2.733 3.490 13.36 15.51 17.54 20.09 21.969 1.735 2.088 2.700 3.325 4.168 14.68 16.92 19.02 21.67 23.59

10 2.156 2.558 3.249 3.940 4.865 15.99 18.31 20.48 23.21 25.1911 2.603 3.054 3.816 4.575 5.578 17.28 19.68 21.92 24.73 26.7612 3.074 3.571 4.404 5.226 6.304 18.55 21.03 23.34 26.22 28.3013 3.565 4.107 5.009 5.892 7.042 19.81 22.36 24.74 27.69 29.8214 4.075 4.660 5.629 6.571 7.790 21.06 23.69 26.12 29.14 31.3215 4.601 5.229 6.262 7.261 8.547 22.31 25.00 27.49 30.58 32.8016 5.142 5.812 6.608 7.962 9.312 23.54 26.30 28.85 32.00 34.2717 5.697 6.408 7.564 8.672 10.09 24.77 27.59 30.19 33.41 35.7218 6.265 7.015 8.231 9.391 10.87 25.99 28.87 31.53 34.81 37.1619 6.844 7.633 8.907 10.12 11.65 27.20 30.14 32.85 36.19 38.5820 7.434 8.260 9.591 10.85 12.44 28.41 31.41 34.17 37.57 40.0021 8.034 8.897 10.28 11.59 13.34 29.62 32.67 35.48 38.93 41.4022 8.643 9.543 10.98 12.34 14.04 30.81 33.92 36.78 40.29 42.8023 9.260 10.20 11.69 13.09 14.85 32.01 35.17 38.08 41.64 44.1824 9.887 10.86 12.40 13.85 15.66 33.20 36.42 39.36 42.98 45.5625 10.52 11.52 13.12 14.61 16.47 34.38 37.65 40.65 44.31 46.9326 11.16 12.20 13.84 15.38 17.29 35.56 38.89 41.92 45.64 48.2927 11.81 12.88 14.57 16.15 18.11 36.74 40.11 43.20 46.96 49.6528 12.46 13.57 15.31 16.93 18.94 37.92 41.34 44.46 48.28 50.9929 13.12 14.26 16.05 17.71 19.77 39.09 42.56 45.72 49.59 52.3430 13.79 14.95 16.79 18.49 20.60 40.26 43.77 46.98 50.89 53.67

Page 50: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

50 Tabulky

Tabulka A.5: Kvantily t(n; α)t(n; α)t(n; α) rozdělení t(n)t(n)t(n)

n\α 0.900 0.950 0.975 0.990 0.9951 3.078 6.314 12.71 31.82 63.662 1.886 2.920 4.303 6.964 9.9253 1.638 2.353 3.182 4.541 5.8414 1.533 2.132 2.776 3.747 4.6045 1.476 2.015 2.571 3.365 4.0326 1.440 1.943 2.447 3.143 3.7077 1.415 1.895 2.365 2.998 3.5008 1.397 1.860 2.306 2.897 3.3559 1.383 1.833 2.262 2.821 3.250

10 1.372 1.813 2.228 2.764 3.16911 1.363 1.796 2.201 2.718 3.10612 1.356 1.782 2.179 2.681 3.05513 1.350 1.771 2.160 2.650 3.01214 1.345 1.761 2.145 2.625 2.97715 1.341 1.753 2.131 2.603 2.94716 1.337 1.746 2.120 2.584 2.92117 1.333 1.740 2.110 2.567 2.89818 1.330 1.734 2.101 2.552 2.87819 1.328 1.729 2.093 2.540 2.86120 1.325 1.725 2.086 2.520 2.84521 1.323 1.721 2.080 2.518 2.83122 1.321 1.717 2.074 2.508 2.81923 1.320 1.714 2.069 2.500 2.80724 1.318 1.711 2.064 2.492 2.79725 1.316 1.708 2.060 2.485 2.78726 1.315 1.705 2.056 2.479 2.77927 1.314 1.703 2.052 2.473 2.77128 1.313 1.701 2.048 2.467 2.76329 1.311 1.699 2.045 2.462 2.75630 1.310 1.697 2.042 2.457 2.750∞ 1.282 1.645 1.960 2.326 2.576

Page 51: PRAVDÌPODOBNOST A MATEMATICK` STATISTIKAfast.darmy.net/opory - I Bc/GA03-Pravdepodobnost_a... · 2014-03-14 · vysokÉ u¨en˝ technickÉ v brnÌ fakulta stavebn˝ helena koutkov`

Literatura

[1] Anděl, J.: Statistické metody. MATFYZPRESS Praha 1993.

[2] Cyhelský, L., Hustopecký, J., Závodský, P.: Příklady k teorii statistiky.SNTL/ALFA Praha 1978.

[3] Friedrich, V.: Statistika 1 - vysokoškolská učebnice pro DS. EF ZU Plzeň2002.

[4] Hátle, J., Likeš, J.: Základy počtu pravděpodobnosti a matematické statis-tiky. SNTL/ALFA Praha 1972.

[5] Hebák, P., Kahounová, J.: Počet pravděpodobnosti v příkladech. SNTLPraha 1988.

[6] Jarušková, D., Hála, M.: Pravděpodobnost a matematická statistika 12.ČVUT Praha 2000.

[7] Jarušková, D.: Matematická statistika 12. ČVUT Praha 1995.

[8] Koutková, H., Moll, I.: Úvod do pravděpodobnosti a matematické statis-tiky. VUT Brno 2001.

[9] Koutková, H., Dlouhý, O.: Sbírka příkladů z pravděpodobnosti a matema-tické statistiky. VUT Brno 2002.

[10] Křivý, J.: Základy matematické statistiky. Ostrava 1983.

[11] Likeš, J., Laga, J.: Základní statistické tabulky. SNTL Praha 1978.

[12] Likeš, J., Machek, J.: Matematická statistika. Matematika pro vysokéškoly technické. Sešit XI. SNTL Praha 1981.

[13] Novovičová, J.: Pravděpodobnost a matematická statistika 12. ČVUTPraha. 1999.

[14] Škrášek, J., Tichý, Z.: Základy aplikované matematiky III. SNTL Praha1990.

[15] Vorlíček, M., Holický M., Špačková, M.: Pravděpodobnost a matematickástatistika pro inženýry. VUT Praha 1979.

[16] Walpole, R. E., Myers, R. H.: Probability and Statistics for Engineers andScientists. MACMILLAN PUBLISHING COMPANY New York 1990.