Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Matematika 4BProf. RNDr. Jan Hamhalter, CSc.
katedra matematiky FEL ČVUT
e-mail: [email protected]
tel: 224353587
web:http://math.feld.cvut.cz//hamhalte
11. ledna 2007
16:56
1
• V.Rogalewicz: Pravděpodobnost a statistika pro in-ženýry, skripta, Vydavatelství ČVUT, 1998.
• K.Zvára a J.Štěpán: Pravděpodobnost a matema-tická statistika, matfyzpress, Praha 2002.
• J.Anděl: Matematika náhody, matfyzpress, Praha 2003.
• J.Anděl: Statistické metody, matfyzpress, Praha 2003.
• V.Dupač a M.Hušková: Pravděpodobnost a matema-tická statistika, Nakladatelství Karolinum, 1999.
• Z.Prášková: Základy náhodných procesů II, Nakla-datelství Karolinum, 2004.
• A. Rényi: Teorie pravděpodobnosti, Academia, Praha1972.
2
1 Historie a podstatateorie pravděpodobnosti
teorie pravděpodobnosti = matematika náhody, systémy snedostatkem informace
svět 19. století – deterministický systém, hodinový strojsvět 20. století – svět náhody (evoluce není možná bez ná-hody, mikrosvět se řídí pravděpodobnostními zákony, teoriechaosu, apod.)
• Úloha o rozdělení sázkyPochází od Arabů. Nedávno objevena v rukopise z r. 1380.
Dva hráči hrají sérii partií. Výsledky jednotlivých her jsounezávislé. Vyhrává ten kdo poprvé zvítězí v šesti partiích.Pravděpodobnost výhry je pro každého hráče stejná, t.j.1/2. Hra je přerušena ve chvíli kdy hráč A vyhrál 5x a hráčB 3x. Jak si rozdělí výhru?
Úloha byla vyřešena nezávisle Pascalem a Fermatem (1654).
Všechny možnosti pokračování (hra bude trvat nejvýše třidalší partie):
AAA AAB ABA ABBBAA BAB BBA BBB
Pouze v jednom případě vítězí B, pravděpodobnost výhryhráče B je 1:8, výhra by se měla rozdělit v poměru 7:1.
3
• Huygens (1657) : On Reasoning in Games of Dice
• Laplace (1812): Analytic Theory of Probabilities
nestačí kombinatorické metody, je třeba uvažovat neko-nečné soubory možností
statistická fyzika, Brownův pohyb, teorie míry a integrace
• A. Kolmogorov (1930): Axiomatické základy teorie prav-děpodobnosti
• současný stav a perspektivy: nové obory založené na prav-děpodobnostním přístupu – kvantová teorie informace,teorie her v ekonomii, teorie chaosu, . . .
4
2 Pravděpodobnostní prostor
pravděpodobnostní model má dvě komponenty:
• struktura náhodných jevů
• pravděpodobnost jako kvantitativní funkce na jevech
2.1. Příklad. Střelba na terčΩ = kruh o poloměru rnáhodné jevy = podmnožiny Ω
pravděpodobnost(A) =obsah(A)
πr2.
5
2.2. Příklad. Sportka
Ω = 1, 2, 3, 4, 5, 6, 1, 3, 4, 6, 2, 17, . . . = šestiprvkové podmnožiny množiny 1, 2, . . . , 49
tyto šestice tvoří elementární jevy s pravděpodobností
1(496
) = 113983816
= 0, 7151138242 · 10−7
jev= podmnožina Ω
pravděpodobnost jevu A ⊂ Ω.
P (A) =velikost(A)(49
6
) .
konkrétní výpočet v tomto modelu – spočtěte pravděpo-dobnost, že uhodnete (právě) tři čísla.
P (A) =
(63
)·(433
)(496
) = 0, 1765040387
6
náhodné jevy musíme umět kombinovat„ jev A nebo jev Bÿ, . . .
2.3. Definice. Nechť Ω je neprázdná množina. SystémA podmnožin množiny Ω se nazývá σ-algebra náhodnýchjevů, jestliže platí
(i) Ω ∈ A.
(ii) Jestliže A1, A2, . . . jsou množiny v A, pak⋃∞i=1Ai ∈ A
(iii) Je-li A ∈ A, pak Ac = Ω \A ∈ A
Terminologie:Ac. . . opačný jev k jevu AA,B jsou navzájem vylučující se (disjunktní) jevy jestližeA ∩B = ∅
7
2.4. Tvrzení. Je-li A σ-algebra podmnožin Ω pak
(i) A1, A2, . . . ∈ A =⇒⋂∞
i=1Ai ∈ A.
(ii) A,B ∈ A =⇒ A ∩Bc ∈ A.
Důkaz:(i) Ac
1, Ac2, . . . ∈ A,=⇒
⋃∞i=1Ac
i ∈ A =⇒(de Morganova pravidla)( ∞⋃
i=1
Aci
)c
=∞⋂
i=1
Ai ∈ A .
(ii) A,Bc ∈ A =⇒ A ∩Bc ∈ A .
8
pravděpodobnost modeluje relativní četnost, měla by re-spektovat stejná pravidla jako počet prvků množiny
2.5. Definice. Předpokládejme, že A je σ-algebra pod-množin množiny Ω. Pravděpodobnost P je zobrazení
P : A → [0, 1] ,
pro které platí
(i) P (Ω) = 1
(ii) P (⋃∞
i=1Ai) =∑∞
i=1 P (Ai),jestliže A1, A2, .... jsou navzájem disjunktní množinyv A.
Trojice (Ω,A, P ) se nazývá pravděpodobnostní prostor.
9
Základní vlastnosti pravděpodobnosti
(i) A ∩B = ∅ =⇒ P (A ∪B) = P (A) + P (B)
(ii) P (∅) = 0(⇐= P (Ω) + P (∅) = P (Ω))
(iii) P (Ac) = 1− P (A)(⇐= P (A) + P (Ac) = P (Ω) = 1.)
(iv) A ⊂ B =⇒ P (B ∩Ac) = P (B)− P (A)(⇐= P (B) = P (A) + P (B ∩Ac))
(v) P (A ∪B) = P (A) + P (B)− P (A ∩B).
odvození: X = A ∩ (A ∩B)c , Y = B ∩ (A ∩B)c
P (X) + P (Y ) + P (A ∩B) = P (A ∪B)
P (A)−P (A∩B)+P (B)−P (A∩B)+P (A∩B) = P (A∪B)
P (A) + P (B) = P (A ∪B) + P (A ∩B)
10
Tato základní pravidla jsou často užitečná při konkrétníchvýpočtech.
2.6. Příklad. Určete pravděpodobnost, že při tahu Sportkybude vylosováno buďto číslo 7 nebo číslo 20.
Řešení: A . . . taženo číslo 7, B . . . taženo číslo 20.
P (A) = P (B) =
(485
)(496
)P (A ∩B) =
(474
)(496
)Tedy
P (A ∪B) = 2 ·(485
)(496
) − (474
)(496
) = 1356= 0, 232148571 .
11
Důležité typy pravděpodobnostních prostorů:
• klasický pravděpodobnostní prostor
• konečný pravděpodobnostní prostor
• diskrétní nekonečný pravděpodobnostní prostor
• geometrický pravděpodobnostní prostor
12
Klasický pravděpodobnostní prostor
Ω = ω1, . . . , ωnA = všechny podmnožiny množiny Ω
P (A) =|A||Ω|=|A|n
.
V tomto modelu mají elementární jevy stejnou šanci = 1n .
Někdy je těžké nalézt dobrý model slovní úlohy, často sesetkáme se složitou kombinatorikou.
13
2.7. Příklad. Hodíme n krát mincí, rub i líc v jednomhodu mají stejnou šanci, tj. 12 . Jaká je pravděpodobnost žepadne právě k krát líc?
Řešení: elementární jevy – posloupnosti nul a jedniček délkyn kódující výsledky hodů.
|Ω| = 2n
Ω = ω1, . . . , ω2n
Ak . . . . posloupnost obsahuje právě k jedniček.
|Ak| =(
n
k
)Tedy
P (Ak) =12n
(n
k
).
Poznámka: Hodíme n krát mincí, kde n je sudé. Jaká jepravděpodobnost, že padne stejný počet nul jako jedniček?
P (An/2) =12n
(n
n/2
)Pomocí tzv. Stirlingova vzorce lze dokázat, že
P (An/2) ≈1√
πn/2→ 0 pro n →∞ .
14
2.8. Příklad. Narozeninový problémJaká je pravděpodobnost, že ve třídě s n žáky se najdedvojice mající narozeniny ve stejný den? (n ≤ 365).
Řešení:
Ω = posloupnosti délky n
prvků množiny 1, 2, . . . , 365
Elementární jevy kódují den narozenin 1. až n-tého žáka.
A . . . sledovaný jevAc . . . jev opačný, všichni mají narozeniny v jiný den.
|Ω| = 365n
|Ac| = 365 · 364 · 363 · · · (365− n+ 1)
P (A) = 1− 365 · 364 · 363 · · · (365− n+ 1)365n
=
= 1 −n−1∏j=1
(1 − j
365
)Nečekané numerické hodnoty:již pro n = 23 je P (A) > 1/2,pro n = 56 je P (A) = 0, 99.
15
Konečný pravděpodobnostní prostor
Ω = ω1, . . . , ωnA = všechny podmnožiny Ω
p1, . . . , pn > 0 . . . váhyn∑
i=1
pi = 1
P (ωi) = pi
• Z toho vyplývá že
P (A) =∑
i|ωi∈A
pi ,
pro všechny A ⊂ Ω.
• Klasický pravděpodobnostní prostor je speciálním přípa-dem, ve kterém jsou všechny váhy stejné:
p1 = p2 = · · · = pn =1n
.
16
2.9. Příklad. Ω = ω1, ω2, ω3
p1 = P (ω1) =12
p2 = P (ω2) =14
p3 = P (ω3) =14
ω1 ω2 ω312
14
14
Je tedy např.
P (ω1, ω2) = p1 + p2 =12+14=34
.
17
Bernoulliovo schéma
Máme jev A (zdar) s pravděpodobností 0 < p < 1a jev B (nezdar) s pravděpodobností 0 < 1− p < 1.V náhodném pokusu nastane právě jeden z jevů A a B spříslušnou pravděpodobností. Provedeme sérii n těchto ná-hodných pokusů, jejichž výsledky se navzájem neovlivňují.
Možné výstupy pro n = 4: ABAA, BBBA, . . .kódovány posloupnostmi 0 a 1: 1011, 0001, . . .
Elementární jevy —- posloupnosti nul a jedniček délky n
Nezávislost znamená, že pravděpodobnosti se násobí:
P (1011) = p · (1− p) · p · p = p3 · (1− p)
P (0001) = (1− p) · (1− p) · (1− p) · p = p · (1− p)3
18
To nás vede k následujícímu modelu:
Ω= všechny posloupnosti nul a jedniček délky n
|Ω| = 2n.
P (posloupnost ) = ppočet 1 · (1− p)počet 0
Ověříme, že součet vah je 1:
2n∑i=1
pi =n∑
k=0
(n
k
)pk (1− p)n−k =
= (p + (1 − p))n = 1.
Důležitý je jev, Ak, že v sérii n pokusů nastane jev A právěk krát.
|Ak| =(nk
).
P (Ak) =
(n
k
)pk (1− p)n−k .
Konkrétní příklady: hod mincí, hod kostkou, ankety, statis-tické šetření, apod.
2.10. Příklad. Terč zasáhneme s pravděpodobností 1/3.Jaká je pravděpodobnost, že se dvakrát strefíme při čtyřechpokusech.
P (A2) =
(42
)132
(23
)2=48161= 0, 2963 .
19
Nekonečný diskrétní pravděpodobnostní prostor
Ω = ω1, ω2, . . . A = všechny podmnožiny Ω(pn)
∞n=1 . . . posloupnost vah
∞∑n=1
pn = 1, pn ≥ 0
P (ωn) = pn pro n = 1, 2, . . .
• Z toho vyplývá, že
P (A) =∑
n|ωn∈A
pn ,
pro všechny A ⊂ Ω.
20
Poissonův zákon
Ω = ω0, ω1, ω2 . . . λ > 0 parametr
pn =λn
n!e−λ , n = 0, 1, . . .
Ověříme korektnost zadání:∞∑
n=0
λn
n!e−λ = e−λ
∞∑n=0
λn
n!= e−λ eλ = 1 .
2.11. Příklad. Za danou časovou jednotku volá na ústřednuprůměrně λ > 0 účastníků. Pravděpodobnost pn, že zavoláprávě n účastníků se řídí Poissonovým zákonem:
pn =λn
n!e−λ
Pravděpodobnost, že zavolá alespoň někdo je 1− e−λ.
21
Geometrický pravděpodobnostní prostor
pravděpodobnost je dána geometrickou kvantitou (délka,obsah, objem)
Ω ⊂ R, R2, R3, . . . ,
0 < velikost (Ω) < ∞ ,
P (A) =velikost (A)velikost (Ω)
pro A ⊂ Ω.
2.12. Příklad. Terč má poloměr 30 cm. Jaká je pravdě-podobnost, že se trefíme do středu o poloměru 5cm ?
Řešení:
p =25π900π
= 0, 02777 . . . .
22
2.13. Příklad. Buffonova úlohaV rovině je dán systém rovnoběžek majících vzdálenost d.Na rovinu hodíme jehlu o velikosti l, l < d. Jaká je prav-děpodobnost, že protne některou rovnoběžku?
Řešení: Polohu jehly vůči rovnoběžné síti popíšeme dvěmaparametry:
x . . . vzdálenost středu jehly od nejbližší rovnoběžky
x ∈< 0,d
2>
ϕ . . . úhel, který jehla svírá s rovnoběžnou sítí
ϕ ∈< 0, π > .
Podmínka protnutí:
l
2sinϕ > x
P =1
π d/2
π∫0
l
2sinϕdϕ =
l
πd
[− cosϕ
]π
0
=
=2lπd
.
23
Další vlastnosti pravděpodobnosti:
Princip inkluze a exkluze
Opakování: P (A ∪B) = P (A) + P (B)− P (A ∩B).
Mějme nyní tři jevy A,B,C ∈ A.
P (A ∪B ∪ C) = P [(A ∪B) ∪ C] =
P (A ∪B) + P (C)− P ((A ∩ C) ∪ (B ∩ C))
= P (A) + P (B)− P (A ∩B) + P (C)
− P (A ∩ C)− P (B ∩ C) + P (A ∩B ∩ C)
= P (A) + P (B) + P (C)
− P (A ∩ C)− P (B ∩ C)− P (A ∩B)
+ P (A ∩ B ∩ C)
24
Zobecnění se dá dokázat indukcí:
2.14. Věta. Princip inkluze a exkluzePředpokládejme, že A1, . . . , An ∈ A, kde (Ω,A, P ) jepravděpodobnostní prostor. Pak platí
P (A1∪A2∪· · ·∪An) =∑1≤i≤n
P (Ai)−∑
1≤i<j≤n
P (Ai∩Aj)
+∑
1≤i<j<k≤n
P (Ai∩Aj∩Ak)+· · ·+(−1)n+1P (∩ni=1Ai) .
25
2.15. Příklad. Roztržitá šatnářkan hostů restaurace si přichází odložit svůj kabát. Šatnářkavydává kabáty chaoticky. Jaká je pravděpodobnost, že ale-spoň jeden z hostů dostane svůj kabát?
Řešení: Elementární jevy jsou permutace n prvkové mno-žiny. (
1 2 . . . nk1 k2 . . . kn
)Všechny mají stejnou pravděpodobnost, tj. 1n! .
A = (k1, . . . , kn) | existuje 1 ≤ i ≤ n tak že ki = i .
A = A1 ∪A2 ∪ · · · ∪An ,
kde
Ai = (k1, . . . , kn) | ki = i
(i-tý host je v pořádku)
P (Ai) =(n− 1)!
n!
P (Ai ∩Aj) =(n− 2)!
n!, i 6= j
P (A1 ∩A2 ∩ · · · ∩An) =1n!
26
P (A) = 1−(
n
2
)(n− 2)!
n!+
(n
3
)(n− 3)!
n!−· · ·+(−1)n+1 1
n!
= 1− 12!+13!− · · ·+ (−1)n+1 1
n!
numerické hodnoty:
n 1 2 3 4 5 6 7P (A) 1 0,5 0,6667 0,625 0,6333 0,6319 0,6321
asymptoticky:
e−1 = 1− 11!+12!− 13!+ · · ·
limn→∞
P (A) = 1− e−1 = 0, 6321....
27
Zacházení s nekonečnými posloupnostmi jevů, spojitost prav-děpodobnosti:
2.16. Věta. Předpokládejme, že (Ω,A, P ) je pravděpo-dobnostní prostor.
(i) Je-li A1 ⊂ A2 ⊂ · · · pro A1, A2, · · · z A, pak
P
( ∞⋃i=1
Ai
)= lim
i→∞P (Ai)
(ii) Je-li A1 ⊃ A2 ⊃ · · · pro A1, A2, · · · z A, pak
P
( ∞⋂i=1
Ai
)= lim
i→∞P (Ai)
Důkaz: (An) splňuje (i)
An = A1 ∪ (A2 \A1) ∪ (A3 \A2) ∪ · · · ∪ (An \An−1)
je disjunktní sjednocení. Pak
P (An) = P (A1) + P (A2 \A1) + P (A3 \A2) +
+ · · · + P (An \ An−1) .
Dále platí∞⋃
n=1
An = A1 ∪ (A2 \A1) ∪ (A3 \A2) ∪ · · ·
28
P
( ∞⋃n=1
An
)=
P (An)︷ ︸︸ ︷P (A1) + P (A2 \A1) + · · ·+ P (An \An−1)+ · · · =
= limn→∞
P (An)
P
( ∞⋃n=1
An
)= lim
n→∞P (An)
(ii) obdobným způsobem, nebo z (i) přechodem k množi-novému komplementu.
29
3 Nezávislé jevy a podmíněná prav-děpodobnost
Pravděpodobnostní model se mění dostaneme-li částečnouinformaci o systému. Víme, že nastal jev B. Pak pravdě-podobnost, že nastane jev A je
P (A ∩B)P (B)
.
———————————————————————
3.1. Definice. Je dán pravděpodobnostní prostor (Ω,A, P )a B ∈ A s P (B) > 0. Podmíněná pravděpodobnost ná-hodného jevu A za podmínky B je definována jako
P (A|B) = P (A ∩B)P (B)
.
Tedy
P (A ∩B) = P (A|B)P (B) = P (B|A)P (A) .
30
3.2. Příklad. Skříňka má tři zásuvky. V první jsou dvězlaté mince, ve druhé zlatá a stříbrná mince a ve třetí dvěstříbrné mince.
•z1 • z2
•z3 s1
s2 s3
Náhodně jsme vybrali zásuvku a náhodně z ní vytáhli minci.Tažená mince je stříbrná. Jaká je pravděpodobnost, žedruhá mince ve vytažené zásuvce je zlatá?Řešení: naivní odpověď 1/2 není správná.Dvě fáze náhodného procesu:1. volba zásuvky 2. volba mince
Ω = (1, z1), (1, z2), (2, z3), (2, s1), (3, s2), (3, s3),
Všechny tyto jevy mají stejnou šanci, tj. 1/6.
Z . . . v otevřené zásuvce je zlatá minceS . . . vyjmuli jsme stříbrnou minci (tento jev nastal).Hledáme p = P (Z|S)
P (S) = P(2, s1), (3, s2), (3, s3) =36=12
.
P (Z ∩ S) = P(2, s1) = 1/6 .
p =1/63/6=13
.
31
Formální vlastnosti podmíněné pravděpodobnosti:
(i) P (B|B) = 1
(ii) P (A1 ∪A2|B) = P (A1|B) + P (A2|B)jsou-li A1, A2 ∈ A disjunktní.
————————————————-
3.3. Tvrzení. Je-li (Ω,A, P ) pravděpodobnostní prostora B ∈ A s P (B) > 0, pak (Ω,A, P ((·|B)) je také pravdě-podobnostní prostor.
————————————————————–V pravděpodobnostním prostoru (Ω,A, P ((·|B)) mají jevydisjunktní s B nulovou pravděpodobnost, podmnožiny v Bmají pravděpodobnost normovanou pravděpodobností jevuB.
32
Nezávislé jevy jsou jevy jejichž podmíněné pravděpodob-nosti se neovlivňují:
P (A), P (B) > 0
P (A) = P (A|B) = P (A ∩B)P (B)
P (A ∩B) = P (A) · P (B) .
——————————————————-
3.4. Definice. Nechť (Ω,A, P ) je pravděpodobnostní pro-stor. Jevy A a B ∈ A nazýváme nezávislé, jestliže
P (A ∩B) = P (A) · P (B) .
———————————————————-
3.5. Příklad. Dvakrát hodíme mincí. Všechny výsledkyjsou stejně pravděpodobné. Ukažte, že výsledky v prvníma druhém hodu jsou nezávislé.
Řešení: R. . . rub, L . . . líc
Ω = RL,RR,LR,LL
P (RL, RR) = 12
P (RL,LL) = 12
P (RL) = 14=12· 12
.
33
Obecnější definice:
3.6. Definice. JevyA1, . . . , An v pravděpodobnostní pro-stor (Ω,A, P ) jsou nezávislé, jestliže
P (Ai1 ∩Ai2 ∩ · · · ∩Aik) = P (Ai1)P (Ai2) · · ·P (Aik
)
pro všechna i1 < i2 < · · · < ik, k ≤ n.
Bernoulliovo schéma (revisited)
Výsledky pokusů v Bernoulliově schématu jsou nezávisléjevy. Bernoulliovo schéma tedy můžeme chápat jako sériinezávislých pokusů se dvěma možnými výsledky, které majídoplňkovou pravděpodobnost.
34
3.7. Příklad. Elektrický obvod znázorněný na obrázku jenáhodně přerušován pěti nezávislými spínači. V jedné větvijsou tři spínače a ve druhé dva. Jaká je pravděpodobnostže obvodem prochází proud? Každý spínač je přerušen spravděpodobností 1/2.
Řešení: Ai . . . i-tý vypínač je sepnut
p = P [(A1 ∩A2 ∩A3) ∪ (A4 ∩A5)] =
= P (A1 ∩A2 ∩A3) + P (A4 ∩A5)
− P (A1 ∩A2 ∩A3 ∩A4 ∩A5) =
=123+122− 125=1125= 0, 34375 .
3.8. Tvrzení. Jsou-li jevy A1, . . . , An v pravděpodob-nostním prostoru nezávislé, pak jsou nezávislé i jevyAc1, A2, . . . , An.
Důkaz:
P (Ac1 ∩A2 ∩ · · · ∩An) = P (A2 ∩A3 ∩ · · · ∩An)−− P (A1 ∩A2 ∩ · · · ∩An) =
P (A2)P (A3) · · ·P (An)−P (A1)P (A2) · · ·P (An) =
= (1− P (A1))P (A2) · · ·P (An) =
= P (Ac1)P (A2)P (A3) · · ·P (An) .
Důsledek: Nahradíme-li v nezávislém systému jevů některéjevy jejich opakem, dostaneme opět nezávislý systém.
35
Situace: A1, . . . , An disjunktní jevy, takové že
P (A1) + P (A2) + · · ·+ P (An) = 1
a P (Ai) > 0 pro všechna i. Pak
P ((A1 ∪A2 ∪ · · · ∪An)c) = 0 .
Pro každé B ∈ A máme
P (B) = P (B ∩A1) + P (B ∩A2) + P (B ∩A3) +
· · ·+ P (B ∩An) + 0 =
= P (B|A1)P (A1)+P (B|A2)P (A2)+· · ·+P (B|An)P (An) .
———————————————————–
3.9. Definice. PosloupnostA1, . . . , An disjunktních jevův pravděpodobnostním prostoru (Ω,A, P ) se nazývá úplnýsystém jevů jestliže A1, . . . , An jsou disjunktní, P (Ai) > 0pro všechna i a
P (A1) + P (A2) + · · ·+ P (An) = 1 .
3.10. Věta. (Věta o úplné pravděpodobnosti)Předpokládejme že A1, . . . , An je úplný systém jevův pravděpodobnostním prostoru (Ω,A, P ) takový, žeP (Ai) > 0 pro všechna i = 1, . . . n. Pro každé B ∈ Aplatí
P (B) = P (B|A1)P (A1) + P (B|A2)P (A2) ++ · · ·+ P (B|An)P (An)
36
„P (B) je kombinace pravděpodobností P (A1), . . . , P (An)s váhami danými podmíněnými pravděpodobnostmiÿ
3.11. Příklad. V urně č.1 je 50 černých a 60 bílých kuli-ček. V urně č.2 je 60 černých a 50 bílých kuliček. Hodíme sihrací kostkou. Padne-li šestka vybereme urnu č. 1. V opač-ném případě urnu č.2. Z vybrané urny vybereme náhodněkuličku. Jaká je pravděpodobnost, že je bílá?
Řešení:
50 • 60 60 • 50 (1)
A1...padne šestka A2...nepadne šestka
P (A1) = 1/6 P (A2) = 5/6
B . . . vytažená kulička je bílá
P (B|A1) =60110
P (B|A2) =50110
.
p =60110
· 16+50110
· 56=111+2566=3166=
= 0, 4697.
37
Bayesův vzorecBayes (1761) . . . stejné apriorní pravděpodobnostiLaplace (1774) . . . obecný případ
věta o úplné pravděpodobnosti:P (Ai), P (B|Ai)→ P (B)nyní určíme P (Ai|B):
3.12. Věta. Bayesův vzorecJe-li A1, . . . , An úplný systém jevů v pravděpodobnostnímprostoru (Ω,A, P ) a B ∈ A s P (B) > 0 pak
P (Aj |B) =P (B|Aj)P (Aj)∑ni=1 P (B|Ai)P (Ai)
pro všechna j = 1, 2, . . . , n.
Důkaz:
P (Aj |B) =P (Aj ∩B)
P (B)=
P (B|Aj)P (Aj)∑ni=1 P (B|Ai)P (Ai)
—————————————————————–vstup:P (A1), P (A2), . . . P (An) . . . apriorní pravděpodobnostiP (B|A1), P (B|A2), . . . P (B|An) . . . podmíněné pravděpo-dobnostiB . . . přináší novou informaci o stavu systému
výstup: P (A1|B), P (A2|B), . . . P (An|B) —— upřesněnáinformace
38
3.13. Příklad. Máme dvě krabice s bílými a černými ku-ličkami. V krabici č. 1 je jedna bílá a devět černých kuliček.V krabici č.2 je jedna černá a devět bílých kuliček.
1 9• č.1
1 • 9 č.2
Za plentou byla vylosována jedna z krabic. Náhodně jsmez ní vytáhli jednu kuličku. Byla bíla. Jaká je pravděpodob-nost, že máme před sebou krabici č.1. ?
A1 . . . první krabice P (A1) =12
A2 . . . druhá krabice P (A2) =12
B . . . tažena bílá kulička P (B|A1) =110
P (B|A2) =910
.
P (A1|B) =P (B|A1)P (A1)
P (B|A1)P (A1) + P (B|A2)P (A2)
=110 ·
12
110 ·
12 +
910 ·
12
=110 ·
12
12
=110
.
39
3.14. Příklad. Diagnóza nemoci
Senzitivita testu: 0,95 (tj. má-li osoba AIDS je test pozi-tivní v 95% případů)
specificita testu: 0,95 (tj. nemá-li osoba AIDS je test ne-gativní v 95% případů)
prevalence nemoci: 0,005 (tj. 0,5% populace je nakaženo)
Jaká je pravděpodobnost, že osoba s pozitivním testem jenakažena virem HIV?
(Naivní odpověď 0,95 je úplně mimo.)
AIDS NE-AIDS0,005 0,995
+, - . . . . výsledky testu
P (+|AIDS) = 0, 95 P (+|NEAIDS) = 0, 05
P (−|AIDS) = 0, 05 P (−|NEAIDS) = 0, 95
P (AIDS|+) =
=P (+|AIDS)P (AIDS)
P (+|AIDS)P (AIDS) + P (+|NEAIDS)P (NEAIDS)
=0, 95 · 0, 005
0, 95 · 0, 005 + 0, 05 · 0, 995= 0, 087 .
apriorní pravděpodobnosti→ aposteriorní pravděpodobnosti(0, 005, 0, 995)→ (0, 087, 0, 913) .
40
Test opakujeme znovu. Testovaná osoba je opět pozitivní.Jaká je nyní pravděpodobnost že má AIDS ?Opakujeme postup s
P (AIDS) = 0, 087 P (NEAIDS) = 0, 913 .
numerické výsledky:i . . . počet pozitivních testů,Pi . . . pravděpodobnost, že daná osoba má AIDS.
i 0 1 2 3 4 5Pi 0,005 0,087 0,645 0,972 0,998 0,9992
41
4 Náhodná veličina
• Zajímá nás pouze sledovaná numerická veličina, nikolivcelý pravděpodobnostní prostor: počet zákazníků, cena ak-cie, hodnota měření napětí, . . .
• Podstatné je stanovit pravděpodobnost, že náhodná ve-ličina má hodnoty v daném rozmezí.
——————————————————–Značení:I . . . interval na reálné ose, zahrnujeme i jednobodové mno-žiny.
X : Ω→ R . . . funkce definovaná na množině Ω.
[X ∈ I] = ω ∈ Ω | X(ω) ∈ I .
4.1. Definice. Nechť (Ω,A, P ) je pravděpodobnostní pro-stor. FunkceX definovaná na Ω se nazývá náhodná veličinajestliže
[X ∈ I] ∈ A
pro všechny intervaly I ⊂ R.
42
Všechny funkce na konečném nebo diskrétním pravděpo-dobnostním prostoru jsou náhodné veličiny.
Náhodné veličiny popisujeme kvantitativně pomocí jejichdistribučních funkcí:
P [X ≤ x] = P (ω | X(ω) ≤ x) .
4.2. Definice. Předpokládejme, že X je náhodná veli-čina na pravděpodobnostním prostoru (Ω,A, P ).Distribuční funkce, FX , náhodné veličiny X je funkce
FX(x) = P [X ≤ x], x ∈ R .
43
4.3. Příklad. X . . . počet ok při hodu kostkouX nabývá šesti hodnot, 1,2,3,4,5,6; distribuční funkce jepo částech spojitá funkce.
4.4. Příklad. X . . . poloha ručičky hodinek při náhod-ném zastavení:
F (x) =
x2π x ∈< 0, 2π >
0 x ≤ 01 x ≥ 2π .
4.5. Příklad. Vlak projíždí přejezdem jedenkrát za ho-dinu, Závory jsou staženy na dvanáct minut. Náhodná ve-ličina X je doba čekání.
P [X = 0] =60− 1260
=4860= 0, 8 .
Pro x ∈ (0, 12 > máme:
P [X ≤ x] = P [X = 0] + P [0 < X ≤ x] = 0, 8 +x
60.
Tedy
FX(x) =
0 x < 0
0, 8 x = 0
0, 8 + x60 x ∈ (0, 12 >
1 x ≥ 12
44
4.6. Věta. Distribuční funkce FX náhodné veličiny Xsplňuje následující podmínky:
(i) 0 ≤ FX ≤ 1
(ii) FX je neklesající
(iii) FX je zprava spojitá
(iv) limx→−∞ FX(x) = 0, limx→∞ FX(x) = 1 .
Dukaz: (ii) Je-li x ≤ y, pak [X ≤ x] ⊂ [X ≤ y], a tedy
FX(x) ≤ FX(y) .
(iii) Volme (δn) klesající posloupnost kladných čísel s nu-lovou limitou a a ∈ R. Uvažujme množiny
An = [X ≤ a+ δn] .
Platí∞⋂
n=1
An = [X ≤ a] .
Dle spojitosti pravděpodobnosti Věta 2.16 platí
P [X ≤ a] = limn→∞
P (An) .
Jinými slovy
FX(a) = limn→∞
FX(a+ δn) ,
a proto
FX(a) = limx→a+
FX(x) .
45
(iv)
An = [X ≤ −n] , n = 1, 2 . . .
Pak An je klesající posloupnost množin s prázdným průni-kem. Dle Věty 2.16 máme
limn→∞
FX(−n) = limn→∞
P (An) = P (∅) = 0 .
FX je neklesající, a proto musí mít v −∞ limitu nula.(Druhá limita podobně.)
V distribuční funkci FX jsou všechny relevantní informaceo náhodné veličině X:
•P [X > a] = 1− P [X ≤ a] = 1− FX(a) .
•
P [X ∈ (a, b >] = P [(X ≤ b) ∧ (X ≤ a)c] =
= P [X ≤ b]− P [X ≤ a] = FX(b)− FX(a) .
•
P [X < a] = limn→∞
P
[X ≤ a− 1
n
]= lim
n→∞FX
(a− 1
n
)= lim
x→a−FX(x) .
•P [X = a] + P [X < a] = P [X ≤ a] .
Odtud
P [X = a] = FX(a)− limx→a−
FX(x) .
(Velikost případného skoku.)
46
4.7. Věta. Ke každé zprava spojité, neklesající funkciF (x) na R, s limitami limx→−∞ F (x) = 0,limx→∞ F (x) = 1, existuje náhodná veličina X tak, že
FX = F .
Důkaz je mimo naše možnosti – teorie míry.
distribuční funkce (náhodná rozdělení) = náhodné veličiny.
Typy náhodných veličin:
• diskrétní rozdělení
• spojité rozdělení
• smíšené rozdělení
47
4.8. Definice. Náhodná veličina X se nazývá diskrétní,jestliže existuje konečná nebo nekonečná posloupnost (xn)taková, že∑
n
P [X = xn] = 1 .
Daná tabulkou resp. pravděpodobnostní funkcí:
x1 x2 x3 · · ·p1 p2 p3 · · ·
P [X = xi] = pi , (xn)n . . . uzly
4.9. Příklad. X . . . počet ok při hodu hrací kostkou
1 2 3 4 5 61/6 1/6 1/6 1/6 1/6 1/6
4.10. Příklad. X . . . doba kdy poprvé padne líc při sériihodů symetrickou mincí.
1 2 3 · · ·12
14
13 · · ·
P [X = n] =12n
.
∞∑n=1
12n= 1 .
48
4.11. Tvrzení. Má-li náhodná veličina X diskrétní roz-dělení s pravděpodobnostní funkcí (xn, pn)n, pak proM ⊂ R platí
P [X ∈ M ] =∑
n | xn∈M
pn .
4.12. Příklad. Jaká je pravděpodobnost, že při házenísymetrickou mincí padne líc poprvé po sudém počtu hodů?
X z Příkladu 4.10.
P [X = sudé] =14+116+164+ · · · = 1
41
1− 14
=13
.
49
4.13. Definice. Náhodná veličina X se nazývá spojitá,jestliže existuje nezáporná funkce f taková, že
FX(x) =
x∫−∞
f(t) dt .
Funkce f se přitom nazývá hustotou náhodné veličiny X.
• Funkce f je hustotou náhodné veličiny právě tehdykdyž je nezáporná a
∫∞−∞ f(t) dt = 1.
• Je-li x bod spojitosti hustoty f , pak f(x) = FX(x)′.
Je-li f hustota náhodné veličiny X, pak
P [a ≤ X ≤ b] =
b∫a
f(x) dx .
Hustota dává preference hodnotám.
50
4.14. Příklad. f(x) =
1 x ∈< 0, 1 >
0 jinak(Rovnoměrné rozdělení)Pro x ∈< 0, 1 >
FX(x) =
x∫0
dt = x .
FX(x) =
0 x ≤ 0x x ∈< 0, 1 >
1 x ≥ 1
4.15. Příklad. f(x) =
x+12 x ∈< −1, 1 >
0 jinak
Pro distribuční funkci F (x) na intervalu < −1, 1 > platí
FX(x) =
x∫−1
t+ 12
dt =
[t2
4+
t
2
]x
−1=
=x2
4+
x
2+14=(x+ 1)2
4.
Pravděpodobnost roste s kvadratickou rychlostí. Pro dis-tribuční funkci máme
FX(x) =
0 x < −1(x+1)2
4 x ∈< −1, 1 >
1 x ≥ 1
51
4.16. Příklad. f(x) =
x+ 1 x ∈< −1, 0 >
1− x x ∈< 0, 1 >
0 jinakPro x ∈< −1, 0 >
FX(x) =
x∫−1
(t+ 1) dt =
[t2
2+ t
]x
−1=
x2
2+ x+
12
.
Pro x ∈< 0, 1 >
FX(x) =12+
x∫0
(1− t) dt =12+
[t− t2
2
]x
0
= −x2
2+ x+
12
.
4.17. Příklad. (Semicircular law)
f(x) =
12π
√4− x2 x ∈< −2, 2 >
0 jinak∫ √4− x2 dx =
12(x
√4− x2 + 4arcsin
x
2) + c .
Pro x ∈< −2, 2 > tedy máme:
FX(x) =14π
x√4− x2 +
1πarcsin
x
2+12
.
52
4.18. Příklad. f(x) =12e−|x| .
Pro x < 0
FX(x) =12
x∫−∞
et dt =ex
2.
Pro x ≥ 0
FX(x) =12+12
x∫0
e−t dt =12− 12e−x +
12= 1− 1
2e−x .
53
4.19. Příklad. Střílíme na terč o poloměru r. Výhra jedána vzdáleností zásahu d od středu terče vzorcem
X = 10(r − d) .
Nalezněte hustotu veličiny X.
Řešení:Pro 0 ≤ x ≤ 10r
P [X ≤ x] = P [10r − 10d ≤ x] = P
[d ≥ r − x
10
]=
= 1−P
[d ≤ r− x
10
]= 1−
π(r − x10 )2
π r2= 1−
(r − x10 )2
r2.
Hustota pro x ∈ (0, 10r >:
f(x) = F ′X(x) =
−2(r − x10 )
r2· −110=15r2
(r − x
10
).
Hustota je nulová mimo interval < 0, 10r >.
54
Důležité je reprezentovat náhodnou veličinu číselnými cha-rakteristikami. Jednou z nich je střední hodnota.
Motivace: Ve škole je N žáků z toho
n1 má prospěch x1 = 1n2 má prospěch x2 = 2n3 má prospěch x3 = 3n4 má prospěch x3 = 4n5 má prospěch x5 = 5
pi =ni
N . . . relativní četnost.
Průměrný prospěch =
=n1x1 + n2x2 + n3x3 + n4x4 + n5x5
N=
=n1N
x1 +n2N
x2 +n3N
x3 +n4N
x4 +n5N
x5 =
= x1p1 + x2p2 + x3p3 + x4p4 + x5p5 .
55
4.20. Definice. Nechť X je diskrétní náhodná veličina,která nabývá hodnot x1, x2, . . . s pravděpodobnostmi
P [X = xi] = pi,∑
i
pi = 1 .
Předpokládejme, že∑i
|xi| pi < ∞ .
Střední hodnota, EX, veličiny X je definovaná vztahem
EX =∑
i
xi pi .
4.21. Definice. Nechť X je náhodná veličina s hustotouf(x) taková, že
∞∫−∞
|x|f(x) dx < ∞ .
Střední hodnota, EX, veličiny X je definována vztahem:
EX =
∞∫−∞
x f(x) dx .
56
4.22. Příklad. Konstantní náhodná veličina
P [X = c] = 1
EX = c · 1 = c .
4.23. Příklad. Počet ok při hodu hrací kostkou
EX =16(1 + 2 + 3 + 4 + 5 + 6) = 3, 5 .
4.24. Příklad. Alternativní rozdělení0 11− p p
EX = 0 · (1− p) + 1 · p = p .
V tomto případě splývá střední hodnota s pravděpodob-ností p.
57
4.25. Příklad. Házíme symetrickou mincí. X je počethodů než padne první líc.
P [X = n] =12n
, n = 1, 2, . . .
EX =∞∑
n=1
n
2n.
Při výpočtu si pomůžeme teorií mocninných řad.∞∑
n=0
xn =11− x
, pro |x| < 1 .
Derivace člen po členu:
∞∑n=1
n xn−1 =
(11− x
)′
=1
(1− x)2.
Pronásobením x
∞∑n=1
n xn =x
(1− x)2
Dosazením x = 12
EX =∞∑
n=1
n
2n=21= 2 .
58
Na každá náhodná veličina má definovánu střední hodnotu.Např. diskrétní veličina s pravděpodobnostní funkcí
P [X = 2n] =12n
, n = 1, 2 . . .
nemá střední hodnotu neboť∞∑
n=1
2n
2n=
∞∑n=1
1 =∞ .
4.26. Příklad. Hustota
f(x) =
x+12 x ∈< −1, 1 >
0 jinak
EX =
1∫−1
xx+ 12
dx =
[x3
6+
x2
4
]1−1=13
.
59
4.27. Příklad. Semicircular law
EX =12π
2∫−2
x√1− x2 dx = 0 .
4.28. Věta. Jsou-li X1 a X2 náhodné veličiny na prav-děpodobnostním prostoru (Ω,A, P ), pak
(i) E(X1 +X2) = EX1 + EX2,
(ii) E(αX1) = αE(X1) , α ∈ R .
(iii) E(X1) ≥ 0 je-li X1 ≥ 0.
60
Podrobnější popis rozložení hodnot kolem střední hodnotyposkytuje rozptyl
4.29. Definice. Rozptyl (variance) náhodné veličinyX, pro kterou existuje EX a EX2 je definován
varX = E[(X − EX)2] .
Značení: var(X), D(X),
Směrodatná odchylka:√
var(X).
E[(X − EX)2] = E[X2 − 2X · (EX) + (EX)2] =
= E(X2) − (EX)2 .
Způsob výpočtu:
EX2 =∑
i
x2i pi . . . diskrétní veličina
EX2 =
∞∫−∞
x2 f(x) dx . . . spojitá veličina
61
4.30. Příklad. Alternativní rozdělení X
0 11− p p
X2 :
0 11− p p
var(X) = EX2 − (EX)2 = p− p2 = p(1− p) .
var(X) ≤ 14
Nejvyšší možná hodnota rozptylu je pro p = 12 a to
14 .
62
4.31. Definice. Nechť FX(x) je distribuční funkce ná-hodné veličiny X. Předpokládejme, že pro každé α ∈ (0, 1)existuje právě jedno β tak, že F (β) = α.
α-kvantil náhodné veličiny X je číslo, pro které platí
FX(xα) = α .
α = P [X ≤ xα] .
Je-li FX prostá, pak xα = F−1X (α) .
F−1X se v tomto případě nazývá kvantilová funkce.
Významné kvantily:
x0,5 . . . mediánx0,75 . . . horní kvartilx0,25 . . . dolní kvartilx0,9 . . . horní decilx0,1 . . . dolní decilx0,99 . . . horní percentil
Statistické tabulky: Průměrný čistý plat v ČR na osobu vdomácnosti v roce 2003 byl 8175 KČ.Dolní decil x0,1=4524 KČ.
63
4.32. Příklad. X je spojité rozdělení s hustotouf(x) = x+1
2 , x ∈< −1, 1 > a nula jinak.Viz Příklad 4.15.
F (x) =14(x+ 1)2 , x ∈< −1, 1 > .
α ∈ (0, 1)
F (x) =14(x+ 1)2 = α
|x+ 1| =√4α
xα = 2√
α− 1
Např. medián
x0,5 = 2√1/2− 1 .
64
4.33. Příklad. Doba rozpadu radioaktivního atomu jenáhodná veličina s hustotou
f(x) =
λ e−λx x ≥ 00 x < 0 ,
kde λ > 0. Určete poločas rozpadu.
Řešení:
Poločas rozpadu je medián. Pro distribuční funkci máme
F (x) =
x∫0
λe−λt dt = [−e−λt]x0 = 1− e−λx .
1− e−λx = 0, 5
e−λx = 0, 5
−λx = − ln 2
x =ln 2λ
Poločas rozpadu je medián
x0,5 =ln 2λ
.
65
4.34. Tvrzení. Platí-li pro náhodné veličinyX a Y vztah
Y = aX + b , a, b ∈ R, a > 0 ,
pak
yα = axα + b
pro všechna α ∈ (0, 1).
Důkaz:
α = P [X ≤ xα] = P [aX + b ≤ axα + b] = P [Y ≤ axα + b︸ ︷︷ ︸yα
] .
66
5 Důležitá rozdělení
Diskrétní rozdělení
Alternativní rozdělení A(p), 0 < p < 1.
0 11− p p
EX = p
varX = p(1− p) .
Binomické rozdělení Bi(n, p), n ∈ N, 0 < p < 1.
0 1 2 . . . np0 p1 p2 . . . pn
P [X = k] = pk =
(n
k
)pk (1− p)n−k k = 0, 1, . . . , n .
67
X = počet zdarů v sérii n pokusůBernoulliova schématu.
• počet líců v sérii n hodů
• počet osob volící daný politický subjekt z ndotázaných
• počet osob sledujících daný TV pořad z nsledovaných
• počet částic v náhodně zvolené příhrádce z npříhrádek
• počet vadných sučástek z n náhodně vybra-ných součástek
Xi =
1 nastal-li zdar v i− tém pokusu0 jinak
Xi má rozdělení A(p).
X = X1 +X2 + · · ·+Xn .
68
5.1. Příklad. S.Pepys (1693), náruživý hráč vkostky. Co je pravděodobnější, že šesti kostkamihodíme alespoň jednu šestku (jev A), nebo že dva-nácti kostkami hodíme alespoň dvě šestky (jev B)?Vyřešil Newton.
počet šestek při hodu šesti kostkami . . .Bi(6, 1/6).(p = 1
6)
P (A) =6∑
k=1
(6k
)pk(1− p)n−k =
1−(60
)p0(1− p)6 = 0, 6651 .
počet šestek při hodu dvanácti kostkami . . .Bi(12, 1/6).(p = 1
6)
P (B) =12∑
k=2
(126
)pk(1− p)n−k =
1−(120
)p0(1−p)12−
(121
)p(1−p)11 = 0, 6189 .
69
Domácí cvičení: Pravděpodovbnost, že 18 kost-kami hodíme alespoň 3 šestky je 0,5973.
5.2. Příklad. Náhodná procházkaČástice se pohybuje po ose x. Začíná v bodě 0.V daném stádiu se rozhodne s pravděpodobností1/2 jít doprava a s pravděpodobností 1/2 doleva.Sn je poloha částice v čase n. Jaké je rozdělení Sn?
Bernoulliovo schéma, n pokusů; p = 12 .
1. . jdeme doprava, -1. . . jdeme doleva.
Je-li k jedniček a n− k -jedniček, pak je poloha
k − (n− k) = 2k − n k = 0, . . . n .
P [Sn = 2k − n] =
(n
k
)2−n .
(Dá se ukázat, že částice s pravděpodobnosí jednanavštíví každý bod. Totéž pro dvě dimenze, nevšak pro tři.)
70
5.3. Příklad.Maxwellovo-Boltzmanovo schéma
Máme n částic a r příhrádek. Každá částice sivybírá nějakou příhrádku. Všechny možnosti majístejnou šanci. Jaké je rozložení počtu částic v pevnězvolené příhrádce?
Bernoulliovo schéma: vybraná částice si zvolí da-nou přihrádku, celkem n pokusů (máme n částic).Šance zdaru je 1
r.
Náhodná veličina má rozdělení Bi(n, 1r).
Konkrétní situace:
5.4. Příklad. Máme n = 500 osob a r = 365příhrádek (narozeniny). Počet osob mající naroze-niny dne 18.7. (jako přednášející) se řídíBi(500, 1365).
Tabulka numerických hodnot:
počet 0 1 2 3 4 5 6pravděpodobnost 0,2537 0,3484 0,2388 0,1089 0,0372 0,0101 0,0023
71
Pravděpodobnost, že tři osoby mají narozeniny 18.7.je 0,1089 .další modely: osoby obsazující vagóny, výsledkyhodu kostkou padající do 6 možností, . . .
72
Charakteristiky Bi(n, k).
X = X1 +X2 + · · ·+Xn
Xi . . . A(p), EXi = p.
EX = EX1 + EX2 + · · ·+ EXn = np .
E(X2) = E(X1+X2+· · ·+Xn)2 = EX21+EX22 · · ·+EX2n+
+ 2E(X1X2) + 2E(X1X3) + · · · .
Je-li i 6= j máme pro Xi Xj rozdělení
0 11− p2 p2
Tedy E(XiXj) = p2, což znamená, že
EX2 = np+ 2 ·(
n
2
)p2 .
Konečně,
var(X) = EX2−(EX)2 = np+2·(
n
2
)p2−n2p2 =
np+2n(n− 1)2
p2−n2p2 = np−np2 = np(1−p) .
73
Má-li X rozdělení Bi(n, p), pak
EX = np varX = np(1− p)
Průměrný počet šestek při sérii n hodů hrací kost-kou je n
6 .
Průměrný počet částic v jedné přihrádce u 500částic náhodně rozptýlených v 365 příhrádkách je500365 = 1, 369863014.
. . .
74
Co se děje s binomickým rozdělením, jestliže senemění střední hodnota, ale počet pokusů jde donekonečna?
5.5. Věta. Poissonova větaPředpokládejme, že (Xn)∞n=1 je posloupnost ná-hodných veličin majících rozdělení Bi(n, λ
n), kde
λ > 0. (Tj. EXn = λ pro všechna n.) Pak
limn→∞
P [Xn = k] =λk
k!e−λ .
Důkaz:
pn =λ
n.
P [Xn = k] =
(n
k
)pk
n(1− pn)n−k =
=1k!
npn · (n− 1)pn · · · (n− k + 1)pn
(1− pn)k
(1−λ
n
)n
.
limn→∞
npn
1− pn
= limn→∞
λ
1− λn
= λ .
limn→∞
(n− 1)pn
1− pn
= limn→∞
λ− λn
1− λn
= λ .
75
Tedy
limn→∞
P [Xn = k] =λk
k!lim
n→∞
(1− λ
n
)n
=λk
k!e−λ .
Aproximujeme pro n velké a pn malé
P [X = k] ∼ λk
k!e−λ .
5.6. Příklad. Stroj produkuje 1% zmetků. Jakáje pravděpodobnost, že z 200 náhodně vybranýchvýrobků neni žádný zmetek?
X ∼ Bi(200,1100)
P [X = 0] = 0, 99200 = 0, 1340 .
Aproximace pomocí Poissonovy věty:
λ = 200 · 1100= 2
P [X = 0].= e−2 = 0, 1353.
76
n částic se náhodně rozděluje do r příhrádek, při-čemž n, r → ∞ při konstantním poměru λ = n
r.
Počet částic v pevně zvolené příhrádce se asymto-ticky řídí Poissonovým zákonem s parametrem λ.
5.7. Příklad. X ∼ Bi(500, 365) . . . viz Příklad 5.4.
počet 0 1 2 3 4 5 6binomický zákon 0,2537 0,3484 0,2388 0,1089 0,0372 0,0101 0,0023Poissonův zákon 0,2541 0,3481 0,2385 0,1089 0,0372 0,0102 0,0023
77
Poissonovo rozdělení
Náhodná veličinaX, která nabývá hodnot 0, 1, . . .s pravděpodobnostmi
P [Xn = n] =λn
n!e−λ , n = 0, 1, . . .
Po(λ)
P [X = 0] = e−λ P [X > 0] = 1− e−λ .
5.8. Příklad. Lahve se vyrábějí ze skloviny obsa-hující kazy, keré jsou rozděly nepravidelně tak, žev každém metrickém centu skloviny je průměrněx kazů. Láhev váží 1 kg a je vadná obsahuje-li je-den či více kazů. Stanovte procento vadných lahví.
Řešení Z M metrických centů se vyrobí 100Mlahví, které budou obsahovat přibližně xM kazů.Pro počet kazů v jedné lahvi tedy máme rozdělení
Bi(xM,1
100M) .
EX = λ = xM1
100M=
x
100.
78
Pro M →∞ máme rozdělení
Po
(x
100
)Pravděpodobnost, že láhev bude bez kazu je
1− e−x100 .
Je-li například x = 30, pak procento vadných lahvíbude 1− e−0,3 = 0, 2592.
Při velkém počtu kazů je výhodnější vyrábět menšílahve. Je-li např. váha lahve 0, 25kg je procentozmetků 7, 22%.
79
Charakteristiky P (λ):
EX =∞∑
n=0
nλn
n!e−λ = λ
( ∞∑n=1
λn−1
(n− 1)!
)e−λ =
= λeλe−λ = λ .
EX2 =∞∑
n=0
n2λn
n!e−λ =
∞∑n=2
n(n−1)λn
n!e−λ+
=λ︷ ︸︸ ︷∞∑
n=0
nλn
n!e−λ =
= e−λ
∞∑n=2
λn
(n− 2)!+λ = e−λλ2
∞∑n=2
λn−2
(n− 2)!+λ =
= e−λλ2 eλ + λ = λ2 + λ .
Tedy
var(X) = EX2 − (EX)2 = λ2 + λ− λ2 = λ .
E(X) = λ
var(X) = λ
80
Příklady Poissonova rozdělení: (homogenní chaosv prostoru nebo čase)
• počet volání na telofonní ústřednu za jed-notku času
• počet atomů radioaktivní látky rozpadlých zajednotku času
• počet hvězd v daném objemu galaxie
• počet létavic meteorického roje za jednotkučasu
• počet střel zasahující danou oblast
• počet defektů kola (bad luck) za jednotkučasu
• počet zákazníků za jednotku času
81
Geometrické rozdělení Ge(p), 0 < p < 1.
X je počet zdarů v Bernoulliově schématu předprvním nezdarem.
P [X = 0] = 1− p .
P [X = 1] = (1− p)p .
P [X = 2] = (1− p)p2 .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
P [X = k] = (1− p)pk k = 0, 1, . . . .
82
5.9. Příklad. Dva hráči se střídají a házejí hracíkostkou. Vyhrává ten komu padne šestka. Jaká jepravděpodobnost výhry u jednotlivých hráčů?
X . . . geometrické rozdělení s p =56
.
A . . . vyhrává hráč, který začíná
P (A) = P [X = sudé] =∞∑
k=0
(1−p)p2k = (1−p)∞∑
k=0
p2k =
= (1− p)1
1− p2=11 + p
=
=11 + 5
6
=611= 0, 54545455 .
83
Střední hodnota geometrického rozdělení:
EX =∞∑
n=0
n (1− p) pn = (1− p)∞∑
n=0
n pn =
= (1−p) pd
dp
( ∞∑n=0
pn
)= (1−p)p
d
dp
(11− p
)=
= (1− p)p1
(1− p)2=
p
1− p.
5.10. Příklad. Žák umí 90% látky. Kolik přežijeprůměrně otázek?
Ge(p), p = 0, 9
EX =0, 91− 0, 9
= 9 .
84
Rozptyl
d2
dp2
∞∑n=0
pn =∞∑
n=0
n(n− 1)pn−2 .
E(X2)− EX =∞∑
n=0
n(n− 1)(1− p)pn =
= (1−p)p2d2
dp2
∞∑n=0
pn = (1−p)p2(11− p
)′′
=
= (1− p)p22
(1− p)3=
2p2
(1− p)2.
E(X2)−(EX)2 =2p2
(1− p)2+
p
1− p− p2
(1− p)2=
p2
(1− p)2+
p
1− p=
p2 + p(1− p)(1− p)2
=
=p
(1− p)2.
85
EX =p
1− p
varX =p
(1− p)2.
Rovnoměrné rozdělení na < a, b >R < a, b >.
Hustota:
f(x) =
1
b−ax ∈< a, b >
0 jinak
Distribuční funkce:
F (x) =
x−ab−a
x ∈< a, b >
0 x < a
1 x > b
86
EX =
b∫a
x1
b− adx =
1b− a
[x2
2
]b
a
=
=b2 − a2
2(b− a)=
a+ b
2.
EX2 =1
b− a
b∫a
x2 dx =1
b− a
b3 − a3
3=
=a2 + ab+ b2
3.
var(X) = E(X2)−(EX)2 =a2 + ab+ b2
3−a2 + 2ab+ b2
4=
=a2 − 2ab+ b2
12=112(b− a)2 .
EX =a+ b
2
varX =112(b− a)2 .
87
Normální rozdělení (Gaussovo rozdělení)
N(µ, σ2).µ ∈ R, σ2 > 0.
hustota:
f(x) =1√2πσ
e−(x−µ)2
2σ2
Vychází z Laplaceova integrálu:
∞∫−∞
e−x2 dx =√
π .
standardní, normované normální rozdělení:N(0, 1).
značení:
Φ(x) =1√2π
x∫−∞
e−t2
2 dt
počítá se numericky, tabelována.
88
Souvislost mezi normálními rozděleními různýchparametrů.
• Má-li Y rozdělení N(0, 1) =⇒ X = µ+σ Y mározdělení N(µ, σ2).
Odvození:
FX(x) = P [X ≤ x] = P [µ+ σ Y ≤ x] =
= P
[Y ≤ x− µ
σ
]= Φ
(x− µ
σ
)
d
dxFX(x) =
1√2π
e−(x−µ
σ )2
2 · 1σ=
=1√2πσ
e−(x−µ)2
2σ2 .
• Má-li X rozdělení N(µ, σ), pak Y = X−µσmá
rozdělení N(0, 1).
89
5.11. Příklad. S jakou pravěpodobností má ve-ličina X s rozdělením N(1, 4) hodnotu v intervalu< 3, 5 > ?
P [3 ≤ X ≤ 5] = Φ(5− 12
)− Φ
(3− 12
)=
= Φ(2)−Φ(1) = 0, 97250−0, 841345 = 0, 131155.
5.12. Tvrzení. Vzhledem k tomu, že hustota stan-dardního normálního rozdělení je sudá funkce, platí
Φ(x) = 1− Φ(−x) x ∈ R .
90
5.13. Příklad. Spočtěte pravděpodobnost, že ve-ličina X s rozdělením N(0, σ2) má hodnotu v in-tervalu < −a, a >, kde a > 0.
Řešení:
P [−a ≤ X ≤ a] = P [−a
σ≤ X
σ≤ a
σ] =
= Φ
(a
σ
)−Φ
(−a
σ
)= Φ
(a
σ
)−
(1−Φ
(a
σ
))=
2Φ
(a
σ
)− 1 .
Střední hodnota a rozptyl normálního rozdělení:
Pro Y s rozdělením N(0, 1) platí
EY =1√2π
∞∫−∞
xe−x2
2 dx = 0 .
91
1 =1√2π
∞∫−∞
e−x2
2 dx .
Použijeme metodu per partes pro
u′ = 1 v = e−x2
2
u = x v′ = −xe−x2
2
a dostaneme
1 =1√2π
[xe−
x2
2
]∞−∞︸ ︷︷ ︸
=0
+1√2π
∞∫−∞
x2e−x2
2 dx .
Odtud plyne, že
var(Y ) = E(Y 2) = 1 .
Obecně: X má rozdělení N(µ, σ2)
X = σY + µ ,
a proto
EX = σEY + µ = µ .
92
X2 = σ2Y 2 + 2µσY + µ2
EX2 = σ2 + 0 + µ2 .
varX = E(X2)− (EX)2 = σ2 + µ2 − µ2 = σ2 .
Závěr:
EX = µ
var(X) = σ2 .
93
kvantilová funkce a kvantily
uα . . . α-kvantil N(0, 1).
kvantilová funke je inverzní funkce Φ−1.
Některé numerické hodnoty:
u0,5 = 0,u0,95 = 1, 644,u0,975 = 1, 95996u0,999 = 3, 09023
Pro α → 1 jde uα →∞.
5.14. Tvrzení.
(i) u1−α = −uα pro všechna α ∈ (0, 1).
(ii) Pro α-kvantil xα rozdělení N(µ, σ2) platí
xα = µ+ σ uα .
94
5.15. Příklad. Určete interval < −a, a > tak,aby náhodná veličina Y s rozdělením N(0, 1) mělav tomto intervalu hodnotu s pravděpodobností 0,95.
a = u0,975.= 1, 96 .
Pravidlo 3σMáme rozdělení X typu N(µ, σ2). Určeme
P [|X − µ| ≤ 3σ] .
Řešení:
P
[|X − µ|
σ≤ 3
]= Φ(3)− Φ(−3) =
= 2Φ(3)−1 = 2·0, 99865−1 = 0, 99730 .
Po třech σ zbývají asi tři promile případů.
95
5.16. Příklad. Pro oděvní továrnu je neziskovévyrábět šaty pro velmi malé a velmi velké muže.Záměr je nevyrábět pro 7,5% největších a 7,5%nejmenších mužů. Ví se, že výška mužů (v pal-cích) má rozdělení N(69, 2, 82). Nalezněte největšía nejmenší výšku pro kterou vyrábět.
Řešení
u0,925 = 1, 43953 .
x0,925 = 69 + 2, 8 · 1, 43953 = 73, 03068x0,075 = 69− 2, 8 · 1, 43953 = 64, 96932
96
5.17. Příklad. Výsledky přijímacích zkoušek seřídí normálním rozdělením s rozptylem 100. Je při-jato 30% uchazečů. Hranice pro přijetí je 85 bodů.Jaký je průměrný výsledek u zkoušky?
Řešení:
N(µ, σ2)
x0,7 = µ+ 10 · u0.7µ = 85− 10 · u0,7 = 85− 10 · 0, 52440
.= 79, 8 .
5.18. Příklad. Máme rozdělení N(µ, 0, 5). Jakzvolit střední hodnotu, aby
P [X ≥ 2] = 0, 01 .
Řešení:
P
[X − µ√0, 5
≥ 2− µ√0, 5
]= 0, 01
2− µ√0, 5= u0,99
µ = 2−√0, 5 · u0,99
.= 0, 355023643
97
Exponenciální rozdělení
Exp(λ) λ > 0
hustota:
f(x) =
λ e−λx x ≥ 00 x < 0 .
distribuční funkce:x ≥ 0
F (x) =
x∫0
λ e−λx dx = 1− e−λ x .
funkce přežití:
P [X ≥ x] = e−λ x
Exponenciální rozdělení popisuje čas do první ”po-ruchy” u systému ”bez paměti”
98
Odvození:
Hledáme funkci přežití
R(t) = P [X ≥ t]
tak, aby byly splněny následující předpoklady:
(i) R(0) = 1
(ii) P [X ≥ t + h|X ≥ t] = P [X ≥ h] provšechna x, h ≥ 0.
(iii) R je diferencovatelná klesající funkce
Z toho plyne:
P [X ≥ t+ h] = P [X ≥ t] · P [X ≥ h] .
R(t+ h) = R(t)R(h)
R(t+ h)−R(t)h
=R(t)R(h)−R(t)
h=
= R(t)R(h)− 1
h
99
Limitním přechodem h → 0+ dostaneme
R′(t) = R(t) ·R′(0)
R(0) = 1
Diferenciální rovnice s počáteční podmínkou.
Označme
R′(0) = −λ (λ > 0).
Řešení (jediné):
R(t) = e−λt .
R(t) tedy vede na exponenciální rozdělení.
100
Střední hodnotu a rozptyl získáme integrací (perpartes)
E(X) =1λ
var(X) =1λ2
λ . . . ”intenzita poruch”
Příklady exponenciálního rozdělení:
• doba rozpadu atomu
• doba do registrace zákazníka
• doba do příletu létavice v meteorickém roji
101
5.19. Příklad. Na přílet meteoritu se průměrněčaká deset minut. Jaká je pravděpodobnost, že bu-deme na ”padající hvězdu” čekat dvě minuty?
Řešení:1λ= 10 λ = 0, 1
F (2) = 1− e−2·0,1 = 1− e−0,2.= 0, 18127 .
102
6 Transformace náhodnýchveličin
Nutnost přepočítat distrubuční funkci. Napříkladmáme měření rychlosti a chceme ho přepočítat naenergii.
Obecná úloha: X je náhodná veličina, h : R 7→ RY = h(X)
• Diskrétní náhodná veličina se vždy zobrazí nadiskrétní
6.1. Příklad. Diskrétní rozdělení X s pravděpo-
dobnostní funkcí -1 0 10,3 0,2 0,5
Y = X2 . . . 1 0 10,3 0,2 0,5
Y . . .
0 10,2 0,8
103
Obecně stanovíme transformaci pomocí distribučnífunkce:
Y = h(X)
FY (y) = P [h(X) ≤ y]
6.2. Příklad. Rychlost molekul plynu má rozdě-lení N(0, 1). Molekula má hmotnost m. Naleznětedistribuční funkci a hustotu energie částice.
X ∼ N(0, 1)
Y =12mX2
Nerovnice 12mX2 ≤ y má řešení pouze pro y ≥ 0.
y ≥ 0
FY (y) = P [12mX2 ≤ y] = P [X ∈< −
√2m
y,
√2m
y >] =
= Φ
(√2m
y
)−Φ
(−
√2m
y
)= 2Φ
(√2m
y
)−1 .
104
Hustota je pro y > 0 derivací distribuční funkce:
g(y) = 21√2π
e−2m y
2 ·√2m· 12√
y=
1√
mπye−
ym
Pro y ≤ 0 je g(y) = 0 .
Důležitý je případ lineární transformace.
Y = aX + b, a 6= 0
a > 0
FY (y) = P [aX + b ≤ y] = P
[X ≤ y − b
a
]= FX
(y − b
a
).
a < 0
FY (y) = P [aX + b ≤ y] = P
[X ≥ y − b
a
]= 1− FX
(y − b
a−
).
105
Užitečné je aplikovat toto pravidlo na spojité roz-dělení
6.3. Tvrzení. Je-li X spojitá náhodná veličina shustotou f(x), pak náhodná veličina
Y = aX + b , a 6= 0je spojitá a má hustotu
g(y) =1|a|
f
(y − b
a
).
Důkaz:
a > 0
FY (y) = F
(y − b
a
)Derivací podle y:
g(y) =1af
(y − b
a
).
a < 0
FY (y) = 1− F
(y − b
a
)106
Derivací podle y:
g(y) = −1af
(y − b
a
).
6.4. Příklad. X má rovnoměrné rozdělení na in-tervalu < 0, 3 >. Určete hustotu
Y = 2X + 1
g(y) =12f
(y − 12
).
y − 12
∈< 0, 3 > ⇐⇒ y ∈< 1, 7 > .
g(y) =
1/6 y ∈< 1, 7 >
0 jinak
Y má rovnoměrné rozdělení na intervalu < 1, 7 >.
107
6.5. Příklad. Y = −X, kde X má rozděleníN(0, 1).
g(y) =1√2π
e−(−y)2
2 =1√2π
e−y2
2
Y má také rozdělení N(0, 1).
6.6. Příklad. X má rozdělení Exp(1). Určeterozdělení −X.
g(y) = f(−y)
g(y) =
ey y ≤ 00 y > 0 .
108
Nelineární transformace náhodné veličiny
Předpoklady:X má hustotu f(x) soustředěnou naintervalu I a h je rostoucí diferencovatelná funkcedefinovaná na I, jejíž obor hodnot je interval J .
Y = h(X)
Pro y /∈ J bude hustota nulová.
Pro y ∈ J
FY (y) =
h−1(y)∫−∞
f(x) dx
Substituce: t = h(x), x = h−1(t), dt = h′(x) dx.
FY (y) =
y∫−∞
f(h−1(t))dt
h′(h−1(t))
Podobně lze postupovat v případě, kdy h je klesa-jící, nebo je možno použít −(−h).
109
Závěr:
g(y) =f(h−1(y))|h′(h−1(y))|
.
pro y ∈ J a nula jinak.
6.7. Příklad. Logaritmicko-normální rozdě-lení
Y = eX ,
kde X má rozdělení N(µ, σ2).
h(x) = ex , h−1(x) = lnx , J = h(R) = (0,∞) .
g(y) =f(ln y)eln y
=1√2πσ
e−(ln y−µ)2
2σ21y
,
pro y > 0; a nula jinak.
110
K výpočtu střední hodnoty transformované veli-činy nepotřebujeme znát rozdělení transformace:
6.8. Věta. Předpokládejme, žeX je náhodná ve-ličina a Y = h(X). Pak
(i) E(Y ) =∑i∈I
h(xi)pi ,
je-li X diskrétní náhodná veličina s pravdě-podobnostní funkcí (xi, pi)i∈I .
(ii) E(Y ) =
∞∫−∞
f(x)h(x) dx
je-li X spojitá náhodná veličina s hustotouf(x).
Důkaz:
(i) h(Y ) má (včetně násobnosti) pravděpodob-nostní funkci (h(xi), pi)i∈I , a proto
E(Y ) =∑i∈I
h(xi)pi .
(ii) je spojitou verzí.
111
6.9. Příklad. Určete střední hodnotu třetí moc-niny rozdělení Exp(1).
E(Y ) =
∞∫0
x3e−x dx = 6 .
112
7 Náhodné vektory
Značení: x = (x1, x2, . . . xn) ∈ Cn
7.1. Definice. Nechť (Ω,A, P ) je pravděpodob-nostní prostor. Zobrazení X : Ω→ Rn
X(ω) = (X1(ω), X2(ω), . . . , Xn(ω)) ,
kde X1, . . . , Xn jsou náhodné veličiny na Ω, senazývá náhodný vektor. Veličiny X1, . . . , Xn senazývají marginální rozdělení vektoru X.
Nestačí znát marginální distribuční funkce, ale dis-tribuční funkci sdruženou.
Značení:[X ≤ x] = [X1 ≤ x1∧X2 ≤ x2∧ · · ·∧Xn ≤ xn].
7.2. Definice. Je-li X : Ω → Rn náhodný vek-tor, pak distribuční funkci FX : Rn → R definu-jeme jako
FX(x) = P [X ≤ x] .
113
7.3. Příklad. X má distribuční funkci F . Určetedistribuční funkci náhodného vektoru
X = (X, X)
FX(x, y) = P [X ≤ x ∧X ≤ y] =
= P [X ≤ min(x, y)] = F (min(x, y))
Pomocí distribuční funkce spočítáme všechny re-levantní pravděpodobnosti:
např.
X = (X, Y )
P [(a < X ≤ b) ∧ (c < Y ≤ d)] =
= FX(b, d)−FX(a, d)−FX(b, c)+FX(a, c) .
114
Základní vlastnosti vícerozměrné distribuční funkce:
7.4. Věta. Je-li F (x1, . . . , xn) sdružená distri-buční funkce náhodných veličin X1, . . . , Xn, pak
(i) limx1→∞,x2→∞,... ,xn→∞ F (x1, . . . , xn) = 1
(ii) limx1→−∞,x2→−∞,... ,xn→−∞
F (x1, . . . , xn) = 0
(iii) F je zprava spojitá a neklesající v každé pro-měnné.
Tyto vlastnosti nestačí k tomu, aby F byla dis-tribuční funkcí. Musí splňovat složitejší podmínkupro hodnoty ve vrcholech vícerozměrných inter-valů.
Jak spočítat marginální rozdělení vektoru
X = (X1, . . . , Xn)?
FX1(x) = limx2→∞,x3→∞,... ,xn→∞
FX(x, x2, x3, . . . , xn) .
115
7.5. Příklad. Xmá rovnoměrné rozdělení na jed-notkovém kruhu se středem v počátku. Naleznětemarginální rozdělení.
X = (X, Y )
Pro −1 < x < 1.
FX(x) =2π
x∫−1
√1− t2 dt =
2π
[12t√1− t2+
12arcsin t
]x
−1=
=x√1− x2
π+
arcsin x
π+12
.
7.6. Definice. Náhodný vektor se nazývá diskrétní,jestliže všechny jeho složky mají diskrétní rozdě-lení.
Diskrétní vektor je dán pravděpodobnostní funkcí:
(x1, p1); (x2, p2); (x3, p3), . . .
pi > 0 ,n∑
i=1
pi = 1 .
116
7.7. Příklad. Pravděpodobnost soustředěná vevrcholech čtverce:
P [X = (0, 0)] = 1/8, P [X = (0, 1)] = 1/4,P [X = (1, 0)] = 1/8, P [X = (1, 1)] = 1/2
tabulka:
Y/X 0 10 1/8 1/41 1/8 1/2
Diskrétní rozdělení pro X
P [X = 0] = 1/8 + 1/4 = 3/8
P [X = 1] = 1/8 + 1/2 = 5/8
X ∼ A(5/8).Podobně Y ∼ A(3/4).
117
• Distribuční funkce diskrétního vektoru je po čás-tech konstantní.
• Má-li X diskrétní rozdělení je
P [X ∈ A] =∑
i | xi∈A
pi .
• Marginální rozdělení diskrétního rozdělení mápravděpodobnostní funkci
P [X1 = a] =∑
i | xi∈A
pi ,
kde A = xi | (xi)1 = a.
118
7.8. Definice. Nechť f(x1, . . . , xn) ≥ 0 je funkcedefinovaná na Rn s∫
Rn
f(x) dx = 1 .
Náhodný vektor X = (X1, . . . , Xn) má spojitérozdělení s hustotou f , jestliže
FX(x1, . . . , xn) =
x1∫−∞
x2∫−∞
· · ·xn∫
−∞
f(t1, . . . , tn)dt1 · · · dtn .
•
f(x1, . . . , xn) =∂nFX(x1, . . . , xn)∂x1∂x2 · · · ∂xn
v bodech spojitosti funkce f
•
P [X ∈ A] =∫A
f(x) dx .
Například: X = (X,Y )
P [X ∈ (a, b > ∧Y ∈ (c, d >] =
b∫a
d∫c
f(x, y) dxdy .
119
7.9. Příklad. Rovnoměrné rozdělení na jednot-kové kouli se středem v počátku má hustotu
f(x, y, z) =
14/3π pro x2 + y2 + z2 ≤ 10 jinak
7.10. Příklad. Dvourozměrná distribuční funkce
F (x, y) =
(1− e−x)(1− e−y) je-li x, y > 0
0 jinak
Pro x, y > 0
f(x, y) =∂2
∂x∂y(1− e−x)(1− e−y) =
= e−xe−y .
(Jinak je f(x, y) nulová.) Je správně neboť
f(x, y) =
∞∫0
∞∫0
e−x e−y = 1 .
120
Marginální rozdělení:
X = (X1, . . . , Xn) má hustotu f(x1, . . . , xn).Pak X1 má distribuční funkci:
FX1(x) =
x∫−∞
∞∫−∞
· · ·∞∫
−∞︸ ︷︷ ︸(n−1)×
f(t1, . . . , tn) dt1 · · · dtn =
=
x∫−∞
( ∞∫−∞
· · ·∞∫
−∞︸ ︷︷ ︸(n−1)×
f(t1, . . . , tn) dt2 · · · dtn
)dt1
Hustota tedy bude
fX1(x) =
∞∫−∞
· · ·∞∫
−∞︸ ︷︷ ︸(n−1)×
f(x, t2, · · · tn) dt2 · · · dtn .
121
7.11. Příklad. Dvourozměrné Gaussovo roz-děleníhustota:
f(x, y) =12π
e−x2+y2
2 .
X, Y ∼ N(0, 1)
FX(x, y) = Φ(x)Φ(y) .
Např.P [X ≤ 3∧Y ≤ 5] = Φ(3)Φ(5) = 0, 9986498158.
Jaká je pravděpodobnost, že (X, Y ) ∈ A, kde Aje mezikruží
A = (x, y) | 4 ≤ x2 + y2 ≤ 9?
P =12π
∫ ∫A
e−x2+y2
2 dxdy
Substituce:x = % sinϕ, y = % cosϕ,Jakobián: dxdy = % d% dϕ.
122
P =12π
2π∫0
3∫2
e−%2/2% d% dϕ =
=12π2π[−e−%2/2]32 = e−2−e−9/2 = 0, 12422 .
Nezávislost náhodných veličin
7.12. Definice. Náhodné veličinyX1, . . . , Xn napravděpodobnostním prostoru (Ω,A, P ) jsou ne-závislé, jestliže sdružená distribuční funkce vektoru
X = (X1, . . . , Xn)
je součinem marginálních distribučních funkcí.
123
7.13. Tvrzení. Náhodné veličinyX1, . . . , Xn jsounezávislé právě tehdy když
P [(X1 ∈ I1) ∧ (X2 ∈ I2) ∧ · · · ∧ (Xn ∈ In)] =
= P [X1 ∈ I1] ·P [X2 ∈ I2] · · ·P [Xn ∈ In]
pro všechny možné výběry intervalů I1, . . . , In ⊂R.
Zdůvodnění pro X = (X, Y ), kde X, Y jsou ne-závislé :
P [X ∈ (a, b > ∧Y ∈ (c, d >] =
= FX(b, d)−FX(a, d)−FX(b, c)+FX(a, c) =
= FX(b)Fy(d)−FX(a)FY (d)−FX(b)FY (c)+FX(a)FY (c) =
= (FX(b)− FX(a))(FY (d)− FY (c)) .
7.14. Příklad. X = (X, Y ) je rovnoměrné roz-dělení na čtverci < 0, 1 > × < 0, 1 >. Pak X aY jsou nezávislé:0 ≤ x, y ≤ 1
FX(x, y) = xy = FX(x) · FY (y)
124
7.15. Tvrzení. Diskrétní náhodné veličinyX1, . . . , Xn jsou nezávislé právě tehdy když všechnyjevy[X1 = x1], [X2 = x2], . . . , [Xn = xn] ,kde x1, . . . , xn ∈ R, jsou nezávislé.
7.16. Příklad. Pravděpodobnost soustředěná vevrcholech čtverce:
P [X = (0, 0)] = 1/8, P [X = (0, 1)] = 1/4,P [X = (1, 0)] = 1/8, P [X = (1, 1)] = 1/2
tabulka:
Y/X 0 10 1/8 1/41 1/8 1/2
X a Y nejsou nezávislé, protože
P [X = 0 ∧ Y = 0] = 1/8 6= P [X = 0]P [Y = 0] = 3/8 · 1/4 .
125
X = (X1, . . . , Xn)
náhodné veličiny v Bernoulliově schématu. Tytoveličiny jsou nezávislé.
Binomické rozdělení Bi(n, p) je součtem n nezá-vislých alternativních rozdělení A(p).
126
7.17. Tvrzení. Spojité vícerozměrné rozdělení jerozdělení nezávislých veličin právě tehdy když sdru-žená hustota je součinem hustot marginálních.
Důvod: hustota je derivací distribuční funkce.
7.18. Příklad. Je-li (X, Y ) rovnoměrné rozdě-lení na jednotkovém kruhu, pak X a Y nejsounezávislé, protože součin marginálních hustot jenenulový v každém bodě čtverce< 0, 1 > × < 0, 1 >.
7.19. Příklad. X a Y jsou nezávislé náhodnéveličiny s rozděleními N(0, σ21), N(0, σ
22). Jaká je
hustota součinu?
f(x, y) =1
2πσ1σ2e− x2
2σ21− y2
2σ22
Gaussovská plocha.
127
charakteristiky nezávislých veličin:
7.20. Věta. Jsou-liX1, . . . , Xn nezávislé náhodnéveličiny na pravděpodobnostním prostoru (Ω,A, P ),pak
E(X1X2 · · ·Xn) = E(X1)E(X2) · · ·E(Xn) .
Důkaz: pro diskrétní rozdělení
X má pravděpodobnostní funkci (xi, pi)i∈I
Y má pravděpodobnostní funkci (yj, pj)j∈J
E(XY ) =∑
i∈I,j∈J
xi yjP [X = xi ∧ Y = yj] =
=∑
i∈I,j∈J
xi yjP [X = xi]P [Y = yj] =
=
(∑i∈I
xiP [Y = xi]
)·(∑
j∈J
yjP [Y = yj]
)=
= E(X)E(Y )
128
7.21. Věta. Jsou-liX1, . . . , Xn nezávislé náhodnéveličiny na pravděpodobnostním prostoru (Ω,A, P ),pak
var(X1 +X2 + · · ·+Xn) = var(X1) + var(X2) + · · ·+ var(Xn) .
Důkaz pro n = 2Víme, že E(X1X2) = E(X1)E(X2).
var(X1+X2) = E[(X1+X2)2]−(E(X1)+E(X2))
2 =
= E(X21 ) + E(X22 ) + 2E(X1X2)−−(E(X1))2−(E(X2))2−2E(X1)E(X2) =E(X1)
2−(E(X1))2+E(X2)2−(E(X2))2 =
= var(X1) + var(X2) .
129
7.22. Příklad. Pro X s rozdělením Bi(n, p) aY s rozdělením A(p) platí
var(X) = n var(Y ) = np(1− p) .
Funkce nezávislých náhodných veličin
7.23. Příklad. Doba kdy lano vydrží zátěž seřídí exponeniálním rozdělením Exp(1). Dvě lanazapojíme a) paralelně b) sériově. Určete rozdělenídoby po kterou systém lan vydrží v obou případecha stanovte střední hodnotu těchto náhodných ve-ličin.
X a Y jsou nezávislé náhodné veličiny s rozděle-ním Exp(1).
a) Zpar = max(X, Y )
b) Zserie = min(X, Y ) .
130
a) paralelně
Distribuční funkce je nulová pro t < 0. Pro t > 0 je
FZpar = (1− e−t)(1− e−t) = (1− e−t)2
Hustota pro t > 0:
f(t) = 2(1− e−t)e−t
Střední hodnota
EZpar = 2
∞∫0
te−t dt− 2∞∫0
te−2t dt = 1, 5 .
131
a) sériově
Distribuční funkce je nulová pro t < 0. Pro t > 0 je
FZpar = 1− e−te−t = 1− e−2t
Hustota pro t < 0:
g(t) = 2e−2t
Střední hodnota
EZserie = 2
∞∫0
e−2t dt = 0, 5 .
132
Rozdělení součtu spojitých nezávislýchnáhodných veličin
Z = X + Y ,
kde X a Y jsou nezávislé, X má hustotu f(x) aY má hustotu g(x).Úlohou je stanovit hustotu náhodné veličiny Z.
Sdružená hustota vektoru (X, Y ) je funkceh(x, y) = f(x)g(y).
P [Z ≤ z] = P [X+Y ≤ z] =∫∫
(x,y) | x+y≤z
f(x)g(y) dxdy =
∞∫−∞
( z−x∫−∞
f(x)g(y) dy
)dx .
Substituce ve vnitřním integráluy = v − x, dv = dy
133
=
∞∫−∞
( z∫−∞
f(x) g(v − x) dv
)dx =
=
z∫−∞
( ∞∫−∞
f(x)g(v − x) dx
)︸ ︷︷ ︸
hustota h(v)
dv
Závěr: Hustota součtu X + Y je funkce
h(y) =
∞∫−∞
f(x)g(y − x) dx .
Terminologie : funkce h je konvolutivní součin funkcíf a g.
134
7.24. Příklad. Čas do první poruchy daného za-řízení se řídí exponenciálním zákonem Exp(λ). Ná-hodná veličina Z je čas do druhé poruchy. Určetejejí hustotu.
Z = X + Y ,
kde X a Y jsou nezávislé s rozdělením Exp(λ).Hustota h(y) je
h(y) =
∞∫−∞
f(x)g(y−x) dx =
y∫0
λe−λxλe−λ(y−x) dx =
= λ2e−λy
y∫0
dx = λ2ye−λy
pro y ≥ 0 a nula jinak.
135
7.25. Příklad. Souprava metra přijíždí kdykolivběhem jedné minuty. Dvakrát přestupujeme. Jakáje hustota čekací doby? Která hodnota je nejvícpreferována?
Z = X + Y ,
kde X a Y jsou nezávislé náhodné veličiny s roz-dělením R < 0, 1 >.
h(y) =
∞∫−∞
f(x)g(y − x) dx ,
kde f a g jsou chrakteristické funkce intervalu< 0, 1 >.Tento integrál je délkou průniku intervalu < 0, 1 >s intervalem < y − 1, y >. Tedy
h(y) =
0 y ≤ 0y 0 ≤ y ≤ 12− y 1 ≤ y ≤ 20 y ≥ 2
Trojúhelníkové rozdělení, preferována je čekací doba1.
136
8 Kovariance a korelace náhod-ných vektorů
Je-liX náhodný vektor, je vektor středních hodnotvektor
EX = (EX1, EX2, . . . EXn) .
Nepopisuje interakci mezi náhodnými veličinami.
8.1. Definice. Nechť X a Y jsou náhodné veli-činy na pravděpodobnostním prostoru (Ω,A, P ),které mají rozptyl. Kovariance náhodných veličinX a Y je definována
cov(X, Y ) = E[(X − EX)(Y − EY )] .
137
• cov(X, X) = var(X)
• cov(X, Y ) = cov(Y, X)
• cov(X, Y ) = E(XY )− E(X)E(Y ) :
E[(X−EX)(Y−EY )] = E(XY )−2EX·EY+EX·EY =
= E(XY )− E(X)E(Y )
Pro výpočet potřebujeme:
1. Diskrétní vektor (X, Y ) s pravděpodobnostnífunkcí ((xi, yi); pi)i∈I .
EX =∑i∈I
xi pi
EY =∑i∈I
yi pi
E(XY ) =∑i∈I
xiyi pi
138
1. Spojitý vektor (X, Y ) se sdruženou hustotouf(x, y).
EX =∫R2
xf(x, y) dxdy
EY =∫R2
yf(x, y) dxdy
E(XY ) =∫R2
xyf(x, y) dxdy
8.2. Příklad. X má rovnoměrné rozdělení na in-tervalu < 0, 1 >. Určete cov(X, X2) .
cov(X, X2) = EX3 − EX · EX2
EX3 =
1∫0
x3 dx =14
EX2 =
1∫0
x2 dx =13
EX =12
.
cov(X, X2) =14− 12· 13=112
.
139
8.3. Příklad. X = (X, Y ) má rovnoměrné roz-dělení na jednotkovém kruhu. Stanovte cov(X, Y ).
EX =∫∫K
x dxdy = 0
E(XY ) =∫∫K
xy dxdy = 0 .
cov(X, Y ) = 0 .
140
8.4. Věta. Jsou-li X a Y nezávislé náhodné ve-ličiny je cov(X, Y ) = 0.
Důkaz:
Jsou-li X a Y nezávislé, pak E(XY ) = EX ·EY .
Veličiny X, Y souřadnice rovnoměrného rozdělenína jednotkovém kruhu mají nulovou kovarianci, apřesto nejsou nezávislé.
Normování náhodné veličiny X : X−EX√varX
má nulo-vou střední hodnotu a jednotkový rozptyl.
cov
(X − EX√
varX,Y − EY√
varY
)=
cov(X, Y )√varX
√varY
.
8.5. Definice. Předpokládejme, že X a Y jsounáhodné veličiny s nenulovým rozptylem. Korelace%(X, Y ) je definována vztahem
%(X, Y ) =cov(X,Y )√varX
√varY
.
141
8.6. Příklad. (X, Y )má diskrétní rozdělení s prav-děpodobnostní funkcí
((x1, y1), 1/3); ((x2, y2), 1/3); ((x3, y3), 1/3);
Předpokládejme dále, že
x1 + x2 + x3 = 0 y1 + y2 + y3 = 0 .
cov(X, Y ) =13x1y1 +
13x2y2 +
13x3y3√
13(x
21 + x22 + x23)
√13(y
21 + y22 + y23)
=
=x1y1 + x2y2 + x3y3√
x21 + x22 + x23√
y21 + y22 + y23= cosϕ ,
kde ϕ je úhel mezi vektoryx = (x1, x2, x3) a y = (y1, y2, y3).Pokud je tedy cov(X, Y ) = 1 je y kladným násob-kem x, pokud je cov(X,Y ) = −1 je y zápornýmnásobkem x
142
8.7. Věta. Pro korelaci %(X, Y ) náhodných ve-ličin X a Y platí
|%(X, Y )| ≤ 1 .Přitom %(X, Y ) = 1 právě tehdy když hodnoty Xa Y leží s pravděpodobností 1 na jedné přímce skladnou směrnicí.%(X, Y ) = −1 právě tehdy když hodnoty X a Yleží s pravděpodobností 1 na jedné přímce se zá-pornou směrnicí.
Důkaz:
Pro všechna t ∈ R máme
0 ≤ var
(X − EX√
varX+ t
Y − EY√varY
)=
= 1 + 2t%(X, Y ) + t2 . (2)
Diskuse kvadratického výrazu:
4%2(X, Y )− 4 ≤ 0
a tedy
|%(X, Y )| ≤ 1 .
143
Předpokládejme, že cov(X, Y ) = 1. Pak v nerov-nosti (2) nastane rovnost a to může nastat právěkdyž t = −1. Dosazením t = −1 pak vede k
X − EX√varX
− Y − EY√varY
= konst .
Tedy
Y =
√varY√varX
·X + konstanta .
%(X, Y ) je míra lineární závislosti X a Y .
144
9 Asymptotické vlastnostináhodných veličin
Větou asymptotického typu byla již věta Poisso-nova: binomické rozdělení s počtem pokusů jdou-cím k nekonečnu a střední hodnotou jdoucí k λ seblíží Poissonově rozdělení Po(λ).
Základní otázka: Co se děje s Bi(n, p), jestližen →∞ a p se nemění?
Orientační odhady poskytuje Čebyševova nerov-nost.
9.1. Věta. Čebyševova nerovnostNehťX je náhodná veličina s E(X2) < ∞. Potomplatí
P [|X| ≥ ε] ≤ E(X2)ε2
.
Speciálně, má-li X rozptyl, pak
P [ |X − EX| ≥ ε] ≤ var(X)ε2
.
145
Důkaz pro spojité rozdělení s hustotou f(x).
P [ |X| ≥ ε] =∫
x | |x|≥ε
f(x) dx
E(X2) =
∞∫−∞
x2 f(x) dx =∫
x | |x|≥ε
x2 f(x) dx+
ε∫−ε
x2 f(x) dx ≥
≥∫
x | |x|≥ε
ε2f(x) dx = ε2P [ |X| ≥ ε] .
9.2. Důsledek. Je-li Xn náhodná veličina s roz-dělením Bi(n, p), pak pro každé ε > 0 platí
P
[ ∣∣∣∣Xn
n− p
∣∣∣∣ ≥ ε
]→ 0 pro n →∞ .
Důkaz:
E
(Xn
n
)=
np
n= p
146
var
(Xn
n
)=1n2
np(1− p) ≤ 14n
Dle Čebyševovy nerovnosti
P
[ ∣∣∣∣Xn
n− p
∣∣∣∣ ≥ ε
]≤
var(Xn
n)
ε2≤ 14nε2
.
9.3. Příklad. Kolika respondentů je třeba se ze-ptat, abychom odhadli volební preference p s to-lerancí 1% s pravděpodobností alespoň 90% ?
n . . . počet osobXn . . .Bi(n, p) (počet osob volících danou stranu)p ≈ Xn
n(aproximace)
Chceme:
P
[ ∣∣∣∣Xn
n− p
∣∣∣∣ < 0, 01
]≥ 0, 9 .
Nebo-li
P
[ ∣∣∣∣Xn
n− p
∣∣∣∣ ≥ 0, 01]︸ ︷︷ ︸≤ 14n(0,01)2
≤ 0, 1
147
14n(0, 01)2
≤ 0, 1
n ≥ 105
4= 25000.
Je pesimistický, nicméně jistý horní odhad.
9.4. Věta. Centrální limitní větaNehť X1, X2, X3, . . . je posloupnost nezávislýchnáhodných veličin, pro které platí
EXi = µ , varXi = σ2 , E|Xi|3 < ∞ .
pro všechna i ∈ N. Pro veličinu Sn (normovanýsoučet),
Sn =X1 +X2 + · · ·+Xn − nµ√
nσ,
platí
limn→∞
P [Sn ≤ x] = Φ(x) ,
pro všechna x ∈ R.
148
Tedy X1 +X2 + · · · +Xn má přibližně rozděleníN(nµ, nσ2).
9.5. Věta. Moaivrova-Laplaceova větaPro náhodnou veličinu Xn s rozdělením Bi(n, p)platí
limn→∞
P
[Xn − np√np(1− p)
≤ x
]= Φ(x)
pro každé x ∈ R.
Důkaz:
Binomické rozdělení je součtem nezávislých alter-nativních rozdělení.
Bi(n, p) ≈ N(np, np(1− p))Empiriké pravidlo pro velikost n :np ≥ 5, n(1− p) ≥ 5.
149
9.6. Příklad. 250 krát hodíme symetrickou mincí.Určete pravděpodobnost, že rub padne 100 až 150krát.
X250 − 125√250 · 0, 25
≈ N(0, 1)
P [100 ≤ X250 ≤ 150] =
= P
[−25√250 · 0, 25
≤ X250 − 125√250 · 0, 25
≤ 25√250 · 0, 25
]=
= 2Φ
(25 · 2√250
)−1 = 2Φ(
√10)−1 .
= 2Φ(3, 16)−1 .=
= 0, 99842 .
Přesně:∑150
k=125
(250k
)12250
9.7. Příklad. Kolika respondentů je třeba se ze-ptat, abychom odhadli volební preference p s to-lerancí 1% a to s pravděpodobností alespoň 90%.
P
[ ∣∣∣∣Xn
n− p
∣∣∣∣ ≤ 0, 01] ≥ 0, 9150
P [ |Xn−np| ≤ 0, 01n] = P
[|Xn − np|√np(1− p)
≤ 0, 01n√np(1− p)
].=
.= 2Φ
(0, 01 ·
√n√
p(1− p)
)−1 ≥ 2Φ
(0, 01 ·
√n
1/2
)−1 =
= 2Φ(0, 02√
n)− 1 .
Volíme n tak aby
2Φ(0, 02√
n)− 1 ≥ 0, 9
Φ(0, 02√
n) ≥ 0, 95
0, 02√
n ≥ u0,95
√n ≥ u0,95
0, 02
n ≥(
u0,950, 02
)2=
(1, 6440, 02
)2.= 6763, 8586
Pro srovnání při 5% toleranci potřebujeme 270 re-spondentů.
151
10 Statistika
Základní výběrové statistiky
10.1. Definice. Náhodný výběr z rozdělení s dis-tribuční funkcí F (x) je vektor
X = (X1, . . . , Xn) ,
kde X1, . . . , Xn jsou nezávislé náhodné veličinymající stejnou distribuční funkci F (x).
Základní výběrové statistiky:
Výběrový průměr
Xn =1n(X1 +X2 + · · ·Xn)
Výběrový rozptyl
S2n =1
n− 1
n∑i=1
(Xi −Xn)2
Výběrová směrodatná odchylka
Sn
152
Výběrové maximum
max(X1, . . . , Xn)
Výběrové minimum
min(X1, . . . , Xn)
Výběrové rozpětí
max(X1, . . . , Xn)−min(X1, . . . , Xn)
Výběrový průměr
EX = µ, var(X) = σ2
E = E(1n(X1 + · · ·+Xn)) =
nµ
n= µ .
var(Xn) = var
(X1 + · · ·+Xn
n
)=1n2
nσ2 =σ2
n.
E(Xn) = µ
var(Xn) =σ2
n
153
Důležité je, že var(Xn)→ 0 pro n →∞.
Čebyševova nerovnost:
P [ |Xn − µ| ≥ ε] ≤ σ2
nε2.
Výběrový rozptyl
S2n =1
n− 1
n∑i=1
(Xi −Xn)2 .
pomocný výpočet:
n∑i=1
(Xi −Xn)2 =
n∑i=1
(X2i − 2XiXn +Xn2) =
=n∑
i=1
X2i − 2Xn
n∑i=1
Xi +n∑
i=1
Xn2=
=n∑
i=1
X2i −2nXn2+nXn
2=
n∑i=1
X2i −nXn2.
154
Výpočet střední hodnoty:
(n−1)E(S2n) = E
[ n∑i=1
X2i −nXn2]=
n∑i=1
E(X2i )−nE(Xn2) =
=n∑
i=1
(var(Xi)+E2(Xi))−n(var(Xn)+E2(Xn)) =
= nσ2 + nµ2 − nσ2
n− nµ2 = (n− 1)σ2
E(S2n) = σ2 .
Výběrové statistiky odvozené od nor-málního rozdělení.
10.2. Tvrzení. Výběrový průměr z rozděleníN(µ, σ2)má rozdělení N(µ, σ2
n).
Důkaz je založen na tom, že součet nezávislýchnormálních rozdělení je normální rozdělení, což sedá dokázt pomocí konvoluce gaussovských funkcí.
Pro popis S2n potřebujeme zavést nové rozdělení
155
10.3. Definice. NechťX1, . . . , Xn jsou nezávisléveličiny s normovaným normálním rozdělením. Roz-dělení χ2 o n stupních volnosti je rozdělení ná-hodné veličiny
Y = X21 +X22 + · · ·+X2n
Značení : χ2nkvantily: χ2n,α χ2n(α)
Má-li X rozdělení χ2n, pak
EX = n var(X) = 2n .
10.4. Příklad. X,Y, Z jsou nezávislé náhodnéveličiny s rozdělením N(0, 1). Stanovte r tak, aby
P [√
X2 + Y 2 + Z2 ≤ r] = 0, 995
(Legenda: složky rychlosti molekul plynu)
r =√
χ23(0, 995) =√12, 838 = 3, 58
156
Základní věta klasické statistiky
10.5. Věta. Nechť X = (X1, . . . , Xn) je ná-hodný výběr z rozdělení N(µ, σ2). Pak
(i) Xn a S2n jsou nezávislé náhodné veličiny
(ii) (n−1)S2n
σ2má rozdělení χ2n−1.
Statistická varianta normování veličiny:
Xn − µ
Sn/√
n
10.6. Definice. NechťX = (X1, . . . , Xn) je ná-hodný výběr z rozděleníN(µ, σ2). Studentovo roz-děleni s n−1 stupni volnosti je rozdělení náhodnéveličiny
Xn − µ
Sn/√
n
Značení: tn−1, kvantily tn−1, α; tn−1(α).
157
W. Gosset – pseudonym Student, Studentovo roz-dělení tn má sudou hustotu, fn(x), která pro n →∞ konverguje bodově k Φ(x). (Aproximuje se ob-vykle pro n ≥ 31)
158
Intervalové odhady
Lokalizace neznámého parametru pomocí dat
10.7. Definice. NechťX = (X1, . . . , Xn) je ná-hodný výběr z rozdělení s neznámým parametremθ a α ∈ (0, 1).
(i) Interval < TD(X), TH(X) > se nazývá100(1− α)% oboustranným intervalem spo-lehlivosti parametru θ jestliže
P [TD(X) ≤ θ ≤ TH(X) ] = 1− α
(ii) Interval < TD(X),∞) se nazývádolním 100(1−α)% intervalem spolehlivostiparametru θ, jestliže
P [θ ≥ TD(X)] = 1− α
(iii) Interval (−∞, TH(X) > se nazýváhorním 100(1−α)% intervalem spolehlivostiparametru θ, jestliže
P [θ ≤ TH(X)] = 1− α
159
Pro odvození intervalových odhadů pro parametryµ a σ2 používáme statistiky
Z =Xn − µ
σ/√
n∼ N(0, 1)
T =Xn − µ
Sn/√
n∼ tn−1
(n− 1)S2nσ2
∼ χ2n−1
10.8. Věta. Nechť X = (X1, . . . , Xn) je ná-hodný výběr z rozdělení N(µ, σ2). Pak
(i) P [Xn − u1−α/2σ√n≤ µ ≤ Xn + u1−α/2
σ√n] = 1− α
(ii) P [Xn − tn−1,1−α/2Sn√n≤ µ ≤ Xn + tn−1,1−α/2
Sn√n] = 1− α
Důkaz: (i) Z = Xn−µσ/√
n∼ N(0, 1)
P [uα/2 ≤ Z ≤ u1−α/2] = 1− α .
σ√n
uα/2 ≤ Xn − µ ≤ σ√n
u1−α/2
160
(ii) Totéž s využitím statistiky T = Xn−µSn/
√n∼ tn−1.
10.9. Příklad. Je měřena výška 16 rostlin. Prů-měr naměřených hodnot je 72,5 cm, výběrová smě-rodatná odchylka je 4,5 cm. Nalezněte 90% inter-val spolehlivosti pro střední výšku.
1− α = 0, 9;α = 0, 1; 1− α/2 = 0, 95
t15(0, 95) = 1, 75
r = 1, 75 4,5√16= 1, 97
(70, 53; 74, 47)
10.10. Příklad. X ∼ N(µ, σ2). Při padesáti mě-ření byla získána směrodatná odchylka
S50 =√2, 192
Určete horní 95% interval spolehlivosti pro σ2.
(n− 1)σ2
σ2∼ χ2n−1
161
P
[(n− 1)S2n
σ2≥ χ2n−1,α
]= 1− α
P
[σ2 ≤ (n− 1)S
2n
χ2n−1,α
]= 1− α
χ249(0, 05) = 33, 930
49 · 2, 19233, 930
= 3, 166 .
Interval: (0, 3,166).
Přibližné intervalové odhady: Xn má podle Cen-trální limitní věty pro velké n přibližně normálnírozdělení:
X1 +X2 + · · ·+Xn − nµ√nσ
=Xn − µ
σ/√
n
má přibližně rozdělení N(0, 1). Dá se použít inter-valový odhad pro normální rozdělení:
Xn − u1−α/2Sn√n≤ E(X) ≤ Xn + u1−α/2
Sn√n
162
s pravděpodobností 1− α.
U alternativního rozdělení A(p) se navíc aproxi-muje σ2 hodnotou
Xn(1−Xn)
Xn − u1−α/2
√Xn(1−Xn)√
n≤ p ≤ Xn + u1−α/2
√Xn(1−Xn)√
n
s pravděpodobností 1− α.
10.11. Příklad. Při průzkumu se zjistilo, že z1500 oslovených osob poslouchá rádiovou stanicikvůli hudbě 63%. Určete 98% interval spolehlivostipro skutečné procento takovýchto posluchačů.
X1500 = 0, 63
r = u0,99 ·√0, 63 · 0, 371500
= 0, 029
interval
(60, 1%; 65, 9%)
163
11 Testování statistickýchhypotéz
statistické rozhodování při neúplné informaci, vždys jistým rizikem.
H0 . . . nulová hypotéza:
k−tice parametrů (θ1, . . . , θk) ∈ A ⊂ Rn
H1 . . . alternatvní hypotéza:
k−tice parametrů (θ1, . . . , θk) ∈ B ⊂ Rn
A ∩B = ∅kritický obor:
W ⊂ Rn
naměřená data: X = (X1, . . . , Xn).
H0 zamítneme ve prospěch H1 pokud X ∈ W ,volí se tak, aby
P [X ∈ W |H0] ≤ α
164
α . . . hladina významnosti
standardy: α = 0, 5; 0, 01
Chyba prvního druhu: H0 platí a test ji zamítá
Chyba druhého druhu: H0 neplatí a test ji neza-mítá
11.1. Příklad. V roce 1951 byla naměřena prů-měrná výška 10 letých chlapců v ČSSR 136,1 cm.V roce 1961 se u 15 náhodně vybraných 10 letýchchlapců zjistila průměrná výška
X15 = 139, 133cm
V obou případech je σ = 6, 4cm
Vzrostla výška?
Výška v r. 1961, N(µ, 6, 42)
H0 : µ = 136, 1 = µ0
H1 : µ > 136, 1
165
Hypotézu H0 zamítneme pokud X15 bude přílišvelký, tj. pokud X15 > c, kde c je vhodně zvolenákonstanta.
Platí-liH0, pakX15 má rozděleníN(µ0, 6,42
15 ). Tedy
Z =X15 − µ0
σ/√15
∼ N(0, 1) .
Zamítáme na hladině α jestliže Z > u1−α
Volme α = 0, 05. u0,95.= 1, 64
Z =139, 133− 136, 16, 4/
√15
.= 1, 835
Protože Z > u0,95 zamítáme hypotézu H0 na hla-dině významnosti 5%.
Kritický obor: x ∈ R15 | 115(x1 + · · ·+ x15) ≥ c
c = 136, 1 + u0,95 · 6, 4√15 = 136, 1 + 1, 838 = 137, 938
166
Lze volit mnoho kritických oborů. Existuje mate-matický výsledek (Neymannovo-Pearsonovo lemma)říkající, že tento test má největší sílu.Síla testu: pravděpodobnost s jakou zamítnemenulovou hypotézu když platí hypotéza alternativní.
Vztah mezi chybou prvního a druhého druhu α aβ. Pokud H0 neplatí, pak α → 0 implikuje β → 1.
Testy o střední hodnotě normálního roz-dělení
X = (X1, . . . , Xn)
. . . náhodný výběr z rozdělení N(µ, σ2).
H0 : µ = µ0
H1 : µ 6= µ0...oboustranný test
H2 : µ > µ0...jednostranný test
H3 : µ < µ0...jednostranný test
167
Z-test
známe σ
Z =Xn − µ0σ/√
n
má za podmínky H0 rozdělení N(0, 1).
H0 zamítneme na hladině významnosti α
a) proti H1: pokud |Z| > u1−α/2
b) proti H2: pokud Z > u1−α
a) proti H3: pokud Z < uα = −u1−α
168
t-test
neznáme σ
T =Xn − µ0Sn/
√n
má za podmínky H0 rozdělení tn−1.
H0 zamítneme na hladině významnosti α
a) proti H1: pokud |T | > tn−1(1− α/2)
b) proti H2: pokud T > tn−1(1− α)
a) proti H3: pokud T < tn−1(α) = −tn−1(1− α)
Pro velké n aproximujeme tn−1 rozdělenímN(0, 1).
169
11.2. Příklad. Automat plní krabice práškem. Normaje 2kg. Náhodně bylo vybráno 6 krabic. Zjistily senásledující odchylky od normy v dkg.
−5, 1,−1,−8, 7,−6
Testujeme správnost funkce automatu.
H0 : µ = 0
H1 : µ 6= 0 .
n = 6, X6 = −2, S26 = 30, 4
T =−2− 0
√30, 4/
√6
.= −0, 889 .
t5(0, 975) = 2, 5706
|T | < 2, 5706
Závěr: H0 nezamítáme.
170
Párový t-test: Sledujeme související veličiny, před-pokládáme, že rozdíl má normální rozdělení.
11.3. Příklad.
váha osob před dietou 82 70 91váha osob po dietě 81 69,5 89
Má dieta efekt ?
Rozdíly před a po:
1— 0,5— 2
H0 : µ = 0
H1 : µ > 0
X3 = 1, 167
S23 = 0, 583
T =1, 167
S3/√3= 2, 647 .
t2(0, 95) = 2, 92
171
Závěr: nezamítáme nulovou hypotézu, pokles váhyneni průkazný. (I když se zdá být ztráta váhy velká,máme málo pokusných osob).
172
Asymtotický test proporce
A(p) . . . alternativní rozdělení
Centrální limitní věta: Xn se aproximuje rozděle-ním N(p, p(1−p)
n).
H0 : p ≤ p0
H1 : p > p0
H0 zamítáme, jestliže Xn > c. Volíme vhodně ctak, aby
P [Xn > c|H0] ≤ α
P
[Xn > c|H0
].= 1− Φ
(c− p√p(1−p)√
n
)=
= 1− Φ(√
n(c− p)√p(1− p)
)√
p(1− p) ≤ 1/2 c− p ≥ c− p0
implikuje√
n(c− p)√p(1− p)
≥ 2√
n(c− p0)
173
Tedy
1− Φ(√
n(c− p)√p(1− p)
)≤ 1− Φ(2
√n(c− p0))
Podmmínce vyhovíme, jestliže
1− Φ(2√
n(c− p0)) ≤ α
Φ(2√
n(c− p0)) ≥ 1− α
2√
n(c− p0) ≥ u1−α
c ≥ p0 +u1−α
2√
n
Závěr: H0 zamítáme ve prospěch H1 jestliže
Xn ≥ p0 +u1−α
2√
n
174
11.4. Příklad. Průzkum zahrnuje 1600 osob. Ko-lik procent z tohoto vzorku má daná koalice získathlasů, abychom na hladině významnosti 1% potvr-dili hypotézu, že koalice vyhraje volby.
X1600 ≥ 0, 5 +u0,9980
.= 0, 5 +
2, 32680
= 0, 529 .
Musíme tedy získat 0, 529 · 1600 .= 847 hlasů.
Musíme vždy získat o asi 2, 9% více než je danámez.
175
Test rozptylu normálního rozdělení
X = (X1, . . . , Xn) . . . náhodný výběr z rozděleníN(µ, σ2)
H0 : σ2 = σ20
H1 : σ2 > σ20
Využíváme statistiku
S =(n− 1)S2n
σ20
která má za předpokladu H0 rozdělení χ2n−1.
Hypotézu H0 zamítáme ve prospěch H1 při hla-dině významnosti α jestliže
(n− 1)S2nσ20
> χ2n−1(1− α) .
176
Testy dobré shody
(Ω,A, P ) . . . pravděpodobnostní prostorA1, . . . , Ak . . . úplný systém jevů
P (Ai) = pi
k∑i=1
pi = 1 .
A1 A2 · · · Ak
p1 p2 · · · pk
Odpovídá rozdělení dat do disjunktních tříd. pi
jsou apriorní pravděpodobnosti. Testujeme jejichshodu s empirickými daty.
H0 : P (Ai) = pi
(k = 2) máme vpodstatě alternativní rozdělení.
Učiníme sérii n pokusů, v každém indikujeme je-den z jevů A1, . . . , Ak. Počítáme kolikrát který jevnastane. Při k = 2 tak máme binomické rozdělení.
177
Značení:n . . . počet nezávislých pokusů
Oi . . . počet výskytů jevu Ai v sérii n pokusů.
Náhodná veličina – empirická četnost.
n pi . . . teoretická četnost
(k = 2 pak Oi ∼ Bi(n, pi))
Testujeme shodu npi ≈ Oi
11.5. Věta. Náhodná veličina
k∑i=1
(Oi − npi)2
npi
má při n →∞ přibližně rozdělení χ2k−1.
Důkaz je založen na centrální limitní větě
HypotézuH0 o apriorních pravděpodobnostech za-mítáme na hladině významnosti α, pokud
k∑i=1
(Oi − npi)2
npi
> χ2k−1(1− α)
178
Tento test se nazývá χ2 test, nebo též Pearsonůvtest. Tento test je asymptotický, doporučuje se hopoužít pro n tak velké, že
npi > 5 pro všechna i = 1, . . . , k .
11.6. Příklad. Testujeme zda hrací kostka nenifalešná. Provedeno 120 hodů. Výsledky jsou
hodnota 1 2 3 4 5 6četnost 15 16 25 31 15 18
n = 120, pi = 1/6, npi = 120 · 16 = 20.
6∑i=1
(Oi − npi)2
npi
=
=52
20+42
20+52
20+112
20+52
20+22
20= 10, 8 .
χ25(0, 95) = 11, 07 .
Závěr: nelze zamítnout hypotézu, že kostka je fa-lešná.
179
Často se používá na test typu rozdělení:
11.7. Příklad. Testujeme hypotézu, že data po-cházejí z rozděleníN(0, 1). Provedeno je 1000 mě-ření, data jsou rozdělena do tří skupin
u0,8 = 0, 84162
250 hodnot v (−∞,−u0,8)
550 hodnot v (−u0,8, u0,8)
200 hodnot v (u0,8,∞)
H0 : p1 = 0, 2; p2 = 0, 6; p3 = 0, 2
np1 = 200
np2 = 600
np3 = 200
3∑i=1
(Oi − npi)2
npi
=502
200+502
600+0200= 16, 667 .
χ22(0, 95) = 5, 9915
Závěr: Hypotézu o rozdělení N(0, 1) zamítáme.
180
Testy shody při neznámých parametrech
Testujeme zda data pocházejí z rozdělení s nezná-mými parametry.
Je-li l počet odhadnutých parametrů, pak
k∑i=1
(Oi − npi)2
npi
má asymptoticky rozdělení χ2k−1−l.
Postup:1. Neznámé parametry odhadneme z dat.2. Pomocí nich spočítáme apriorní pravděpodob-nosti3. Hypotézu o daném rozdělení zamítneme, jestliže
k∑i=1
(Oi − npi)2
npi
> χ2k−1−l(1− α)
181
11.8. Příklad. Za války byl Londýn bombardo-ván střelami V1 a V2. Hypotéza je, že střely do-padaly náhodně (bez zaměřování) do jednotlivýchlokalit.Celkem na Londýn dopadlo 537 raket.Území města bylo rozděleno na 242 = 576 čtvercůstejné velikosti.
Empirická data:
počet zásahů: 0 1 2 3 4 a vícepočet oblastí: 229 211 93 35 8
X: počet zásahů v náhodně vybrané oblasti:
Bi
(počet střel ,
1počet oblastí
)≈ Po
(počet střel · 1
počet oblastí
).
1. Odhadneme:
λ.=537576
(=počet střelpočet oblastí
).
2. Platí-li H0 je
P [X = i] =λie−λ
i!.
182
počet pokusů = počet oblastí
n = 576
nP [X = 0] = 576 e−537576
.= 226, 7 .
nP [X = 1] = 576 · 537576
e−537576
.= 211, 4 .
nP [X = 2].= 98, 5 .
nP [X = 3].= 30, 6 .
nP [X ≥ 4] .= 8, 7 .
počet zásahů: 0 1 2 3 4 a víceskutečnost: 229 211 93 35 8teorie: 226,7 211,4 98,5 30,6 8,7
Numerický výpočet:5∑
i=1
(0i − npi)2
npi
= 1, 569
χ25−1−1(0, 95) = 7, 81 .
Závěr: Na hladině významnosti 5% potvrzujemehypotézu H0.
183