Matematika 4B - math.fel.cvut.cz

Matematika 4BProf. RNDr. Jan Hamhalter, CSc.

katedra matematiky FEL ČVUT

e-mail: [email protected]

tel: 224353587

web:http://math.feld.cvut.cz//hamhalte

11. ledna 2007

16:56

1

• V.Rogalewicz: Pravděpodobnost a statistika pro in-ženýry, skripta, Vydavatelství ČVUT, 1998.

• K.Zvára a J.Štěpán: Pravděpodobnost a matema-tická statistika, matfyzpress, Praha 2002.

• J.Anděl: Matematika náhody, matfyzpress, Praha 2003.

• J.Anděl: Statistické metody, matfyzpress, Praha 2003.

• V.Dupač a M.Hušková: Pravděpodobnost a matema-tická statistika, Nakladatelství Karolinum, 1999.

• Z.Prášková: Základy náhodných procesů II, Nakla-datelství Karolinum, 2004.

• A. Rényi: Teorie pravděpodobnosti, Academia, Praha1972.

2

1 Historie a podstatateorie pravděpodobnosti

teorie pravděpodobnosti = matematika náhody, systémy snedostatkem informace

svět 19. století – deterministický systém, hodinový strojsvět 20. století – svět náhody (evoluce není možná bez ná-hody, mikrosvět se řídí pravděpodobnostními zákony, teoriechaosu, apod.)

• Úloha o rozdělení sázkyPochází od Arabů. Nedávno objevena v rukopise z r. 1380.

Dva hráči hrají sérii partií. Výsledky jednotlivých her jsounezávislé. Vyhrává ten kdo poprvé zvítězí v šesti partiích.Pravděpodobnost výhry je pro každého hráče stejná, t.j.1/2. Hra je přerušena ve chvíli kdy hráč A vyhrál 5x a hráčB 3x. Jak si rozdělí výhru?

Úloha byla vyřešena nezávisle Pascalem a Fermatem (1654).

Všechny možnosti pokračování (hra bude trvat nejvýše třidalší partie):

AAA AAB ABA ABBBAA BAB BBA BBB

Pouze v jednom případě vítězí B, pravděpodobnost výhryhráče B je 1:8, výhra by se měla rozdělit v poměru 7:1.

3

• Huygens (1657) : On Reasoning in Games of Dice

• Laplace (1812): Analytic Theory of Probabilities

nestačí kombinatorické metody, je třeba uvažovat neko-nečné soubory možností

statistická fyzika, Brownův pohyb, teorie míry a integrace

• A. Kolmogorov (1930): Axiomatické základy teorie prav-děpodobnosti

• současný stav a perspektivy: nové obory založené na prav-děpodobnostním přístupu – kvantová teorie informace,teorie her v ekonomii, teorie chaosu, . . .

4

2 Pravděpodobnostní prostor

pravděpodobnostní model má dvě komponenty:

• struktura náhodných jevů

• pravděpodobnost jako kvantitativní funkce na jevech

2.1. Příklad. Střelba na terčΩ = kruh o poloměru rnáhodné jevy = podmnožiny Ω

pravděpodobnost(A) =obsah(A)

πr2.

5

2.2. Příklad. Sportka

Ω = 1, 2, 3, 4, 5, 6, 1, 3, 4, 6, 2, 17, . . . = šestiprvkové podmnožiny množiny 1, 2, . . . , 49

tyto šestice tvoří elementární jevy s pravděpodobností

1(496

) = 113983816

= 0, 7151138242 · 10−7

jev= podmnožina Ω

pravděpodobnost jevu A ⊂ Ω.

P (A) =velikost(A)(49

6

) .

konkrétní výpočet v tomto modelu – spočtěte pravděpo-dobnost, že uhodnete (právě) tři čísla.

P (A) =

(63

)·(433

)(496

) = 0, 1765040387

6

náhodné jevy musíme umět kombinovat„ jev A nebo jev Bÿ, . . .

2.3. Definice. Nechť Ω je neprázdná množina. SystémA podmnožin množiny Ω se nazývá σ-algebra náhodnýchjevů, jestliže platí

(i) Ω ∈ A.

(ii) Jestliže A1, A2, . . . jsou množiny v A, pak⋃∞i=1Ai ∈ A

(iii) Je-li A ∈ A, pak Ac = Ω \A ∈ A

Terminologie:Ac. . . opačný jev k jevu AA,B jsou navzájem vylučující se (disjunktní) jevy jestližeA ∩B = ∅

7

2.4. Tvrzení. Je-li A σ-algebra podmnožin Ω pak

(i) A1, A2, . . . ∈ A =⇒⋂∞

i=1Ai ∈ A.

(ii) A,B ∈ A =⇒ A ∩Bc ∈ A.

Důkaz:(i) Ac

1, Ac2, . . . ∈ A,=⇒

⋃∞i=1Ac

i ∈ A =⇒(de Morganova pravidla)( ∞⋃

i=1

Aci

)c

=∞⋂

i=1

Ai ∈ A .

(ii) A,Bc ∈ A =⇒ A ∩Bc ∈ A .

8

pravděpodobnost modeluje relativní četnost, měla by re-spektovat stejná pravidla jako počet prvků množiny

2.5. Definice. Předpokládejme, že A je σ-algebra pod-množin množiny Ω. Pravděpodobnost P je zobrazení

P : A → [0, 1] ,

pro které platí

(i) P (Ω) = 1

(ii) P (⋃∞

i=1Ai) =∑∞

i=1 P (Ai),jestliže A1, A2, .... jsou navzájem disjunktní množinyv A.

Trojice (Ω,A, P ) se nazývá pravděpodobnostní prostor.

9

Základní vlastnosti pravděpodobnosti

(i) A ∩B = ∅ =⇒ P (A ∪B) = P (A) + P (B)

(ii) P (∅) = 0(⇐= P (Ω) + P (∅) = P (Ω))

(iii) P (Ac) = 1− P (A)(⇐= P (A) + P (Ac) = P (Ω) = 1.)

(iv) A ⊂ B =⇒ P (B ∩Ac) = P (B)− P (A)(⇐= P (B) = P (A) + P (B ∩Ac))

(v) P (A ∪B) = P (A) + P (B)− P (A ∩B).

odvození: X = A ∩ (A ∩B)c , Y = B ∩ (A ∩B)c

P (X) + P (Y ) + P (A ∩B) = P (A ∪B)

P (A)−P (A∩B)+P (B)−P (A∩B)+P (A∩B) = P (A∪B)

P (A) + P (B) = P (A ∪B) + P (A ∩B)

10

Tato základní pravidla jsou často užitečná při konkrétníchvýpočtech.

2.6. Příklad. Určete pravděpodobnost, že při tahu Sportkybude vylosováno buďto číslo 7 nebo číslo 20.

Řešení: A . . . taženo číslo 7, B . . . taženo číslo 20.

P (A) = P (B) =

(485

)(496

)P (A ∩B) =

(474

)(496

)Tedy

P (A ∪B) = 2 ·(485

)(496

) − (474

)(496

) = 1356= 0, 232148571 .

11

Důležité typy pravděpodobnostních prostorů:

• klasický pravděpodobnostní prostor

• konečný pravděpodobnostní prostor

• diskrétní nekonečný pravděpodobnostní prostor

• geometrický pravděpodobnostní prostor

12

Klasický pravděpodobnostní prostor

Ω = ω1, . . . , ωnA = všechny podmnožiny množiny Ω

P (A) =|A||Ω|=|A|n

.

V tomto modelu mají elementární jevy stejnou šanci = 1n .

Někdy je těžké nalézt dobrý model slovní úlohy, často sesetkáme se složitou kombinatorikou.

13

2.7. Příklad. Hodíme n krát mincí, rub i líc v jednomhodu mají stejnou šanci, tj. 12 . Jaká je pravděpodobnost žepadne právě k krát líc?

Řešení: elementární jevy – posloupnosti nul a jedniček délkyn kódující výsledky hodů.

|Ω| = 2n

Ω = ω1, . . . , ω2n

Ak . . . . posloupnost obsahuje právě k jedniček.

|Ak| =(

n

k

)Tedy

P (Ak) =12n

(n

k

).

Poznámka: Hodíme n krát mincí, kde n je sudé. Jaká jepravděpodobnost, že padne stejný počet nul jako jedniček?

P (An/2) =12n

(n

n/2

)Pomocí tzv. Stirlingova vzorce lze dokázat, že

P (An/2) ≈1√

πn/2→ 0 pro n →∞ .

14

2.8. Příklad. Narozeninový problémJaká je pravděpodobnost, že ve třídě s n žáky se najdedvojice mající narozeniny ve stejný den? (n ≤ 365).

Řešení:

Ω = posloupnosti délky n

prvků množiny 1, 2, . . . , 365

Elementární jevy kódují den narozenin 1. až n-tého žáka.

A . . . sledovaný jevAc . . . jev opačný, všichni mají narozeniny v jiný den.

|Ω| = 365n

|Ac| = 365 · 364 · 363 · · · (365− n+ 1)

P (A) = 1− 365 · 364 · 363 · · · (365− n+ 1)365n

=

= 1 −n−1∏j=1

(1 − j

365

)Nečekané numerické hodnoty:již pro n = 23 je P (A) > 1/2,pro n = 56 je P (A) = 0, 99.

15

Konečný pravděpodobnostní prostor

Ω = ω1, . . . , ωnA = všechny podmnožiny Ω

p1, . . . , pn > 0 . . . váhyn∑

i=1

pi = 1

P (ωi) = pi

• Z toho vyplývá že

P (A) =∑

i|ωi∈A

pi ,

pro všechny A ⊂ Ω.

• Klasický pravděpodobnostní prostor je speciálním přípa-dem, ve kterém jsou všechny váhy stejné:

p1 = p2 = · · · = pn =1n

.

16

2.9. Příklad. Ω = ω1, ω2, ω3

p1 = P (ω1) =12

p2 = P (ω2) =14

p3 = P (ω3) =14

ω1 ω2 ω312

14

14

Je tedy např.

P (ω1, ω2) = p1 + p2 =12+14=34

.

17

Bernoulliovo schéma

Máme jev A (zdar) s pravděpodobností 0 < p < 1a jev B (nezdar) s pravděpodobností 0 < 1− p < 1.V náhodném pokusu nastane právě jeden z jevů A a B spříslušnou pravděpodobností. Provedeme sérii n těchto ná-hodných pokusů, jejichž výsledky se navzájem neovlivňují.

Možné výstupy pro n = 4: ABAA, BBBA, . . .kódovány posloupnostmi 0 a 1: 1011, 0001, . . .

Elementární jevy —- posloupnosti nul a jedniček délky n

Nezávislost znamená, že pravděpodobnosti se násobí:

P (1011) = p · (1− p) · p · p = p3 · (1− p)

P (0001) = (1− p) · (1− p) · (1− p) · p = p · (1− p)3

18

To nás vede k následujícímu modelu:

Ω= všechny posloupnosti nul a jedniček délky n

|Ω| = 2n.

P (posloupnost ) = ppočet 1 · (1− p)počet 0

Ověříme, že součet vah je 1:

2n∑i=1

pi =n∑

k=0

(n

k

)pk (1− p)n−k =

= (p + (1 − p))n = 1.

Důležitý je jev, Ak, že v sérii n pokusů nastane jev A právěk krát.

|Ak| =(nk

).

P (Ak) =

(n

k

)pk (1− p)n−k .

Konkrétní příklady: hod mincí, hod kostkou, ankety, statis-tické šetření, apod.

2.10. Příklad. Terč zasáhneme s pravděpodobností 1/3.Jaká je pravděpodobnost, že se dvakrát strefíme při čtyřechpokusech.

P (A2) =

(42

)132

(23

)2=48161= 0, 2963 .

19

Nekonečný diskrétní pravděpodobnostní prostor

Ω = ω1, ω2, . . . A = všechny podmnožiny Ω(pn)

∞n=1 . . . posloupnost vah

∞∑n=1

pn = 1, pn ≥ 0

P (ωn) = pn pro n = 1, 2, . . .

• Z toho vyplývá, že

P (A) =∑

n|ωn∈A

pn ,

pro všechny A ⊂ Ω.

20

Poissonův zákon

Ω = ω0, ω1, ω2 . . . λ > 0 parametr

pn =λn

n!e−λ , n = 0, 1, . . .

Ověříme korektnost zadání:∞∑

n=0

λn

n!e−λ = e−λ

∞∑n=0

λn

n!= e−λ eλ = 1 .

2.11. Příklad. Za danou časovou jednotku volá na ústřednuprůměrně λ > 0 účastníků. Pravděpodobnost pn, že zavoláprávě n účastníků se řídí Poissonovým zákonem:

pn =λn

n!e−λ

Pravděpodobnost, že zavolá alespoň někdo je 1− e−λ.

21

Geometrický pravděpodobnostní prostor

pravděpodobnost je dána geometrickou kvantitou (délka,obsah, objem)

Ω ⊂ R, R2, R3, . . . ,

0 < velikost (Ω) < ∞ ,

P (A) =velikost (A)velikost (Ω)

pro A ⊂ Ω.

2.12. Příklad. Terč má poloměr 30 cm. Jaká je pravdě-podobnost, že se trefíme do středu o poloměru 5cm ?

Řešení:

p =25π900π

= 0, 02777 . . . .

22

2.13. Příklad. Buffonova úlohaV rovině je dán systém rovnoběžek majících vzdálenost d.Na rovinu hodíme jehlu o velikosti l, l < d. Jaká je prav-děpodobnost, že protne některou rovnoběžku?

Řešení: Polohu jehly vůči rovnoběžné síti popíšeme dvěmaparametry:

x . . . vzdálenost středu jehly od nejbližší rovnoběžky

x ∈< 0,d

2>

ϕ . . . úhel, který jehla svírá s rovnoběžnou sítí

ϕ ∈< 0, π > .

Podmínka protnutí:

l

2sinϕ > x

P =1

π d/2

π∫0

l

2sinϕdϕ =

l

πd

[− cosϕ

]π

0

=

=2lπd

.

23

Další vlastnosti pravděpodobnosti:

Princip inkluze a exkluze

Opakování: P (A ∪B) = P (A) + P (B)− P (A ∩B).

Mějme nyní tři jevy A,B,C ∈ A.

P (A ∪B ∪ C) = P [(A ∪B) ∪ C] =

P (A ∪B) + P (C)− P ((A ∩ C) ∪ (B ∩ C))

= P (A) + P (B)− P (A ∩B) + P (C)

− P (A ∩ C)− P (B ∩ C) + P (A ∩B ∩ C)

= P (A) + P (B) + P (C)

− P (A ∩ C)− P (B ∩ C)− P (A ∩B)

+ P (A ∩ B ∩ C)

24

Zobecnění se dá dokázat indukcí:

2.14. Věta. Princip inkluze a exkluzePředpokládejme, že A1, . . . , An ∈ A, kde (Ω,A, P ) jepravděpodobnostní prostor. Pak platí

P (A1∪A2∪· · ·∪An) =∑1≤i≤n

P (Ai)−∑

1≤i<j≤n

P (Ai∩Aj)

+∑

1≤i<j<k≤n

P (Ai∩Aj∩Ak)+· · ·+(−1)n+1P (∩ni=1Ai) .

25

2.15. Příklad. Roztržitá šatnářkan hostů restaurace si přichází odložit svůj kabát. Šatnářkavydává kabáty chaoticky. Jaká je pravděpodobnost, že ale-spoň jeden z hostů dostane svůj kabát?

Řešení: Elementární jevy jsou permutace n prvkové mno-žiny. (

1 2 . . . nk1 k2 . . . kn

)Všechny mají stejnou pravděpodobnost, tj. 1n! .

A = (k1, . . . , kn) | existuje 1 ≤ i ≤ n tak že ki = i .

A = A1 ∪A2 ∪ · · · ∪An ,

kde

Ai = (k1, . . . , kn) | ki = i

(i-tý host je v pořádku)

P (Ai) =(n− 1)!

n!

P (Ai ∩Aj) =(n− 2)!

n!, i 6= j

P (A1 ∩A2 ∩ · · · ∩An) =1n!

26

P (A) = 1−(

n

2

)(n− 2)!

n!+

(n

3

)(n− 3)!

n!−· · ·+(−1)n+1 1

n!

= 1− 12!+13!− · · ·+ (−1)n+1 1

n!

numerické hodnoty:

n 1 2 3 4 5 6 7P (A) 1 0,5 0,6667 0,625 0,6333 0,6319 0,6321

asymptoticky:

e−1 = 1− 11!+12!− 13!+ · · ·

limn→∞

P (A) = 1− e−1 = 0, 6321....

27

Zacházení s nekonečnými posloupnostmi jevů, spojitost prav-děpodobnosti:

2.16. Věta. Předpokládejme, že (Ω,A, P ) je pravděpo-dobnostní prostor.

(i) Je-li A1 ⊂ A2 ⊂ · · · pro A1, A2, · · · z A, pak

P

( ∞⋃i=1

Ai

)= lim

i→∞P (Ai)

(ii) Je-li A1 ⊃ A2 ⊃ · · · pro A1, A2, · · · z A, pak

P

( ∞⋂i=1

Ai

)= lim

i→∞P (Ai)

Důkaz: (An) splňuje (i)

An = A1 ∪ (A2 \A1) ∪ (A3 \A2) ∪ · · · ∪ (An \An−1)

je disjunktní sjednocení. Pak

P (An) = P (A1) + P (A2 \A1) + P (A3 \A2) +

+ · · · + P (An \ An−1) .

Dále platí∞⋃

n=1

An = A1 ∪ (A2 \A1) ∪ (A3 \A2) ∪ · · ·

28

P

( ∞⋃n=1

An

)=

P (An)︷︸︸︷P (A1) + P (A2 \A1) + · · ·+ P (An \An−1)+ · · · =

= limn→∞

P (An)

P

( ∞⋃n=1

An

)= lim

n→∞P (An)

(ii) obdobným způsobem, nebo z (i) přechodem k množi-novému komplementu.

29

3 Nezávislé jevy a podmíněná prav-děpodobnost

Pravděpodobnostní model se mění dostaneme-li částečnouinformaci o systému. Víme, že nastal jev B. Pak pravdě-podobnost, že nastane jev A je

P (A ∩B)P (B)

.

———————————————————————

3.1. Definice. Je dán pravděpodobnostní prostor (Ω,A, P )a B ∈ A s P (B) > 0. Podmíněná pravděpodobnost ná-hodného jevu A za podmínky B je definována jako

P (A|B) = P (A ∩B)P (B)

.

Tedy

P (A ∩B) = P (A|B)P (B) = P (B|A)P (A) .

30

3.2. Příklad. Skříňka má tři zásuvky. V první jsou dvězlaté mince, ve druhé zlatá a stříbrná mince a ve třetí dvěstříbrné mince.

•z1 • z2

•z3 s1

s2 s3

Náhodně jsme vybrali zásuvku a náhodně z ní vytáhli minci.Tažená mince je stříbrná. Jaká je pravděpodobnost, žedruhá mince ve vytažené zásuvce je zlatá?Řešení: naivní odpověď 1/2 není správná.Dvě fáze náhodného procesu:1. volba zásuvky 2. volba mince

Ω = (1, z1), (1, z2), (2, z3), (2, s1), (3, s2), (3, s3),

Všechny tyto jevy mají stejnou šanci, tj. 1/6.

Z . . . v otevřené zásuvce je zlatá minceS . . . vyjmuli jsme stříbrnou minci (tento jev nastal).Hledáme p = P (Z|S)

P (S) = P(2, s1), (3, s2), (3, s3) =36=12

.

P (Z ∩ S) = P(2, s1) = 1/6 .

p =1/63/6=13

.

31

Formální vlastnosti podmíněné pravděpodobnosti:

(i) P (B|B) = 1

(ii) P (A1 ∪A2|B) = P (A1|B) + P (A2|B)jsou-li A1, A2 ∈ A disjunktní.

————————————————-

3.3. Tvrzení. Je-li (Ω,A, P ) pravděpodobnostní prostora B ∈ A s P (B) > 0, pak (Ω,A, P ((·|B)) je také pravdě-podobnostní prostor.

————————————————————–V pravděpodobnostním prostoru (Ω,A, P ((·|B)) mají jevydisjunktní s B nulovou pravděpodobnost, podmnožiny v Bmají pravděpodobnost normovanou pravděpodobností jevuB.

32

Nezávislé jevy jsou jevy jejichž podmíněné pravděpodob-nosti se neovlivňují:

P (A), P (B) > 0

P (A) = P (A|B) = P (A ∩B)P (B)

P (A ∩B) = P (A) · P (B) .

——————————————————-

3.4. Definice. Nechť (Ω,A, P ) je pravděpodobnostní pro-stor. Jevy A a B ∈ A nazýváme nezávislé, jestliže

P (A ∩B) = P (A) · P (B) .

———————————————————-

3.5. Příklad. Dvakrát hodíme mincí. Všechny výsledkyjsou stejně pravděpodobné. Ukažte, že výsledky v prvníma druhém hodu jsou nezávislé.

Řešení: R. . . rub, L . . . líc

Ω = RL,RR,LR,LL

P (RL, RR) = 12

P (RL,LL) = 12

P (RL) = 14=12· 12

.

33

Obecnější definice:

3.6. Definice. JevyA1, . . . , An v pravděpodobnostní pro-stor (Ω,A, P ) jsou nezávislé, jestliže

P (Ai1 ∩Ai2 ∩ · · · ∩Aik) = P (Ai1)P (Ai2) · · ·P (Aik

)

pro všechna i1 < i2 < · · · < ik, k ≤ n.

Bernoulliovo schéma (revisited)

Výsledky pokusů v Bernoulliově schématu jsou nezávisléjevy. Bernoulliovo schéma tedy můžeme chápat jako sériinezávislých pokusů se dvěma možnými výsledky, které majídoplňkovou pravděpodobnost.

34

3.7. Příklad. Elektrický obvod znázorněný na obrázku jenáhodně přerušován pěti nezávislými spínači. V jedné větvijsou tři spínače a ve druhé dva. Jaká je pravděpodobnostže obvodem prochází proud? Každý spínač je přerušen spravděpodobností 1/2.

Řešení: Ai . . . i-tý vypínač je sepnut

p = P [(A1 ∩A2 ∩A3) ∪ (A4 ∩A5)] =

= P (A1 ∩A2 ∩A3) + P (A4 ∩A5)

− P (A1 ∩A2 ∩A3 ∩A4 ∩A5) =

=123+122− 125=1125= 0, 34375 .

3.8. Tvrzení. Jsou-li jevy A1, . . . , An v pravděpodob-nostním prostoru nezávislé, pak jsou nezávislé i jevyAc1, A2, . . . , An.

Důkaz:

P (Ac1 ∩A2 ∩ · · · ∩An) = P (A2 ∩A3 ∩ · · · ∩An)−− P (A1 ∩A2 ∩ · · · ∩An) =

P (A2)P (A3) · · ·P (An)−P (A1)P (A2) · · ·P (An) =

= (1− P (A1))P (A2) · · ·P (An) =

= P (Ac1)P (A2)P (A3) · · ·P (An) .

Důsledek: Nahradíme-li v nezávislém systému jevů některéjevy jejich opakem, dostaneme opět nezávislý systém.

35

Situace: A1, . . . , An disjunktní jevy, takové že

P (A1) + P (A2) + · · ·+ P (An) = 1

a P (Ai) > 0 pro všechna i. Pak

P ((A1 ∪A2 ∪ · · · ∪An)c) = 0 .

Pro každé B ∈ A máme

P (B) = P (B ∩A1) + P (B ∩A2) + P (B ∩A3) +

· · ·+ P (B ∩An) + 0 =

= P (B|A1)P (A1)+P (B|A2)P (A2)+· · ·+P (B|An)P (An) .

———————————————————–

3.9. Definice. PosloupnostA1, . . . , An disjunktních jevův pravděpodobnostním prostoru (Ω,A, P ) se nazývá úplnýsystém jevů jestliže A1, . . . , An jsou disjunktní, P (Ai) > 0pro všechna i a

P (A1) + P (A2) + · · ·+ P (An) = 1 .

3.10. Věta. (Věta o úplné pravděpodobnosti)Předpokládejme že A1, . . . , An je úplný systém jevův pravděpodobnostním prostoru (Ω,A, P ) takový, žeP (Ai) > 0 pro všechna i = 1, . . . n. Pro každé B ∈ Aplatí

P (B) = P (B|A1)P (A1) + P (B|A2)P (A2) ++ · · ·+ P (B|An)P (An)

36

„P (B) je kombinace pravděpodobností P (A1), . . . , P (An)s váhami danými podmíněnými pravděpodobnostmiÿ

3.11. Příklad. V urně č.1 je 50 černých a 60 bílých kuli-ček. V urně č.2 je 60 černých a 50 bílých kuliček. Hodíme sihrací kostkou. Padne-li šestka vybereme urnu č. 1. V opač-ném případě urnu č.2. Z vybrané urny vybereme náhodněkuličku. Jaká je pravděpodobnost, že je bílá?

Řešení:

50 • 60 60 • 50 (1)

A1...padne šestka A2...nepadne šestka

P (A1) = 1/6 P (A2) = 5/6

B . . . vytažená kulička je bílá

P (B|A1) =60110

P (B|A2) =50110

.

p =60110

· 16+50110

· 56=111+2566=3166=

= 0, 4697.

37

Bayesův vzorecBayes (1761) . . . stejné apriorní pravděpodobnostiLaplace (1774) . . . obecný případ

věta o úplné pravděpodobnosti:P (Ai), P (B|Ai)→ P (B)nyní určíme P (Ai|B):

3.12. Věta. Bayesův vzorecJe-li A1, . . . , An úplný systém jevů v pravděpodobnostnímprostoru (Ω,A, P ) a B ∈ A s P (B) > 0 pak

P (Aj |B) =P (B|Aj)P (Aj)∑ni=1 P (B|Ai)P (Ai)

pro všechna j = 1, 2, . . . , n.

Důkaz:

P (Aj |B) =P (Aj ∩B)

P (B)=

P (B|Aj)P (Aj)∑ni=1 P (B|Ai)P (Ai)

—————————————————————–vstup:P (A1), P (A2), . . . P (An) . . . apriorní pravděpodobnostiP (B|A1), P (B|A2), . . . P (B|An) . . . podmíněné pravděpo-dobnostiB . . . přináší novou informaci o stavu systému

výstup: P (A1|B), P (A2|B), . . . P (An|B) —— upřesněnáinformace

38

3.13. Příklad. Máme dvě krabice s bílými a černými ku-ličkami. V krabici č. 1 je jedna bílá a devět černých kuliček.V krabici č.2 je jedna černá a devět bílých kuliček.

1 9• č.1

1 • 9 č.2

Za plentou byla vylosována jedna z krabic. Náhodně jsmez ní vytáhli jednu kuličku. Byla bíla. Jaká je pravděpodob-nost, že máme před sebou krabici č.1. ?

A1 . . . první krabice P (A1) =12

A2 . . . druhá krabice P (A2) =12

B . . . tažena bílá kulička P (B|A1) =110

P (B|A2) =910

.

P (A1|B) =P (B|A1)P (A1)

P (B|A1)P (A1) + P (B|A2)P (A2)

=110 ·

12

110 ·

12 +

910 ·

12

=110 ·

12

12

=110

.

39

3.14. Příklad. Diagnóza nemoci

Senzitivita testu: 0,95 (tj. má-li osoba AIDS je test pozi-tivní v 95% případů)

specificita testu: 0,95 (tj. nemá-li osoba AIDS je test ne-gativní v 95% případů)

prevalence nemoci: 0,005 (tj. 0,5% populace je nakaženo)

Jaká je pravděpodobnost, že osoba s pozitivním testem jenakažena virem HIV?

(Naivní odpověď 0,95 je úplně mimo.)

AIDS NE-AIDS0,005 0,995

+, - . . . . výsledky testu

P (+|AIDS) = 0, 95 P (+|NEAIDS) = 0, 05

P (−|AIDS) = 0, 05 P (−|NEAIDS) = 0, 95

P (AIDS|+) =

=P (+|AIDS)P (AIDS)

P (+|AIDS)P (AIDS) + P (+|NEAIDS)P (NEAIDS)

=0, 95 · 0, 005

0, 95 · 0, 005 + 0, 05 · 0, 995= 0, 087 .

apriorní pravděpodobnosti→ aposteriorní pravděpodobnosti(0, 005, 0, 995)→ (0, 087, 0, 913) .

40

Test opakujeme znovu. Testovaná osoba je opět pozitivní.Jaká je nyní pravděpodobnost že má AIDS ?Opakujeme postup s

P (AIDS) = 0, 087 P (NEAIDS) = 0, 913 .

numerické výsledky:i . . . počet pozitivních testů,Pi . . . pravděpodobnost, že daná osoba má AIDS.

i 0 1 2 3 4 5Pi 0,005 0,087 0,645 0,972 0,998 0,9992

41

4 Náhodná veličina

• Zajímá nás pouze sledovaná numerická veličina, nikolivcelý pravděpodobnostní prostor: počet zákazníků, cena ak-cie, hodnota měření napětí, . . .

• Podstatné je stanovit pravděpodobnost, že náhodná ve-ličina má hodnoty v daném rozmezí.

——————————————————–Značení:I . . . interval na reálné ose, zahrnujeme i jednobodové mno-žiny.

X : Ω→ R . . . funkce definovaná na množině Ω.

[X ∈ I] = ω ∈ Ω | X(ω) ∈ I .

4.1. Definice. Nechť (Ω,A, P ) je pravděpodobnostní pro-stor. FunkceX definovaná na Ω se nazývá náhodná veličinajestliže

[X ∈ I] ∈ A

pro všechny intervaly I ⊂ R.

42

Všechny funkce na konečném nebo diskrétním pravděpo-dobnostním prostoru jsou náhodné veličiny.

Náhodné veličiny popisujeme kvantitativně pomocí jejichdistribučních funkcí:

P [X ≤ x] = P (ω | X(ω) ≤ x) .

4.2. Definice. Předpokládejme, že X je náhodná veli-čina na pravděpodobnostním prostoru (Ω,A, P ).Distribuční funkce, FX , náhodné veličiny X je funkce

FX(x) = P [X ≤ x], x ∈ R .

43

4.3. Příklad. X . . . počet ok při hodu kostkouX nabývá šesti hodnot, 1,2,3,4,5,6; distribuční funkce jepo částech spojitá funkce.

4.4. Příklad. X . . . poloha ručičky hodinek při náhod-ném zastavení:

F (x) =

x2π x ∈< 0, 2π >

0 x ≤ 01 x ≥ 2π .

4.5. Příklad. Vlak projíždí přejezdem jedenkrát za ho-dinu, Závory jsou staženy na dvanáct minut. Náhodná ve-ličina X je doba čekání.

P [X = 0] =60− 1260

=4860= 0, 8 .

Pro x ∈ (0, 12 > máme:

P [X ≤ x] = P [X = 0] + P [0 < X ≤ x] = 0, 8 +x

60.

Tedy

FX(x) =

0 x < 0

0, 8 x = 0

0, 8 + x60 x ∈ (0, 12 >

1 x ≥ 12

44

4.6. Věta. Distribuční funkce FX náhodné veličiny Xsplňuje následující podmínky:

(i) 0 ≤ FX ≤ 1

(ii) FX je neklesající

(iii) FX je zprava spojitá

(iv) limx→−∞ FX(x) = 0, limx→∞ FX(x) = 1 .

Dukaz: (ii) Je-li x ≤ y, pak [X ≤ x] ⊂ [X ≤ y], a tedy

FX(x) ≤ FX(y) .

(iii) Volme (δn) klesající posloupnost kladných čísel s nu-lovou limitou a a ∈ R. Uvažujme množiny

An = [X ≤ a+ δn] .

Platí∞⋂

n=1

An = [X ≤ a] .

Dle spojitosti pravděpodobnosti Věta 2.16 platí

P [X ≤ a] = limn→∞

P (An) .

Jinými slovy

FX(a) = limn→∞

FX(a+ δn) ,

a proto

FX(a) = limx→a+

FX(x) .

45

(iv)

An = [X ≤ −n] , n = 1, 2 . . .

Pak An je klesající posloupnost množin s prázdným průni-kem. Dle Věty 2.16 máme

limn→∞

FX(−n) = limn→∞

P (An) = P (∅) = 0 .

FX je neklesající, a proto musí mít v −∞ limitu nula.(Druhá limita podobně.)

V distribuční funkci FX jsou všechny relevantní informaceo náhodné veličině X:

•P [X > a] = 1− P [X ≤ a] = 1− FX(a) .

•

P [X ∈ (a, b >] = P [(X ≤ b) ∧ (X ≤ a)c] =

= P [X ≤ b]− P [X ≤ a] = FX(b)− FX(a) .

•

P [X < a] = limn→∞

P

[X ≤ a− 1

n

]= lim

n→∞FX

(a− 1

n

)= lim

x→a−FX(x) .

•P [X = a] + P [X < a] = P [X ≤ a] .

Odtud

P [X = a] = FX(a)− limx→a−

FX(x) .

(Velikost případného skoku.)

46

4.7. Věta. Ke každé zprava spojité, neklesající funkciF (x) na R, s limitami limx→−∞ F (x) = 0,limx→∞ F (x) = 1, existuje náhodná veličina X tak, že

FX = F .

Důkaz je mimo naše možnosti – teorie míry.

distribuční funkce (náhodná rozdělení) = náhodné veličiny.

Typy náhodných veličin:

• diskrétní rozdělení

• spojité rozdělení

• smíšené rozdělení

47

4.8. Definice. Náhodná veličina X se nazývá diskrétní,jestliže existuje konečná nebo nekonečná posloupnost (xn)taková, že∑

n

P [X = xn] = 1 .

Daná tabulkou resp. pravděpodobnostní funkcí:

x1 x2 x3 · · ·p1 p2 p3 · · ·

P [X = xi] = pi , (xn)n . . . uzly

4.9. Příklad. X . . . počet ok při hodu hrací kostkou

1 2 3 4 5 61/6 1/6 1/6 1/6 1/6 1/6

4.10. Příklad. X . . . doba kdy poprvé padne líc při sériihodů symetrickou mincí.

1 2 3 · · ·12

14

13 · · ·

P [X = n] =12n

.

∞∑n=1

12n= 1 .

48

4.11. Tvrzení. Má-li náhodná veličina X diskrétní roz-dělení s pravděpodobnostní funkcí (xn, pn)n, pak proM ⊂ R platí

P [X ∈ M ] =∑

n | xn∈M

pn .

4.12. Příklad. Jaká je pravděpodobnost, že při házenísymetrickou mincí padne líc poprvé po sudém počtu hodů?

X z Příkladu 4.10.

P [X = sudé] =14+116+164+ · · · = 1

41

1− 14

=13

.

49

4.13. Definice. Náhodná veličina X se nazývá spojitá,jestliže existuje nezáporná funkce f taková, že

FX(x) =

x∫−∞

f(t) dt .

Funkce f se přitom nazývá hustotou náhodné veličiny X.

• Funkce f je hustotou náhodné veličiny právě tehdykdyž je nezáporná a

∫∞−∞ f(t) dt = 1.

• Je-li x bod spojitosti hustoty f , pak f(x) = FX(x)′.

Je-li f hustota náhodné veličiny X, pak

P [a ≤ X ≤ b] =

b∫a

f(x) dx .

Hustota dává preference hodnotám.

50

4.14. Příklad. f(x) =

1 x ∈< 0, 1 >

0 jinak(Rovnoměrné rozdělení)Pro x ∈< 0, 1 >

FX(x) =

x∫0

dt = x .

FX(x) =

0 x ≤ 0x x ∈< 0, 1 >

1 x ≥ 1


x+12 x ∈< −1, 1 >

0 jinak

Pro distribuční funkci F (x) na intervalu < −1, 1 > platí

FX(x) =

x∫−1

t+ 12

dt =

[t2

4+

t

2

]x

−1=

=x2

4+

x

2+14=(x+ 1)2

4.

Pravděpodobnost roste s kvadratickou rychlostí. Pro dis-tribuční funkci máme

FX(x) =

0 x < −1(x+1)2

4 x ∈< −1, 1 >

1 x ≥ 1

51


x+ 1 x ∈< −1, 0 >

1− x x ∈< 0, 1 >

0 jinakPro x ∈< −1, 0 >

FX(x) =

x∫−1

(t+ 1) dt =

[t2

2+ t

]x

−1=

x2

2+ x+

12

.

Pro x ∈< 0, 1 >

FX(x) =12+

x∫0

(1− t) dt =12+

[t− t2

2

]x

0

= −x2

2+ x+

12

.

4.17. Příklad. (Semicircular law)

f(x) =

12π

√4− x2 x ∈< −2, 2 >

0 jinak∫ √4− x2 dx =

12(x

√4− x2 + 4arcsin

x

2) + c .

Pro x ∈< −2, 2 > tedy máme:

FX(x) =14π

x√4− x2 +

1πarcsin

x

2+12

.

52

4.18. Příklad. f(x) =12e−|x| .

Pro x < 0

FX(x) =12

x∫−∞

et dt =ex

2.

Pro x ≥ 0

FX(x) =12+12

x∫0

e−t dt =12− 12e−x +

12= 1− 1

2e−x .

53

4.19. Příklad. Střílíme na terč o poloměru r. Výhra jedána vzdáleností zásahu d od středu terče vzorcem

X = 10(r − d) .

Nalezněte hustotu veličiny X.

Řešení:Pro 0 ≤ x ≤ 10r

P [X ≤ x] = P [10r − 10d ≤ x] = P

[d ≥ r − x

10

]=

= 1−P

[d ≤ r− x

10

]= 1−

π(r − x10 )2

π r2= 1−

(r − x10 )2

r2.

Hustota pro x ∈ (0, 10r >:

f(x) = F ′X(x) =

−2(r − x10 )

r2· −110=15r2

(r − x

10

).

Hustota je nulová mimo interval < 0, 10r >.

54

Důležité je reprezentovat náhodnou veličinu číselnými cha-rakteristikami. Jednou z nich je střední hodnota.

Motivace: Ve škole je N žáků z toho

n1 má prospěch x1 = 1n2 má prospěch x2 = 2n3 má prospěch x3 = 3n4 má prospěch x3 = 4n5 má prospěch x5 = 5

pi =ni

N . . . relativní četnost.

Průměrný prospěch =

=n1x1 + n2x2 + n3x3 + n4x4 + n5x5

N=

=n1N

x1 +n2N

x2 +n3N

x3 +n4N

x4 +n5N

x5 =

= x1p1 + x2p2 + x3p3 + x4p4 + x5p5 .

55

4.20. Definice. Nechť X je diskrétní náhodná veličina,která nabývá hodnot x1, x2, . . . s pravděpodobnostmi

P [X = xi] = pi,∑

i

pi = 1 .

Předpokládejme, že∑i

|xi| pi < ∞ .

Střední hodnota, EX, veličiny X je definovaná vztahem

EX =∑

i

xi pi .

4.21. Definice. Nechť X je náhodná veličina s hustotouf(x) taková, že

∞∫−∞

|x|f(x) dx < ∞ .

Střední hodnota, EX, veličiny X je definována vztahem:

EX =

∞∫−∞

x f(x) dx .

56

4.22. Příklad. Konstantní náhodná veličina

P [X = c] = 1

EX = c · 1 = c .

4.23. Příklad. Počet ok při hodu hrací kostkou

EX =16(1 + 2 + 3 + 4 + 5 + 6) = 3, 5 .

4.24. Příklad. Alternativní rozdělení0 11− p p

EX = 0 · (1− p) + 1 · p = p .

V tomto případě splývá střední hodnota s pravděpodob-ností p.

57

4.25. Příklad. Házíme symetrickou mincí. X je počethodů než padne první líc.

P [X = n] =12n

, n = 1, 2, . . .

EX =∞∑

n=1

n

2n.

Při výpočtu si pomůžeme teorií mocninných řad.∞∑

n=0

xn =11− x

, pro |x| < 1 .

Derivace člen po členu:

∞∑n=1

n xn−1 =

(11− x

)′

=1

(1− x)2.

Pronásobením x

∞∑n=1

n xn =x

(1− x)2

Dosazením x = 12

EX =∞∑

n=1

n

2n=21= 2 .

58

Na každá náhodná veličina má definovánu střední hodnotu.Např. diskrétní veličina s pravděpodobnostní funkcí

P [X = 2n] =12n

, n = 1, 2 . . .

nemá střední hodnotu neboť∞∑

n=1

2n

2n=

∞∑n=1

1 =∞ .

4.26. Příklad. Hustota

f(x) =

x+12 x ∈< −1, 1 >

0 jinak

EX =

1∫−1

xx+ 12

dx =

[x3

6+

x2

4

]1−1=13

.

59

4.27. Příklad. Semicircular law

EX =12π

2∫−2

x√1− x2 dx = 0 .

4.28. Věta. Jsou-li X1 a X2 náhodné veličiny na prav-děpodobnostním prostoru (Ω,A, P ), pak

(i) E(X1 +X2) = EX1 + EX2,

(ii) E(αX1) = αE(X1) , α ∈ R .

(iii) E(X1) ≥ 0 je-li X1 ≥ 0.

60

Podrobnější popis rozložení hodnot kolem střední hodnotyposkytuje rozptyl

4.29. Definice. Rozptyl (variance) náhodné veličinyX, pro kterou existuje EX a EX2 je definován

varX = E[(X − EX)2] .

Značení: var(X), D(X),

Směrodatná odchylka:√

var(X).

E[(X − EX)2] = E[X2 − 2X · (EX) + (EX)2] =

= E(X2) − (EX)2 .

Způsob výpočtu:

EX2 =∑

i

x2i pi . . . diskrétní veličina

EX2 =

∞∫−∞

x2 f(x) dx . . . spojitá veličina

61

4.30. Příklad. Alternativní rozdělení X

0 11− p p

X2 :

0 11− p p

var(X) = EX2 − (EX)2 = p− p2 = p(1− p) .

var(X) ≤ 14

Nejvyšší možná hodnota rozptylu je pro p = 12 a to

14 .

62

4.31. Definice. Nechť FX(x) je distribuční funkce ná-hodné veličiny X. Předpokládejme, že pro každé α ∈ (0, 1)existuje právě jedno β tak, že F (β) = α.

α-kvantil náhodné veličiny X je číslo, pro které platí

FX(xα) = α .

α = P [X ≤ xα] .

Je-li FX prostá, pak xα = F−1X (α) .

F−1X se v tomto případě nazývá kvantilová funkce.

Významné kvantily:

x0,5 . . . mediánx0,75 . . . horní kvartilx0,25 . . . dolní kvartilx0,9 . . . horní decilx0,1 . . . dolní decilx0,99 . . . horní percentil

Statistické tabulky: Průměrný čistý plat v ČR na osobu vdomácnosti v roce 2003 byl 8175 KČ.Dolní decil x0,1=4524 KČ.

63

4.32. Příklad. X je spojité rozdělení s hustotouf(x) = x+1

2 , x ∈< −1, 1 > a nula jinak.Viz Příklad 4.15.

F (x) =14(x+ 1)2 , x ∈< −1, 1 > .

α ∈ (0, 1)

F (x) =14(x+ 1)2 = α

|x+ 1| =√4α

xα = 2√

α− 1

Např. medián

x0,5 = 2√1/2− 1 .

64

4.33. Příklad. Doba rozpadu radioaktivního atomu jenáhodná veličina s hustotou

f(x) =

λ e−λx x ≥ 00 x < 0 ,

kde λ > 0. Určete poločas rozpadu.

Řešení:

Poločas rozpadu je medián. Pro distribuční funkci máme

F (x) =

x∫0

λe−λt dt = [−e−λt]x0 = 1− e−λx .

1− e−λx = 0, 5

e−λx = 0, 5

−λx = − ln 2

x =ln 2λ

Poločas rozpadu je medián

x0,5 =ln 2λ

.

65

4.34. Tvrzení. Platí-li pro náhodné veličinyX a Y vztah

Y = aX + b , a, b ∈ R, a > 0 ,

pak

yα = axα + b

pro všechna α ∈ (0, 1).

Důkaz:

α = P [X ≤ xα] = P [aX + b ≤ axα + b] = P [Y ≤ axα + b︸︷︷︸yα

] .

66

5 Důležitá rozdělení

Diskrétní rozdělení

Alternativní rozdělení A(p), 0 < p < 1.

0 11− p p

EX = p

varX = p(1− p) .

Binomické rozdělení Bi(n, p), n ∈ N, 0 < p < 1.

0 1 2 . . . np0 p1 p2 . . . pn

P [X = k] = pk =

(n

k

)pk (1− p)n−k k = 0, 1, . . . , n .

67

X = počet zdarů v sérii n pokusůBernoulliova schématu.

• počet líců v sérii n hodů

• počet osob volící daný politický subjekt z ndotázaných

• počet osob sledujících daný TV pořad z nsledovaných

• počet částic v náhodně zvolené příhrádce z npříhrádek

• počet vadných sučástek z n náhodně vybra-ných součástek

Xi =

1 nastal-li zdar v i− tém pokusu0 jinak

Xi má rozdělení A(p).

X = X1 +X2 + · · ·+Xn .

68

5.1. Příklad. S.Pepys (1693), náruživý hráč vkostky. Co je pravděodobnější, že šesti kostkamihodíme alespoň jednu šestku (jev A), nebo že dva-nácti kostkami hodíme alespoň dvě šestky (jev B)?Vyřešil Newton.

počet šestek při hodu šesti kostkami . . .Bi(6, 1/6).(p = 1

6)

P (A) =6∑

k=1

(6k

)pk(1− p)n−k =

1−(60

)p0(1− p)6 = 0, 6651 .

počet šestek při hodu dvanácti kostkami . . .Bi(12, 1/6).(p = 1

6)

P (B) =12∑

k=2

(126

)pk(1− p)n−k =

1−(120

)p0(1−p)12−

(121

)p(1−p)11 = 0, 6189 .

69

Domácí cvičení: Pravděpodovbnost, že 18 kost-kami hodíme alespoň 3 šestky je 0,5973.

5.2. Příklad. Náhodná procházkaČástice se pohybuje po ose x. Začíná v bodě 0.V daném stádiu se rozhodne s pravděpodobností1/2 jít doprava a s pravděpodobností 1/2 doleva.Sn je poloha částice v čase n. Jaké je rozdělení Sn?

Bernoulliovo schéma, n pokusů; p = 12 .

1. . jdeme doprava, -1. . . jdeme doleva.

Je-li k jedniček a n− k -jedniček, pak je poloha

k − (n− k) = 2k − n k = 0, . . . n .

P [Sn = 2k − n] =

(n

k

)2−n .

(Dá se ukázat, že částice s pravděpodobnosí jednanavštíví každý bod. Totéž pro dvě dimenze, nevšak pro tři.)

70

5.3. Příklad.Maxwellovo-Boltzmanovo schéma

Máme n částic a r příhrádek. Každá částice sivybírá nějakou příhrádku. Všechny možnosti majístejnou šanci. Jaké je rozložení počtu částic v pevnězvolené příhrádce?

Bernoulliovo schéma: vybraná částice si zvolí da-nou přihrádku, celkem n pokusů (máme n částic).Šance zdaru je 1

r.

Náhodná veličina má rozdělení Bi(n, 1r).

Konkrétní situace:

5.4. Příklad. Máme n = 500 osob a r = 365příhrádek (narozeniny). Počet osob mající naroze-niny dne 18.7. (jako přednášející) se řídíBi(500, 1365).

Tabulka numerických hodnot:

počet 0 1 2 3 4 5 6pravděpodobnost 0,2537 0,3484 0,2388 0,1089 0,0372 0,0101 0,0023

71

Pravděpodobnost, že tři osoby mají narozeniny 18.7.je 0,1089 .další modely: osoby obsazující vagóny, výsledkyhodu kostkou padající do 6 možností, . . .

72

Charakteristiky Bi(n, k).

X = X1 +X2 + · · ·+Xn

Xi . . . A(p), EXi = p.

EX = EX1 + EX2 + · · ·+ EXn = np .

E(X2) = E(X1+X2+· · ·+Xn)2 = EX21+EX22 · · ·+EX2n+

+ 2E(X1X2) + 2E(X1X3) + · · · .

Je-li i 6= j máme pro Xi Xj rozdělení

0 11− p2 p2

Tedy E(XiXj) = p2, což znamená, že

EX2 = np+ 2 ·(

n

2

)p2 .

Konečně,

var(X) = EX2−(EX)2 = np+2·(

n

2

)p2−n2p2 =

np+2n(n− 1)2

p2−n2p2 = np−np2 = np(1−p) .

73

Má-li X rozdělení Bi(n, p), pak

EX = np varX = np(1− p)

Průměrný počet šestek při sérii n hodů hrací kost-kou je n

6 .

Průměrný počet částic v jedné přihrádce u 500částic náhodně rozptýlených v 365 příhrádkách je500365 = 1, 369863014.

. . .

74

Co se děje s binomickým rozdělením, jestliže senemění střední hodnota, ale počet pokusů jde donekonečna?

5.5. Věta. Poissonova větaPředpokládejme, že (Xn)∞n=1 je posloupnost ná-hodných veličin majících rozdělení Bi(n, λ

n), kde

λ > 0. (Tj. EXn = λ pro všechna n.) Pak

limn→∞

P [Xn = k] =λk

k!e−λ .

Důkaz:

pn =λ

n.

P [Xn = k] =

(n

k

)pk

n(1− pn)n−k =

=1k!

npn · (n− 1)pn · · · (n− k + 1)pn

(1− pn)k

(1−λ

n

)n

.

limn→∞

npn

1− pn

= limn→∞

λ

1− λn

= λ .

limn→∞

(n− 1)pn

1− pn

= limn→∞

λ− λn

1− λn

= λ .

75

Tedy

limn→∞

P [Xn = k] =λk

k!lim

n→∞

(1− λ

n

)n

=λk

k!e−λ .

Aproximujeme pro n velké a pn malé

P [X = k] ∼ λk

k!e−λ .

5.6. Příklad. Stroj produkuje 1% zmetků. Jakáje pravděpodobnost, že z 200 náhodně vybranýchvýrobků neni žádný zmetek?

X ∼ Bi(200,1100)

P [X = 0] = 0, 99200 = 0, 1340 .

Aproximace pomocí Poissonovy věty:

λ = 200 · 1100= 2

P [X = 0].= e−2 = 0, 1353.

76

n částic se náhodně rozděluje do r příhrádek, při-čemž n, r → ∞ při konstantním poměru λ = n

r.

Počet částic v pevně zvolené příhrádce se asymto-ticky řídí Poissonovým zákonem s parametrem λ.

5.7. Příklad. X ∼ Bi(500, 365) . . . viz Příklad 5.4.

počet 0 1 2 3 4 5 6binomický zákon 0,2537 0,3484 0,2388 0,1089 0,0372 0,0101 0,0023Poissonův zákon 0,2541 0,3481 0,2385 0,1089 0,0372 0,0102 0,0023

77

Poissonovo rozdělení

Náhodná veličinaX, která nabývá hodnot 0, 1, . . .s pravděpodobnostmi

P [Xn = n] =λn

n!e−λ , n = 0, 1, . . .

Po(λ)

P [X = 0] = e−λ P [X > 0] = 1− e−λ .

5.8. Příklad. Lahve se vyrábějí ze skloviny obsa-hující kazy, keré jsou rozděly nepravidelně tak, žev každém metrickém centu skloviny je průměrněx kazů. Láhev váží 1 kg a je vadná obsahuje-li je-den či více kazů. Stanovte procento vadných lahví.

Řešení Z M metrických centů se vyrobí 100Mlahví, které budou obsahovat přibližně xM kazů.Pro počet kazů v jedné lahvi tedy máme rozdělení

Bi(xM,1

100M) .

EX = λ = xM1

100M=

x

100.

78

Pro M →∞ máme rozdělení

Po

(x

100

)Pravděpodobnost, že láhev bude bez kazu je

1− e−x100 .

Je-li například x = 30, pak procento vadných lahvíbude 1− e−0,3 = 0, 2592.

Při velkém počtu kazů je výhodnější vyrábět menšílahve. Je-li např. váha lahve 0, 25kg je procentozmetků 7, 22%.

79

Charakteristiky P (λ):

EX =∞∑

n=0

nλn

n!e−λ = λ

( ∞∑n=1

λn−1

(n− 1)!

)e−λ =

= λeλe−λ = λ .

EX2 =∞∑

n=0

n2λn

n!e−λ =

∞∑n=2

n(n−1)λn

n!e−λ+

=λ︷︸︸︷∞∑

n=0

nλn

n!e−λ =

= e−λ

∞∑n=2

λn

(n− 2)!+λ = e−λλ2

∞∑n=2

λn−2

(n− 2)!+λ =

= e−λλ2 eλ + λ = λ2 + λ .

Tedy

var(X) = EX2 − (EX)2 = λ2 + λ− λ2 = λ .

E(X) = λ

var(X) = λ

80

Příklady Poissonova rozdělení: (homogenní chaosv prostoru nebo čase)

• počet volání na telofonní ústřednu za jed-notku času

• počet atomů radioaktivní látky rozpadlých zajednotku času

• počet hvězd v daném objemu galaxie

• počet létavic meteorického roje za jednotkučasu

• počet střel zasahující danou oblast

• počet defektů kola (bad luck) za jednotkučasu

• počet zákazníků za jednotku času

81

Geometrické rozdělení Ge(p), 0 < p < 1.

X je počet zdarů v Bernoulliově schématu předprvním nezdarem.

P [X = 0] = 1− p .

P [X = 1] = (1− p)p .

P [X = 2] = (1− p)p2 .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

P [X = k] = (1− p)pk k = 0, 1, . . . .

82

5.9. Příklad. Dva hráči se střídají a házejí hracíkostkou. Vyhrává ten komu padne šestka. Jaká jepravděpodobnost výhry u jednotlivých hráčů?

X . . . geometrické rozdělení s p =56

.

A . . . vyhrává hráč, který začíná

P (A) = P [X = sudé] =∞∑

k=0

(1−p)p2k = (1−p)∞∑

k=0

p2k =

= (1− p)1

1− p2=11 + p

=

=11 + 5

6

=611= 0, 54545455 .

83

Střední hodnota geometrického rozdělení:

EX =∞∑

n=0

n (1− p) pn = (1− p)∞∑

n=0

n pn =

= (1−p) pd

dp

( ∞∑n=0

pn

)= (1−p)p

d

dp

(11− p

)=

= (1− p)p1

(1− p)2=

p

1− p.

5.10. Příklad. Žák umí 90% látky. Kolik přežijeprůměrně otázek?

Ge(p), p = 0, 9

EX =0, 91− 0, 9

= 9 .

84

Rozptyl

d2

dp2

∞∑n=0

pn =∞∑

n=0

n(n− 1)pn−2 .

E(X2)− EX =∞∑

n=0

n(n− 1)(1− p)pn =

= (1−p)p2d2

dp2

∞∑n=0

pn = (1−p)p2(11− p

)′′

=

= (1− p)p22

(1− p)3=

2p2

(1− p)2.

E(X2)−(EX)2 =2p2

(1− p)2+

p

1− p− p2

(1− p)2=

p2

(1− p)2+

p

1− p=

p2 + p(1− p)(1− p)2

=

=p

(1− p)2.

85

EX =p

1− p

varX =p

(1− p)2.

Rovnoměrné rozdělení na < a, b >R < a, b >.

Hustota:

f(x) =

1

b−ax ∈< a, b >

0 jinak

Distribuční funkce:

F (x) =

x−ab−a

x ∈< a, b >

0 x < a

1 x > b

86

EX =

b∫a

x1

b− adx =

1b− a

[x2

2

]b

a

=

=b2 − a2

2(b− a)=

a+ b

2.

EX2 =1

b− a

b∫a

x2 dx =1

b− a

b3 − a3

3=

=a2 + ab+ b2

3.

var(X) = E(X2)−(EX)2 =a2 + ab+ b2

3−a2 + 2ab+ b2

4=

=a2 − 2ab+ b2

12=112(b− a)2 .

EX =a+ b

2

varX =112(b− a)2 .

87

Normální rozdělení (Gaussovo rozdělení)

N(µ, σ2).µ ∈ R, σ2 > 0.

hustota:

f(x) =1√2πσ

e−(x−µ)2

2σ2

Vychází z Laplaceova integrálu:

∞∫−∞

e−x2 dx =√

π .

standardní, normované normální rozdělení:N(0, 1).

značení:

Φ(x) =1√2π

x∫−∞

e−t2

2 dt

počítá se numericky, tabelována.

88

Souvislost mezi normálními rozděleními různýchparametrů.

• Má-li Y rozdělení N(0, 1) =⇒ X = µ+σ Y mározdělení N(µ, σ2).

Odvození:

FX(x) = P [X ≤ x] = P [µ+ σ Y ≤ x] =

= P

[Y ≤ x− µ

σ

]= Φ

(x− µ

σ

)

d

dxFX(x) =

1√2π

e−(x−µ

σ )2

2 · 1σ=

=1√2πσ

e−(x−µ)2

2σ2 .

• Má-li X rozdělení N(µ, σ), pak Y = X−µσmá

rozdělení N(0, 1).

89

5.11. Příklad. S jakou pravěpodobností má ve-ličina X s rozdělením N(1, 4) hodnotu v intervalu< 3, 5 > ?

P [3 ≤ X ≤ 5] = Φ(5− 12

)− Φ

(3− 12

)=

= Φ(2)−Φ(1) = 0, 97250−0, 841345 = 0, 131155.

5.12. Tvrzení. Vzhledem k tomu, že hustota stan-dardního normálního rozdělení je sudá funkce, platí

Φ(x) = 1− Φ(−x) x ∈ R .

90

5.13. Příklad. Spočtěte pravděpodobnost, že ve-ličina X s rozdělením N(0, σ2) má hodnotu v in-tervalu < −a, a >, kde a > 0.

Řešení:

P [−a ≤ X ≤ a] = P [−a

σ≤ X

σ≤ a

σ] =

= Φ

(a

σ

)−Φ

(−a

σ

)= Φ

(a

σ

)−

(1−Φ

(a

σ

))=

2Φ

(a

σ

)− 1 .

Střední hodnota a rozptyl normálního rozdělení:

Pro Y s rozdělením N(0, 1) platí

EY =1√2π

∞∫−∞

xe−x2

2 dx = 0 .

91

1 =1√2π

∞∫−∞

e−x2

2 dx .

Použijeme metodu per partes pro

u′ = 1 v = e−x2

2

u = x v′ = −xe−x2

2

a dostaneme

1 =1√2π

[xe−

x2

2

]∞−∞︸︷︷︸

=0

+1√2π

∞∫−∞

x2e−x2

2 dx .

Odtud plyne, že

var(Y ) = E(Y 2) = 1 .

Obecně: X má rozdělení N(µ, σ2)

X = σY + µ ,

a proto

EX = σEY + µ = µ .

92

X2 = σ2Y 2 + 2µσY + µ2

EX2 = σ2 + 0 + µ2 .

varX = E(X2)− (EX)2 = σ2 + µ2 − µ2 = σ2 .

Závěr:

EX = µ

var(X) = σ2 .

93

kvantilová funkce a kvantily

uα . . . α-kvantil N(0, 1).

kvantilová funke je inverzní funkce Φ−1.

Některé numerické hodnoty:

u0,5 = 0,u0,95 = 1, 644,u0,975 = 1, 95996u0,999 = 3, 09023

Pro α → 1 jde uα →∞.

5.14. Tvrzení.

(i) u1−α = −uα pro všechna α ∈ (0, 1).

(ii) Pro α-kvantil xα rozdělení N(µ, σ2) platí

xα = µ+ σ uα .

94

5.15. Příklad. Určete interval < −a, a > tak,aby náhodná veličina Y s rozdělením N(0, 1) mělav tomto intervalu hodnotu s pravděpodobností 0,95.

a = u0,975.= 1, 96 .

Pravidlo 3σMáme rozdělení X typu N(µ, σ2). Určeme

P [|X − µ| ≤ 3σ] .

Řešení:

P

[|X − µ|

σ≤ 3

]= Φ(3)− Φ(−3) =

= 2Φ(3)−1 = 2·0, 99865−1 = 0, 99730 .

Po třech σ zbývají asi tři promile případů.

95

5.16. Příklad. Pro oděvní továrnu je neziskovévyrábět šaty pro velmi malé a velmi velké muže.Záměr je nevyrábět pro 7,5% největších a 7,5%nejmenších mužů. Ví se, že výška mužů (v pal-cích) má rozdělení N(69, 2, 82). Nalezněte největšía nejmenší výšku pro kterou vyrábět.

Řešení

u0,925 = 1, 43953 .

x0,925 = 69 + 2, 8 · 1, 43953 = 73, 03068x0,075 = 69− 2, 8 · 1, 43953 = 64, 96932

96

5.17. Příklad. Výsledky přijímacích zkoušek seřídí normálním rozdělením s rozptylem 100. Je při-jato 30% uchazečů. Hranice pro přijetí je 85 bodů.Jaký je průměrný výsledek u zkoušky?

Řešení:

N(µ, σ2)

x0,7 = µ+ 10 · u0.7µ = 85− 10 · u0,7 = 85− 10 · 0, 52440

.= 79, 8 .

5.18. Příklad. Máme rozdělení N(µ, 0, 5). Jakzvolit střední hodnotu, aby

P [X ≥ 2] = 0, 01 .

Řešení:

P

[X − µ√0, 5

≥ 2− µ√0, 5

]= 0, 01

2− µ√0, 5= u0,99

µ = 2−√0, 5 · u0,99

.= 0, 355023643

97

Exponenciální rozdělení

Exp(λ) λ > 0

hustota:

f(x) =

λ e−λx x ≥ 00 x < 0 .

distribuční funkce:x ≥ 0

F (x) =

x∫0

λ e−λx dx = 1− e−λ x .

funkce přežití:

P [X ≥ x] = e−λ x

Exponenciální rozdělení popisuje čas do první ”po-ruchy” u systému ”bez paměti”

98

Odvození:

Hledáme funkci přežití

R(t) = P [X ≥ t]

tak, aby byly splněny následující předpoklady:

(i) R(0) = 1

(ii) P [X ≥ t + h|X ≥ t] = P [X ≥ h] provšechna x, h ≥ 0.

(iii) R je diferencovatelná klesající funkce

Z toho plyne:

P [X ≥ t+ h] = P [X ≥ t] · P [X ≥ h] .

R(t+ h) = R(t)R(h)

R(t+ h)−R(t)h

=R(t)R(h)−R(t)

h=

= R(t)R(h)− 1

h

99

Limitním přechodem h → 0+ dostaneme

R′(t) = R(t) ·R′(0)

R(0) = 1

Diferenciální rovnice s počáteční podmínkou.

Označme

R′(0) = −λ (λ > 0).

Řešení (jediné):

R(t) = e−λt .

R(t) tedy vede na exponenciální rozdělení.

100

Střední hodnotu a rozptyl získáme integrací (perpartes)

E(X) =1λ

var(X) =1λ2

λ . . . ”intenzita poruch”

Příklady exponenciálního rozdělení:

• doba rozpadu atomu

• doba do registrace zákazníka

• doba do příletu létavice v meteorickém roji

101

5.19. Příklad. Na přílet meteoritu se průměrněčaká deset minut. Jaká je pravděpodobnost, že bu-deme na ”padající hvězdu” čekat dvě minuty?

Řešení:1λ= 10 λ = 0, 1

F (2) = 1− e−2·0,1 = 1− e−0,2.= 0, 18127 .

102

6 Transformace náhodnýchveličin

Nutnost přepočítat distrubuční funkci. Napříkladmáme měření rychlosti a chceme ho přepočítat naenergii.

Obecná úloha: X je náhodná veličina, h : R 7→ RY = h(X)

• Diskrétní náhodná veličina se vždy zobrazí nadiskrétní

6.1. Příklad. Diskrétní rozdělení X s pravděpo-

dobnostní funkcí -1 0 10,3 0,2 0,5

Y = X2 . . . 1 0 10,3 0,2 0,5

Y . . .

0 10,2 0,8

103

Obecně stanovíme transformaci pomocí distribučnífunkce:

Y = h(X)

FY (y) = P [h(X) ≤ y]

6.2. Příklad. Rychlost molekul plynu má rozdě-lení N(0, 1). Molekula má hmotnost m. Naleznětedistribuční funkci a hustotu energie částice.

X ∼ N(0, 1)

Y =12mX2

Nerovnice 12mX2 ≤ y má řešení pouze pro y ≥ 0.

y ≥ 0

FY (y) = P [12mX2 ≤ y] = P [X ∈< −

√2m

y,

√2m

y >] =

= Φ

(√2m

y

)−Φ

(−

√2m

y

)= 2Φ

(√2m

y

)−1 .

104

Hustota je pro y > 0 derivací distribuční funkce:

g(y) = 21√2π

e−2m y

2 ·√2m· 12√

y=

1√

mπye−

ym

Pro y ≤ 0 je g(y) = 0 .

Důležitý je případ lineární transformace.

Y = aX + b, a 6= 0

a > 0

FY (y) = P [aX + b ≤ y] = P

[X ≤ y − b

a

]= FX

(y − b

a

).

a < 0

FY (y) = P [aX + b ≤ y] = P

[X ≥ y − b

a

]= 1− FX

(y − b

a−

).

105

Užitečné je aplikovat toto pravidlo na spojité roz-dělení

6.3. Tvrzení. Je-li X spojitá náhodná veličina shustotou f(x), pak náhodná veličina

Y = aX + b , a 6= 0je spojitá a má hustotu

g(y) =1|a|

f

(y − b

a

).

Důkaz:

a > 0

FY (y) = F

(y − b

a

)Derivací podle y:

g(y) =1af

(y − b

a

).

a < 0

FY (y) = 1− F

(y − b

a

)106

Derivací podle y:

g(y) = −1af

(y − b

a

).

6.4. Příklad. X má rovnoměrné rozdělení na in-tervalu < 0, 3 >. Určete hustotu

Y = 2X + 1

g(y) =12f

(y − 12

).

y − 12

∈< 0, 3 > ⇐⇒ y ∈< 1, 7 > .

g(y) =

1/6 y ∈< 1, 7 >

0 jinak

Y má rovnoměrné rozdělení na intervalu < 1, 7 >.

107

6.5. Příklad. Y = −X, kde X má rozděleníN(0, 1).

g(y) =1√2π

e−(−y)2

2 =1√2π

e−y2

2

Y má také rozdělení N(0, 1).

6.6. Příklad. X má rozdělení Exp(1). Určeterozdělení −X.

g(y) = f(−y)

g(y) =

ey y ≤ 00 y > 0 .

108

Nelineární transformace náhodné veličiny

Předpoklady:X má hustotu f(x) soustředěnou naintervalu I a h je rostoucí diferencovatelná funkcedefinovaná na I, jejíž obor hodnot je interval J .

Y = h(X)

Pro y /∈ J bude hustota nulová.

Pro y ∈ J

FY (y) =

h−1(y)∫−∞

f(x) dx

Substituce: t = h(x), x = h−1(t), dt = h′(x) dx.

FY (y) =

y∫−∞

f(h−1(t))dt

h′(h−1(t))

Podobně lze postupovat v případě, kdy h je klesa-jící, nebo je možno použít −(−h).

109

Závěr:

g(y) =f(h−1(y))|h′(h−1(y))|

.

pro y ∈ J a nula jinak.

6.7. Příklad. Logaritmicko-normální rozdě-lení

Y = eX ,

kde X má rozdělení N(µ, σ2).

h(x) = ex , h−1(x) = lnx , J = h(R) = (0,∞) .

g(y) =f(ln y)eln y

=1√2πσ

e−(ln y−µ)2

2σ21y

,

pro y > 0; a nula jinak.

110

K výpočtu střední hodnoty transformované veli-činy nepotřebujeme znát rozdělení transformace:

6.8. Věta. Předpokládejme, žeX je náhodná ve-ličina a Y = h(X). Pak

(i) E(Y ) =∑i∈I

h(xi)pi ,

je-li X diskrétní náhodná veličina s pravdě-podobnostní funkcí (xi, pi)i∈I .

(ii) E(Y ) =

∞∫−∞

f(x)h(x) dx

je-li X spojitá náhodná veličina s hustotouf(x).

Důkaz:

(i) h(Y ) má (včetně násobnosti) pravděpodob-nostní funkci (h(xi), pi)i∈I , a proto

E(Y ) =∑i∈I

h(xi)pi .

(ii) je spojitou verzí.

111

6.9. Příklad. Určete střední hodnotu třetí moc-niny rozdělení Exp(1).

E(Y ) =

∞∫0

x3e−x dx = 6 .

112

7 Náhodné vektory

Značení: x = (x1, x2, . . . xn) ∈ Cn

7.1. Definice. Nechť (Ω,A, P ) je pravděpodob-nostní prostor. Zobrazení X : Ω→ Rn

X(ω) = (X1(ω), X2(ω), . . . , Xn(ω)) ,

kde X1, . . . , Xn jsou náhodné veličiny na Ω, senazývá náhodný vektor. Veličiny X1, . . . , Xn senazývají marginální rozdělení vektoru X.

Nestačí znát marginální distribuční funkce, ale dis-tribuční funkci sdruženou.

Značení:[X ≤ x] = [X1 ≤ x1∧X2 ≤ x2∧ · · ·∧Xn ≤ xn].

7.2. Definice. Je-li X : Ω → Rn náhodný vek-tor, pak distribuční funkci FX : Rn → R definu-jeme jako

FX(x) = P [X ≤ x] .

113

7.3. Příklad. X má distribuční funkci F . Určetedistribuční funkci náhodného vektoru

X = (X, X)

FX(x, y) = P [X ≤ x ∧X ≤ y] =

= P [X ≤ min(x, y)] = F (min(x, y))

Pomocí distribuční funkce spočítáme všechny re-levantní pravděpodobnosti:

např.

X = (X, Y )

P [(a < X ≤ b) ∧ (c < Y ≤ d)] =

= FX(b, d)−FX(a, d)−FX(b, c)+FX(a, c) .

114

Základní vlastnosti vícerozměrné distribuční funkce:

7.4. Věta. Je-li F (x1, . . . , xn) sdružená distri-buční funkce náhodných veličin X1, . . . , Xn, pak

(i) limx1→∞,x2→∞,... ,xn→∞ F (x1, . . . , xn) = 1

(ii) limx1→−∞,x2→−∞,... ,xn→−∞

F (x1, . . . , xn) = 0

(iii) F je zprava spojitá a neklesající v každé pro-měnné.

Tyto vlastnosti nestačí k tomu, aby F byla dis-tribuční funkcí. Musí splňovat složitejší podmínkupro hodnoty ve vrcholech vícerozměrných inter-valů.

Jak spočítat marginální rozdělení vektoru

X = (X1, . . . , Xn)?

FX1(x) = limx2→∞,x3→∞,... ,xn→∞

FX(x, x2, x3, . . . , xn) .

115

7.5. Příklad. Xmá rovnoměrné rozdělení na jed-notkovém kruhu se středem v počátku. Naleznětemarginální rozdělení.

X = (X, Y )

Pro −1 < x < 1.

FX(x) =2π

x∫−1

√1− t2 dt =

2π

[12t√1− t2+

12arcsin t

]x

−1=

=x√1− x2

π+

arcsin x

π+12

.

7.6. Definice. Náhodný vektor se nazývá diskrétní,jestliže všechny jeho složky mají diskrétní rozdě-lení.

Diskrétní vektor je dán pravděpodobnostní funkcí:

(x1, p1); (x2, p2); (x3, p3), . . .

pi > 0 ,n∑

i=1

pi = 1 .

116

7.7. Příklad. Pravděpodobnost soustředěná vevrcholech čtverce:

P [X = (0, 0)] = 1/8, P [X = (0, 1)] = 1/4,P [X = (1, 0)] = 1/8, P [X = (1, 1)] = 1/2

tabulka:

Y/X 0 10 1/8 1/41 1/8 1/2

Diskrétní rozdělení pro X

P [X = 0] = 1/8 + 1/4 = 3/8

P [X = 1] = 1/8 + 1/2 = 5/8

X ∼ A(5/8).Podobně Y ∼ A(3/4).

117

• Distribuční funkce diskrétního vektoru je po čás-tech konstantní.

• Má-li X diskrétní rozdělení je

P [X ∈ A] =∑

i | xi∈A

pi .

• Marginální rozdělení diskrétního rozdělení mápravděpodobnostní funkci

P [X1 = a] =∑

i | xi∈A

pi ,

kde A = xi | (xi)1 = a.

118

7.8. Definice. Nechť f(x1, . . . , xn) ≥ 0 je funkcedefinovaná na Rn s∫

Rn

f(x) dx = 1 .

Náhodný vektor X = (X1, . . . , Xn) má spojitérozdělení s hustotou f , jestliže

FX(x1, . . . , xn) =

x1∫−∞

x2∫−∞

· · ·xn∫

−∞

f(t1, . . . , tn)dt1 · · · dtn .

•

f(x1, . . . , xn) =∂nFX(x1, . . . , xn)∂x1∂x2 · · · ∂xn

v bodech spojitosti funkce f

•

P [X ∈ A] =∫A

f(x) dx .

Například: X = (X,Y )

P [X ∈ (a, b > ∧Y ∈ (c, d >] =

b∫a

d∫c

f(x, y) dxdy .

119

7.9. Příklad. Rovnoměrné rozdělení na jednot-kové kouli se středem v počátku má hustotu

f(x, y, z) =

14/3π pro x2 + y2 + z2 ≤ 10 jinak

7.10. Příklad. Dvourozměrná distribuční funkce

F (x, y) =

(1− e−x)(1− e−y) je-li x, y > 0

0 jinak

Pro x, y > 0

f(x, y) =∂2

∂x∂y(1− e−x)(1− e−y) =

= e−xe−y .

(Jinak je f(x, y) nulová.) Je správně neboť

f(x, y) =

∞∫0

∞∫0

e−x e−y = 1 .

120

Marginální rozdělení:

X = (X1, . . . , Xn) má hustotu f(x1, . . . , xn).Pak X1 má distribuční funkci:

FX1(x) =

x∫−∞

∞∫−∞

· · ·∞∫

−∞︸︷︷︸(n−1)×

f(t1, . . . , tn) dt1 · · · dtn =

=

x∫−∞

( ∞∫−∞

· · ·∞∫

−∞︸︷︷︸(n−1)×

f(t1, . . . , tn) dt2 · · · dtn

)dt1

Hustota tedy bude

fX1(x) =

∞∫−∞

· · ·∞∫

−∞︸︷︷︸(n−1)×

f(x, t2, · · · tn) dt2 · · · dtn .

121

7.11. Příklad. Dvourozměrné Gaussovo roz-děleníhustota:

f(x, y) =12π

e−x2+y2

2 .

X, Y ∼ N(0, 1)

FX(x, y) = Φ(x)Φ(y) .

Např.P [X ≤ 3∧Y ≤ 5] = Φ(3)Φ(5) = 0, 9986498158.

Jaká je pravděpodobnost, že (X, Y ) ∈ A, kde Aje mezikruží

A = (x, y) | 4 ≤ x2 + y2 ≤ 9?

P =12π

∫ ∫A

e−x2+y2

2 dxdy

Substituce:x = % sinϕ, y = % cosϕ,Jakobián: dxdy = % d% dϕ.

122

P =12π

2π∫0

3∫2

e−%2/2% d% dϕ =

=12π2π[−e−%2/2]32 = e−2−e−9/2 = 0, 12422 .

Nezávislost náhodných veličin

7.12. Definice. Náhodné veličinyX1, . . . , Xn napravděpodobnostním prostoru (Ω,A, P ) jsou ne-závislé, jestliže sdružená distribuční funkce vektoru

X = (X1, . . . , Xn)

je součinem marginálních distribučních funkcí.

123

7.13. Tvrzení. Náhodné veličinyX1, . . . , Xn jsounezávislé právě tehdy když

P [(X1 ∈ I1) ∧ (X2 ∈ I2) ∧ · · · ∧ (Xn ∈ In)] =

= P [X1 ∈ I1] ·P [X2 ∈ I2] · · ·P [Xn ∈ In]

pro všechny možné výběry intervalů I1, . . . , In ⊂R.

Zdůvodnění pro X = (X, Y ), kde X, Y jsou ne-závislé :

P [X ∈ (a, b > ∧Y ∈ (c, d >] =

= FX(b, d)−FX(a, d)−FX(b, c)+FX(a, c) =

= FX(b)Fy(d)−FX(a)FY (d)−FX(b)FY (c)+FX(a)FY (c) =

= (FX(b)− FX(a))(FY (d)− FY (c)) .

7.14. Příklad. X = (X, Y ) je rovnoměrné roz-dělení na čtverci < 0, 1 > × < 0, 1 >. Pak X aY jsou nezávislé:0 ≤ x, y ≤ 1

FX(x, y) = xy = FX(x) · FY (y)

124

7.15. Tvrzení. Diskrétní náhodné veličinyX1, . . . , Xn jsou nezávislé právě tehdy když všechnyjevy[X1 = x1], [X2 = x2], . . . , [Xn = xn] ,kde x1, . . . , xn ∈ R, jsou nezávislé.

7.16. Příklad. Pravděpodobnost soustředěná vevrcholech čtverce:

P [X = (0, 0)] = 1/8, P [X = (0, 1)] = 1/4,P [X = (1, 0)] = 1/8, P [X = (1, 1)] = 1/2

tabulka:

Y/X 0 10 1/8 1/41 1/8 1/2

X a Y nejsou nezávislé, protože

P [X = 0 ∧ Y = 0] = 1/8 6= P [X = 0]P [Y = 0] = 3/8 · 1/4 .

125

X = (X1, . . . , Xn)

náhodné veličiny v Bernoulliově schématu. Tytoveličiny jsou nezávislé.

Binomické rozdělení Bi(n, p) je součtem n nezá-vislých alternativních rozdělení A(p).

126

7.17. Tvrzení. Spojité vícerozměrné rozdělení jerozdělení nezávislých veličin právě tehdy když sdru-žená hustota je součinem hustot marginálních.

Důvod: hustota je derivací distribuční funkce.

7.18. Příklad. Je-li (X, Y ) rovnoměrné rozdě-lení na jednotkovém kruhu, pak X a Y nejsounezávislé, protože součin marginálních hustot jenenulový v každém bodě čtverce< 0, 1 > × < 0, 1 >.

7.19. Příklad. X a Y jsou nezávislé náhodnéveličiny s rozděleními N(0, σ21), N(0, σ

22). Jaká je

hustota součinu?

f(x, y) =1

2πσ1σ2e− x2

2σ21− y2

2σ22

Gaussovská plocha.

127

charakteristiky nezávislých veličin:

7.20. Věta. Jsou-liX1, . . . , Xn nezávislé náhodnéveličiny na pravděpodobnostním prostoru (Ω,A, P ),pak

E(X1X2 · · ·Xn) = E(X1)E(X2) · · ·E(Xn) .

Důkaz: pro diskrétní rozdělení

X má pravděpodobnostní funkci (xi, pi)i∈I

Y má pravděpodobnostní funkci (yj, pj)j∈J

E(XY ) =∑

i∈I,j∈J

xi yjP [X = xi ∧ Y = yj] =

=∑

i∈I,j∈J

xi yjP [X = xi]P [Y = yj] =

=

(∑i∈I

xiP [Y = xi]

)·(∑

j∈J

yjP [Y = yj]

)=

= E(X)E(Y )

128

7.21. Věta. Jsou-liX1, . . . , Xn nezávislé náhodnéveličiny na pravděpodobnostním prostoru (Ω,A, P ),pak

var(X1 +X2 + · · ·+Xn) = var(X1) + var(X2) + · · ·+ var(Xn) .

Důkaz pro n = 2Víme, že E(X1X2) = E(X1)E(X2).

var(X1+X2) = E[(X1+X2)2]−(E(X1)+E(X2))

2 =

= E(X21 ) + E(X22 ) + 2E(X1X2)−−(E(X1))2−(E(X2))2−2E(X1)E(X2) =E(X1)

2−(E(X1))2+E(X2)2−(E(X2))2 =

= var(X1) + var(X2) .

129

7.22. Příklad. Pro X s rozdělením Bi(n, p) aY s rozdělením A(p) platí

var(X) = n var(Y ) = np(1− p) .

Funkce nezávislých náhodných veličin

7.23. Příklad. Doba kdy lano vydrží zátěž seřídí exponeniálním rozdělením Exp(1). Dvě lanazapojíme a) paralelně b) sériově. Určete rozdělenídoby po kterou systém lan vydrží v obou případecha stanovte střední hodnotu těchto náhodných ve-ličin.

X a Y jsou nezávislé náhodné veličiny s rozděle-ním Exp(1).

a) Zpar = max(X, Y )

b) Zserie = min(X, Y ) .

130

a) paralelně

Distribuční funkce je nulová pro t < 0. Pro t > 0 je

FZpar = (1− e−t)(1− e−t) = (1− e−t)2

Hustota pro t > 0:

f(t) = 2(1− e−t)e−t

Střední hodnota

EZpar = 2

∞∫0

te−t dt− 2∞∫0

te−2t dt = 1, 5 .

131

a) sériově

Distribuční funkce je nulová pro t < 0. Pro t > 0 je

FZpar = 1− e−te−t = 1− e−2t

Hustota pro t < 0:

g(t) = 2e−2t

Střední hodnota

EZserie = 2

∞∫0

e−2t dt = 0, 5 .

132

Rozdělení součtu spojitých nezávislýchnáhodných veličin

Z = X + Y ,

kde X a Y jsou nezávislé, X má hustotu f(x) aY má hustotu g(x).Úlohou je stanovit hustotu náhodné veličiny Z.

Sdružená hustota vektoru (X, Y ) je funkceh(x, y) = f(x)g(y).

P [Z ≤ z] = P [X+Y ≤ z] =∫∫

(x,y) | x+y≤z

f(x)g(y) dxdy =

∞∫−∞

( z−x∫−∞

f(x)g(y) dy

)dx .

Substituce ve vnitřním integráluy = v − x, dv = dy

133

=

∞∫−∞

( z∫−∞

f(x) g(v − x) dv

)dx =

=

z∫−∞

( ∞∫−∞

f(x)g(v − x) dx

)︸︷︷︸

hustota h(v)

dv

Závěr: Hustota součtu X + Y je funkce

h(y) =

∞∫−∞

f(x)g(y − x) dx .

Terminologie : funkce h je konvolutivní součin funkcíf a g.

134

7.24. Příklad. Čas do první poruchy daného za-řízení se řídí exponenciálním zákonem Exp(λ). Ná-hodná veličina Z je čas do druhé poruchy. Určetejejí hustotu.

Z = X + Y ,

kde X a Y jsou nezávislé s rozdělením Exp(λ).Hustota h(y) je

h(y) =

∞∫−∞

f(x)g(y−x) dx =

y∫0

λe−λxλe−λ(y−x) dx =

= λ2e−λy

y∫0

dx = λ2ye−λy

pro y ≥ 0 a nula jinak.

135

7.25. Příklad. Souprava metra přijíždí kdykolivběhem jedné minuty. Dvakrát přestupujeme. Jakáje hustota čekací doby? Která hodnota je nejvícpreferována?

Z = X + Y ,

kde X a Y jsou nezávislé náhodné veličiny s roz-dělením R < 0, 1 >.

h(y) =

∞∫−∞

f(x)g(y − x) dx ,

kde f a g jsou chrakteristické funkce intervalu< 0, 1 >.Tento integrál je délkou průniku intervalu < 0, 1 >s intervalem < y − 1, y >. Tedy

h(y) =

0 y ≤ 0y 0 ≤ y ≤ 12− y 1 ≤ y ≤ 20 y ≥ 2

Trojúhelníkové rozdělení, preferována je čekací doba1.

136

8 Kovariance a korelace náhod-ných vektorů

Je-liX náhodný vektor, je vektor středních hodnotvektor

EX = (EX1, EX2, . . . EXn) .

Nepopisuje interakci mezi náhodnými veličinami.

8.1. Definice. Nechť X a Y jsou náhodné veli-činy na pravděpodobnostním prostoru (Ω,A, P ),které mají rozptyl. Kovariance náhodných veličinX a Y je definována

cov(X, Y ) = E[(X − EX)(Y − EY )] .

137

• cov(X, X) = var(X)

• cov(X, Y ) = cov(Y, X)

• cov(X, Y ) = E(XY )− E(X)E(Y ) :

E[(X−EX)(Y−EY )] = E(XY )−2EX·EY+EX·EY =

= E(XY )− E(X)E(Y )

Pro výpočet potřebujeme:

1. Diskrétní vektor (X, Y ) s pravděpodobnostnífunkcí ((xi, yi); pi)i∈I .

EX =∑i∈I

xi pi

EY =∑i∈I

yi pi

E(XY ) =∑i∈I

xiyi pi

138

1. Spojitý vektor (X, Y ) se sdruženou hustotouf(x, y).

EX =∫R2

xf(x, y) dxdy

EY =∫R2

yf(x, y) dxdy

E(XY ) =∫R2

xyf(x, y) dxdy

8.2. Příklad. X má rovnoměrné rozdělení na in-tervalu < 0, 1 >. Určete cov(X, X2) .

cov(X, X2) = EX3 − EX · EX2

EX3 =

1∫0

x3 dx =14

EX2 =

1∫0

x2 dx =13

EX =12

.

cov(X, X2) =14− 12· 13=112

.

139

8.3. Příklad. X = (X, Y ) má rovnoměrné roz-dělení na jednotkovém kruhu. Stanovte cov(X, Y ).

EX =∫∫K

x dxdy = 0

E(XY ) =∫∫K

xy dxdy = 0 .

cov(X, Y ) = 0 .

140

8.4. Věta. Jsou-li X a Y nezávislé náhodné ve-ličiny je cov(X, Y ) = 0.

Důkaz:

Jsou-li X a Y nezávislé, pak E(XY ) = EX ·EY .

Veličiny X, Y souřadnice rovnoměrného rozdělenína jednotkovém kruhu mají nulovou kovarianci, apřesto nejsou nezávislé.

Normování náhodné veličiny X : X−EX√varX

má nulo-vou střední hodnotu a jednotkový rozptyl.

cov

(X − EX√

varX,Y − EY√

varY

)=

cov(X, Y )√varX

√varY

.

8.5. Definice. Předpokládejme, že X a Y jsounáhodné veličiny s nenulovým rozptylem. Korelace%(X, Y ) je definována vztahem

%(X, Y ) =cov(X,Y )√varX

√varY

.

141

8.6. Příklad. (X, Y )má diskrétní rozdělení s prav-děpodobnostní funkcí

((x1, y1), 1/3); ((x2, y2), 1/3); ((x3, y3), 1/3);

Předpokládejme dále, že

x1 + x2 + x3 = 0 y1 + y2 + y3 = 0 .

cov(X, Y ) =13x1y1 +

13x2y2 +

13x3y3√

13(x

21 + x22 + x23)

√13(y

21 + y22 + y23)

=

=x1y1 + x2y2 + x3y3√

x21 + x22 + x23√

y21 + y22 + y23= cosϕ ,

kde ϕ je úhel mezi vektoryx = (x1, x2, x3) a y = (y1, y2, y3).Pokud je tedy cov(X, Y ) = 1 je y kladným násob-kem x, pokud je cov(X,Y ) = −1 je y zápornýmnásobkem x

142

8.7. Věta. Pro korelaci %(X, Y ) náhodných ve-ličin X a Y platí

|%(X, Y )| ≤ 1 .Přitom %(X, Y ) = 1 právě tehdy když hodnoty Xa Y leží s pravděpodobností 1 na jedné přímce skladnou směrnicí.%(X, Y ) = −1 právě tehdy když hodnoty X a Yleží s pravděpodobností 1 na jedné přímce se zá-pornou směrnicí.

Důkaz:

Pro všechna t ∈ R máme

0 ≤ var

(X − EX√

varX+ t

Y − EY√varY

)=

= 1 + 2t%(X, Y ) + t2 . (2)

Diskuse kvadratického výrazu:

4%2(X, Y )− 4 ≤ 0

a tedy

|%(X, Y )| ≤ 1 .

143

Předpokládejme, že cov(X, Y ) = 1. Pak v nerov-nosti (2) nastane rovnost a to může nastat právěkdyž t = −1. Dosazením t = −1 pak vede k

X − EX√varX

− Y − EY√varY

= konst .

Tedy

Y =

√varY√varX

·X + konstanta .

%(X, Y ) je míra lineární závislosti X a Y .

144

9 Asymptotické vlastnostináhodných veličin

Větou asymptotického typu byla již věta Poisso-nova: binomické rozdělení s počtem pokusů jdou-cím k nekonečnu a střední hodnotou jdoucí k λ seblíží Poissonově rozdělení Po(λ).

Základní otázka: Co se děje s Bi(n, p), jestližen →∞ a p se nemění?

Orientační odhady poskytuje Čebyševova nerov-nost.

9.1. Věta. Čebyševova nerovnostNehťX je náhodná veličina s E(X2) < ∞. Potomplatí

P [|X| ≥ ε] ≤ E(X2)ε2

.

Speciálně, má-li X rozptyl, pak

P [ |X − EX| ≥ ε] ≤ var(X)ε2

.

145

Důkaz pro spojité rozdělení s hustotou f(x).

P [ |X| ≥ ε] =∫

x | |x|≥ε

f(x) dx

E(X2) =

∞∫−∞

x2 f(x) dx =∫

x | |x|≥ε

x2 f(x) dx+

ε∫−ε

x2 f(x) dx ≥

≥∫

x | |x|≥ε

ε2f(x) dx = ε2P [ |X| ≥ ε] .

9.2. Důsledek. Je-li Xn náhodná veličina s roz-dělením Bi(n, p), pak pro každé ε > 0 platí

P

[ ∣∣∣∣Xn

n− p

∣∣∣∣ ≥ ε

]→ 0 pro n →∞ .

Důkaz:

E

(Xn

n

)=

np

n= p

146

var

(Xn

n

)=1n2

np(1− p) ≤ 14n

Dle Čebyševovy nerovnosti

P

[ ∣∣∣∣Xn

n− p

∣∣∣∣ ≥ ε

]≤

var(Xn

n)

ε2≤ 14nε2

.

9.3. Příklad. Kolika respondentů je třeba se ze-ptat, abychom odhadli volební preference p s to-lerancí 1% s pravděpodobností alespoň 90% ?

n . . . počet osobXn . . .Bi(n, p) (počet osob volících danou stranu)p ≈ Xn

n(aproximace)

Chceme:

P

[ ∣∣∣∣Xn

n− p

∣∣∣∣ < 0, 01

]≥ 0, 9 .

Nebo-li

P

[ ∣∣∣∣Xn

n− p

∣∣∣∣ ≥ 0, 01]︸︷︷︸≤ 14n(0,01)2

≤ 0, 1

147

14n(0, 01)2

≤ 0, 1

n ≥ 105

4= 25000.

Je pesimistický, nicméně jistý horní odhad.

9.4. Věta. Centrální limitní větaNehť X1, X2, X3, . . . je posloupnost nezávislýchnáhodných veličin, pro které platí

EXi = µ , varXi = σ2 , E|Xi|3 < ∞ .

pro všechna i ∈ N. Pro veličinu Sn (normovanýsoučet),

Sn =X1 +X2 + · · ·+Xn − nµ√

nσ,

platí

limn→∞

P [Sn ≤ x] = Φ(x) ,

pro všechna x ∈ R.

148

Tedy X1 +X2 + · · · +Xn má přibližně rozděleníN(nµ, nσ2).

9.5. Věta. Moaivrova-Laplaceova větaPro náhodnou veličinu Xn s rozdělením Bi(n, p)platí

limn→∞

P

[Xn − np√np(1− p)

≤ x

]= Φ(x)

pro každé x ∈ R.

Důkaz:

Binomické rozdělení je součtem nezávislých alter-nativních rozdělení.

Bi(n, p) ≈ N(np, np(1− p))Empiriké pravidlo pro velikost n :np ≥ 5, n(1− p) ≥ 5.

149

9.6. Příklad. 250 krát hodíme symetrickou mincí.Určete pravděpodobnost, že rub padne 100 až 150krát.

X250 − 125√250 · 0, 25

≈ N(0, 1)

P [100 ≤ X250 ≤ 150] =

= P

[−25√250 · 0, 25

≤ X250 − 125√250 · 0, 25

≤ 25√250 · 0, 25

]=

= 2Φ

(25 · 2√250

)−1 = 2Φ(

√10)−1 .

= 2Φ(3, 16)−1 .=

= 0, 99842 .

Přesně:∑150

k=125

(250k

)12250

9.7. Příklad. Kolika respondentů je třeba se ze-ptat, abychom odhadli volební preference p s to-lerancí 1% a to s pravděpodobností alespoň 90%.

P

[ ∣∣∣∣Xn

n− p

∣∣∣∣ ≤ 0, 01] ≥ 0, 9150

P [ |Xn−np| ≤ 0, 01n] = P

[|Xn − np|√np(1− p)

≤ 0, 01n√np(1− p)

].=

.= 2Φ

(0, 01 ·

√n√

p(1− p)

)−1 ≥ 2Φ

(0, 01 ·

√n

1/2

)−1 =

= 2Φ(0, 02√

n)− 1 .

Volíme n tak aby

2Φ(0, 02√

n)− 1 ≥ 0, 9

Φ(0, 02√

n) ≥ 0, 95

0, 02√

n ≥ u0,95

√n ≥ u0,95

0, 02

n ≥(

u0,950, 02

)2=

(1, 6440, 02

)2.= 6763, 8586

Pro srovnání při 5% toleranci potřebujeme 270 re-spondentů.

151

10 Statistika

Základní výběrové statistiky

10.1. Definice. Náhodný výběr z rozdělení s dis-tribuční funkcí F (x) je vektor

X = (X1, . . . , Xn) ,

kde X1, . . . , Xn jsou nezávislé náhodné veličinymající stejnou distribuční funkci F (x).

Základní výběrové statistiky:

Výběrový průměr

Xn =1n(X1 +X2 + · · ·Xn)

Výběrový rozptyl

S2n =1

n− 1

n∑i=1

(Xi −Xn)2

Výběrová směrodatná odchylka

Sn

152

Výběrové maximum

max(X1, . . . , Xn)

Výběrové minimum

min(X1, . . . , Xn)

Výběrové rozpětí

max(X1, . . . , Xn)−min(X1, . . . , Xn)

Výběrový průměr

EX = µ, var(X) = σ2

E = E(1n(X1 + · · ·+Xn)) =

nµ

n= µ .

var(Xn) = var

(X1 + · · ·+Xn

n

)=1n2

nσ2 =σ2

n.

E(Xn) = µ

var(Xn) =σ2

n

153

Důležité je, že var(Xn)→ 0 pro n →∞.

Čebyševova nerovnost:

P [ |Xn − µ| ≥ ε] ≤ σ2

nε2.

Výběrový rozptyl

S2n =1

n− 1

n∑i=1

(Xi −Xn)2 .

pomocný výpočet:

n∑i=1

(Xi −Xn)2 =

n∑i=1

(X2i − 2XiXn +Xn2) =

=n∑

i=1

X2i − 2Xn

n∑i=1

Xi +n∑

i=1

Xn2=

=n∑

i=1

X2i −2nXn2+nXn

2=

n∑i=1

X2i −nXn2.

154

Výpočet střední hodnoty:

(n−1)E(S2n) = E

[ n∑i=1

X2i −nXn2]=

n∑i=1

E(X2i )−nE(Xn2) =

=n∑

i=1

(var(Xi)+E2(Xi))−n(var(Xn)+E2(Xn)) =

= nσ2 + nµ2 − nσ2

n− nµ2 = (n− 1)σ2

E(S2n) = σ2 .

Výběrové statistiky odvozené od nor-málního rozdělení.

10.2. Tvrzení. Výběrový průměr z rozděleníN(µ, σ2)má rozdělení N(µ, σ2

n).

Důkaz je založen na tom, že součet nezávislýchnormálních rozdělení je normální rozdělení, což sedá dokázt pomocí konvoluce gaussovských funkcí.

Pro popis S2n potřebujeme zavést nové rozdělení

155

10.3. Definice. NechťX1, . . . , Xn jsou nezávisléveličiny s normovaným normálním rozdělením. Roz-dělení χ2 o n stupních volnosti je rozdělení ná-hodné veličiny

Y = X21 +X22 + · · ·+X2n

Značení : χ2nkvantily: χ2n,α χ2n(α)

Má-li X rozdělení χ2n, pak

EX = n var(X) = 2n .

10.4. Příklad. X,Y, Z jsou nezávislé náhodnéveličiny s rozdělením N(0, 1). Stanovte r tak, aby

P [√

X2 + Y 2 + Z2 ≤ r] = 0, 995

(Legenda: složky rychlosti molekul plynu)

r =√

χ23(0, 995) =√12, 838 = 3, 58

156

Základní věta klasické statistiky

10.5. Věta. Nechť X = (X1, . . . , Xn) je ná-hodný výběr z rozdělení N(µ, σ2). Pak

(i) Xn a S2n jsou nezávislé náhodné veličiny

(ii) (n−1)S2n

σ2má rozdělení χ2n−1.

Statistická varianta normování veličiny:

Xn − µ

Sn/√

n

10.6. Definice. NechťX = (X1, . . . , Xn) je ná-hodný výběr z rozděleníN(µ, σ2). Studentovo roz-děleni s n−1 stupni volnosti je rozdělení náhodnéveličiny

Xn − µ

Sn/√

n

Značení: tn−1, kvantily tn−1, α; tn−1(α).

157

W. Gosset – pseudonym Student, Studentovo roz-dělení tn má sudou hustotu, fn(x), která pro n →∞ konverguje bodově k Φ(x). (Aproximuje se ob-vykle pro n ≥ 31)

158

Intervalové odhady

Lokalizace neznámého parametru pomocí dat

10.7. Definice. NechťX = (X1, . . . , Xn) je ná-hodný výběr z rozdělení s neznámým parametremθ a α ∈ (0, 1).

(i) Interval < TD(X), TH(X) > se nazývá100(1− α)% oboustranným intervalem spo-lehlivosti parametru θ jestliže

P [TD(X) ≤ θ ≤ TH(X) ] = 1− α

(ii) Interval < TD(X),∞) se nazývádolním 100(1−α)% intervalem spolehlivostiparametru θ, jestliže

P [θ ≥ TD(X)] = 1− α

(iii) Interval (−∞, TH(X) > se nazýváhorním 100(1−α)% intervalem spolehlivostiparametru θ, jestliže

P [θ ≤ TH(X)] = 1− α

159

Pro odvození intervalových odhadů pro parametryµ a σ2 používáme statistiky

Z =Xn − µ

σ/√

n∼ N(0, 1)

T =Xn − µ

Sn/√

n∼ tn−1

(n− 1)S2nσ2

∼ χ2n−1

10.8. Věta. Nechť X = (X1, . . . , Xn) je ná-hodný výběr z rozdělení N(µ, σ2). Pak

(i) P [Xn − u1−α/2σ√n≤ µ ≤ Xn + u1−α/2

σ√n] = 1− α

(ii) P [Xn − tn−1,1−α/2Sn√n≤ µ ≤ Xn + tn−1,1−α/2

Sn√n] = 1− α

Důkaz: (i) Z = Xn−µσ/√

n∼ N(0, 1)

P [uα/2 ≤ Z ≤ u1−α/2] = 1− α .

σ√n

uα/2 ≤ Xn − µ ≤ σ√n

u1−α/2

160

(ii) Totéž s využitím statistiky T = Xn−µSn/

√n∼ tn−1.

10.9. Příklad. Je měřena výška 16 rostlin. Prů-měr naměřených hodnot je 72,5 cm, výběrová smě-rodatná odchylka je 4,5 cm. Nalezněte 90% inter-val spolehlivosti pro střední výšku.

1− α = 0, 9;α = 0, 1; 1− α/2 = 0, 95

t15(0, 95) = 1, 75

r = 1, 75 4,5√16= 1, 97

(70, 53; 74, 47)

10.10. Příklad. X ∼ N(µ, σ2). Při padesáti mě-ření byla získána směrodatná odchylka

S50 =√2, 192

Určete horní 95% interval spolehlivosti pro σ2.

(n− 1)σ2

σ2∼ χ2n−1

161

P

[(n− 1)S2n

σ2≥ χ2n−1,α

]= 1− α

P

[σ2 ≤ (n− 1)S

2n

χ2n−1,α

]= 1− α

χ249(0, 05) = 33, 930

49 · 2, 19233, 930

= 3, 166 .

Interval: (0, 3,166).

Přibližné intervalové odhady: Xn má podle Cen-trální limitní věty pro velké n přibližně normálnírozdělení:

X1 +X2 + · · ·+Xn − nµ√nσ

=Xn − µ

σ/√

n

má přibližně rozdělení N(0, 1). Dá se použít inter-valový odhad pro normální rozdělení:

Xn − u1−α/2Sn√n≤ E(X) ≤ Xn + u1−α/2

Sn√n

162

s pravděpodobností 1− α.

U alternativního rozdělení A(p) se navíc aproxi-muje σ2 hodnotou

Xn(1−Xn)

Xn − u1−α/2

√Xn(1−Xn)√

n≤ p ≤ Xn + u1−α/2

√Xn(1−Xn)√

n

s pravděpodobností 1− α.

10.11. Příklad. Při průzkumu se zjistilo, že z1500 oslovených osob poslouchá rádiovou stanicikvůli hudbě 63%. Určete 98% interval spolehlivostipro skutečné procento takovýchto posluchačů.

X1500 = 0, 63

r = u0,99 ·√0, 63 · 0, 371500

= 0, 029

interval

(60, 1%; 65, 9%)

163

11 Testování statistickýchhypotéz

statistické rozhodování při neúplné informaci, vždys jistým rizikem.

H0 . . . nulová hypotéza:

k−tice parametrů (θ1, . . . , θk) ∈ A ⊂ Rn

H1 . . . alternatvní hypotéza:

k−tice parametrů (θ1, . . . , θk) ∈ B ⊂ Rn

A ∩B = ∅kritický obor:

W ⊂ Rn

naměřená data: X = (X1, . . . , Xn).

H0 zamítneme ve prospěch H1 pokud X ∈ W ,volí se tak, aby

P [X ∈ W |H0] ≤ α

164

α . . . hladina významnosti

standardy: α = 0, 5; 0, 01

Chyba prvního druhu: H0 platí a test ji zamítá

Chyba druhého druhu: H0 neplatí a test ji neza-mítá

11.1. Příklad. V roce 1951 byla naměřena prů-měrná výška 10 letých chlapců v ČSSR 136,1 cm.V roce 1961 se u 15 náhodně vybraných 10 letýchchlapců zjistila průměrná výška

X15 = 139, 133cm

V obou případech je σ = 6, 4cm

Vzrostla výška?

Výška v r. 1961, N(µ, 6, 42)

H0 : µ = 136, 1 = µ0

H1 : µ > 136, 1

165

Hypotézu H0 zamítneme pokud X15 bude přílišvelký, tj. pokud X15 > c, kde c je vhodně zvolenákonstanta.

Platí-liH0, pakX15 má rozděleníN(µ0, 6,42

15 ). Tedy

Z =X15 − µ0

σ/√15

∼ N(0, 1) .

Zamítáme na hladině α jestliže Z > u1−α

Volme α = 0, 05. u0,95.= 1, 64

Z =139, 133− 136, 16, 4/

√15

.= 1, 835

Protože Z > u0,95 zamítáme hypotézu H0 na hla-dině významnosti 5%.

Kritický obor: x ∈ R15 | 115(x1 + · · ·+ x15) ≥ c

c = 136, 1 + u0,95 · 6, 4√15 = 136, 1 + 1, 838 = 137, 938

166

Lze volit mnoho kritických oborů. Existuje mate-matický výsledek (Neymannovo-Pearsonovo lemma)říkající, že tento test má největší sílu.Síla testu: pravděpodobnost s jakou zamítnemenulovou hypotézu když platí hypotéza alternativní.

Vztah mezi chybou prvního a druhého druhu α aβ. Pokud H0 neplatí, pak α → 0 implikuje β → 1.

Testy o střední hodnotě normálního roz-dělení

X = (X1, . . . , Xn)

. . . náhodný výběr z rozdělení N(µ, σ2).

H0 : µ = µ0

H1 : µ 6= µ0...oboustranný test

H2 : µ > µ0...jednostranný test

H3 : µ < µ0...jednostranný test

167

Z-test

známe σ

Z =Xn − µ0σ/√

n

má za podmínky H0 rozdělení N(0, 1).

H0 zamítneme na hladině významnosti α

a) proti H1: pokud |Z| > u1−α/2

b) proti H2: pokud Z > u1−α

a) proti H3: pokud Z < uα = −u1−α

168

t-test

neznáme σ

T =Xn − µ0Sn/

√n

má za podmínky H0 rozdělení tn−1.

H0 zamítneme na hladině významnosti α

a) proti H1: pokud |T | > tn−1(1− α/2)

b) proti H2: pokud T > tn−1(1− α)

a) proti H3: pokud T < tn−1(α) = −tn−1(1− α)

Pro velké n aproximujeme tn−1 rozdělenímN(0, 1).

169

11.2. Příklad. Automat plní krabice práškem. Normaje 2kg. Náhodně bylo vybráno 6 krabic. Zjistily senásledující odchylky od normy v dkg.

−5, 1,−1,−8, 7,−6

Testujeme správnost funkce automatu.

H0 : µ = 0

H1 : µ 6= 0 .

n = 6, X6 = −2, S26 = 30, 4

T =−2− 0

√30, 4/

√6

.= −0, 889 .

t5(0, 975) = 2, 5706

|T | < 2, 5706

Závěr: H0 nezamítáme.

170

Párový t-test: Sledujeme související veličiny, před-pokládáme, že rozdíl má normální rozdělení.

11.3. Příklad.

váha osob před dietou 82 70 91váha osob po dietě 81 69,5 89

Má dieta efekt ?

Rozdíly před a po:

1— 0,5— 2

H0 : µ = 0

H1 : µ > 0

X3 = 1, 167

S23 = 0, 583

T =1, 167

S3/√3= 2, 647 .

t2(0, 95) = 2, 92

171

Závěr: nezamítáme nulovou hypotézu, pokles váhyneni průkazný. (I když se zdá být ztráta váhy velká,máme málo pokusných osob).

172

Asymtotický test proporce

A(p) . . . alternativní rozdělení

Centrální limitní věta: Xn se aproximuje rozděle-ním N(p, p(1−p)

n).

H0 : p ≤ p0

H1 : p > p0

H0 zamítáme, jestliže Xn > c. Volíme vhodně ctak, aby

P [Xn > c|H0] ≤ α

P

[Xn > c|H0

].= 1− Φ

(c− p√p(1−p)√

n

)=

= 1− Φ(√

n(c− p)√p(1− p)

)√

p(1− p) ≤ 1/2 c− p ≥ c− p0

implikuje√

n(c− p)√p(1− p)

≥ 2√

n(c− p0)

173

Tedy

1− Φ(√

n(c− p)√p(1− p)

)≤ 1− Φ(2

√n(c− p0))

Podmmínce vyhovíme, jestliže

1− Φ(2√

n(c− p0)) ≤ α

Φ(2√

n(c− p0)) ≥ 1− α

2√

n(c− p0) ≥ u1−α

c ≥ p0 +u1−α

2√

n

Závěr: H0 zamítáme ve prospěch H1 jestliže

Xn ≥ p0 +u1−α

2√

n

174

11.4. Příklad. Průzkum zahrnuje 1600 osob. Ko-lik procent z tohoto vzorku má daná koalice získathlasů, abychom na hladině významnosti 1% potvr-dili hypotézu, že koalice vyhraje volby.

X1600 ≥ 0, 5 +u0,9980

.= 0, 5 +

2, 32680

= 0, 529 .

Musíme tedy získat 0, 529 · 1600 .= 847 hlasů.

Musíme vždy získat o asi 2, 9% více než je danámez.

175

Test rozptylu normálního rozdělení

X = (X1, . . . , Xn) . . . náhodný výběr z rozděleníN(µ, σ2)

H0 : σ2 = σ20

H1 : σ2 > σ20

Využíváme statistiku

S =(n− 1)S2n

σ20

která má za předpokladu H0 rozdělení χ2n−1.

Hypotézu H0 zamítáme ve prospěch H1 při hla-dině významnosti α jestliže

(n− 1)S2nσ20

> χ2n−1(1− α) .

176

Testy dobré shody

(Ω,A, P ) . . . pravděpodobnostní prostorA1, . . . , Ak . . . úplný systém jevů

P (Ai) = pi

k∑i=1

pi = 1 .

A1 A2 · · · Ak

p1 p2 · · · pk

Odpovídá rozdělení dat do disjunktních tříd. pi

jsou apriorní pravděpodobnosti. Testujeme jejichshodu s empirickými daty.

H0 : P (Ai) = pi

(k = 2) máme vpodstatě alternativní rozdělení.

Učiníme sérii n pokusů, v každém indikujeme je-den z jevů A1, . . . , Ak. Počítáme kolikrát který jevnastane. Při k = 2 tak máme binomické rozdělení.

177

Značení:n . . . počet nezávislých pokusů

Oi . . . počet výskytů jevu Ai v sérii n pokusů.

Náhodná veličina – empirická četnost.

n pi . . . teoretická četnost

(k = 2 pak Oi ∼ Bi(n, pi))

Testujeme shodu npi ≈ Oi

11.5. Věta. Náhodná veličina

k∑i=1

(Oi − npi)2

npi

má při n →∞ přibližně rozdělení χ2k−1.

Důkaz je založen na centrální limitní větě

HypotézuH0 o apriorních pravděpodobnostech za-mítáme na hladině významnosti α, pokud

k∑i=1

(Oi − npi)2

npi

> χ2k−1(1− α)

178

Tento test se nazývá χ2 test, nebo též Pearsonůvtest. Tento test je asymptotický, doporučuje se hopoužít pro n tak velké, že

npi > 5 pro všechna i = 1, . . . , k .

11.6. Příklad. Testujeme zda hrací kostka nenifalešná. Provedeno 120 hodů. Výsledky jsou

hodnota 1 2 3 4 5 6četnost 15 16 25 31 15 18

n = 120, pi = 1/6, npi = 120 · 16 = 20.

6∑i=1

(Oi − npi)2

npi

=

=52

20+42

20+52

20+112

20+52

20+22

20= 10, 8 .

χ25(0, 95) = 11, 07 .

Závěr: nelze zamítnout hypotézu, že kostka je fa-lešná.

179

Často se používá na test typu rozdělení:

11.7. Příklad. Testujeme hypotézu, že data po-cházejí z rozděleníN(0, 1). Provedeno je 1000 mě-ření, data jsou rozdělena do tří skupin

u0,8 = 0, 84162

250 hodnot v (−∞,−u0,8)

550 hodnot v (−u0,8, u0,8)

200 hodnot v (u0,8,∞)

H0 : p1 = 0, 2; p2 = 0, 6; p3 = 0, 2

np1 = 200

np2 = 600

np3 = 200

3∑i=1

(Oi − npi)2

npi

=502

200+502

600+0200= 16, 667 .

χ22(0, 95) = 5, 9915

Závěr: Hypotézu o rozdělení N(0, 1) zamítáme.

180

Testy shody při neznámých parametrech

Testujeme zda data pocházejí z rozdělení s nezná-mými parametry.

Je-li l počet odhadnutých parametrů, pak

k∑i=1

(Oi − npi)2

npi

má asymptoticky rozdělení χ2k−1−l.

Postup:1. Neznámé parametry odhadneme z dat.2. Pomocí nich spočítáme apriorní pravděpodob-nosti3. Hypotézu o daném rozdělení zamítneme, jestliže

k∑i=1

(Oi − npi)2

npi

> χ2k−1−l(1− α)

181

11.8. Příklad. Za války byl Londýn bombardo-ván střelami V1 a V2. Hypotéza je, že střely do-padaly náhodně (bez zaměřování) do jednotlivýchlokalit.Celkem na Londýn dopadlo 537 raket.Území města bylo rozděleno na 242 = 576 čtvercůstejné velikosti.

Empirická data:

počet zásahů: 0 1 2 3 4 a vícepočet oblastí: 229 211 93 35 8

X: počet zásahů v náhodně vybrané oblasti:

Bi

(počet střel ,

1počet oblastí

)≈ Po

(počet střel · 1

počet oblastí

).

1. Odhadneme:

λ.=537576

(=počet střelpočet oblastí

).

2. Platí-li H0 je

P [X = i] =λie−λ

i!.

182

počet pokusů = počet oblastí

n = 576

nP [X = 0] = 576 e−537576

.= 226, 7 .

nP [X = 1] = 576 · 537576

e−537576

.= 211, 4 .

nP [X = 2].= 98, 5 .

nP [X = 3].= 30, 6 .

nP [X ≥ 4] .= 8, 7 .

počet zásahů: 0 1 2 3 4 a víceskutečnost: 229 211 93 35 8teorie: 226,7 211,4 98,5 30,6 8,7

Numerický výpočet:5∑

i=1

(0i − npi)2

npi

= 1, 569

χ25−1−1(0, 95) = 7, 81 .

Závěr: Na hladině významnosti 5% potvrzujemehypotézu H0.

183

Documents

Matematika 4B - math.fel.cvut.cz