Upload
lisandra-church
View
34
Download
4
Embed Size (px)
DESCRIPTION
TEORETICKÉ MODELY některých DISKRÉTNÍCH NV. Veličiny, kterými se biolog, lékař, zemědělec, historik, … zabývá, bývají nejrůznější povahy. - PowerPoint PPT Presentation
Citation preview
Teoretické modely diskrétních náhodných veličin
Veličiny, kterými se zabýváme, bývají nejrůznější povahy.Přesto však existují skupiny náhodných veličin, které mají podobně rozloženou pravděpodobnostní funkci a lze je tedy popsat přibližně stejným modelem rozdělení pravděpodobnosti.
Typové modely takových rozdělení byly stanoveny teoreticky a jejich platnost pro různé náhodné veličiny byla ověřena experimentálně.
Mějme naměřená reálná (empirická) data - obvykle výběrový soubor z nějaké populace. Snažíme se nalézt teoretické rozdělení a stanovit jeho parametry tak, aby co nejlépe odpovídalo našemu reálnému rozdělení četností.Jinými slovy: Vybíráme takový „model rozdělení“, který vystihuje povahu našich reálných (empirických) dat.
Rovnoměrné diskrétní rozdělení
Náhodná veličina má rovnoměrné diskrétní rozdělení, jestliže k - hodnot, kterých může nabývat, se vyskytujes pravděpodobností
Rozdělení je modelem pokusů házení mincí (k=2) nebo házení hrací kostkou (k=6)
Střední hodnota je
a rozptyl je var(X)=E[X-E(X)]2 = E(X2) - [E(X)]2
kik
xXP i ...,,2,1,1
)(
k
iii
k
ii x
kxXPxXE
11
1)()(
2
112
2 11)var(
k
ii
k
ii x
kx
kX
Příklad: Rovnoměrné diskrétní rozdělení
Hod mincí 1. stranu označíme 1 2. stranu označíme 2
Hod kostkou
5,12
3
2
1)(
2
1
i
ixXE
5,36
21
6
1)(
6
1
i
ixXE
25,04
9
2
5
2
1
2
1)var(
22
1
2
12
2
ii
ii xxX
92,236
441691
36
21
6
91
6
1
6
1)var(
226
1
6
12
2
ii
ii xxX
Binomické rozdělení Bi (n; π)
Toto rozdělení má náhodná veličina X, která vznikne jako součet n nezávislých alternativně* rozdělených náhodných veličin se stejným parametrem π (pravděpodobnost úspěchu).
Diskrétní náhodná veličina X má binomické rozdělenís parametry n, π, π Є (0, 1), resp.nabývá-li hodnoty x = 0, 1, 2, .., n s pravděpodobností
Střední hodnota:
Rozptyl:
*Alternativně - mají jen 2 možné výsledky: úspěch x neúspěch
xnx
x
nxXP
1)(
nXE )(
)1()(var nX
),(),( nBnBi
Příklad: Hokejisté mají proměnit 5 trestných střílení. Jsou vybráni hráči, u nichž pravděpodobnost vstřelení branky je 0,8. Jaká je pravděpodobnost, že vstřelí branku ze všech pěti pokusů?
Podle pravidla násobení pravděpodobností: p = 0,8*0,8*0,8*0,8*0,8
Jaká by byla pravděpodobnost, že vstřelí branku jen ve třech stříleních? Z definice binomického rozdělení: p = počet možností * (0,8)3 * (0,2)2
Binomické rozdělení je rozdělením nezávislých pokusů alternativní veličiny se stejnou pravděpodobností úspěchu.
Binomické rozdělení Bi (n; π)
xnx
x
nxXP
1)( 353 8,018,0
3
5)3(
XP
Binomické rozdělení Bi (n; π)
Máme alternativní veličinu např. indikující, že daná osoba
trpí diabetem s pravděpodobností p = π a osoba je zdravá s pravděpodobností p = 1 - π
Předpoklady: všechny osoby mají stejnou pravděpodobnost výskytu onemocnění
výskyt diabetes je u jednotlivých osob nezávislý(nejedná se o nakažlivou chorobu)
Sledovaná populace: n osob Ve výběru bude: x nemocných
Pravděpodobnost, že X = x
xnx
x
nxXP
1)(
Binomické rozdělení - grafické znázornění
0 10 20 30
π=0,5 π=0,01 π=0,2 π=0,95
xnx
x
nxXP
)1()(
X … náhodná veličinax … hodnota NV, které dosáhne (např. pro 30 měření 0, 1, 2, …, 30)π … pravděpodobnost, s jakou je jev pozorován1-π … pravděpodobnost, s jakou jev nenastane
Alternativní (Bernoulliho) rozdělení
je zvláštním případem Binomického rozdělení a nazývá se Alternativní neboli Bernoulliho rozdělení.
Alternativní veličina – indikátor nemoci, symptomu, … .
NV může nabývat pouze hodnoty 1 s pravděpodobností pnebo hodnoty 0 s pravděpodobností (1-p)
Střední hodnota E(X) = pRozptyl var(X) = p(1-p)
PŘ1: počet lvů při hodu 1 mincí - buď padne 1 lev nebo žádný, p = 0,5
PŘ2: riziko onemocnění, pravděpodobnost výhry, ...
Kde a … počet pozitivních odpovědí (nemocných, losů, které vyhrávají). b … počet negativních odpovědí (počet zdravých, losů bez výhry)
ba
ap
),1( Bi
U předchozího binomického rozdělení jsme sledovali soubor konečného, často malého rozsahu. Ale často se stává, že sledovaná populace může být velmi rozsáhlá nebo dokonce „nekonečná“, např. sledujeme počet onemocnění klíšťovou encefalitidou v populaci ČR v každém týdnu aktuálního roku.
Parametr n v tomto případě neznáme a rozdělení veličiny můžeme popsat vzorcem , kde
λ je jediným parametrem tohoto rozdělení a vyjadřuje pravděpodobnost, že ve výběru bude x nemocných.Rozdělení se nazývá Poissonovo rozdělení.
Poissonovo rozdělení
ex
xXPx
!)(
Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek
Diskrétní náhodná veličina X má Poissonovo rozdělenís parametrem λ > 0, nabývá-li hodnot x = 0, 1, 2, …
s pravděpodobností
Základní charakteristikystřední hodnota a rozptyl:
Distribuční funkce (kumulativní pravděpodobnosti):
Poissonovo rozdělení je rozdělením řídkých jevů.
ex
xXPx
!)(
)(var)( XXE
Poissonovo rozdělení )(Po
xt
t
texF
!)(
Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek
Spolu s Binomickým rozdělením se používá nejčastěji pro popis veličin, které vyjadřují počet nalezených objektů našeho zájmu:
- počet hovorů za jednotku času v telefonní ústředně- počet vadných výrobků- počet kazů na látce- počet částic v jednotce objemu
Pro velká n a malá p lze Binomické rozdělení aproximovat Poissonovým rozdělením Po (λ = np)
Vztah platí i opačně – Poissonovo rozdělení můžeme aproximovat Binomickým: - zvolíme dostatečně velké n (řádově 100 – 1000 x větší než λ) a p vypočteme jako p = λ/n
Poissonovo rozdělení )(Po
Př. Sledujeme počet infekcí horních dýchacích cest dětí během prvních tří let jejich věku ve velmi rozsáhlé populaci a z těchto sledování stanovíme pravděpodobnost tohoto onemocnění a označíme ji λ.
Pravděpodobnost, že ve výběru bude x nemocných, vypočteme pomocí Poissonova rozdělení
za předpokladů: všechny děti mají stejnou pravděpodobnost onemocnění výskyt onemocnění je u jednotlivých osob nezávislý
Poissonovo rozdělení
ex
xXPx
!)(
Německý statistik Borkiewicz sledoval po dobu 10 let ve 20-ti německých armádních sborech zabití vojenských osob úderem koňského kopyta
Očekávaná hodnota λ (lambda) byla podle propočtů počet mrtvých / počet sledování 122 / 200 = 0,61
Skutečnost Propočet0 mrtvých 109 109
1 mrtvý 65 662 mrtví 22 203 mrtví 3 44 mrtví 1 0,6
ex
xXPx
!)(Poissonovo rozdělení
Poissonovo rozložení - smrt po úderu koňským kopytem
Počet úmrtí Vypočtený počet
vojenských sborů
Porovnání se skutečným sledováním
0 0,543 108,7 109
1 0,331 66,3 65
2 0,101 20,2 22
3 0,0205 4,1 3
4 0,0031 0,6 1
5 0,00038 0,1 0
6 0,000038 0,0 0
ex
xXPx
!)(
Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek
MODŘE - skutečnostŠEDĚ – propočet
Poissonovo rozložení - smrt po úderu koňským kopytem
ex
xXPx
!)(
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
1 3 5 7 9 11 13 15 17 19 21 23
λ=0,5
λ=1
λ=2
λ=4
λ=10
Frekvenční funkce Poissonova rozložení v závislosti na λ
ex
xXPx
!)(
Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek
Příklad: Do podnikové telefonní ústředny přichází v průměru 120 hovorů za hodinu. Vypočtěte, jaká je pravděpodobnost:
a) že za půl minuty nepřijde hovorb) že přijdou méně než tři hovory
Řešení: 120 hovorů za hodinu znamená 1 hovor za půl minuty: λ = 1 Jedná se o řídký náhodný jev, proto ho můžeme modelovat Poissonovým rozdělením.Pro hledaný časový interval půl minuty, tj, λ=1 se vzorec zjednoduší na
Pro X=0 je
Pro X=1 je
Pro X=2 je
a) P(X=0) = 0,368 b) P(X<3) = 0,368+0,368+0,184 = 0,92
ex
xXPx
!)(Poissonovo rozdělení - příklad
exe
xxXP
x
!
1
!
1)( 1
368,01
!0
1)0(
eeXP
368,01
!1
1)1(
eeXP
184,02
1
!2
1)1(
eeXP
Multinomické rozdělení
Příklad:
sledujeme nominální veličinu rodinný stav matkysvobodná, vdaná, rozvedená, vdova
Pravděpodobnost, že z n – matek bude právěk1 svobodných, k2 vdaných, k3 rozvedených a k4 vdov vyjadřuje vzorec:
P(X1=k1, X2=k2, X3=k3, X4=k4) =
43214321
4321 !!!!
! kkkk ppppkkkk
n
Hypergeometrické rozdělení H(M,N,n)
Mějme: N předmětů, z tohoM předmětů jednoho druhuN - M předmětů druhého druhu
Vylosujeme n předmětů bez vracení, kde je x - předmětů prvního druhu, např. x = 0 znamená, že 1. druh nebyl tažen.Sledujeme počet úspěchů x v n - závislých pokusech
Ne všechny situace jsou možné, musíme stanovit podmínky.
Příklad 1: Z osudí, ve kterém je N kuliček, z toho M bílých, vybíráme náhodně n jednotek a ptáme se, kolik je mezi nimi bílých kuliček. (Losovat můžeme postupně, ale důležité je, že kuličky zpět nevracíme).
Příklad 2: Losování sportkyPředměty prvního druhu jsou označeny veřejným losováním ve hře sportka. Výběrem čísel na tiketu jsme losovali právě tyto předměty prvního druhu.
Hypergeometrické rozdělení H(M,N,n)
Diskrétní náhodná veličina X má hypergeometrické rozdělenís parametry M, N, n, kde M, N, n jsou přirozená čísla a n Є (0, M), nabývá-li hodnoty x = 0, 1, 2, .., n s pravděpodobností
Základní charakteristiky:
Střední hodnota:
Rozptyl:
n
N
xn
MN
x
M
xXP )(
N
nMXE )(
N
M
N
Mn
N
nNX 1
1)(var
Hypergeometrické rozdělení H(M,N,n)
Je-li rozsah výběru n oproti počtu jednotek v osudí N malý(provedeme-li třeba jen 10%-ní výběr), pak se hodnota výrazu
ze vzorce pro rozptyl blíží 1. označíme jako p
a hypergeometrické rozdělení lze aproximovat Binomickým
rozdělením s rozptylem
1
N
nN
N
MnBi ,
N
M
N
Mn
N
nNX 1
1)(var
N
M
)1()(var ppnX