50
Rozdělení spojitých veličin Frekvenční a distribuční funkce spojité náhodné veličiny (NV) Rovnoměrné spojité rozdělení Normální rozdělení (Gaussovo, Gauss- Laplaceovo) Normální normované rozdělení Logaritmicko - normální rozdělení Exponenciální rozdělení - rozdělení (Pearsonovo) Studentovo t - rozdělení Fischerovo - Snedecorovo F - rozdělení 2

Rozdělení spojitých veličin

Embed Size (px)

DESCRIPTION

Rozdělení spojitých veličin. Úvod Rovnoměrné spojité rozdělení Normální rozdělení (Gaussovo, Gauss- Laplaceovo ) Normální normované rozdělení Logaritmicko - normální rozdělení Exponenciální rozdělení rozdělení ( Pearsonovo ) Studentovo t - rozdělení - PowerPoint PPT Presentation

Citation preview

Page 1: Rozdělení spojitých veličin

Rozdělení spojitých veličin

Frekvenční a distribuční funkce spojité náhodné veličiny (NV) Rovnoměrné spojité rozdělení Normální rozdělení (Gaussovo, Gauss-Laplaceovo) Normální normované rozdělení Logaritmicko - normální rozdělení Exponenciální rozdělení - rozdělení (Pearsonovo) Studentovo t - rozdělení Fischerovo - Snedecorovo F - rozdělení

2

Page 2: Rozdělení spojitých veličin

FREKVENČNÍ FUNKCE spojité NV

Pokud u spojité náhodné veličiny X vynášíme na osu y pravděpodobnost,dostaneme FREKVENČNÍ FUNKCI neboli HUSTOTU PRAVDĚPODOBNOSTI.

Page 3: Rozdělení spojitých veličin

DISTRIBUČNÍ FUNKCE spojité NV

Pokud u spojité náhodné veličiny vynášíme na osu yKUMULATIVNÍ pravděpodobnost, dostaneme DISTRIBUČNÍ FUNKCI.

Page 4: Rozdělení spojitých veličin

DISTRIBUČNÍ FUNKCE spojité NV

Distribuční funkce spojité NV má tvar esovité křivkyje nezápornáneklesajícínejvýše = 1

Pro zvolenou hodnotu p nalezneme na vodorovné ose x hodnotu kvantilu x(p).

1)(0 xF

x

dttfxF )()(

Page 5: Rozdělení spojitých veličin

Rovnoměrné spojité rozdělení

U různých programových produktů (tabulkové procesory, programovací jazyky, statistické a simulační programy) je dostupný tzv. generátor náhodných čísel. Je to funkce, jejímž voláním lze získat hodnoty náhodné veličiny, které

mají rovnoměrné rozdělení pravděpodobnosti. Běžně se setkáváme s tím, že tato funkce generuje hodnoty spojité veličiny U z intervalu [0,1).

Některé programové produkty dovolují i generování hodnot diskrétní náhodné veličiny s rovnoměrným rozdělením, jinak tyto hodnoty můžeme získat vhodnou transformací (zaokrouhlením) spojité veličiny X.

Je nutno mít na paměti, že tzv. generátory náhodných čísel jsou deterministické algoritmy, tzn., že jednou vygenerovanou řadu hodnot jsme schopni při stejném počátečním zadání přesně zopakovat. Vygenerované hodnoty tedy nejsou, přísně vzato, náhodné. Proto se někdy takto vygenerovaným hodnotám říká pseudonáhodná čísla.

Page 6: Rozdělení spojitých veličin

Rovnoměrné spojité rozdělení - Frekvenční funkce

Spojitá náhodná veličina X má rovnoměrné rozdělení, jestliže hustota pravděpodobnosti je na intervalu hodnot (a,b) konstantní a mimo tento interval nulová. Plocha pod „frekvenční křivkou“ (úsečkou) = 1

pro a < x < b

f(x) = 0 jinak

abxf

1

)(

Page 7: Rozdělení spojitých veličin

Rovnoměrné spojité rozdělení - Distribuční funkceDistribuční funkce rovnoměrně rozdělené náhodné veličiny X je

F(x) = 0 pro x ≤ a

pro a < x < bF(x) = 1 pro x ≥ b

)(111

)()()( axab

aab

xab

dttfxXPxFx

a

Page 8: Rozdělení spojitých veličin

Rovnoměrné spojité rozdělení - střední hodnota a rozptyl

Matematicky je střední hodnota NV s distribuční funkcí F(x) definovaná pomocí integrálu

je to vlastně součet všech možných hodnot vynásobený jejich pravděpodobností

Rozptyl vypočteme dosazením do vzorce: var(X)=E(X2) - [E(X)]2

22

1

2

11)(

222 abab

ab

x

abdxx

abXE

b

a

b

a

22

2

1)var(

ab

dxxab

Xb

a

)(xxdF

b

a

b

a

b

a

dxxab

dxab

xdxxfxXE11

)()(

Page 9: Rozdělení spojitých veličin

Rovnoměrné spojité rozdělení – odvození vzorce pro rozptyl

Analogicky:

Zapsáno v jiném tvaru: var(X) = E(X2) - [E(X)]2

22

2

1)var(

ab

dxxab

Xb

a

n

iii

n

ii xxxx

nxx

nX

1

222

1

)2(1

)(1

)var(

n

ii

n

ii xx

nxxx

n 1

22

1

222 12

1

Page 10: Rozdělení spojitých veličin

Rovnoměrné spojité rozdělení – odvození vzorce pro rozptyl

43

1

2

1)var(

2322 abx

ab

abdxx

abX

b

a

b

a

4

2

3

)()(1

43

1 2222233 ababababab

ab

abab

ab

1212

2

12

363

12

444 2222222 ababababababab

12

)var(2ab

X

Page 11: Rozdělení spojitých veličin

Normální rozdělení spojitých veličin

Budeme zkoumat rozdělení četností (pravděpodobnosti výskytu) různých hodnot u biologických i jiných veličin, např.:

tělesná výška dospělých mužů váha novorozených dětí hodnoty cholesterolu pacientů z cévní poradny IQ školních dětí počet slov na potištěných stránkách životnost žárovek

Tyto veličiny budeme považovat za spojité a rozdělení pravděpodobnosti výskytu jejich hodnot nazývat NORMÁLNÍ

krajní hodnoty (nízké a vysoké) se vyskytují jen zřídka prostřední hodnoty jsou směrem ke střední hodnotě četnější

malá četnost = malá pravděpodobnost výskytu velká četnost = vysoká pravděpodobnost výskytu

Page 12: Rozdělení spojitých veličin

Pravděpodobnostní funkce spojité náhodné veličiny

Spojitou NV měříme s omezenou přesností: přesnost omezená měřicími přístroji nebo našimi schopnostmia zobrazujeme ji Histogramem četností (sloupcovým grafem) Frekvenční funkcí neboli Hustotou pravděpodobnosti

32 34 36 38 40 42 44 46 48 inch

Page 13: Rozdělení spojitých veličin

Pravděpodobnostní funkce Normálního rozdělení

Histogram četností je měření obvodu hrudi 5738 skotských vojáků (autorem je Belgičan Adolph Quételet).

Křivka je Frekvenční funkce neboli Hustota pravděpodobnosti O první uveřejnění spisku o této křivce se zasloužil v roce 1733 francouzský matematik Abraham de Moivre.

32 34 36 38 40 42 44 46 48 inch

Page 14: Rozdělení spojitých veličin

Pravděpodobnostní funkce Normálního rozděleníROZDĚLENÍ (ROZLOŽENÍ) NÁHODNÉ VELIČINY tedy znázorníme

PRAVDĚPODOBNOSTNÍ neboli FREKVENČNÍ FUNKCÍ.

Hladkou křivku můžeme také nazvat HUSTOTA PRAVDĚPODOBNOSTI

Př. Hmotnost narozených dětí

50004500400035003000250020001500

Page 15: Rozdělení spojitých veličin

Normální rozdělení

Normální rozdělení je myšlenkovým modelem. Normální křivka je jednoznačně určena dvěma parametry:

střední hodnotou rozptylem resp. směrodatnou odchylkou

Střední hodnota je v tomto případě aritmetický průměr, medián i modus - určuje střed křivky na ose x

Rozptyl určuje plochost nebo naopak špičatost křivky (čím je rozptyl větší, tím je křivka plošší )

Page 16: Rozdělení spojitých veličin

Normální rozdělení (Gaussovo, Gauss-Laplaceovo)

Obecné normální rozdělení má ve statistice dominantní postavení. Mnohé náhodné veličiny v přírodních vědách i ekonomice mají toto rozdělení nebo lze jejich rozdělení Normálním rozdělením dobře aproximovat.

Proč? V BIOSTATISTICE je rozdělení hodnot dáno především

BIOLOGICKOU VARIABILITOU SLEDOVANÉ VELIČINY – měřenou proměnnou ovlivňuje současně velký počet nepatrných vzájemně nezávislých náhodných vlivů.

Projevuje se to kolísáním kolem střední hodnoty tak, že na obě strany jsou výsledky stále méně časté a extrémní hodnoty se objevují jen ojediněle.

Page 17: Rozdělení spojitých veličin

Normální rozdělení (Gaussovo, Gauss-Laplaceovo)

Normální rozdělení N(μ; σ2) je popsáno matematickou funkcí:

Frekvenční funkce je symetrická zvonovitá funkce

jejíž špičatost závisí nepřímo na velikosti rozptylu

Normální rozdělení je stejně jako ostatní rozdělení myšlenkovým modelem, nikoli exaktním přírodním zákonem.

I zde platí, že se může vyskytnout nejméně pravděpodobná hodnota.

2

2

1

2

2

1

2

1)(

2

2

xx

eexf

2

Page 18: Rozdělení spojitých veličin

Normální rozdělení (Gaussovo, Gauss-Laplaceovo)

Normální rozdělení platí pro (téměř) všechny výběry

Např. zkoumáme váhu stovky (tisíce, statisíce) havranů. Všichni jsou černí, ale jejich váhy se budou lišit nejen u jednotlivců, ale u různých výběrů.

Pokud jejich váhy jsou rozděleny „normálně“, součet vah výběrů je také rozdělen normálně.

Obecně platí, že normálně bude rozdělena i veličina, která vznikne součtem výběrů, i kdyby původní veličina normální rozdělení neměla.

Normální křivku matematicky popsal poprvé v roce 1733 Abraham de Moivre, francouzský matematik, který utekl do Londýna. Na základě binomického rozdělení uskutečnil myšlenkový skok od sloupečků k hladké křivce. Jenže křivka i rovnice upadly v zapomnění.

Page 19: Rozdělení spojitých veličin

Normální rozdělení (Gaussovo, Gauss-Laplaceovo)

Znovuobjevena byla jako GAUSSOVA – LAPLACEOVA KŘIVKA CHYB.

Proč chyb?Na přelomu 18. a 19. století získávali astronomové při svých měřením ve vesmíru kvůli nedokonalosti přístrojů stále odlišné hodnoty.

Astronomové – mezi nimi Gauss a Laplace - hledali cestu, jak ze spousty různých výsledků najít pravděpodobně správnou hodnotu. Nejprve chtěli vypočítat aritmetický průměr, ale pak oba došli k závěru, že velmi odlišné hodnoty vyloučí a budou se zabývat jen těmi „podobnějšími“.

Nejčetnější hodnoty byly prostřední a odpovídal jim i aritmetický průměr.

Pro práci s odchylkami (např. +2 a -2, +5 a -5) zvolil každý jinou cestu: Laplace absolutní hodnoty, Gauss chyby umocnil na druhou – tento postup se pak uplatnil při výpočtu rozptylu a směrodatné odchylky.

Pro biometrii – vědu o měření člověka – objevil normální rozdělení belgický vědec Adolphe-Lambert Quételet, jeden ze zakladatelů Královské statistické společnosti v Londýně.

Page 20: Rozdělení spojitých veličin

Normální rozdělení (Gaussovo, Gauss-Laplaceovo)

Quételet zavedl pojem „homme moyen“ – tvrdil, že příroda se snaží vytvořit ideální typ člověka, ale že různě chybuje.Měl odpůrce i stoupence, např. Francis Galton zavedl do biologie kvantitativní metody a měrné stupnice pro všechny možné tělesné znaky.

Dalším obdivovatelem normální křivky byl Karl Pearson, otec moderní matematické statistiky. Stanovil, že i v přírodě jsou nenormálně rozdělené veličiny. Pokusil se vypracovat specifická schémata rozdělení pro tyto případy a po pečlivém rozboru skutečností zjistil, že se obvykle jedná o „spletence“ dvou nebo více normálních rozdělení.

Výsledkem dohadů o normálním rozdělení je centrální limitní věta, která nám říká asi toto: Jestliže je znak určen působením většího počtu navzájem nezávislých vlivů, výsledkem je alespoň přibližně normální rozdělení, ať už je každý z těchto faktorů rozdělen jakkoliv.

Page 21: Rozdělení spojitých veličin

Platí: - součet či rozdíl normálních veličin je normální - tedy i průměr normálně rozdělených veličin je normální - čím více nezávislých náhodných veličin sčítáme, tím je jejich součet blíž normálnímu rozdělení a to bez ohledu, jaké měly původní

veličiny rozdělení

Považujeme ho za rozdělení, které vystihuje rozložení SPOJITÝCH KVANTITATIVNÍCH VELIČIN.

Můžeme ho popsat pomocí dvou parametrů μ a σ2.

Tyto parametry jsou mírou polohy a měřítka a jejich přirozeným odhadem je výběrový průměr a výběrový rozptyl.

Matematicky lze dokázat, že pro dostatečně velké n je binomické rozdělení Bi(n; π) „podobné“ normálnímu rozdělení N(nπ; nπ(1-π))

Normální rozdělení (Gaussovo, Gauss-Laplaceovo)

Page 22: Rozdělení spojitých veličin

Grafy hustoty pravděpodobnosti Normálního rozložení

Page 23: Rozdělení spojitých veličin

Grafy odpovídajících distribučních funkcí Normálního rozložení

Page 24: Rozdělení spojitých veličin

-3δ -2δ -1δ 0 δ 2δ 3δ- odchylky na obě strany jsou stejně pravděpodobné (symetrie, šikmost = 0)- v úseku –δ a +δ leží 68,26% případů, tj. o něco víc než 2/3 celkové plochy- v úseku –2δ a +2δ leží 95% případů- v úseku –3δ a +3δ leží 99,7% případů

Normální křivka se teoreticky rozkládá od -∞ do +∞

Frekvenční funkce a PRAVIDLO TŘÍ SIGMA

Page 25: Rozdělení spojitých veličin

Normované normální rozdělení značíme někdy místo N(0; 1) symbolem U nebo Z

Má střední hodnotu μ = 0 a směrodatnou odchylku σ = 1

Je popsáno matematickou funkcí:

která vznikla zjednodušením rovnice

dosazením za μ = 0 a σ = 1

Normované normální rozdělení N (0; 1)

2

2

1

2

1)(

xexf

2

2

1

2

1)(

x

exf

Page 26: Rozdělení spojitých veličin

Normování je účelná konvence: vzorec pro přepočet hodnot normovaného rozdělení je:

Důvody: pro střední hodnotu = 0 je rozložení symetrické (šikmost = 0) pro směrodatnou odchylku = 1 je špičatost = 0 pro testování hypotéz potřebujeme mít k dispozici kritické hodnoty –

převod na Normované rozdělení nám umožní použít statistické tabulky, v nichž jsou tabelovány hodnoty pouze pro μ = 0 a σ2 = 1

Poznámka: statistické programy už umí pracovat i s obecným normálním

rozdělením

Normované normální rozdělení N (0;1)

x

z

Page 27: Rozdělení spojitých veličin

Statistická tabulka rozdělení pravděpodobností N(0; 1)

Page 28: Rozdělení spojitých veličin

Příklad

O rozdělení IQ obyvatel je známo, že má normální rozdělení se střední hodnotou 100 a směrodatnou odchylkou 10, tj. N(100; 100)

Jaká je pravděpodobnost, že vaše kamarádka má1. IQ > 852. IQ > 1253. IQ mezi 90 a 1104. IQ = 100

5,110

10085

z

5,210

100125

z

0,110

10090

z

0,110

100110

z

Vypočteme z - skóry pro N(0; 1)

1. 85:

2. 125:

3. 90:

4. 110:

Page 29: Rozdělení spojitých veličin

Příklad - řešení

1. IQ > 85 … -1,52. IQ > 125 … 2,53. IQ mezi 90 a 110

-1 a 14. IQ = 100

Pravděpodobnost:1. 0,9332. 1-0,994: 0,0063. 0,841-0,159: 0,6824. 0

Page 30: Rozdělení spojitých veličin

LOGARITMICKO - NORMÁLNÍ ROZDĚLENÍ

Příklady: Koncentrace látek Hmotnost dospělého muže U normálního rozdělení se chyby sčítají, zajímá nás o kolik se změní

sledovaná veličina (aditivní).

U logaritmicko-normálního se ptáme kolikrát se změní sledovaná veličina (multiplikativní) – vytváří násobek skutečné veličiny, třeba blízký jedné. Tento násobek můžeme ještě názorněji vyjádřit procentuelně.

zvýšení hmotnosti člověka s 50 kg o 5 kg je 10%, tj. násobek 1,1 zvýšení hmotnosti člověka se 100 kg o 5 kg je 5% tj. násobek 1,05

Proto je vhodnější počítat tyto veličiny v logaritmicko normálním rozložení.

Page 31: Rozdělení spojitých veličin

LOGARITMICKO - NORMÁLNÍ ROZDĚLENÍ

Pokud si nakreslíme histogram s rozdělením váhy v normálních hodnotách, histogram není symetrický, ale zešikmený kladně - v pravé části se bude objevovat více odlehlých hodnot

Pokud by průměrná hmotnost dospělého muže byla 80 kg, pak najdeme daleko víc mužů, kteří váží přes 100 kg než mužů, kteří váží méně než 60. Zároveň odchylka 50 kg se ve vyšších hodnotách bude zcela jistě vyskytovat (váha 130 kg), ale v nižších hodnotách (30 kg) se skoro jistě nevyskytne vůbec.

Pokud stejné rozdělení zobrazíme jako logaritmy hodnot, rozdělení se bude jevit symetrické.

Mají-li tyto logaritmy normální rozložení, mluvíme o logaritmicko-normálním rozdělení.

Charakteristikou polohy je geometrický průměr, který vypočteme odlogaritmováním průměru logaritmů.

Testy a výpočty intervalů počítáme také z logaritmů naměřených hodnot. Meze intervalů jsou nesymetrické.

Page 32: Rozdělení spojitých veličin

LOGARITMICKO - NORMÁLNÍ ROZDĚLENÍ

0 2 4 6 8 10 12

Vyznačuje se kladným zešikmením Příklady: - koncentrace- hmotnost postavy

Page 33: Rozdělení spojitých veličin

EXPONENCIÁLNÍ ROZDĚLENÍ

Používá se nejčastěji pro analýzu doby přežití v biologii nebove fyzice pro modelování rychlosti rozpadu izotopů.

Nejjednodušší model pravděpodobnosti přežití je založen na myšlence, že pravděpodobnost úmrtí je v každém okamžiku stejná, tj. pravděpodobnost, že sledovaná osoba zemře v daném okamžiku za předpokladu, že se tohoto okamžiku dožila, je konstantní – nezávisí na čase.

Hustota exponenciálního rozdělení je popsána vzorcem:

Základní charakteristiky jsou: E(X) = avar(X) = a2

a

xa

x

ea

ea

xf

11)(

Page 34: Rozdělení spojitých veličin

Mějme náhodnou veličinu o které předpokládáme, že má Normální rozdělení s parametry μ a σ.

V praxi často neznáme skutečné hodnoty těchto parametrů a musíme je nahradit jejich odhady. Tato „transformace“ změní rozložení zkoumané veličiny.

Proto byla odvozena jiná (výběrová) rozdělení, která slouží jako vzor pro porovnávání s výběrovým rozdělením.

V kapitole o Statistických testech budeme hledat způsob, jak určit shodu mezi naší náhodnou veličinou a teoretickým rozdělením, o kterém předpokládáme, že je modelem pro naše data.

Výběrová rozdělení veličin

Page 35: Rozdělení spojitých veličin

Jinými slovy: Při testování veličiny vypočteme testovací statistiku, o které víme, že za platnosti testované hypotézy, má nějaké výběrové rozdělení, např.:

rozdělení (používá se pro popis výběrového rozptylu)

Studentovo t - rozdělení (nejčastěji se používá k porovnání průměrů)

Fisherovo F rozdělení (použití pro porovnání rozptylů ve dvou souborech nebo při porovnání rozptylů závislých veličin v lineární regresi)

Výběrová rozdělení veličin

2

Page 36: Rozdělení spojitých veličin

rozdělení (Pearsonovo) Mějme n nezávislých náhodných veličin s normovaným

normálním rozdělením N(0; 1): U1, U2, …, Un

Potom náhodná veličina X má rozdělení s n-stupni volnosti.

Je to rozdělení součtu n druhých mocnin normálně rozdělených veličin.

Hodnota n je jediný parametr tohoto rozdělení. Základní charakteristiky: E(X) = n, D(X) = 2n

Hustota rozdělení je pro hodnoty x ≤ 0 nulová (viz obrázek dále).

2

n

iiU

1

22

Page 37: Rozdělení spojitých veličin

rozdělení (Pearsonovo) S rostoucím n se rozdělení blíží normálnímu rozdělení ―› N(n, 2n) s parametry μ = n

σ2=2n

2

n

iiU

1

222

Page 38: Rozdělení spojitých veličin

rozdělení (Pearsonovo)

Distribuční funkci, stejně jako hustotu rozdělení, nelze vyjádřit jednoduchým výrazem, proto je tabelována, podobně jako kvantily rozdělení chí kvadrát.

Tabelované hodnoty najdeme ve statistických tabulkách, kde jsou obvykle v levém sloupci stupně volnosti a v horním řádku najdeme hladinu významnosti α (vysvětlení najdete v kapitole o statistických testech).

V Excelu pro určení kvantilů rozdělení můžeme použít funkci CHISQ.INV, jejíž parametry jsou p, tj. levostranná pravděpodobnost a počet stupňů volnosti, takže např. zadáním CHISQ.INV(0,95;10) dostaneme hodnotu 0,95-kvantilu rozdělení pro 10 stupňů volnosti = 18,307

2

2

2

Page 39: Rozdělení spojitých veličin

rozdělení (Pearsonovo)

analogická funkce CHISQ.INV.RT, počítá kvantily zprava, tj. CHISQ.INV.RT(0,05;10) vypočte stejnou hodnotu kvantilu jako CHISQ.INV(0,95;10).

Tato funkce je inverzní k funkci distribuční, tj. pro CHISQ.DIST s parametry (x; n; 1), kde x je kvantil, n je počet stupňů volnosti a 1 určuje, že se jedná o distribuční funkci.

Obecně má funkce CHISQ.DIST parametry (x; n; kumulativní), kde x je kvantil, n je počet stupňů volnosti a „kumulativní“ je pravda (1) - distribuční funkce, nebo nepravda (0) - frekvenční funkce (hustota pravděpodobnosti).

analogicky funkce CHISQ.DIST.RT vrátí hodnotu distribuční funkce zprava. Třetí parametr nemá.

2

Page 40: Rozdělení spojitých veličin

rozdělení (Pearsonovo) Používá se nejčastěji pro popis výběrového rozptylu.

Tvar rozložení je závislý na počtu sčítanců n, ale toto číslo musíme v případě, že pro výpočet použijeme odhad jednoho nebo více parametrů, zmenšit o příslušný počet odhadovaných parametrů.

Příklad: pro výpočet odhadu ROZPTYLU, kdy použijeme odhad průměru, je počet stupňů volnosti (n – 1) místo n (odhadovali jsme 1 parametr).

Ve složitějších případech bývá počet odhadovaných parametrů větší a počet stupňů volnosti se tím zmenší.

2

Page 41: Rozdělení spojitých veličin

Studentovo t - rozdělení

Také Studentovo t-rozdělení patří mezi rozdělení odvozená od Normálního rozdělení a můžeme ho popsat funkcí:

kde veličina U má standardizované normální rozložení

a veličina chí-kvadrát rozdělení o n - stupních volnosti

Statistické charakteristiky: E(T) = 0, D(T) =

n

Ut

2

2

2n

n

Page 42: Rozdělení spojitých veličin

Studentovo t - rozdělení

S rostoucím n se t-rozdělení blíží normovanému normálnímu rozdělení a pro n > 40 ho můžeme nahradit normovaným rozdělením N (0; 1)

Název získalo rozdělení podle pseudonymu chemika pivovaru Guiness v Dublinu Williama Sealy Gosseta, jednoho ze zakladatelů aplikací induktivní statistiky v oblasti nesporně významné - v zabezpečení kvality piva.

Nejčastěji se používá k porovnání průměrů.

Kvantily t-rozdělení jsou tabelovány nebo je můžeme určit pomocí software.

Page 43: Rozdělení spojitých veličin

Studentovo t - rozdělení

V Excelu existují funkce T.INV a T.INV.2T s dvěma parametry: pravděpodobnost a počet stupňů volnosti.

Každá z nich se chová jinak: T.INV vrací hodnotu p-kvantilu zleva, např. T.INV(0,04; 40) = -1,796

T.INV.2T počítá s oboustrannou pravděpodobností, např. T.INV.2T(0,04; 40) = 2,123 - vrací hodnotu kvantilu pro pravděpodobnost 0,98 zprava, tzn., že na obou stranách křivky „ukrojíme“ hodnoty s pravděpodobností < než 0,02.

Je to proto, že na rozdíl od funkce chí-kvadrát a Normálního rozdělení je pro Studentovo rozdělení definována hladina významnosti α oboustranně: P{|T|≥ t(α)} = α

Page 44: Rozdělení spojitých veličin

Studentovo t - rozdělení

Co znamená hladina významnosti α bude vysvětleno v kapitole u statistických testů.

Zatím na příkladu:

řekli jsme, že Studentovo rozdělení pro n > 40 můžeme nahradit Normálním normovaným rozdělením.

T.INV (0,4; 40) = -0,255T.INV.2T (0,8; 40) = 0,255 ... oboustranná pravděpodobnost

NORM.S.INV (0,4) = -0,253 ... pravděpodobnost zprava

NORM.S.INV (0,6) = 0,253 ... zleva pravděpodobnost 0,04

Page 45: Rozdělení spojitých veličin

Studentovo t - rozdělení

Analogicky najdeme v Excelu Distribuční funkci T.DIST s parametry x, volnost, kumulativní,

kde x je kvantil, volnost je počet stupňů volnosti a „kumulativní“ je pravda (1) - distribuční funkce, nebo nepravda (0) - frekvenční funkce (hustota pravděpodobnosti).

Funkce T.DIST.RT poskytne hodnotu pravostranného Studentova rozdělení

a funkce T.DIST.2T poskytne hodnotu oboustranného Studentova rozdělení

Page 46: Rozdělení spojitých veličin

Studentovo t - rozdělení

Page 47: Rozdělení spojitých veličin

Studentovo t - rozdělení

Tabelování hodnot studentova rozdělení:P{|T| ≥ t(α)} = α

Tabelování hodnot Normálního normovaného rozdělení:P{X ≥ u(α)} = α

Absolutní hodnota u Studentova rozdělení zdvojnásobí hladinu významnosti pro stejnou hodnotu nezávisle proměnné (testovací statistiky): Z(α) ~ t(2α),

např. Z = 2,576 pro α = 0,005a t = 2,576 pro 2α = 0,01 (pro nekonečně velký počet stupňů volnosti)

V Excelu použijeme funkce:

NORM.S.INV (1-α) … pro Normální normované rozděleníT.INV.2T (2α; počet stupňů volnosti) … pro Studentovo rozdělení

Page 48: Rozdělení spojitých veličin

Fischerovo - Snedecorovo F-rozdělení

Mějme dvě nezávislé náhodné veličiny s rozdělením

Veličina má Fischerovo - Snedecorovo rozdělení s n a m stupni volnosti.

Na pořadí parametrů záleží.

Statistické charakteristiky: E(F) = D(F) =

Používá se především pro testování rozdílnosti rozptylů a při porovnání rozptylů závislých veličin v lineární regresi

m

nF 2

2

2

1

2

2n

n

)4()2(

)2(22

2

nnm

nmn

Page 49: Rozdělení spojitých veličin

Fischerovo - Snedecorovo F-rozdělení

Page 50: Rozdělení spojitých veličin

Fischerovo - Snedecorovo F-rozdělení

V Excelu kvantily počítá funkce F.INV s parametry 1-p, n, m, např. F.INV(0,05; 10; 20) vrátí hodnotu 2,3478,což je 0,95-kvantil

Vzhledem k tomu, že náhodná veličina F je podílem veličin X a Y, pro kvantily F-rozdělení platí

F.INV(0,25;100;20) = 1,31F.INV(0,75;20;100) = 0,76 1/0,76 = 1,31

)1(

1)(

,, pF

pFnm

mn