Upload
geneva
View
97
Download
0
Embed Size (px)
DESCRIPTION
Statistika a výpočetní technika www.vfu.cz/stat Doc.RNDr.Iveta Bedáňová, Ph.D. Biostatistika - sleduje biologické vlastnosti živých jedinců na základě vybraných statistických znaků. znaky zpravidla nabývají číselných hodnot více-méně kvantifikují sledovanou vlastnost. - PowerPoint PPT Presentation
Citation preview
Statistika avýpočetní technika
www.vfu.cz/stat
Doc.RNDr.Iveta Bedáňová, Ph.D.
BiostatistikaBiostatistika
- sleduje biologické vlastnosti živých - sleduje biologické vlastnosti živých jedinců na základě vybraných jedinců na základě vybraných
statistických znakůstatistických znaků- znaky zpravidla nabývají číselných znaky zpravidla nabývají číselných
hodnot hodnot
více-méně kvantifikují sledovanou více-méně kvantifikují sledovanou
vlastnostvlastnost
• ordinální – vzestupné (sestupné) uspořádání intenzity vzestupné (sestupné) uspořádání intenzity (subjektivní měřítko)(subjektivní měřítko)
• kardinální – přesná číselná hodnotapřesná číselná hodnota (objektivní měřítko, (objektivní měřítko, přístroj)přístroj)
KvalitativníKvalitativní (nominální) – pouze 2 stavy: ano-ne, (ne)přítomnost znaku
Statistické znakyStatistické znaky
Z formálního hlediska: diskrétní
spojité
Kvantitativní:Kvantitativní:
Statistický souborStatistický soubor
•Výběrový souborVýběrový soubor ((VS, výběr)VS, výběr) – – nn
-- omezený počet jedincůomezený počet jedinců (náhodný výběr)(náhodný výběr)
nepřesnost výpočtůnepřesnost výpočtů
• Základní soubor (ZS, populace) – N=
- „všichni“, u nichž se sledovaný znak může vyskytovat
Variační řada - vzestupně (sestupně) uspořádané hodnoty souboru
Např.: 2,3,4,4,5,5,5,6,6,7,7,8 (diskrétní veličina)Četnost varianty - počet opakování stejné hodnoty ve
variační řadě
Náhodná veličinaNáhodná veličina - diskrétní- diskrétní - spojitá- spojitá
Rozdělení četností NV - grafické vyjádření rozložení hodnot v souboru
0 1 2 3 4 5 6 7 8 x (počet mláďat)
četnost
3
2
1
Rozdělení četnostíRozdělení četností – – diskrétní veličina:diskrétní veličina:
Diskrétní veličina – počet mláďat ve vrhu: 2,3,4,4,5,5,5,6,6,7,7,8
četn.
xx (hmotnost)
střed třídy
histogram
polygon
Rozdělení četností – spojitá veličina:
f(x) - hustota pravděpodobnosti
x (hmotnost)
teoretická křivka (ZS)
empirické křivky (VS)
Rozdělení četností (pravděpodobností)
a) normální (Gaussovo)
b) neznámé (asymetrické, extrémní, nepravidelné)
Typy teoretických křivek rozdělení
Gaussovo normální rozděleníGaussovo normální rozdělení( ( - střední hodnota, - střední hodnota, - směrodatná - směrodatná
odchylka)odchylka)
Podle typu rozdělení (testy normality)
Soubory s GNR: parametrické metodySoubory s neznámým r.: neparametrické metody
metody statistického zpracování
Popisné charakteristiky Popisné charakteristiky
statistických souborůstatistických souborů
Základní souborZákladní soubor
- přesné parametry- přesné parametry (nelze empiricky zjistit)
Výběrový soubor Výběrový soubor
- výběrové charakteristiky- výběrové charakteristiky (odhad skutečných parametrů ZS)
A) Střední hodnotyA) Střední hodnoty
1) 1) Aritmetický průměrAritmetický průměr:: (ZS), (VS)(ZS), (VS) (střední hodnota)(střední hodnota)
x
N
xN
i
i 1
Vlastnosti:Vlastnosti: - - ovlivněn extrémními hodnotami ovlivněn extrémními hodnotami ! ! ( použití u stejnorodých souborů s pravidelným r. - GNR))
- 0)( xxi
n
xx
n
i
i 1
2)2) MediánMedián:: (ZS), (VS)(ZS), (VS)~ x~
2
1~
nPoř.č.x
Vlastnosti:Vlastnosti: - - není není ovlivněn extrémními hodnotami ovlivněn extrémními hodnotami
= prostřední hodnota variační řady= prostřední hodnota variační řady (průměr 2 (průměr 2 prostředních)prostředních)
~
50%
50%
50%
50%
~
1) RozptylRozptyl:: (ZS), (VS)(ZS), (VS) 2 2s
N
xxN
ii
1
2
2
= průměr čtverců odchylek jednotlivých = průměr čtverců odchylek jednotlivých hodnot xhodnot xi i od aritmetického průměru souboru od aritmetického průměru souboru
x
2σ
11
2
2
n
xxs
n
ii „Odhad
rozptylu“
B) Míry variability (proměnlivosti B) Míry variability (proměnlivosti souboru)souboru)
3) Variační koeficientVariační koeficient::
(relativní směrodatná odchylka)(relativní směrodatná odchylka)
%100x
sV
není závislý na absolutních hodnotách znakunení závislý na absolutních hodnotách znaku
2) 2) Směrodatná odchylkaSměrodatná odchylka:: (ZS),(ZS), (VS)(VS)
(SD (SD – Standard Deviation– Standard Deviation))
= odmocnina z rozptylu= odmocnina z rozptylu
stejný rozměr jako měřená veličinastejný rozměr jako měřená veličina
s
Testování hypotéz
Využití: vyhodnocování experimentů VS platnost
hypotézy o ZS
Hypotéza nulová Hypotéza nulová (testovaná)(testovaná) - - HH00:: == konst konst. .
11== 22
112 2 = = 22
22
Hypotéza alternativníHypotéza alternativní - - HH11: popírá platnost : popírá platnost
HH00
Parametrické testy – – pro soubory s GNR, hypotéza o pro soubory s GNR, hypotéza o a a . . Výpočty vycházejí z odhadů těchto Výpočty vycházejí z odhadů těchto parametrů u VS.parametrů u VS.
Neparametrické testy – pro soubory s neznámým – pro soubory s neznámým rozdělením, hypotéza o shodě rozdělení. rozdělením, hypotéza o shodě rozdělení. Výpočty vycházejí z pořadí hodnot VS.Výpočty vycházejí z pořadí hodnot VS.
Testovací kritérium:
Např.: t – Studentův t-test (průměry) H0: 1=2
F – Fisherův F-test (rozptyly) H0: 1
2=22
2 – testování rozdílu četností (2- test)Překročení kritické hodnoty (tab.) zamítáme nulovou
hypotézu (statisticky významný rozdíl mezi testovanými parametry)
Hladina významnosti testu: zvolená chyba =0,05 (0,01)
(Vyhodnocení experimentů: Pokus x Kontrola ) 2
11 s,x2
22 s,x
= 0,05 - hladina významnosti testu (0,01)
Parametrické testyParametrické testy(GNR: (GNR: ,,))
F-test - rozdíl 2 rozptylů
t- test - rozdíl 2 průměrů
F-test F-test (H(H00: : 1122==22
22))
1.VS : n1, s12
2.VS : n2, s22
Testovací krirérium: ),(
),(2
22
1
22
21
ssmenší
ssvětšíF
Je-li vypočítané F > FJe-li vypočítané F > Fkrit. krit. 1122 22
2 2 ( (významný rozdíl významný rozdíl rozptylůrozptylů- - pokusný zásahpokusný zásah byl účinnýbyl účinný) ) Je-li vypočítané F Je-li vypočítané F F Fkrit. krit. 11
22= = 222 2 (ne (nevýznamný rozdíl významný rozdíl
rozptylůrozptylů - - pokusný zásahpokusný zásah byl byl neúčinnýneúčinný) )
- vliv pokusného zásahu na rozptýlení hodnot sledované - vliv pokusného zásahu na rozptýlení hodnot sledované veličinyveličiny
Studentův t-testStudentův t-test(testování rozdílu 2 středních hodnot)
I.Porovnání ZS x VSI.Porovnání ZS x VS (jednovýběrový t-test)
- použití v pokusech, kdy známe u ZS (např.
fyziol. hodnoty biochem. ukazatelů)= konst.
- testujeme hypotézu, že pokusný VS pochází z populace s touto (H(H00: : = konst.) = konst.)
Experiment: Experiment:
VS (VS (nn) – aplikace pokusného ) – aplikace pokusného zásahuzásahu
X ZS – známeZS – známe
2s,x
ns
μxt
2
Testovací Testovací
kritérium t:kritérium t:
• Je-li t Je-li t ttkrit.krit. statisticky statisticky nevýznamnýnevýznamný rozdíl při zvolené rozdíl při zvolené
(p(p>0,05>0,05)) H H0 0 platíplatí (pokusný zásah byl(pokusný zásah byl neúčinnýneúčinný
- - VS pochází ze ZS se =konst.)
• Je-li t Je-li t >>ttkrit.krit. statisticky statisticky významný významný rozdíl (při rozdíl (při = 0,05) = 0,05)
(p(p<0<0,05),05)
vysoce významnývysoce významný rozdíl (při rozdíl (při = 0,01) = 0,01) (p(p<0,01<0,01))
HH0 0 neplatí (pokusný zásah bylneplatí (pokusný zásah byl účinnýúčinný, způsobil změnu , způsobil změnu konst.)
Nevýznamný rozdíl (-): p>0,05
Významný rozdíl (+): p<0,05
Vysoce významný rozdíl (++):p<0,01
Příklad
V chovu koní je střední hladina glukózy krevního séra = = 3.1mmoll3.1mmoll-1. Koním byl aplikován v krmivu energetický přípravek a byl zjišťován jeho účinek na hladinu glukozy krevního séra koní: v odebrané krvi u 10 náhodně vybraných jedinců byla stanovena hladina glukozy kr.séra v mmoll-1:3.1, 2.7, 3.3, 3.1, 3.1, 3.2, 3.0, 2.8, 2.9, 2.7.Měl přípravek vliv na hladinu glukózy krevního séra koní?
HH00: : =3.1=3.1
t < tt < tkkritrit.. statisticky nevýznamný rozdíl (Hstatisticky nevýznamný rozdíl (H00 platí platí;; výběrový soubor pochází z populace sevýběrový soubor pochází z populace se =3.1). =3.1).
Závěr:Závěr:Aplikace přípravku neměla vliv na hladinu Aplikace přípravku neměla vliv na hladinu glukózy v krevním séru glukózy v krevním séru [[PP>>0.050.05]]..
578.1
102079.0
1.399.2
ns
μxt
22
0432.0
2079.0
999.2
2
s
s
x
Výběr:Výběr: Testovací kritérium:Testovací kritérium:
ttkrit.(0.05krit.(0.05;9;9)) = 2.262 = 2.262
II.Porovnání VS x VSII.Porovnání VS x VS (dvojvýběrový t-test)
1)1) Párový pokusPárový pokus
- - u 1 VS provedena 2 měření:u 1 VS provedena 2 měření:
před P po Pč. xi xi´ rozdíly
1. x1 x1´ x1-x1´2. x2 x2´ x2-x2´…..i. xi xi´ xi-xi´…..n. xn xn´ xn-xn´
páry
2s,x
Testovací kritérium Testovací kritérium t:t:
ns
xt
2
Testujeme hypotézu, že měření před pokusem a po pokuse se rovnají
• Je-li t Je-li t ttkrit.krit. statisticky statisticky nevýznamnýnevýznamný rozdíl, Hrozdíl, H00 platí platí (p(p>>0,05)0,05) • Je-li t Je-li t ttkrit.krit. statisticky statisticky významnývýznamný rozdíl (při rozdíl (při = 0,05) = 0,05)
(p(p<<0,05)0,05)
stat.vysoce významnýstat.vysoce významný rozdíl (při rozdíl (při = 0,01) = 0,01) (p(p<<0,00,011))
HH00 neplatí (pokusný zásah byl neplatí (pokusný zásah byl účinnýúčinný - - způsobil změnu střední hodnoty 2.měření
oproti 1.měř.)
Příklad:Příklad:
Zjistěte, zda režim s fyzickou zátěží způsobí změnu hmotnosti Zjistěte, zda režim s fyzickou zátěží způsobí změnu hmotnosti u lab.potkanů poté, co byli režimu podrobeni. Změny u lab.potkanů poté, co byli režimu podrobeni. Změny hmotnosti u 12 pokusných jedinců (váha po zátěži – váha před hmotnosti u 12 pokusných jedinců (váha po zátěži – váha před zátěží) v g:zátěží) v g:0.2, -0.5, -1.3, -1.6, -0.7, 0.4, -0.1, 0.0, -0.6, -1.1, -1.2, -0.8. 0.2, -0.5, -1.3, -1.6, -0.7, 0.4, -0.1, 0.0, -0.6, -1.1, -1.2, -0.8.
HH00: : rozd.rozd.=0 =0
t > tt > tkkritrit..(0.01) (0.01) H H00 neplatí: statisticky vysoce významný rozdílneplatí: statisticky vysoce významný rozdíl
Závěr:Závěr:Režim s fyzickou zátěží způsobí vysoce významnou ztrátu Režim s fyzickou zátěží způsobí vysoce významnou ztrátu hmotnosti u lab.potkanů hmotnosti u lab.potkanů [[PP<0.01]<0.01]..
389.3
124008.0
61.0
ns
xt
2
22 4008.0
1161.0
gs
gx
Rozdíly:Rozdíly: Testovací kritérium:Testovací kritérium:
ttkrit.(0.0krit.(0.05;5;11)11)==22..220101 ttkrit.(0.0krit.(0.01;1;11)11)==33..110606
2)2) Nepárový pokusNepárový pokus
-- porovnání 2 různých VS: 1.VS x 2.VSporovnání 2 různých VS: 1.VS x 2.VS
Pokusný Pokusný KontrolníKontrolní- testujeme hypotézu- testujeme hypotézu HH00: : 11 = =
22
1.VS (n1.VS (n11) : ) : vypočtemevypočteme
2.VS (n2.VS (n22) : ) : vypočtemevypočteme
211 s,x
222 s,x
Soubory mohou mít stejný nebo různý rozptyl ovlivňuje provedení t-testu.
Podle výsledku F-testu:Podle výsledku F-testu:
• Je-li FJe-li FFFkrit.krit. a) a) 1122==22
22
• Je-li FJe-li FFFkrit.krit. b) b) 112 2 22
22
a) a) 1122==22
22 : : 21
21
21
222
211
21
nnnn
2nns1ns1n
xxt
**
Pro n1=n2=n: n
ss
xxt
22
21
21
b)b) 112 2 22
22 : :
2
22
1
21
21
ns
ns
xxt
• Je-li t Je-li t ttkrit.krit. statisticky statisticky nevýznamný nevýznamný rozdíl mezi rozdíl mezi 11 a a 2 2
(p(p>>0,05)0,05)
HH00: : 11==22 platí, pokusný zásah byl platí, pokusný zásah byl neúčinnýneúčinný
• Je-li t Je-li t ttkritkrit statisticky statisticky významnývýznamný rozdíl (při rozdíl (při = 0,05)= 0,05)
(p(p<<0,05)0,05)
stat. stat. vysoce významnývysoce významný rozdíl (při rozdíl (při = 0,01)= 0,01) (p(p<<0,00,011))
HH00 neplatí neplatí, , pokusný zásah byl pokusný zásah byl účinnýúčinný – –
způsobil změnu střední hodnoty (11 22 ) )
Příklad:Příklad:
Zjistěte vliv trasportního stresu u brojlerů na celkový počet leukocytů v krvi. Z trasportu bylo náhodně vybráno 7 brojlerů (pokusná skup.), kontrolní skupina (n=7) přepravována nebyla. Po hematologickém vyšetření byly zjištěny následující hodnoty počtu Leu (G/l): Pokusná sk. (P): 9.9, 9.0, 11.1, 9.6, 8.7, 10.4, 9.5. Kontrolní sk. (K): 8.8, 8.4, 7.9, 8.7, 9.1, 9.6, 8.7.
6670.0
774.9
12
1
11
s
nxPokus:Pokus:
6283.0
774.8
22
2
22
s
nxKontrola:Kontrola:
367.2283.0
670.0F
FF<<FFkrit.krit. 1122==22
22
(5.820)(5.820)
HH00: : 11 = = 22
t > tt > tkkritrit..(0.01) (0.01) H H00: : 11==22 neplatí (na hladině neplatí (na hladině =0.01).=0.01).
Závěr Závěr : Transport brojlerů způsobil statisticky vysoce významné : Transport brojlerů způsobil statisticky vysoce významné zvýšení počtu leukocytů v krvi.zvýšení počtu leukocytů v krvi. [ [PP<0.01]<0.01]
6670.0
774.9
12
1
11
s
nxPokus:Pokus:
Testovací kritérium t:Testovací kritérium t:
ttkrit.(0.0krit.(0.05;5;12)12)==22.179.179
6283.0
774.8
22
2
22
s
nxKontrola:Kontrola:
367.2283.0
670.0F
FF<<FFkrit.krit. 1122==22
22
(5.820)(5.820)
834.3261.0
743.8743.9
nss
xxt
22
21
21
ttkrit.(0.01krit.(0.01;;12)12)=3.055=3.055
HH00: : 11 = = 22
=(7-1).2=12=(7-1).2=12
Neparametrické testyNeparametrické testy
CharakteristikaCharakteristika
•Pro soubory s neznámým rozdělením
•Hypotéza: shoda rozdělení četností (tvar křivky)
•Výpočty: z pořadových čísel naměřených hodnot souboru - „pořadové testy“
(i pro ordinální znaky, nevyžadují přesné hodnoty)
• Jednodušší výpočet, ale nižší přesnost a spolehlivost (síla testu)
•Obecnější použití (i pro data s GNR – orientační hodnocení předběžných pokusů)
Př:Př: byl sledován vliv vit.B12 na zvyšování hmotnosti u selat – zjistěte účinnost :(A – standardní krmná směs, B – přídavek vit. B12)
Závěr:Závěr: vitamín B12 zvyšuje statisticky vysoce významně hmotnostní přírůstky u selat.
)2
.. A
1121A R
1)(nnnn U(
Pozn.: při výpočtu testovacího kritéria jde o dosažení minima
Wilcoxonův testWilcoxonův test(párový pokus: 2 měření 1VS)
před P před P (X):(X): x1, x2, x3, x4, x5, x6, ..………….xn
po P po P (X´): (X´): x1´, x2´, x3´, x4´, x5´, x6´ ….………..xn´
rozdíly X-X´: +z1, -z2, +z3, -z4, -z5, +z6 ….…0…….zn
seřazení: +z3 < +z1 < -z5 < -z4 < +z6 < -z2 ……….
pořadí: 1. 2. 3. 4. 5. 6. …….…n.(průměrné pořadí u stejných rozdílů)
V případě platnosti H0:
(ideálně: všechny rozdíly =0)(ideálně: všechny rozdíly =0)
rozdíly jsou rozloženy symetricky kolem 0 (stejný počet + a – rozdíly jsou rozloženy symetricky kolem 0 (stejný počet + a – rozdílů).rozdílů).
W+ - pořadových čísel kladných rozdílů
W- - pořadových čísel záporných rozdílů
Je-li W W(, n) zamítáme H0 o shodnosti rozdělení veličiny X a X´
(pokusný zásah byl účinný – hodnoty před pokusem
a po pokusu se liší)
Je-li W W(, n) platí H0 o shodnosti rozdělení veličiny X a X´
(pokusný zásah byl neúčinný – hodnoty před pokusem
a po pokusu se neliší)
Př:Př: zhodnoťte výsledky testu bakteriální kontaminace po ošetření 2 preparáty (A, B)(1.polovina každého vzorku byla ošetřena preparátem A, 2.polovina prep.B). Zjistěte rozdíl v účinnosti :
Závěr: Závěr: preparát B má statisticky významně vyšší antibakteriální účinnost.