Upload
uncle-joe
View
43
Download
11
Embed Size (px)
DESCRIPTION
.
Citation preview
Következtető (inferenciális) statisztika
• A statisztikai analízis célja egy kezelési módszer, vagy egy kockázati tényező hatásának kimutatása, egy - a populációból kiválasztott - mintából származó adatok segítségével.
• Ezek az adatok lehetővé teszik, hogy a minta segítségével levont következtetéseket alkalmazni tudjuk a teljes populációra.
Következtető (inferenciális) statisztika
• Mivel adataink egy minta tanulmányozásából származnak, nem zárható ki a véletlen szerepe.
• A statisztikai analízis megmutatja, milyen szerepe volt a véletlennek az eredmények létrejöttében, illetve, alkalmazhatjuk-e eredményeinket a populációra?
Következtető (inferenciális) statisztika
• Példa: egy vérnyomáscsökkentő gyógyszer hatásának vizsgálata egy csoportban
• Mi a valószínűsége annak, hogy ez a különbség (amely látszatra jelentős) nem csupán a véletlen műve?
• Ezt mutatja meg a statisztikai analízis, és az adataink típusától függően többféle statisztikai tesztet alkalmazhatunk a kiszámítására.
124129127127118125124128119123
124,4
168154162159151167169155160164
160,9
Kezelés előtt Kezelés után
Hipotézisvizsgálat
• Az előbbi példában a két vérnyomásérték közti különbség 2 forrásból származhat:– Lehet a véletlen műve: nem mértünk elég pontosan,
ugyanaz a személy is produkálhat különböző értékeket, stb.– Tényleges különbségről van szó, amely nem magyarázható
a véletlennel• A statisztikai analízis eredményének segítségével eldöntjük,
hogy a megfigyelt különbség valós vagy nem (MI döntjük el, nem a statisztika).
Hipotézisvizsgálat
• Mindig 2 hipotézist állítunk fel:– Nullhipotézis (H0): a vérnyomáscsökkentő gyógyszer nem
csökkenti a vizsgált egyedek vérnyomását, az átlagok között megfigyelt különbség csupán a véletlen műve
– Alternatív hipotézis (H1): a vérnyomáscsökkentő gyógyszer lecsökkenti a vizsgált egyedek vérnyomását, az átlagok között megfigyelt különbség olyan nagy, hogy nem magyarázható véletlennel
Hipotézisvizsgálat
• A statisztikai teszt elvégzése után 2 lehetőség adódik:– Elfogadjuk a nullhipotézist (az alternatív hipotézis hamis,
és nem alkalmazható a populációra)– Elutasítjuk a nullhipotézist (az alternatív hipotézis igaz, és
alkalmazható a populációra)• Mivel a statisztikában könnyebb megcáfolni, mint igazolni
valamit, a statisztikai analízis során igazából azt szeretnénk elérni, hogy elutasítsuk a nullhipotézist (lásd a gyógyszeres példát, egy vérnyomáscsökkentőtől azt várjuk el, hogy csökkentse a vérnyomás értékeket)
Szignifikancia
• Hol van az a küszöb, ahol még fenntartjuk a nullhipotézist?• Az orvosi kutatásokban leggyakrabban használt küszöbértékek
(szignifikancia-szint, α):– α = 0,05– α = 0,01– α = 0,001
• Példa: annak a valószínűsége, hogy az átlagok közti különbség a véletlen műve, p = 0,04 (vagyis 4%). Mivel ez az érték az általánosan elfogadott küszöbérték alatt van, elvethetjük a nullhipotézist, és azt mondhatjuk, az átlagok között megfigyelt különbség szignifikáns.
A hipotézisvizsgálat hibái
• Elsőfajú hiba (type I error): statisztikailag szignifikáns különbséget kapunk a vizsgált minták között, emiatt elvetjük a nullhipotézist, miközben igazából a minták között nincs különbség. Az elsőfajú hiba előfordulási aránya megegyezik a szignifikancia-szinttel, vagyis az összes olyan kísérlet közül, ahol a minták között nincs különbség, 5%-nál fog fellépni elsőfajú hiba
• Másodfajú hiba (type II error): elfogadjuk a nullhipotézist, miközben igazából a vizsgált minták között szignifikáns különbség van
Statisztikai tesztek
• Paraméteres tesztek– A minták legyenek normál eloszlásúak– A mintavételezés legyen véletlenszerű– A minták szórása legyen egyenlő
• Nemparaméteres tesztek– Nem szükséges a normál eloszlás– Nem az átlagok különbségeit vizsgálják, hanem a minta
más tulajdonságait
Paraméteres tesztek
1. z-teszt (u-teszt)– Alapkövetelmények– A minta elemszáma legyen nagyobb mint 30
Paraméteres tesztek
2. t-teszt (Student)– Alapkövetelmények– 30 elemszám alatt is használható, ahol nem érvényes a
normál eloszlás– Ezt a tesztet használjuk a leggyakrabban
t-teszt
• One sample t-test: egy minta átlagát hasonlítjuk egy fix értékhez
• Independent samples t-test: független minták átlagának összehasonlítása– Egyforma a minták szórása? >>> F-teszt (ez dönti el,
használhatunk-e t-tesztet)– Ha a minták varianciája nem egyenlő >>> Welch teszt
• Paired samples t-test: párosított minták átlagának összehasonlítása– Önkontrollos vizsgálatok– Itt nem kell a varianciát figyelni
Paraméteres tesztek
3. Varianciaanalízis (analysis of variance, ANOVA): több minta egyidejű összehasonlítása a varianciák alapján– Egyutas (One-way ANOVA): kettőnél több független minta
összehasonlítása
Gyógyszer Szisztolés vny átlaga
A gyógyszer 168B gyógyszer 154C gyógyszer 162D gyógyszer 159Placebo 163
Ha p<0,01, akkor Bonferroni teszt, vagy páronként t-teszt
Paraméteres tesztek
– Kétutas (Two-way ANOVA): két független változó egyidejű hatásának vizsgálata
Gyógyszer Testmozgás Szisztolés vny átlaga
A gyógyszer Igen 131B gyógyszer Igen 127C gyógyszer Igen 162A gyógyszer Nem 159B gyógyszer Nem 163C gyógyszer Nem 159
Nemparaméteres tesztek
1. Előjelpróba (sign-test)Példa: kettős vak randomizált kísérlet
Ha a nullhipotézis érvényes, a + és – előjelek aránya kb. megegyezik
Placebo Gyógyszer Különbség Előjel
168 124 44 -
154 129 25 -
162 127 35 -
159 127 32 -
... ... ... ...
Nemparaméteres tesztek
2. Mann-Whitney teszt (Wilcoxon rank sum test)• Ha a minta kis elemszámú• Ha a minta nem normál eloszlású• A varianciák különböznek• Ha az adatok nem numerikusak, de rangsorolhatóak
Pl. Apgar score értéke bizonyos újszülöttkori betegség esetén (sorrendi skála)
Nemparaméteres tesztek
2. Mann-Whitney teszt (Wilcoxon rank sum test)
Beteg Egészséges
7 10
10 9
6 10
8 10
7 8
10
6 7 7 8 8 9 10 10 10 10 10
1 2,5 2,5 4,5 4,5 6 9 9 9 9 9
1 2 3 4 5 6 7 8 9 10 11
A rangokból átlagot számolunk, és azokat hasonlítjuk össze:
3,9 vs 7,75 p=0,043
Nemparaméteres tesztek
3. Wilcoxon-féle előjeles rangpróba• Egyesíti az előjelpróba és a Mann-Whitney teszt előnyeit• Párosított mintáknál alkalmazzuk
Nemparaméteres tesztek
4. Khi négyzet (2) próba– Független kvalitatív vagy diszkrét kvantitatív változók– Kontingencia táblázat
Hibák a tudományos kutatásban
1. Véletlen hibák2. Szisztematikus hibák3. Konfúzió4. Validitás
Véletlen hibák
• Kizárólag a véletlennek tulajdonítható eltérést jelentenek a mintában és a populációban vizsgált változó között
• Három forrásuk van: – biológiai variabilitás– mintavételi hiba– mérési hiba
• Nem lehet őket teljesen kizárni
Véletlen hibák
• Előfordulásuk nagy mértékben csökkenthető a következő módszerekkel:– biológiai variabilitás: az expozíció és a hatás pontos
mérése– mintavételi hiba: a minta méretének növelése– mérési hiba: a mérőműszerek validálása
Szisztematikus hibák
• Akkor jelennek meg, mikor egy epidemiológiai kutatás során sorozatosan (szisztematikusan) a valóstól eltérő eredményeket kapunk
• Egy olyan tanulmány amelynek a szisztematikus hibaszázaléka alacsony, pontosnak tekinthető
• A pontosságot nem befolyásolja a minta nagysága
Szisztematikus hibák
• Különleges kockázatot jelentenek az epidemiológusok számára, mert a laboratóriumi kísérletektől eltérően, a vizsgált alanyokat nem tudják befolyásolni
• Két fő kategória:– szelekciós hiba– információs hiba
Szelekciós hiba
• A minta nem reprezentatív arra a populációra, amelyet vizsgálni szeretnénk Két fő kategória:
• Két forrás:– nem megfelelően választjuk ki a mintát– a vizsgált személyek hiányos vagy téves információkat
szolgáltatnak
Információs hiba
• Az expozíció vagy a betegség téves mérése, általában rosszul megválasztott mérőműszerek miatt
Konfúzió
• Leggyakrabban akkor jelenik meg, mikor egy kockázati tényező és egy betegség közti esetleges viszonyt vizsgáljuk
• Feltételezi egy harmadik tényező létezését, amely ugyanazon betegség kialakulásához vezet
• Legtöbbször hibás következtetéseket eredményez
Validitás
• A kutatási eredmények igazságtartalmát jelöli• Megkülönböztetünk belső és külső validitást• A külső validitás egy tanulmány következtetéseinek
általánosítását jelöli• Belső validitás: a mért adatok hűen tükrözik a kutatás
alanyainak tulajdonságait, és nem tulajdoníthatók a véletlennek, hibáknak, konfúziónak vagy rosszul megírt protokollnak