Kutatásmódszertan 4.pptx

Következtető (inferenciális) statisztika

• A statisztikai analízis célja egy kezelési módszer, vagy egy kockázati tényező hatásának kimutatása, egy - a populációból kiválasztott - mintából származó adatok segítségével.

• Ezek az adatok lehetővé teszik, hogy a minta segítségével levont következtetéseket alkalmazni tudjuk a teljes populációra.


• Mivel adataink egy minta tanulmányozásából származnak, nem zárható ki a véletlen szerepe.

• A statisztikai analízis megmutatja, milyen szerepe volt a véletlennek az eredmények létrejöttében, illetve, alkalmazhatjuk-e eredményeinket a populációra?


• Példa: egy vérnyomáscsökkentő gyógyszer hatásának vizsgálata egy csoportban

• Mi a valószínűsége annak, hogy ez a különbség (amely látszatra jelentős) nem csupán a véletlen műve?

• Ezt mutatja meg a statisztikai analízis, és az adataink típusától függően többféle statisztikai tesztet alkalmazhatunk a kiszámítására.

124129127127118125124128119123

124,4

168154162159151167169155160164

160,9

Kezelés előtt Kezelés után

Hipotézisvizsgálat

• Az előbbi példában a két vérnyomásérték közti különbség 2 forrásból származhat:– Lehet a véletlen műve: nem mértünk elég pontosan,

ugyanaz a személy is produkálhat különböző értékeket, stb.– Tényleges különbségről van szó, amely nem magyarázható

a véletlennel• A statisztikai analízis eredményének segítségével eldöntjük,

hogy a megfigyelt különbség valós vagy nem (MI döntjük el, nem a statisztika).


• Mindig 2 hipotézist állítunk fel:– Nullhipotézis (H0): a vérnyomáscsökkentő gyógyszer nem

csökkenti a vizsgált egyedek vérnyomását, az átlagok között megfigyelt különbség csupán a véletlen műve

– Alternatív hipotézis (H1): a vérnyomáscsökkentő gyógyszer lecsökkenti a vizsgált egyedek vérnyomását, az átlagok között megfigyelt különbség olyan nagy, hogy nem magyarázható véletlennel


• A statisztikai teszt elvégzése után 2 lehetőség adódik:– Elfogadjuk a nullhipotézist (az alternatív hipotézis hamis,

és nem alkalmazható a populációra)– Elutasítjuk a nullhipotézist (az alternatív hipotézis igaz, és

alkalmazható a populációra)• Mivel a statisztikában könnyebb megcáfolni, mint igazolni

valamit, a statisztikai analízis során igazából azt szeretnénk elérni, hogy elutasítsuk a nullhipotézist (lásd a gyógyszeres példát, egy vérnyomáscsökkentőtől azt várjuk el, hogy csökkentse a vérnyomás értékeket)

Szignifikancia

• Hol van az a küszöb, ahol még fenntartjuk a nullhipotézist?• Az orvosi kutatásokban leggyakrabban használt küszöbértékek

(szignifikancia-szint, α):– α = 0,05– α = 0,01– α = 0,001

• Példa: annak a valószínűsége, hogy az átlagok közti különbség a véletlen műve, p = 0,04 (vagyis 4%). Mivel ez az érték az általánosan elfogadott küszöbérték alatt van, elvethetjük a nullhipotézist, és azt mondhatjuk, az átlagok között megfigyelt különbség szignifikáns.

A hipotézisvizsgálat hibái

• Elsőfajú hiba (type I error): statisztikailag szignifikáns különbséget kapunk a vizsgált minták között, emiatt elvetjük a nullhipotézist, miközben igazából a minták között nincs különbség. Az elsőfajú hiba előfordulási aránya megegyezik a szignifikancia-szinttel, vagyis az összes olyan kísérlet közül, ahol a minták között nincs különbség, 5%-nál fog fellépni elsőfajú hiba

• Másodfajú hiba (type II error): elfogadjuk a nullhipotézist, miközben igazából a vizsgált minták között szignifikáns különbség van

Statisztikai tesztek

• Paraméteres tesztek– A minták legyenek normál eloszlásúak– A mintavételezés legyen véletlenszerű– A minták szórása legyen egyenlő

• Nemparaméteres tesztek– Nem szükséges a normál eloszlás– Nem az átlagok különbségeit vizsgálják, hanem a minta

más tulajdonságait

Paraméteres tesztek

1. z-teszt (u-teszt)– Alapkövetelmények– A minta elemszáma legyen nagyobb mint 30


2. t-teszt (Student)– Alapkövetelmények– 30 elemszám alatt is használható, ahol nem érvényes a

normál eloszlás– Ezt a tesztet használjuk a leggyakrabban

t-teszt

• One sample t-test: egy minta átlagát hasonlítjuk egy fix értékhez

• Independent samples t-test: független minták átlagának összehasonlítása– Egyforma a minták szórása? >>> F-teszt (ez dönti el,

használhatunk-e t-tesztet)– Ha a minták varianciája nem egyenlő >>> Welch teszt

• Paired samples t-test: párosított minták átlagának összehasonlítása– Önkontrollos vizsgálatok– Itt nem kell a varianciát figyelni


3. Varianciaanalízis (analysis of variance, ANOVA): több minta egyidejű összehasonlítása a varianciák alapján– Egyutas (One-way ANOVA): kettőnél több független minta

összehasonlítása

Gyógyszer Szisztolés vny átlaga

A gyógyszer 168B gyógyszer 154C gyógyszer 162D gyógyszer 159Placebo 163

Ha p<0,01, akkor Bonferroni teszt, vagy páronként t-teszt


– Kétutas (Two-way ANOVA): két független változó egyidejű hatásának vizsgálata

Gyógyszer Testmozgás Szisztolés vny átlaga

A gyógyszer Igen 131B gyógyszer Igen 127C gyógyszer Igen 162A gyógyszer Nem 159B gyógyszer Nem 163C gyógyszer Nem 159

Nemparaméteres tesztek

1. Előjelpróba (sign-test)Példa: kettős vak randomizált kísérlet

Ha a nullhipotézis érvényes, a + és – előjelek aránya kb. megegyezik

Placebo Gyógyszer Különbség Előjel

168 124 44 -

154 129 25 -

162 127 35 -

159 127 32 -

... ... ... ...


2. Mann-Whitney teszt (Wilcoxon rank sum test)• Ha a minta kis elemszámú• Ha a minta nem normál eloszlású• A varianciák különböznek• Ha az adatok nem numerikusak, de rangsorolhatóak

Pl. Apgar score értéke bizonyos újszülöttkori betegség esetén (sorrendi skála)


2. Mann-Whitney teszt (Wilcoxon rank sum test)

Beteg Egészséges

7 10

10 9

6 10

8 10

7 8

10

6 7 7 8 8 9 10 10 10 10 10

1 2,5 2,5 4,5 4,5 6 9 9 9 9 9

1 2 3 4 5 6 7 8 9 10 11

A rangokból átlagot számolunk, és azokat hasonlítjuk össze:

3,9 vs 7,75 p=0,043


3. Wilcoxon-féle előjeles rangpróba• Egyesíti az előjelpróba és a Mann-Whitney teszt előnyeit• Párosított mintáknál alkalmazzuk


4. Khi négyzet (2) próba– Független kvalitatív vagy diszkrét kvantitatív változók– Kontingencia táblázat

Hibák a tudományos kutatásban

1. Véletlen hibák2. Szisztematikus hibák3. Konfúzió4. Validitás

Véletlen hibák

• Kizárólag a véletlennek tulajdonítható eltérést jelentenek a mintában és a populációban vizsgált változó között

• Három forrásuk van: – biológiai variabilitás– mintavételi hiba– mérési hiba

• Nem lehet őket teljesen kizárni

Véletlen hibák

• Előfordulásuk nagy mértékben csökkenthető a következő módszerekkel:– biológiai variabilitás: az expozíció és a hatás pontos

mérése– mintavételi hiba: a minta méretének növelése– mérési hiba: a mérőműszerek validálása

Szisztematikus hibák

• Akkor jelennek meg, mikor egy epidemiológiai kutatás során sorozatosan (szisztematikusan) a valóstól eltérő eredményeket kapunk

• Egy olyan tanulmány amelynek a szisztematikus hibaszázaléka alacsony, pontosnak tekinthető

• A pontosságot nem befolyásolja a minta nagysága

Szisztematikus hibák

• Különleges kockázatot jelentenek az epidemiológusok számára, mert a laboratóriumi kísérletektől eltérően, a vizsgált alanyokat nem tudják befolyásolni

• Két fő kategória:– szelekciós hiba– információs hiba

Szelekciós hiba

• A minta nem reprezentatív arra a populációra, amelyet vizsgálni szeretnénk Két fő kategória:

• Két forrás:– nem megfelelően választjuk ki a mintát– a vizsgált személyek hiányos vagy téves információkat

szolgáltatnak

Információs hiba

• Az expozíció vagy a betegség téves mérése, általában rosszul megválasztott mérőműszerek miatt

Konfúzió

• Leggyakrabban akkor jelenik meg, mikor egy kockázati tényező és egy betegség közti esetleges viszonyt vizsgáljuk

• Feltételezi egy harmadik tényező létezését, amely ugyanazon betegség kialakulásához vezet

• Legtöbbször hibás következtetéseket eredményez

Validitás

• A kutatási eredmények igazságtartalmát jelöli• Megkülönböztetünk belső és külső validitást• A külső validitás egy tanulmány következtetéseinek

általánosítását jelöli• Belső validitás: a mért adatok hűen tükrözik a kutatás

alanyainak tulajdonságait, és nem tulajdoníthatók a véletlennek, hibáknak, konfúziónak vagy rosszul megírt protokollnak

Documents

Kutatásmódszertan 4.pptx