Štatistické spracovanie a vyhodnotenie dát 2

Štatistické spracovanie a vyhodnotenie dát 2

Induktívna štatistika

Základným predpokladom použitia akejkoľvek induktívnej štatistickej metódy je náhodný výber, teda výber, ktorý spĺňa dve základné vlastnosti: Pravdepodobnosť zaradenia do vzorky je pre všetky štatistické

jednotky nenulová. Štatistické jednotky sú do vzorky vyberané nezávisle jedna od

druhej.Použitie induktívnej štatistiky na vzorkách, ktoré neboli získané

náhodným výberom (napr. kvótne výbery) a pre cenzusy (vyšetrovania celých základných súborov) je nesprávne.

Induktívna štatistika rieši dva typy úloh: Odhady parametrov. Testy štatistických hypotéz.

Odhady parametrov

Koľko premenných chcete skúmať súčasne:

Jednu premennú Príklad: Možno na základe 30 meraní tvrdiť, že priemerný čas

prečítania jednej strany knihy (X) je menej ako 4 minúty?

Dve premenné Príklad: Súvisí počet vyriešených problémových úloh žiakmi (Y)

a množstvo položenia otázok učiteľom žiakom počas vysvetľovania (X)?

Tri a viac premenných Príklad: Existuje vzťah medzi dosiahnutým prospechom žiakov (Y)

a vzdelaním (X1), vekom (X2) a pohlavím (X3) učiteľov?

Odhady parametrov

Intervalový odhad

Testy štatistických hypotéz

Postup testovania hypotéz:

Formulácia nulovej hypotézy (H0)

Formulácia alternatívnej hypotézy (Ha) Stanovenie hladiny významnosti (α) Výpočet testovacej štatistiky a pravdepodobnosti Rozhodnutie

Sila testu a veľkosti vzoriek

Sila testu (pravdepodobnosť zachytenia existujúceho významného rozdielu) závisí od: Variability Veľkosti vzorky Pravdepodobnosti chyby I. druhu (α) Veľkosti efektu

Analýza sily (Power Analysis)

Čím je vyššia variabilita hodnôt premennej, tým je nižšia sila testu. Zvýšenie zvyšných troch faktorov zvyšuje silu testu.

Veľkosť efektu je veľkosť rozdielu parametrov (napr. rozdiel priemerov pri t-teste), ktorý možno zachytiť napr. experimentom. Na zachytenie veľkého efektu stačí menšia vzorka ako na zachytenie malého efektu. Voľba vhodnej veľkosti efektu je často ťažká, pretože je veľmi subjektívna. Voliť sa má vždy taká veľkosť efektu, ktorá je pre daný výskum užitočná.

Vzťahmi medzi variabilitou, veľkosťou vzorky, alfou, veľkosťou efektu a silou testu sa zaoberá analýza sily (Power Analysis).

Analýzou sily sa treba zaoberať už pri plánovaní výskumu. Nedostatočná veľkosť vzorky, môže spôsobiť nezachytenie relevantného

efektu. Príliš veľká vzorka stojí zbytočne veľa času a peňazí s minimálnym úžitkom.

Nevýhody testovania hypotéz

Výsledok testovania hypotéz je dichotomické rozhodnutie o tom, či zamietnuť alebo nezamietnuť nulovú hypotézu. Veľmi často je takýto výsledok nepostačujúci - napr. v prípade testovania efektívnosti novej liečby. Výskumník sa zaujíma o silu efektu nie o to, či sa efekt rovná presne 0. Porovnávanie P-hodnôt (aj v rámci jednej štúdie) bez doplňujúcich informácií a následným vyvodením záverov nemusí byť správne.

Ak napríklad vo viacfaktorovej ANOVA faktor A má P=0,0001 a faktor B P=0,049, nemôžeme jednoducho povedať, že faktor A má silnejší efekt ako faktor B. Samotná P-hodnota 0,001 môže v skutočnosti znamenať 3 situácie:

triviálny (z praktického hľadiska nevýznamný) efekt v základnom súbore zistený z veľkej vzorky,

silný efekt v základnom súbore zistený zo stredne veľkej vzorky, obrovský efekt v základnom súbore zistený z malej vzorky.

Výhody intervalových odhadov odpovedajú na otázku v akých hraniciach možno očakávať skutočný

efekt v základnom súbore. Poskytujú teda viac informácií ako testy hypotéz.

V prípade, že chceme zistiť, či je liek proti vysokému krvnému tlaku účinný, môžeme použiť párový t-test. Vzorke pacientov zmeriame tlak pred a po podávaní lieku. Ak sa priemerný rozdiel tlakov významne odlišuje od 0, potom má liek účinok.

Silu účinku však možno určiť len intervalovým odhadom priemerného rozdielu. Intervalový odhad nám s danou spoľahlivosťou (pravdepodobnosťou v %) povie, aký pokles tlaku môžeme očakávať v základnom súbore tvorenom pacientmi s vysokým krvným tlakom. Veľkou výhodou intervalových odhadov je ich výpovedná schopnosť. Z intervalu, ktorý je príliš široký (vykazuje veľkú chybu) jasne vidno, že veľkosť vzorky je nedostatočná. Naopak, z intervalu ktorý je úzky, pričom vyjadruje triviálny efekt vidno, že štatistická významnosť je dosiahnutá veľkou vzorkou (teda príliš veľkou silou testu).

Usporiadanie základných situácií štatistického usudzovania

Rozhodovacia schéma pre výber testov stredných hodnôt

Jednorozmerná induktívna štatistika - intervalová premenná

Jednovzorkový Studentov t-test na testovanie nulovej štatistickej hypotézy, ktorá tvrdí, že priemer

základného súboru sa rovná zadanej konštante. Test teda odpovedá na otázku, či možno na základe náhodnej vzorky tvrdiť, že (neznámy) priemer základného súboru sa rovná zadanému číslu (resp. či je väčší, príp. menší ako zadané číslo).

Viac informácií ako samotný test poskytuje Intervalový odhad priemeru, pretože určuje hranice v ktorých sa s danou spoľahlivosťou (pravdepodobnosťou – tradične 95 %) nachádza priemer základného súboru. Studentov t-test aj intervalový odhad priemeru predpokladajú normálne rozdelenie premennej v základnom súbore. Ak je vzorka malá (n < 50) a testy normality zamietnu normálnosť, treba použiť neparametrické alternatívy: Wilcoxonov test (1945) a znamienkový test, ktoré testujú nulovú hypotézu o zhode mediánu s konštantou.

Výber štatistického testu pre porovnanie skupín

Viacrozmerné prieskumné techniky

Porovnanie dvoch nezávislých výberov z normálne rozdelených základných súborov

Skúmame tú istú premennú na dvoch nezávislých výberoch. podmienky pokusu pre oba výbery sa odlišujú iba v pôsobení

jedného faktora. Rozdiel výberových priemerov môžu podmieňovať náhodné vplyvy, vtedy nebude signifikantný rozdiel v nameraných priemeroch. Naopak, ak je rozdiel podmienený istým faktorom, vtedy zistíme signifikantnosť rozdielu.

Oprávnenosť použitia t-testu: normálne rozdelenie, oba výbery sú homogénne, teda variancia oboch súborov je rovnaká (pomocou kritéria F-testu – testovanie podielu variancií). Ak platí, že variancie sú v oboch súboroch rovnaké použijeme t-test určený pre takýto prípad.

variancie sledovaných súborov štatisticky významne odlišné – použiť upravený t-test určený pre prípad nehomogénných súborov.

Porovnanie dvoch závislých výberov (v niektorej literatúre sa označujú aj ako korelujúce výbery) z normálne rozdelených základných súborov

test nulovej hypotézy pre závislé výbery, v prípade, keď rovnaký test použijeme v tom istom súbore dvakrát. Vznikajú dvojice pozorovaných hodnôt (napríklad vstupný a výstupný test) – na analýzu použijeme párový t-test

musí platiť, že ide o normálne rozdelenie. testujeme či aritmetický priemer rozdielu vo výsledkoch sa

odlišuje od nuly náhodne alebo štatisticky signifikantne. Hodnoty, ktoré premenná nadobúda pri oboch meraniach,

musia pritom navzájom pozitívne korelovať.

Porovnanie dvoch nezávislých výberov neparametrickými testovacími metódami

Ak pracujeme s dátami, ktoré nemajú normálne rozdelenie, musíme zvoliť postup, ktorý je nezávislý od určitej formy rozdelenia.

Hypotézy, ktoré testujeme, sa v tomto prípade nevzťahujú na parametre rozdelení, a preto hovoríme o neparametrických testoch. Často sa takto používajú Wilcoxonov test a Kolmogorovov-Smirnov test.

Porovnanie dvoch závislých výberov neparametrickými testovacími metódami

Pre malé výbery ťažko dokázať normálnosť rozdelenia náhodnej premennej. Preto aj pre závislé (korelujúce) výbery treba siahnuť po neparametrickej testovacej metóde. V takomto prípade môžeme použiť znamienkový test (sign test – skúma smer odchýlky merania od predpokladaného mediánu).

Documents

Štatistické spracovanie a vyhodnotenie dát 2