Jednorozmerný a dvojrozmerný chí-kvadrát test (krížové
tabuľky)
Iveta WaczulíkováPeter Slezák
Fakulta matematiky, fyziky a informatiky UK
Ústav normálnej a patologickej fyziológie SAV
Frekvenčná tabuľka• Jednoduchá (frekvenčná) tabuľka zodpovedá
jednostupňovému triedeniu. Obsahuje triedne početnosti podľa kategórií (tried) jednej premennej. Zostrojenie frekvenčných tabuliek z údajov sa nazýva tabelácia.
• Prezentácia: koláčový graf, stĺpcový graf, kumulatívny stĺpcový graf
Kedy použiť jednorozmerný chí2 test dobrej zhody? “Goodness of fit”
• Keď je premenná kategorická (nominálna alebo ordinálna)
• Testuje jeden typ otázky (napr. otázka na pacienta): – Čo považujete za najväčší nedostatok v
zdravotnej starostlivosti? • (Pearsonov) chí2 test dobrej zhody testuje nulovú
štatistickú hypotézu, ktorá tvrdí, že aktuálne (pozorované) početnosti v jednotlivých kategóriách (presnejšie hodnotách/úrovniach kategorickej premennej) sa rovnajú očakávaným (teoretickým) početnostiam (univariačná analýza toho, či distribúcia frekvencií “fituje” predpokladané populačné proporcie).
Štatistická otázka• Predpokladáme, že v odpovediach budú v jednotlivých
stanovených triedach (hodnotách kategórie) rozdiely
• 43% odpovedí “kvalita”• 34% odpovedí “dostupnosť”• 23% odpovedí “neviem”
• Ale sú tieto rozdiely štatisticky signifikantné? Inými slovami, nakoľko “veľký” je veľký rozdiel medzi týmito percentami?
• Výskumná otázka na vzorke 105 pacientov: Sú jednotlivé typy odpovedí pacientmi ROVNAKO PREFEROVANÉ? (excelovský príklad, list 1).
Poznámka: triedy odpovedí sú pre naše potreby zjednodušené – v takejto podobe nevyhovujú kritériám pre „closed-ended question“
Testovanie hypotézy
• Ho: 1 = 2 = 3
– to znamená, že ak sú preferencie rovnaké, očakávané hodnoty by mali byť 35/105 resp. 33,3% pre každú úroveň kategorickej premennej (typ odpovede)
• Ha: 1 = 2 = 3
Uvažujeme chybu typu I. druhu maximálne vo výške 5% (alfa = 0,05)
Podmienky použitia testu dobrej zhody
• Analýza nízkych očakávaných početností je kontroverzná (Koehler a Larnz 1980). Použitie aproximačného chí2 testu vyžaduje splnenie všetkých (!) nasledujúcich podmienok:
• Celkový počet pozorovaných početností n ≥ 10
• Počet tried/úrovní kategórie c ≥ 3
• Všetky očakávané hodnoty Eij ≥ 0,25
Excel pre test dobrej zhody• Pripraviť si frekvenčnú tabuľku aktuálnych a očakávaných
početností
• Bunka (fx) > kategória štatistické (funkcie) > CHITEST• Zadať stĺpec aktuálnych počtov a stĺpec očakávaných počtov• Existuje rozdiel medzi tým, koľko pacientov skutočne
preferovalo daný typ odpovede (úroveň kategorickej premennej) a tým, koľko sme očakávali, pri rovnakej preferencii (35)?
• Je tento rozdiel dosť veľký na to, aby sme urobili štatistický záver (inference), alebo mohol byť tento rozdiel spôsobený náhodnou chybou výberu (random sampling error)?
• Testová štatistika: chí2 = 6,34, df = 3(triedy)-1 =2• Výstup je hodnota pravdepodobnosti P=0,042
Záver príkladu
• Pre danú hodnotu chí2 = 6,34, a df = 2, pri alfa = 0,05, by mala byť pravdepodobnosť získania takejto hodnoty chí2 rovná alebo menšia než 0,05 na to, aby sme to považovali za významný rozdiel (significant difference).
• p = 0,042 .... aký je záver?
• Zamietame nulovú hypotézu, že pozorované rozdiely v preferenciách mohli byť spôsobené náhodnou chybou a prijímame alternatívnu hypotézu, že medzi preferenciami (triedy kategórie=typ odpovede) je signifikantný rozdiel. Preferencie sú rôzne.
Kedy použiť dvojrozmerný chí2 test nezávislosti? “The r (rows) by c (columns) chi-
square tests of independence of the categories in a table ”
• Keď analyzujeme v skutočnosti dve premenné, skupinovú (grupujúcu) premennú a akúkoľvek premennú, v ktorej chceme dané podskupiny porovnať (bivariačná analýza)
• Keď obe premenné sú kategorické, t.j., nominálne alebo ordinálne.
• Keď testujeme, či existuje medzi týmito premennými vzťah (sú asociované) alebo nie (sú nezávislé).
(Pearsonov) chí2 test nezávislosti predstavuje rozšírenie chí2 testu dobrej zhody na analýzu kontingenčnej tabuľky.Príklad:Lekár má podozrenie na neštandardné rozdelenie krvných skupín u pacientov, ktorí majú pooperačné komplikácie. Percentuálny výskyt krvných skupín u nás: krvná skupina A: 43 %, 0: 42 %, B: 11 %, AB: 4 %. Porovnaním populačného rozdelenia krvných skupín s rozdelením u náhodnej vzorky pacientov možno podozrenie lekára potvrdiť (excelovský príklad, list 2).
Podmienky použitia testu nezávislosti
• Náhodný výber• Každé pozorovanie je klasifikované do jednej bunky
tabuľky r x c (resp. 2 x 2)• Analýza nízkych očakávaných početností je
kontroverzná. Použitie aproximačného chí2 testu pre tabuľku 2 x 2 vyžaduje splnenie nasledujúcich podmienok:
• Celkový počet pozorovaných početností n ≥ 20
• Všetky očakávané hodnoty Eij ≥ 5
Nulová hypotéza je nezávislosť riadkových a stĺpcových kategórií (tried).
Ďalšie chí2 testy
• Pre párové proporcie použijeme McNemarov chí2 test
• Mantel-Haenszelov test pre stratifikované 2 x 2 tabuľky pri fixných efektoch
• Zovšeobecnený (generalised) Cochran-Mantel-Haenszelov test – pre stratifikované r x c tabuľky
Exaktné testy• Binomické rozdelenie využívame pre testovanie pravdepodobnosti,
že „r“ pozorovaní z celkového počtu „n“ (r/n) prevýši očakávanú hodnotu
• Pre 0,5 (t.j. šanca 50:50) použijeme znamienkový test (Exact sign test). Nulová hypotéza znie: pozorovaná proporcia nie je odlišná od 0,5.
• Pre očakávanú hodnotu inú než 0,5 použijeme binomický test – inak tiež test jednej proporcie (The single proportion test (binomial test)).
• Fisherov exaktný test použijeme, ak v tabuľke 2 x 2:keď je ktorákoľvek očakávaná hodnota menšia ako 1 alebo 20% všetkých očakávaných hodnôt je menších alebo rovných
5.Podmienka: riadkové a stĺpcové súčty sú fixné (často kontroverzné)
• Zovšeobecnený Fisherov test (The generalised Fisher exact test - The Fisher-Freeman-Halton test) použijeme pre tabuľku r x c.
• Pre párované proporcie použijeme Liddellov test
Príklad pre chí2 test nezávislosti
• Výskumná otázka: Sú preferencie odpovedí pacientov rovnaké u mužov aj u žien? Inými slovami, sú preferencie závislé na pohlaví?
• Otázka v dotazníku: Čo považujete za najväčší nedostatok v zdravotnej starostlivosti? Kvalitu, dostupnosť alebo je odpoveď „neviem“?
(zvoľte jednu odpoveď)
Druhá kategória je Pohlavie: Muž Žena• Vzorka: 105 náhodne vybraných pacientov po
hospitalizácii v zvolenom zdravotníckom zariadení
Excel pre test nezávislosti• Pripraviť si frekvenčnú tabuľku aktuálnych početností typov
odpovedí pre obe pohlavia. • Zistiť súčty pre riadky a stĺpce.• Dopočítať očakávané početnosti pre obe pohlavia podľa
vzorca (excelovský príklad, list 3).
• kde:Aij = aktuálna početnost v i-tom riadku a j-tom stĺpci
Eij = očakávaná početnost v i-tom riadku a j-tom stĺpcir = počet riadkovc = počet stĺpcov
Yatesova korekcia na spojitosť: odpočíta 0,5 z absolútnej hodnoty každej dvojice v čitateli ( Aij- Eij )-0,5)2
• Bunka (fx) > kategória štatistické (funkcie) > CHITEST
• Zadať pole aktuálnych počtov a pole očakávaných počtov
• Existuje rozdiel medzi mužmi a ženami v skutočnom (aktuálnom) rozložení preferencií (úrovní kategorickej premennej) a tým, koľko by sme očakávali pri podobných preferenciách?
• Je tento rozdiel dosť veľký na to, aby sme urobili štatistický záver o závislosti preferencií na pohlaví, alebo mohol byť tento rozdiel spôsobený náhodnou chybou?
• Testová štatistika: chí2 = 4,85, df = (3-1)*(2-1) =2• Výstup je hodnota pravdepodobnosti P=0,088
Nominálna nezávislosť: Chi2 = 4,851, DF = 2, P = 0,0884Fisher-Freeman-Haltonov exaktný test: P = 0,0884
Testovanie hypotézy
• Ho: Muži a ženy majú rovnaké rozdelenie „preferencií“ t.j. početností odpovedí v kategórii „Hodnotenie nedostatkov v zdravotnej starostlivosti“.
• Ha: Muži a ženy nemajú rovnaké rozdelenie „preferencií“ t.j. početností odpovedí v kategórii „Hodnotenie nedostatkov v zdravotnej starostlivosti“.
• Testujeme na hladine významnosti alfa = 0,01
Interpretácia výsledku testovania
• Pozrieť na hodnotu pravdepodobnosti, ktorá je „prepojená“ s hodnotou testovej štatistiky (chí2 = 4,85) p = 0,088
• Záver: Zamietame alebo akceptujeme nulovú hypotézu na hladine významnosti alfa = 0,01?
• Akceptujeme nulovú hypotézu a zamietame alternatívnu. Medzi mužmi a ženami nie je významný rozdiel v termínoch preferencií t.j. početností odpovedí v kategórii „Hodnotenie nedostatkov v zdravotnej starostlivosti“.
• Stačí? Nestačí! (Štatistická významnosť nie je klinická/praktická významnosť). Interpretujeme ďalej...preštudovaním konkrétnych početností v bunkách tabuľky. Rozhodnite, ktorou cestou „čítate“ tabuľku (podľa usporiadania oboch kategórií: stĺpce vs. riadky) a popíšte charakter rozdielov medzi podskupinami (pohlaviami). Všímajte si bunky s veľkými rozdielmi medzi aktuálnymi (pozorovanými) a očakávanými hodnotami (percentami).
Interpretácia výsledku z popisnej štatistiky
Záver začíname “spomedzi…/z” a doplníme názov „riadkovej“ kategorickej premennej (typ odpovede) alebo stĺpcovej (pohlavie). Keď čítame po riadkoch, čítame pozdĺž “vnútri-riadkovej” premennej. Keď čítame po stĺpcoch, čítame nadol “vnútri-stĺpcovej“ premennej. Záver: zdá sa, že muži najviac volili „dostupnosť“ a ženy „kvalitu“ (Čítanie nadol stĺpcami) Ďalej, z pacientov, ktorí preferovali kvalitu bolo 40% mužov a 60% žien. Z pacientov, ktorí preferovali dostupnosť bolo 61% mužov a 39% žien. Nerozhodnutých mužov bolo viac (27%) ako nerozhodnutých žien (18%) (Čítanie pozdĺž riadkov)Celkovo sme náhodným výberom pacientov „zabezpečili“ približne rovnaké zastúpenie žien (47,6%) aj mužov (52,4) (pozn. možno overiť znamienkovým testom )