28
Fakultet elektrotehnike i računarstva Sveučilište u Zagrebu Ani Grubišić Hi-kvadrat test i njegove primjene seminarski rad kolegij: Otkrivanje znanja u skupovima podataka prof.dr.sc. Bojana Dalbelo-Bašić Split, veljača 2004.

Hi-kvadrat test i njegove primjene

  • Upload
    dangnhi

  • View
    295

  • Download
    11

Embed Size (px)

Citation preview

Page 1: Hi-kvadrat test i njegove primjene

Fakultet elektrotehnike i računarstva Sveučilište u Zagrebu

Ani Grubišić

Hi-kvadrat test i njegove primjene

seminarski rad

kolegij: Otkrivanje znanja u skupovima podataka prof.dr.sc. Bojana Dalbelo-Bašić

Split, veljača 2004.

Page 2: Hi-kvadrat test i njegove primjene

1

Sadržaj:

1. UVOD ........................................................................................................................... 2 2. TABLICE KONTIGENCIJE ............................................................................................... 3 3. DEFINICIJA 2χ ............................................................................................................. 3

4.1. Jedan uzorak ........................................................................................................ 5 4.2. Dva ili više nezavisnih uzoraka.......................................................................... 11 4.3. Dva nezavisna uzorka (McNemarov test) .......................................................... 14

5. NEKI OSNOVNI UVJETI ZA UPOTREBU HI-KVADRAT TESTA.......................................... 15 6. PRIMJER PRIMJENE HI-KVADRAT TESTA...................................................................... 16 7. ZAKLJUČAK................................................................................................................ 26 8. LITERATURA .............................................................................................................. 27

Page 3: Hi-kvadrat test i njegove primjene

2

1. Uvod

Svijet u kojem živimo i koji želimo razumjeti pun je različitosti i neodređenosti, što otvara put za granu znanosti zvanu Statistika. Statistika nas uči kako donositi ispravne zaključke i odluke u svijetu neodređenosti. U svakodnevnom životu prikupljamo mnoštvo podataka. Statistika nam daje metode za njihovo organiziranje i sažeto prikazivanje te izvlačenje zaključaka na osnovu informacija sadržanih u tim podacima. Računala nam omogućavaju lakše pohranjivanje podataka koje bismo inače bacili. Unutar svih tih podataka skriva se potencijalno korisna informacija, koja se rijetko iskorištava. Posao znanstvenika jest razumijeti podatke, otkriti uzorke koji određuju kako funkcionira fizički svijet, te ih zatim pretvoriti u teorije koje se mogu koristiti i za predviđanje onoga što će se dogoditi u novim situacijama. Inteligentno analizirani podaci vrijedan su izvor prihoda. Oni mogu dovesti do novih otkrića i komercijalnih prednosti. Da bi se došlo do značajnih rezultata, važno je poznavati svoje podatke. Dakle, prvo što trebamo napraviti s bilo kojim skupom podataka je pogledati ga i prikazati na različite načine. Da li prikaz tih podataka daje normalnu distribuciju, da li ima istaknutih elemenata, da li ima više vrhunaca,…?

U ovom radu bit će opisan jedan od statističkih testova prilagodbe - χ2-test. Hi-kvadrat test spada u grupu statističkih testova koji ne uključuju usporedbe. Uvaj test se koristi za ispitivanje nezavisnosti (eng. indepedence) dvije varijable ili faktora, slučajnosti (eng. randomness), te dobrote prilagodbe (eng. goodness-to-fit). Na kraju rada, nakon definiranja χ2-testa i opisa načina primjene na različitim uzorcima, bit će opisana primjena ovog testa na podacima vezanima za testiranje grupe od 41 studenta na dvijema grupama testova. Dobiveni podaci bit će analizirani upotrebom programskog paketa Statistica 6.0., te će na temelju dobivenih izračuna hi-kvadrat testa biti doneseni zaključci o povezanost između dvije grupe testova, tj. o vjerojatnosti povezanosti.

Page 4: Hi-kvadrat test i njegove primjene

3

2. Tablice kontigencije

Pretpostavimo da u određenom skupu mogućih događaja (vidi Tablicu 1), događaji E1, E2, E3, …, Ek se pojavljuju u frekvencijama pojavljivanja fo1, fo2, fo3, …, fok (opažene frekvencije), a prema pravilima vjerojatnosti frekvencije pojavljivanja su ft1, ft2, ft3, …, ftk (očekivane frekvencije).

Tablica 1. Događaj E1 E2 E3 … Ek Opažena frekvencija fo1 fo2 fo3 … fok Očekivana frekvencija ft1 ft2 ft3 … ftk

Tablica 1. u kojoj su opažene frekvencije prikazane u jednom retku, naziva se jednosmjerna klasifikacijska tablica. Kako ima k stupaca naziva se i 1 x k tablica. Poopćavanjem dolazi se do dvosmjerne klasifikacijske tablice ili h x k tablice gdje opažene frekvencije zauzimaju h redaka i k stupaca. Ovakve tablice se često nazivaju tablice kontigencije. Svakoj opaženoj frekvenciji u h x k tablici kontigencije odgovara jedna očekivana frekvencija koja se računa prema pravilima vjerojatnosti. Ove frekvencije koje se nalaze u ćelijama tablice kontigencije nazivaju se frekvencije ćelije. Zbroj frekvencija svakog retka ili stupca naziva se marginalna frekvencija. Broj stupnjeva slobode se računa prema formuli: (h-1)(k-1).

3. Definicija 2χ

Postupak nazvan hi-kvadrat test se upotrebljava u većini slučajeva ako se radi o kvalitativnim podacima ili ako tim podacima distribucija značajno odstupa od normalne. Već u početku treba naglasiti da se hi-kvadrat test računa samo s frekvencijama pa u račun nije dopušteno unositi nikakve mjerne jedinice. Osnovni podaci istraživanja mogu biti i mjerne vrijednosti, ali u hi-kvadrat unose se samo njihove frekvencije. Hi-kvadrat test je vrlo praktičan test koji može osobito poslužiti onda kad želimo utvrditi da li neke dobivene (opažene) frekvencije odstupaju od frekvencija koje bismo očekivali pod određenom hipotezom. Kod ovog testa katkada tražimo postoji li povezanost između dvije varijable i on pokazuje vjerojatnost povezanosti. Možemo pretpostaviti da neka teorijska raspodjela dobro opisuje opaženu raspodjelu frekvencija. Da bismo tu pretpostavku (hipotezu) provjerili, primjenjujemo ovaj test. Rezultati dobiveni u uzorcima ne podudaraju se uvijek s teoretskim rezultatima koji se očekuju prema pravilima vjerojatnosti. Npr. iako prema teoriji očekujemo da kad god bacimo valjan novčić 100 puta dobijemo 50 „glava“ i 50 „pisama“, rijetko kada se dobije ovakav rezultat.

Page 5: Hi-kvadrat test i njegove primjene

4

Često želimo znati da li se opažene frekvencije značajno razlikuju od očekivanih frekvencija. Ta razlika se računa se prema sljedećoj formuli:

∑ −=

t

t

fff 2

02 )(χ (1)

pri čemu f0 znači opažene frekvencije, a ft očekivane (teoretske) frekvencije, tj. frekvencije koje bismo očekivali pod nekom određenom hipotezom, te vrijedi:

∑ ∑ == Nff to - ukupna frekvencija (2) Izraz ekvivalentan formuli (1) je sljedeći:

∑ −= Nff

t

o2

2χ (3)

Broj stupnjeva slobode ν definiran je kao broj nezavisnih varijabli uključenih u izračun 2χ . Nalazimo ga na sljedeći način: ν = broj razreda – broj ograničenja. Razmotrimo pokus koji daje n opaženih frekvencija fi. Želimo li provjeriti hipotezu da ta opažanja slijede neku teorijsku raspodjelu, najprije izračunamo očekivane teorijske vrijednosti fti. Opažene frekvencije, naravno, odstupaju od teorijskih, a mi želimo donijeti odluku možemo li ta odstupanja pripisati slučaju. Nul-hipoteza je: "Opažanja slijede teorijsku raspodjelu". Nul-hipoteza je hipoteza koju testiramo i označavamo je s H0. Ona se iskazuje kao nedostatak različitosti ili učinka. Nul-hipoteza se odbacuje ako test značajnosti pokaže da su podaci nekonzistentni s nul-hipotezom. Granična vrijednost je vrijednost testa za koje se nul-hipoteza odbacuje. Značajnost testa α je vjerojatnost odbacivanja nul-hipoteze kada je istinita, tj. vjerojatnost da su promatrani podaci ekstremniji od stvarnih rezultata kad je nul-hipoteza istinita. Mala značajnost testa znači da su podaci toliko ekstremni da su nevjerojatni pod ovom nul-hipotezom. Značajnost testa nije vjerojatnost da je nul hipoteza lažna. Mala značajnost testa ne znači da postoji mala vjerojatnost da je nul-hipoteza istinita. Nul-hipoteza se odbacuje za značajnost testa 0.05 ili 5%. Najčešće upotrebljavamo hi-kvadrat test u ovim slučajevima:

1. Kad imamo frekvencije jednog uzorka pa želimo ustanoviti odstupaju li te frekvencije od frekvencija koje očekujemo uz neku hipotezu.

2. Kad imamo frekvencije dvaju ili više nezavisnih uzoraka te želimo ustanoviti razlikuju li se uzorci u opaženim svojstvima.

3. Kad imamo frekvenciju dvaju zavisnih uzoraka, koji imaju dihotomna svojstva, te želimo ustanoviti razlikuju li se uzorci u mjernim svojstvima, tj. je li došlo do promjene.

Page 6: Hi-kvadrat test i njegove primjene

5

4.1. Jedan uzorak Prvi primjer: 48 liječnika iznijelo je mišljenje o tome treba li ženi u porodu dati analgeziju. Dobiveni su odgovori: 26 odgovora „da“, 12 odgovora „ne znam“ i 10 odgovora „ne“. Postavit ćemo „nul-hipotezu“: nema razlike između dobivenih odgovora i slučajno raspoređenih odgovora. Kad bi odgovori bili dani potpuno slučajno, svaki bi od njih imao jednaku vjerojatnost pa bismo svaki odgovor očekivali 48/3=16 puta. Dakle, očekivana frekvencija za svaki odgovor bila bi 16. Prikažimo rezultate u tablici:

„Da“ „Ne znam“ „Ne“ Ukupno f0 26 12 10 48 ft 16 16 16 48

Izračunajmo podatke potrebne za formulu (1):

f0 ft f0 - ft (f0 - ft)2 t

t

fff 2

0 )( −

26 16 10 100 100/16=6,25 12 16 -4 16 16/16=1 10 16 -6 36 36/16=2,25 ∑=9,50

50,9)( 2

20 ==−∑ χ

t

t

fff

Princip interpretacije dobivenog rezultata 2χ : kad ne bi našli nikakve razlike između opažanih i očekivanih frekvencija, izraz 2χ bi bio 0. što su razlike između opažanih i očekivanih frekvencija veće, to je veći i definitivni izraz 2χ . Prema tome, što je hi-kvadrat manji, to je vjerojatnije da treba prihvatiti postavljenu hipotezu, a što je hi-kvadrat veći, to je vjerojatnije da postavljenu hipotezu treba odbaciti, jer se opaženi rezultati znatno razlikuju od onih koje bismo pod određenom hipotezom očekivali. Tablica graničnih vrijednosti 2χ pokazuje do koje vrijednosti (uz određeni broj stupnjeva slobode) smatramo da je hi-kvadrat još uvijek dovoljno visok, a da bismo mogli odbaciti hipotezu, odnosno, koliko mora najmanje iznositi hi-kvadrat pa da odbacimo hipotezu. Kao praktično pravilo može poslužiti činjenica da centralna vrijednosti hi-kvadrata uz neki stupanj slobode iznosi otprilike toliko koliko imamo stupnjeva slobode. Prema tome, nul-hipotezu sigurno možemo prihvatiti (bez uvida u tablicu hi-kvadrata) ako je dobiveni hi-kvadrat manji ili jednak broju stupnjeva slobode.

Page 7: Hi-kvadrat test i njegove primjene

6

Tablica 2. Tablica graničnih vrijednosti 2χ

Tumačenje postanka tablice graničnih vrijednosti 2χ : Zamislimo da smo 100 ispravnih novčića bacili u zrak (ili 1 novčić 100 puta) i da smo dobili 46 „glava“ i 54 „pisma“. Očekivane su frekvencije: 50 „glava“ i 50 „pisama“. Izračunamo li hi-kvadrate dobit ćemo:

Page 8: Hi-kvadrat test i njegove primjene

7

f0 ft f0 - ft (f0 - ft)2

t

t

fff 2

0 )( −

Glava 46 50 -4 16 0,32 Pismo 54 50 4 16 0,32

64,0)( 2

20 ==−∑ χ

t

t

fff

Budući da je dovoljno znati koliko je palo „glava“ pa da time odmah znamo koliko je palo „pisama“ (jer su obje ćelije zavisne jedna od druge), to je broj stupnjeva slobode jednak 1. Na Slici 1. Prikazana je distribucija hi-kvadrata uz različite stupnjeve slobode. One vrijednosti hi-kvadrata koje toliko jako odstupaju od očekivanog da je njihovo slučajno pojavljivanje moguće samo u 1% ili u 5% slučajeva, možemo smatrati tolikim odstupanjem da s pravom možemo pretpostaviti da vjerojatno nisu slučajne. Na Slici 1. Uz krivulju distribucije hi-kvadrata uz 1 stupanj slobode označena je na apscisi 5%-tna granica iza koje površina krivulje nadesno iznosi 5%. Kako se vidi iz slike (i čitamo iz tablice graničnih vrijednosti) ta je vrijednost 3,84.

Slika 1. Distribucija uzoraka hi-kvadrata uz različite stupnjeve slobode

Ako umjesto 100 novčića bacimo 100 igraćih kockica, također možemo promatrati koliko odstupanje imamo kod svakog broja od 1 do 6, prema očekivanim frekvencijama (1/6 kockica morala bi pasti na broj 1, 1/6 na broj 2, itd.). u tom slučaju imamo 6-1=5 stupnjeva slobode. Velikom brojem bacanja dobili bi distribuciju hi-kvadrata prikazanu na Slici 1. uz 5 stupnjeva slobode. Kad imamo samo jednu varijablu s jednim nizom rezultata, broj stupnjeva slobode računa se prema formuli N-1, pri čemu N znači ukupan broj ćelija (a ne ukupan broj frekvencija). U primjeru s liječnicima imamo samo tri ćelije („da“, „ne znam“, „ne“), broj stupnjeva slobode je 3-1=2. želimo li testirati značajnost na razini 5%, očitat ćemo u tablici graničnu vrijednost hi-kvadrat uz 2 stupnja slobode, a na razini značajnosti P=0,05. Kako se iz tablice vidi, granična vrijednost je 5,991. Kako je izračunata vrijednost od 9,50 veća od 5,991 zaključujemo da treba odbaciti postavljenu hipotezu, tj. dobiveni se odgovori statistički značajno razlikuju od odgovora koje bismo očekivali kad bi oni bili dani posve slučajno.

Page 9: Hi-kvadrat test i njegove primjene

8

Prednost hi-kvadrata je da možemo postaviti hipotezu kakvu želimo. Na primjer, možemo postaviti hipotezu da bismo u nekom slučaju morali očekivati „normalnu raspodjelu“, što će se pokazati u sljedećem primjeru. Drugi primjer: S pomoću jednog testa testiramo 200 ljudi. Test je takve prirode da daje samo tri kategorije rezultata: A=slab, B=prosječan, C=dobar. Kao rezultat mjerenja dobijemo ove frekvencije:

A B C f0 40 110 50

Odstupa li taj rezultat značajno od rezultata koje bismo očekivali da je svojstvo normalno raspodijeljeno među ispitanicima? Budući da imamo tri kategorije, najopravdanije bi bilo pretpostaviti da bi – po toj hipotezi – trebalo biti 50% prosječnih, a po 25% loših i dobrih:

A B C ft 50 100 50

Račun će izgledati ovako:

f0 ft f0 - ft (f0 - ft)2 t

t

fff 2

0 )( −

40 50 -10 100 2 110 100 10 100 1 50 50 0 0 0

00,3)( 2

20 ==−∑ χ

t

t

fff

Taj broj je manji od 5,991 pa ćemo prihvatiti hipotezu i zaključiti da se dobiveni rezultati ne razlikuju statistički značajno od onih koje bismo očekivali pod pretpostavkom da je mjereno svojstvo normalno distribuirano u skupini. Postoji mogućnost da neku očekivanu frekvenciju već unaprijed znamo jer je ona poznata u populaciji. Treći primjer: Možemo ispitati da li se uzorak u kojem imamo 50 ljudi i to 40 s tamnom kosom (80%) i 10 sa svjetlom kosom (20%), značajno razlikuje od omjera koji je poznat u nekoj populaciji, tj. Da 75% ljudi ima tamnu kosu, a 25% svijetlu kosu. Imamo sljedeću tablicu:

Tamna kosa Svijetla kosa Ukupno f0 40 10 50 ft 37,5 12,5 50

Izračunajmo hi-kvadrat:

Page 10: Hi-kvadrat test i njegove primjene

9

f0 ft f0 - ft (f0 - ft)2 t

t

fff 2

0 )( −

40 37,5 2,5 6,25 0,17 10 12,5 -2,5 6,25 0,50

67,0)( 2

20 ==−∑ χ

t

t

fff

Broj stupnjeva slobode je 2-1=1. Dobiveni hi-kvadrat znatno je manji od granične vrijednosti 3,84 pa zaključujemo da naš uzorak ne odstupa statistički značajno od stvarne proporcije tamne i svijetle kose u populaciji. Napomena: Kad imamo više od 2 ćelije, ako je više od 20% očekivanih frekvencija manje od 5, treba spajati susjedne ćelije zajedno. Kad radimo samo s 2 ćelije, većina statističara smatra da ne smije ni jedna očekivana frekvencija biti manja od 5. Četvrti primjer: Uzmimo da smo analizirali nesreće kod 398 ljudi u jednom poslu i našli da su one među tim ljudima raspoređene kao što je prikazano u Tablici 3. Zanima nas da li su nesreće među tim ljudima raspoređene prema „slučaju“, tj. prema zakonu „rijetkih događaja“ (to je tzv. Poissonova raspodjela). Poissonova se raspodjela može izračunati ovako:

1. Ukupan broj nesreća podijelimo brojem ljudi i dobijemo prosječan broj nesreća; 2. izračunamo logaritam iz broja ljudi; 3. prosječan broj nesreća (1) pomnožimo s 0,4343; 4. izvršimo operaciju (2)-(3); 5. izračunamo antilogaritam izraza pod (4). Tako dobijemo frekvenciju ljudi s 0

nesreća; 6. izvedemo operaciju (5)*(1) i tako dobijemo frekvenciju ljudi s 1 nesrećom; 7. (6)*(1)/2 je broj ljudi s 2 nesreće; (6)*(1)/3 je broj ljudi s 3 nesreće; (6)*(1)/4 je

broj ljudi s 4 nesreće;…

Tablica 3. Frekvencija ljudi s različitim brojem nesreća Broj nesreća Broj ljudi 0 14 1 37 2 76 3 70 4 64 5 53 6 31 7 19 8 14 9 9 10 5 11 5 12 1 N=398

Page 11: Hi-kvadrat test i njegove primjene

10

Ako ovako izračunamo Poissonovu raspodjelu, dobit ćemo očekivane frekvencije prikazane u Tablici 4:

Tablica 4. Očekivana frekvencija ljudi s različitim brojem nesreća

Broj nesreća Broj ljudi 0 8,12 1 31,59 2 61,44 3 79,67 4 77,48 5 60,28 6 39,08 7 21,72 8 10,56 9 4,59 10 1,77 11 0,63 12 0,20 13 0,06 14 0,02 15 0,01 ∑=397,19

Kontrola rezultata sastoji se u tome da suma očekivanih (teoretskih) frekvencija (uz dopuštene manje razlike zbog zaokruživanja decimalnih brojeva) mora odgovarati sumi opaženih frekvencija. Izračunajmo hi-kvadrat:

Broj nesreća f0 ft f0 - ft (f0 - ft)2 t

t

fff 2

0 )( −

0 14 8,12 5,88 34,57 4,26 1 37 31,59 5,41 29,27 0,93 2 76 61,44 14,56 211,99 3,45 3 70 79,67 -9,67 93,51 1,17 4 64 77,48 -13,48 181,71 2,35 5 53 60,28 -7,28 53,00 0,88 6 31 39,08 -8,08 65,29 1,67 7 19 21,72 -2,72 7,40 0,34 8 14 10,56 3,44 11,83 1,12 9 i više 20 7,25 12,75 162,56 22,42

59,38)( 2

20 ==−∑ χ

t

t

fff

Page 12: Hi-kvadrat test i njegove primjene

11

Vidljivo je da su u tablici spojeni rezultati od 9. razreda nadalje jer kod te vrste hi-kvadrat računa statističari zahtijevaju da ni jedna očekivana frekvencija ne bude manja od 5. U testiranju Poissonove raspodijele broj stupnjeva slobode računa se po principu: broj razreda - 2. (Jedan „stupanj slobode“ izgubljen je na zajednički N kod opažene i teoretske krivulje, a drugi na zajedničku aritmetičku sredinu.) U ovom primjeru imamo 10-2=8 stupnjeva slobode. Iz tablice hi-kvadrata možemo očitati da uz 8 stupnjeva slobode granična vrijednost hi-kvadrat iznosi (na razini slučajnosti 5%) 15,507. Kako je dobiveni hi-kvadrat veći odbacujemo nul-hipotezu i zaključujemo da vrlo vjerojatno (tj. uz rizik od 5%) ova distribucija nesreće nije Poissonova distribucija.

4.2. Dva ili više nezavisnih uzoraka Prvi primjer: U jednoj tvornici provedena je anketa među 23 radnika i 26 radnica te je ispitivan stav prema liječniku u ambulanti. Iz dobivenih odgovora moglo se zaključiti je li stav prema liječniku u cjelini „pozitivan“ ili „negativan“. Budući da je liječnik u toj ambulanti bila žena, postavljeno je pitanje razlikuju li se muškarci od žena u stavu prema toj liječnici. Dobiveni su ovi rezultati:

Muškarci (N=23) Pozitivan stav 14 Negativan stav 9 Žene (N=26) Pozitivan stav 9 Negativan stav 17

Najprije ćemo unijeti rezultate u tzv. 2*2 tablicu u kojoj će apscisa predstavljati jednu varijablu (stav), a ordinata drugu varijablu (spol):

Stav prema liječniku Negativan Pozitivan Ukupno Muškarci 9 14 23 Žene 17 9 26 Spol

Ukupno 26 23 49 Pod pretpostavkom da nema značajne razlike između muškaraca i žena, proporcija negativnog (ili pozitivnog) stava morala bi biti jednaka kod muškaraca i kod žena. Budući da u čitavoj grupi imamo 26 ljudi s negativnim stavom, znači da je proporcija tih ljudi u uzorku 26/49, pa stoga frekvencija muškaraca s negativnim stavom treba biti 23*26/49 (jer imamo ukupno 23 muškarca), a frekvencija žena s negativnim stavom 26*26/49. dakle, očekivane frekvencije u svakoj ćeliji dobivamo tako da pomnožimo sumu reda sa sumom stupca i podijelimo totalnom sumom frekvencija. Na taj ćemo način dobiti očekivane frekvencije:

Stav prema liječniku Negativan Pozitivan Ukupno Muškarci 23*26/49=12,2 23*23/49=10,8 23,0 Žene 26*26/49=13,8 26*23/49=12,2 26,0 Spol

Ukupno 26,0 23,0 49,0

Page 13: Hi-kvadrat test i njegove primjene

12

Većina statističara preporučuje da uvijek kad radimo s tablicama kontigencije, a u bilo kojoj ćeliji imamo očekivanu frekvenciju manju od 5, upotrijebimo tzv. Yates-ovu korekciju koja se sastoji u tome da se za 0,5 smanji svaka opažena frekvencija koja je veća od očekivane, a za 0,5 poveća svaka opažena frekvencija koja je manja od očekivane. Drugim riječima, svaka se razlika između očekivane i opažene frekvencije smanji za 0,5. Tada se hi-kvadrat računa prema sljedećoj formuli:

∑−−

=t

t

fff 2

02 )5.0(χ (4)

Primijenimo li Yates-ovu korekciju na ovaj primjer, računat ćemo ovako:

f0 ft f0 - ft (f0 - ft)2 t

t

fff 2

0 )( −

9,5 12,2 -2,7 7,29 0,598 13,5 10,8 2,7 7,29 0,675 16,5 13,8 2,7 7,29 0,528 9,5 12,2 -2,7 7,29 0,598

399,2)( 2

20 ==−∑ χ

t

t

fff

U tablicama broj stupnjeva slobode je jednak (broj redaka-1)*(broj stupaca-1). U ovom primjeru je broj stupnjeva slobode (2-1)*(2-1)=1*1=1. iz tablice hi-kvadrat možemo očitati da je granična vrijednost hi-kvadrat uz 1 stupanj slobode na razini značajnosti od 5% 3,841. budući da je izračunati hi-kvadrat manji, prihvatit ćemo hipotezu, tj. zaključit ćemo da se muškarci ne razlikuju statistički značajno od žena u stavu prema konkretnom liječniku. Drugi primjer: Medicinski centar je izvršio analizu oboljenja od gripe u poduzećima gdje su neki zaposlenici bili cijepljeni 11 mjeseci prije epidemije, neki neposredno prije epidemije, a neki nisu bili uopće cijepljeni. Dobiveni su sljedeći rezultati:

Oboljeli Nisu oboljeli Necijepljeni 402 2497 2899 Cijepljeni 11 mjeseci prije epidemije 378 3789 4167 Cijepljeni neposredno prije epidemije 131 2009 2140 911 8295 9206

Izračunamo li već spomenutim postupkom očekivane frekvencije, možemo postaviti sljedeću tablicu izračunavanja hi-kvadrata:

Page 14: Hi-kvadrat test i njegove primjene

13

f0 ft f0 - ft (f0 - ft)2 t

t

fff 2

0 )( −

402 286,9 115,1 13248,01 46,176 2497 2612,1 -115,1 13248,01 5,072 378 412,3 -34,3 1176,49 2,853 3789 3754,7 34,3 1176,49 0,313 131 211,8 -80,8 6528,64 30,825 2009 1928,2 80,8 6528,64 3,386

625,88)( 2

20 ==−∑ χ

t

t

fff

Broj stupnjeva slobode je (2-1)*(3-1)=1*2=2. dobiveni hi-kvadrat je znatno veći od 5,991, pa zaključujemo da postoji statistički značajna razlika u frekvenciji oboljenja između te tri grupe. Takva informacija nije dovoljna, jer treba znati u čemu se sastoji razlika: jesu li cijepljeni obolijevali manje ili više od necijepljenih? Budući da su veličine skupina u svakoj kategoriji dosta različite, to je interpretiranje rezultata najlakše provesti ako vrijednosti u tablici pretvorimo u postotke. Pretvaranje u postotke treba obaviti u onom „smjeru“ koji ispitujemo: budući da nas zanima da li više obolijevaju necijepljeni od cijepljenih, pretvorit ćemo naše frekvencije u tablici u postotke tako da će nam ukupne kategorije „necijepljenih“, „cijepljenih prije 11 mjeseci“ i „cijepljenih neposredno prije“ iznositi 100%. Nova tablica će izgledati ovako:

Oboljeli Nisu oboljeli Necijepljeni 13,9 86,1 100 Cijepljeni 11 mjeseci prije epidemije

9,1 90,9 100

Cijepljeni neposredno prije epidemije

6,1 93,9 100

Sada se vidi da je najmanji postotak oboljelih među cijepljenima neposredno prije epidemije, a najveći među necijepljenima, pa je zaključak sljedeći: Postoji statistički značajna razlika u frekvenciji oboljenja između cijepljenih i necijepljenih, s tim da među cijepljenima ima najmanje oboljelih. Napomena: Ova tablica govori da postoje statistički značajne razlike u frekvencijama među pojedinim grupama. Međutim, hi-kvadrat ne govori ništa o tome među kojim grupama je razlika značajna. U ovom primjeru značajnost razlike mogla bi se odnositi samo na grupe „necijepljeni“ i „cijepljeni neposredno prije“. Ako nas izričito zanima postoji li statistički značajna razlika između grupe „cijepljeni prije 11 mjeseci“ i grupe „cijepljeni neposredno prije“, morali bismo izračunati poseban hi-kvadrat samo za te dvije skupine. Važna napomena: Hi-kvadrat se može upotrijebiti kod 2*2 tablica uvijek ako je N veći od 40. kad je N manji od 40, ali veći od 20, smijemo računati samo ako ni jedna očekivana frekvencija nije manja od 5. U tablicama kontigencije, kad je broj stupnjeva

Page 15: Hi-kvadrat test i njegove primjene

14

slobode veći od 1, hi-kvadrat test može se računati ako manje od 20% ćelija ima očekivanu frekvenciju manju od 5, a ako ni jedna ćelija nema očekivanu frekvenciju manju od 1. ako taj uvjet nije postignut, moramo neke ćelije spajati zajedno da bi povećali očekivanu frekvenciju.

4.3. Dva nezavisna uzorka (McNemarov test) Ako uspoređujemo rezultate jedne te iste grupe „prije“ i „poslije“, ili uspoređujemo istu grupu u dvije različite aktivnosti, onda vjerojatno postoji korelacija između prvih i drugih rezultata. Primjer: 100 ispitanika je ispitano testom 1 i testom 2. dobiveni su sljedeći rezultati:

Test 2 Nisu zadovoljili Zadovoljili Zadovoljili 5A 55B Test 1 Nisu zadovoljili 25C 15D

Postoji li značajna razlika između rezultata u 1. i 2. testu? Razlike između 1. i 2. testa nalaze se u ćelijama A i D, dok su u ćelijama B i C navedeni samo oni koji su uspjeli ili nisu uspjeli u oba testa. Prema tome, A+D predstavlja totalni broj onih kod kojih se ne slaže uspjeh prvog i drugog mjerenja. Budući da A+D predstavljaju ukupan broj ispitanika koji su promijenili svoj uspjeh, očekivali bismo pod nul-hipotezom da bi se ½(A+D) slučajeva promijenilo u jednom, a ½(A+D) u drugom smjeru. Drugim riječima, pod nul-hipotezom očekivane frekvencije u ćeliji A iznose ½(A+D), a jednako toliko i u ćeliji D. Zanimaju nas samo ćelije A i D (jer B i C pokazuju poklapanje), pa su opažene frekvencije one koje se nalaze u A i D, a očekivane su frekvencije ½(A+D). Dakle,

∑ +

+−

++

+−

=−

=

2

)2

(

2

)2

()(22

202

DA

DAD

DA

DAA

fff

t

tχ (5)

Izvršimo li potrebne računske operacije u gornjoj formuli, dobivamo:

DADA+−

=2

2 )(χ (6)

a uz Yates-ovu korelaciju (ako je (A+D)<20) konačna formula glasi:

DADA+

−−=

22 )1(

χ (7)

Page 16: Hi-kvadrat test i njegove primjene

15

U našem primjeru dobivamo:

05,42081

20)110(

155)1155( 22

2 ==−

=+

−−=χ

Broj stupnjeva slobode je 1. Granična vrijednost hi-kvadrat za 1 stupanj slobode je 3,841, a kako je dobiveni hi-kvadrat veći, odbacit ćemo nul-hipotezu (tj. da nema razlike u težini testova) i zaključiti da razlika postoji, tj. da je drugi test lakši. Napomena: Ako su očekivane frekvencije u ćelijama A i D manje od 5, taj se račun ne može upotrijebiti. Valja uočiti da bi primjena standardnog postupka za izračunavanje očekivanih frekvencija koji inače koristimo kod tablica kontigencije hi-kvadrata (suma reda puta suma stupca, podijeljeno s ukupnom sumom) dala potpuno nelogične i neupotrebljive rezultate. Pretpostavimo da u prijašnjem primjeru nije došlo ni do kakvih promjena između prvog i drugog mjerenja i da je rezultat bio ovakav:

Test 2 Nisu zadovoljili Zadovoljili Zadovoljili 0A 70B 70 Nisu zadovoljili 30C 0D 30 Test 1

30 70 100 Od ukupno 100 ispitanika isti ispitanici koji nisu zadovoljili u prvom testiranju (njih 30), nisu zadovoljili ni u drugom, a također istih 70 ispitanika oba je puta zadovoljilo. Izračunamo li standardnim postupkom očekivane frekvencije, dobili bi ove frekvencije: 21, 49, 9, 21. izračunati hi-kvadrat (uz Yates-ovu korekciju) iznosio bi 95,29, no taj bi rezultat bio potpuno besmislen, jer ništa se nije promijenilo. McNemarov test (ovaj put bez Yates-ove korekcije, jer je u brojniku nula) dao bi naprotiv potpuno točan rezultat: hi-kvadrat=0, tj. nema promjene.

5. Neki osnovni uvjeti za upotrebu hi-kvadrat testa

Hi-kvadrat je stvarno vrlo jednostavan test, jer je njegova logika jasna, a izračunavanje vrlo jednostavno. No upravo se u tome vjerojatno i krije opasnost da se njegova jednostavnost precijeni. Kod hi-kvadrat testa uvijek je potrebno dobro promisliti kako ćemo rezultate prikazati u tablici. Ovaj test posjeduje tzv. aditivna svojstva, a to znači da imamo pravo zbrojiti nekoliko hi-kvadrata iz istih istraživanja, i o značajnosti dobivenog rezultata zaključivati iz tablice, s tim da zbrojimo i stupnjeve slobode. Pri takvim situacijama zbrajanja rezultata hi-kvadrata treba paziti da se zbroje svi raspoloživi rezultati (a ne samo pozitivni).

Page 17: Hi-kvadrat test i njegove primjene

16

Uvjeti koji moraju biti ispunjeni da bi se smio računati hi-kvadrat test: 1. hi-kvadrat test može se računati samo s frekvencijama 2. Suma očekivanih frekvencija mora biti jednaka sumi opaženih frekvencija 3. Kad god u hi-kvadrat testu radimo s nekim svojstvom koje se pojavilo ili se nije

pojavilo, treba u računu staviti i frekvencije u kojima se to svojstvo nije pojavilo. 4. Frekvencije u pojedinim ćelijama moraju biti u tom smislu nezavisne da svaka

frekvencija u pojedinoj ćeliji mora pripadati nekom drugom individuumu. Npr. ne smijemo u tablicu unositi nekoliko odgovora jednog ispitanika.

5. Nijedna očekivana frekvencija ne smije biti previše mala. U tom se treba pridržavati ovih pravila:

a. Kad imamo više od dvije ćelije, ako je više od 20% očekivanih frekvencija manje od 5, treba spajati susjedne ćelije. Kad radimo samo s dvije ćelije, ne smije ni jedna očekivana frekvencija biti manja od 5.

b. Kod 2*2 tablica hi-kvadrat smije se upotrijebiti uvijek ako je N veći od 40. ako je N manji od 40, ali veći od 20, ne smije ni jedna očekivana frekvencija biti manja od 5.

c. U tablicama kontigencije kad je broj stupnjeva slobode veći od 1, hi-kvadrat se smije računati ako manje od 20% ćelija ima očekivanu frekvenciju manju od 5, a ni jedna ćelija manju od 1. ako to nije postignuto treba spajati ćelije u kojima su očekivane frekvencije previše male.

6. Kada postoji samo 1 stupanj slobode, potrebno je provesti korekciju za kontinuitet (Yates-ova korekcija). Ako su razlike između opaženih i očekivanih frekvencija vrlo male tako da primjenom Yates-ove korekcije dobijemo razliku koja je numerički veća (bez obzira na predznak), onda upotreba te korekcije nema opravdanja.

6. Primjer primjene hi-kvadrat testa

Podaci nad kojima se vrši primjena hi-kvadrat testa: Grupa od 41 studenta sudjelovala je u 4 testiranja vezana za poznavanje gradiva iz kolegija Uvod u računarstvo. Prvi test – Test 1 - je bio tradicionalni test na papiru s pitanjima tipa višestrukog odgovora i tipa nadopunjavanja. Taj test je bio podijeljen na tri dijela Test1 RKS, Test1 MSDOS i Test1 BS kojima su redom bila obuhvaćena gradiva nastavnih cjelina Računalo kao sustav, Operacijski sustav MS DOS te Brojevni sustavi i logički sklopovi. Ostala tri testa su se odvijala pomoću Web orijentirane inteligentne autorske ljuske DTE-Sys koja je u svojoj naravi Web orijentirani inteligentni tutorski sustav namjenjen učenju i poučavanju na daljinu. Jedan test – Test 2 - je obuhvaćao gradivo nastavne cjeline Računalo kao sustav, drugi – Test 3 - nastavne cjeline MS DOS i treći – Test 4 – nastavne cjeline Brojevni sustavi i logički sklopovi.

Page 18: Hi-kvadrat test i njegove primjene

17

Svakom je studentu i svakom testu pridijeljena oznaka položenosti tih testova: „d“ – student je položio test i „n“ – student nije položio test. Dobiveni podaci prikazani su u Tablici 5. Prolaznost cjelokupnog testa 1, a time i njegovih segmenata, određena je granicom uspjeha od 50%, a za testove 2, 3 i 4 prolaznost je određena postignućem kategorije 0-1-9. Tako npr. znamo da je student 1 na testu 1 postigao uspjeh 89%, u tom testu je pokazao poznavanje nastavne cjeline Računalo kao sustav, poznavanje nastavne cjeline MS DOS i poznavanje nastavne cjeline Brojevni sustavi i logički sklopovi. Isti student je zadovoljio testove 2 i 3, ali nije zadovoljio test 4 gdje vidimo kontradikciju. Upravo zbog te i sličnih kontradikcija odlučili smo ispitati da li postoji značajna razlika između tih načina testiranja. Postavljamo nul-hipotezu: nema razlike u načinu testiranja, oba načina su jednako teška ili laka. Analiza je provedena uporabom programskog paketa Statistica 6.0. Statistica je alat koji u sebi ima ugrađene komponente za analizu podataka, izradu grafova, omogućava upravljanje bazama podataka. Statistica radi s nekoliko vrsta dokumenata: radne knjige (eng. workbooks), stranice (eng. spreadsheets), izvještaji (eng. reports), grafovi. Koristeći Statisticu napravljeni su 2D-histogrami koji predstavljaju grafički prikaz distribucije frekvencije odabrane varijable (ili više njih). Visina stupaca proporcionalna je s frekvencijama pojavljivanja neke varijable. Ovaj graf je koristan upravo za usporedbu distribucije varijabli s različitim frekvencijama. Histogrami obogućavaju uspoređivanje opažene i očekivane frekvencije.

Page 19: Hi-kvadrat test i njegove primjene

18

Tablica 5. Test1 bodovi Test1 postotak Test1 RKS Test2 Test 1 MSDOS Test3 Test1 BS Test4

Student 1Student 2Student 3Student 4Student 5Student 6Student 7Student 8Student 9Student 10Student 11Student 12Student 13Student 14Student 15Student 16Student 17Student 18Student 19Student 20Student 21Student 22Student 23Student 24Student 25Student 26Student 27Student 28Student 29Student 30Student 31Student 32Student 33Student 34Student 35Student 36Student 37Student 38Student 39Student 40Student 41

9,75 88,64% d d d d d n8,00 72,73% d d d n d n8,00 72,73% d d n d d d7,88 71,59% d n d d d n7,75 70,45% d d d n n d7,75 70,45% d d d d d d7,50 68,18% d d d n d d6,88 62,50% d d d d n d6,75 61,36% d d d d d d6,50 59,09% d n n d d d6,25 56,82% d d n n d d6,25 56,82% n n d d d d6,00 54,55% d n d d d n5,75 52,27% d d d d d n5,75 52,27% d d d n n d5,50 50,00% d d n d d d5,13 46,59% d n d n d n5,13 46,59% d n n d d n5,00 45,45% d d n d n d4,88 44,32% d d n d d d4,75 43,18% d n n d d d4,50 40,91% d d n d n d4,50 40,91% n d d d d d4,25 38,64% n d n n n d4,00 36,36% n n n d d d3,88 35,23% n d n n d n3,50 31,82% n d n n d d3,50 31,82% d n n n n d3,25 29,55% n d n d n d3,25 29,55% n n n d n n3,00 27,27% n d n d n d3,00 27,27% n d n n n d3,00 27,27% d n n d n d3,00 27,27% n d n n d d2,75 25,00% n d n d n d2,75 25,00% n d d d n d2,00 18,18% n n d n n n2,00 18,18% n d n d n d0,50 4,55% n d n n d d0,50 4,55% n d n n n d0,00 0,00% n n n n n n

Page 20: Hi-kvadrat test i njegove primjene

19

Analiza uporabom programskog paketa Statistica 6.0.: 1. Test1 RKS i Test2 - histogram normalne razdiobe:

Histogram (Sheet1 in podaci1 8v*41c)Test1 RKS = 41*1*normal(x; 1,439; 0,5024)

Test2 = 41*1*normal(x; 1,3171; 0,4711)

Test1 RKS Test2

d n0

5

10

15

20

25

30

35

40

No

of o

bs

Tablice usporedbe rezultata testova Test1 RKS i Test2: - s opaženim frekvencijama:

2-Way Summary Table: Observed Frequencies (ShMarked cells have counts > 10

Test1 RKSTest2

dTest2

nRow

TotalsdnTotals

15 8 2313 5 1828 13 41

- s očekivanim frekvencijama:

2-Way Summary Table: Expected Frequencies (SheMarked cells have counts > 10

Test1 RKSTest2

dTest2

nRow

TotalsdnTotals

15,70732 7,29268 23,0000012,29268 5,70732 18,0000028,00000 13,00000 41,00000

Page 21: Hi-kvadrat test i njegove primjene

20

- hi-kvadrat: 0,7619 Statistics: Test1 RKS(2) x Test2(2

StatisticChi-square df p

Pearson Chi-squareM-L Chi-squareYates Chi-squareFisher exact, one-tailedtwo-tailedMcNemar Chi-square (A/D)(B/C)

,2288117 df=1 p=,63241,2302895 df=1 p=,63131,0196571 df=1 p=,88850

p=,44651p=,74171

4,050000 df=1 p=,04417,7619048 df=1 p=,38274

Iz tablice značajnosti možemo očitati da je granična vrijednost hi-kvadrata uz 1 stupanj slobode na razini značajnosti od 5% 3,841. Kako je 0,7619<3,841, prihvaćamo nul-hipotezu da nema razlike u načinu testiranja putem testova Test1 RKS i Test 2, tj. oba su jednako teška ili laka. 2. Test1 MSDOS i Test3 - histogram normalne razdiobe:

Histogram (Sheet1 in podaci1 8v*41c)Test 1 MSDOS = 41*1*normal(x; 1,6098; 0,4939)

Test3 = 41*1*normal(x; 1,3902; 0,4939)

Test 1 MSDOS Test3

d n0

5

10

15

20

25

30

35

No

of o

bs

Page 22: Hi-kvadrat test i njegove primjene

21

Tablice usporedbe rezultata testova Test1 MSDOS i Test3: - s opaženim frekvencijama:

2-Way Summary Table: Observed FrequenciesMarked cells have counts > 10

Test 1 MSDOSTest3

dTest3

nRow

TotalsdnTotals

10 6 1615 10 2525 16 41

- s očekivanim frekvencijama:

2-Way Summary Table: Expected Frequencies Marked cells have counts > 10

Test 1 MSDOSTest3

dTest3

nRow

TotalsdnTotals

9,75610 6,24390 16,0000015,24390 9,75610 25,0000025,00000 16,00000 41,00000

- hi-kvadrat: 3,0476

Statistics: Test 1 MSDOS(2) x Tes

StatisticChi-square df p

Pearson Chi-squareM-L Chi-squareYates Chi-squareFisher exact, one-tailedtwo-tailedMcNemar Chi-square (A/D)(B/C)

,0256250 df=1 p=,87282,0256721 df=1 p=,87270,0282516 df=1 p=,86652

p=,56862p=1,0000

,0500000 df=1 p=,823063,047619 df=1 p=,08086

Iz tablice značajnosti možemo očitati da je granična vrijednost hi-kvadrata uz 1 stupanj slobode na razini značajnosti od 5% 3,841. Kako je 3,0476<3,841, prihvaćamo nul-hipotezu da nema razlike u načinu testiranja putem testova Test1 MSDOS i Test 3, tj. oba su jednako teška ili laka.

Page 23: Hi-kvadrat test i njegove primjene

22

3. Test1 BS i Test4 - histogram normalne razdiobe:

Histogram (Sheet1 in podaci1 8v*41c)Test1 BS = 41*1*normal(x; 1,439; 0,5024)Test4 = 41*1*normal(x; 1,7317; 0,4486)

Test1 BS Test4

n d0

5

10

15

20

25

30

35

40

No

of o

bs

Tablice usporedbe rezultata testova Test1 BS i Test4: - s opaženim frekvencijama:

2-Way Summary Table: Observed Frequencies (SheeMarked cells have counts > 10

Test1 BSTest4

nTest4

dRow

TotalsdnTotals

8 15 233 15 18

11 30 41 - s očekivanim frekvencijama:

2-Way Summary Table: Expected Frequencies (SheeMarked cells have counts > 10

Test1 BSTest4

nTest4

dRow

TotalsdnTotals

6,17073 16,82927 23,000004,82927 13,17073 18,00000

11,00000 30,00000 41,00000

Page 24: Hi-kvadrat test i njegove primjene

23

- hi-kvadrat: 6,7222 Statistics: Test1 BS(2) x Test4(2) (

StatisticChi-square df p

Pearson Chi-squareM-L Chi-squareYates Chi-squareFisher exact, one-tailedtwo-tailedMcNemar Chi-square (A/D)(B/C)

1,688076 df=1 p=,193861,747004 df=1 p=,18626,8913794 df=1 p=,34511

p=,17315p=,29110

1,565217 df=1 p=,210916,722222 df=1 p=,00952

Iz tablice značajnosti možemo očitati da je granična vrijednost hi-kvadrata uz 1 stupanj slobode na razini značajnosti od 5% 3,841. Kako je 6,7222>3,841, odbacujemo nul-hipotezu da nema razlike u načinu testiranja putem testova Test1 BS i Test 4 te zaključujemo da je Test4 lakši. 4. Izračun hi-kvadrat za svaki test: Test1 RKS Kako je hi-kvadrat=0,6097<3,841 zaključujemo da se kod ovog testa rezultati statistički značajno ne razlikuju od onih koje bismo očekivali kad bi oni bili posve slučajni.

Observed vs. Expected Frequencies (Spreadsheet5Chi-Square = ,6097561 df = 1 p < ,434880

Caseobserved

Test1RKS foexpected

Test1 RKS feO - E (O-E)**2

/EdaneSum

23,00000 20,50000 2,50000 0,30487818,00000 20,50000 -2,50000 0,30487841,00000 41,00000 0,00000 0,609756

Test1 MSDOS Kako je hi-kvadrat=1,9756<3,841 zaključujemo da se kod ovog testa rezultati statistički značajno ne razlikuju od onih koje bismo očekivali kad bi oni bili posve slučajni.

Observed vs. Expected Frequencies (Spreadsheet53)Chi-Square = 1,975610 df = 1 p < ,159855

Caseobserved

Test1 MSDOS foexpected

Test1 MSDOS feO - E (O-E)**2

/EdaneSum

16,00000 20,50000 -4,50000 0,98780525,00000 20,50000 4,50000 0,98780541,00000 41,00000 0,00000 1,975610

Page 25: Hi-kvadrat test i njegove primjene

24

Test1BS Kako je hi-kvadrat=0,6097<3,841 zaključujemo da se kod ovog testa rezultati statistički značajno ne razlikuju od onih koje bismo očekivali kad bi oni bili posve slučajni.

Observed vs. Expected Frequencies (Spreadsheet5Chi-Square = ,6097561 df = 1 p < ,434880

Caseobserved

Test1 BS foexpected

Test1 BS feO - E (O-E)**2

/EdaneSum

23,00000 20,50000 2,50000 0,30487818,00000 20,50000 -2,50000 0,30487841,00000 41,00000 0,00000 0,609756

Test2 Kako je hi-kvadrat=5,4878<3,841 zaključujemo da se kod ovog testa rezultati statistički značajno razlikuju od onih koje bismo očekivali kad bi oni bili posve slučajni.

Observed vs. Expected Frequencies (Spreadsheet5Chi-Square = 5,487805 df = 1 p < ,019150

CaseobservedTest2 fo

expectedTest2 fe

O - E (O-E)**2/E

daneSum

28,00000 20,50000 7,50000 2,74390213,00000 20,50000 -7,50000 2,74390241,00000 41,00000 0,00000 5,487805

Test3 Kako je hi-kvadrat=1,9756<3,841 zaključujemo da se kod ovog testa rezultati statistički značajno ne razlikuju od onih koje bismo očekivali kad bi oni bili posve slučajni.

Observed vs. Expected Frequencies (Spreadsheet5Chi-Square = 1,975610 df = 1 p < ,159855

CaseobservedTest3 fo

expectedTest3 fe

O - E (O-E)**2/E

daneSum

25,00000 20,50000 4,50000 0,98780516,00000 20,50000 -4,50000 0,98780541,00000 41,00000 0,00000 1,975610

Test4 Kako je hi-kvadrat=8,8048<3,841 zaključujemo da se kod ovog testa rezultati statistički značajno razlikuju od onih koje bismo očekivali kad bi oni bili posve slučajni.

Observed vs. Expected Frequencies (Spreadsheet5Chi-Square = 8,804878 df = 1 p < ,003004

CaseobservedTest4 fo

expectedTest4 fe

O - E (O-E)**2/E

daneSum

30,00000 20,50000 9,50000 4,40243911,00000 20,50000 -9,50000 4,40243941,00000 41,00000 0,00000 8,804878

Page 26: Hi-kvadrat test i njegove primjene

25

Zaključak analize rezultata: Cilj ove analize je bio ispitati da li postoji, i ako postoji kolika je, statistički značajna razlika između načina testiranja tradicionalnim testom na papiru kojeg sastavlja učitelj i testiranja putem distribuirane autorske ljuske DTEx-Sys. Analiza je pokazala da su dva od tri testa putem DTEx-Sys-a jednako teška ili laka kao i tradicionalni test. Međutim, pokazalo se da je jedan test, Test4, koji je vezan za gradivo nastavne cjeline Brojevni sustavi i logički sklopovi, lakši od tradicionalnog testa vezanog za istu nastavnu cjelinu. Naknadnom usporedbom pitanja iz ta dva testa, ustanovljeno je da se u tradicionalnom testu ispitivalo proceduralno znanje kod kojeg je bilo potrebno iskazati poznavanje vještina u operativnim zadacima, dok se kod testa 4 ispitivalo samo poznavanje činjenica, tj. deklarativno znanje, što bi moglo objasniti statistički značajnu razliku. Kod tradicionalnih testova pokazalo se da se dobiveni rezultati statistički značajno ne razlikuju od onih koje bismo očekivali kad bi oni bili posve slučajni. Kod testova putem DTEx-Sys-a se pokazalo da se u dva od tri testa rezultati statistički značajno razlikuju od onih koje bismo očekivali kad bi oni bili posve slučajni. Ta činjenica se može objasniti time što je kod tradicionalnog testa u učionici bio prisutan učitelj pa je bila smanjena mogućnost prepisivanja kod studenata, dok su tijekom testiranja putem DTEx-Sys-a studenti bili sami pa je postoji velika vjerojatnost da su međusobno surađivali.

Page 27: Hi-kvadrat test i njegove primjene

26

7. Zaključak

Hi-kvadrat test je vrlo praktičan test koji može osobito poslužiti onda kad želimo utvrditi da li neke dobivene (opažene) frekvencije odstupaju od frekvencija koje bismo očekivali pod određenom hipotezom. Kod ovog testa katkada tražimo postoji li povezanost između dvije varijable i on pokazuje vjerojatnost povezanosti. Kod hi-kvadrat testa smatramo da je razlika između opaženih i teoretskih frekvencija statistički značajna, ako je dobiveni hi-kvadrat veći od granične vrijednosti u tablici hi-kvadrata, uz određeni broj stupnjeva slobode. Kod hi-kvadrat testa i suviše mali hi-kvadrat možemo smatrati da nije slučajno nastao. Glavna opasnost od hi-kvadrat testa je u tome što se on lagano izračunava, ali treba prethodno dobro promisliti što nas zapravo zanima, pa tek onda ići u izračunavanje teoretskih (očekivanih) frekvencije, jer one ovise o hipotezi koju smo postavili.

Page 28: Hi-kvadrat test i njegove primjene

27

8. Literatura

[GERA] Gerard E. Dallal, „The Little Handbook of Statistical Practice“,

http://www.tufts.edu/~gdallal/LHSP.HTM [GRAF2002] Alan Grafen, Rosie Hails, „Simplicity and serenity in advanced statistics:

Modern Statistics of the Life Sciences“, Oxford University Press, 2002. [LANE2001] Lane, D. M., “HyperStat Online Textbook.”,

http://davidmlane.com/hyperstat/index.html [LAWR1990] Lawrence L. Lapin, „Probability and Statistics for Modern Engineering“,

PWS-KENT Publishing Company, Boston, 1990., p630-669 [MIRK2001] B. Mirkin, „Eleven Ways to Look at the Chi-Squared Coefficient for

Contingency Tables“, The American Statistician, 55, no. 2, 111-120 [MURR1992] Murray R. Spiegel, „Schaum's Outline of Theory and Problems of

Statistics“, McGraw-Hill, Inc., 1992., p245-263 [SWIN2001] Swinscow T. D. V., „Statistics at Square One“, University of

Southampton, Copyright BMJ Publishing Group, http://bmj.com/statsbk/