96
1. TEMELJNI STATISTIČKI POJMOVI MEDICINSKI FAKULTET SPLIT Katedra za znanstvenu metodologiju BIOSTATISTIKA za studente medicine 5. izdanje Voditelj Katedre: Prof. dr. Davor Eterović Autori: Davor Eterović, Goran Kardum Akademska godina: 2010/11 Tiskano: srpanj 2010.

1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

  • Upload
    dodung

  • View
    248

  • Download
    9

Embed Size (px)

Citation preview

Page 1: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

1. TEMELJNI STATISTIČKI POJMOVI

MEDICINSKI FAKULTET SPLIT

Katedra za znanstvenu metodologiju

BIOSTATISTIKA za studente medicine

5. izdanje

Voditelj Katedre: Prof. dr. Davor Eterović

Autori: Davor Eterović, Goran Kardum

Akademska godina: 2010/11

Tiskano: srpanj 2010.

Page 2: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI
Page 3: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

1. TEMELJNI STATISTIČKI POJMOVI

Ovaj je tekst izravno namijenjen studentima 2. godine Medicinskog fakulteta Sveučilišta u Splitu, potom općenito medicinarima. Teme uglavnom ne izlaze iz okvira elementarne statistike, s dodatkom metoda procjene dijagnostičkih testova. Ne samo primjeri, već i općenite teme razmatrani su sa stajališta medicinske prakse. Redoslijed i izbor tema nisu standardni. Uvod je tematski širi od uobičajenih i sadrži sve ono što smo smatrali da je zajedničko statističkim analizama u biomedicini. Stil je sažet, tako da studentu nije ostavljeno da sam prosuñuje što je važno. Tekst je praktično orijentiran, s ciljem da student nauči: što, kada i kako. Matematički obojene teme prisutne su u najmanjoj mogućoj mjeri. Predavanja iz Biostatistike na Katedri praćena su praktičnim radom na računalu, gdje studenti rade s podacima koje su dobili anketno, testovima i mjerenjima fizioloških parametara, gdje su sami bili i eksperimentatori i uzorak. Sadržaj se da izložiti u petnaestak sati predavanja, za praktičan rad preporučamo dvostruku satnicu. Ovo prvo izdanje Biostatistike za studente medicine nije prošlo recenziju nezavisnih stručnjaka, niti lektora. D.E.

KOMENTAR 2. IZDANJU: U 2. su izdanju popravljene omaške i nejasne formulacije, te su dodani dijagrami toka odabira statističkih analiza.

KOMENTAR 3. IZDANJU: U 3. su izdanju popunjene 'rupe' u izlaganju odjeljcima 3.4., 4.1 (u značajnijoj mjeri) i 5.1. i 6.2. KOMENTAR 4. IZDANJU: 4. izdanje sadrži male, ali važne promjene odjeljka 2.2 -reinterpretaciju rezultata statističkog testa, u svjetlu bajezijanske statistike. Takoñer je odjeljak 5.1. dopunjen definicijama omjera izglednosti (likelihood ratios), što je koncept koji se sve više koristi u procjenama valjanosti dijagnostičkog testa. KOMENTAR 5. IZDANJU: 5. izdanje sadrži odjeljak o vezi snage statističkih testova i veličine uzorka, analiza čega je neizostavan dio planiranja biomedicinskih istraživanja. Takoñer je odjeljak o uporabi kontigencijskih tablica u medicini dopunjen prikazom ROC analize.

Page 4: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI
Page 5: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

1. TEMELJNI STATISTIČKI POJMOVI

SADRŽAJ

1. TEMELJNI STATISTIČKI POJMOVI (Eterović)........................................................... 1

1.1. Statistički podaci........................................................................................................ 1 1.2. Raspodjele učestalosti................................................................................................ 2 1.3. Deskriptivna statistika ............................................................................................... 5 1.4. Populacija i uzorak .................................................................................................... 8

2. ŠTO JE ZAJEDNIČKO STATISTIČKIM ANALIZAMA (Eterović) ........................... 11 2.1. Vrste statističkih analiza.......................................................................................... 11 2.2. Statističko zaključivanje .......................................................................................... 12 2.3. Filozofija statističkih testova usporedbe.................................................................. 15 2.4. Statistička i biološka (klinička) značajnost ............................................................. 16

3. USPOREDBE METRIČKIH VARIJABLI (Kardum).................................................... 17 3.1 t-test .......................................................................................................................... 17 3.2 Neparametrijske inačice t-testa za dva nezavisna uzorka......................................... 22 3.3 Neparametrijske inačice t-testa za dva zavisna uzorka............................................. 25 3.4 Usporedbe triju ili više varijabli: Analiza varijance (ANOVA)............................... 27 3.5 Neparametrijske inačice ANOVE: nezavisni uzorci ................................................ 32 3.6 Neparametrijske inačice ANOVE: zavisni uzorci .................................................... 33

4. POVEZANOSTI KATEGORIJSKIH VARIJABLI (Kardum)....................................... 38 4.1 Hi-kvadrat test .......................................................................................................... 38

5. UPORABE KONTINGENCIJSKIH TABLICA U MEDICINI (Eterović) .................... 43 5.1. Valjanost dijagnostičkih metoda ............................................................................. 43

6. POVEZANOST METRIČKIH VARIJABLI (Eterović) ................................................ 52 6.1. Funkcije i povezanost .............................................................................................. 52 6. 2. Linearna regresija i korelacija................................................................................. 55

7. PROCJENE POTREBNE VELIČINE UZORAKA (Eterović) ...................................... 70 VJEŽBE IZ BIOSTATISTIKE........................................................................................... 78

Vježba 1: Prikupljanje podataka..................................................................................... 78 Vježba 2: Unos podataka................................................................................................ 80 Vježba 3: Deskriptivna statistika.................................................................................... 81 Vježbe 4 i 5: Usporedbe metričkih i kategorijskih varijabli........................................... 82 Vježba 6: Dijagnostičke vrijednosti testa ...................................................................... 83 Vježba 7: Linearna regresija i korelacija ...................................................................... 84 Dijagrami toka za izbor statističke analize ..................................................................... 86 Pitanja za provjeru znanja............................................................................................... 91

Page 6: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI
Page 7: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

1. TEMELJNI STATISTIČKI POJMOVI

1

1. TEMELJNI STATISTIČKI POJMOVI

1.1. Statistički podaci

Statistika se bavi rezultatima opisa/mjerenja/ankete više jedinki (bioloških ili drugih). Ti se rezultati (podaci) zovu varijable, zato što se mijenjaju od jedinke do jedinke (za razliku od konstanti). Pojam varijabla koristi se najčešće za skup više podataka iste vrste. Dakle, varijabla je sinonim (istoznačnica) za više podataka, ne za pojedini podatak (vrijednost, rezultat). Statističke se analize razlikuju prema vrstama varijabli:

•••• Kategorijske (kvalitativne, nominalne) varijable mogu imati nekoliko vrijednosti, meñu kojima ne postoji prirodan redoslijed. Tipičan je primjer spol, kategorijska varijabla koja ima dvije vrijednosti (muški, ženski). Spol, bračni status (vjenčan, nevjenčan), 5-godišnje preživljenje raka dojke (da, ne) primjeri su binarnih (ili dihotomnih) kategorijskih varijabli. Neke kategorijske varijable (rasa, religiozna pripadnost, nacionalnost, krvna grupe, tip bolesti ili lijeka) su multikategorijske, tj. imaju više od dvije vrijednosti.

•••• Ordinalne (ljestvične) varijable imaju vrijednosti meñu kojima postoji prirodan poredak, ali nije precizno odreñeno koliko se vrijednosti meñusobno razlikuju.

Primjeri su: socijalni sloj (1=siromašan, 2=srednji, 3=bogat), tumorski stadij (1=bez metastaza, 2=lokalne metastaze, 3=metastaze prisutne i u udaljenijim organima i 4=obilje metastaza na mnogim lokacijama), te razni “skorovi” (zbrojevi) kojima se u medicini označava stupanj ozljede, bolesti ili pouzdanosti dijagnoze. Ocjena na usmenom ispitu takoñer je primjer ordinalne varijable, jer je subjektivna.

Ordinalne varijable je najteže statistički analizirati i za njih postoje posebne metode.

•••• Metričkim ili kvantitativnim varijablama možemo pridružiti realne brojeve (ili točke pravca), te ih podvrgavati matematičkim operacijama. To su sve prirodne, fizikalne veličine (prostorne dimenzije, vrijeme, tlak, masa), kao i mnogi biološki parametri (npr. koncentracije raznih sastojaka krvi, volumen pluća, tjelesna visina i masa, dob, tlak krvi).

Metričke varijable mogu imati meñusobno razmaknute, diskretne vrijednosti (npr. broj poroda, broj recidiva bolesti, broj brakova, broj lomova kostiju). Najčešće su vrijednosti metričkih varijabli kontinuirane, bez rupa meñu mogućim veličinama. Ako nije potrebna preciznost (ili ako mjerenja nisu jako točna), kontinuirane se varijable mogu zaokružiti na cjelobrojne vrijednosti. Ponekad se metričke varijable prikazuju na skali bez prirodne nule (npr. temperatura u °C, ocjena na temelju test-ispita), pa ne možemo praviti omjere (npr. 20 °C nije dva puta viša

Page 8: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

2

temperatura od 10 °C). To rješavamo uporabom prirodne skale (temperatura u stupnjevima kelvina, umjesto ocjene-broj bodova na testu). U medicini se često zbog jednostavnosti metričke varijable prikazuju kao kategorijske ili ordinalne. Tako se bolesnici često razvrstavaju u skupine prema graničnim vrijednostima krvnih tlakova u normotoničare (osobe normalnog krvnog tlaka) i hipertoničare (osobe kojima je krvni tlak povišen). Drugi su primjeri dobne skupine.

1.2. Raspodjele učestalosti

U puno raznih podataka nije lako imati direktan uvid. Tu pomažu

1. grafički prikazi 2. opisivanje velikog skupa podataka pomoću karakterističnih vrijednosti.

Kategorijske i ordinalne varijable lako prikazujemo: svakoj vrijednosti varijable pridružena je njena učestalost (frekvencija), tj. broj jedinki koje imaju tu vrijednost (to su npr. brojevi muških i ženskih studenata vaše generacije).

Sve učestalosti varijable čine distribuciju (raspodjelu) te varijable. Grafički distribucije prikazujemo kao stupičaste dijagrame (bar chart) ili tzv. pite (pie chart).

Sljedeći primjer ilustrira prikaze učestalosti raznih vrsta poroda u jednoj klinici. Porodi su razvrstani u 3 kategorije: I: normalni porod, II: porod uz korištenje forcepsa i III: operacijski porod (carski rez). Podatke (učestalosti kategorijske varijable: broj poroda) možemo prikazati na više načina: tabelarno (TABLICA 1.1), pomoću stupčastog dijagrama (SLIKA 1.1) ili u obliku pite (SLIKA 1.2). TABLICA 1.1. Načini poroda 600 beba u jednoj bolnici.

Način poroda Broj beba Postotak Normalni 478 79.7 Forceps 65 10.8 Carski rez 57 9.5 Ukupno 600 100

Učestalostima kategorijske varijable proporcionalne su u stupčastom dijagramu visine stupića, a u piti površine kružnih isječaka.

Page 9: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

1. TEMELJNI STATISTIČKI POJMOVI

3

0

100

200

300

400

500

600

normalni porodi forceps carski rez

SLIKA 1.1. Stupčasti dijagram koji pokazuje načine poroda 600 beba u jednoj bolnici.

normalni

forceps

carski rez

SLIKA 1.2. Dijagram tipa pita koji pokazuje načine poroda 600 beba u jednoj bolnici. I metrički se podaci mogu prikazati kao distribucije, ako ih prvo svrstamo u razrede (inače ne, jer svaku odreñenu točnu vrijednost često ima samo po jedna jedinka). To je smisleno ako metričkih podataka ima dovoljno (recimo više od 100). U suprotnom je broj razreda premali i ne vidi se oblik raspodjele, ili je u pojedinim razredima premalo podataka za pouzdaniju procjenu. Valja paziti da meñu razredima nema preklapanja. Slijedeći primjer ilustrira prikaz distribucije koncentracije hemoglobina u krvi u ispitanica ženskog spola (TABLICA 1.2).

Page 10: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

4

TABLICA 1.2. Vrijednosti hemoglobina (g/100 mL) u 70 žena

10.2 13.7 10.4 14.9 11.5 12.0 11.0 13.3 12.9 12.1 9.4 13.2 10.8 11.7 10.6 10.5 13.7 11.8 14.1 10.3 13.6 12.1 12.9 11.4 12.7 10.6 11.4 11.9 9.3 13.5 14.6 11.2 11.7 10.9 10.4 12.0 12.9 11.1 8.8 10.2 11.6 12.5 13.4 12.1 10.9 11.3 14.7 10.8 13.3 11.9 11.4 12.5 13.0 11.6 13.1 9.7 11.2 15.1 10.7 12.9 13.4 12.3 11.0 14.6 11.1 13.5 10.9 13.1 11.8 12.2

Prvo valja uočiti najmanju i najveću vrijednosti metričke varijable (dvije masno tiskane vrijednosti u gornjoj tablici), odnosno ukupni raspon podataka. Uputno je zaokružiti najmanju i najveću vrijednost na cijele brojeve, te tu razliku podijeliti s brojem razreda. Tako dobivamo osnovni distribucijski interval. Ugrubo, uglavnom se prikazuje 5-20 razreda, ovisno o veličini uzorka. U ovom se primjeru možemo odlučiti na interval od 1 g/100 mL, čime dobivamo 8 razreda. Nakon toga prebrojimo (mi ili računalo) koliko podataka ima u pojedinom razredu, što je prikazano u TABLICI 1.3.

TABLICA 1.3. Distribucija koncentracije hemoglobina u 70 žena

Hemoglobin (g/100 mL)

Učestalosti Postoci

8-8.9 1 1.4 9-9.9 3 4.3

10-10.9 14 20.0 11-11.9 19 27.0 12-12.9 14 20.0 13-13.9 13 18.6 14-14.9 5 7.1 15-15.9 1 1.4

Ukupno 70 100

Distribucije metričkih varijabli takoñer se mogu prikazati stupčastim dijagramom, koji se gdjekad naziva histogramom (SLIKA 1.3). Prikazuju se učestalosti kao apsolutni brojevi ili kao postoci, u oba je slučaja oblik histograma jednak.

Page 11: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

1. TEMELJNI STATISTIČKI POJMOVI

5

0

5

10

15

20

8-8,9

9-9,9

10-10,9

11-11,9

12-12,9

13-13,9

14-14,9

15-15,9

SLIKA 1.3. Stupčasti dijagram distribucije koncentracije hemoglobina (g/100 mL) u 70 žena.

1.3. Deskriptivna statistika

Distribucije metričkih podataka moguće je dodatno opisivati, jer su metrički podaci realni brojevi (za razliku od kategorijskih i ordinalnih podataka).

•••• Aritmetička sredina je prosječna vrijednost konačnog skupa metričkih podataka. Ako se metrička varijabla sastoji od N podataka (x1, x2, …, xN) aritmetička je sredina njihov zbroj podijeljen s N:

N

x...xxx N21 +++

=

što skraćeno pišemo, koristeći Σ kao simbol za zbrajanje:

N

xx

∑=

Aritmetička je sredina u sredini simetrično distribuiranih podatka (kada su odstupanja od prosjeka podjednaka s obje strane).

•••• U sredini nesimetričnih distribucija nije aritmetička sredina, već medijan. To je, dakle, ona vrijednost od koje je pola podataka manje, a druga polovina veća.

Ako neparan broj N podataka poredamo po veličini, medijan je (N+1)/2 po redu. Ako je broj podataka paran, ne postoji srednji. Tada se medijan računa kao aritmetička sredina izmeñu dva susjedna oko sredine.

Page 12: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

6

•••• Osim medijana, koriste se i drugi parametri koji opisuju kojim tempom podaci rastu po veličini: donji kvartil je granica koja razdvaja po veličini prvih 25% podataka od ostalih (većih), dok je od gornjeg kvartila 75% podataka manje, a ostatak veći. Razlika izmeñu gornjeg i donjeg kvartila zove se interkvartilni raspon i obuhvaća 50% podataka. Finije detalje opisujemo pomoću percentila. Prvi percentil obuhvaća po veličini prvih 1% podataka, drugi 2% itd. •••• Vrijednost koja ima najveću učestalost je mod distribucije.

Kod simetričnih raspodjela aritmetička sredina, medijan i mod jedna su te ista vrijednost.

SLIKA 1.4 prikazuje moguće oblike distribucija statističkih podataka u medicini: simetričnu distribuciju (npr. visinu ispitanika odreñenog spola), pozitivno asimetričnu distribuciju (npr. debljinu kožnog nabora iznad tricepsa), negativno asimetričnu distribuciju (npr. trajanje trudnoće), te rjeñe oblike – bimodalnu (npr. koncentracije hormona u muškaraca i žena), jednokračnu (npr. vrijeme preživljenja nakon dijagnoze raka pluća) i uniformnu (npr. učestalost po mjesecima u godini bolesti koja nema sezonske varijacije).

SLIKA 1.4. Razni oblici distribucija metričkih podataka.

Srednja vrijednost, mod i medijan opisuju grupiranje podataka oko središta, te se nazivaju mjerama centralne tendencije. One ne govore o raspršenju podataka oko tih središta.

•••• Rasap vrijednosti (širinu distribucije) možemo opisivati pomoću razlike izmeñu najveće i najmanje vrijednosti. To je ukupna širina raspodjele, koju potpuno odreñuju samo dvije, ponekad slučajne vrijednosti.

Page 13: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

1. TEMELJNI STATISTIČKI POJMOVI

7

•••• Prosječno apsolutno odstupanje od aritmetičke sredine je informativnije. Još je bolja (iz matematičkih razloga u koje ne ulazimo) tzv. standardna devijacija (SD): kvadratni korijen iz prosjeka kvadrata odstupanja podataka od aritmetičke sredine:

1N

)x(xSD

2

−= ∑

Pri računanju prosječnog kvadratičnog odstupanja, umjesto broja podataka N, koristili smo N-1 zbog toga što sva odstupanja podataka od aritmetičke sredine nisu nezavisna. Naime zbroj svih odstupanja uvijek je jednak nuli, pa se jedno može izračunati iz preostalih N-1.

•••• Tako korigirana veličina uzorka zove se stupnjevi slobode, što skraćujemo kao df (prema engl. degrees of freedom).

•••• Koeficijent varijacije (CV) je standardna devijacija izražena u postocima od aritmetičke sredine:

(%)x

SDCV =

•••• Kvadrat SD zove se varijanca (var):

var = SD2

“Srce” statistike je simetrična, zvonolika raspodjela koju nazivamo normalnom ili Gaussovom raspodjelom (SLIKA 1.4). Potpuno je odreñena s dva parametra: 1. aritmetička sredina odreñuje os simetrije, dok 2. standardna devijacija podataka odreñuje širinu raspodjele i njen točan oblik (ne postoje dvije različite normalne raspodjele s istom aritmetičkom sredinom i standardnom devijacijom!). Za metričke varijable koje slijede normalnu raspodjelu vrijedi da sljedeći rasponi obuhvaćaju podatke na način:

aritmetička sredina ± 1 SD: oko 2/3 (68%) podataka aritmetička sredina ± 1.96 SD: oko 95% podataka aritmetička sredina ± 2.58 SD: oko 99% podataka Statističke metode koje pretpostavljaju normalnu raspodjelu varijabli zovu se parametrijske metode. Njihova je moć sadržana u činjenici da je veliko broj normalno rasporeñenih podataka potpuno odreñen s dva parametra distribucije, poznavajući koje znamo cijeli skup. •••• Standardna pogreška aritmetičke sredine (SE) je standardna devijacija aritmetičkih sredina. Možemo je odrediti tako da puno puta dobivamo podatke na N jedinki (uzorcima) iz nekog velikog skupa (populacije). Npr. ako izračunam aritmetičku sredinu tjelesne visine vaše generacije i tako zaredom 30 godina. Potom se izračuna srednja vrijednost tih 30 srednjih vrijednosti i njena standardna devijacija.

Takva su istraživanja opsežna i često nemoguća.

Page 14: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

8

Na sreću, SE se da procijeniti iz standardne devijacije i broja podataka N samo jednog uzorka: Ako je populacijska raspodjela podataka normalna: ����� =

SE govori kolika je pouzdana procjena aritmetičke sredine cijele populacije iz aritmetičke sredine jednog uzorka iz populacije.

Valja uočiti:

1. Standardna devijacija je mjera individualne varijabilnosti podataka dobivenih jednim uzorkovanjem oko njihove aritmetičke sredine, dok standardna pogreška govori za varijabilnost aritmetičkih sredina tijekom budućih uzorkovanja.

2. SE je uvijek manja od SD, tim više što je broj uzoraka N veći, ali veza nije linearna: da bi SE smanjili na polovicu, potrebno je broj uzoraka učetverostručiti (ne udvostručiti).

3. Ako je populacijska raspodjela varijable normalna, isto vrijedi i za raspodjelu aritmetičkih sredina uzoraka iz populacije. Štoviše, ako su uzorci iz populacije dovoljno veliki, njihove aritmetičke sredine slijede normalnu raspodjelu bez obzira na populacijsku raspodjelu varijable.

1.4. Populacija i uzorak

Populacija je veliki skup jedinki odreñenog istog svojstva (npr. sve Splićanke).

Ali, druga se svojstva individualno razlikuju, tj. imaju svoje distribucije (dob, visina, bračni status, zanimanje ...).

Upravo ta druga svojstva nas u statistici zanimaju. Kada usporeñujemo dvije populacije (npr. Splićanke i Kaštelanke), one se razlikuju u osnovnom obilježju (prebivalište), dok im se distribucije ostalih svojstava mogu, ali ne moraju bitno razlikovati (npr. vjerojatno Splićanke nisu prosječno više od Kaštelanki, ali je moguće da se manje bave poljoprivredom). Populacije možemo usporeñivati u cijelosti (rijetko) ili na temelju UZORAKA (češće). Uzorak: Dio (podskup) populacije (npr. Splićanke koje stanuju u Varošu su uzorak iz populacije svih Splićanki).

Uzorak je reprezentativan za populaciju iz koje potiče ako su njegova prosječna svojstva (točnije: distribucije svojstava) uglavnom slična prosječnim svojstvima (njihovim distribucijama) matične populacije.

Page 15: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

1. TEMELJNI STATISTIČKI POJMOVI

9

Npr. Varošanke se vjerojatno ne razlikuju od prosječnih Splićanki u mnogim svojstvima, ali je za pretpostaviti da su im roditelji nešto češće roñeni Splićani.

Takoñer, stanovnici Meja (i Bačvica) vjerojatno nisu reprezentativan uzorak Splićana, ako je ispitivano obilježje imovinski status, ali to mogu biti u slučaju tjelesne visine.

ZAŠTO UZIMAMO UZORKE:

Cijele su populacije najčešće nedostupne (npr. u bolnici su u odreñenom vremenu samo neki srčani bolesnici, a ne svi iz tog grada), ili su prevelike za analizu (predugo, preskupo).

Ako populacije usporeñujemo na temelju uzoraka, osnovni je preduvjet pouzdanosti zaključaka da su uzorci reprezentativni za populacije iz kojih potiču, posebno glede ispitivanog obilježja.

Ako npr. usporeñujemo Splićanke i Omišanke, tada je slučajni uzorak od 120 Varošanki vjerojatno reprezentativan za populaciju Splićanki ako se usporeñuje tjelesna visina, ali nije reprezentativan ako se Splićanke i Omišanke usporeñuju glede porijekla roditelja.

Ako uzorak ne možemo birati (npr. bolesnici koji su momentalno dostupni), njegovu reprezentativnost možemo samo procjenjivati, ali na nju ne možemo utjecati.

Ako uzorak biramo, najbolja je metoda slučajnog izbora.

Slučajni izbor ili randomizirano uzorkovanje (engl. random sampling): svaka jedinka iz populacije ima JEDNAKU šansu biti izabrana u uzorak.

Idealni slučajni izbor nije jednostavno provesti (npr. ako izvlačimo kuglice iz vreće, obično se ne izvuku one na vrhu i one na samom dnu). Dobro je koristi automatske postupke (kada čovjek nema utjecaja) i rezultate prirodno slučajnih procesa. Metoda slučajnog izbora osigurava reprezentativan uzorak tim sigurnije što je broj jedinki uzorka (N) veći.

Ako smo, npr. slučajno izabrali 5 Splićanki, lako se može dogoditi da su sve više od prosjeka (Splićanki). Na slučajnom uzorku veličine N=100, to je vrlo malo vjerojatno.

Ako smo u našem istraživanju ograničeni na male uzorke, umjesto metode slučajnog izbora, možemo sami izabirati, nastojeći što više uzorak približiti populaciji. Tu je potrebno osigurati objektivnost, tako da se ne dogodi “namještanje” željenog rezultata (npr. želimo dokazati da su Splićanke više od Omišanki, pa u uzorak Splićanki uključimo nekoliko košarkašica).

Page 16: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

10

Page 17: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

2. ŠTO JE ZAJEDNIČKO STATISTIČKIM ANALIZAMA

11

2. ŠTO JE ZAJEDNIČKO STATISTIČKIM ANALIZAMA

2.1. Vrste statističkih analiza

Tri su mogućnosti:

•••• Zanima nas samo uzorak, ne cijela populacije (npr. mene zanima vaše znanje stranih riječi, jer ovu skriptu pravim za vas i prilagodit ću ih sljedećoj generaciji studenata, ako ocijenim da su u tom pogledu drukčiji).

•••• Ispitujemo cijelu populaciju (jednu ili više njih).

•••• Zaključujemo iz uzorka (uzoraka) na populaciju (populacije). Prva su dva slučaja jednostavna. Statističke metode (u užem smislu) koriste se u trećem slučaju. Njihov je zadatak:

PROCJENA POUZDANOSTI ZAKLJUČIVANJA NA TEMELJU UZORAKA Tri su osnovne namjene statističkih metoda:

1. testiraju hipoteze (pretpostavke) o različitosti populacija glede nekog svojstva. Primjer je pretpostavka da su muškarci viši od žena, ili da češće dobivaju rak pluća.

2. procjenjuju intenzitet povezanosti izmeñu dvije kategorijske varijable. Primjer je koliko češće pušači dobivaju rak pluća nego nepušači.

3. procjenjuju mogućnost predviñanja jednog svojstva (zavisne varijable) iz jednog ili više drugih svojstava (nezavisnih varijabli ili prediktora) iste populacije. Npr. ishod infarkta miokarda (da li je bolesnik preživio ili ne-kategorijska, zavisna varijabla) možemo dijelom predvidjeti iz veličine dijela srčanog mišića koji je odumro, činjenice da li se radi o prvom ili ponovljenom infarktu, dobi bolesnika … (razne kategorijske i metričke prediktorske varijable).

Ovisno o vrsti ispitivanog svojstva statističke metode koje testiraju hipoteze dijelimo na:

• metode koje usporeñuju metričke varijable (npr. t-test) i • metode koje usporeñuju kategorijske varijable (npr. χ2 test), dok su • za ordinalne varijable razvijeni su posebni, neparametrijski testovi. Obično metričke varijable usporeñujemo koristeći tzv. parametrijske testove. Bitna je pretpostavka tih testova da je raspodjela aritmetičkih sredina normalna, ili barem simetrična. To je uvijek tako ako su same varijable simetrično distribuirane, a za velike uzorke i bez obzira na njihovu raspodjelu (tzv. teorem o središnjoj graničnoj vrijednosti). Ako se radi o malim uzorcima i uz to su još varijable vrlo nesimetrično rasporeñene, parametrijski testovi nisu uporabivi. Naravno, parametrijski testovi nisu uporabivi niti za

Page 18: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

12

ordinalne varijable. Zato su razvijeni tzv. neparametrijski testovi, koji ne tretiraju varijable kao brojeve s kojima su moguće matematičke operacije, već kao rangirani niz.

Dakle, neparametrijske testove koristimo:

• uvijek za ordinalne varijable

• ponekad za metričke varijable, kada je broj podataka N mali, a podaci su nesimetrično distribuirani i ne mogu se transformirati u simetrično (normalno) rasporeñene. Odstupanje od normalne (Gaussove) raspodjele utvrñuje se posebnim testovima.

Ne postoji oštra granica izmeñu velikih i malih uzoraka, ali se većina se statističara slaže:

1. Za N>30, bez obzira na raspodjelu podataka, koristimo parametrijsku statistiku (jer je za velike uzorke, raspodjela aritmetičkih sredina uvijek simetrična!).

2. Za 30>N>20 koristimo parametrijsku statistiku ako je poznato da je populacijska raspodjela varijable normalna, ili ako test pokaže da je raspodjela danih podataka približno normalna. U suprotnom možemo pokušati transformirati varijablu u drugu, koja ima simetričniju distribuciju (logaritmiranjem, kvadriranjem i sl.,), ili upotrijebiti neparametrijske metode.

3. Za N<20, za uporabu parametrijske statistike, nije dovoljno znati da je populacijska raspodjela normalna, već uvijek valja testirati danu raspodjelu (uzorak). Tako mali uzorci pretežito se testiraju neparametrijski.

Inače, neparametrijske testove izbjegavamo jer su manje pouzdani od parametrijskih testova.

2.2. Statističko zaključivanje

Obzirom da nikad ne možemo biti sigurni koliko su uzorci reprezentativni za matične populacije, u statistici nema potpuno sigurnih tvrdnji, sve se vezuje za odreñene vjerojatnosti. Na uzorcima iz populacija istraživane varijable se uvijek barem malo razlikuju, bez obzira da li u matičnim populacijima stvarna razlika postoji ili ne (npr. izmjerimo svima vama visinu danas i nakon mjesec dana-malo je vjerojatno da ćemo dobiti potpuno iste aritmetičke sredine). To su tzv. opažene razlike (nasuprot stvarnim razlikama izmeñu matičnih populacija). Npr. neka je stvarna razlika aritmetičkih sredina visina muškaraca i žena vašeg raspona dobi u našoj Županiji 15 cm (za to valja izmjeriti cijele populacije). Ako bi to provjeravali na vama, opažena razlika može biti veća ili manja (recimo 12 ili 18 cm), redovno drukčija nego u sljedećoj generaciji. Štoviše, ako bi kao uzorke uzeli samo po 5 muškaraca i 5 žena, nije isključeno da dobijemo i suprotan zaključak (ako slučajno uzmemo natprosječno visoke žene i natprosječno niske muškarce). Dakle, opažene se razlike redovno razlikuju od stvarnih. Statistički testovi procjenjuju “kvalitetu” opaženih razlika.

Page 19: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

2. ŠTO JE ZAJEDNIČKO STATISTIČKIM ANALIZAMA

13

Nul-hipoteza je pretpostavka da se populacije ne razlikuju u ispitivanom obilježju, tj. da su opažene razlike slučajne (da stvarne, populacijske razlike ne postoje). Statistički test računa tzv. p-vrijednost. To je vjerojatnost dobivanja uočene ili još veće razlike na slučajnim uzorcima iste veličine iz populacija koje se u istraživanom obilježju ne razlikuju, tj. pod pretpostavkom da je nul-hipoteza točna. Što je p-vrijednost manja, to je manje vjerojatno da je nul-hipoteza točna, dok velika p-vrijednost sugerira prihvatljivost nul-hipoteze. Iako vjerojatnost točnosti nul-hipoteze odgovara p-vrijednosti, njenu točnu vrijednost ne znamo. Nemoguće je, naime, izračunati vjerojatnost neke pretpostavke polazeći od toga da je ona točna. Ipak, iz p-vrijednosti moguće je izračunati, koristeći tzv. Bayesovu statistiku, za koliko istraživanje na našem uzorku modificira dotadašnju procjenu vjerojatnosti nul-hipoteze. 1 - p = odgovara vjerojatnosti da nul-hipoteza nije točna, tj. da stvarna razlika postoji i naziva se razina značajnosti. Što je p-vrijednost manja, razina značajnosti je veća, tj. pouzdanija je procjena stvarnih iz uočenih razlika.

Ponekad unaprijed znamo da neko obilježje populacije A ne može biti prosječno manje nego u populaciji B, a nismo sigurni da li je veće (ili obrnuto).

Npr. ispitujemo novi lijek za sniženje krvnog tlaka. Poznato je da taj lijek ne može povisiti krvni tlak, ali nije poznato da li ga smanjuje i koliko.

Ta se testiranja zovu jednokračni testovi (one-tailed), nasuprot standardnim, dvokračnim testovima (two-tailed). Kod jednokračnih testiranja iste opažene razlike daju duplo manje p-vrijednosti (razina značajnosti je veća!), jer je 50% slučajnih ishoda unaprijed isključeno.

Jednokračna testiranja treba kritički koristiti. U praksi su rijetka. Ako se posebno ne istakne suprotno, test je dvokračni.

Često na osnovu rezultata statističkih testova donosimo odluke (npr. proizvodnja novog lijeka, primjena nove metode liječenja, dijagnosticiranje bolesti i sl.). To nas ponekad prisiljava da definiramo:

graničnu razinu značajnosti (1- graničnu p-vrijednost)

Granična je ona razina značajnosti iznad koje prihvaćamo da su uočene razlike stvarne, tj. zanemarujemo malu vjerojatnost (p-vrijednost) da se radi o slučaju.

• Kažemo da se uzorci statistički značajno razlikuju ako je dobivena p-vrijednost testa manja od granične p-vrijednosti. • Ako to nije slučaj, tj. ako je p-vrijednost testa veća ili jednaka od granične p-vrijednosti, kažemo da se uzorci ne razlikuju statistički značajno. U prvom slučaju nul-hipotezu odbacujemo, a u drugom ju prihvaćamo. U biomedicini je uobičajena 95% granična razina značajnosti, odnosno čuvena granična p-vrijednost = 5%.

Page 20: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

14

Tu graničnu p-vrijednost valja uzeti s “debelom” rezervom. Ako npr. u usporedbi novog lijeka sa starim dobijemo p=0.049, novi lijek prihvaćamo, dok ga u slučaju p=0.051 ne prihvaćamo. Razlika je drastična, a vjerojatnosti da novi lijek nema prednosti pred starim su podjednako male u oba slučaja (4.9 i 5.1%).

No, tako je uvijek kada moramo odrediti granice (student koji ima na testu ima jedan bod ispod praga prolaznosti vjerojatno se ne razlikuje od onoga koji je prošao s jednim bodom više). Razgraničenje pomoću granične razine značajnosti povlači mogućnost pogrešaka u zaključivanju.

• Alfa (αααα) pogreška (ili pogreška tipa 1) je odbacivanje nul-hipoteze, dok je ona u stvari točna. Dakle, na osnovu rezultata statističkog testa ustvrdili smo da postoji razlika u istraživanom obilježju izmeñu populacija, iako ta razlika ne postoji, tj. na našim smo je uzorcima dobili slučajno. Vjerojatnost alfa pogreške odgovara p-vrijednosti. Vjerojatnost da nećemo napraviti pogrešku tipa 1 odgovara razini značajnosti (1-p).

• Beta (ββββ) pogreška (ili pogreška tipa 2) je prihvaćanje nul-hipoteze, dok je ona u stvarnosti netočna. Drugim riječima, razlika nañena na uzorcima nije testom bila statistički značajna, iako se populacije u istraživanom obilježju razlikuju. Vjerojatnost beta pogreške ovisi o tome što prihvaćamo kao stvarnu razliku u promatranoj veličini. Drugim riječima moramo definirati što smatramo stvarno značajnom razlikom (u medicini govorimo o biološkoj ili kliničkoj značajnosti). Jasno je da ćemo vrlo male razlike teže statistički potvrditi nego relativno velike.

• Vjerojatnost da nećemo napraviti pogrešku tipa 2 povezana je sa snagom istraživanja. Snaga istraživanja raste s veličinom uzorka (N) i s veličinom razlike koju smatramo stvarno značajnom, a opada s razinom značajnosti (statističke). Ako nismo prisiljeni odreñivati granice, dobivene p-vrijednosti prosuñujemo ovisno o tome da li smo uočene razlike očekivali (npr. nećemo odbaciti p=0.08 u usporedbi visina desetgodišnjih dječaka i djevojčica, jer je to fiziološki očekivani rezultat), ili su neočekivani rezultat u mnoštvu usporedbi (ako se kocka često baca, pojavit će se i malo vjerojatne kombinacije, poput tri šestice zaredom). Nadalje važne su i posljedice interpretacije testa. Tako ćemo teško prihvatiti novi lijek i pored toga što je gotovo sigurno učinkovit (npr. p=0.01), ako je njegova proizvodnja vrlo skupa (u praksi se radi o milijardama dolara), dok ćemo manje oklijevati u slučaju lijeka koji može spasiti život, a ne postoji slični. Zbog toga se u novije vrijeme sve češće rezultati statističkih testiranju dopunjuju iskazima koji sadrže više informacija od same činjenice da li je dobivena p-vrijednost testa veća ili manja od izabrane granične p-vrijednosti. Radi se o tzv.: •••• intervalima pouzdanosti (C.I., prema engl. Confidence Interval) Naime, na temelju uočenih razlika izmeñu uzoraka, mogu se, sa zadanom pouzdanošću, procijeniti intervali mogućih vrijednosti stvarnih (populacijskih) razlika. Tako je najčešće u uporabi tzv. 95% interval pouzdanosti (95 % C.I.).

Page 21: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

2. ŠTO JE ZAJEDNIČKO STATISTIČKIM ANALIZAMA

15

Neka se negdje navede da je 95% C.I. razlike aritmetičkih sredina visina izmeñu odraslih Splićana i Splićanki 8-14 cm. To znači da je, temeljem mjerenja tjelesne visine na uzorku odraslih Splićanki i Splićana, 95% sigurno da je razlika prosječnih visina Splićana i Splićanki izmeñu 8 i 14 cm. Drugim riječima, ponavljanjem sličnog mjerenja na jednako velikim uzorcima u samo 5% slučajeva dobili bismo procjene koje su izvan (veće ili manje) tog intervala. Jednako se definiraju i ostali intervali pouzdanosti (90% C.I., 99% C.I., ili bilo koji drugi). Intervali pouzdanosti ne moraju se odnositi samo na razlike veličina, već, jednostavno, i na same veličine (npr. iz nekog mjerenja može se procijeniti da je 95% C.I. prosječne visine odraslih Splićana 178-186 cm). Takoñer, ne mora se raditi o aritmetičkim sredinama, već i o raznim omjerima metričkih varijabli. Tako je uobičajen iskaz u medicinskoj literaturi npr. sljedeći: “U ovom je istraživanju procijenjeno da je rak pluća 8 puta učestaliji (tijekom cijelog života) u pušača nego u nepušača (95% C.I. 4-17)”. To znači da, iako je najbolja procjena relativnog rizika razvoja raka pluća u pušača 8, postoji 5% vjerojatnost da je stvarni omjer rizika razvoja raka pluća izmeñu pušača i nepušača manji od 4, ali i veći od 17. Takav iskaz nameće kritičku prosudbu rezultata istraživanja, gdje se uočene razlike dopunjuju njihovim neodreñenostima i gdje se jasnije zrcali uloga veličine uzoraka (nego ako se samo citira p-vrijednost).

2.3. Filozofija statističkih testova usporedbe

Tri su čimbenika pouzdanosti zaključivanja na temelju uzoraka iz populacija:

1. Koliko se ispitivane populacije zaista razlikuju u istraživanom obilježju (npr. lakše ćemo utvrditi da li postoji razliku u visini Splićana i stanovnika Tokija, nego Splićana i Trogirana)

2. Kolike su širine distribucija, tj. varijabilnosti istraživane varijable u populacijima (npr. ako su u moru sve sive ribe veličine 10, a sve plave 12 cm, dovoljno je uhvatiti po jednu)

3. Kolike su veličine uzoraka iz populacija (veći uzorci osiguravaju bolju reprezentativnost-sličnost s matičnim populacijama).

Naravno, stvarne razlike i varijabilnosti obilježja u populacijama ne znamo, te ih procjenjujemo iz opaženih razlika i varijabilnosti unutar uzoraka.

Na temelju tih podataka i veličina uzoraka statistički testovi izračunavaju p-vrijednosti.

Dakle, za sve testove usporedbe populacija na temelju uzoraka vrijedi isto: dobivena p-vrijednost tim je manja (procjena je pouzdanija), što su:

• opažene razlike veće, • varijabilnosti manje i • uzorci veći

U praksi su prva dva čimbenika zadata i jedino možemo utjecati na treći: što su opažene razlike manje i varijabilnosti obilježja veće, za pouzdane procjene, potrebni su veći uzorci.

Page 22: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

16

2.4. Statistička i biološka (klinička) značajnost

Često je, osobito u medicini, sporedno pitanje da li nekakva razlika izmeñu populacija postoji ili ne (uostalom, nepostojanje razlika samo je idealni koncept, u stvarnosti uvijek postoje nekakve, barem male razlike u bilo čemu izmeñu bilo čega), već je bitno procijeniti veličinu razlike. Intervali pouzdanosti daju uvid u veličine varijabli i njihovih razlika izmeñu populacija. Bitno je uočiti da se intervali pouzdanosti ne mogu procijeniti iz p-vrijednosti, bez poznavanja veličine uzoraka. Odreñena p-vrijednost testa može biti rezultat potpuno različitih situacija. Tako npr. mala p-vrijednost može značiti da je vrlo sigurno da postoji mala razlika, ili da je prilično (ali ne i jako) sigurno da postoji velika razlika u ispitivanom obilježju izmeñu populacija. PRIMJER 2.1. Uzmimo npr. da su stvarne razlike u visini (aritmetičke sredine razlika visina cijelih populacija) izmeñu odraslih Splićana i Zagrepčana 6 cm, a izmeñu Splićana i stanovnika Tokija 12 cm. Pretpostavimo nadalje da smo te razlike procijenili na uzorcima stanovnika ta 3 grada i da su odgovarajuće opažene razlike 5.5 cm (Split-Zagreb) i 13 cm (Split-Tokio). Ukoliko je usporedba Split-Zagreb bazirana na većem broju ispitanika nego usporedba Split-Tokio, moguće je da je u oba slučaja p-vrijednost testa jednaka, npr. 1%. Ne znajući ništa osim tih p-vrijednosti, možemo samo zaključiti da je jednako vjerojatno da nema razlike u visini izmeñu Splićana i Zagrepčana, kao i Splićana i stanovnika Tokija. Kako je vjerojatnost nul-hipoteze mala, skloni smo ju odbaciti. Nakon što smo prilično sigurni da su prosječno Splićani viši i od Zagrepčana i od stanovnika Tokija, željeli bismo znati da li su razlike izmeñu Splićana, Zagrepčana i stanovnika Tokija veće ili manje od 5 cm, što smatramo antropološki značajnom razlikom. Iz p-vrijednosti ne možemo o tome prosuñivati, ali možemo iz intervala pouzdanosti U ovom bi slučaju 99% C.I. razlika visina izmeñu Splićana i Zagrepčana bio 0-11 cm (simetrično rasporeñen oko uočene razlike od 5.5 cm, zahvaćajući nulu na lijevom kraku), dok bi 99% C.I. razlika visina izmeñu Splićana i stanovnika Tokija iznosio 0-26 cm (simetrično rasporeñen oko uočene razlike od 13 cm, zahvaćajući nulu na lijevom kraku). Iz tih je podataka razvidno da je vjerojatnost da su Splićani barem 5 cm prosječno veći od Zagrepčana nešto veća od 50% (jer je 50% mogućih razlika veće od 5.5 cm) dok je ista vjerojatnost za stanovnike Tokija puno veća od 50% (jer je 50% mogućih razlika 13 cm ili više). Dakle, postojanje antropometrijski značajnih razlika u visini (koje uistinu postoje!) više nam sugerira istraživanju Split-Tokio, iako je provedeno na manjim uzorcima nego istraživanje Split-Zagreb! Taj naizgledni paradoks rezultat je činjenice da su stvarne, pa prema tom i uočene razlike visina, u tom istraživanju bile veće. PRIMJER 2.2. Antihipertenzivni lijek A testiran je na 300, a lijek B na 60 bolesnika s povišenim arterijskim krvnim tlakom. Obje su skupine bile prispodobive po dobi, spolu, visini, masi i krvnim tlakovima. U oba je pokusa svaki bolesnik primao prvo lijek, pa placebo, ili obrnuto, randomiziranim poretkom. Antihipertenzivni lijek A snizio je dijastolički arterijski krvni tlak prosječno za 2 mm Hg više od placeba, a lijek B za 8 mm Hg. No, kako je prvi pokus izveden na 5 puta većem uzorku, p vrijednosti značajnosti razlike prema placebu iznosile su 2% u oba slučaja.

Odgovorite: a) Razlikuje li se vjerojatnosti da se pojedini lijek ne razlikuje od placeba, tj. da je farmakološki neučinkovit? b) Možemo li temeljem opisanih pokusa jednom od lijekova dati prednost? Zaključimo da nije bitno samo da li su opažene razlike statistički značajne, već i koliko su one velike. Često je statistički značajna razlika biološki (ili klinički) nevažna, dok opažena veća razlika zaslužuje veću pozornost, bez obzira na sličnu (ili čak manju) razinu značajnosti. U tim nam analizama pomažu intervali pouzdanosti.

Page 23: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

3. USPOREDBE METRIČKIH VARIJABLI

17

3. USPOREDBE METRIČKIH VARIJABLI

3.1 t-test

Kada testiramo razlike izmeñu dvije skupine rezultata najpoznatiji parametrijski test zove se t-test ili Studentov-t test. Dakle, t-test je jedan od najpoznatijih statističkih testova za testiranje značajnosti razlika izmeñu dvije aritmetičke sredine.

Postoje i odreñeni preduvjeti za primjenu t-testa:

� Za računanje t-testa obje varijable moraju biti metričke (kvantitativne).

� Broj mjerenja mora biti zadovoljavajući (ne manje od 20), osobito ako su distribucije rezultata značajno nesimetrične.

Ovisno o vrsti podataka možemo razlikovati dvije procedure testiranja t-testom

t-test za nezavisne uzorke t-test za zavisne uzorke

Uzorci mogu biti stvarno nezavisni (npr. ako usporeñujemo znanje o dijabetesu izmeñu liječnika iz Zagreba i Rijeke)

Mjerenje je provedeno na istim ispitanicima u dva različita stanja (npr. prije i poslije operacije)

Unutar postojećeg uzorka u istraživanju možemo napraviti podjelu na dva nezavisna uzorka - npr. podjelu uzorka na muške i ženske ispitanike

Kada primjenjujemo statističke metode gotovo uvijek radimo s uzorcima, a ne cijelim populacijama. Iz te činjenice proizlazi i smisao postojanja standardne pogreške mjerenja, koja se veže uz različite statističke parametre, poput aritmetičke sredine i standardne devijacije.

U 1. poglavlju smo spomenuli da se standardna pogreška aritmetičke sredine (SE) da izraziti pomoću standardne devijacije SD i veličine uzorka (broja ispitanika) N:

N

SDSE =

Ako su podaci dobiveni na nezavisnim uzorcima (v1 i v2), standardna pogreška razlike varijabli (v1-v2) SE1-2 da se izraziti pomoću SE1 i SE2 na način:

22

2121 SESESE +=−

Page 24: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

18

2

22

1

21

21 N

SD

N

SDSE +=−

Dakle, standardna pogreška razlike dviju varijabli veća je od svake pojedine, ali manja od njihovog zbroja, jer je hipotenuza pravokutnog trokuta kojemu se katete pojedine pogreške.

Pretpostavimo da imamo dva velika uzorka liječnika u Sloveniji (N1=1000) i u Hrvatskoj (N2=700) koji su rješavali test znanja o hipertenziji. Liječnici u Sloveniji su postigli prosječno 130 bodova (M1=130, SD1=15), dok su liječnici u Hrvatskoj postigli u prosjeku 125 bodova (M2=125, SD2=11).

Ako iz izloženog primjera uvrstimo vrijednosti u formulu, dobivamo da je standardna pogreška razlika izmeñu aritmetičkih sredina 0.63.

Dobivenu vrijednost tumačimo jednako kao osnovne parametre normalne raspodjele. Dakle, 68% je vjerojatno da dobivena razlika izmeñu aritmetičkih sredina (130-125=5) ne odstupa od prave ili populacijske razlike (razlike izmeñu svih liječnika u Sloveniji i Hrvatskoj) više od ± 0.63. Nadalje, 95% je vjerojatno da dobivena razlika ne odstupa od populacijske razlike više od ± 1.2 (1.96⋅ 0.63). Isto je tako 99% vjerojatno da dobivena razlika ne odstupa od prave razlike više od ± 1.6 (2.54⋅0.63).

Na sljedećoj slici vidimo kako izgleda distribucija razlika aritmetičkih sredina uzoraka iz populacije kojoj je aritmetička sredina nula (nul-hipoteza), a standardna pogreška 0.63.

00.5 1 1.5 2-2 -1.5 -1 -0.5 3 4 5

SLIKA 3.1 Prikaz distribucija razlika izmeñu dvije aritmetičke sredine uzoraka iz populacije kojoj je aritmetička sredina nula, a standardna pogreška 0.63, Prikazana je i uočena razlika od 5.

Iz prethodno iznesenog slijedi da, ukoliko je razlika izmeñu dvije aritmetičke sredine na velikim uzorcima više od tri puta veća od svoje pogreške, onda je smatramo značajnom na 99%-noj razini. U osnovi, t vrijednost t-testa pokazuje koliko je puta dobivena razlika izmeñu dvije aritmetičke sredine veća od svoje standardne pogreške.

Page 25: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

3. USPOREDBE METRIČKIH VARIJABLI

19

Dakle, t-test za nezavisne uzorke se zasniva na postupku oduzimanja dviju aritmetičkih sredina (jedne od druge), što se podjeli sa standardnom pogreškom njihove razlike. Rezultat se naziva t-vrijednošću:

21

21

−=

SE

XXt

Računalo iz te t-vrijednosti računa vjerojatnost da je uočena razlika slučajna, tj. da će se takva ili veća razlika dobiti na uzorcima iz populacija koje se ne razlikuju u ispitivanoj varijabli. To je pripadajuća p-vrijednost t-testa.

Ukoliko se odlučimo na korištenje granične razine značajnosti, t-test nam govori:

1) da su razlike u rezultatima dviju skupina (ili jedne skupine po dvije varijable) statistički značajne i da meñu njima postoje statistički značajne razlike

Posljedica: Odbacivanje nul-hipoteze ili:

2) da su razlike u rezultatima dviju skupina (ili jedne skupine po dvije varijable) statistički neznačajne, tj. da je mogućnost da su slučajne neprihvatljivo velika.

Posljedica: Prihvaćanje nul-hipoteze

Na sljedećoj slici prikazane su dvije distribucije rezultata. Vidljivo je da je aritmetička sredina druge distribucije veća od aritmetičke sredine prve distribucije, te da postoji odreñen broj vrijednosti koje su jednake u obje distribucije (površina distribucija se preklapaju).

Razlike aritmetičkih sredina distribucija mogu biti statistički značajne i pored toga što se neki rezultati preklapaju. (npr. veći u prvoj distribuciji u odnosu na drugu, iako je prosjek prve manji).

X X1 2

_ _<

SLIKA 3.2. Odnos izmeñu distribucija rezultata dva uzorka čije se vrijednosti preklapaju

Page 26: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

20

Na sljedećoj je slici prikazana distribucija rezultata dva uzorka čije se vrijednosti ne poklapaju, te se gotovo sve vrijednosti jedne varijable razlikuju više od tri standardne devijacije druge varijable.

SLIKA 3.3. Odnos izmeñu distribucija rezultata dva uzorka čije se vrijednosti ne preklapaju

Postoje još i daljnje podjele t-testa kojih ćemo se samo dotaknuti. Naime, osim izbora t-testa za zavisne ili nezavisne uzorke (dependent, independent t-test) moramo uzeti u obzir i veličinu uzorka. Sljedeće su inačice (varijante) t-testa:

a) t-test za velike nezavisne uzorke

b) t-test za male nezavisne uzorke

c) t-test za velike zavisne uzorke

d) t-test za male zavisne uzorke (metoda diferencije)

No, navedenu podjelu je potrebno samo poznavati, jer računalo vodi računa o malim i velikim uzorcima i na korisniku je da samo u aplikaciji Statistica ili nekoj drugoj izabere vrstu t-testa (zavisni ili nezavisni uzorci).

PRIMJER 3.1. Ukoliko želimo provjeriti da li postoji statistički značajna razlika izmeñu muških i ženskih ispitanika u vrijednostima sistoličkog tlaka nakon maksimalnog trčanja dionice od 100 m, trebamo imati sljedeće parametre i proceduru za provjeru razlika. Pretpostavimo da je u istraživanju sudjelovalo 80 žena i 100 muškaraca. Prosječna vrijednost sistoličkog tlaka (u mm Hg) za žene nakon opterećenja neka je 155, a za muškarce 140. Dakle, riječ je o nezavisnim uzorcima i razlikama izmeñu njihovih aritmetičkih sredina. Prema tome, ukoliko smo dobili takve podatke, radit ćemo t-test za nezavisne uzorke:

žX = 155

SDž=15

mX = 140

SDM=10

Nž = 80

Nm=100

X X 1 2

_ _

Page 27: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

3. USPOREDBE METRIČKIH VARIJABLI

21

Standardna pogreška aritmetičke sredine sistoličkog tlaka za žene je:

69.180

15===

N

SDSE

Ž

a za muškarce:

1100

10===

N

SDSEM

Sada možemo izračunati vrijednost t-testa,

65.796.1

15

169.1

14015522

21==

+

−=

−=

−MŽSE

XXt , p<0.01

Dakle, dobivena vrijednost t-testa je značajna na razini od 99% i možemo odbaciti nul hipotezu te zaključiti da postoji značajna razlika izmeñu muškaraca i žena u vrijednostima sistoličkog tlaka nakon opterećenja. Ovo je bio primjer t-testa za nezavisne uzorke.

Odgovarajući primjer primjene t-testa za zavisne uzorke bio bi analiza razlike izmeñu sistoličkog tlaka u sjedećem položaju i sistoličkog tlaka nakon opterećenja. U tom slučaju analiziramo rezultate istih ispitanika kojima smo prvo izmjerili sistolički tlak u sjedećem položaju, a zatim nakon opterećenja. Dakle, t-test za zavisne uzorke uključuje dva mjerenja na istim ispitanicima i usporedbu dobivenih srednjih vrijednosti u ta dva mjerenja.

3.2 Neparametrijske inačice t-testa za dva nezavisna uzorka

Znatan dio parametrijskih testova (t-test, analiza varijance) pretpostavlja normalnu raspodjelu varijabli u promatranim populacijama. No, često se dogaña da populacijska raspodjela varijable nije niti približno simetrična, nego čak pripada nekim drugim raspodjelama. Primjeri su multimodalna raspodjela, s najvećim učestalostima na krajnjim vrijednostima apscise (U-raspodjela) ili Poissonova raspodjela (raspodjela učestalosti vrlo rijetke pojave). Neparametrijska statistika koristi se kod podataka koji imaju neke od sljedećih karakteristika:

o distribucija malog broja podataka značajno odstupa od normalne

o podaci su izraženi na nominalnim ili ordinalnim mjernim ljestvicama

Snaga neparametrijskih testova značajno je manja od snage parametrijskih testova. Ako izmeñu dvije populacije postoji razlika, veća je vjerojatnost da ćemo to otkriti parametrijskim nego neparametrijskim testom.

U sljedećim ćemo poglavljima govoriti o različitim mjerama povezanosti metričkih varijabli. Ovdje ćemo samo navesti da i tu postoje parametrijski (Pearsonov koeficijent korelacije) i neparametrijski testovi (Spearmanova korelacija).

Page 28: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

22

Neparametrijske testove možemo klasificirati prema dva kriterija: vrsti eksperimentalnog nacrta ili istraživanja (zavisni ili nezavisni uzorci) i broju varijabli koji se koristi u analizi rezultata. U sljedećem odjeljku razmatramo neparametrijske testove za dva uzorka i to za nezavisne i za zavisne uzorke. S druge strane, nakon poglavlja o analizi varijance raspravljamo o neparametrijskim testovima za više zavisnih ili nezavisnih uzoraka.

U ovom poglavlju o usporedbi dviju varijabli obrañujemo neparametrijske inačice testova za dva nezavisna i dva zavisna uzorka.

Neparametrijske inačice za dva nezavisna uzorka koriste se kada zbog jednog ili više poznatih razloga ne smijemo koristiti parametrijske testove (t-test).

Neparametrijskih testova ima jako puno, no najčešće navoñeni u literaturi i u pojedinim aplikacijama su:

� test sume rangova (Wilcoxonov t-test, Mann-Whitney U-test)

� medijan test

� test homogenog niza (Run test, Wald-Wolfowitzov test)

� Siegel-Tukey test

Parametrijskoj inačici t-testa, gdje nastojimo ispitati značajnost razlika izmeñu dvije aritmetičke sredine, približno odgovara neparametrijski test, medijan test. Medijan testom ispitujemo da li dva uzorka pripadaju populaciji s istim medijanom ili ne. Vrlo je jednostavan test koji se svodi na tzv. χ2 test (prikazan u 4. poglavlju).

Prvi korak kod računanja medijan testa je pronalaženje centralne vrijednosti svih podataka iz oba uzorka zajedno. Nakon toga, u drugom koraku izračunamo kolika je učestalost rezultata koji su ispod ili iznad medijana i to odvojeno u oba uzorka. Nakon prebrojavanja rezultata dobivamo kontigencijsku tablicu (2x2), iz koje izračunavamo hi-kvadrat vrijednost testa. Dakle, test je vrlo jednostavan i krajnja interpretacija dobivenih rezultata je ista kao i kod hi-kvadrat testa.

Jedan od najčešće korištenih neparametrijskih testova za dva nezavisna uzorka je test sume rangova (Mann-Whitney U test).

Jednako kao i kod medijan testa, kod testa sume rangova testiramo da li dva uzorka pripadaju populaciji s jednakim medijanom. Vrlo je sličan testu homogenog niza, no koristi veći broj informacija te ga možemo smatrati snažnijim testom. Za razliku od parametrijskih testova, Mann-Whitney U test nije osjetljiv na oblik distribucije i jednakost varijanci promatranih varijabli. Mann-Whitney U test je alternativa t-testu za nezavisne uzorke i za izračunavanje potrebnih statističkih vrijednosti koristi rangove kao osnovne parametre, a ne realne vrijednosti koje koristi t-test za izračunavanje aritmetičke sredine.

Sljedeći je primjer tipične uporabe Mann-Whitney U testa.

PRIMJER 3.2. U jednom istraživanju nastojalo se ispitati da li postoji značajna razlika izmeñu muškaraca i žena na testu prostorne vizualizacije. U testu je sudjelovalo ukupno 16 ispitanika i to 8 muškaraca i 8 žena koji su odabrani po slučaju. Slijedeća tablica pokazuju dobivene rezultate i njihove rangove.

Page 29: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

3. USPOREDBE METRIČKIH VARIJABLI

23

Muškarci Rang (R1)

Žene Rang (R2)

70 4 81 8

86 11 80 7

60 2 50 1

92 13 95 16

82 9 93 14

65 3 85 10

74 5 90 12

94 15 75 6

N=8 R1= 62 N=8 R2= 74

Na osnovi dobivenih vrijednosti potrebno je izračunati pripadne U vrijednosti.

UA= N1 N2+ N1(N1+1) R1

UA= 8x8+ 8(8+1) 62

UA= 64+ 72 62

UA=38

UB = N1 N2 UA

UB = 64-38= 26

UB je niža vrijednost i kada uzmemo u obzir da je kritična vrijednost za proglašavanje značajne razlike (za N1=8, N2=8) 13, zaključujemo da postoji statistički značajna razlika izmeñu muškaraca i žena. Naravno, sve vrijednosti koje su potrebne za tumačenje Mann-Whitney U testa dobivaju se automatski pomoću aplikacije na računalu.

Prema osnovnim postavkama Mann-Whitney U testa, ukoliko se izrazito statistički značajno razlikuju dva uzorka, onda su njihovi rangovi poredani tako da su jedni na jednoj strani skale rangova, a drugi na drugoj strani skale rangova. S druge strane, ako nema statistički značajne razlike izmeñu dva uzorka, onda su pripadne vrijednosti rangova jednog i drugog uzorka meñusobno pomiješani.

Ukoliko je uzorak ispitanika veći od 8 tada možemo koristiti z-vrijednosti za procjenjivanje značajnosti razlika unutar testa. Slijedeća slika pokazuje kako u programu Statistica izgleda rezultat provedbe Mann-Whitney U testa. Dakle, prikazane su sve potrebne vrijednosti (U, Z, p, korigirana Z i p vrijednost).

Page 30: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

24

3.3 Neparametrijske inačice t-testa za dva zavisna uzorka

Kod neparametrijskih testova za dva nezavisna uzorka imali smo dva različita uzorka na kojima smo proveli mjerenja. Kod zavisnih uzoraka, imamo dva mjerenja na istim ispitanicima ili na dva uzorka ispitanika gdje svaki ispitanik ima svoj tzv. usklañeni par.

Neparametrijske inačice testova za zavisne uzorke su:

� test predznaka (Sign test)

� Wilcoxonov test usklañenih parova (Wilcoxon matched pairs test)

Test predznaka je neparametrijska alternativa t-testa za zavisne uzorke. Test predznaka je vrlo jednostavan i izračunava se na osnovi učestalosti slučajeva kada je vrijednost mjerenja A veća od vrijednosti mjerenja B. Na osnovi tzv. binomne raspodjele izračunava se z-vrijednost i pripadajuća p-vrijednost. Naravno, potrebno je poznavati svrhu i logiku primjene testa, a ostalo obavi računalo. Na sljedećoj je slici prikazan izbornik u aplikaciji Statistica pomoću kojega je potrebno odrediti varijable i vrstu testa.

Dakle, nakon primjene testa predznaka računalo prikaže pripadajuću Z vrijednost i p.

Wilcoxonov test usklañenih parova zahtijeva metričke podatke. Logika testa se sastoji u izračunavanju razlika izmeñu svakog para dvaju zavisnih uzoraka. Razlike mogu biti

Page 31: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

3. USPOREDBE METRIČKIH VARIJABLI

25

pozitivne ili negativne. Sve izračunate razlike izmeñu pojedinog para se rangiraju. Ukoliko su dva para ili njih više po rangu isti, dobivaju zajednički rang.

Ukoliko nema razlike izmeñu dva uzorka, tada je suma pozitivnih i negativnih rangova jednaka ili vrlo slična. Ako postoji značajna razlika u sumi pozitivnih i negativnih rangova, tada statistička aplikacija na računalu prema veličini razlike odreñuje brojčani iznos p vrijednosti.

Snaga Wilcoxonovog testa značajno je veća od snage testa predznaka .

Primjenom Wilcoxonovog testa dobivamo Z vrijednost koja ima svoju distribuciju, te na osnovi dobivene Z vrijednosti izračunava se p.

PRIMJER 3.3. Istraživači su pokušali ispitati da li novoroñenče primjećuje u ranoj dobi odnos izmeñu govora i pomicanje usnama govornika. Na taj način istraživači pokušavaju uvidjeti važnost vizualnih informacija i razvoj govora u djece. Istraživači su novoroñenčad stavljali u dvije eksperimentalne situacije: a) govor i pomicanje usnama su istovremeni i normalno sinhronizirani b) govor kasni za pomicanjem usana za 400 msec. U obje eksperimentalne situacije istraživači su mjerili vrijeme (sekunde) koje novoroñenče provodi u promatranju istraživača koji govori. Na slijedećoj slici su prikazani podatci u obje situacije.

Nakon unesenih podataka, statistička aplikacija (Statistica) izračunava prikladnu Z vrijednost i značajnost (p).

Iz priloženog je vidljivo da je dobivena Z vrijednost (2.67) statistički značajna na razini od 99% (p=0.0077; p<0.01) i zaključujemo da izmeñu dvije eksperimentalne situacije (a i b) postoji statistički značajna razlika u vremenu vizualnog procesiranja.

Page 32: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

26

3.4 Usporedbe triju ili više varijabli: Analiza varijance (ANOVA)

ZAŠTO ANOVA

Provedeno je istraživanje u kojem se želi vidjeti postoji li razlika u vrijednostima dijastoličkog krvnog tlaka izmeñu ispitanika koji su primali 1, 2 ili 3 antihipertenziva. U istraživanju je ukupno sudjelovalo 150 ispitanika, gdje je po 50 ispitanika uzimalo kontinuirano 1, 2 ili 3 antihipertenziva. Znači, u ovom se slučaju mijenja situacija u odnosu na t-test, gdje smo imali razliku izmeñu dva uzorka ili dva mjerenja. S jedne strane imamo kontinuiranu, metričku varijablu, te s druge strane kvalitativnu, trihotomnu varijablu. Dakle, želimo vidjeti da li izmeñu ispitanika/pacijenata koji pripadaju odreñenoj skupini (1, 2 ili 3 antihipertenziva) postoji razlika u jednoj metričkoj, kontinuiranoj varijabli (dijastolički tlak).

Riječ je o situaciji kada postoji indikacija za upotrebu tzv. analize varijance.

→→→→ Naime, u ovakvim slučajevima ne koristimo t-testove za svaki pojedini par skupina, jer povećavanjem broja t-testova povećavamo vjerojatnost slučajnog pozitivnog nalaza. Tako na primjer, u 20 usporedbi skupina gdje razlike izmeñu populacija nema (stvarna razlika jednaka nuli), prosječno će jedno testiranje proglasiti uočene razlike statistički značajnim uz 95% graničnu razini značajnosti.

Analiza varijance je statistički postupak kojim se usporeñuju različite komponente varijance (kvadrirane standardne devijacije).

Jednostavna analiza varijance primjenjuje se kada usporeñujemo rezultate jedne zavisne varijable unutar jedne nezavisne varijablom koja ime više razina ili kategorija. Primjer je istraživanje da li izmeñu četiri dobne skupine ispitanika (1: 10-19 godina, 2: 20-29, 3: 30-49, 4: 50-59) postoji statistički značajna razlika u razini kolesterola u krvi. U ovom slučaju možemo primijeniti postupak jednostavne analize varijance jer želimo vidjeti da li izmeñu većeg broja dobnih skupina (nezavisna varijabla) postoji statistički značajna razlika u razini kolesterola u krvi (zavisna varijabla).

Složena analiza varijance je statistički postupak koji se primjenjuje u onim slučajevima kada usporeñujemo rezultate više zavisnih varijabli unutar više nezavisnih varijabli koje imaju različite razine ili kategorije. Za razliku od jednostavne analize varijance, gdje imamo samo jednu zavisnu varijablu, kod složene analize varijance, osim utjecaja većeg broja nezavisnih varijabli na zavisnu, gledamo i meñudjelovanje (interakciju) izmeñu većeg broja zavisnih varijabli.

Dakle, u slučaju jednostavne analizu varijance, kada želimo utvrditi kako neka nezavisna varijabla utječe na neku zavisnu varijablu potrebno je imati:

a) veći broj kategorija nezavisne varijable b) za svaku od kategorija odreñeni broj ispitanika na kojima su prikupljeni podaci o

zavisnoj varijabli c) zavisnu varijablu koja je metrička, kontinuirana varijabla

Općenito logika jednostavne analize varijance počiva na:

a) odstupanjima pojedinačnih rezultata od vlastite aritmetičke sredine, i tu imamo variranje unutar skupine kojoj pripada ispitanik i na:

Page 33: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

3. USPOREDBE METRIČKIH VARIJABLI

27

b) odstupanjima aritmetičkih sredina pojedinih skupina rezultata od zajedničke aritmetičke sredine svih rezultata

Ako ove dvije činjenice povežemo sa prije iznesenim primjerom koncentracije kolesterola u krvi možemo reći sljedeće:

a) ako imamo ispitanika koji ima 35 godina onda njegova koncentracija kolesterola odstupa za neku vrijednost od aritmetičke sredine njegove skupine ispitanika od 30-49 godina

b) aritmetička sredina koncentracije kolesterola skupine od 30-49 godina odstupa za neku vrijednost od zajedničke aritmetičke sredine sve četiri skupine ispitanika

Dakle, za analizu varijance bitan je odnos variranja izmeñu i unutar skupina. Izračunava se tzv. F-vrijednost testa:

us

is

V

VF =

Vis – varijanca izmeñu skupina Vus – varijanca unutar skupina

Iz formule je vidljivo da što je veće variranje rezultata izmeñu skupina ispitanika u odnosu na variranje unutar skupina, to je F omjer veći. Što je veći F-omjer, uz pripadajuće stupnjeve slobode, to je i opravdanije odbacivanje nul-hipoteze. Na sljedećoj je slici prikazan jedan od tipičnih primjera distribucija rezultata zavisne varijable (npr. koncentracije leukocita) za četiri kategorije nezavisne varijable (npr. različitih vrsta leukemije), kada se rezultati značajno preklapaju.

X X1 3

_ _X2

_X_

4

SLIKA 3.4.. Prikaz distribucija rezultata zavisne (metričke) varijable za 4 kategorije nezavisne (kvalitativne) varijable. Slika prikazuje slučaj značajnog preklapanja rezultata pojedinih skupina. Varijabilitet izmeñu skupina (Vis) je manji od varijabiliteta unutar skupina (Vus).

Iz slike je vidljivo značajno preklapanje rezultata pojedinih skupina jer je varijabilitet izmeñu skupina (Vis) manji od varijabiliteta unutar skupina (Vus). Na sljedećoj je slici

Page 34: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

28

vidljiva obrnuta situacija: jasna razlika izmeñu skupina očituje se zbog većeg varijabiliteta izmeñu skupina (Vis) u odnosu na varijabilitet unutar skupina (Vus).

SLIKA 3.5. Prikaz distribucija rezultata zavisne (metričke) varijable za 4 kategorije nezavisne varijable. Slika prikazuje značajno razlikovanje rezultata pojedinih skupina. Rezultati meñu skupinama se ne poklapaju jer je varijabilitet izmeñu skupina (Vis) veći od varijabiliteta unutar skupina (Vus).

Osnovna mjera koju dobijemo nakon provedene analize varijance je omjer varijance meñu skupinama i varijance unutar skupina. Slično smo imali i kod t-testa. U svakom slučaju logika je ista: dobije se odreñena vrijednost F-omjera, pripadajući stupnjevi slobode (df) i p-vrijednost (koja se tumači na isti način kao i kod svih ostalih statističkih testova).

PRIMJER 3.4. Jedan od primjera primjene analize varijance je u slučaju kada želimo utvrditi da li postoji razlika izmeñu različitih dobnih skupina u vrijednostima sistoličkog tlaka nakon maksimalnog opterećenja. Znači, imamo ispitanike koji pripadaju različitim kategorijama dobne skupine, te bi prema tome shematski analiza trebala izgledati kao na slijedećoj slici.

Ako se podsjetimo, kod t-testa smo imali samo dvije skupine izmeñu kojih smo testirali da li postoji statistički značajna razlika, dok kod analize varijance imamo nezavisnu varijablu koja ima više kategorija. Prema tome u ovom konkretnom slučaju gledamo da li postoji statistički značajna razlika izmeñu različitih dobnih skupina (kojih ima 5) glede sistoličkog tlaka nakon opterećenja. Imamo sve pretpostavke za korištenje analize varijance i to: nezavisnu varijablu koja ima više razina (kategorija) i zavisnu varijablu koja je metrička (sistolički tlaka u mmHg).

Page 35: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

3. USPOREDBE METRIČKIH VARIJABLI

29

Za primjenu analize varijance i tumačenje značajnosti razlika važno je napomenuti i tzv. post hoc testiranja. Naime, ako dobijemo F-omjer koji je značajan, to znači da se promatrane skupine statistički značajno razlikuju u istraživanoj varijabli. No, još ne možemo tvrditi izmeñu kojih parova je razlika značajna! Da bi provjerili izmeñu kojih parova postoji razlika, moramo primijeniti jedan od naknadih testova (post hoc) koji slijede nakon analize varijance.

Postoje različiti testovi (Scheffe, Tuckey, Duncan, Newman-Keuls…), jedni od najviše korištenih post hoc testova su Scheffeov test i HSD Tuckey test. No, potrebno je napomenuti da je Scheffeov post hoc test dosta strog ili 'konzervativan' za razliku od HSD Tuckey testa koji je podosta liberalan (izbor ovisi koju statističku pogrešku više želimo izbjeći: tipa 1 ili tipa 2).

Dakle, analiza varijance nije jednostavna metoda i uključuje niz modela:

� jednosmjerna (one-way) analiza varijance (ANOVA), s podvrstama za nezavisne i zavisne uzorke (repeated measures ANOVA)

� višesmjerna (multi-way) analiza varijance

� multifaktorska analiza varijance (MANOVA)

� analiza varijance s kontrolom kovarijabli (ANCOVA ili MANCOVA)

U gornjim se definicijama smjerovi odnose na nezavisnu varijablu (više smjerova znači više načina kategorizacije), a faktori na zavisnu varijablu (više faktora znači više zavisnih varijabli). Kako smo već definirali, složena analiza varijance uključuje i višesmjernu i multifaktorsku ANOVA-u. Kovarijabla u analizi varijance je metrička varijabla koja može imati utjecaja na rezultata analize jer nije podjednako distribuirana po nezavisnim varijablama. U ANCOVI (MANCOVI) se njen utjecaj matematički odračunava. U višesmjernoj ANOVA-i postoji mogućnost istraživanja meñudjelovanja (interakcije) izmeñu nezavisnih varijabli, kao u primjeru koji slijedi.

PRIMJER 3.5. U jednom istraživanju nastojalo se ispitati da li u funkciji dobi i spola postoje razlike u brzini procesiranja vizualno prostornih informacija. Primjenjen je test koji ispituje brzinu jednostavne konvergentne vizualne orijentacije koristeći CRD računalnu psihodijagnostički skup testova. Ispitanici su bila djeca u dobi od 11 do 15 godina, s tim da je u svakoj od 5 dobnih skupina bilo ukupno 50 djece. Postavlja se pitanje, da li osim razlike po dobi i spolu, postoji interakcija izmeñu navedenih zavisnih varijabli, npr. da li je utjecaj dobi vezan samo za jedan spol.

Slika prikazuje razvojne krivulje promjene u funkciji dobi, zasebno za dječake i djevojčice. Pojedine točke su transformirane (tzv. z-vrijednosti) za jedan od testova CRD serije.

Page 36: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

30

Promjene brzine rješavanja testa konvergentne vizualne orijentacije CRD-21 u funkciji dobi, posebno za za pojedini spol. U sljedećoj tablici su prikazani rezultati provedene analize varijance.

Analiza varijance za vrijeme rješavanja CRD-21 testa konvergentne vizualne orijentacije (zavisna varijabla) u funkciji dobi i spola (nezavisne varijable). Prikazano je i meñudjelovanje nezavisnih varijabli (interkacija).

Stupnjevi slobode

Varijanca izmeñu skupina

Varijanca unutar skupina

F p

Spol 1 ,02 ,67 ,03 ,859 Dob 4 25,39 ,67 37,64 ,000 Interakcija 4 ,55 ,67 ,82 ,513

Dakle, postoji statistički značajna razlika izmeñu dobnih skupina (F=37.64, p<0.01), ali ne postoji značajna razlika izmeñu spolova (F=0.82, p>0.05), niti postoji meñudjelovanje dobi i spola. No, iako znamo da postoji statistički značajna razlika izmeñu dobnih skupina, ne znamo izmeñu kojih. Zato moramo provesti post hoc analizu. U ovom primjeru izabrat ćemo Scheffeov test.

Scheffeov test, prikaz značajnosti razlika meñu pojedinim skupinama ispitanika u odnosu na ukupno vrijeme rješavanja testa jednostavne vizualne orijentacije

Page 37: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

3. USPOREDBE METRIČKIH VARIJABLI

31

Iz priložene tablice možemo točno očitati izmeñu kojeg para postoji statistički značajna razlika, jedna od onih koje uvjetuju značajan F omjer za dob.

3.5 Neparametrijske inačice ANOVE: nezavisni uzorci

Ukoliko nisu zadovoljeni uvjete za korištenje parametrijskih testova, kod istraživačkih nacrta s više nezavisnih uzoraka koristimo neparametrijske inačice.

Često korišteni testovi u okviru neparametrijskih inačica za više nezavisnih uzoraka su prošireni medijan test, te posebno Kruskal-Wallis test (K-W).

Kruskal-Wallis test je u osnovi zamjena za analizu varijance. Za razliku od analize varijance K-W test koristi rangove umjesto 'sirovih' podataka. K-W test koristi više informacija od proširenog medijan testa, te je po svojoj prirodi 'snažniji' test. Prema tome, može se dogoditi da prošireni medijan test neda značajnu razliku izmeñu više uzoraka u promatranom mjerenju, dok isti rezultati kod K-W testa pokazuju značajnu razliku.

Kruskal-Wallis test u osnovi usporeñuje medijane dvaju ili više nezavisnih uzoraka. Značajn rezultat testa znači statistički značajno različite medijane. Interpretacija K-W testa jednaka je interpretaciji analize varijance, osim što je K-W test neparametrijski test baziran na medijanu, a ne na aritmetičkoj sredini.

Tipična situacija kada koristimo Kruskal-Wallis test je:

� podaci su nezavisni � podaci mogu biti ordinalni � distribucije podataka ne moraju biti normalne � varijance pojedinih skupina rezultata ne moraju biti jednake � uzorci trebaju biti slične, ali ne nužno i jednake veličine

PRIMJER 3.6. U jednom su eksperimentalnom nacrtu istraživači nastojali ispitati kako različiti lijekovi utječu na stupanj otvorenosti kapaka kod zečeva (anti-imflammatory effects). Na svakoj od 4 skupine po 6 zečeva primijenjen je jedan od 4 različita lijeka. Stupanj otvorenosti oka 15 minuta nakon apliciranja lijeka mjeren je na skali od 4 stupnja: 0 – oko potpuno otvoreno, 1-2 – procjena srednje zatvorenosti oka, 3 – oko potpuno zatvoreno. Podaci su:

I skupina II skupina III skupina IV skupina

Indomethicin Aspirin Piroxicam BW755C

Zec Rezultat Rang Zec Rezultat Rang Zec Rezultat Rang Zec Rezultat Rang

1 +2 13,5 1 +1 9 1 +3 20 1 +1 9

2 +3 20 2 +3 20 2 +1 9 2 0 4

3 +3 20 3 +1 9 3 +2 13,5 3 0 4

4 +3 20 4 +2 13,5 4 +1 9 4 0 4

5 +3 20 5 +2 13,5 5 +3 20 5 0 4

6 0 4 6 +3 20 6 +3 20 6 -1 1

Kod Kruskal-Wallis testa je važno vidjeti visinu H vrijednosti i pripadajuću p vrijednost. U ovom primjeru H vrijednost iznosi 11.804 i p<0.01.

Page 38: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

32

3.6 Neparametrijske inačice ANOVE: zavisni uzorci

Kada ne postoje uvjeti za korištenje parametrijske statistike, a imamo više zavisnih uzoraka ili mjerenja, koristimo jedan od testova neparametrijske statistike za više zavisnih uzoraka: Friedmanov test, Fergusonov test monotonije trenda ili Cochranov Q test.

Najčešće se koristi Friedmanov test, kojem odgovara parametrijska medoda analize varijance za zavisne uzorke. Dakle, za Friedmanov test nije bitan oblik distribucije, niti jednakost varijance promatranih zavisnih mjerenja. Koncept Friedmanovog testa svodi se na pretvaranje rezultata u rangove, a oni koji imaju isti rang dobivaju tzv. vezani ili zajednički rang. Važan statistički parametar je hi-kvadrat vrijednost s pripadajućim stupnjevima slobode, koji se računaju kao k-1 (gdje je k broj ponovljenih mjerenja) i, naravno, odgovarajuća p- vrijednost.

PRIMJER 3.7. Konzilij od 10 liječnika procjenjivao je uspješnost tri terapeutska zahvata (A, B i C) na skali od 1 do 10 (1 označava potpuno neuspješno, 10 potpuno uspješno):

Ocjene Rang

Liječnik A B C A B C 1 2 3 4 5 6 7 8 9 10

9.0 9.5 5.0 7.5 9.5 7.5 8.0 7.0 8.5 6.0

7.0 6.5 7.0 7.5 5.0 8.0 6.0 6.5 7.0 7.0

6.0 8.0 4.0 6.0 7.0 6.5 6.0 4.0 6.5 3.0

3 3 2 2.5 3 2 3 3 3 2

2 1 3 2.5 1 3 1.5 2 2 3

1 2 1 1 2 1 1.5 1 1 1

Postavlja se pitanje da li postoji razlika izmeñu uspješnosti 3 terapije prema procjenama liječnika?

Rezultati Friedmanovog testa su χ2=12.33 i p<0.05. Prema tome, postoji statistčki značajna razlika u uspješnosti postupaka prema liječničkoj prosudbi.

Page 39: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

3. USPOREDBE METRIČKIH VARIJABLI

33

Odnos izmeñu χ2 vrijednosti dobivene Friedmanovim testom i njegove značajnosti.

Friedmanov test koristimo kada imamo veći broj eksperimentalnih situacija ili ponovljenih mjerenja. U slijedećem primjeru prikazan je način na koji aplikacija Statistica prikazuje rezultate Friedmanovog testa.

Page 40: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

34

PRIMJER 3.8. Dvadeset majki zajedno sa svojom gluhom djecom polazili su seminar o treniranju odnosa prema djeci s poteškoćama u razvoju. Trinaest nepristranih članova voditelja seminara rangirali su majke prema stupnju uspješnosti odnosa prema djeci. Interesira nas da li postoje razlike izmeñu voditelja seminara u prosudbi poretka uspješnosti roditeljskog odnosa te skupine majki. Dakle, isiti skup majki prosuñen je više puta (ponovljena mjerenja). Rezultati su:

Primjenom Friedmanovog testa pomoću aplikacije Statistica dobiva se:

Dakle, Friedmanov testa pokazuje statistički značajan hi-kvadrat (χ2=139.98, p<0.01), iz čega zaključujemo da razni ocjenjivači različito rangiraju majčinske odnose.

Page 41: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

3. USPOREDBE METRIČKIH VARIJABLI

35

Sljedeća tablica sumarno prikazuje odnose izmeñu parametrijskih i neparametrijskih metoda usporedbe metričkih varijabli.

TABLICA 3.1. Usporedni prikaz parametrijskih i odgovarajućih neparametrijskih metoda usporedbe metričkih varijabli izmeñu više skupina (kategorija).

Neparametrijska metoda Svrha Parametrijska metoda Test predznaka (Sign test) Testiranje razlike izmeñu zavisnih

uzoraka t-test za zavisne uzorke

Wilkoxonov test ekvivalentnih parova

Testiranje razlike izmeñu zavisnih uzoraka

t-test za zavisne uzorke

Wilkoxonov T-test Alternativa za Mann-Whitney U test

t-test za nezavisne uzorke

Mann-Whitney U test Kendall S test

Usporedva dva nezavisna uzorka t-test za nezavisne uzorke

Kruskal-Wallisov test Usporedba nekoliko nezavisnih grupa

ANOVA za nezavisne uzorke

Friedmanov test Usporedba više od dva zavisna uzorka

ANOVA za zavisne uzorke (ponovljena mjerenja)

Page 42: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

36

Page 43: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

4. POVEZANOSTI KATEGORIJSKIH VARIJABLI

37

4. POVEZANOSTI KATEGORIJSKIH VARIJABLI

4.1 Hi-kvadrat test

Hi-kvadrat testom nastojimo izračunati postoji li statistički značajna povezanost u učestalostima (frekvencijama) dviju kategorijskih varijabli, ili izmeñu dobivenih (opaženih) učestalosti i učestalosti koje očekujemo pod odreñenom hipotezom. Hi-kvadrat test isključivo koristi učestalosti (frekvencije) i nije dopušteno unositi nikakve mjerne jedinice (za razliku usporedbi aritmetičkih sredina ili računanja korelacija, gdje podaci mogu biti izraženi u proizvoljnim mjernim jedinicama).

Dakle, hi-kvadrat (χ2- test) test se koristi u slučajevima:

• kada su podaci svih varijabli kvalitativni i

• rezultati izraženi u frekvencijama (učestalostima) pojedinih odgovora,

za testiranje:

• povezanosti izmeñu dviju kvalitativnih (kategorijske) varijable

• odstupanja dobivenih učestalosti pojavljivanja jedne varijable od očekivanih.

U praksi, ovisno o prirodi mjerenja (zavisni ili nezavisni uzorci) i broju varijabli, hi-kvadrat test može imati sljedeća tri modaliteta:

1. Hi-kvadrat test za nezavisne uzorke: postoje učestalosti dvaju obilježja nezavisnih uzoraka, te želimo ustanoviti njihovu povezanost (npr. da li je spol povezan s pušačkom navadom).

2. Hi-kvadrat test za zavisne uzorke: postoje učestalosti dvaju dihotomnih obilježja zavisnih uzoraka, te želimo ustanoviti njihovu povezanost (npr. da li dvije dijagnostičke metode slično ocjenjuju postojanje bolesti u istih ispitanika).

3. Hi-kvadrat test hipoteze: Postoje učestalosti jedne kategorijske varijable, te želimo utvrditi odstupaju li dobiveni podaci od učestalosti koje očekujemo uz neku hipotezu (npr. da li učestalost infekcije salmonelom u našoj Županiji varira po mjesecima u godini).

Osnova za izračunavanje hi-kvadrat testa jest tzv. kontingencijska tablica, koja prikazuje sve moguće kombinacije zajedničkog pojavljivanja promatranih obilježja. Te stvarne učestalosti zajedničkog pojavljivanja obilježja usporeñujemo s teoretski očekivanim učestalostima pod nul-hipotezom da promatrana obilježja nisu povezana.

Page 44: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

38

Formula za izračunavanje hi-kvadrata je:

∑−

=t

t

f

ff 202 )(

χ

f0 – opažene učestalosti ft – očekivane ili teoretske učestalosti

• Ako nema razlika izmeñu opaženih i očekivanih frekvencija hi-kvadrat jednak je nuli.

• Što je hi-kvadrat veći, to je vjerojatnije da nul- hipotezu treba odbaciti, tj. da su promatrana obilježja povezana.

Rezultati testa su vrijednost hi-kvadrata, stupnjevi slobode i pripadajući p.

Za tablicu s m redaka i n stupaca formula za računanje stupnjeva slobode je:

df = (m-1)(n-1)

Općenito, ako s f0(m,n) označimo opaženu učestalost na mjestu m-tog retka i n-tog stupca, jednostavnim zaključivanjem dolazimo do zaključka da se očekivana učestalost ft(m,n) dobiva iz opaženih učestalosti po formuli:

f0(m,n)=

zbroj opaženih učestalosti m-tog retka x zbroj opaženih učestalosti n-tog stupca/zbroj svih učestalosti

Interpretacija značajnosti hi-kvadrat testa jednaka je kao i kod ostalih testova i ovisi koju smo razinu značajnosti (95%, 99% ili neku drugu) uzeli kao okvirnu granicu za prihvaćanje ili odbacivanje nul hipoteze.

Uvjet za primjenu hi-kvadrat testa je da su sve očekivane frekvencije 5 ili veće. Ako to nije ispunjeno, a imamo kontingencijsku tablicu 2x2, valja koristiti tzv. Fisherov egzaktni test. O tome bi trebala voditi računa statistička aplikacija.

Većina statističara predlaže tzv. korekciju kontinuiteta ili Yatesovu korekciju u formuli za računanje hi-kvadrat vrijednosti za tablice 2x2. Prerañena formula, koja daje nešto niže vrijednosti hi-kvadrata (osobito za male razlike izmeñu opaženih i očekivanih frekvencija) je:

∑−−

=t

t

f

ff 202 )5.0(

χ

PRIMJER 4.1. U jednom istraživanju nastojalo se vidjeti da li prehrana bolesnika utječe na pojavu kardiovaskularne bolesti. U istraživanju je sudjelovalo 23 ispitanika. Od ukupno 15 ispitanika koji su bili na prehrani s visokim kolesterolom, u njih 11 razvila se kardiovaskularna bolesti, kao i u 2 od osam ispitanika koji su koristili prehranu s niskom razinom kolesterola. Sljedeća kontigencijska tablica prikazuje sve moguće kombinacije učestalosti promatrane dvije dihotomne varijable (2x2=4).

Kardiovaskularna bolest

DA NE ukupno

Page 45: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

4. POVEZANOSTI KATEGORIJSKIH VARIJABLI

39

visoka 11 4 15 Razina kolesterola u prehrani niska 2 6 8

ukupno 13 10 23

Unošenjem pripadnih vrijednosti u tablicu 2x2 u aplikaciji Statistica dobivamo vrijednost hi-kvadrat testa od 4.96 i pripadajući p=0.026. Uzmemo li razinu značajnosti od 95%, možemo razvoja kardiovaskularne bolesti. Ovo je primjer hi-kvadrat testa za nezavisne uzorke.

PRIMJER 4.2. U jednoj klinici nastojalo se ispitati da li se dobivene (opažene) učestalosti učinaka psihoterapije značajno razlikuju od onih koje bismo očekivali pod pretpostavkom da liječenje nema stvarnih učinaka. U istraživanju je bilo ukupno 100 ispitanika i distribucija odgovora je vidljiva na slijedećoj kontigencijskoj tablici:

Stanje nakon psihoterapije Bolje Lošije Isto Ukupno Stvarne učestalosti 45 25 30 100 Očekivane učestalosti 33.33 33.33 33.33 100

Hipotetski se očekuju podjednake učestalosti stanja nakon psihoterapije: 100:3=33.33.

Hi-kvadrat vrijednost je:

5.633.33

)33.3330(

33.33

)33.3325(

33.33

)33.3345( 2222 =

−+

−+

−=χ , df=3-1=2, p=0.039

Dobivena vrijednost hi-kvadrat testa je statistički značajna, uz razinu značajnosti od 95% (p<0.05). Prema tome, opažene frekvencije pojedinih stanja nakon psihoterapije se značajno razlikuju od teoretskih. Prema tome, vidljiv je značajan broj slučajeva da je bolesnicima nakon psihoterapije bilo bolje.

Ovo je primjer hi -kvadrat testa hipoteze.

PRIMJER 4.3. U jednom istraživanju u području dijagnostike nastojalo se vidjeti da li postoji razlika izmeñu dvije dijagnostičke metode u otkrivanju jedne bolesti. U istraživanju je sudjelovalo ukupno 100 ispitanika. U kontingencijskoj tablici s oznakom + označeni su ispitanici s pozitivnim nalazom, a s oznakom – ispitanici s negativnim nalazom.

Dijagnostička m. I - +

+ 40 (A) 15 (B) Dijagnostička m. II - 20 (C) 25 (D)

Dakle, postavlja se pitanje postoji li značajna razlika izmeñu rezultata dijagnostičke metode I i II. U kontigencijskoj tablici je vidljivo da se dobivene razlike nalaze u ćelijama A i D. Naša je teoretska hipoteza da ukupan broj ispitanika po kojima se ne slažu dijagnostičke metode I i II u ćelijama A i D treba biti podjednak. U ćelijama B i C su oni ispitanici po kojima se slažu dijagnostičke metode I i II.

Prerañena formula za hi-kvadrat test u ovom slučaju za zavisne uzorke glasi:

DA

DA

+

−−=

22 )1(

χ

Page 46: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

40

ako naše podatke uvrstimo u formulu dobivamo:

02.365

14

2540

)12540( 222 ==

+

−−=χ

Za ovaj primjer uzet ćemo razinu značajnosti hi kvadrat testa od 95%. Broj stupnjeva slobode (za 2x2 tablicu) je 1 i granična vrijednost da bi hi-vadrat bio značajan na razini od 95% je 3.841. Vrijednost hi kvadrat testa koju smo dobili u ovom istraživanju je manja od 3.841 i prema tome p>0.05. Dakle, prihvaćamo nul hipotezu i kažemo da uz razinu značajnosti od 95% ne postoji statistički značajna razlika izmeñu dijagnostičkih metoda I i II. Ovo je primjer hi-kvadrat testa za zavisne uzorke, koji se još naziva Mc-Nemmarin test.

Page 47: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

5. UPORABE KONTINGENCIJSKIH TABLICA U MEDICINI

41

5. UPORABE KONTINGENCIJSKIH TABLICA U MEDICINI

Kontingencijske tablice prikazuju sve kombinacije mogućih vrijednosti dvije kategorijske varijable. U prethodnom je poglavlju opisana njihova uporaba u testiranju povezanosti dvaju opisnih svojstava (kategorijskih varijabli).

Općenito, kontingencijske se tablice u medicini koriste u tri slučaja:

• testiranja statističke značajnosti povezanosti opisnih svojstava

• procjene valjanosti dijagnostičkih metoda

• procjene intenziteta povezanosti opisnih svojstava

5.1. Valjanost dijagnostičkih metoda

Često se rezultat medicinskog dijagnostičkog postupka da svesti na jedno od dvoje: 1. prisutnost bolesti ili simptoma ili 2. normalan nalaz. U tom je slučaju ishod postupka kategorijska, dihotomna varijabla. Često se kaže da je rezultat testa pozitivan (bolest prisutna) ili negativan (normalan nalaz).

Vrlo je iznimno metoda savršeno točna. U pravilu se bolesnici (općenito, osobe s prisutnim simptomom) samo dijelom dijagnostički prepoznaju, dok na jedan dio njih otpadaju tzv. lažno negativni nalazi. Slično, testovi zdravih (normalnih) ispitanika jednim dijelom pokažu tzv. lažno pozitivne nalaze.

Svi mogući odnosi izmeñu stvarnosti i dijagnostičkog rezultata čine jednu 2x2 tablicu:

DIJAGNOSTIČKI REZULTAT

pozitivan negativan

bolestan (A+B) stvarno pozitivan (A) lažno negativan (B)

zdrav (C+D) lažno pozitivan (C) stvarno negativan (D)

ukupno: N ispitanika A+C B+D

Znači, ukupan broj (N) ispitanika rasporeñen je prema rezultatima dijagnostičkog testa (2 mogućnosti) i stvarnosti (2 mogućnosti) u 2x2= 4 razreda, te predstavlja jednu kontingencijsku tablicu. Odmah nam se nameće mogućnost da hi-kvadrat testom za vezane uzorke provjerimo da li je uopće dijagnostički test značajno povezan sa stvarnošću, ili su njegovi rezultati slučajni. No, to je najčešće bespredmetno.

Page 48: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

42

Test koji ima relativno malo lažno negativnih rezultata ima veliku moć detekcije bolesti, te kažemo da ima veliku osjetljivost. Osjetljivost testa se definira kao proporcija bolesnika koji će biti prepoznati testom, tj. udio pozitivnih nalaza u svim nalazima bolesnika:

osjetljivost = broj stvarno pozitivnih nalaza (A)/ukupan broj bolesnika (A+B)

Test koji ima relativno malo lažno pozitivnih rezultata ima veliku moć isključenja bolesti, te kažemo da ima veliku specifičnost. Specifičnost testa se definira kao proporcija zdravih koji će biti prepoznati testom, tj. udio negativnih nalaza u svim nalazima zdravih osoba:

specifičnost = broj stvarno negativnih nalaza (D)/ukupan broj zdravih (D+C)

Osjetljivost i specifičnost su brojevi u rasponu od 0-1 i mogu se izražavati u postocima.

Važno je uočiti (pokažite za vježbu) da se osjetljivost i specifičnost daju izraziti i kao: osjetljivost = 1 - udio lažno negativnih nalaza u bolesnika, tj. osjetljivost (%) = 100% - postotak lažno negativnih nalaza u zdravih specifičnost = 1- udio lažno pozitivnih nalaza u zdravih, tj. specifičnost (%) = 100% - postotak lažno pozitivnih nalaza u zdravih PRIMJER 5.1. U trogodišnjem razdoblju u jednoj klinici 130 bolesnika podvrgnuto je operacijskom zahvatu na lumbalnoj kralježnici. Osamdesetoro njih imalo je herniju lumbalnog diska, a drugi ostale smetnje. Svim je bolesnicima prije operacije učinjena kompjuterizirana tomografija lumbalne kralježnice (CT). Glede hernije, CT nalaz je bio pozitivan u 56 bolesnika s hernijom i u 10 bolesnika bez hernije.

REZULTATI CT-A pozitivan negativan bolesnici s hernijom (80) 56 24 bolesnici bez hernije (50) 10 40 Ukupno: 130 66 64

Na ovom primjeru procjenjujemo da u dijagnostici hernije lumbalnog diska CT ima: osjetljivost=56/80=0.7 (70%), specifičnost=40/50=0.8 (80%). Udio lažno negativnih nalaza je 0.3 (30%), a lažno pozitivnih 0.2 (20%). Uočimo da ovdje bolestan znači “ima herniju”, a zdrav “nema herniju”, bez obzira što se u oba slučaja radi o bolesniku koji je operiran radi problema s lumbalnom kralježnicom.

U praksi dijagnostičku metodu primjenjujemo prije nego što doznamo stvarno stanje. Ponekad stvarno znanje nije sigurno poznato, već smo, pored ispitivane metode primijenili tzv. referentnu metodu čiji su rezultati vrlo vjerojatno točni. Referentna se metoda rutinski rjeñe koristi zbog skupoće, invazivnosti ili nedostupnosti.

Page 49: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

5. UPORABE KONTINGENCIJSKIH TABLICA U MEDICINI

43

POGREŠKE I OGRANIČENJA PROCJENA VALJANOSTI

Osjetljivost i specifičnost ne možemo smatrati varijablama koje podliježu statističkim slučajnostima uzorkovanja. Naime, u kojoj će mjeri test krivo prepoznati bolesnika ili zdravu osobu većim je dijelom rezultat sistemskih pogrešaka, koje se na daju statistički opisati (za razliku od slučajnih pogrešaka).

Naravno, odreñeni će test puno lakše prepoznati bolesnika u uznapredovaloj fazi bolesti nego bolesnika sa slabo izraženim morfološkim ili funkcijskim promjenama. Zato je procjena osjetljivosti testa primjenjiva na širu populaciju samo ako su u bolesnici u tom istraživanju reprezentativni glede faze ili stupnja bolesti. Procjena specifičnosti o tome ne ovisi (razmislite zašto!).

Bitno je uočiti da se osjetljivost testa odnosi samo na bolesnike, a specifičnost samo na zdrave ispitanike. To povlači da su osjetljivost i specifičnost parametri koji ne ovise o udjelu bolesnika u istraživanom uzorku. Relativne udjele bolesnika i zdravih osoba ne znamo, jer ne znamo da li je odreñena osoba bolesna ili zdrava (zato i primjenjujemo dijagnostičku metodu). Često se istraživanja valjanosti dijagnostičkih metoda oslanjaju na uzorke u kojima je udio bolesnika veći nego u općoj populaciji, ili nije poznato da li je usporediv. Zato je bitno da parametri koji opisuje valjanost metode ne ovise o reprezentativnosti uzorka glede udjela bolesnika i zdravih osoba.

Osim osjetljivosti i specifičnosti postoje i drugi parametri koji opisuju valjanost dijagnostičkog testa, koji, meñutim, imaju ograničeniju primjenu, upravo zbog toga što ovise o relativnim udjelima bolesnika i zdravih osoba.

Komponenta slučajne pogreške uzorkovanja može se procijeniti, te se ponekad osjetljivost i specifičnost istraživanja iznose zajedno s pripadnim intervalima pouzdanosti. Pri tome se koriste standardne pogreške proporcija. Nadalje, moguće je dvije dijagnostičke metode usporeñivati prema tome koja ima bolju osjetljivost i specifičnost. Pri tome, ako se radi o nevezanim uzorcima (jedni ispitanici evaluirani jednom, a drugi drugom metodom), koristimo hi-kvadrat test samo bolesnike (kada usporeñujemo osjetljivosti), odnosno samo zdrave bolesnike (kada usporeñujemo specifičnosti). Ako se radi o vezanim uzorcima (isti ispitanici evaluirani objema metodama), koristimo Mc-Nemmarin test.

OSTALI PARAMETRI VALJANOSTI TESTA

Točnost dijagnostičkog testa definira kao udio točno dijagnosticiranih u cjelokupnom uzorku ispitanika. Dakle:

točnost = broj točnih nalaza (A+D) /ukupan broj ispitanika (N) Točnost je parametar koji bitno ovisi o relativnim udjelima bolesnika i zdravih ispitanika u ukupnom uzorku na kojemu je metoda primijenjena. Npr. visoko-specifičan test bit će i vrlo točan samo ako pretežu zdravi ispitanici, kada su rezultati testa pouzdani. Prema tome točnost testa ne karakterizira samo metodu, već i istraživanje na koje se odnosi. Osjetljivost (specifičnost) govori kolika je vjerojatnosti da će dijagnostička metoda prepoznati bolesnika (zdravu osobu). Osjetljivost i specifičnost dobro opisuju metodu, ali nisu direktno primjenjive na pojedinca, o kome ne znamo da li je bolestan ili zdrav. U

Page 50: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

44

praksi liječnik je suočen s osobom koja je napravila dijagnostički postupak i dolazi s pozitivnim ili negativnim nalazom. Zato se definiraju sljedeći parametri testa: Pozitivna prediktivna vrijednost testa je vjerojatnost da pozitivan nalaz testa znači da je osoba stvarno bolesna. Računski se dobiva kao omjer izmeñu stvarno pozitivnih i svih pozitivnih nalaza, tj.: pozitivna prediktivna vrijednost = = broj stvarno pozitivnih nalaza (A) /broj svih pozitivnih nalaza (A+C)

Negativna prediktivna vrijednost testa je vjerojatnost da negativan nalaz testa znači da je osoba stvarno zdrava. Računski se dobiva kao omjer izmeñu stvarno negativnih i svih negativnih nalaza, tj.: negativna prediktivna vrijednost = = broj stvarno negativnih nalaza (D) /broj svih negativnih nalaza (B+D)

Za razliku od osjetljivosti i specifičnosti, točnost, te pozitivna i negativna prediktivna vrijednost testa odreñuju se prema rezultatima i bolesnih i zdravih ispitanika, te njihove vrijednosti ovise o relativnim udjelima tih skupina u cijelom uzorku. Stoga je njihova uporaba ograničena na:

1. istraživanja gdje očekujemo reprezentativnu zastupljenost bolesnika u uzorku ili

2. na istraživanja kada je poznata zastupljenost bolesti u općoj populaciji.

PRIMJER 5.2. Novi biokemijski test trudnoće uveden je u jedan laboratorij opće prakse. U razdoblju od 2 mjeseca testirano je ukupno 320 žena. Test je bio pozitivan u 182 i negativan u preostale 132 ispitanice. Naknadnim ultrazvučnim pregledima svih 320 žena ustanovljeno je da se trudnoća razvila u 132 žene s pozitivnim i u 34 žene s negativnim nalazom.

REZULTATI TESTA TRUDNOĆE pozitivan negativan trudnice (166) 132 34 žene koje nisu trudne (154) 50 104 Ukupno: 320 182 138

Na ovom primjeru procjenjujemo da u dijagnostici trudnoće metoda ima:

osjetljivost=132/166=0.8 (80%) specifičnost=104/154=0.68 (68%) točnost=(132+104)/320= 0.74 (74%) pozitivnu prediktivnu vrijednost=132/182=0.73 (73%) i negativnu prediktivnu vrijednost=104/138=0.75 (75%)

Za razliku od primjera 5.1. ovaj je primjer tipičan za istraživanja gdje je zastupljenost “bolesnika” (trudnica) u ukupnom uzorku vjerojatno tipična za populaciju na koju želimo primijeniti rezultate (žene koje dolaze u ambulantu radi testiranja trudnoće). Zato ovdje ima smisla, pored osjetljivosti i specifičnosti deklarirati i ostale parametre testa.

Page 51: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

5. UPORABE KONTINGENCIJSKIH TABLICA U MEDICINI

45

BAYESOV TEOREM

Ako želimo procijeniti prediktivne parametre testa u istraživanjima poput primjera 5.1., rezultate istraživanja moramo kombinirati s nezavisnim podatkom: zastupljenošću bolesti u populaciji na koju istraživanje želimo primijeniti. U primjeru 5.1. to je zastupljenost hernije lumbalnog diska u općoj populaciji, ili u osoba koje imaju simptome bolesti donjeg dijela kralježnice, ovisno koja nas populacija zanima.

U biti, na osnovu podatka o zastupljenosti bolesti u referentnoj populaciji, metoda simulira rezultate istraživanja koji bi se odnosili na uzorak iste veličine, ali s relativnim zastupljenostima poput referentne. Bez ulaženja u detalje, korigirana formula daje iste vrijednosti osjetljivosti i specifičnosti, ali se prediktivne vrijednosti izražavaju koristeći tzv. Bayesov teorem kao:

ost)zastupljenst)(1specifično(1ostzastupljenxstosjetljivo

ostzastupljenxstosjetljivo

vrijednostaprediktivnpozitivna

−−+=

=

ost)zastupljen(1x st specifičnoostzastupljenxst)osjetljivo-(1

ost)zastupljen1(xstspecifično

vrijednostaprediktivnn

−+−

=

=egativna

Kao parametri valjanosti testa koji ne ovise o zastupljenosti bolesnika u uzorku danas se sve više koriste pozitivni i negativni omjeri izglednosti (likelihood ratios). Omjeri izglednosti govore koliko je puta vjerojatnije da se će se odreñeni rezultat testa (pozitivan ili negativan) pojaviti u bolesnika nego u zdravog ispitanika. Tako je:

pozitivni omjer izglednosti =

vjerojatnost pozitivnog nalaza u bolesnika/vjerojatnost pozitivnog nalaza u zdrave osobe =

= osjetljivost / (1-specifičnost)

negativni omjer izglednosti =

vjerojatnost negativnog nalaza u bolesnika/vjerojatnost negativnog nalaza u zdrave osobe =

= (1-osjetljivost)/specifičnost

Još se korisno upoznati sa statističkim konceptom šanse (odds). Šansa je vjerojatnost nekog ishoda (p) podijeljena sa svojim komplementom (1-p). Dakle, dok su vjerojatnosti brojevi u intervalu od nula do jedan, šansa može biti bilo koji pozitivan broj. Jedan je od iskaza Bayesovog teorema:

Page 52: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

46

šansa točne pozitivne (negativne) predikcije =

pozitivni (negativni) omjer izglednosti x zastupljenost

KAKO IZGLEDA PRAKSA

Do sada smo razmatrali idealan, jednostavan slučaj kada je rezultat dijagnostike decidiran i da se svesti na jednu od dvije tvrdnje: 1. bolest prisutna ili 2. bolest isključena. U praksi često nije tako, bilo da se radi o slikovnoj dijagnostici osjetljivoj na morfološke abnormalnosti ili o laboratorijskom, funkcijskom nalazu.

U laboratorijskoj dijagnostici vrijednosti zdrave i bolesne populacije dijelom se preklapaju i nije moguće postaviti prag koji ih potpuno razdvaja (SLIKA 5.1). Kada se npr. daje nalaz koncentracija nekog hormona u serumu, navodi se područje normalnih vrijednosti, čije su granice donji i gornji prag. Općenito, neku bolest karakteriziraju povišene, a drugu snižene vrijednosti hormona. Zbog toga što pojedine vrijednosti zdravih osoba mogu biti jako različite od većine drugih, obično područje normalnih vrijednosti ne uključuje čitav raspon vrijednosti u zdravih ispitanika (tzv. normale).

SLIKA 5.1. Idealan slučaj kada su distribucije vrijednosti dijagnostičkog testa zdravih i bolesnih osoba odvojene, bez preklapanja (a) u praksi gotovo da ne postoji. U realnosti se postavlja prag koji samo djelomično razdvaja podatke, zbog čega postoje lažno pozitivni i lažno negativni nalazi (b).

Uzmimo slučaj kada se bolest manifestira povišenim vrijednostima nekog hormona. Ukoliko gornji prag smanjujemo, sve više bolesnika ispravno dijagnosticiramo (sve manje je lažno negativnih nalaza), povećavajući osjetljivost metode. No istodobno je sve više nalaza zdravih osoba koje su izvan praga, tj. lažno pozitivnih nalaza, te se smanjuje specifičnost metode. Obrnuto se dogaña ako gornji prag podižemo (SLIKA 5.2).

→→→→ Dakle, odluka gdje ćemo postaviti prag ima suprotne učinke na osjetljivost i specifičnost metode.

Page 53: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

5. UPORABE KONTINGENCIJSKIH TABLICA U MEDICINI

47

SLIKA 5.2. Utjecaj izbora gornjeg praga normalnih vrijednosti na parametre valjanosti dijagnostičkog testa. Što je gornji prag niži manje je lažno negativnih, ali više lažno pozitivnih nalaza, te je osjetljivost testa veća, a specifičnost manja. Obrnuto, povećavajući gornji prag poboljšavamo specifičnost na štetu osjetljivosti.

Page 54: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

48

Grafički prikaz utjecaja variranja pragova normalnih vrijednosti na osjetljivost i specifičnost testa naziva se ROC (Receiver Operating Characteristics) krivulja, gdje svaka točka pripada jednom izboru praga, apscisa grafa je (1-specifičnost), a ordinata osjetljivost. Na ovaj se način dijagnostičke performanse prikazuju u potpunosti (SLIKA 5.3).

SLIKA 5.3. Grafički prikaz ovisnosti osjetljivosti i specifičnosti metode o pragu diskriminacije. Svaka točka krivulje odgovara jednom pragu. Potpune performanse dijagnostičke metode tim su veće što je površina ispod ROC krivulje bliža jedinici, kada je ROC krivulja spljoštena na vrh grafa (postojanje praga potpune diskriminacije: 100% osjetljivost i 100% specifičnost, snižavanjem praga osjetljivost ostaje 100%, specifičnost pada u nulu). Potpuna nepovezanost metode s istinom znači da se 100% osjetljivost može ostvariti samo s 0% specifičnošću i obrnuto; to odgovara pravcu na grafu, kada je površina ispod ROC krivulje 0.5.

ODABIR TESTA

Koji ćemo test izabrati u praksi i kakve ćemo kriterije postaviti za pozitivne i negativne nalaze ovisi o namjeni testa.

• Velika osjetljivost povlači da će test prepoznati većinu bolesnika. Obzirom da su lažno negativni rezultati rijetki, negativni nalaz testa vrlo je pouzdan. To je oslonac za pouzdano isključenje bolesti, što je važno kada je neprepoznavanje bolesti povezano s teškim posljedicama. Takvi se testovi često primjenjuju na cijelim populacijama u svrhu filtriranja bolesnika (engl. screening), osobito ako nisu skupi ili invazivni. Mana testa je nepouzdan pozitivan rezultat testa (mala specifičnost), koji zahtijeva dodatne pretrage prije definitivne dijagnoze. Uz takve testove vežu se nepotrebne naknadne pretrage i nepotrebna (kriva) liječenja dijela ispitanika.

• Velika specifičnost povlači da će test prepoznati većinu zdravih ispitanika. Obzirom da su lažno pozitivni rezultati rijetki, pozitivan nalaz testa vrlo je pouzdan. To je oslonac za pouzdanu potvrdu bolesti, što je važno kada je nepotrebno liječenje vezano s velikim

Page 55: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

5. UPORABE KONTINGENCIJSKIH TABLICA U MEDICINI

49

rizicima. Takvi se testovi najčešće koriste kod već probranih ispitanika, gdje postoji sumnja da je bolest prisutna. Zato cijena testa i eventualna invazivnost nisu primarni. Mana testa je nepouzdan negativan rezultat testa, kada bolest ne možemo isključiti.

Najčešće se definitivna dijagnoza donosi na osnovu rezultata više testova, od kojih neki imaju veliku osjetljivost, a drugi veliku specifičnost (SLIKA 5.4).

SLIKA 5.4. Opći princip dijagnostičkih algoritama. Populacija s malom vjerojatnošću ozbiljne bolesti filtrira se visoko osjetljivim, jeftinim i relativno bezopasnim testom. Rezultati su pozitivni u gotovo svih bolesnika, te se negativni nalaz može smatrati dokazom da bolest ne postoji. Pozitivan rezultat znači sumnju da bolest postoji, ali ne i dokaz, zbog mogućnosti lažno pozitivnog nalaza. Zbog toga se takve osobe, zajedno s osobama koji imaju druge pokazatelje bolesti, upućuju na visoko specifičan (često skup ili invazivan) test. Takov je test negativan u gotovo svih zdravih, te pozitivan rezultat upućuje na postojanje bolesti. Negativan rezultat visoko specifičnog testa nije pouzdan, zbog mogućnosti lažno negativnog nalaza. Zato tada nastavljamo s pretragama.

Page 56: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

50

6. POVEZANOST METRIČKIH VARIJABLI

6.1. Funkcije i povezanost

Matematički, funkcija je način (formula) kojim se odreñuje kako su vrijednosti neke veličine (zavisne varijable) odreñene vrijednostima jedne ili više drugih veličina (nezavisnih varijabli). Tako je npr. površina kvadrata (P) jednoznačno odreñena duljinom njegove stranice (a), na način:

P = a2

Možemo reći da je površina kvadrata funkcija njegove stranice. U ovom se slučaju radi o kvadratnoj funkciji, jer se vrijednosti zavisne varijable (P) dobivaju kvadriranjem vrijednosti nezavisne varijable (a). Ako os x koordinatnog sustava predstavlja moguće duljine stranica kvadrata (svi pozitivni realni brojevi), a os y odgovarajuće površine, dobivamo grafički prikaz (graf) gornje funkcijske zavisnosti, što predstavlja parabolu (SLIKA 6.1):

SLIKA 6.1. Graf ovisnosti površine kvadrata (P) o duljine njegove stranice (a) je parabola P=a2. Najjednostavnija je linearna funkcija, čiji je grafički prikaz pravac. Primjer linearne funkcije je ona koja povezuje dvije proporcionalne veličine, poput radnje i prijeñenog puta, puta i brzine (ili vremena) kod jednoliko ubrzanog gibanja, koncentracije lijeka u krvi i dane doze lijeka, itd. Uobičajeno je zavisnu varijablu označiti y, a nezavisnu x. Ako su te veličine proporcionalne, možemo reći da y ovisi o x (da je funkcija x-a) na način:

Page 57: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

6. POVEZANOST METRIČKIH VARIJABLI

51

y = b x

gdje je b konstanta proporcionalnosti. Graf koji prikazuje proporcionalne veličine je pravac koji prolazi kroz ishodište, jer, za nultu vrijednost nezavisne varijable, zavisna varijabla takoñer je jednaka nuli. Nagib tog pravca odreñen je konstantom proporcionalnosti b. Često je zavisna varijabla različita od nule kada je vrijednost nezavisne varijable jednaka nuli. Tada se ne radi o proporcionalnim veličinama, već o općenitoj linearnoj zavisnosti. Primjer je veza izmeñu početne koncentracije lijeka u krvi c i dane doze d, ako već, prije davanja lijeka u krvi postoji (od prije) neka početna koncentracija c0. Tada vrijedi jednadžba:

c = c0 + b d

U toj jednadžbi konstanta b ovisi o razrjeñenju lijeka (u plazmi, ekstracelularnoj tekućini, itd.). Dakle, općenito je zapis linearne funkcije:

y = a + b x

a grafički joj je prikaz pravac koji siječe os y u točki (0, a), nagiba odreñenog parametrom b. Pokažite da iz gornje jednadžbe slijedi da je parametar b jednak promjeni zavisne varijable koja odgovara jediničnoj promjeni nezavisne varijable, tj. b= y(x+1)-y(x), što je takoñer jednako svakom omjeru promjena nezavisne i zavisne varijable: ∆y/∆x (SLIKA 5.2).

SLIKA 6.2. Grafički prikaz linearno povezanih veličina: y = a + b x je pravac. Taj pravac siječe os y u točki (0, a), a nagib mu je odreñen konstantom b, koja je jednaka promjeni varijable y koja odgovara jediničnoj promjeni varijable x.

Page 58: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

52

Funkcije iskazuju stroge, zakonske (matematičke ili fizikalne) povezanosti dviju ili više veličina. U medicini se češće srećemo s približnim, djelomičnim povezanostima. Možemo reći da se vrijednosti zavisne varijable daju približno izračunati (predvidjeti, procijeniti) iz vrijednosti nezavisne varijable (ili varijabli). Donja tablica sadrži rezultate mjerenja tjelesne mase i volumena krvi u 8 zdravih, odraslih muškaraca (volumen krvi izmjeren je tehnikom razrjeñenja radioindikatora). TABLICA 6.1. Volumen krvi i tjelesna masa u 12 zdravih muškaraca

Ispitanik Masa (kg)

Volumen krvi (L)

1 58.0 4.58 2 70.0 4.77 3 74.0 5.62 4 63.5 4.60 5 62.0 4.34 6 70.5 5.82 7 71.0 5.08 8 66 5.2 9 81 5,6

10 75 5,6

11 78 5,8

12 72 5

Ti se podaci mogu prikazati i grafički, u koordinatnom sustavu, tako da volumen krvi bude ordinata, a masa apscisa.

Page 59: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

6. POVEZANOST METRIČKIH VARIJABLI

53

Slika 6.4. Grafički prikaz volumena krvi u odnosu na tjelesnu masu u 12 ispitanika. Vidi se da osobe veće mase imaju uglavnom i veći volumen krvi (ali ne uvijek!), te da postoji približna linearna povezanost izmeñu te dvije fiziološke veličine.

6. 2. Linearna regresija i korelacija

Vratimo se na vezu izmeñu tjelesne mase i volumena krvi. Željeli bismo kvantificirati približnu linearnu vezu izmeñu tih dviju veličina. To možemo napraviti konstrukcijom pravca koji najbolje opisuje podatke. Intuitivno bismo to učinili tako da je približno jednak broj točaka iznad pravca i ispod njega (SLIKA 6.5).

Page 60: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

54

SLIKA 6.5. Grafički prikaz podataka volumena krvi u odnosu na tjelesnu masu u 12 muškaraca, zajedno s pravcem koji naglašava njihovu približnu linearnu povezanost. Postoji egzaktan, matematički način koji se naziva linearna regresija. Parametri a i b podacima “najbolje” prilagoñenog, tzv. regresijskog pravca:

y = a + bx

odreñuju se iz uvjeta da je zbroj kvadrata vertikalnih udaljenosti točaka od pravca najmanji (minimalan, SLIKA 6.6). Postupak se naziva metoda najmanjih kvadrata.

Slika 6.6. Podacima (x, y) najbolje prilagoñen pravac karakterizira minimalni zbroj kvadrata vertikalnih udaljenosti (označenih isprekidanim crticama) točaka od pravca. Metoda koja iz tog uvjeta odreñuje parametre “najboljeg” pravca y = a + b x naziva se metoda najmanjih kvadrata. U ovom je slučaju a = 0.81 L i b = 0.062 L/kg.

Page 61: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

6. POVEZANOST METRIČKIH VARIJABLI

55

Metoda ima dvije bitne prednosti pred drugim: 1. ako su varijable x i y normalno distribuirane, metoda najmanjih kvadrata odreñuje pravac koji je, iz zadanih uzoraka x-a i y-a, najbolja procjena pravog, populacijskog pravca i 2. uvjet metode rezultira jednostavnim izrazima za parametre a i b. Nagib pravca b (tzv. regresijski koeficijent) i slobodni član a (presjecište s osi y, nultočka) dani su jednadžbama:

∑∑

−−=

2)(

))((

xx

yyxxb

xbya −= Zbog dostupnosti računala gornje izraze ne trebate pamtiti. Regresijski koeficijent i nultočka dobiveni regresijskom analizom služe za procjenu jedne veličine (y-a, zavisne varijable, varijable ishoda) ako znamo vrijednosti druge veličine (x-a, nezavisne varijable, prediktora). Veličina regresijskog koeficijenta govori nam kolika je očekivana promjena y-a koja odgovara jediničnoj promjeni x-a. Zato regresijski koeficijent i nultočka regresije ovise o jedinicama u kojima izražavamo varijable, te o tome koju varijablu proglasimo zavisnom, a koju nezavisnom. Bezdimenzionalna veličina koja opisuje stupanj linearne povezanosti, neovisno o tome koja je varijabla zavisna, je koeficijent linearne korelacije R. Do definicije za R dolazimo na sljedeći način:

Neka je b regresijski koeficijent koji odgovara jednadžbi y = a + bx, gdje je, dakle, y zavisna, a x nezavisna varijabla. Ako je veza izmeñu x i y približno linearna, možemo promatrati i x kao zavisnu, a y kao nezavisnu varijablu. Tada je regresijska jednadžba: x = a’ + b’y, a koeficijente a’ i b’ možemo takoñer odrediti metodom najmanjih kvadrata. Ako je veza izmeñu x i y savršeno linearna (sve točke leže na pravcu), veza izmeñu koeficijenata b i b’ je recipročna (pokažite za vježbu!), tj.:

b = 1/b’ U slučaju približne linearnosti gornja jednadžba vrijedit će samo približno, to točnije što je linearna povezanost dvaju veličina jača. R se definira izrazom:

bbR ′=

gdje je predznak R-a jednak predznaku regresijskog koeficijenta b (ili b’). Korelacijski koeficijent uvijek je bezdimenzionalni broj u rasponu od –1 do +1. R je pozitivan ako s porastom x-a raste i y, dok je u suprotnom slučaju negativan. Dakle, dvije veličine mogu pozitivno korelirati (R>0) ili negativno korelirati (R<0).

Ako varijable nisu povezane R je približno jednak nuli, dok je graf x-y cirkularnog oblika. Što je linearna povezanost varijabli veća, više se iznos R-a približava jedinici, a graf x-y

Page 62: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

56

postaje sve spljošteniji. Maksimalna vrijednost od 1 odgovara slučaju kada sve točke grafa leže na pravcu (SLIKA 6.7).

SLIKA 6.7. Grafički prikazi parova podataka dviju veličina raznih stupnjeva povezanosti, iskazanih pomoću koeficijenata linearne korelacije R. Prikazani su i regresijski pravci.

Page 63: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

6. POVEZANOST METRIČKIH VARIJABLI

57

Ne postoji oštra granica, ali uobičajeno je veličinu linearnog koeficijenta korelacije opisno interpretirati na način da apsolutna vrijednost R-a od 0.5 razdvaja jake od slabih korelacija. Tako npr. R= -0.3 pridružujemo slaboj negativnoj korelaciji, dok R= 0.8 govori za jaku pozitivnu korelaciju (linearnu povezanost) dviju veličina (SLIKA 6.8).

SLIKA 6.8. Opisno se korelacije često navode kao jake ili slabe, iako stroga granica ne postoji. Kvadrat koeficijenta linearne korelacije R2 naziva se koeficijent determinacije. Obzirom da je R po iznosu manji od 1, koeficijent determinacije manji je od koeficijenta korelacije, osim u slučaju potpune linearne povezanosti, kada su oba jednaka jedinici (R2≤R). Naziv koeficijent determinacije je opravdan jer R2 govori koliki je dio varijacije jedne varijable, u okviru linearnog modela, objašnjen varijacijom druge varijable. Naime, zbroj kvadrata razlika podataka varijable y od njene prosječne vrijednosti (varijacija zavisne varijable), umanjen za zbroj kvadrata odstupanja (vertikalnih udaljenosti) točaka na x-y grafu od regresijskog pravca (rezidualna varijacija), naziva se varijacija objašnjena regresijom. To stoga jer ta veličina predstavlja varijaciju zavisne varijable kada, umjesto originalnih vrijednosti yi, uvrstimo ordinatu regresijskog pravca y(xi). Može se pokazati da je:

R2 = varijacija objašnjena regresijom / varijacija zavisne varijable

Page 64: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

58

Ukoliko su sve točke na regresijskom pravcu, rezidualna varijacija jednaka je nuli i R2 =1. U našem primjeru regresije masa-volumen krvi R=0,81 i R2 =0.64, što znači da se oko 64% varijacije volumena krvi u promatranih 12 ispitanika da objasniti varijacijom tjelesne mase. Ostatak od oko 36% govori za prisutnost drugih čimbenika koji utječu na volumen krvi. Naime, jasno je da povećanje tjelesne mase, kako idemo od lakših prema težim ispitanicima, ne mora uvijek značiti i općenito veće osobe, s većim volumenima krvi, već i veći udio masnih tkiva, krupnijih kostiju i sl. Kažemo da je veza volumena krvi i tjelesne masi izmeñu raznih osoba opterećena drugim, neistraženim varijablama, tzv. kovarijablama.

Jasnije i općenito veće povezanosti nalazimo u istih jedinki koje promatramo u raznim vremenima ili stanjima. Tada kovarijabli nema ili im je utjecaj mali. Naime, izmeñu raznih vremena ili stanja (koji predstavljaju nezavisne, prediktorske varijable) svaka jedinka ostaje ista (ili približno ista) u svemu osim u istraživanoj varijabli. Tako npr. povezanost izmeñu brzine trčanja i potrošnje kisika možemo procijeniti iz podataka dobivenih na istom ispitaniku koji trči raznim brzinama, pri čemu mu, koristeći portabilni spiroergometar, mjerimo potrošnju kisika (SLIKA 6.9).

SLIKA 6.9. Povezanost izmeñu brzine trčanja i potrošnje kisika u trenirane i netrenirane osobe. Uočite linearnu povezanost, sve do točke maksimalne potrošnje, nakon čega počinje anaerobni metabolizam.

POUZDANOST REGRESIJSKE ANALIZE

Vrijednosti regresijskog koeficijenta b, presjecišta a, kao i koeficijenta korelacije R samo su procjene populacijskih vrijednosti na temelju uzoraka iz populacije (točaka, tj. parova vrijednosti xi, yi). Zato su podložne slučajnostima uzorkovanja i imaju svoje standardne pogreške (poput standardne pogreške aritmetičke sredine).

Page 65: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

6. POVEZANOST METRIČKIH VARIJABLI

59

Zanemarujući pogreške u dobivanju (mjerenju) podataka, te pod pretpostavkama

1. da je, za svaku vrijednost x, varijabla y normalno (simetrično) rasporeñena i da te 2. distribucije y-a imaju jednaku standardnu devijaciju,

standardne pogreške parametara a i b, SE (a) i SE (b) daju se izraziti su u funkciji parova podataka xi i yi (formule ne navodimo).

Mjera rasapa točaka (opaženih vrijednosti varijabli) oko regresijskog pravca je tzv. standardna pogreška regresije (procjene) (SEE, prema engl.: Standard Error of Estimate): drugi korijen iz prosjeka kvadratičnih odstupanja točaka od pravca.

Ako se rezultat regresijske analize prvenstveno koristi za predviñanje (procjenu) zavisne varijable y iz vrijednosti nezavisne varijable x, potrebno je procijeniti i standardne pogreške vrijednosti y-a dobivenih korištenjem regresijskog pravca. Dakle, umjesto neposredno dobivene (izmjerene) vrijednosti yi (koja se odnosi na vrijednost xi), koristimo y-koordinatu regresijskog pravca: y (xi) = a + bxi. Standardna pogreška predikcije SE (y (xi)) da se izraziti pomoću xi, SEE i N podataka varijable x na način:

( )( )

−++=∑

2

21

1))((xx

xx

NSEExySE i

i

Prvo valja uočiti da ne postoji jedna, već svaka predviñena vrijednost y (xi) ima različitu standardnu pogrešku. Nadalje, ta je pogreška najmanja za vrijednosti xi koje su najbliže aritmetičkoj sredini x-a (jer je tada brojnik u trećem pribrojniku izraza ispod korijena najmanji). Dakle, najtočnije procjene na temelju regresijske analize su oko aritmetičke sredine nezavisne varijable i sve su nepouzdanije kako se od te sredine udaljavamo.

→→→→ Pouka je da regresijsku jednadžbu ne valja koristiti izvan područja vrijednosti nezavisne varijable koje pripada originalnim podacima.

Koristeći SE (y (xi)) možemo dobiti i intervale pouzdanosti regresijske procjene. Tako je:

95% C.I. od y (xi): y (xi) ± 1.96 SE (y (xi)).

Formule u ovom poglavlju nisu prikazane radi potrebe njihovog memoriranje (niti ih student medicine treba znati izvesti), jer u praksi koristimo računala. Razlozi su demistifikacija, ukazivanje na razvojnu logiku i pretpostavke na kojima počivaju.

T-test služi za procjenu da li je regresijski koeficijent značajno različit od nule:

t = b/SE (b), d.f. = N-2

Page 66: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

60

To je ekvivalentno testiranju pretpostavke R=0. U našem primjeru linearne povezanosti tjelesne mase i volumena krvi, izlazi: t= 4.32 i pripadni p=0.0015.

ŠTO RADIMO U PRAKSI

U praksi počinjemo s N podataka dviju veličina x i y, koji su prirodno povezani u parove (xi, yi). U medicini ta povezanost najčešće znači pripadnost istoj jedinki. Tada imamo N parova podataka, gdje svaki predstavlja vrijednosti dviju veličina u druge jedinke (osobe, životinje, stanice i sl.). Pri tome je ponekad prirodno, a ponekad proizvoljno jednu veličinu proglasiti zavisnom, a drugu nezavisnom. Druga je mogućnost niz od N podataka istraživane (zavisne) varijable iste jedinke u raznim vremenima ili stanjima (što su vrijednosti nezavisne, prediktorske varijable). U svakom slučaju postoje 2 metričke varijable koje unosimo u elektroničku tablicu. Te podatke računalo koristi za izračune. Rezultat linearne regresije slikovno se prikazuje kao graf x-y na kojem je nacrtan i regresijski pravac, te najčešće sljedeće informacije (SLIKA 5.9):

1. broj uzoraka (parova podataka) N

2. regresijska jednadžba: y = a + bx,

3. koeficijent korelacije R, i

4. p-vrijednost regresije, što je dobro upotpuniti sa

5. standardnom pogreškom regresije SEE.

Pri tome:

• Sve vrijednosti valja zaokružiti na dva do tri značajna (od nule različita) mjesta, uzimajući u obzir da regresijske parametre samo približno procjenjujemo, te nema smisla sugerirati točnost koja ne postoji.

• Jedinice mjere apscise i ordinate obvezno se navode. Zbog grafičke preglednosti jedinice parametara regresijske jednadžbe ne moramo navesti. Dakako, iz grafa je jasno da je dimenzija nul-točke regresije (a) jednaka dimenziji zavisne varijabla (y): [a]=[y], dok za regresijski koeficijent b vrijedi: [b]=[y] /[x]. Ako se navodi i standardna pogreška regresije, njena se jedinica mjere navodi (ista je kao i za y, što, meñutim, nije očigledno iz samog grafa).

• Koodinatni početak ne mora uvijek biti točka (0,0), osobito ako su vrijednosti varijabli oko nule fiziološki nemoguće (kao u našem primjeru, tjelesna masa i volumen krvi ne mogu biti jednaki nuli, niti vrlo mali!). No tada se treba grafički označiti da su osi pri ishodištu prekinute.

Page 67: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

6. POVEZANOST METRIČKIH VARIJABLI

61

SLIKA 6.10. Što valja sadržavati grafički prikaz linearne regresije.

Nije uobičajeno, ali niti suvišno regresijsku jednadžbu dopuniti i informacijama o standardnim pogreškama parametara, na način: y = a±SE(a) + (b±SE(b)) x.

Ukoliko testiramo samo stupanj linearne povezanosti dviju veličina, bez ambicija (ili osnova) da predviñamo vrijednost jedne iz vrijednosti druge, tada je dovoljno prikazati koeficijent korelacije i p-vrijednost regresije.

Većina komercijalnih statističkih programa grafički prikaz regresije upotpunjuje i zakrivljenim crtama koje predstavljaju granice područja pouzdanosti regresije, obično 95%-tnog (SLIKA 6.11). Radi se o crtama koje spajaju intervale pouzdanosti točaka na regresijskom pravcu. U medicinskoj literaturi takav se prikaz izbjegava (zbog šarenila).

Page 68: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

62

SLIKA 6.11. Graf linearne regresije s prikazanim granicama 95%-tnog područja pouzdanosti.

NAJČEŠĆE POGREŠKE U PRIMJENI REGRESIJSKE ANALIZE Dostupnost računala ima i mane. Jedna je pretjerana i nekritična primjena statističkih analiza. Najčešće pogreške u primjeni linearne regresije su:

1. korištenje podataka koji su dijelom ponovljena mjerenja 2. korištenje podataka dviju (ili više) raznih populacija 3. korištenje linearne regresije kada su veličine nelinearno povezane Do sada smo pretpostavili da su podaci parova (xi, yi) dobiveni kao nezavisne informacije (mjerenja). To znači da se svaki par podataka odnosi na drugu jedinku, ili na istu jedinku u različitim stanjima. Ono što nije dopušteno je korištenje ponovljenih (istih) mjerenja, koja nisu nova informacija, već samo lažno povećavaju veličinu uzorka i statističke značajnosti izračunatih parametara. U našem primjeru veze volumena krvi i tjelesna mase, dopušteno bi bilo svakoj od 12 osoba volumen krvi izmjeriti više puta i na kraju uzeti aritmetičke sredine. Ali, nije dopušteno pojedina ponovljena mjerenja istih osoba uzeti kao posebne podatke (u sklopu podataka raznih osoba). Veličina korelacije može se lažno uvećati (ali i smanjiti) spajanjem podataka dviju ili više skupina iz različitih populacija. Uzmimo na primjer povezanost izmeñu tjelesne visine i mase. Neka su ti podaci poznati za 10 žena i 10 muškaraca, iz kojih računamo korelaciju tih dviju varijable za kombinirani uzorak, gdje su žene i muškarci zajedno. SLIKA 5.11 ilustrira što se može dogoditi u takvom slučaju. Povezanost izmeñu mase i visine izgleda veća u kombiniranom uzorku, nego kada se svaki spol uzme posebno. Većinom je to zbog toga što su muškarci prosječno i viši i teži od žena.

Page 69: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

6. POVEZANOST METRIČKIH VARIJABLI

63

SLIKA 6.12. Tipičan primjer lažne korelacije zbog miješanja uzoraka iz raznih populacija. NELINEARNA REGRESIJA Do sada smo pretpostavili da dvije veličine mogu biti više ili manje linearno povezane. Meñutim, povezanost veličina ne mora biti samo linearna, već su moguće i složenije povezanosti. Npr. učinak lijeka bit će proporcionalan njegovoj dozi samo za manje doze koje ne zasićuju receptore (najčešće proteine na staničnim membranama) za koje se lijek veže. Nakon toga nije moguće polučiti veći terapijski učinak, već samo veće neželjene posljedice. U ovom je slučaju grafički prikaz povezanosti koncentracije lijeka u tijelu (nezavisna varijabla) i njegovog učinka (zavisna varijabla, koja je proporcionalna postotku lijekom vezanih receptora) krivulja koja se asimptotski približava horizontalnoj crti (platou) (SLIKA 6.13).

Page 70: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

64

SLIKA 6.13. S porastom koncentracije lijeka njegova učinkovitost (A), kao rezultat vezivanja za receptore (B), raste, ali sve slabije i slabije, jer je broj receptora ograničen. Prikazane su i koncentracije lijeka koje izazivaju 50% učinak (A, KE), odnosno 50% vezivanja za receptore (B, KO). Koeficijent korelacije mjeri meñutim samo intenzitet linearne povezanosti i njegova će vrijednost ukazati na lažno malu ili nikakvu korelaciju u ovom i sličnim slučajevima.

→→→→ Pouka je da prije bili kakve analize najprije valja vizualno analizirati graf x-y. U suprotnom možemo propustiti jaku, ali nelinearnu povezanost, kao u ovom primjeru. U slučaju očite nelinearne povezanosti linearnu regresiju ne smijemo izravno primijeniti. Moguće su ponekad njene neizravne primjene, ako postoji približno linearna veza izmeñu transformiranih varijabli. Tipičan je slučaj (približne) eksponencijalne povezanosti: y = a ebx. Nakon logaritmiranja:

ln y = a + bx Dakle, iako varijable x i y nisu linearno povezane, izmeñu x i ln y postoji linearna veza i parametre a i b možemo odrediti metodom najmanjih kvadrata iz parova podatka (xi, ln yi). Slično rješavamo i kvadratnu ili neku drugu funkcijsku vezu. Naravno, u praksi je problem pogoditi koja funkcija nabolje povezuje varijable. VIŠESTRUKA REGRESIJA U biologiji i medicini vrlo je rijetko neka veličina funkcija samo jednog prediktora. Biološke veličine u pravilu su u kompleksnoj, samo djelomično poznatoj meñuovisnosti o mnoštvu drugih veličina, koje su takoñer meñusobno više ili manje povezane. Često želimo jednu metričku varijablu opisati (predvidjeti) iz podataka ne samo jedne već dviju ili više drugih varijabli (koje mogu biti metričke, ali i kategorijske). Kao i prije, zavisnu varijablu y zovemo varijablom ishoda (ili kriterijskom varijablom), dok su skup prediktora x1, x2, …,xk nezavisne varijable (uočimo da ovdje xi ne označava i-tu vrijednost varijable x, već jednu iz niza nezavisnih varijabli).

Page 71: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

6. POVEZANOST METRIČKIH VARIJABLI

65

Ako su nezavisne varijable meñusobno nepovezane, dovoljno je ispitati pojedinačne linearne veze: y = ai + bi xi (i=1,..,k). Najčešće su nezavisne varijable barem malo povezane. U tom slučaju, u okviru tzv. višestruke (multiple) regresije, kriterijsku varijablu prikazujemo u obliku:

y = a0 + b1 x1 + b2 x2 + …+ bk xk

I u ovom se slučaju parametri a0, b1, …,bk mogu izračunati iz podataka zavisne varijable i prediktora. Takoñer se izračunava tzv. koeficijent višestruke korelacije R. Njegova je interpretacija neposredno poopćenje linearnog koeficijenta korelacije, s jedinom iznimkom što je koeficijent višestruke korelacije uvijek pozitivan broj (nemoguće je pridružiti jedan smjer korelaciji koja uključuje više od jednog para varijabli). Kvadrat koeficijenta višestruke korelacije takoñer se naziva koeficijentom determinacije i ima isto značenje kao kod linearne (jednostruke) regresije. Regresijski koeficijenti b1,…, bk razlikuju se od koeficijenata linearne regresije (osim kada su prediktori meñusobno potpuno nepovezani), te se zovu koeficijenti parcijalne regresije. Koeficijent parcijalne regresije bi očekivana je promjena kriterijske varijable kada se i-ti prediktor promijeni za jediničnu vrijednost, a svi ostali prediktori ostanu nepromijenjeni. Pripadne pojedinačne korelacije nazivaju se koeficijenti parcijalne korelacije.

NEPARAMETRIJSKA REGRESIJA Linearnu regresiju možemo koristiti ako su obje varijable kvantitativne (metričke). Tada se koeficijent linearne korelacije naziva i Pearsonov koeficijent korelacije. Moguće je promatrati povezanost i izmeñu metričke i ordinalne veličine, kao i izmeñu dvije ordinalne veličine. Primjer je veza izmeñu koncentracije antitijela na virus (prediktor) i simptoma bolesti, koje opisujemo bodovnim skorom (ishod). Neparametrijski ekvivalent linearnog (Pearsonovog) koeficijenta korelacije je tzv. Spearmanova korelacija ranga (Rs). Metoda ne koristi apsolutne vrijednosti varijabli, već njihove poretke (rangove). Osnovni podaci su razlike rangova odgovarajućih parova podataka. Rs je broj izmeñu –1 i 1 i interpretira se isto kao i Pearsonov R. Spearmanovu korelaciju umjesto Pearsonove uputno je koristiti i kada su obje varijable metričke, ali vrlo nesimetrično rasporeñene, uz postojanje vrijednosti (x-a ili y-a) koje znatno odskaču od ostalih. Alternativa je zadržati se u okvirima parametrijske statistike, uz odgovarajuću transformaciju (normalizaciju) varijabli. POVEZANOST I KAUZALNOST Važno je uočiti da povezanost ne mora uvijek značiti kauzalnu (uzročno-posljedičnu) vezu. Veza izmeñu dvije veličine može biti samo naizgledna, bez stvarne uzročne povezanosti. To se dogaña u situacijama kada na obje promatrane veličine utječe zajednički čimbenik (treća veličina ili stanje), koji uzrokuje njihovu istodobnu, sličnu promjenu.

Page 72: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

66

Tako npr. neki tumori žljezdanog tkiva uzrokuju povećanu sekreciju 2 (ili više) hormona i to tim više što su veći. Zbog toga osobe s većim tumorima imaju veće razine oba hormona. Sljedbeno, ako bi ta dva hormona postavili u meñusobno odnos, dobili bismo pozitivnu linearnu korelaciju, iako sami hormoni uopće ne djeluju jedan na drugog.

Page 73: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

6. POVEZANOST METRIČKIH VARIJABLI

67

Page 74: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

68

7. PROCJENE POTREBNE VELIČINE UZORAKA

ZAŠTO SE MORAMO GNJAVITI I S OVOM STATISTIKOM

Neophodan dio istraživanja je procjena koliko uzoraka (ljudi) valja analizirati da bi odgovorili na postavljene ciljeve. Često se taj broj 'izvlači iz šešira' ili odreñuje isključivo na logističkoj osnovi.

(i) Premali broja pacijenata znači upuštanje u istraživanje koji neće završiti pouzdanim zaključcima, dok

(ii) Preveliki broj pacijenata ne samo da je gubljenje vremena, novaca, ograničenih resursa, često neetično, već može pokušati 'prošvercati' trivijalne rezultate kao klinički značajne (na velikim uzorcima male, biološki nevažne razlike mogu biti statistički značajne).

Brojevi (veličine) uzoraka (sample sizes) moraju biti dostatni sa se:

1. eventualne populacijske razlike u istraživanim obilježjima (ili intenziteti obilježja) pouzdano ustanove, tj. 2. pouzdano isključe ako ne postoje.

U slučaju konvencionalnog razgraničenja rezultata uporabom granične razine značajnosti (i pripadne p-vrijednosti) to znači da u:

1. slučaju test daje: p<granične vrijednosti, a u 2. slučaju: p≥granične vrijednosti Drugim riječima želimo da su obje vjerojatnosti, kako β pogreške (slučaj 1.), tako i α pogreške (slučaj 2.) male. Ta su dva zahtjeva oprečna. Što teže prihvaćamo hipotezu da razlike postoje, to ćemo prije proglasiti statistički neznačajnima stvarne razlike. U biomedicini smo stroži glede α pogreške. Uobičajeno je njenu vjerojatnost držati ispod 5%. Beta pogrešku uobičajeno je prihvatiti ako joj je vjerojatnost 10, pa čak i 20%. ŠTO TREBAMO ZNATI PRIJE PROCJENE Pretpostavimo da se dvije populacije 1 i 2 razlikuju u nekom svojstvu koje opisujemo metričkom varijablom X. Dakle, stvarna razlika u obilježju X izmeñu populacija 1 i 2 postoji i pitanje je da li ćemo ju otkriti na temelju uzoraka iz populacija. U 2. poglavlju smo pokazali da ćemo opaženu razliku na uzorcima proglasiti statistički značajnom tim prije što je ona veća, varijabilnosti obilježja u populacijama (standardne devijacije) manje i što su uzorci veći. U stvarnosti ne znamo veličinu stvarne razlike, niti da li ona uopće postoji. Ono što trebamo odrediti je najmanja stvarna razlika koju želimo ustanoviti (ne propustiti). Naime,

Page 75: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

7. PROCJENE POTREBNE VELIČINE UZORAKA

69

ne možemo zahtijevati da želimo ustanoviti svaku razliku, ma kolika ona bila. To zahtijeva istraživanje cijelih populacija, najčešće nije moguće i vrlo rijetko ima smisla. Time smo definirali: •••• osjetljivost istraživanja = najmanja razlika izmeñu populacija u istraživanom obilježju koju želimo ustanoviti ako postoji (granična, stvarno značajna razlika). Osjetljivost je posebnost svakog istraživanja i ne postoje univerzalni recepti za njeno odreñivanje. Radi se o stvarno značajnoj razlici koju ne želimo propustiti jer joj pridajemo biološku (kliničku) važnost (postupak koji snižava mortalitet za 1% može biti klinički važan, dok sniženje učestalosti akutnih epizoda astme za 20% to ne mora). Stvarno značajnu razliku ne smijemo miješati sa statistički značajnom razlikom. Stvarno značajna razlika je značajno velika populacijsku razlika, dok je statistički značajna razlika uočena na uzorcima i vrlo je vjerojatno stvarna, populacijska, a ne slučajna. Nadalje, valja definirati pouzdanost (vjerojatnost, šansu) otkrivanja zadane razlike. Naime, i kada stvarna razlika izmeñu populacija postoji, zbog slučajnosti uzorkovanja moguće je dobivanje puno manje opažene razlike na uzorcima, koju će statistički test proglasiti neznačajnom. Dakle, nikada ne možemo biti potpuno sigurni da ćemo stvarnu razliku ustanoviti, već raspolažemo s većom ili manjom pouzdanošću njenog otkrivanja. Ta se pouzdanost naziva snaga istraživanja: •••• snaga istraživanja = vjerojatnost dobivanja statistički značajne razlike na uzorcima, ako je stvarna, populacijska razlika veća ili jednaka od zadane. Dakle, snaga istraživanja je pouzdanost otkrivanja odreñene minimalne (biološki značajne) razlike nekog obilježja izmeñu populacija. Prisjetimo se iz 2. poglavlja da je snaga istraživanja vjerojatnost da nećemo napraviti β pogrešku (pogrešku tipa 2), tj. da stvarnu razliku nećemo proglasiti statistički neznačajnom. Naravno, snaga istraživanja vezuje se za:

- graničnu razinu (statističke) značajnosti istraživanja, odnosno za graničnu p-vrijednost. Što je granična razina značajnosti veća (p-vrijednost manja) teže ćemo uočene razlike proglasiti statistički značajnim (tj. prije napraviti β pogrešku ako stvarna razlika postoji). U istom smislu djeluje i:

- varijabilnost istraživanog obilježja. Što su varijabilnosti (individualne razlike) obilježja veće, teže ćemo uočene razlike pripisati stvarnima.

Uobičajen zahtjev za snagu istraživanja u biomedicini je 90%. Dakako, u odreñenom istraživanju prihvatljiva snaga može biti manja ili veća, ovisno o tome koju pogrešku više želimo izbjeći: pogrešku tipa 1 ili tipa 2 (alfa ili beta pogrešku). Dok velika statistička značajnost istraživanja znači pouzdanost prihvaćanja pozitivnih rezultata istraživanja, velika snaga istraživanja znači pouzdanost prihvaćanja negativnih rezultata istraživanja. Dakle, prije procjene potrebne veličine uzoraka potrebno je definirati:

Page 76: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

70

1. osjetljivost istraživanja (minimalnu stvarno značajnu razliku) 2. snagu istraživanja (pouzdanost detekcije stvarno značajnih razlika) 3. graničnu značajnost istraživanja (pouzdanost isključenja slučajnih razlika) i

procijeniti: 4. varijabilnosti istraživanog obilježja u populacijama.

Tek kada smo definirali osjetljivost, snagu i graničnu značajnost istraživanja i procijenili varijabilnosti istraživanog obilježja u populacijama, možemo procijeniti dovoljne veličine uzoraka (brojeve ispitanika). Dakle, pod pretpostavkom da stvarna razlika u nekom obilježju u populacijama postoji i barem je odreñene veličine, želimo imati dovoljno veliku vjerojatnost (recimo 90%) da ćemo je statističkim testom potvrditi na izabranoj graničnoj razini značajnosti (recimo 95%). Želimo procijeniti koliki su najmanji uzorci iz populacija dovoljni za te ciljeve. PROBLEM JE SLOŽENIJI NEGO SE NA PRVI POGLED ČINI Izračun potrebnih veličina uzoraka može izgledati varljivo jednostavnim. Uzmimo primjer istraživanja razlike u populacijama 1 i 2 u metričkom obilježju X. Zbog jednostavnosti pretpostavimo da ćemo iz svake populacije izabrati jednaki broj jedinki: N1 = N2 =N. Odgovarajući statistički test je t-test za nezavisne uzorke. Nakon definiranja minimalne stvarno značajne razlike X1-X2 i procjene standardnih devijacija SD1 i SD2, tipična pogreška je variranje broja ispitanika N (u svakoj skupini!) u formuli za t-vrijednost, sve dok se ne dobije granična t-vrijednost testa za izabranu graničnu razinu značajnosti (npr. t=1.96 za granični p=0.05). U slučaju podjednakih standardnih devijacija uzoraka, kada je standardna pogreška aritmetičke sredine razlike X1-X2 jednaka:

21 XXSE − =

N

SD

N

SD 22

21 + jednadžba 1

t vrijednost se računa pomoću sljedeće jednadžbe:

t = 21 XX

21

SE

XX

− jednadžba 2

Pogreška je što opažena razlika X1-X2 (koja će se koristiti u testu) u pravilu neće biti jednaka stvarnoj, populacijskoj razlici. U stvari, u 50% slučajeva će opažena razlika biti jednaka ili veća, a u drugih 50% slučajeva manja od stvarne. To znači da ćemo, koristeći takav pristup, imati samo 50%-tnu vjerojatnost detekcije stvarne razlike izmeñu populacija. Snaga takvog istraživanja je 50%, što je neprihvatljivo malo. Pored toga, ovaj je primjer ilustrativan jer pokazuje da potrebna veličina uzorka inverzno ovisi o kvadratu minimalne razlike koju želimo uočiti. Naime, iz gornja jednadžbe slijedi:

Page 77: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

7. PROCJENE POTREBNE VELIČINE UZORAKA

71

N = 221

22

21

2

)XX(

)SDSD(t

−+

jednadžba 3

Dakle, dvostruko veća osjetljivost istraživanja (dvostruko manja minimalna stvarno značajna razlika) povlači potrebu za četverostruko većim uzorcima. RJEŠENJE PROBLEMA: KAKO DOKAZATI DA RAZLIKA NIJE NULA Pokažimo sada principe procjene minimalnog broja ispitanika za zadanu snagu istraživanja, recimo 90%-tnu (što lako možemo poopćiti za druge izbore). Ostanimo pri gornjem primjeru i pretpostavimo takoñer istu, 95%-tnu statističku značajnost istraživanja. Sve što je potrebno je u jednadžbu 3, umjesto populacijske razlike X1-X2, uvrstiti najnepovoljniju uočenu razliku. To je najmanja uočena razlika koju ćemo, uz pretpostavku da je stvarna razlika X1-X2, dobiti u 90% slučajeva uzimajući uzorke iz populacija. Obzirom da raspon: aritmetička sredina ± 1.28 standardnih pogrešaka aritmetičke sredine sadrži 80% površine ispod normalne krivulje (izvan je po 10% s obje strane), te da gledamo samo polovinu slučajeva kada je uočena razlika manja od stvarne, ta je, granična, najnepovoljnija vrijednost za 1.28 standardnih pogrešaka ulijevo od stvarne razlike, tj. njena je vrijednost:

X1 – X2 – 1.28 21 XXSE −

Prihvatljivim rizikom držimo činjenicu da ćemo u preostalih 10% slučajeva (polovica od 20% površine ispod normalne krivulje, koja je s lijeve strane izvan 80%-tnog područja pouzdanosti), dobit na uzorcima još manju uočenu razliku, što će rezultirati statistički neznačajnom razlikom (p>0.05). Zamjenjujući gornji izraz u jednadžbi 3 umjesto izraza X1-X2 i uzimajući u obzir da je za 95% statističku značajnost istraživanja granična t-vrijednost jednaka 1.96, te rješavajući po N dobivamo:

N = 221

22

21

2

)XX(

)SDSD()28.196.1(

−++

Ako s SD2 označimo varijancu razlike X1 – X2, gornja jednadžba postaje:

N = 2

21 XX

SD5.10

− jednadžba 4

Drugi, ekvivalentan pristup je uočavanje činjenice da ćemo uočenu razliku veličina X1 i X2 proglasiti statički značajnom ako 95% raspon pouzdanosti te razlike ne zahvaća nulu (s

Page 78: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

72

lijeve strane). Obzirom da je poluširina 95%-tnog raspona pouzdanosti 1.96 21 XXSE − , te da

će 90% uočenih razlika biti veće od X1 – X2 – 1.28 21 XXSE − , najmanji potreban N

zadovoljava jednadžbu (slika 1):

X1 –X2 = 1.28 21 XXSE − + 1.96

21 XXSE −

čije je rješenje po N jednako takoñer dano jednadžbom 4.

SLIKA 1: Distribucija uočenih razlika metričkih veličina X1 i X2 oko stvarne razlike X1-X2. Dostatne veličine uzoraka osigurat će da raspon pouzdanosti oko uočene razlike ne zahvaća nulu. KAKO DOKAZATI DA JE RAZLIKA VEĆA OD NEKE VRIJEDNOSTI Nepostojanje razlika je idealistička pretpostavka. Sve se od svačega barem malo razlikuje, ili, općenitije rečeno, učinci nečega na nešto nikad nisu jednaki nuli. U odnosu na dokazivanje da je nešto različito od nule, realnija, ali ambicioznija zadaća je pokazati da je neka razlika (općenito nekakav učinak) veća od neke vrijednosti. Tu se opet u medicini radi o klinički ili biološki značajnoj vrijednosti. Dakle, sada želimo odrediti minimalnu veličinu uzoraka, ne bi li za odreñenu, stvarno važnu razliku, s odreñenom sigurnošću (snagom), ustanovili da se statistički značajno razlikuje (uz dani granični p), ovaj put ne od nule, već od neke, zadane vrijednosti.

Uočite da se ovdje dva puta pojavljuju stvarno važne razlika, s time da se radi o dvjema vrijednostima koje ne mogu biti jednake. Naime, nemoguće je dokazati da je npr. stvarna 30%-tna razlika veća od 30%. Realan primjer je sljedeći: želimo procijeniti brojeve ispitanika koji će biti dostatni da s 90%-tnom snagom i 5%-tnom osjetljivošću stvarni učinak hipertenziva u 10%-tnom sniženju dijastoličkog arterijskog tlaka dokažemo većim od 5%-tnog.

Page 79: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

7. PROCJENE POTREBNE VELIČINE UZORAKA

73

Formalno se problem lako svede na već riješeni u prethodnom dijelu, na način da ulogu nule uzima zadana vrijednost. Drugi način je da umjesto varijable X1-X2 uzmemo varijablu X1 - X2 – zadana vrijednost. Meñutim, valja uočiti da se u ovom slučaju zahtjevi na veličinu uzoraka mogu znatno povećati, ovisno koliko se zadana vrijednost približava pretpostavljenoj minimalnoj stvarno važnoj. KAKO DOKAZATI DA JE RAZLIKA MANJA OD NEKE VRIJEDNOSTI Vrlo je važan slučaj kada želimo pokazati da je neki uvriježen postupak u stvari neučinkovit, npr. da je vanjsko zračenje nakon davanja citostatika nepotrebno. Naravno, istraživanje s malim brojem ispitanika dat će statistički neznačajan p. Ali, nemogućnost pokazivanja statistički značajne razlike ne znači da razliku možemo pouzdano isključiti. Mi želimo pouzdano pokazati da je stvarna razlika manja od neke vrijednosti koju držimo minimalnom, klinički značajnom.

Problem je složeniji od gornjih primjera. U ovom slučaju 95%-tni raspon pouzdanosti oko uočene razlike u 90% slučajeva ne smije obuhvatiti zadani broj. Problem je što raspodjela uočenih razlika ovisi o tome kolika je stvarna razlika, koja se, u najgorim slučajevima, može po volji približiti samoj zadanoj granici. Tada se s konačnim brojem uzoraka ne može statistički dokazati da je stvarna razlika manja od zadane, jer su rasponi pouzdanosti aritmetičkih sredina uvijek konačno veliki.

Ono što možemo napraviti je da pretpostavimo da je stvarna razlika nula. Tada su dovoljni konačni uzorci, da bi raspon pouzdanosti oko uočenih razlika dovoljno često ne uključivao zadanu minimalnu vrijednost. Opće se rješenje (za snagu 90% i statističku značajnost 95%) dobiva rješenjem po N sljedeće jednadžbe:

1.28 SE + 1.96 SE = odabrana klinički značajna razlika (učinak)

Ambiciozniji, ali još uvijek rješiv pristup je dopustiti da stvarna razlika bude bilo koja izmeñu nule i odabrane minimalne, te tražiti da ju dovoljno često možemo statistički potvrditi, ali ne svaku od njih posebno, već sve zajedno (jer je jasno je da one razlike koje su jako blizu odabrane granice nećemo ustanoviti s konačnim brojem uzoraka). Komercijalni statistički programi ne razmatraju ovaj slučaj. JEDNOSTAVNIJI PROBLEM: ZNAMO DA RAZLIKA POSTOJI, ŽELIMO JE PRECIZNO PROCIJENITI Često nije u pitanju da li neka razlika, nekakav učinak ili neka povezanost postoji, već ju istraživanje treba potvrditi s dovoljnom preciznošću. To je jednostavniji problem: potrebni brojevi uzoraka jednostavno se odreñuju iz zadanog, najvećeg dopuštenog koeficijenta varijacije (omjer učinka i njegove standardne pogreške). NEKE VAŽNE STVARI 1. Potreba probnog istraživanja (pilot pokus). Probno istraživanje manje je potrebno za definiranje klinički važne razlike, više za procjenu varijabilnosti istraživanih svojstava. Neki statističari taj problem zaobilaze na način da definiraju tzv. velike, srednje i male

Page 80: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

74

efekte u funkciji varijabilnosti parametara. Tako možemo reći da želimo otkriti razliku izmeñu antihipertenziva i placeba u sniženju dijastoličkog arterijskog tlaka ako je ona prosječno 2.5 puta veća od svoje individualne varijabilnosti (standardne devijacije), ma kolika potonja bila! Uočite iz jednadžbe 4 da je ta je informacija dovoljna za odreñivanje potrebnog broja uzoraka. Drugi statističari s prezirom odbacuju takvu 'zaobilaznicu'. Jedan ju naziva 'T-shirt phylosophy'. U slučaju kada istražujemo novu biološku pojavu, bez jasnih kliničkih poveznica, možemo prihvatiti da se konzistentnost učinka stavlja ispred njegove veličine. U suprotnom slučaju liječenja koje smanjuje smrtnost, jasno je da je prosječni učinak prvenstveno važan (broj spašenih života), bez obzira na njegovu varijabilnost. Realno je zauzeti stav da definicija biološki važne razlike u funkciji njene inter-indivudualne varijabilnosti nije univerzalno prihvatljiv koncept.

2. Rezultate analize ne treba gledati kao precizne, niti oktroirane. Uputno je prikazati rezultate za razne izbore osjetljivosti i snage istraživanje.

3. Kada se anticipira opsežna analiza rezultata, za procjenu veličine uzorka valja uzeti najvažniju analizu (ili sve, pa onda izabrati najveći procijenjeni potrebni N).

4. Za procjenu možemo koristiti formule ili računalo. Računalni programi za tu svrhu još nisu široko dostupni, često su ograničeni glede vrste testa ili daju rezultate samo za jednako velike ispitne i kontrolne skupine. U potonjem slučaju postoje formule za korekciju procijenjene veličine uzorka za slučaj nejednako velike ispitne i kontrolne skupine (često se bira nekoliko kontrola po ispitaniku!). 5. U situacijama kada raspolažemo sa zadanim uzorcima, iz njihovih veličina računamo snagu istraživanja za odreñenu osjetljivost. Često se takve analize rade a posteriori pri interpretaciji negativnih rezultata istraživanja. Recenzenti često traže da se za negativan rezultat izračuna snaga istraživanja. Pri tome se uočena razlika smatra biološki važnom. To, naravno, nema smisla.

6. Ukoliko preliminarni rezultati istraživanja pokazuju da je istraživani utjecaj (razlika) puno veći od minimalnog, stvarno značajnog, uputno je (a ponekad i etički uvjet) istraživanje prekinuti, jer su odgovori već dobiveni. 7. Dva su uvjeta da bi negativna studija bila važna: -pouzdano je negativna, tj. snaga istraživanja je prihvatljiva -rezultati su interesantni (neočekivani, a važni)

Page 81: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

7. PROCJENE POTREBNE VELIČINE UZORAKA

75

Page 82: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

76

VJEŽBE IZ BIOSTATISTIKE

Vježba 1: Prikupljanje podataka

U prvoj vježbi studenti prikupljaju podatke s kojima će kasnije vježbati statističke analize. Radi se o vlastitim podacima dobivenim na 3 načina:

1. anketom 2. testom intelektualnih sposobnosti i 3. mjerenjima fizioloških parametara: srčane frekvencije, te dijastoličkog i sistoličkog

arterijskog krvnog tlaka (u mirovanju, stajanju i tijekom tjelesnog opterećenja). Student podatke zapisuju u osobne (Upitnik) i zbirne “kartone”.

Page 83: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

VJEŽBE IZ BIOSTATISTIKE

77

UPITNIK ZA VJEŽBE IZ BIOSTATISTIKE

1. Šifra: _________________

2. Spol: M Ž

3. Tjelesna masa u kilogramima: ______

4. Visina u centimetrima: ________

5. Krvna grupa: A B AB 0 ne znam

6. Plave oči: DA NE

7. Plava kosa: DA NE

8. Barem jedan od roditelja ima vidnu manu (ne uključujući starovidnost): DA NE

9. Broj cipela: _________

10. Prosječni uspjeh u razredima srednje škole (npr. (3+3+4+3)/4=3.25): _______

11. Pušim više od 5 cigareta dnevno dulje od 2 godine: DA NE

12. Barem jedan od roditelja je pušač: DA NE

13. Bavim se sportom aktivno ili više od 2 puta tjedno rekreativno: DA NE

14. Imao sam barem jedan prijelom kosti: DA NE

15. Bio sam barem jednom operiran: DA NE

16. Bolujem od astme ili dijabetesa: DA NE

17. Barem jedan od roditelja boluje od astme, dijabetesa ili maligne bolesti: DA NE

18. Nosim ili bih trebao nositi naočale za korekciju vida: DA NE

19. Srčana frekvencija (1/min) pri mirnom sjedenju: _______

20. Dijastolički tlak (mm Hg) pri mirnom sjedenju: _______

21. Sistolički tlak (mm Hg) pri mirnom sjedenju: __________

22. Srčana frekvencija (1/min) pri mirnom stajanju: _______

23. Dijastolički tlak (mm Hg) pri mirnom stajanju: _______

24. Sistolički tlak (mm Hg) pri mirnom stajanju: __________

25. Srčana frekvencija (1/min) nakon tjelovježbe: _______

26. Dijastolički tlak (mm Hg) nakon tjelovježbe: _______

27. Sistolički tlak (mm Hg) nakon tjelovježbe: __________

28. Broj bodova na testu intelektualnih sposobnosti

Page 84: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

78

Vježba 2: Unos podataka

• U drugoj se vježbi studenti upoznaju sa statističkom aplikacijom Statistica 6.0. Naglasak je na općim stvarima, zajedničkim za kasnije uporabe u pojedinim vježbama (specifičnosti uporaba menija, grafičke mogućnosti, unos, promjena i generiranje novih varijabli).

• Podatke dobivene na Vježbi 1 studenti unose u elektroničke tablice (data sheet) u okviru aplikacija Excel i Statistica. Varijable su definirane u Upitniku. U donjoj su tablici (kodni plan) popisane u istom poretku (broj), navedena su njihova imena u elektroničkoj tablici (ime varijable), te način kodiranja kategorijskih varijabli (tablični unos). Ako vrijednost neke varijable ne znamo, pripadno polje u elektroničkoj tablici ostavljamo praznim.

• Nakon pažljive provjere točnosti unosa svi studenti koriste zajedničku datoteku imena StatVjezbe03.

Kodni plan

broj ime varijable tablični unos 1 ime tekst imena ili šifre 2 spol 1 (muškarci), 2 (žene) 3 masa 4 visina 5 kgrupa 1 (A), 2 (B), 3 (AB), 4 (0) 6 plaveoci 1 (DA), 0 (NE) 7 plavakosa 1 (DA), 0 (NE) 8 rodvid 1 (DA), 0 (NE) 9 bcipela 10 uspjeh 11 cigar 1 (DA), 0 (NE) 12 rodcig 1 (DA), 0 (NE) 13 sport 1 (DA), 0 (NE) 14 fraktura 1 (DA), 0 (NE) 15 operacija 1 (DA), 0 (NE) 16 bolest 1 (DA), 0 (NE) 17 rodbol 1 (DA), 0 (NE) 18 vidman 1 (DA), 0 (NE) 19 f0 20 dtlak0 21 stlak0 22 f1 23 dtlak1 24 stlak1 25 f2 26 dtlak2 27 stlak2 28 intspos

Page 85: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

VJEŽBE IZ BIOSTATISTIKE

79

Vježba 3: Deskriptivna statistika

1. Razvrstajte varijable 1-28 prema vrstama (u tablici 3x28). 2. Prikažite tablično raspodjele učestalosti (distribucije) svih kategorijskih i ordinalnih

varijabli, za cijeli uzorak i posebno prema spolovima. 3. Na računalu kreirajte (pomoću aplikacije Statistika) razne oblike grafičkih prikaza

distribucija iz zadatka 2. 4. Tablično prikažite varijablu intspos podijeljenu u 7 razreda jednakog raspona, bez

preklapanja.

Raspon razreda učestalost

1

2

3

4

5

6

7

5. Prikažite tablično sljedeće parametre distribucija: (i) broj jedinki u uzorku, (ii) mod, (iii) najmanju vrijednost, (iv) najveću vrijednost i (v) standardnu devijaciju za varijable: visina muškaraca, visina žena, tjelesna masa muškaraca, tjelesna masa žena, broj cipela muškaraca, broj cipela žena, srčana frekvencija pri mirnom sjedenju muškaraca i srčana frekvencija žena pri mirnom sjedenju.

6. Uz pretpostavku da su distribucije krvnog tlaka normalne, procijenite u kojem se

rasponu oko aritmetičke sredine nalazi: a) 68% izmjerenih vrijednosti dtlak0 (svih ispitanika)

b) 95% izmjerenih vrijednosti visina muškaraca

b) 99% izmjerenih vrijednosti intpos (svih ispitanika)

7. Otvorite aplikaciju Word i kreirajte novi dokument. Dokument pospremite u svoj direktorij i dajte mu ime po vašem imenu i prezimenu (MateMatić.doc). Pokrenite Excel aplikaciju, te kreirajte stupičaste grafikone koji prikazuju aritmetičke sredine promjena sistoličkog tlaka izmeñu stajanja i tijekom opterećenja, i to posebno spolovima. Grafikon prebacite u Word dokument.

Page 86: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

80

Vježbe 4 i 5: Usporedbe metričkih i kategorijskih varijabli

1. Pokažite u kojim se varijablama na promatranom uzorku muškarci i žene statistički značajno razlikuju. Istražite varijable pod rednim brojevima: 3, 4, 6, 7 i 10. Rezultate prikažite tablično. Navedite p-vrijednost, vrstu testa i kratko obrazložite zašto je odreñeni test korišten.

2. Istražite da li izmeñu ispitanika koji imaju različite krvne grupe postoji statistički značajna razlika u bilo kojoj metričkoj varijabli. U čemu se ovaj zadatak razlikuje od prvog?

3. Istražite da li na promatranom uzorku (svi ispitanici) postoji statistički značajna razlika izmeñu tjelesnog opterećenja i mirnog stajanja u a) srčanoj frekvenciji i b) sistoličkom krvnom tlaku. Rezultate prikažite tablično i grafički, pomoću aplikacije Excel. Navedite p-vrijednost, vrstu testa i kratko obrazložite zašto je odreñeni test korišten. UPUTA: Ne morate voditi računa da smo varijable mjerili i u sjedenju, tj. u ukupno više od 2 stanja (ne morate koristiti analizu varijance!).

4. Provjerite da li se srčana frekvencija u bilo kojem od tri stanja (sjedenje, stajanje, tjelesni napor) statistički značajno razlikuje izmeñu:

a) spolova

b) sportaša i nesportaša

c) pušača i nepušača

d) osoba s i bez kronične bolesti

Rezultate prikažite tablično i grafički, pomoću aplikacije Excel.

5. Provjerite da li se spolovi razlikuju glede promjena sistoličkog tlaka tijekom opterećenja u odnosu na mirno stajanje.

6. Polažite da li postoji statistički značajna povezanost izmeñu:

a) pušenja i bavljenja sportom

b) plave boje očiju i plave boje kose

c) pušenja i postojanja kronične bolesti

U svim testovima navedite p-vrijednost. U interpretaciji statističke značajnosti koristite

se jednom od uobičajenih graničnih p-vrijednosti: 0.1, 0.05 (najčešće se koristi) ili

0.001. Izaberite sami!

Page 87: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

VJEŽBE IZ BIOSTATISTIKE

81

Vježba 6: Dijagnostičke vrijednosti testa

U vježbi ćemo poznati ishod, spol, pokušati predvidjeti iz drugih antropometrijskih karakteristika. Pripadnost odreñenom spolu “testirat” ćemo:

1. Pomoću poznate tjelesne mase, koristeći nekoliko pragova, bilo unaprijed odreñene mase (npr. 60 kg) ili podataka o distribuciji mase cijelog uzorka. Npr. smatrat ćemo da se radi o ispitanici ako je masa manja od 60 kg (varijanta 1), manja od donjeg kvartila (varijanta 2), manja od medijana (varijanta 3) ili od gornjeg kvartila svih podataka tjelesne mase (varijanta 4).

2) Pomoću poznate visine, na sličan način kao i u slučaju mase.

3) Kombinirajući podatke o visini i masi. Npr. smatrat ćemo da se radi o ispitanici ako je ispunjeno oboje: masa manja od medijana svih masa i visina manja od medijana svih masa. Osmislite i testirajte vlastite kriterije!

• Skicirajte tablično svaki problem, izračunajte osjetljivost i specifičnost svih “testova”. Komentirajte kako na te dijagnostičke parametre utječe diskriminacijski prag. •••• Izračunajte preostale parametre valjanosti testova: točnost, pozitivnu prediktivnu vrijednost i negativnu prediktivnu vrijednost. •••• Koja su ograničenja u primjeni vaših rezultata na šire populacije?

Page 88: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

82

Vježba 7: Linearna regresija i korelacija

1. Istražite da li postoji povezanost izmeñu sljedećih varijabli:

a) visina, masa, broj cipela, uspjeh u školi, broj bodova na testu intelektualnih sposobnosti,

b) dijastolički i sistolički tlakovi u svim promatranim stanjima zasebno (zašto zasebno?), c) relativne vrijednosti tlakova i relativne srčane frekvencije pri stajanju i nakon

opterećenja (definirane kao postotak od vrijednosti pri sjedenju). Rezultate prikažite tablično (matrica korelacijskih koeficijenata), neparametrijske korelacije posebno označite. Napravite 3 posebne tablice (za povezanosti pod a), b) i c)). Relativne vrijednosti varijabli generirajte pomoću aplikacije Statistica 6.0, nazovite ih tako da na kraj imena varijable dodate R (npr. dtlak1R). UPUTA: Prvo provjerite kada možete uporabiti parametrijsku statistiku. Nemojte testirati fiziološki besmislene povezanosti (npr. dijastolički tlak pri sjedenju sa sistoličkim tlakom u stajanju). Usporedite relativne vrijednosti tlakova (npr. sistoličkog krvnog tlaka) u odreñenom “pobuñenom” stanju (npr. nakon opterećenja) s relativnom vrijednostima srčane frekvencije (time testirate povezanost promjena srčane frekvencije s promjenama arterijskih krvnih tlakova) 2. Nakon što ste ustanovili koje su korelacije statistički značajne (sami izaberite graničnu p-vrijednost od tri uobičajene: 0.1, 0.05 ili 0.01), razmislite koja bi varijabla u odreñenom paru prirodno mogla biti prediktor (nezavisna, x), a koja ishod (zavisna, y). Zatim sve takve parove prikažite grafički, u okviru rezultata linearne regresije. Grafove obradite prema uputama iz Skripte. U legendi ispod svakog grafa objasnite o čemu se radi (ne ponavljajte podatke koji su prikazani na samom grafu!). Dakle:

a) ne prikazujete regresije koje su besmislene ili statistički neznačajne

b) regresije veličina koje se ne mogu staviti u odnos prediktor-ishod komentirajte samo pomoću koeficijenta korelacije (bez prikazivanja regresijske jednadžbe, prema uputama u Skripti)

c) regresije tipa prediktor-ishod upotpunite regresijskom jednadžbom i standardnom pogreškom procjene. Komentirajte što znači p-vrijednost regresije.

Page 89: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

VJEŽBE IZ BIOSTATISTIKE

83

Page 90: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

84

Dijagrami toka za izbor statističke analize

Page 91: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

VJEŽBE IZ BIOSTATISTIKE

85

Page 92: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

86

Page 93: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

VJEŽBE IZ BIOSTATISTIKE

87

Page 94: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

88

Page 95: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

VJEŽBE IZ BIOSTATISTIKE

89

Pitanja za provjeru znanja

u svim je pitanjima od 5 ponuñenih odgovora točan samo jedan

1. Nacionalnost, krvna grupa, tumorski stadij i volumen pluća redom su sljedeći tipovi varijabli:

a) kategorijska, ordinalna, ordinalna i metrička b) ordinalna, kategorijska, ordinalna i metrička c) kategorijska, kategorijska, ordinalna i metrička d) kategorijska, kategorijska, kategorijska i metrička e) kategorijska, kategorijska, kategorijska i ordinalna 2. Vrijednost varijable koja ima najveću učestalost uvijek je:

a) aritmetička sredina b) medijan c) mod d) standardna devijacija e) varijanca 3. Srednja vrijednost i standardna devijacija visine skupine 17-godišnjih dječaka redom iznose 180 i 9 cm. Koeficijent varijacije tjelesne visine u ovom je primjeru:

a) 5% b) 12% c) 6% d) 8% e) 4% 4. Parametrijske testove koristimo:

a) u slučaju malih uzoraka b) kada usporeñujemo ordinalne varijable c) u slučaju nesimetričnih distribucija d) kada su varijable normalno distribuirane e) u slučaju nezavisnih uzoraka 5. Tzv. p-vrijednost statističkog testa:

a) prirodan je broj b) može biti negativna c) u rasponu je od nule do 1 d) vjerojatnost je da nul-hipoteza nije točna e) naziva se razinom značajnosti

Page 96: 1. TEMELJNI STATISTIČKI POJMOVI - neuron.mefst.hrneuron.mefst.hr/docs/graduate school/ebm/Predmeti/klinicka... · 1. TEMELJNI STATISTIČKI POJMOVI 1 1. TEMELJNI STATISTIČKI POJMOVI

Eterović, Kardum: Biostatistika za studente medicine

90

6. Hi-kvadrat testom za nezavisne uzorke provjerit ću značajnost razlike:

a) u prolaznosti (prošao/pao) ovog ispita izmeñu muškaraca i žena b) u bodovima dobivenim na ovom ispitu izmeñu muškaraca i žena c) u dobi izmeñu onih koji su ispit pali i onih koji su prošli d) u visini izmeñu onih koji su ispit pali i onih koji su prošli e) u bodovima dobivenim na ovom ispitu i na testu intelektualnih sposobnosti 7. t-testom provjerit ću značajnost razlike:

a) učestalosti točnog odgovara na ovo pitanje izmeñu muškaraca i žena b) u bodovima dobivenim na ovom ispitu izmeñu muškaraca i žena c) u prolaznosti (prošao/pao) ovog ispita izmeñu muškaraca i žena d) u prolaznosti ovog ispita i učestalosti točnog odgovora na ovo pitanje e) u prolaznosti ovog ispita izmeñu starijih i mlañih od 25 godina 8. Na temelju slučajnih uzoraka stanovništva primorja, otoka i kontinentalne Hrvatske procjenjujemo da li se te 3 populacije razlikuje glede veličine dijastoličkog krvnog tlaka. Uporabit ćemo:

a) t-test za nezavisne uzorke b) analizu varijance c) t-test za zavisne uzorke d) hi-kvadrat test za zavisne uzorke e) hi-kvadrat test za nezavisne uzorke 9. Stotini ljudi izmjereni su dijastolički i sistolički arterijski krvni tlakovi. Ukoliko je koeficijent korelacije izmeñu te dvije veličine 0.7, zaključujemo:

a) ako se dijastolički tlak promijeni za 1 kPa, očekivana promjena sistoličkog je 0.7 kPa b) 49% parova vrijednosti leži na regresijskom pravcu c) 70% parova vrijednosti leži na regresijskom pravcu d) 70% varijacije jednog od krvnih tlakova objašnjavamo varijacijom onog drugog e) 49% varijacije jednog od krvnih tlakova objašnjavamo varijacijom onog drugog