117
Biometrika i planiranje istraživanja na životinjama Miroslav Kapš tel: 239-3949 e-mail: [email protected]

Biometrika i Planiranje Istrazivanja 2010

Embed Size (px)

Citation preview

Page 1: Biometrika i Planiranje Istrazivanja 2010

Biometrika i planiranje istraživanja na životinjama Miroslav Kapš tel: 239-3949 e-mail: [email protected]

Page 2: Biometrika i Planiranje Istrazivanja 2010

1 UVOD ............................................................................................................................................................................. 1 1.1 PODACI I VARIJABLE.................................................................................................................................................. 1 1.2 PRIKAZ PODATAKA.................................................................................................................................................... 3

1.2.1 Grafički prikazi ................................................................................................................................................. 3 1.2.2 Numeričke metode za opis kvantitativnih podataka.......................................................................................... 3 1.2.3 Simboli .............................................................................................................................................................. 3 1.2.4 Aritmetička srednja vrijednost:......................................................................................................................... 4 1.2.5 Varijanca uzorka: ............................................................................................................................................. 4 1.2.6 Standardna devijacija uzorka ........................................................................................................................... 5 1.2.7 Uvodni SAS primjer .......................................................................................................................................... 5

1.3 ZAKLJUČCI O POPULACIJAMA NA TEMELJU UZORAKA................................................................................................ 6 1.4 SLUČAJNE VARIJABLE I NJIHOVE RASPODJELE ........................................................................................................... 6

1.4.1 Raspodjele vjerojatnosti za diskretne slučajne varijable.................................................................................. 7 1.4.2 Raspodjele vjerojatnosti za kontinuirane slučajne varijable ............................................................................ 8

1.5 FUNKCIJE SLUČAJNE VARIJABLE.............................................................................................................................. 14 1.5.1 Neke statistike i njihove raspodjele................................................................................................................. 15 1.5.2 Stupnjevi slobode ............................................................................................................................................ 16

1.6 ZAKLJUČIVANJE O POPULACIJI NA TEMELJU UZORAKA ............................................................................................ 16 1.7 PROCJENA PARAMETARA......................................................................................................................................... 16

1.7.1 Procjena srednje vrijednosti populacije ......................................................................................................... 17 1.7.2 Procjena varijance u normalnoj populaciji .................................................................................................... 17

1.8 PROVJERA HIPOTEZA ............................................................................................................................................... 17 1.8.1 P-vrijednost..................................................................................................................................................... 18 1.8.2 Statistička i praktična značajnost ................................................................................................................... 19 1.8.3 Moguće greške kod statističkog zaključivanja i snaga provjere..................................................................... 19

2 JEDNOSTAVNA LINEARNA REGRESIJA ........................................................................................................... 21 2.1 UVOD ...................................................................................................................................................................... 21 2.2 PROCJENA PARAMETARA Β0 I Β1 ............................................................................................................................... 23 2.3 OSTATAK I SVOJSTVA OSTATKA............................................................................................................................... 24 2.4 PROSJECI I VARIJANCE PROCJENITELJA .................................................................................................................... 24 2.5 STUDENTOVA T-PROVJERA I INTERVAL POUZDANOSTI PROCJENE PARAMETARA...................................................... 25 2.6 INTERVAL POUZDANOSTI ZA Β1................................................................................................................................ 26 2.7 INTERVALI POUZDANOSTI ZAVISNE VARIJABLE ....................................................................................................... 26 2.8 RAŠČLANJENJE UKUPNE VARIJABILNOSTI................................................................................................................ 28

2.8.1 Veza između suma kvadrata............................................................................................................................ 29 2.9 PROVJERA HIPOTEZA - F- PROVJERA........................................................................................................................ 30 2.10 KOEFICIJENT DETERMINACIJE (R2) ........................................................................................................................ 31 2.11 SAS PRIMJER ZA JEDNOSTAVNU LINEARNU REGRESIJU.......................................................................................... 32

3 KOEFICIJENT KORELACIJE ................................................................................................................................ 34 3.1 PROCJENA KOEFICIJENTA KORELACIJE..................................................................................................................... 35

4 VEKTORI I MATRICE ............................................................................................................................................. 36 4.1 TIPOVI I SVOJSTVA MATRICA ................................................................................................................................... 36

4.1.1 Operacije s matricama i vektorima: ............................................................................................................... 37 5 JEDNOSTAVNA REGRESIJA U MATRIČNOM PRIKAZU............................................................................... 40

6 MULTIPLA REGRESIJA.......................................................................................................................................... 43 6.1 DVIJE NEZAVISNE VARIJABLE.................................................................................................................................. 43

6.1.1 Raščlanjenje ukupne varijabilnosti i provjera hipoteza ................................................................................. 45 6.2 PARCIJALNE I STUPNJEVITE EKSTRA SUME KVADRATA ............................................................................................ 46 6.3 SAS PRIMJER ZA MULTIPLU REGRESIJU ................................................................................................................... 47 6.4 KRIVOLINIJSKA REGRESIJA DRUGOG STUPNJA ......................................................................................................... 48

6.4.1 SAS primjer za kvadratnu regresiju................................................................................................................ 49 6.5 MOGUĆE POTEŠKOĆE KOD UPOTREBE REGRESIJE .................................................................................................... 50

6.5.1 Analiza ostataka i narušenost pretpostavki modela........................................................................................ 51

Page 3: Biometrika i Planiranje Istrazivanja 2010

6.5.2 Loša opažanja................................................................................................................................................. 52 6.5.3 Multikolinearnost............................................................................................................................................ 52

6.6 IZGRADNJA MODELA I KRITERIJI ZA IZBOR MODELA................................................................................................. 53 7 JEDNOSTRUKA ANALIZA VARIJANCE ............................................................................................................. 54

7.1 MODEL JEDNOSTRUKE ANALIZE VARIJANCE S FIKSNIM UTJECAJIMA........................................................................ 55 7.1.1 Raščlanjenje ukupne varijabilnosti na izvore varijabilnosti: ......................................................................... 56 7.1.2 Postavljanje hipoteza i F-provjera ................................................................................................................. 57

7.2 USPOREDBA SREDNJIH VRIJEDNOSTI POJEDINIH GRUPA ........................................................................................... 59 7.2.1 Najmanja značajna razlika (LSD) .................................................................................................................. 59 7.2.2 Tukey provjera (HSD)..................................................................................................................................... 59

7.3 SAS PRIMJER JEDNOSTRUKE ANALIZE VARIJANCE S FIKSNIM UTJECAJIMA .............................................................. 60 7.4 MODEL SA SLUČAJNIM UTJECAJIMA GRUPA ............................................................................................................. 61 7.5 INTRAKLASNA KORELACIJA..................................................................................................................................... 63 7.6 SAS PRIMJER JEDNOSTRUKE ANALIZE VARIJANCE SA SLUČAJNIM UTJECAJIMA ....................................................... 64

8 NAČELA PLANIRANJA POKUSA.......................................................................................................................... 65 8.1 POKUSNA JEDINICA I TRETMANI .............................................................................................................................. 66 8.2 PONAVLJANJA I POKUSNA GREŠKA .......................................................................................................................... 66 8.3 POTREBAN BROJ PONAVLJANJA ............................................................................................................................... 67

9 POTPUNO SLUČAJNI POKUSNI PLAN................................................................................................................ 68

10 BLOKOVI U ANALIZI VARIJANCE.................................................................................................................... 70 10.1 SLUČAJNI BLOK PLAN (POTPUNI) ........................................................................................................................... 70

10.1.1 Raščlanjenje ukupne sume kvadrata............................................................................................................. 71 10.1.2 Postavljanje hipoteza i F-provjera ............................................................................................................... 72 10.1.3 SAS primjer za slučajni blok plan................................................................................................................. 73 10.1.4 SAS primjer s više pokusnih jedinica po kombinaciji blok x tretman ........................................................... 74

11 'CHANGE-OVER' POKUSNI PLANOVI .............................................................................................................. 77 11.1 JEDNOSTAVNI 'CHANGE-OVER' PLAN...................................................................................................................... 77 11.2 'CHANGE-OVER' PLAN KADA POSTOJI UTJECAJ RAZDOBLJA.................................................................................... 78

11.2.1 SAS primjer za ‘change-over’ plan s utjecajem razdoblja ........................................................................... 79 11.3 LATINSKI KVADRAT............................................................................................................................................... 80

11.3.1 SAS primjer za latinski kvadrat..................................................................................................................... 82 11.4 CHANGE OVER PLAN POSTAVLJEN KAO VIŠE LATINSKIH KVADRATA...................................................................... 84

12 FAKTORIJALNI POKUS........................................................................................................................................ 85 12.1 SAS PRIMJER ZA FAKTORIJALNI POKUS ................................................................................................................. 88

13 HIJERARHIJSKI POKUSNI PLANOVI ............................................................................................................... 90 13.1 SAS PRIMJER ZA HIJERARHIJSKI PLAN ................................................................................................................... 92

14 POKUSNI PLANOVI SA KAVEZIMA I PREGONIMA ..................................................................................... 94

15 DVOSTRUKI BLOKOVI......................................................................................................................................... 96

16 SPLIT PLOT POKUSNI PLAN............................................................................................................................. 100 16.1 FAKTOR A (GLAVNI FAKTOR) KAO SLUČAJNI BLOK PLAN .................................................................................... 100

16.1.1 SAS Primjer: Split plot plan, glavne jedinice kao slučajni blokovi ............................................................ 101 16.2 FAKTOR A (GLAVNI FAKTOR) KAO POTPUNO SLUČAJNI PLAN .............................................................................. 103

16.2.1 SAS primjer: Glavne jedinice u potpuno slučajnom planu ......................................................................... 104 17 ANALIZA KOVARIJANCE.................................................................................................................................. 106

17.1 POTPUNO SLUČAJNI POKUSNI PLAN SA KOVARIJABLOM ....................................................................................... 106

Page 4: Biometrika i Planiranje Istrazivanja 2010

1

1 Uvod

1.1 Podaci i varijable

Podaci: - materijal s kojim statističar radi - prikupljaju se mjerenjem, brojanjem ili opažanjem - Primjeri: skup težina teladi, količina mlijeka u laktaciji, muški ili ženski spol, plava ili zelena boja očiju

Pokus ili eksperiment:

– Proces sakupljanja, opažanja ili mjerenja podataka Varijabla

– Označava skup podataka – Poprima različite vrijednosti

• vrijednosti varijable pokazuju varijabilnost – Primjeri: težina, količina mlijeka, spol, boja očiju –

Podaci su vrijednosti koje varijabla poprima. - težina od 200 kg, ili količina mlijeka od 20 kg.

VARIJABLE

KVALITATIVNE (ATRIBUTIVNE, KATEGORIČKE).

KVANTITATIVNE (NUMERIČKE)

NOMINALNE ORDINALNE DISKRETNE KONTINUIRANE

VARIJABLE A) kvantitativne (numeričke)

- čije se vrijednosti prikazuju brojevima, a razlike između brojeva imaju numeričko značenje - težina životinja, broj mladih u leglu, temperatura, vrijeme a) diskretne

- konačna ili beskonačna - prebrojiva, mjeri sa cijelim ili prirodnim brojevima - broj mladih u leglu ili broj jaja

Page 5: Biometrika i Planiranje Istrazivanja 2010

2

b) kontinuirane - poprima beskonačno mnogo vrijednosti - njene vrijednosti mjere se realnim brojevima - količina mlijeka ili težina

B) kvalitativne (atributivne, kategoričke)

- podaci su im opisni - boja očiju ili da li je životinja bolesna ili nije a) nominalne

- ne može se reći da je jedna kategorija veća ili manja od druge - boja očiju ili kože

b) ordinalne - kod kojih se kategorije mogu poredati po veličini - ocjene lakoće telenja

Zašto podaci, mjerenja, opažanja

• Mjerenja ili opažanja nam pomažu u zaključivanju o nekoj pojavi • Pitanje je i koji je uzrok da je neka krava bolja

– Da li možemo ‘izmjeriti’ i taj uzrok – Da li možemo reći da će uslijed nekog zahvata krava biti ‘bolja’ – Na primjer: ako damo kravi mineralni dodatak da li će dati više mlijeka? Kako ćemo

to zaključiti? • Zaključak:

– Rekapitulacija stanja – Koristiti i u budućim situacijama

Koliko smo sigurni da je naš zaključak korektan?

• Točnost i preciznost zaključaka ovise o broju podataka (količini informacija), kvaliteti podataka, reprezentativnosti podataka

• Često donosimo zaključak uz neku vjerojatnost Statističke metode

• Načini na koje dolazimo do zaključaka koristeći podatke • Uključuju sakupljanje, organiziranje, tabeliranje, analizu, interpretaciju, opis i prezentaciju

podataka • Uključuju pažljivo i precizno definiranje problema (postavljanje cilja), donošenje pravilnog

zaključka koji pomaže odgovoriti na postavljeno pitanje ili cilj Biometrika (Biostatisika), a posebno statističke metode uključuju dva glavna pristupa u donošenju

zaključaka: 1. Opis nekog skupa podataka (opisna statistika) 2. Izbor uzoraka iz većeg skupa podataka (populacije, izvora podataka) i korištenje tih uzoraka za

zaključak o toj populaciji (populacijama)

Page 6: Biometrika i Planiranje Istrazivanja 2010

3

1.2 Prikaz podataka

1.2.1 Grafički prikazi Primjer: Histogram:

-raspodjela frekvencija nekog skupa podataka - podaci se svrstavaju u razrede - prikazuje broj opažanja u pojedinom razredu - prava ili relativna frekvencija

1 1

5

8 86

12

16

12

7 78

2

5

2

02468

10121416

190 200 210 220 230 240 250 260 270 280 290 300 310 320 330

Sredine razreda

Bro

j tel

adi

Slika 1-1: Histogram težine teladi u dobi od 7 mjeseci (n=100)

1.2.2 Numeričke metode za opis kvantitativnih podataka NUMERIČKE OPISNE MJERE A) Mjere centralne tendencije

- Aritmetička srednja vrijednost - Medijan - Mode B) Mjere varijabilnosti - Raspon - Varijanca - Standardna devijacija - Koeficijent varijabilnosti

C) Mjere relativnog položaja - Percentili - z-vrijednost

1.2.3 Simboli

Σi = veliko grčko slovo sigma = oznaka za sumu i = 1 do n

Suma n brojeva:

Σi yi = y1 + y2 +.....+ yn

Suma kvadrata n brojeva:

Σi y2i = y2

1 + y22 +.....+ y2

n Suma produkata dva niza brojeva:

Σi xiyi = x1y1 + x2y2 +.....+ xnyn

Page 7: Biometrika i Planiranje Istrazivanja 2010

4

Primjer: y y1 y2 y3 2 4 6

x x1 x2 x3 3 6 7

Σi yi = y1 + y2 + y3 = 2 + 4 +6 = 12

Σi y2i = y2

1 + y22 + y2

3 = 22 + 42 +62 = 56

Σi xiyi = x1y1 + x2y2 + x3y3 = (3)(2) + (6)(4) +(7)(6) = 72 1.2.4 Aritmetička srednja vrijednost:

n

yy i i∑=

Svojstva aritmetičke srednje vrijednosti:

1. ( )∑ =−i i yy 0

2. ( )∑ =−i i yy minimum2

drugim riječima ( ) ( )∑∑ −<−

i ii i ayyy 22 , za bilo koji broj a. 1.2.5 Varijanca uzorka: Ako se i prosjek izračunava iz istog uzorka kao y (tj. ako je nepoznat prosjek populacije)

1

)( 22

−= ∑

n

yys i i

Ako je od prije poznat prosjek populacije µ i NE računa se iz istog uzorka:

n

ys i i∑ −

=2

2)( µ

- Varijanca je prosječno kvadrirano odstupanje od prosjeka Suma kvadriranih odstupanja od srednje vrijednosti (korigirana suma kvadrata) =

( )n

yyyy i i

i ii i

2

22)( ∑∑∑ −=−

Page 8: Biometrika i Planiranje Istrazivanja 2010

5

1.2.6 Standardna devijacija uzorka

2ss = prosječno odstupanje od prosjeka 1.2.7 Uvodni SAS primjer

Pogledajmo rješavanje primjera o uzorku težine teladi koristeći SAS software. Na detaljna objašnjenja upotrebe programa čitaoca upućujem na iscrpnu SAS literaturu, dio koje može vidjeti u popisu literature na kraju ove knjige. Ovdje možemo samo ukratko spomenuti da se svaki SAS program sastoji od dva dijela: 1) DATA step, koji služi za unos ili kreiranje skupa podataka za koji se želi napraviti analiza, i 2) PROC step, koji služi za analizu podataka. Treba još reći da SAS software daje mogućnost obrade podataka i bez pisanja programa sa instrukcijama, tj. koristeći i birajući ponuđene opcije za željenu analizu. Međutim, pisanje programa daje korisniku veće mogućnosti i znanje o korištenju programa bez obzira na kompjutersku platformu. SAS ima tri osnovna prozora: Program prozor (PGM) u koji se upisuje program, Ispis prozor (OUT) u kojem korisnik može vidjeti ispis i LOG prozor u kojem se može provjeriti detalje o provedbi programa i moguće greške. Vratimo se primjeru o težinama teladi. Izmjereni su slijedeći podaci 20 teladi: SAS program: DATA telad; INPUT tezina @@; DATALINES; 260 260 230 280 290 280 260 270 260 300 280 290 260 250 270 320 320 250 320 220 ; PROC MEANS DATA = telad N MEAN MIN MAX VAR STD CV ; VAR tezina; RUN;

Objašnjenje: SAS naredbe pisat ćemo uvijek velikim slovima da ih istaknemo, makar to u programu nije potrebno, tj. program jednako tretira i velika i mala slova. Imena koja sam korisnik daje varijablama i drugim oznakama pisat ćemo malim slovima. Naredba DATA definira ime datoteke koja će sadržavati podatke, a ovdje je telad ime datoteke. Naredba INPUT definira ime varijable, a naredba DATALINES govori da slijede podaci. Ovdje je varijabla tezina. SAS treba podatke varijabli u kolonama, pa se u pravilu podaci i pišu u kolone. Na primjer, INPUT tezina; DATALINES; 260 260 … 220 ;

učitava podatke varijable tezina. Podaci se mogu pisati i jedan za drugim u redu ako se koristi oznaka @@ kod naredbe INPUT. SAS čita podatke jedan po jedan i sprema ih u kolonu. Program koristi proceduru MEANS. Da bi označili da je to ime procedure treba napisati PROC MEANS. DATA = telad, definira za koju datoteku će se računati statistike. Slijedi popis statistika koje tražimo: N = broj podataka, MEAN = aritmetička srednja vrijednost, MIN = minimum, MAX = maksimum, VAR = varijanca, STD= standardna devijacija, CV = koeficijent varijacije. Naredba VAR definira varijablu (tezina) koja će se analizirati.

Page 9: Biometrika i Planiranje Istrazivanja 2010

6

SAS ispis: Analysis Variable: TEZINA

N Mean Minimum Maximum Variance Std Dev CV ------------------------------------------------------------- 20 273.5 220 320 771.31579 27.77257 10.1545 -------------------------------------------------------------

SAS ispis prikazuje ime varijable koja će se analizirati (Analysis varijabla: TEZINA), a zatim opisnu statistiku.

1.3 Zaključci o populacijama na temelju uzoraka

• Populacija:

– Skup jedinki koje imaju neka zajednička svojstva od interesa – Izvor podataka

• Parametri:

– Opisni pokazatelji populacije – Obično nepoznate vrijednosti – Primjer: prosjek populacije

• Koliki je prosjek količine mlijeka u laktaciji?

• Uzorak: – Skup jedinki (podataka) izabran iz populacije – Služi za procjenu i (ili) zaključivanje o populaciji. – Vjerodostojnost procjene i zaključaka o populaciji je veća:

• ako je uzorak dobar predstavnik populacije • uzorak mora biti slučajno izabran

• Statistike:

– Numerički opisni pokazatelji uzorka (eng. statistics) – Mogu se izračunati iz uzoraka – Primjer: aritmetička srednja vrijednost uzorka

• Statistički zaključci na temelju uzoraka su podložni greški • Donose se uz neku vjerojatnost • Kako odrediti vjerojatnost?

– Definiranjem slučajne varijable i matematičkih modela raspodjele vjerojatnosti

1.4 Slučajne varijable i njihove raspodjele

Slučajna varijabla:

• Matematički pojam, govori kako se opažanju pridružuje numerička vrijednost • Vrijednost koju varijabla poprima smatra se slučajnim procesom (događajem)

– Na primjer: izmjerimo tele i vidimo da je teško 180 kg. Međutim ne znamo zašto baš ima 180 kg.

Page 10: Biometrika i Planiranje Istrazivanja 2010

7

– Barem dio te vrijednosti zato smatramo slučajnim • Slučajna varijabla poprima određenu numeričku vrijednost s određenom vjerojatnosti

y je oznaka za varijablu yi predstavlja vrijednost i-tog opažanje

- određeno opažanje: y1, y2 y ≤ y0 su sve vrijednosti koje su manje ili jednake od y0 Slučajne varijable

Kontinuirana (neprekidna) - sve vrijednosti u nekom intervalu - realni brojevi - težina teladi starih 6, bilo koja vrijednost u intervalu od 160 do 260 kg, recimo 180.0 ili 191.23456

Diskretna (prekidna) - poprima samo određeni broj vrijednosti u nekom intervalu - NE sve vrijednosti - često cijeli brojevi - broj latica u cvijetu, broj mladih u leglu

Vrijednost varijable y

- numerički događaj - ima određenu vjerojatnost da se dogodi

Raspodjela vjerojatnosti slučajne varijable y: - tablica, grafikon ili formula koji pokazuje vjerojatnost da y poprimi određenu vrijednost

Raspodjela vjerojatnosti slučajne varijable

• Raspodjela vjerojatnosti slučajne varijable s konačnim ili prebrojivim vrijednostima je raspodjela frekvencija

• Raspodjela vjerojatnosti se često može prikazati formulom (funkcijom) – Matematički model prave raspodjele frekvencija – Procjena prave raspodjele frekvencija – Funkcija slučajne varijable: p(y) ili f(y)

• Raspodjela = distribucija Očekivanje (prosjek) i varijanca slučajne varijable

- pokazatelji položaja i varijabilnosti Očekivanje (prosjek): E(y) = µy

Varijanca: Var(y) = σ2y =σ2 = E[(y – µy)2] = E[y2] – µy

2 (Sjetite se da je varijanca prosječno kvadrirano odstupanje od prosjeka)

1.4.1 Raspodjele vjerojatnosti za diskretne slučajne varijable - tabelarni ili grafički prikaz ili formula koja daje vjerojatnost p(y) za svaku moguću vrijednost

varijable y. Uvjeti: 1. O ≤ p(y) ≤ 1

2. Σ(svi y) p(y) =1

Page 11: Biometrika i Planiranje Istrazivanja 2010

8

Primjeri diskretnih varijabli

• Binarna varijabla – samo dva moguća rezultata neke pojave – DA i NE ili 0 i 1 bolestan – zdrav i sl

• Binomna varijabla

– Broj povoljnih pokušaja (y) u ukupno n pokušaja – U pojedinačnom pokušaju moguća samo dva rezultata

• broj ženske teladi u 4 telenja, broj bijelih praščića u leglu Binomna raspodjela - raspodjela vjerojatnosti y povoljnih opažanja (pokušaja) u ukupno n pokušaja - broj ženske teladi u 4 telenja - broj bijelih praščića u leglu Raspodjela vjerojatnosti od y: - određena parametrom p i brojem pokušaja n:

ynyqpyn

yp −

=)(

(y = 0,1,2,,...., n) p = vjerojatnost povoljnog rezultata u pojedinačnom opažanju (pokušaju) (vjerojatnost elementarnog događaja). q = 1 – p = vjerojatnost nepovoljnog rezultata Oblik raspodjele vjerojatnosti ovisi o p: - binomna raspodjela je simetrična kada je p = 0.5 - asimetrična u svim ostalim slučajevima

00.050.1

0.150.2

0.250.3

0 1 2 3 4 5 6 7 8broj povoljnih pokušaja

frekvencija

A)

0

0.1

0.2

0.3

0.4

0 1 2 3 4 5 6 7 8

broj povoljnih pokušaja

frekvencija

B)

Slika 1-2: Binomna raspodjela (n = 8) za dva slučaja A) p=0.5 i B) p = 0.2 Primjer 1.4.2 Raspodjele vjerojatnosti za kontinuirane slučajne varijable Kontinuirana slučajna varijabla:

• Poprima neprebrojivo mnogo vrijednosti • Nemoguće je pridružiti vjerojatnost za svaki pojedinačni numerički događaj

Page 12: Biometrika i Planiranje Istrazivanja 2010

9

– Teoretski vrijednost kontinuirane varijable je točka, a matematički točka nema dimenzije

– Vjerojatnost da slučajna varijabla poprimi neku određenu vrijednost je jednaka nuli

• VAŽNO: – promatrati vjerojatnost da varijabla y poprima vrijednosti u nekom intervalu – vjerojatnost se pridružuje numeričkom događaju koji se odnosi na neki interval

Primjer: težina teladi - vrijednosti koje se pridružuju pojedinom mjerenju zavise od preciznosti mjerenja - ako npr. preciznost na 1 kg, tada izmjera od 220 kg znači sve mjere od 219.5 do 220.5 kg - pošto se radi o intervalu ==> događaj ima vjerojatnost Funkcija vjerojatnosti gustoće

– Gustoća = podsjetnik da govorimo o vjerojatnosti u intervalima – Funkcija gustoće = model prave (nepoznate) raspodjele frekvencije

Svojstva funkcije gustoće: 1. f(yi) ≥ 0 2. P(–∝ ≤ y ≤ +∝) = 1 (vjerojatnost da se dogodi bilo koji y je jednaka 1) 1.4.2.1 NORMALNA RASPODJELA

- model raspodjele relativnih frekvencija u mnogim pojavama. - normalnu raspodjelu slijede mnogi pokazatelji koji se koriste za statističko zaključivanje. - normalna krivulja = Gaussova krivulja - oblik zvona.

Slika 1-3: Normalna (Gaussova) krivulja

Položaj i oblik normalne krivulje je određen sa dva parametra µ i σ2 (prosjek i varijanca) Funkcija gustoće je:

− −

=

2

21

22

1)(σ

µ

πσ

y

eyf

-∝ < y < +∝

e = baza prirodnog logaritma (e = 2.71828...) π = 3.14...

y je normalna slučajna varijabla => y ∼ N (µ,σ2)

Page 13: Biometrika i Planiranje Istrazivanja 2010

10

- Visina i raspršenost krivulje ovisi o varijanci σ2 - Povećanje σ2 dovodi da krivulja smanjuje visinu i više je raširena.

0

0.1

0.2

0.3

0.4

-4 -3 -2 -1 0 1 2 3 4

Frrekvencija

σ = 1σ = 1.5

Slika 1-4: Normalne krivulje sa standardnim devijacijama σ = 1 i σ = 1.5

Vjerojatnost da se slučajno izabrana jedinka (s nekom vrijednosti y) nalazi u intervalu (y1, y2) je

jednaka površini ispod normalne krivulje ograničena vrijednostima y1 i y2. (Uzima se da je ukupna površina 1 ili 100%)

Ova vjerojatnost je jednaka proporciji jedinki s vrijednostima između y1 i y2

Primjer: Vjerojatnost da y bude između 170 i 210

P(y1 ≤ y ≤ y2) = P(170 ≤ y ≤ 210)

µ = 200

y1 = 170 y2 = 210

Slika 1-5: Površina ispod normalne krivulje ograničena vrijednostima 170 i 210

Primjer: Vjerojatnost da y < 230

µ = 200 0y = 230

Slika 1-6: Normalna krivulja sa µ = 200 i σ = 20

Standardizacija normalnih krivulja

Page 14: Biometrika i Planiranje Istrazivanja 2010

11

• Budući da oblik krivulje ovisi samo o varijanci (odnosno stanardnoj devijaciji σ), sve normalne krivulje se mogu standardizirati tj. prevesti u standardnu normalnu krivulju

• Standardizacija: slučajna normalna varijabla y se izrazi u jedinicama standardne devijacije:

σµ−

=yz

Standardna normalna krivulja je takva normalna krivulja kojoj je prosjek 0 i standardna devijacija 1

=> µ = 0 i σ = 1 Često se za standardnu normalnu varijablu piše: z ∼ Z ili z ∼ N(0, 1) Funkcija gustoće standardne normalne varijable je:

[ ]221

21)( zezf −

0

95%

-1 1.96 1.96 1

Slika 1-7: Standardna normalna krivulja (µ = 0 i σ2 = 1)

• Površina ispod standardne normalne krivulje ograničena s dvije vrijednosti standardne

normalne varijable z1 i z2, predstavlja vjerojatnost da varijabla poprime vrijednosti između ta dva broja. (opet se utima da je ukupna površina jednaka jedan (ili 100%): P(–∞≤ z ≤ +∞) = 1

• Također: P(–1.96 ≤ z ≤ 1.96) = 0.95 Praktična vrijednost standardizacije je u tome što za pronalaženje površine ispod krivulje ograničenu nekim intervalom koristimo samo jednu krivulju. Podsjetimo se da je površina ispod krivulje u nekom intervalu (y1, y2) odgovara vjerojatnosti da slučajna varijabla y poprima vrijednosti u tom intervalu. Matematički površina ispod krivulje je jednaka određenom integralu funkcije gustoće. Kako ne postoji eksplicitna formula za taj integral, služimo se tablicama (bilo iz knjige ili kompjuterskog programa). Pošto je moguće sve normalne krivulje svesti na standardnu, potrebno je imati samo jednu tablicu. Naime vjerojatnost da y poprima vrijednosti između y1 i y2 je: P(y1 ≤ y ≤ y2) = P(z1 ≤ z ≤ z2) gdje su

σµ−

= 11

yz i σ

µ−= 2

2yz

Page 15: Biometrika i Planiranje Istrazivanja 2010

12

Primjer

z

y

0 1.5

µ=200 y0=230

Slika 1-8: Prikaz normalne i standardne normalne krivulje. Prikazane su dvije skale: originalna skala y

i standardna normalna skala z. Vrijednost varijable y0 = 230 odgovara vrijednosti z0 = 1.5.

210200170

.5 01.5 z

y

Slika 1-9: Površina ispod krivulje između 170 i 210.

Koliki je prosjek odabranih životinja?

zs = prosjek z vrijednosti za koje vrijedi z > z0, tj. z vrijednosti većih od z0. Za standardnu normalnu krivulju vrijedi:

PzfzS

)( 0=

p = površina ispod standardne normalne krivulje za z>z0, f(z0) = ordinata za vrijednost z0. Ordinata je:

π2

)(202

1

0

zezf−

=

-vrijednost funkcije za danu vrijednost z.

Page 16: Biometrika i Planiranje Istrazivanja 2010

13

z 0 z0 zS

P

f(z)

f(z0)

Slika 1-10 Prosjek odabranih z vrijednosti. f(z0) = ordinata krivulje za z = z0, P je površina, odnosno vjerojatnost P(z>z0) i zS je prosjek vrijednosti većih od z0.

Primjer:

1.4.2.2 HI KVADRAT RASPODJELA

Neka su z1, z2,…, zv standardne normalne varijable sa µ = 0 i σ = 1. Slučajna varijabla

χ2 = Σj z2j

ima hi kvadrat raspodjelu sa v stupnjeva slobode.

0.000.050.100.150.200.250.300.350.400.450.50

0 5 10 15 20

v=2

v=6

v=10

χ 2

f (χ 2)

Slika 1.11 Funkcija gustoće χ2 varijabli sa stupnjevima slobode v = 2, v = 6 i v = 10

Nagib i oblik raspodjele ovisi o stupnju slobode 1.4.2.3 STUDENTOVA (T) RASPODJELA

Neka je z normalna slučajna varijabla sa µ = 0 i σ = 1 i χ2 hi-kvadrat slučajna varijabla sa v

stupnjevima slobode. Varijabla definirana sa:

v

zt2χ

=

je slučajna varijabla s t-raspodjelom.

Page 17: Biometrika i Planiranje Istrazivanja 2010

14

stupnjevi slobode v = 16

stupnjevi slobode v = 2

Slika 1-12: Funkcija gustoće t slučajnim varijablama sa stupnjevima slobode 16 i 2.

Studentova t raspodjela je po obliku slična normalnoj samo što sa smanjenjem stupnjeva slobode krivulja postaje više razvučenija (deblja) prema repovima (Slika 1.13).

Kada stupnjevi slobode idu prema beskonačnosti, t raspodjela prelazi u normalnu..

1.4.2.4 F-RASPODJELA

Neka su χ21 i χ2

2 hi-kvadrat slučajne varijable sa stupnjevima slobode v1 i v2. I neka su χ21 i χ2

2 nezavisni. Tada je:

2

22

121

vvF

χχ

=

slučajna varijabla sa F-raspodjelom Oblik F raspodjele ovisi o stupnjevima slobode

Slika 1.13 Funkcije gustoće F raspodjela sa stupnjevima slobode: a) v1=2 i v2 = 6; b) v1=6 i v2 = 10; c) v1=10 i v2 =20

1.5 Funkcije slučajne varijable

• Slučajne varijable: varijable čije vrijednosti mjerimo, opažamo (težina, količina mlijeka – normalne slučajne varijable)

• Funkcije tih varijabli iz uzoraka koje zovemo statistike (primjer: aritmetička srednja vrijednost)

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

0 1 2 3 4 5F

f(F) v1=2; v2=6

v1=10; v2=20

v1=6; v2=10

Page 18: Biometrika i Planiranje Istrazivanja 2010

15

Statistike (engl. statistics)

• Numerički opisni pokazatelji izračunati iz uzorka • Funkcije slučajne varijable => i same su slučajne varijable • Primjeri: y i s2 su statistike • Imaju poznate teoretske raspodjele

– => moguća procjena vjerojatnosti sa kojom se određena vrijednost statistike pojavljuje

– => koriste se za donošenje zaključaka o populaciji 1.5.1 Neke statistike i njihove raspodjele 1.5.1.1 RASPODJELA SREDNJIH VRIJEDNOSTI UZORAKA , SREDIŠNJI GRANIČNI TEOREM

Ako se slučajno izabiru uzorci veličine n iz neke populacije sa srednjom vrijednosti µ i varijancom σ2 i kada je n dovoljno velik, raspodjela srednjih vrijednosti uzoraka može se predočiti normalnom funkcijom gustoće sa prosjekom

µ =yµ i standardnom devijacijom

nyσ

σ = .

yσ = standardna greška procijene prosjeka populacije ili samo standardna greška

yµ Slika 1-14: Raspodjela srednjih vrijednosti uzoraka

yσ se može procijeniti standardnom greškom uzorka

nss y =

1.5.1.2 NEKE STATISTIKE KOJE NEMAJU NORMALNU RASPODJELU

2

2

2

2 )()1(σσ

∑ −=

− iyysn

ima hi-kvadrat raspodjela sa v = (n–1) stupnjevima slobode, ako je y normalna varijabla.

Page 19: Biometrika i Planiranje Istrazivanja 2010

16

Statistika n

s

yt2

µ−= imai studentovu t raspodjelu sa (n–1) stupnjeva slobode, ako je y normalna

varijabla. Neke statistike imaju F raspodjelu. 1.5.2 Stupnjevi slobode

• Broj nezavisnih opažanja povezanih sa procjenom varijance, odnosno s izračunavanjem prosjeka kvadrata

• Ukupan broj opažanja manje broj parametara korištenih u izračunavanju tog prosjeka kvadrata

• Na primjer: u izračunu varijance uzorka stupnjevi slobode su (n–1) Stupnjevi slobode u izračunu varijance uzorka

• Varijanca uzorka je prosječno kvadrirano odstupanje od aritmetičke srednje vrijednosti • Postoji (n–1) nezavisnih opažanja jer smo već s istim opažanjima izračunali aritmetičku

srednju vrijednost • Dakle, prosjek kvadriranih odstupanja dobije se dijeljenjem sume kvadrata sa (n–1)

1.6 Zaključivanje o populaciji na temelju uzoraka

1. Procjena svojstava populacije (procjena parametara)

2. provjera hipoteza o populaciji

1.7 Procjena parametara

Procjene parametara:

Jedinstveni procjenitelj: - pravilo ili formula koja govori kako izračunati procjenu iz uzorka

procjena = broj koji izračunamo

Intervalni procjenitelj -formula koja govori kao izračunati interval procjene

- intervalna procijena = izračunati interval Svojstva jedinstvenih procjenitelja:

- statistika (funkcija slučajne varijable) - izračunat iz uzorka - mora biti nepristran: očekivanje od procjenitelja je jednako pravom parametru - odstupanje procjenitelja od prave vrijednsoti parametra mora imati najmanju varijancu - ima poznatu raspodjelu statistike uzorka (engl. sampling distribution).

Npr. prema centralnom graničnom teoremu raspodjela prosjeka uzorka će biti približno normalna za

velike uzorke ( n > 30), sa srednjom vrijednosti µ i standardnom devijacijom n/σ

Page 20: Biometrika i Planiranje Istrazivanja 2010

17

1.7.1 Procjena srednje vrijednosti populacije

Jedinstveni procjenitelj od µ je y Svojstava: Očekivanje od aritmetičkog prosjeka je jedanko prosjeku populacije - odstupanja )( yyi − imaju najmanju varijancu )( yyVar i − = min.

- y ima normalnu raspodjelu sa µ i n

yσσ =

Statistika

y

yzσ

µ−= ima standardnu normalnu raspodjelu

1.7.2 Procjena varijance u normalnoj populaciji Nepristrani procjenitelj varijance populacije (σ2) je varijanca uzorka:

1

)( 22

−= ∑

n

yys i i

Ukoliko je y normalna varijabla sa prosjekom µ i varijancom σ2, tada je:

2

22 )1(

σχ sn −

=

slučajna varijabla sa hi-kvadrat raspodjelom.

2)2/1(

22

22/

2 )1()1(

αα χσ

χ −

−≤≤

− snsn

1.8 Provjera hipoteza

Hipoteza: tvrdnja o jednoj ili više populacija.

Istraživačka hipoteza

Statistička hipoteza

Nul hipoteza (H0) - nepromijenjeno stanje, nepostojeća razlika - hipoteza koju provjeravamo

Alternativna hipoteza (H1) - promijenjeno stanje, postojeća razlika – obično je identična istraživačkoj - sama se po sebi ne može provjeravati, nego se koristi provjera nul hipoteze.

Page 21: Biometrika i Planiranje Istrazivanja 2010

18

Provjera hipoteza: - na temelju informacija iz uzorka - rezultira u jednoj od dvije odluke:

1. odluka da se H0 odbaci 2. odluka da se H0 ne odbaci, jer uzorak nije dao dovoljno dokaza da bi se H0 odbacila.

- H0 i H1, se uvijek postavljaju tako da isključuju jedna drugu - kada odbacujemo H0, pretpostavljamo da je H1 točna. - u zaključivanju koristimo zakone vjerojatnosti

Općenito, lakše je dokazati da je neka hipoteza lažna nego da je točna

- prihvaćanje H0 ne znači da je ona točna, nego da uzorak ne daje dovoljno dokaza da je H0 lažna. - prihvaćamo H0 sve dok nije prikupljeno dovoljno dokaza koji je obaraju

Koraci u provjeri hipoteza: 1) Definiramo H0 i H1 2) Odredimo α (razinu značajnosti) 3) Izračunamo procjenu parametra 4) Odredimo statistiku za provjeru i njezinu raspodjelu kada vrijedi H0 i izračunamo njenu vrijednost iz uzorka 5) Odredimo kritičnu vrijednost, kritično područje 6) Usporedimo izračunatu vrijednost statistike za provjeru sa kritičnim vrijednostima i donosimo zaključak. Prikaz razine značajnosti, kritične vrijednosti i kritičnog područja poznate raspodjele

zα/2 -

α/2 α/2

razina značajnosti = α

kritično područje

kritično područje

0 kritična

vrijednost

1.8.1 P-vrijednost Drugi način da se odluči o prihvaćanju ili odbijanju nul hipoteze H0, je da se utvrdi vjerojatnost da izračunata vrijednost statistike za provjeru pripada distribuciji kada H0 vrijedi. Ta vjerojatnost obično se označava kao P vrijednost i predstavlja opaženu razinu značajnosti. Mnogi kompjuterski statistički programi daju P vrijednost i ostavljaju istraživaču da sam odluči o prihvaćanju ili odbijanju H0. Može se reći da se H0 odbacuje uz vjerojatnost pogreške koja je jednaka P vrijednosti. P vrijednost se može koristiti i kada je razina značajnosti unaprijed određena. Za zadanu razinu značajnosti α, ako je P vrijednost manja od α, H0 se odbacuje uz α razinu značajnosti.

Page 22: Biometrika i Planiranje Istrazivanja 2010

19

1.8.2 Statistička i praktična značajnost Statistička značajnost ne mora uvijek značiti da istraživanje ima i praktičnu značajnost. Na primjer, pretpostavimo pokus s upotrebom aditiva u hrani koji je povećao dnevni prirast u tovu junadi za 20 g. Ovo povećanje je relativno malo i najvjerojatnije nema ni praktično ni ekonomsko značenje. Međutim uz dovoljno velik uzorak i takvo povećanje se može pokazati statistički značajno. Također, razlike između populacija mogu imati praktično značenje, ali zbog malih uzoraka razlika se nje pokazala statistički značajna u uzorcima.

Potreban je oprez u upotrebi riječi značajan. Pojam statistička značajnost vrijedi samo za uzorak. Tako se može reći: “postoji značajna razlika između prosjeka uzoraka”, što znači da njihova izračunata razlika vodi do izračunate P vrijednosti dovoljno male da možemo odbaciti H0. Ali treba izbjegavati izraze kao “prosjeci populacije su značajno različiti”, jer prosjeci populacije mogu biti samo praktično različiti, dakle oni su različiti ili nisu različiti. Potpuno je pogrešan izraz: “alternativna hipoteza H1 je da su prosjeci dviju populacije značajno različite”, jer alternativna hipoteza znači samo razliku, a prihvaćanje alternativne hipoteze putem statističke provjere ne znači automatski i praktičnu značajnost. 1.8.3 Moguće greške kod statističkog zaključivanja i snaga provjere Kod zaključivanja na temelju uzorka moguća su dva pogrešna zaključka: a) tip I greška = odbacivanje nul hipoteze H0, a da je zapravo H0 istinita b) tip II greška = ne odbacivanje H0, a da je zapravo H0 lažna.

Istinita (prava) situacija

H0 točno H0 nije točno Nije odbačena H0 Korektno prihvaćanje

P = 1–α Tip II greška

P = β

Odl

uka

stat

istič

ke

prov

jere

Odbačena H0 Tip I greška P = α

Korektno odbijanje P = 1 – β

1 – β = snaga provjere Način kontrole (smanjenja vjerojatnosti) tip I i tip II greške:

- povećati uzorak - smanjiti varijancu - povećati utjecaj (engl. effect size)

snagu provjere treba razmatrati kod planiranja pokusa - kada je uzorak već određen, ne može se istovremeno smanjiti i α i β - obično se nastoji smanjiti tip I greška (α)

- postavi α= 0.05 i u većini slučajeva se ne obazire na β. Vjerojatnost tip I greške (α, P-vrijednost):

- poznata ili se lako izračuna - postavlja ju sam istraživač kao razinu značajnosti

Vjerojatnost tip II greške (β): - često teško izračunati - mora se pretpostaviti neka raspodjela ako je H1 točno i na temelju te raspodjele pokušati odrediti β

Page 23: Biometrika i Planiranje Istrazivanja 2010

20

Raspodjela ako vrijedi H1

µ0

β

α

Snaga provjere

Raspodjela ako vrijedi H0

Kritično područje µ1

Slika 1-15: Vjerojatnost greške tipa I i II

Snaga provjere: - veća snaga provjere (ili analogno mali β, jer snaga je jednaka 1– β) je važna u slučaju kada ne odbacujemo nul hipotezu - ako provjera ima malu snagu i nije odbačena nul hipoteza, zaključak je sumnjiv i velika je šansa da radimo tip II grešku - obično ne donosimo zaključke o jednakosti dva ili više parametara baš zbog često velike vjerojatnosti β, odnosne male snage (1 – β)

Snaga provjere može se odrediti ako pretpostavimo nekoliko specifičnih alternativnih hipoteza sa različitim parametrima

Page 24: Biometrika i Planiranje Istrazivanja 2010

21

2 Jednostavna linearna regresija

2.1 Uvod

Mjerenja više varijabli Pitanja:

- kakav utjecaj imaju varijable jedna na drugu - da li postoji funkcijska veza između varijabli

Primjer:

- kako promjena vanjske temperature za jedan stupanj utječe na promjenu konverziju hrane - kako promjena razine proteina u hrani utječe na promjenu dnevnog prirasta.

Regresija

- uključuje skup statističkih procedura kojima se izvode zaključci o vezi između varijabli - proučava statističku vezu između varijabli na taj način da se jedna varijabla definira kao zavisna varijabla, a ostale kao nezavisne varijable - kako promjena nezavisnih varijabli utječe na promjenu zavisne varijable

zavisna varijabla = y (konverzija hrane) nezavisne varijable = x (temperatura) Statistički model:

y = β0 + β1x + ε

y = zavisna varijabla (slučajna) x = nezavisna varijabla (fiksna) β0, β1 = regresijski koeficijenti (parametri) ε = slučajna greška

ε = slučajna neprotumačena odstupanja

- zbog individualnih razlika između životinja ili različite okoline, greške kod mjerenja i sl.,

Statistički model: matematički model koji sadrži ε Deterministički model: NE sadrži ε

- kada bi opseg prsa točno opisao težinu y = β0 + β1x

Model regresije se odnosi na parove opažanja (x1,y1),(x2,y2),...,(xn,yn) Prema modelu svaki yi se može prikazati:

yi = β0 + β1xi + εi i = 1,.....n Odnosno,

y1 = β0 + β1x1 + ε1 y2 = β0 + β1x2 + ε2 ............ yn = β0 + β1xn + εn

Page 25: Biometrika i Planiranje Istrazivanja 2010

22

Očekivanje zavisne varijable y za zadani x je E(y|x) i predstavlja pravac. E(yi| xi) = β0 + β1xi = pravac

yE(y|x)

*

*

*

*

*

* *

*

*

* (xi,yi )

εi

x

Slika 2-1: Pravac linearne regresije. Zvjezdicama su prikazana prava mjerenja (xi,yi), Pravac E(y|x) je očekivanje zavisne varijable, εi je odstupanje mjerenja od očekivanja

Objašnjenje parametara jednostavne regresije β0 = odsječak na y osi, vrijednost (E(y| xi=0) β1 = govori o nagibu pravca, to je promjena ∆E(y| x) koja odgovara promjeni vrijednosti varijable x

za jedinicu (∆x=1).

E(yi |xi) = β0 + β1xi

β0

β1

x

y

β1

∆x=1

Slika 2-2: Objašnjenje parametara obične linearne regresije

x x

yx

ya) b)

x

yc)

Slika 2-3: a) pozitivna regresija, β1 > 0; b) negativna regresija, β1 < 0, c) regresija nije jasno utvrđena, β1 = 0

Page 26: Biometrika i Planiranje Istrazivanja 2010

23

2.2 Procjena parametara β0 i β1

1) izabrati slučajni uzorak 2) izmjeriti y i x

Broj životinje 1 2 3 ... n Opseg prsa (x) x1 x2 x3 ... xn Težina (y) y1 y2 y3 ... yn Cilj: pronaći krivulju koja će ‘najbolje‘ opisati dani skup podataka; pronaći procjenitelje parametara

β0 i β1. Procjenitelji parametara: 0β i 1β ili b0 i b1. E(yi|xi) se procjenjuje sa:

ii xbby 10ˆ += = procijenjeni pravac (krivulja) regresije, procijenjeni model

Ostatak:

iii yye ˆ−= Svako opažanje u uzorku se može napisati:

yi = b0 + b1xi + ei i = 1,.....n

iii yye ˆ−=

$yi

$y

*

*

*

*

* *

*

** * yi

y

x

Slika 2-4: Procijenjeni pravac jednostavne linearne regresije.

Metoda najmanjih kvadrata: Pravilo: - pronaći procjenitelje b0 i b1, da vrijedi:

( ) minˆ 22 ∑∑ ==− i ii ii eyy (ostaci moraju biti što manji)

OSTi i SSe∑ =2 = Suma kvadrata ostatka

Page 27: Biometrika i Planiranje Istrazivanja 2010

24

Procjenitelji b1 i b0 :

xbybSSSS

bxx

xy

10

1

−=

=

Gdje su:

( )( )yyxxSS ii ixy −−= ∑ = suma produkata y i x

( )2∑ −=i ixx xxSS

= suma kvadrata od x n = veličina uzorka

2.3 Ostatak i svojstva ostatka

Podsjetite se da je greška pravog modela (modela populacije): εi = yi –E(yi|xi)

Ostatak je odstupanje vrijednosti zavisne varijable od regresijskog pravca procijenjenog iz uzorka: iii yye ˆ−=

Dakle, Ostatak = greška procijenjenog pravca (procijenjenog modela) Suma kvadrata za ostatak:

( )2ˆ∑ −=i iiOST yySS

Prosjek kvadrata ostatka (varijanca procijenjenog modela):

22

−==

nSSsMS OST

OST

(n–2) = stupnjevi slobode. MSOST = s2 je procjena σ2 = Var (ε). Stupnjevi slobode:

n – (broj parametara koje treba procijeniti za dotičnu sumu kvadrata)

• Skraćeni način računanja:

xx

xyyyOST SS

SSSSSS

2)(−=

2.4 Prosjeci i varijance procjenitelja

Svojstva procjenitelja: E(b1) = β1

xxb SS

bVar2

21 1)( σσ ==

Ako y normalan onda b1 normalan

Podsjetimo se: varijanca greške: Var(εi) = σ2.

Page 28: Biometrika i Planiranje Istrazivanja 2010

25

Nepristrani procjenitelj varijance σ2 je:

( ) OSTOST

i ii MSnSSyy

ns =

−=−

−= ∑ 2

ˆ2

1 22

MSOST =prosjek kvadrata za ostatak Skraćeni način računanja sume kvadrata za ostatak:

xx

xyyyOST SS

SSSSSS

2)(−=

Standardna greška regresijskog modela:

22

−== nSSOSTss

Var(b1) možemo procijeniti sa:

xxb SS

ss2

21

=

Standardna greška procjenitelja b1 je:

xxb SS

ss2

1=

2.5 Studentova t-provjera i interval pouzdanosti procjene parametara

Provjera hipoteza o nagibu pravca regresije: H0: β1 = 0 H1: β1 ≠ 0

H0: regresije nema, nagib regresije je nula, pravac regresije je horizontalan. H1: regresija postoji, nagib nije horizontalan Statistika za provjeru:

1

01

bsbt −

=

Uz H0, statistika t ima t raspodjelu sa (n–2) stupnjeva slobode Odbacujemo H0 ako je izračunata statistika |t| “velika”. Za α razinu značajnosti odbacujemo H0 ako

|t| ≥ tα/2,(n–2).

b1β1 = 0

tα/2-tα/2 0 t Slika 2-5: Teoretska distribucija procjenitelja b1 i skala odgovarajuće t statistike

Page 29: Biometrika i Planiranje Istrazivanja 2010

26

2.6 Interval pouzdanosti za β1

Možemo pisati da je za 100(1–α)% interval pouzdanosti

12,21 bn stb −± α Za 95% interval pouzdanosti (IP)

12,025.01 bn stb −± tα/2,n–2 = kritična vrijednost

xxb SSss 21

= = standardna greška procjenitelja b1.

2.7 Intervali pouzdanosti zavisne varijable

Procjena prosjeka populacije za danu vrijednost x0 E[y|x0] = β0 + β1x0.

Procjenitelj: 0100ˆ xbby += . ( )

−+=

xx

i

SSxx

nyVar

22

)01ˆ( σ

Standardna greška: ( )

−+=

xx

iy SS

xxn

ss2

10

Interval pouzdanosti:

2,025.0ˆ0 0ˆ −± ny tsy

Predviđanje buduće vrijednosti varijable y na temelju dane vrijednosti x0. y|x0 = β0 + β1x0 + ε0. Procjenitelj:

010,0ˆ xbby NOVI += . Varijanca procjenitelja:

( )

−++=

xx

iNOVI SS

xxn

yVar2

2),0

11ˆ( σ

Standardna greška predviđenih novih vrijednosti zavisne varijable za danu vrijednost x0 je:

( )

−++=

xx

iy SS

xxn

ssNOVI

22

ˆ11

,0 .

Page 30: Biometrika i Planiranje Istrazivanja 2010

27

Interval pouzdanosti za nova opažanja uz razinu značajnosti α = 0.05 je: 2,025.0ˆ,0 ,

ˆ −± nyNOVI tsyNOVIi

Intervali pouzdanosti za više x vrijednosti: Prosjek populacije:

pnpyi pFsyi −± ,,ˆˆ α

Nova opažanja:

pnpNOVIyi pFsyi −± ,,,ˆˆ α

Gdje su: F = granična vrijednost F raspodjele za p i (n–p) stupnjeva slobode p = broj parametara n = broj opažanja α = vjerojatnost da je barem jedan interval nekorektan.

550

600

650

700

750

212 214 216 218 220 222

Opseg trupa (cm)

Teži

na (k

g)

Slika -6: Površine pouzdanosti za prosjeke populacije za dane vrijednosti x ( ___ )i nova opažanja (......)

Page 31: Biometrika i Planiranje Istrazivanja 2010

28

2.8 Raščlanjenje ukupne varijabilnosti

Regresijskim modelom nastoji se objasniti što veći dio varijabilnosti zavisne varijable.

*

*

*raspodjela

y

**

*

*

*

*

*

*

x

yyi oko

raspodjela

(A)

(B)yyi ˆ okoy

y

Slika 2-7: Raspodjela varijabilnosti oko prosjeka i procijenjenog pravca regresije.

(B) mjeren sa sumom kvadrata za ostatak:

( )2ˆ∑ −=i iiOST yySS

(A) mjeren sa ukupnom sumom kvadrata: ( )2∑ −=

i iiUKUP yySS Tri izvora varijabilnosti: 1.Varijabilnost opisana modelom

- protumačena varijabilnost, mjeri se sumom kvadrata za regresiju (SSREG). 2. Ukupna varijabilnost zavisne varijable

- varijabilnost oko y , mjeri se ukupnom sumom kvadrata. (SSUKUP) 3. Neprotumačena varijabilnost

- varijabilnost oko y , mjeri se sumom kvadrata za ostatak (SSOST).

**

**

**

*

****

*

y

x

Page 32: Biometrika i Planiranje Istrazivanja 2010

29

Jak linearan trend: SSOST << SSUKUP

**

*

*

***

*

***

*

y

x

Slab linearan trend: SSOST ≈ SSUKUP 2.8.1 Veza između suma kvadrata Vrijedi

)ˆ()ˆ()( yyyyyy iiii −+−=− )

*

**

*

*

*

*

*y

x

y yi −$y y−

y yi − $

$y

y

*yi

Slika 2-8: Prikaz mjerenja y kao odstupanja od prosjeka i procijenjenog pravca

Može se pokazati da vrijedi:

( ) ( ) ( )222 ˆˆ ∑∑∑ −+−=− i iii ii i yyyyyy SSUKUP = SSREG + SSOST

Kratki način računanja suna kvadrata:

1) SSUKUP = SSyy

2) xx

xyREG SS

SSSS

2)(=

3) xx

xyyyOST SS

SSSSSS

2)( −=

Na slična način kao što se raščlanjuju sume kvadrata, tako se raščlanjuju i stupnjevi slobode: (n–1) = 1 + (n–2) (stupnjevi slobode) ukupno = regresija + ostatak

Page 33: Biometrika i Planiranje Istrazivanja 2010

30

Ukupani stupnjevi slobode: - gubi se 1 stupanj slobode u procijeni aritmetičke srednje vrijednosti

Stupnjevi slobode ostatka: - gube se 2 stupnja slobode u procijeni β0 i β1.

Stupanj slobode za regresiju: - treba 1 stupanj slobode za procjenu β1.

Dijeljenjem suma kvadrata sa odgovarajućim stupnjevima slobode dobijemo prosjeke kvadrata: Prosjek kvadrata za regresiju:

1REG

REGSSMS =

Prosjek kvadrata za ostatak: 2−

=nSSMS OST

OST

Ovi izračunati prosjeci kvadrata koriste se u provjeri hipoteza.

2.9 Provjera hipoteza - F- provjera

Hipoteze: H0: β1 = 0 nema regresije H1: β1 ≠ 0 regresija postoji

Statistika za provjeru:

OST

REG

MSMS

F =

Ovdje je:

regresijuza kvadrata prosjek 1

MSREG == REGSS

ostatka kvadrata prosjek 2

MSOST =−

=nSSOST

F statistika ima F-raspodjelu sa stupnjevima slobode 1 i (n–2) ukoliko vrijedi H0. Za α razinu značajnosti odbacujemo H0 ako je izračunata vrijednost F ekstremnija od kritične

vrijednosti F raspodjele (F > Fα,1,n–2)

f (F 1, n-2 )

F α,1,n -2

F 1,n -2

Slika 2.9 F raspodjela i kritična vrijednost za stupnjeve slobode 1 i (n – 2). Izraz Fα,1,n–2 predstavlja kritičnu vrijednost F raspodjele

Page 34: Biometrika i Planiranje Istrazivanja 2010

31

Korisno je izračune i provjeru upisati u ANOVA tablicu (tablicu analize varijance) ANOVA tablica

Izvor SS df MS F Regresija SSREG 1 MSREG F = MSREG / MSOST Ostatak SSOST n–2 MSOST Ukupno SSUKUP n–1

Analiza varijance je podjela ukupne varijabilnosti na izvore varijabilnosti i analiza značajnosti tih

izvora.

2.10 Koeficijent determinacije (R2)

- Proporcija varijabilnosti protumačenog modelom u odnosu na ukupnu varijabilnost:

UKUP

OST

UKUP

REG

SSSS

SSSS

R −== 12

Poprima vrijednosti od 0 do 1: 10 2 ≤≤ R

Mjera valjanosti modela

“Dobar” model UKUPREG SSSS ≈

“Loš” model UKUPOST SSSS ≈

“Dobar model” znači da je 12 ≈R

Page 35: Biometrika i Planiranje Istrazivanja 2010

32

2.11 SAS primjer za jednostavnu linearnu regresiju

Primjer: Procijenite pravac linearne regresije težine na opseg grudi krava prema slijedećem uzorku:

Krava 1 2 3 4 5 6 Težina (y): 641 633 651 666 688 680 Opseg prsa (x): 214 215 216 217 219 221

SAS program: DATA krave; INPUT tezina opseg; DATALINES; 641 214 633 215 651 216 666 217 688 219 680 221 ; PROC REG; MODEL tezina = opseg / ; RUN; QUIT; *ili; PROC GLM; MODEL tezina =opseg / ; RUN; QUIT;

Objašnjenje: Koristi se procedura GLM ili procedura REG. Naredba MODEL tezina = opseg znači da je zavisna varijabla tezina, a nezavisna opseg. SAS ispis: Analiza varijance Sum of Mean Source DF Squares Square F Value Prob>F Model 1 1927.52941 1927.52941 16.642 0.0151 Error 4 463.30392 115.82598 C Total 5 2390.83333 Root MSE 10.76225 R-square 0.8062 Dep Mean 659.83333 Adj R-sq 0.7578 C.V. 1.63106

Parameter Estimates Parameter Standardna T for H0: Variable DF Estimate Error Parameter=0 Prob > |T| INTERCEP 1 -974.049020 400.54323178 -2.432 0.0718 OPSEG 1 7.529412 1.84571029 4.079 0.0151

Page 36: Biometrika i Planiranje Istrazivanja 2010

33

Objašnjenje: Prvo je dana ANOVA tablica: izvor (Source), stupnjevi slobode (DF), sume kvadrata (Sum of Squares), prosjek kvadrata (Mean Square), F vrijednost (F value) i P vrijednost (Prob>F). Izvori varijabilnosti su Regresija (Model), Ostatak (Error) i Ukupno (C Total). Vidljivo je da je F = 16.642 sa P vrijednosti = 0.0151, što znači da je koeficijent regresije u uzorku značajno različit od nule. Ispod ANOVA tablice dane su standardna greška regresijskog modela (Root MSE) = 10.76225 i koeficijent determinacije (R-square) = 0.8062. Ispod podnaslova Parameter Estimates, možemo vidjeti procijene parametara sa standardnim greškama i t provjerom da su procjenitelji značajno različiti od nule. Ovdje je b0 (INTERCEP) = 974.046020 sa standardnom greškom (Standard error) = 400.54323178, a b1 (opseg) = 7.529412 sa standardnom greškom 1.84571029. Izračunata t statistika je 4.079, s P vrijednosti (Prob > |T|) = 0.0151, što pokazuje da je b1 značajno različit od nule.

630640650660670680690700

214 216 218 220 222

Opseg prsa (cm)

Teži

na (k

g)

Slika 2-10: Regresija težine krava na opseg prsa

Page 37: Biometrika i Planiranje Istrazivanja 2010

34

3 Koeficijent korelacije

Korelacija: - mjera jakosti linearne veze između dvije varijable - relativna mjera

- poprima vrijednosti između -1 i 1 - x i y su slučajne varijable sa zajedničkom bivarijatnom raspodjelom -Varijable zajednički variraju - Ne mora nužno postojati uzročno-posljedična veza

(Pozor: Regresija: uzročno-posljedična veza x i y, x = nezavisna, y = zavisna varijabla) Koeficijent korelacije:

22yx

xy

σσ

σρ =

σ2y = Var(y)

σ2x =Var(x)

σxy = Cov(x, y) = kovarijanca između x i y x i y su slučajne normalne varijable. Kovarijanca:

- zajedničko variranje dvije slučajne varijable - apsolutna mjera veze - ako su varijable nezavisne => Cov(x, y) = 0

Korelacija je kovarijanca standardiziranih varijabli x i y

- Korealcija ρ može biti pozitivna ili negativna. Korelacija ρ = 1 ili ρ = –1 znači idealnu linearnu vezu ρ = 0 znači da veza ne postoji.

Page 38: Biometrika i Planiranje Istrazivanja 2010

35

x

x

x

x

y

x

y

x

a)

x

b)

x

c)

x

d)

x

x

y

x

y

Slika 3-1 a) pozitivna korelacija, b) negativna korelacija, c) korelacija ne postoji d) veza između varijabli postoji ali nije linearna

3.1 Procjena koeficijenta korelacije

Procjenitelj koeficijenta korelacije je koeficijent korelacije uzorka:

yyxx

xy

SSSSSS

r =

SSxx = suma kvadrata od x ( )2∑ −=

i ixx xxSS SSyy = suma kvadrata od y

( )2∑ −=i iyy yySS

SSxy = suma produkata y i x ( )( )yyxxSS ii ixy −−= ∑

n = veličina uzorka

Page 39: Biometrika i Planiranje Istrazivanja 2010

36

4 Vektori i matrice

Matrica je skup brojeva koji su po nekom kriteriju svrstani u redove i kolone:

2x32x33231

2221

1211

121131

aaaaaa

−=

=A

2x32x33231

2221

1211

213112

bbbbbb

=

=B

Često pišemo: A = {aij}3x2 Vektor:

jedna kolona ili jedan red

1x221

=b

4.1 Tipovi i svojstva matrica

Kvadratna matrica: - isti broj kolona i redova.

Simetrična matrica: - kvadratna matrica - vrijedi aij = aji.

2x22112

=C

Dijagonalna matrica

- kvadratna matrica takva da je aij = 0 za svaki i ≠ j

2x22002

D

=

Jedinična matrica:

- dijagonalna matrica aii = 1

=

=

100010001

,1001

32 II

Nul matrica je matrica čiji su svi članovi jednaki nuli. Nul vektor je vektor čiji su članovi jednaki nuli.

Page 40: Biometrika i Planiranje Istrazivanja 2010

37

=

=

000

0 ,0000

0

Matrica čiji su svi članovi jednaki 1, obično se označava sa J. Vektor čiju su svi članovi jednaki 1 obično se označava sa 1.

=

=

111

,1111

1J

Transponirana matrica:

- matrica kojoj su kolone zamijenjene s redovima

=113

211'A

4.1.1 Operacije s matricama i vektorima: Zbrajanje matrica

=

++++++

=+

33333131

22222121

12121111

babababababa

BA

2x3134243

211231111321

=

+−+++++

=+ BA

Množenje matrica s brojem

2x3242262

2

−=A

Množenje matrice s matricom

- broj kolona prve matrice mora biti jednak broju redova druge matrice, - broj elemenata u redu prve matrice mora biti jednak broju redova druge matrice

Općenito:

A = {aik}ima dimenzije r x c B = {bkj}ima dimenziju c x s produkt AB= {cij} ima dimenziju r x s:

cij = ∑ =c

1k kjikba Primjer: Izračunaj AC ako je:

Page 41: Biometrika i Planiranje Istrazivanja 2010

38

2x32x33231

2221

1211

121131

aaaaaa

−=

=A i

2x22x22221

1211

2112

cccc

=C

++++++

=

2232213121321131

2222212121221121

2212211121121111

c*ac*ac*ac*ac*ac*ac*ac*ac*ac*ac*ac*a

AC

23033375

2*11*21*12*22*11*11*12*12*31*11*32*1

x

=

−−++++

=AC

Primjer 2:

1x221

=b . Izračunaj Ab

1x31x3 037

1*12*22*11*12*31*1

=

−++

=Ab

Kvadratni oblik:

- umnožak transponiranog vektora i samog vektora - predstavlja sumu kvadrata elemenata vektora.

Neka je vektor

1nxn

2

1

y...yy

=y

Kvadratni oblik je:

[ ] ∑=

= i2i

n

2

1

n21 y

y...yy

y..yyyy' = suma kvadriranih članova vektora

Inverzna matrica neke matrice C je matrica C-1 takva da je C-1C = I i CC-1 = I Sustav linearnih jednadžbi može prikazati matrično. Primjer: Sustav jednadžbi s dvije nepoznanice

2a1 + a2 = 5 a1 – a2 = 1

Page 42: Biometrika i Planiranje Istrazivanja 2010

39

=

2

1

aa

a

=1112

X

=

15

y

Xa = y | X–1

X–1Xa = X–1y a = X–1y

=

=

=

12

15

3/23/13/13/1

15

1112 1

2

1

aa

Normalne jednadžbe definirane su sa: X’Xa = X’y

(X’X)–1(X’X)a = (X’X)–1X’y Normalne jednadžbe pogodne su za rješavanje sustava jednadžbi kada je broj jednadžbi veći nego

broj nepoznanica

Page 43: Biometrika i Planiranje Istrazivanja 2010

40

5 Jednostavna regresija u matričnom prikazu

skalarni model regresije: yi = β0 + β1xi + εi i = 1,.....n

Definirajmo vektore i matrice

=

ny

yy

...2

1

y

=

nx

xx

1......

11

2

1

X

=

1

0

ββ

β

=

εε

...2

1

ε

y = vektor opažanja zavisne varijable X = matrica opažanja nezavisnih varijabli β = vektor parametara ε = vektor greški y = Xβ + ε Prosjek od y :

( ) Xβy =

+

++

=

=

nn x

xx

yE

yEyE

E

10

210

110

2

1

...)(

...)()(

ββ

ββββ

Varijanca od y je:

Var(y) = σ2I Procijenjeni model :

Xby =ˆ

yye ˆ−= = vektor ostataka b = vektor procjenitelja

=

1

0

bb

b i

=

n

2

1

e...ee

e

Normalne jednadžbe: (X’X)b = X’y

Page 44: Biometrika i Planiranje Istrazivanja 2010

41

Rješenje jednadžbe za b je: b = (X’X)–1X’y

=

∑∑∑

i ii i

i i

xxxn

2XX'

=

∑∑

i ii

i i

yxy

yX'

−+=−

xxxx

xxx

SSSSx

SSx

SSx

n1

1

)(

2

1XX'

Očekivanje i varijanca su:

E(b) = β

= )(= 1−2

)(),(),()(

)Var(110

100

bVarbbCovbbCovbVar

XX'b σ

Ukoliko koristimo s2 tada je varijanca vektora b jednaka: s2(b) = s2(X'X)–1 Vektor procijenjenih vrijednosti zavisne varijable je:

( ) yXXXXXby 1 ''ˆ −== Ostatak je definiran sa:

y-ye ˆ= Sume kvadrata:

( )2i iREG yy)ˆ()'ˆ(SS ∑ −=−−= yyyy

( )2i iOST yy)ˆ()'ˆ(SS ∑ −=−−= yyyy

( )2i iUKUP yy)()'(SS ∑ −=−−= yyyy

Primjer: Napišite procijenjeni model regresije težine na opseg grudi krava koristeći matrice i vektore. Mjerenja 6 krava dana su u slijedećoj tablici:

Krava 1 2 3 4 5 6 Težina (y): 641 633 651 666 688 680 Opseg prsa (x): 214 215 216 217 219 221

Page 45: Biometrika i Planiranje Istrazivanja 2010

42

Vektor y i matrica X su:

=

680688666651633641

y i

=

221121912171216121512141

X

Prva kolona matrice X sadrži broj 1 jer procjenjujemo odsječak na osi y, b0. Kada uvrstimo X i y, model je:

+

=

6

5

4

3

2

1

1

0

2211121912171216121512141

680688666651633641

eeeeee

bb

+⋅++⋅++⋅++⋅++⋅++⋅+

=

610

510

410

310

210

110

221219217216215214

ebbebbebbebbebbebb

Page 46: Biometrika i Planiranje Istrazivanja 2010

43

6 Multipla regresija

Multipla regresija: - regresija koja ima dvije ili više nezavisnih varijabli - regresija koja ima tri ili više parametara

Ciljevi: 1. Pronaći model (funkciju) koja najbolje opisuje zavisnost zavisne varijable o nezavisnim

varijablama. Odnosno odrediti parametre. 2. Predviđanje vrijednosti zavisne varijable na temelju novih mjerenja nezavisnih varijabli 3. Proučiti važnost nezavisnih varijabli, odnosno procijeniti da li su sve ili samo neke nezavisne

varijable važne u modelu. To je izgradnja optimalnog modela. Podaci: y x1 x2 ... xp y1 x11 x21 ... xp1 y2 x12 x22 ... xp2 . . . . . . . . yn x1n x2n ... xpn Model:

yi = β0 + β1x1i + β2x2i + ... + βp–1x(p–1)i + εi i = 1,...,n yi = opažanja zavisne varijable x1i ,x2i ,......,x(p–1)i = opažanja nezavisnih varijabli

β0 , β1 , β2 ,......, βp–1 = regresijski koeficijenti (parametri) εi = ‘greška’, model nije egzaktan, slučajna odstupanja, neprotumačena, zbog jedinke ili mjerenja

6.1 Dvije nezavisne varijable

Model: yi = β0 + β1x1i + β2x2i + εi i = 1,...,n

yi = opažanja zavisne varijable y x1i i x2i = opažanja nezavisnih varijabli x1 i x2

β0 , β1 , β2 = regresijski koeficijenti (parametri) εi = greška modela Model procijene (procijenjena krivulja) je:

iii xbxbby 22110ˆ ++= i = 1,...,n

Page 47: Biometrika i Planiranje Istrazivanja 2010

44

Ostatak: )]xb xb (b - [y yye 2i21i10iiii ++=−=

b0 , b1 i b2 = procjenitelji parametara Model matrično:

y = Xβ + ε y = vektor zavisne varijable β = vektor parametara X = matrica konstanti ε = vektor greški sa prosjekom E(ε) = 0 i varijancom Var(ε) = σ2I

=

ny

yy

...2

1

y

=

nn xx

xxxx

21

2212

2111

1.........

11

X

=

2

1

0

βββ

β

=

εε

...2

1

ε

Procijenjeni model je:

Xby =ˆ

=

2

1

0

bbb

b

=

ne

ee

...2

1

e

Procjena parametara: Metoda najmanjih kvadrata:

uvjet da Σi e2i = e’e = min.

e'e = suma kvadrata ostataka. e’e parcijalno derivira po b i izjednači s nulom. Normalne jednadžbe: X’Xb = X’y b = (X’X)–1X’y

=

n2n1

2212

2111

n22212

n11211

xx1.........

xx1xx1

x...xxx...xx1...11

XX'

=

∑∑∑∑∑∑∑∑

i ii iii i

i iii ii i

i ii i

xxxxxxxx

xxn

22212

21211

21

=

=

∑∑∑

i ii2

i ii1

i i

n

2

1

n22221

n11211

yxyx

y

y...yy

x...xxx...xx1...11

yX'

Primjer

Page 48: Biometrika i Planiranje Istrazivanja 2010

45

Ostatak: yye ˆ−=

Suma kvadrata za ostatak je: SSOST = e'e

Varijanca σ2 procjenjuje se sa

OSTOST MS

pnSSs =

−=2

n–p = stupnjevi slobode. Općenito: stupnjevi slobode = n – (broj parametara u modelu). Drugi korijen iz procjene varijance:

2ss = standardna greška regresijskog modela. Svojstva procjenitelja: E(b) = β Var(b) = σ2(X’X)–1

Ukoliko se koristi varijanca procijenjena iz uzorka tada je varijanca: s2(b) = s2(X’X)–1 Provjera hipoteze H0: βi = 0 Statistika za provjeru:

)( i

i

bsbt =

)( )s(b 2i ibs=

Kritična vrijednost t raspodjele određuje se prema razini značajnosti α i stupnju slobode n –p, gdje je p = broj parametara. p = 3 pa su stupnjevi slobode jednak n–3.

6.1.1 Raščlanjenje ukupne varijabilnosti i provjera hipoteza Sume kvadrata:

( )2ˆ)ˆ()'ˆ( ∑ −=−−=i iREG yySS yyyy

( )2ˆ)ˆ()'ˆ( ∑ −=−−=i iOST yySS yyyy

( )2)()'( ∑ −=−−=

i iUKUP yySS yyyy SSUKUP = SSREG + SSOST Stupnjevi slobode: n–1 = (p–1) + (n–p) n = broj životinja i p je broj parametara Hipoteze:

Page 49: Biometrika i Planiranje Istrazivanja 2010

46

H0: β2 = ... = βp = 0 H1 : barem jedan βi ≠ 0, i = 1 do p–1 Ako nul hipoteza vrijedi tada kvocijent

OST

REG

MSMSF =

ima F-raspodjelu sa (p–1) i (n–p) stupnjeva slobode, gdje je p broj parametara u modelu. Za α razinu značajnosti odbacujemo Ho ako

Fα,p–1,n–3 ( F > Fα,p–1,n–3).

ANOVA tablica

Izvor SS df MS = SS/df F Regresija SSREG p–1 MSREG F=MSREG/SSOST Ostatak SSOST n–p MSOST Ukupno SSUKUP n–1 Koeficijent multiple determinacije je:

UKUP

OST

UKUP

REGSSSS

SSSSR −== 12

0 ≤ R2 ≤ 1

6.2 Parcijalne i stupnjevite ekstra sume kvadrata

SSREG se može raščlaniti na sume kvadrate za odgovarajuće parametre u modelu Provjerava se važnost pojedinih parametara Primjer: Puni model (sve varijable uključene u model). y = β0 + β1x1 + β2x2 + β3x3 + ε Reducirani modeli (podskupovi punog modela): y = β0 + β1x1 + β2x2 + ε y = β0 + β1x1 + β3x3 + ε y = β0 + β2x2 + β3x3 + ε y = β0 + β1x1 + ε y = β0 + β2x2 + ε y = β0 + β3x3 + ε y = β0 + ε Broj parametara ↓ ⇒ SSREG ↓ SSOST ↑ Broj parametara ↑ ⇒ SSREG ↑ SSOST ↓ Provjera opravdanosti parametara β3 i β4 u punom modelu je: Općenito:

)().()(

_

__

PUNIPUNIOST

REDUCIRANIPUNIPUNIOSTREDUCIRANIOST

pnSSppSSSS

F−

−−=

Page 50: Biometrika i Planiranje Istrazivanja 2010

47

Ovdje je: pREDUCIRANI = broj parametara u reduciranom modelu. pPUNI = broj parametara u punom modelu SSOST_PUNI / (n–pPUNI) = MSOST_PUNI = prosjek kvadrata ostatka punog modela

6.3 SAS primjer za multiplu regresiju

Primjer: Procijenite regresiju težine na opseg grudi i visina do grebena 6 mladih bikova. Podaci su slijedeći:

Bik: 1 2 3 4 5 6 7 Težina, kg (y) 480 450 480 500 520 510 500 Opseg, cm (x1): 175 177 178 175 186 183 185 Visina, cm (x2): 128 122 124 128 131 130 124

SAS program: DATA bikovi; INPUT tezina opseg visina; DATALINES; 480 175 128 450 177 122 480 178 124 500 175 128 520 186 131 510 183 130 500 185 124 ; PROC GLM; MODEL tezina=opseg visina ; RUN; QUIT;

SAS ispis:

Dependent Variable: tezina Sum of Source DF Squares Mean Square F Value Pr > F Model 2 2727.655201 1363.827601 9.78 0.0288 Error 4 558.059085 139.514771 Corrected Total 6 3285.714286 R-Square Coeff Var Root MSE tezina Mean 0.830156 2.403531 11.81164 491.4286 Source DF Type I SS Mean Square F Value Pr > F opseg 1 1400.983103 1400.983103 10.04 0.0339 visina 1 1326.672098 1326.672098 9.51 0.0368 Source DF Type III SS Mean Square F Value Pr > F opseg 1 616.426512 616.426512 4.42 0.1034

Page 51: Biometrika i Planiranje Istrazivanja 2010

48

visina 1 1326.672098 1326.672098 9.51 0.0368 Standard Parameter Estimate Error t Value Pr > |t| Intercept -495.0140313 225.8696150 -2.19 0.0935 opseg 2.2572580 1.0738674 2.10 0.1034 visina 4.5808460 1.4855045 3.08 0.0368

6.4 Krivolinijska regresija drugog stupnja

Model: yi = β0 + β1xi + β2x2

i + εi i = 1,...,n yi = opažanja zavisne varijable y xi = opažanja nezavisne varijable x

β0, β1, β2 = regresijski koeficijenti (parametri) εi = greška modela, kvadratna regresija = multipla regresija sa dvije nezavisne varijable x i x2, Model procijene (parabola):

iiii exbxbby ˆ 22110 +++= i = 1,...,n Matrično model se piše:

y = Xβ + ε

=

ny

yy

...2

1

y

=

2

222

211

1.........

11

nn xx

xxxx

X

=

3

1

0

βββ

β

=

εε

...2

1

ε

Model procijene:

Xby =ˆ Ostatak:

yye ˆ−=

=

2

1

0

bbb

b

=

ne

ee

...2

1

e

Vektor procjena parametara izračuna se iz izraza:

b = (X’X)–1X’y Provjera hipoteza: H0: β1 = ... = βp–1 = 0 H1: barem jedan βi ≠ 0, i = 1 do (p–1)

Page 52: Biometrika i Planiranje Istrazivanja 2010

49

Ako nul hipoteza vrijedi tada kvocijent

OST

REGMSMS

F =

ima F-raspodjelu sa 2 i (n–3) stupnjeva slobode.

Primarni cilj analize: - da li je β2 potreban u modelu - odnosno da li je model kvadratne regresije valjan. Hipoteza: H0: β2 = 0

t- provjera:

)( 2

2bsbt =

Procijenjene varijance i kovarijance za b0, b1 i b2 su;:

s2(b) = s2(X’X)–1 6.4.1 SAS primjer za kvadratnu regresiju

SAS program za primjer s rastom purana je slijedeći.

SAS program: DATA purani; INPUT tezina dan @@; DATALINES; 44 1 66 7 100 14 150 21 265 28 370 35 455 42 605 49 770 56 ; PROC GLM; MODEL tezina=dan dan*dan/ ; RUN; QUIT; Objašnjenje: Koristimo proceduru GLM. Naredba MODEL tezina = dan dan*dan znači da je zavisna varijabla tezina, a nezavisne dan kao linearna komponenta i dan*dan kao kvadratna komponenta.

SAS ispis:

Dependent Variable: TEZINA Sum of Mean Source DF Squares Square F Value Pr > F Model 2 523870.39532 261935.19766 1246.82 0.0001 Error 6 1260.49357 210.08226 Corrected Total 8 525130.88889

R-Square C.V. Root MSE TEZINA Mean 0.997600 4.617626 14.494215 313.88889

Source DF Type I SS Mean Square F Value Pr > F DAN 1 497569.66165 497569.66165 2368.45 0.0001 DAN*DAN 1 26300.73366 26300.73366 125.19 0.0001

Page 53: Biometrika i Planiranje Istrazivanja 2010

50

Source DF Type III SS Mean Square F Value Pr > F DAN 1 859.390183 859.390183 4.09 0.0896 DAN*DAN 1 26300.733664 26300.733664 125.19 0.0001

T for H0: Pr > |T| Std Error of Parameter Estimate Parameter=0 Estimate INTERCEPT 38.85551791 3.15 0.0197 12.31629594 DAN 2.07249024 2.02 0.0896 1.02468881 DAN*DAN 0.19515458 11.19 0.0001 0.01744173

0100200300400500600700800

0 20 40 60

Dob u danima

Teži

na (g

)

Slika 6-1: Mjerene (•) i procijenjene (-) vrijednosti težine zago

6.5 Moguće poteškoće kod upotrebe regresije

Mogući problemi kod regresije mogu se pojaviti zbog 1) Neka opažanja su ‘loša’. Pod ‘lošim’ podacima misli se na opažanja koja su neuobičajeno ekstremna. 2) greške modela nemaju konstantnu varijancu 3) greške modela nisu nezavisne 4) greške modela nisu normalno distribuirane 5) Nelinarnost 6) Jedna ili više važnih nezavisnih varijabli nisu uključeni u model 7) Model sadrži previše nezavisnih varijabli 8) Multikolinearnost. Multikolinearnost je pojava kad postoji korelacija između nezavisnih varijabli. Mogu dovesti do: - upotrebe krivog modela, - lošeg procjene regresije, - krivog zaključka - nepreciznosti procjene parametara zbog velike varijance.

Page 54: Biometrika i Planiranje Istrazivanja 2010

51

6.5.1 Analiza ostataka i narušenost pretpostavki modela

iii yye ˆ−=

*

***

***

**

**0

( )x y $

e

Model OK Raspršenost ostatka slučajna Varijanca konstantna Nema ekstremnih podataka.

*

**

*** *

**

**

*0

e

( )x y $

Nelinearnost. ????Potreban xi2 ili xi

3 u modelu. ???? logaritamska, eksponencijalna funkcija

*

****

**

*

***0

( )x y $

e

Zavisnost ostataka (autokorelacija)

Page 55: Biometrika i Planiranje Istrazivanja 2010

52

*

**

*

***

*

*** **

***0

( )x y $

e

Varijanca nije homogena. Potrebne su transformacije ili x ili y varijable. Moguća je i upotreba različite strukture varijance koja će definirati nehomogenost. Normalnost ostataka. Nenormalnost dovodi u pitanje valjanost F ili t provjere. ??? poopćeni linearni model (engl. 'generalized linear models') 6.5.2 Loša opažanja ‘loša’ = neuobičajeno ekstremna opažanja

*

**

*

***

**

*

**

*

***

**

**

xixi

y

y

*

*

*

*

4

53

2

1

*

Slika -2 Prikaz ekstremnih vrijednosti u analizi regresiji Ekstremne vrijednosti su zaokružene i označene brojevima: a) ekstremi u odnosu na x su: 3, 4 i (5), b) ekstremi u odnosu na y su: 1, 2 i 4, c) ekstremi koji imaju utjecaja na procjenu regresije su: 2, 4 i (5)

6.5.3 Multikolinearnost Postoji značajna i visoka korelacija između nezavisnih varijabli Nezavisne varijable su skoro linearno zavisne Varijanca procjenitelja velika

Page 56: Biometrika i Planiranje Istrazivanja 2010

53

Problem multiokolinearnosti može se riješiti: a) ispuštanjem problematičnih opažanja b) ako se iz nekoliko koreliranih nezavisnih varijabli definira jedna c) ispuštanjem nepotrebnim varijabli iz modela d) korištenjem drugih statističkim metoda ('Ridge' regresija ili 'Principal Components')

6.6 Izgradnja modela i kriteriji za izbor modela

a) Koeficijent determinacije(R2) Dodavanje nove varijable ==> povećanje R2 ? dodavanje kojih varijabli značajno povećava R2 b) Prosjek kvadrata ostatka (MSOST) Dodavanje nove varijable obično se smanjuje MSOST. !!!! opasnost da se izabere preveliki model. c) Parcijalne F-provjere Značajnost pojedine varijable u modelu. ??? optimalan model. Kolinearnost (varijable gledane posebno mogu izgledati važne, a ukupni model može biti vrlo neprecizan) c ) Cp kriterij ('Conceptual Predictive Criterion') - Uspoređuje se model kandidat sa 'pravim' modelom e) AIC (Akaike Information Criteria)

Page 57: Biometrika i Planiranje Istrazivanja 2010

54

7 Jednostruka analiza varijance

Cilj: - da li postoji razlika prosjeka više populacija - provjera razlika aritmetičkih prosjeka uzoraka izabranih iz više populacija.

Zavisna varijabla:

- mjerenja ili opažanja Nezavisna varijabla:

- grupa (ili način klasificiranja), često kažemo i tretmani (grupe predstavljaju populacije)

- kvalitativna, ili kategorička varijabla - faktor

Da li postoji utjecaj grupa na opažanja??? Primjer1 : Utjecaj različite hranidbe na prirast u tovu. Sakupljanje podataka, odnosno organiziranje pokusa: Odredit ćemo grupe životinja slučajnim izborom, različito ih tretirati i izračunati srednje vrijednosti grupa. (Izabrati ćemo slučajni uzorak i slučajno primijeniti tretmane (napraviti grupe) na uzorak). Primjer 2: Da li postoji razlika u mliječnosti krava simentalske pasmine između tri županije. Sakupljanje podataka, odnosno plan pokusa:

– Izabrati ćemo slučajne uzorke iz županija – Županije su definicije grupa (različitih populacija)

Pitanja? 1. Procijeniti prosjeke grupa i ukupnu srednju vrijednost, 2. Da li postoji utjecaj grupe, tj. da li su prosjeci pojedinih grupa različiti

• (Da li su aritmetičke srednje vrijednosti uzoraka grupa značajno različiti) Odgovoriti na pitanje da li postoji utjecaj grupe, tj. da li su srednje vrijednosti pojedinih grupa dovoljno različite da ih možemo smatrati značajno različitim.

(Značajna razlika => u smislu da možemo u velikom broju takvih ponovljenih pokusa očekivati razliku.)

Odgovor na ova pitanja može dati statistička procedura koja se zove analiza varijance. Analiza varijance:

- podjela ukupne varijabilnosti na izvore varijabilnosti i analiza značajnosti tih izvora. - da li je protumačena varijabilnost (varijabilnost između prosjeka grupa) značajna u odnosu na neprotumačenu varijabilnost (unutar grupa)

Modeli analize varijance prema broju nezavisnih (kategoričkih) varijabli:

- jednostruka - dvostruka, itd.

Page 58: Biometrika i Planiranje Istrazivanja 2010

55

7.1 Model jednostruke analize varijance s fiksnim utjecajima

Pretpostavka je da postoji fiksni utjecaj, tj. utjecaj grupe je isti na svaku jedinku u toj grupi Neka je broj grupa (tretmana) = a Grupe ili tretmani = slučajni uzorci iz odgovarajućih populacija Po svakom tretmanu n mjerenja. ukupno N = (n a) jedinica je podijeljeno u a grupa veličine n. Mjera varijabilnosti između grupa je varijabilnost prosjeka grupa Mjera varijabilnosti unutar grupa je varijabilnost između pojedinih mjerenja unutar grupe Model:

yij = µ + τi + εij i = 1,.....,a j = 1,...,n

yij = opažanje jedinice j u grupi i (tretmanu i) µ = ukupni prosjek τi = fiksni utjecaji grupe ili tretmana i εij = greška modela sa N(0, σ2) Nezavisna varijabla τ :

- poprima vrijednosti različitih grupa (tretmana) - kategorička varijabla, često se zove faktor - prema modelu faktor ima utjecaj na vrijednosti zavisne varijable y

Prosjeci populacija procjenjuju se aritmetičkim prosjecima grupa. Model procijene:

iiijy τµµ ˆˆˆˆ +== i = 1,.....,a j = 1,...,n

ijednostsrednja vrukupna na procijenjeˆ =µ i grupe utjecaj niprocijenjeˆ =iτ i grupeprosjek niprocijenje ˆ =iµ

iijij ye µ−= = ostatak u uzorcima, neprotumačen modelom yij = j-to mjerenje u i-toj grupi

Grupa G1 G2 G3 y11 y21 y31 y12 y22 y32 y13 y23 y33 y14 y24 y34 y15 y25 y35

Page 59: Biometrika i Planiranje Istrazivanja 2010

56

7.1.1 Raščlanjenje ukupne varijabilnosti na izvore varijabilnosti: Izvori varijabilnosti:

a) ukupna varijabilnost (varijabilnost opažanja bez obzira u kojoj su grupi), b) varijabilnost opažanja unutar svake grupe i c) varijabilnost između prosjeka grupa

Podsjetimo se da je varijanca uzorka pokazatelj varijabilnosti tog uzorka:

( )( )

11var

2

222

−=

−==

∑ ∑∑

nny

y

nyy

si

i ii

i i

Također, ( )( )

∑ ∑∑ −=−i

i iii i n

yyyy

2

22 = suma kvadrata korigirana na srednju vrijednost (SS).

Mjere izvora varijabilnosti

• Ukupna varijabilnost => (SSUKUP) = Ukupna suma kvadrata • Varijabilnost između grupa => (SSTRT) = Suma kvadrata između grupa (tretmana)

= Suma kvadrata za grupe (tretmane) • Varijabilnost unutar grupa => (SSOST) = Suma kvadrata unutar grupa

= Suma kvadrata za ostatak SSTRT = Suma kvadrata između grupa (tretmana) = Suma kvadrata za grupe (tretmane) SSOST = Suma kvadrata unutar grupa = suma kvadrata za ostatak = suma kvadrata za pokusnu

grešku SSUKUP = Ukupna suma kvadrata Može se pokazati da vrijedi: SSUKUP = SSTRT + SSOST Stupnjevi slobode (ukupno) = stupnjevi slobode (grupa) + stupnjevi slobode (ostatak) (N–1) = (a–1) + (N–a) N = ukupan broj mjerenja, a = broj tretmana. Oznake prosjeka:

i

j iji n

yy

∑=. = prosjek grupe i

..N

yy iji j∑∑

= = prosjek svih opažanja

N = ukupan broj opažanja

Page 60: Biometrika i Planiranje Istrazivanja 2010

57

Sume kvadrata:

∑ ∑ −= i j ijUKUP yySS 2..)(

∑∑ ∑ −=−= i iii j iTRT yynyySS 22 ..).(..).(

∑ ∑ −= i j iijOST yySS 2.)(

Kratki način računanja: 1) Ukupna suma

Σi Σj yij 2) Korekcija za srednju vrijednost

( ) ( )opazanja broj ukupni

sumaukupna 22

==∑ ∑

N

yC i j ij

3) Ukupna (korigirana) suma kvadrata

∑ ∑ −= i j ijUKUP CySS 2 = Suma svih kvadriranih opažanja minus C

4) Suma kvadrata za grupe (tretmane) ( )

Cn

ySS

ii

j ij

TRT −= ∑∑ 2

= Suma ( )grupiuopažanja broj

suma grupe

2

za svaku grupu minus C

5) Suma kvadrata za ostatak SSOST = SSUKUP – SSTRT Dijeljenjem suma kvadrata s odgovarajućim stupnjevima slobode dobiju se prosjeci kvadrata: prosjek kvadrata = SS/ stupnjevi slobode Prosjek kvadrata za tretmane:

MSTRT = SSTRT/(a–1) Prosjek kvadrata za ostatak:

MSOST = SSOST/(N–a) 7.1.2 Postavljanje hipoteza i F-provjera H0: τ1 = τ2 =... = τa , nema utjecaja grupa H1: τi ≠ τi’ za barem jedan par (i,i’), razlika između grupa postoji Hipoteza se može i ovako postaviti: H0: µ1 = µ2 =... = µa , prosjeci populacija su isti, H1: µi ≠ µi’ za barem jedan par (i,i’) prosjeci populacija nisu isti.

Page 61: Biometrika i Planiranje Istrazivanja 2010

58

F – provjerom pšrovjeravamo: - da li je varijabilnost mjerenja potpuno slučajna ili je uvjetovana i nekim sistematskim utjecajem

(grupom ili tretmanom) - da li je varijabilnost između grupa (između prosjeka grupa) značajna u odnosu na varijabilnost unutar grupa - da li su prosjeci grupa ili utjecaji grupa značajno različiti

OST

TRTMSMSF =

ima F raspodjelu sa (a–1) i (N–a) stupnjeva slobode, ukoliko vrijedi H0. : - Odbacujemo H0 ako F > Fα,(a–1),(N–a), tj. ako je izračunata statistika F iz uzorka veća od kritične

vrijednosti

Fα,(a-1),(N-a)

F F

Slika 7-1: Provjera hipoteza koristeći F raspodjelu. Ako je F izračunatimanji od F kritično,

tj. F < Fα,a–1,N–a,H0 ne odbacujemo.

Fα,(a-1),(N-a)

F F

Slika 7-2: Provjera hipoteza koristeći F raspodjelu. Ako je F izračunativeći od F kritočno, tj. F > Fα,a–

1,N–a,H0 odbacujemo uz α razinu značajnosti.

Radi preglednosti izračuni i provjera se može napisati u tablicu analize varijance ANOVA tablica: Izvor SS df MS = SS/df F Grupa SSTRT a–1 MSTRT MSTRT/MSOST Ostatak SSOST N–a MSOST Ukupno SSUKUP N–1

Page 62: Biometrika i Planiranje Istrazivanja 2010

59

7.2 Usporedba srednjih vrijednosti pojedinih grupa

F-provjerom provjeravamo da li postoji razlika između tretmana. Ako se H0 ne odbaci:

- nije potrebno dublje analizirati problem, - (!!!mogućnost tip II greške)

Ako se H0 odbaci: - ? koji tretman je utjecao na to - između kojih tretmana je utvrđena značajna razlika. - da li je µi ≠ µi’ za tretmane i i'

7.2.1 Najmanja značajna razlika (LSD)

Cilj: utvrditi najmanju razliku koja će biti značajna i usporediti razlike svih parova srednjih vrijednosti tretmana sa tom vrijednošću.

+= −

',2/'

11

iiOSTaNii nn

MStLSD α Procedura:

1.F-provjera (H0: µ1 =..........= µa , H1: µi ≠ µi’ za barem jedan par i,i’) 2. Ukoliko H1 tada se računa LSDii’ za sve parove ii’. 3. Zaključujemo µi ≠ µi’ ako '' iiii LSDyy ≥−

F provjera mora prethoditi LSD da osiguramo razinu značajnosti α za bilo koji broj usporedbi. Prednost LSD provjere:

- vrlo vjerojatno da će pronaći razliku između srednjih vrijednosti (ako postoje) - ima nisku razinu tip II greške

Loša strana: - pokazuje često razlike kada i nisu - visoka razina tip 1 greške

7.2.2 Tukey provjera (HSD)

t

OSTaNa n

MSqHSD −= ,,α

q statistika ima Q raspodjelu (iz tablica); nt je broj opažanja po grupi Zaključujemo , ako ''' iiiiii HSDyy ≥−≠ µµ . Vjerojatnost da se napravi greška tip I je jednaka α, tj razina α vrijedi za cijelu proceduru, tj. za sve

parove srednjih vrijednosti Za nejednaki broj opažanja po grupi:

)(1

12

N

nN

an i i

t∑−

−=

Prednost Tukey provjere:

- ne toliko pogrešnih zaključaka kao LSD, Loša strana:

- ima više pogrešnih µi = µj zaključaka.

Page 63: Biometrika i Planiranje Istrazivanja 2010

60

7.3 SAS primjer jednostruke analize varijance s fiksnim utjecajima

Primjer: Postavljen je pokus u svrhu provjere razlika tri smjese u dnevnom prirastu prasadi. Tri smjese su označene s TR1, TR2 i TR3. Podaci su dani u slijedećoj tablici:

TR1 TR2 TR3 270 290 290 300 250 340 280 280 330 280 290 300 270 280 300 Ukupno

SAS program: DATA pigs; INPUT smjesa $ prirast @@; DATALINES; TR1 270 TR2 290 TR3 290 TR1 300 TR2 250 TR3 340 TR1 280 TR2 280 TR3 330 TR1 280 TR2 290 TR3 300 TR1 270 TR2 280 TR3 300 ; PROC GLM DATA = pigs; CLASS smjesa; MODEL prirast = smjesa ; LSMEANS smjesa / STDERR PDIFF ADJUST=TUKEY; RUN; QUIT;

Dependent Variable: prirast Sum of Mean Source DF Squares Square F Value Pr > F Model 2 3640.0000 1820.0000 6.13 0.0146 Error 12 3560.0000 296.6667 Corrected Total 14 7200.0000 R-Square Coeff Var. Root MSE prirast Mean 0.505556 5.939315 17.224014 290.00000 Least Squares Means Adjustment for multiple comparisons: Tukey prirast Standard LSMEAN smjesa LSMEAN Error Pr > |t| Number TR1 280.000000 7.702813 0.0001 1 TR2 278.000000 7.702813 0.0001 2 TR3 312.000000 7.702813 0.0001 3 Least Squares Means for effect smjesa Pr > |t| for H0: LSMean(i)=LSMean(j) i/j 1 2 3 1 0.9816 0.0310 2 0.9816 0.0223 3 0.0310 0.0223

Page 64: Biometrika i Planiranje Istrazivanja 2010

61

7.4 Model sa slučajnim utjecajima grupa

Grupa ili tretman slučajna varijabla sa nekom raspodjelom. Slijedeće dvije slike prikazuju razlike između modela s fiksnim i modela sa slučajnim utjecajima:

Slika 7-3: Prikaz izvora varijabilnosti fiksnog modela jednostruke analize varijance: Ukupna varijabilnost , varijabilnost unutar grupa, varijabilnost između grupa .

Slika 7-4: Prikaz izvora varijabilnosti slučajnog modela jednostruke analize varijance: Ukupna varijabilnost , varijabilnost unutar grupa, varijabilnost između grupa .

Fiksni model:

• Mali (konačan) broj grupa • Utjecaj grupe definiran i fiksan • Varijabilnost između grupa nije objašnjena teoretskom raspodjelom

Slučajni model

• Velik (beskonačan) broj grupa • Utjecaj pojedine grupe (prosjek) je slučajna varijabla • Varijabilnost između grupa je objašnjena teoretskom raspodjelom

Model jednostruke analize varijance:

yij = µ + τi + εij i = 1, 2, ... j = 1,...,n

yij = Opažanje jedinice j u grupi i µ = ukupni prosjek τi = slučajni utjecaji grupe ili tretmana i εij = slučajna greška

Page 65: Biometrika i Planiranje Istrazivanja 2010

62

Pretpostavke modela: τi = slučajna varijabla sa prosjekom E(τi) = 0 i varijancom Var(τi) = σ2

τ εij = slučajna greška sa prosjekom E(εij) = 0 i homogenom varijancom σ2 σ2

τ i σ2 = komponente varijance. τi i εij su nezavisni, tj. Cov(τi , εij) = 0 Iz pretpostavki slijedi yi ∼ N(0, σ2

τ + σ2) varijanca opažanja sadrži komponente varijanci Cov(yij , yij’) = σ2

τ Cov(τi , yij) = σ2

τ - kovarijanca između opažanja unutar jedne grupe je jednaka varijanci između grupa. Ciljevi:

1. Provjera hipoteza 2. Procjena komponenti varijance 3. Predviđanje τ1,.., τa.

Hipoteze: da li postoji varijabilnost između tretmana:

H0: σ2τ = 0

H1: σ2τ ≠ 0

Ukoliko vrijedi H0:

=> varijanca grupa jednaka je nuli => grupe su jednake jer nema varijabilnosti između njih

F provjera:

OST

TRT

MSMSF =

ako vrijedi H0 tada je σ2τ = 0, i F = 1.

ANOVA tablica Izvor SS df MS = SS/df E(MS) Grupa SSTRT a–1 MSTRT σ2 + n σ2

τ Ostatak SSOST N–a MSOST σ2 Ukupno SSUKUP N–1 U tablicu je dobro upisati i očekivanja prosjeka kvadrata, E(MS) Pošto je E(MSOST) = σ2 E(MSTRT) = σ2 + n σ2

τ

Page 66: Biometrika i Planiranje Istrazivanja 2010

63

mogu se iz Anova tablice procijeniti komponente varijance koristeći jednakosti: 2222 ˆˆ)( ττ σσσσ nMSnMSE TRTTRT +=⇒+=

22 ˆ)( σσ =⇒= OSTOST MSMSE Iz tog slijedi:

OSTMS=2σ

) - (ˆ 2

nMSMS OSTTRT=τσ

parametara procijene su ˆ i ˆ 22τσσ

n = broj opažanja po grupi Predviđanje srednjih vrijednosti odnosno utjecaja tretmana (primijetite da su različite od

aritmetičkih prosjeka zbog komponenti varijanci): ..ˆ y=µ

)ˆ.(ˆ ., µτ τ −= iyi ybi

( )( ) ii

iiy nyVar

yCovbi /

,22

2

., σσστ

τ

ττ +

== ako su varijance poznate

iy n

bi /ˆˆ

ˆ22

2

.ˆ, σσσ

τ

ττ +

= ako se varijance isto procjenjuju iz uzoraka

7.5 Intraklasna korelacija

Korelacija između opažanja unutar grupe.

)()(

),(

',,

',,

jiji

jijit yVaryVar

yyCov=ρ

Kovarijanca između opažanja unutar grupa jednaka komponenti varijance između grupa: Cov(yij,yij') = Var (τi) = στ

2 Varijanca bilo kojeg opažanja ij je: Var(yij) = στ

2 + σ2

Intraklasna korelacija:

22

2

σσσρ

τ

τ

+=t

Procjena iz uzorka:

22

2

ˆˆˆ

σσσ

τ

τ

+=tr

Page 67: Biometrika i Planiranje Istrazivanja 2010

64

7.6 SAS primjer jednostruke analize varijance sa slučajnim utjecajima

Primjer: Mjerena je koncentracija progesterona kod 8 svinja s ciljem da se procijeni varijabilnost unutar i između svinja, odnosno da se utvrdi da li je varijabilnost između svinja značajna. Koncentracija progesterona je mjerena tri puta na svakoj svinji. Podaci su u slijedećoj tablici.

Svinja Mjerenje 1 2 3 4 5 6 7 8 1 5.3 6.6 4.3 4.2 8.1 7.9 5.5 7.8 2 6.3 5.6 7.0 5.6 7.9 4.7 4.6 7.0 3 4.2 6.3 7.9 6.6 5.8 6.8 3.4 7.9

SAS program: DATA sow; INPUT sow prog @@; DATALINES; 1 5.3 1 6.3 1 4.2 2 6.6 2 5.6 2 6.3 3 4.3 3 7.0 3 7.9 4 4.2 4 5.6 4 6.6 5 8.1 5 7.9 5 5.8 6 7.9 6 4.7 6 6.8 7 5.5 7 4.6 7 3.4 8 7.8 8 7.0 8 7.9 ; PROC MIXED DATA=sow METHOD = REML; CLASS sow ; MODEL prog = / SOLUTION DDFM = SATTERTH; RANDOM sow / SOLUTION; RUN;

SAS ispis: Covariance Parameter Estimates Cov Parm Estimate sow 0.5571 Residual 1.4937 Solution for Fixed Effects Standard Effect Estimate Error DF t Value Pr > |t| Intercept 6.1375 0.3632 7 16.90 <.0001 Solution for Random Effects Std Err Effect sow Estimate Pred DF t Value Pr > |t| sow 1 -0.4599 0.5475 5.49 -0.84 0.4360 sow 2 0.0154 0.5475 5.49 0.03 0.9785 sow 3 0.1386 0.5475 5.49 0.25 0.8093 sow 4 -0.3542 0.5475 5.49 -0.65 0.5437 sow 5 0.5963 0.5475 5.49 1.09 0.3216 sow 6 0.1738 0.5475 5.49 0.32 0.7626 sow 7 -0.8647 0.5475 5.49 -1.58 0.1698 sow 8 0.7547 0.5475 5.49 1.38 0.2216

Page 68: Biometrika i Planiranje Istrazivanja 2010

65

8 Načela planiranja pokusa

Pokus (eksperiment): - planirano istraživanje u svrhu dobivanja novih činjenica ili potvrde odnosno osporavanja rezultata prijašnjih pokusa

Istraživanje se može prikazati u nekoliko koraka: 1. Opis problema (uvod)

- općenito, dosadašnja istraživanja 2. Postavljanje cilja (hipoteze)

- usko, specifično, dalji rad slijedi iz toga - pitanje na koje treba odgovoriti - hipoteza koju treba provjeriti - utjecaj koji treba procijeniti

3. Postavljanje pokusnog plana (design)

- što treba učiniti, materijal i metode 4. Sakupljanje podataka

- prema pokusno planu 5. Analiza (Rezultati i rasprava) 6. Donošenje zaključka

- odgovor na postavljeni cilj - jasan i koncizan

U pokusnom planu treba definirati: - Tretmani (populacije) - Pokusna jedinica - Jedinica uzorka (opažanje) - Ponavljanja - Pokusna greška Pokusni plan: - Način na koji se primjenjuju tretmani na pokusne jedinice - Postavlja ga istraživač - Unutar okvira plana mora postojati slučajnost primjene tretmana Statistički model:

- Slijedi pokusni plan - Pomaže pri provjeri statističkih hipoteza - Pomaže pri donošenju zaključaka - Sastoji se od tri dijela:

- prosjeci (očekivanja) - disperzija (varijance i kovarijance) - definirane raspodjele Često prikazan matematičkom formulom

Page 69: Biometrika i Planiranje Istrazivanja 2010

66

8.1 Pokusna jedinica i tretmani

Pokusna jedinica - jedinica materijala na koje se primjenjuju tretmani - jedna jedinka, npr. životinja - ili grupa jedinki kao što je 10 pilića u jednom kavezu

Tretman - procedura čiji utjecaj će biti mjeren i uspoređivan s drugim utjecajima - primjer: razina hranidbe, način primjene insekticida - određivanje populacije za koje će se donositi zaključci

Utjecaj tretmana se mjeri na jedinici uzorka Faktor: grupa tretmana koji predstavljaju vrijednosti jedne kategoričke nezavisne varijable. Jedinica uzorka:

- može biti jednaka pokusnoj jedinici - može biti dio pokusne jedinice

8.2 Ponavljanja i pokusna greška

Ponavljanja: - kada se tretmani primjenjuju više puta na više pokusnih jedinca - omogućuju procjenu pokusne greške - više ponavljanja povećava preciznost pokusa jer se time smanjuju standardne greške tretmana

Pokusna greška (engl. experimental error):

- mjera neprotumačene varijabilnosti koja postoji između opažanja na pokusnim jedinicama kada bi one bile tretirane jednako, odnosno kad nema utjecaja tretmana MSOST , s2 , MSE - prosjek kvadrata za ostatak - prosjek kvadrata između pokusnih jedinica - prosjek kvadrata unutar tretmana (grupa).

Procjena pokusne greške je potrebna: - za provjeru značajnosti razlika pojedinih utjecaja - za procjenu intervala povjerenja srednjih vrijednosti

Količina informacija:

2snI =

Kontrola pokusne greške

(kontrola varijabilnosti između pokusnih jedinica) Pokusna greška se može smanjiti:

1. Izborom pokusnog materijala sa što manjom varijabilnosti među pokusnim jedinicama (slučajnost izbora mora biti zadovoljena) 2. Poboljšanjem provedbe pokusa dajući slične uvjete pokusnim jedinicama 3. Izborom odgovarajućeg statističkog plana

Page 70: Biometrika i Planiranje Istrazivanja 2010

67

Na točnu procjenu pokusne greške utječe: - slučajnost izbora pokusnog materijala - slučajnost primjene tretmana na pokusne jedinice

Izvori varijabilnost pokusne greške: - varijabilnost između pokusnih jedinica koju se ne može objasniti - postoji varijabilnost zbog pomanjkanja uniformnosti u provedbi pokusa.

Preciznost pokusnih planova

• Na preciznost pokusa utječe: – izbor i homogenost pokusnog materijala – izbor i razine tretmana – kontrola pokusne greške – broj ponavljanja

8.3 Potreban broj ponavljanja

Ovisi o: - varijabilnosti uzorka - željenoj razlici između prosjeka tretmana - preciznosti pokusa - broju tretmana - razini vjerojatnosti sa kojom želimo biti sigurni da nismo pogriješili u zaključivanju (razina značajnosti)

Potreban broj ponavljanja:

( ) 22

2/ 2σδ

βα zzr

+≥

zα/2 = vrijednost na apscisi standardne normalne raspodjele određen sa α/2 vjerojatnosti tipa 1 greške

zβ = vrijednost na apscisi standardne normalne krivulje određen sa β vjerojatnosti tipa 2 greške τ = željena razlika koju želimo utvrditi σ2 = pokusna greška, odnosno varijanca pokusnih jedinca kad ne bi bilo utjecaja tretmana.

Page 71: Biometrika i Planiranje Istrazivanja 2010

68

9 Potpuno slučajni pokusni plan

Svojstva: - tretmani se dodjeljuju slučajno na pokusne jedinice - pokusne jedinice izabrane su slučajno iz populacije jednostruka analiza varijance = jednofaktorska analiza varijance.

Koristi se: - kada su pokusne jedinice homogene.

Primjer:

Utjecaj tri različite hranidbe na prirast u tovu. Prvo treba definirati sakupljanje podataka, odnosno napraviti plan pokusa:

Izabrat ćemo slučajni uzorak i slučajno primijeniti tretmane na uzorak (definirati grupe) Izabrali smo 15 junadi i različito ih hranili.(tretirali).

Page 72: Biometrika i Planiranje Istrazivanja 2010

69

Radi preglednosti mogu se životinje i njihova mjerenja napisati po tretmanima Tretmani

T1 T2 T3

June Mjerenje June Mjerenje June Mjerenje

2 1170 1 1090 3 1290

6 1200 4 1050 5 1340

9 1180 8 1080 7 1330

12 1180 10 1090 11 1300

15 1170 14 1080 13 1300

Shema: Broj životinje 1 2 3 4 5 6 7 8 Tretman T2 T1 T3 T2 T3 T1 T3 T2

Broj životinje 9 10 11 12 13 14 15 Tretman T1 T2 T3 T1 T3 T2 T1

Radi preglednosti mogu se životinje i njihova mjerenja napisati po tretmanima: Tretmani T1 T2 T3 Broj Mjerenje Broj Mjerenje Broj Mjerenje 2 y11 1 y21 3 y31 6 y12 4 y22 5 y32 9 y13 8 y23 7 y33 12 y14 10 y24 11 y34 15 y15 14 y25 13 y35

Page 73: Biometrika i Planiranje Istrazivanja 2010

70

10 Blokovi u analizi varijance

Unaprijed je poznato da će neke pokusne jedinice, iako tretirane jednako, ponašati različito - teže životinje će imati drugačiji prirast nego lakše - mjerenje na isti dan će biti sličnija nego ona u različitim danima

Pokusni plan: - pokusne jedinice se klasificiraju i prema tim poznatim izvorima varijabilnosti - smanjuje se pokusna greška

10.1 Slučajni blok plan (potpuni)

Pokusne jedinice uz tretmane mogu grupirati i prema drugom poznatim izvoru varijabilnosti u blokove - npr. na temelju početne težine, kondicije, pasmine, spolu, stadij laktacije, legla, itd.

Blokovi: - grupe koje služe da se protumači još jedan dio varijabilnosti - njihova provjera obično nije od primarnog interesa

Cilj grupiranja u blokove: - da su jedinice unutar blokova slične tako da je varijabilnost između njih uglavnom zbog različitih tretmana

Karakteristike slučajnog blok plana su:

- imamo a tretmana i b blokova. Svaki tretman se javlja u svakom bloku i to samo jedanput - način kako se tretmani primjenjuju na životinje u pojedinom bloku je potpuno slučajan - dvostruka analiza varijance (dvostruka klasifikacija) - dva načina klasificiranja pokusnih jedinica: prema bloku i tretmanu

Primjer: Stimulansi na rast junadi

- 3 tretmana - 4 bloka prema početnoj težini - u svakom bloku 3 životinje na koje slučajno primjenjujemo tretmane - ukupno 12 životinja u pokusu

Blok Životinje I 1,2,3 II 4,5,6, III 7,8,9 IV 10,11,12 Shema pokusnog plana:

Page 74: Biometrika i Planiranje Istrazivanja 2010

71

Blokovi I II III IV

Br. 1 (T3) br. 4 (T1) br. 7 (T3) br. 10 (T3) Br. 2 (T1) br. 5 (T2) br. 8 (T1) br. 11 (T2) Br. životinje (Tretman) Br. 3 (T2) br. 6 (T3) br. 9 (T2) br. 12 (T1)

Rezultati mjerenja:

Blokovi I II III IV

T1 y11 y12 y13 y14 T2 y21 y22 y23 y24

Tret

man

T3 y31 y32 y33 y34

yij = mjerenje tretmana i u bloku j. Model: yij = µ + τi + βj + εij i = 1,.....,a j = 1,...,b

yij = opažanje pokusne jedinice za tretman i u bloku j µ, = ukupna srednja vrijednost τi = fiksni utjecaji grupe (tretmana) βj = fiksni utjecaji blokova εij - slučajni neprotumačeni utjecaj N(0, σ2) = interakcija blok x tretman 10.1.1 Raščlanjenje ukupne sume kvadrata Sume kvadrata: SSUKUP = SSTRT + SSBLK + SSOST Stupnjevi slobode su: (ba–1) = (a–1) + (b–1) + (a–1)(b–1) Također je (a–1)(b–1) = (ab–a–b+1) Jednostruka ANOVA:

SSUKUP = SSTRT + SS'OST Dvostruka ANOVA:

SSUKUP = SSTRT + SSBLK + SSOST SS'OST = SSBLK + SSOST SSOST : suma kvadrata za ostatak kod dvostruke ANOVA-e (pokusna greška kod slučajnog blok

plana) SS'OST : suma kvadrata za ostatak kod jednostruke ANOVA-e

Page 75: Biometrika i Planiranje Istrazivanja 2010

72

Smanjenje SS ostatka => veća preciznost slučajnog blok plana u utvrđivanju eventualnih razlika tretmana

Sume kvadrata:

∑ ∑ −=i j ijUKUP yySS 2..)(

∑∑ ∑ −=−=i ii j iTRT yybyySS 22 ..).(..).(

∑∑ ∑ −=−=i ji j jBLK yyayySS 22 ..).(..).(

∑ ∑ +−−=i j jiijOST yyyySS 2..)..(

Kratki način računanja suma kvadrata:

1) Ukupna suma = Σi Σj yij 2) Korekcijski faktor za srednju vrijednost:

( ) ( )opazanja broj ukupni

sumaukupna 22

==∑ ∑

ab

yC i j ij

3) SSUKUP = Σi Σj yij2 – C

4) ( )

Cb

ySS

i

j ij

TRT −= ∑∑ 2

5) ( )

Ca

ySS

ji ij

BLK −= ∑ ∑ 2

6) SSOST = SSUKUP – SSTRT – SSBLK Prosjeci kvadrata = MS = SS/df

MSBLK = SSBLK/ (b–1), MSTRT = SSTRT/ (a–1), MSOST = SSOST/[(a–1)(b–1)]

10.1.2 Postavljanje hipoteza i F-provjera H0: τ1 = τ2 =... = τa , nema utjecaja tretmana H1: τi ≠ τi’ za barem jedan par (i,i’), razlika između tretmana postoji F statistika

OST

TRT

MSMS

F =

ima F raspodjelu sa stupnjevima slobode (a–1) i (a–1)(b–1) ukoliko vrijedi H0 Za α razinu značajnosti odbacujemo Ho ako F > Fα,(a–1),(a–1)(b–1) Provjera za blokove:

- obično nije od primarnog interesa - analogna kao i za tretmane.

Page 76: Biometrika i Planiranje Istrazivanja 2010

73

Anova tablica: Izvor SS df MS F Blokovi SSBLK b–1 MSBLK F=MSBLK/MSOST Tretmani SSTRT a–1 MSTRT F=MSTRT/MSOST Ostatak SSOST (a–1)(b–1) MSOST Ukupno SSUKUP ab–1 10.1.3 SAS primjer za slučajni blok plan

Primjer: Cilj pokusa je bio utvrditi utjecaj primjene tri tretmana (T1, T2 i T3) na prosječni dnevni prirast u tovu junadi. Junad je podijeljena u četiri bloka prema početnoj težini. U svakom su bloku dakle tri životinje na koje su slučajno dodijeljeni tretmani. Ukupno je bilo 12 životinja u pokusu. Radi lakšeg praćenja napravimo tablicu s podacima, prosjecima i sumama po tretmanima i blokovima:

Blokovi I II III IV T1 826 865 795 850 T2 827 872 721 860 T3 753 804 737 822

SAS program: DATA steer; INPUT trt blok $ prirast @@; DATALINES; 1 I 826 1 II 865 1 III 795 1 IV 850 2 I 827 2 II 872 2 III 721 2 IV 860 3 I 753 3 II 804 3 III 737 3 IV 822 ; PROC GLM DATA = steer; CLASS blok trt; MODEL prirast = blok trt/ ; LSMEANS trt / STDERR PDIFF ADJUST=TUKEY; RUN; QUIT;

SAS output: Dependent Variable: prirast Sum of Mean Source DF Squares Square F Value Pr > F Model 5 24734.0000 4946.8000 8.08 0.0122 Error 6 3672.0000 612.0000 Corrected Total 11 28406.0000 R-Square Coeff Var Root MSE prirast Mean 0.870732 3.050386 24.7386 811.000

Page 77: Biometrika i Planiranje Istrazivanja 2010

74

Source DF Type III SS Mean Square F Value Pr > F blok 3 18198.0000 6066.0000 9.91 0.0097 trt 2 6536.0000 3268.0000 5.34 0.0465 Least Squares Means Adjustment for Multiple Comparisons: Tukey prirast Standard LSMEAN trt LSMEAN Error Pr > |t| Number 1 834.000000 12.369317 0.0001 1 2 820.000000 12.369317 0.0001 2 3 779.000000 12.369317 0.0001 3 Least Squares Means for effect trt Pr > |t| for H0: LSMean(i)=LSMean(j) Dependent Variable: prirast i/j 1 2 3 1 0.7165 0.0456 2 0.7165 0.1246 3 0.0456 0.1246

10.1.4 SAS primjer s više pokusnih jedinica po kombinaciji blok x tretman

Primjer: Pretpostavimo opet da je cilj pokusa bio utvrditi utjecaj primjene tri tretmana (T1, T2 i T3) na prosječni dnevni prirast u tovu junadi. Opet ćemo koristiti 4 bloka, međutim ovaj puta imamo na raspolaganju 8 životinja po svakom bloku. Ukupno u cijelom pokusu ima 4×3×2 = 24 životinje. Tretmani su primijenjeni na životinje u bloku slučajno. Tablica sa rezultatima mjerenja na kraju pokusa je slijedeća:

Blokovi

Tretmani I II III IV

T1 826 806

864 834

795 810

850 845

T2 827 800

871 881

729 709

860 840

T3 753 773

801 821

736 740

820 835

SAS program za primjer s junadi i dvije pokusne jedinice po kombinaciji blok x tretman je slijedeći. Dva pristupa će biti pokazana: blokovi definirani kao fiksni koristeći GLM proceduru i blokovi definirani kao slučajni koristeći MIXED proceduru. SAS program: DATA prirast; INPUT trt blok $ prirast @@; DATALINES; 1 I 826 1 I 806 1 II 864 1 II 834 1 III 795 1 III 810 1 IV 850 1 IV 845

Page 78: Biometrika i Planiranje Istrazivanja 2010

75

2 I 827 2 I 800 2 II 871 2 II 881 2 III 729 2 III 709 2 IV 860 2 IV 840 3 I 753 3 I 773 3 II 801 3 II 821 3 III 736 3 III 740 3 IV 820 3 IV 835 ; PROC GLM DATA = prirast; CLASS blok trt; MODEL prirast = blok trt blok*trt/; LSMEANS trt / STDERR PDIFF ADJUST=TUKEY; LSMEANS blok*trt / STDERR PDIFF ADJUST=TUKEY; RUN; QUIT;

SAS ispis GLM procedure za fiksne blokove: Dependent Variable: prirast Sum of Source DF Squares Mean Square F Value Pr > F Model 11 49929.83333 4539.07576 25.81 <.0001 Error 12 2110.00000 175.83333 Corrected Total 23 52039.83333 R-Square Coeff Var Root MSE prirast Mean 0.959454 1.638244 13.26022 809.4167 Source DF Type III SS Mean Square F Value Pr > F blok 3 33816.83333 11272.27778 64.11 <.0001 trt 2 8025.58333 4012.79167 22.82 <.0001 blok*trt 6 8087.41667 1347.90278 7.67 0.0015 Least Squares Means Adjustment for Multiple Comparisons: Tukey prirast Standard LSMEAN trt LSMEAN Error Pr > |t| Number 1 828.750000 4.688194 <.0001 1 2 814.625000 4.688194 <.0001 2 3 784.875000 4.688194 <.0001 3 Least Squares Means for Effect trt t for H0: LSMean(i)=LSMean(j) / Pr > |t| Dependent Variable: prirast i/j 1 2 3 1 0.1251 <.0001 2 0.1251 0.0020 3 <.0001 0.0020 Least Squares Means prirast Standard blok trt LSMEAN Error Pr > |t| I 1 816.000000 9.376389 <.0001 I 2 813.500000 9.376389 <.0001 I 3 763.000000 9.376389 <.0001 II 1 849.000000 9.376389 <.0001 II 2 876.000000 9.376389 <.0001 II 3 811.000000 9.376389 <.0001

Page 79: Biometrika i Planiranje Istrazivanja 2010

76

III 1 802.500000 9.376389 <.0001 III 2 719.000000 9.376389 <.0001 III 3 738.000000 9.376389 <.0001 IV 1 847.500000 9.376389 <.0001 IV 2 850.000000 9.376389 <.0001 IV 3 827.500000 9.376389 <.0001

PROC MIXED DATA = prirast; CLASS blok trt; MODEL prirast = trt/; RANDOM blok blok*trt; LSMEANS trt / DIFF ADJUST=TUKEY; RUN;

SAS ispis MIXED procedure za slučajne blokove: Covariance Parameter Estimates Cov Parm Estimate blok 1654.06 blok*trt 586.03 Residual 175.83 Type 3 Tests of Fixed Effects Num Den Effect DF DF F Value Pr > F trt 2 6 2.98 0.1264 Least Squares Means Stand Effect trt Est Error DF t Val Pr>|t| Alpha Lower Upper trt 1 828.75 24.1247 6 34.35 <.0001 0.05 769.72 887.78 trt 2 814.62 24.1247 6 33.77 <.0001 0.05 755.59 873.66 trt 3 784.87 24.1247 6 32.53 <.0001 0.05 725.84 843.91 Differences of Least Squares Means Stand Effect tr_tr Est Error DF t Val Pr > |t| Adjustment Adj P Alpha trt 1 2 14.125 18.3569 6 0.77 0.4708 Tukey-Kramer 0.7339 0.05 trt 1 3 43.875 18.3569 6 2.39 0.0540 Tukey-Kramer 0.1174 0.05 trt 2 3 29.750 18.3569 6 1.62 0.1562 Tukey-Kramer 0.3082 0.05 Differences of Least Squares Means Adj Adj Effect trt _trt Lower Upper Lower Upper trt T1 T2 -30.7927 59.0427 . . trt T1 T3 -1.0427 88.7927 . . trt T2 T3 -15.1677 74.6677 . .

Page 80: Biometrika i Planiranje Istrazivanja 2010

77

11 'Change-over' pokusni planovi

11.1 Jednostavni 'change-over' plan

Svojstva: - svi tretmani se primjenjuju na svaku životinju (subjekt) - a mjerenja na svakom od n subjekata - mjerenja a odgovaraju tretmanima - redoslijed primjene tretmana je slučajan - pokusna jedinica NIJE subjekt (životinja) - pokusna jedinica JE jedno mjerenje na životinji

- protumačeni izvori varijabilnosti: - subjekti i tretmani

Razdoblje Subjekt 1 Subjekt 2 Subjekt 3 … Subjekt n 1 T2 T1 T2 … T3 2 T1 T3 T3 … T2 3 T3 T2 T1 … T1

Model: yij = µ + τi + SUBj + εij i = 1,.....,a j = 1,...,n

yij = Opažanje životinje (subjekta) j u za tretman i µ = ukupni prosjek τi = fiksni utjecaj tretmana i SUBj = slučajni utjecaj životinje (subjekta) j εij – slučajna greška Kada imamo rezultate mjerenja obično pišemo: Subjekt Tretman 1 2 ......... n T1 y11 y12 .... y1n T2 y21 y22 .... y2n

.......................... Ta y31 y32 .... yan Izvori varijabilnosti Sume kvadrata :

SSUKUP = SSSUB + SSUNUTAR SUBJEKTA SSUNUTAR SUBJEKTA = SSTRT + SSOST

SSUKUP = SSSUB + SSTRT + SSOST

Page 81: Biometrika i Planiranje Istrazivanja 2010

78

stupnjevi slobode: (na–1) = (n–1) + (a–1) + (n–1)(a–1) Sume kvadrata su:

∑ ∑ −=i j ijUKUP yySS 2..)(

∑∑ ∑ −=−=i ji j jSUB yyayySS 22 ..).(..).(

∑∑ ∑ −=−=i iii j iTRT yynyySS 22 ..).(..).(

∑ ∑ −=i j jijUNUTAR yySS 2

SUBJEKTA ).(

∑ ∑ +−−=i j jiiijOST yyyySS 2..)..(

MS = SS/df:

MSTRT = SSTRT/ (a–1) MSOST = SSOST/[(a–1)(n–1)]

ANOVA tablica: Izvor SS df MS F Između subj. SSSUB n–1 MSSUB Unutar subj. SSUNUTAR n(a–1) MSUNUTAR Tretmani SSTRT a–1 MSTRT MSTRT/MSOST Ostatak SSOST (n–1)(a–1) MSOST Hipoteze: H0: τ1 = τ2 =... = τa , nema utjecaja grupa H1: τi ≠ τi’ za barem jedan par (i,i’), razlika između grupa postoji F statistika:

OST

TRT

MSMSF =

11.2 'Change-over' plan kada postoji utjecaj razdoblja

omogućava i provjeru utjecaja redoslijeda primjene tretmana. Model: yijkl = µ + τi + βk + SUB(β)jk + tl + εijkl i = 1 do a; j = 1 do nk, k = 1 do b; l = 1 do a Gdje su: yijkl = opažanje ijkl µ = ukupni prosjek korigiran na sve utjecaje τi = utjecaj tretmana i βk = utjecaj bloka k, blok može na primjer biti redoslijed primjene pojedinog tretmana SUB(β)jk = slučajni utjecaj životinje (subjekta) j unutar bloka k sa prosjekom 0 i varijancom σ2

g tl = utjecaj razdoblja l εijkl = slučajna greška s prosjekom 0 i varijancom σ2

Page 82: Biometrika i Planiranje Istrazivanja 2010

79

a = broj tretmana i razdoblja, b = broj blokova, je nk = broj životinja unutar bloka k. n = Σknk = ukupan broj životinja ANOVA tablica: Izvor varijabilnosti SS df MS = SS / df F Blokovi SSBLK b–1 MSBLK MSBLK/MSSUB Subjekt unutar bloka SSSUB Σk(nk–1) MSSUB Razdoblje SSt a–1 MSt MSt/MSOST Tretmani SSTRT a–1 MSTRT MSTRT/MSOST

Ostatak SSOST (a–1)(Σknk – 2) MSOST Ukupno SSUKUP aΣknk – 1 Provjera tretmana:

Provjera blokova

OST

TRT

MSMSF = F =

)(BLOKSUBJ

BLOK

MSMS

11.2.1 SAS primjer za ‘change-over’ plan s utjecajem razdoblja

Primjer: Ispitivan je utjecaj dva tretmana na proizvodnju mlijeka kod krava. Primijenjen je 'change-over' plan, tj. na svaku kravu primijenjena su oba tretmana. Pokus je proveden u 3. i 4. mjesecu laktacije. Redoslijed tretmana kod svake krave utvrđen je slučajno. Na kraju pokusa dobivene su slijedeće prosječne dnevne količine mlijeka u kg:

BLOK I Razdoblje Tretman Krava 1 Krava 4 Krava 5 Krava 9 Krava 10 1 1 31 34 43 28 25 2 2 27 25 38 20 19

BLOK II Razdoblje Tretman Krava 2 Krava 3 Krava 6 Krava 7 Krava 8 1 2 22 40 40 33 18 2 1 21 39 41 34 20

SAS program: DATA Cows; INPUT period trt order cow milk @@; DATALINES; 1 1 1 1 31 1 2 2 2 22 2 2 1 1 27 2 1 2 2 21 1 1 1 4 34 1 2 2 3 40 2 2 1 4 25 2 1 2 3 39 1 1 1 5 43 1 2 2 6 40 2 2 1 5 38 2 1 2 6 41 1 1 1 9 28 1 2 2 7 33 2 2 1 9 20 2 1 2 7 34 1 1 1 10 25 1 2 2 8 18 2 2 1 10 19 2 1 2 8 20 ;

Page 83: Biometrika i Planiranje Istrazivanja 2010

80

PROC MIXED ; CLASS trt cow period order; MODEL milk = order trt period; RANDOM cow(order) ; LSMEANS trt/ DIFF ADJUST=TUKEY ; RUN;

SAS ispis: Covariance Parameter Estimates Cov Parm Estimate cow(order) 75.4000 Residual 1.5250 Type 3 Tests of Fixed Effects Num Den Effect DF DF F Value Pr > F order 1 8 0.11 0.7527 trt 1 8 37.90 0.0003 period 1 8 29.51 0.0006 Least Squares Means Standard Effect trt Estimate Error DF t Value Pr > |t| trt 1 31.6000 2.7735 8 11.39 <.0001 trt 2 28.2000 2.7735 8 10.17 <.0001 Differences of Least Squares Means Standard Effect trt _trt Estimate Error DF t Value Pr > |t| trt 1 2 3.4000 0.5523 8 6.16 0.0003 Differences of Least Squares Means Effect trt _trt Adjustment Adj P trt 1 2 Tukey-Kramer 0.0003

11.3 Latinski kvadrat

Značajke: - tretmani se primjenjuju na blokove na dva različita načina, tj. u kolone i redove. - svaka kolona i svaki red predstavljaju kompletni blok sa primjenjenim svim tretmanima - tri protumačena izvora varijabilnosti - kolone, redovi i tretmani - pojedino opažanje je samo u jednoj koloni, jednom redu i podliježe samo jednom tretmanu - pretpostavka da nema interakcije - r = broj tretmana, kolona i redova - ukupan broj mjerenja = r2

Page 84: Biometrika i Planiranje Istrazivanja 2010

81

Primjer: - blokovi utjecaj životinje i razdoblje - na istu životinju se primjenjuju svi tretmani u različitim razdobljima - latinski kvadrat => 'change-over' plan.

Primjer: r = 4 Životinje

Razdoblja 1 2 3 4 1 T1 T2 T3 T4 2 T2 T3 T4 T1 3 T3 T4 T1 T2. 4 T4 T1 T2 T3

yij(k) = mjerenje u i - tom redu (periodu), j - toj koloni (životinji), sa primijenjenim k -tim

tretmanom: Životinje

Razdoblja 1 2 3 4 1 y11(1) y12(2) y13(3) y14(4) 2 y21(2) y22(3) y23(4) y24(1) 3 y31(3) y32(4)..y33(1)..y34(2). 4 y41(4) y42(1) y43(2) y44(3)

Statistički model:

yij(k) = µ + REDi + KOLj + τ(k) + εij(k) i,j,k = 1,...,r

yij(k) = opažanje ij(k) µ = srednja vrijednost korigirana na sve utjecaje REDi = fiksni utjecaj i reda KOLj = fiksni utjecaj j kolone τ(k) = fiksni utjecaj tretmana k εij(k) - ostatak slučajni N(0, σ2) Sume kvadrata: SSUKUP = SSRED + SSKOL + SSTRT + SSOST stupnjevi slobode: r2 – 1 = (r–1) + (r–1) + (r–1) + (r–1)(r–2) Sume kvadrata:

∑∑ −=i j kijUKUP yySS 2

)( ..)(

∑ −=i iRED yyrSS 2..).(

∑ −=i jKOL yyrSS 2..).(

∑ −=i kTRT yyrSS 2..)(

( )∑∑ +−−−=i j kjiijOST yyyyySS ..2..

Page 85: Biometrika i Planiranje Istrazivanja 2010

82

Kratki način računanja:

1) Ukupna suma = Σi Σj yij(k) = y.. 2) Korekcijski faktor za srednju vrijednost:

( ) ( )

opazanja broj ukupnisumaukupna 2

2

2)(

==∑ ∑

r

yC i j kij

3) SSUKUP = Σi Σj (yij(k))2 – C

4) ( )

Cr

ySS

i

j ijk

RED −= ∑∑ 2

5) ( )

Cr

ySS

ji kij

KOL −= ∑ ∑ 2)(

6) ( )

Cr

ySS

ki j kij

TRT −= ∑∑∑ 2

)(

7) SSOST = SSUKUP – SSA – SSB – SSTRT MSRED = SSRED/ (r–1), MSKOL = SSKOL/ (r–1), MSTRT = SSTRT/ (r–1), MSOST = SSOST/[(r–1)(r–2)] Hipoteze: H0: τ1 = τ2 =... = τa , nema utjecaja tretmana H1: τi ≠ τi’ za barem jedan par (i,i’), razlika između tretmana postoji

OST

TRT

MSMSF =

ANOVA tablica Izvor SS df MS F Redovi SSRED r–1 MSRED MSRED/MSOST Kolone SSKOL r–1 MSKOL MSKOL/MSOST Tretmani SSTRT r–1 MSTRT MSTRT/ MSOST Ostatak SSOST (r–1)(r–2) MSOST Ukupno SSUKUP r2–1 11.3.1 SAS primjer za latinski kvadrat

Cilj pokusa je bio utvrditi utjecaj dodavanja 4 različita dodataka (A, B, C i D) na uzimanje sijena kod tovne junadi. Pokus je proveden kao latinski kvadrat: na 4 životinje u 4 razdoblja.

Page 86: Biometrika i Planiranje Istrazivanja 2010

83

June Razdoblje 1 2 3 4 1 10.0(B) 9.0(D) 11.1(C) 10.8(A) 2 10.2(C) 11.3(A) 9.5(D) 11.4(B) 3 8.5(D) 11.2(B) 12.8(A) 11.0(C) 4 11.1(A) 11.4(C) 11.7(B) 9.9(D)

SAS program: DATA a; INPUT period steer suppl $ hay @@; DATALINES; 1 1 B 10.0 3 1 D 8.5 1 2 D 9.0 3 2 B 11.2 1 3 C 11.1 3 3 A 12.8 1 4 A 10.8 3 4 C 11.0 2 1 C 10.2 4 1 A 11.1 2 2 A 11.3 4 2 C 11.4 2 3 D 9.5 4 3 B 11.7 2 4 B 11.4 4 4 D 9.9

; PROC GLM; CLASS period steer suppl; MODEL hay = period steer suppl; LSMEANS suppl / STDERR PDIFF ADJUST=TUKEY; RUN; QUIT;

SAS ispis: Dependent Variable: hay Sum of Source DF Squares Mean Square F Value Pr > F Model 9 17.09562500 1.89951389 13.12 0.0027 Error 6 0.86875000 0.14479167 Corrected Total 15 17.96437500

R-Square Coeff Var Root MSE hay Mean 0.951640 3.562458 0.380515 10.68125

Source DF Type III SS Mean Square F Value Pr > F period 3 1.48187500 0.49395833 3.41 0.0938 steer 3 3.59187500 1.19729167 8.27 0.0149 suppl 3 12.02187500 4.00729167 27.68 0.0007 Least Squares Means Adjustment for Multiple Comparisons: Tukey hay Standard LSMEAN suppl LSMEAN Error Pr > |t| Number A 11.5000000 0.1902575 <.0001 1 B 11.0750000 0.1902575 <.0001 2 C 10.9250000 0.1902575 <.0001 3 D 9.2250000 0.1902575 <.0001 4 Least Squares Means for Effect suppl t for H0: LSMean(i)=LSMean(j) / Pr > |t| Dependent Variable: hay

Page 87: Biometrika i Planiranje Istrazivanja 2010

84

i/j 1 2 3 4 1 0.4536 0.2427 0.0006 2 0.4536 0.9411 0.0019 3 0.2427 0.9411 0.0030 4 0.0006 0.0019 0.0030

11.4 Change over plan postavljen kao više latinskih kvadrata

I kvadrat II kvadrat B B A 1 2 3 A 1 2 3 1 a b c 1 a b c 2 b c d 2 b c d 3 c d a 3 c d a Model: yij(k)m = µ + KVm + A(KV)im + B(KV)jm+ T(k) + εij(k)m i,j,k = 1,...,r; m = 1,...,b gdje su: yij(k)m = opažanje ij(k)m µ = ukupni prosjek korigiran na sve utjecaje KVm = utjecaj kvadrata m RED(KV)im = fiksni utjecaj reda i unutar kvadrata m KOL(KV)jm, = fiksni utjecaj kolone j unutar kvadrata m τ(k) = fiksni utjecaj tretmana k εij(k)m = slučajna greška sa prosjekom 0 i varijancom σ2 r = broj tretmana, i broj redova i kolona unutar kvadrata b = broj kvadrata ANOVA tablica: Izvor df Kvadrati (blokovi) b–1 Redovi unutar kvadrata b(r–1) Kolone unutar kvadrata b(r–1) Tretman b–1 Ostatak (Pokusna greška) b(r–1)(r–2)+(b–1)(r–1) Ukupno b r2–1 F-provjera:

OST

TRT

MSMSF =

Page 88: Biometrika i Planiranje Istrazivanja 2010

85

12 Faktorijalni pokus

- kada imamo dva ili više faktora koji se proučavaju u isto vrijeme. - sve kombinacije faktora se provjeravaju međusobno

Interakcija:

- različiti utjecaj razina jednog faktora na razine drugog faktora Glavni utjecaji:

- utjecaji svakog faktora gledajući samo po sebi Protumačeni izvori varijabilnosti: - faktor 1, faktor 2, …., interakcije između faktora Primjer:

- pokus sa dva faktora: prvi faktor = količina proteina (3 razine) drugi faktor = vrsta proteinskih krmiva u obroku krava (dva krmiva) - pojedinoj kravi u pokusu dodjeljuje se jedna od 6 kombinacija krmivo x količina. - 3 × 2 faktorijalni pokus, tj. tri razine prvog faktora i 2 razine drugog faktora

Upotreba:

- kada malo znamo o faktorima - potrebno je istražiti sve moguće kombinacije da se vidi koja od njih je najpovoljnija - također je moguće istražiti interakcije između faktora, tj. da li je razlika između razina jednog faktora ista ili različita u razinama drugih faktora.

Pokusni plan: - potpuno slučajni - kombinacije razina faktora se slučajno dodjeljuju pokusnim jedinicama

Pretpostavimo dva faktora A i B - faktor A => a razina - faktor B => b razina - broj pokusnih jedinica po svakoj kombinaciji = n - ukupno ima nab pokusnih jedinica podijeljenih u ab grupa (kombinacija faktora A i B) - skup tretmana se sastoji od ab mogućih kombinacija razina faktora

Model faktorijalnog pokusa je:

yijk = µ + Ai + Bj +(AB)ij + εijk

yijk = k-to opažanje za razinu i faktora A i razinu j faktora B µ = ukupni prosjek Ai = fiksni utjecaj razine i faktora A Bj = fiksni utjecaj razine j faktora B (AB)ij = fiksni utjecaj interakcije razine ij faktora A i B εijk - neprotumačeni utjecaj, slučajan sa N(0, σ2) Primjer: dva faktora A i B i obadva imaju dvije razine

- 2 × 2 faktorijalni plan

Page 89: Biometrika i Planiranje Istrazivanja 2010

86

Kombinacije razine faktora A i B

Faktor B Faktor A B1 B2 A1 A1B1 A1B2 A2 A2B1 A2B2 Ukupno ima četiri kombinacije razina faktora Shema faktorijalnog plana sa mjerenjima yijk A1 A2

B1 B2 B1 B2 y111 y121 y211 y221 y112 y122 y212 y222 ... ... ... ... y11n y12n y21n y22n

Sume kvadrata: SSUKUP = SSA + SSB+ SSAB+ SSOST stupnjevi slobode (abn–1) = (a–1) + (b–1) + (a–1)(b–1) + ab(n–1) Sume kvadrata:

∑ ∑ ∑ −= i j k ijkUKUP yySS 2...)(

∑∑ ∑ ∑ −=−= i ii j k iA yybnyySS 22 ...)..(...)..(

∑∑∑ ∑ −=−=i ji j k jB yyanyySS 22 ...)..(...)..(

BAi j ijAB SSSSyynSS −−−= ∑ ∑ 2...).(

∑ ∑ ∑ −=i j k ijijkOST yySS 2.)(

∑ ∑ ∑ −=i j k ijijkOST yySS 2.)(

Sume kvadrata se mogu izračunati i kratkim načinom:

1) Ukupna suma = Σi Σj Σk yijk = y... 2) Korekcijski faktor za srednju vrijednost:

( ) ( )opazanja broj ukupni

sumaukupna 22

==∑ ∑ ∑

abn

yC i j k ij

3) SSUKUP = Σi Σj Σk (yijk)2 – C

4) ( )

Cnb

ySS

i

j k ijk

A −= ∑∑ ∑ 2

Page 90: Biometrika i Planiranje Istrazivanja 2010

87

5) ( )

Cna

ySS

ji k ijk

B −= ∑ ∑ ∑ 2

6) ( )

CSSSSn

ySS BAi j

k ijkAB −−−= ∑∑ ∑ 2

7) SSOST = SSUKUP – SSA – SSB – SSAB Prosjeci kvadrata

MSA = SSA/ (a–1) MSB = SSB/ (b–1) MSAB = SSAB/ (a–1)(b–1) MSOST = SSOST/[ab(n–1)]

ANOVA tablica Izvor SS df MS=SS/df F

A SSA a–1 MSA MSA/MSOST (2)

B SSB b–1 MSB MSB/MSOST (3)

AB SSAB (a–1)(b–1) MSAB MSAB/MSOST (1)

Ostatak SSOST ab(n–1) MSE

Ukupno SSUKUP abn–1

(1) F-provjera za interakciju (2) F-provjera za faktor A (ukoliko nema interakcije) (3) F-provjera za faktor B (ukoliko nema interakcije) Ukoliko je interakcija značajna provjera za glavne utjecaje nema smisla.

A1A1

A2

A2

0.400.450.500.550.600.650.700.75

B1 B2

Razine faktora B

Prira

st (k

g)

Slika 12-1: Prikaz interakcije 2 × 2 faktorijalnog pokusa.

Page 91: Biometrika i Planiranje Istrazivanja 2010

88

12.1 SAS primjer za faktorijalni pokus

Primjer: Istraživan je utjecaj dodavanja dva vitamina (I i II) u krmivo na prosječni dnevni prirast kod svinja. Primijenjeni su dvije razine vitamina I (0 i 40 mg) i dvije razine vitamina II (0 i 5 mg). Izabrano je 20 životinja. Na njih su slučajnim izborom primijenjene 4 kombinacije vitamina I i II. Izmjereni su slijedeći dnevni prirasti:

Vitamin I 0 mg 4mg Vitamin II 0 mg 5 mg 0 mg 5 mg 0.585 0.567 0.473 0.684 0.536 0.545 0.450 0.702 0.458 0.589 0.869 0.900 0.486 0.536 0.473 0.698 0.536 0.549 0.464 0.693

SAS program: DATA prirast; INPUT vitI vitII prirast @@; DATALINES; 1 1 0.585 2 1 0.473 1 1 0.536 2 1 0.450 1 1 0.458 2 1 0.869 1 1 0.486 2 1 0.473 1 1 0.536 2 1 0.464 1 2 0.567 2 2 0.684 1 2 0.545 2 2 0.702 1 2 0.589 2 2 0.900 1 2 0.536 2 2 0.698 1 2 0.549 2 2 0.693 ; PROC GLM; CLASS vitI vitII; MODEL prirast= vitI vitII vitI*vitII; LSMEANS vitI*vitII / STDERR PDIFF ADJUST=TUKEY; RUN; QUIT;

SAS ispis:

Dependent Variable: prirast Sum of Mean Source DF Squares Square F Value Pr > F Model 3 0.14521095 0.04840365 4.39 0.0196 Error 16 0.17648360 0.01103023 Corrected Total 19 0.32169455 R-Square Coeff Var Root MSE prirast Mean 0.451394 17.81139 0.10502 0.58965 Source DF Type III SS Mean Square F Value Pr > F vitI 1 0.05191805 0.05191805 4.71 0.0454 vitII 1 0.06418445 0.06418445 5.82 0.0282 vitI*vitII 1 0.02910845 0.02910845 2.64 0.1238 Least Squares Means

Page 92: Biometrika i Planiranje Istrazivanja 2010

89

Adjustment for multiple comparisons: Tukey vit vit Standard LSMEAN I II prirast LSMEAN Error Pr > |t| Number 1 1 0.52020000 0.04696855 0.0001 1 1 2 0.55720000 0.04696855 0.0001 2 2 1 0.54580000 0.04696855 0.0001 3 2 2 0.73540000 0.04696855 0.0001 4 Least Squares Means for effect vitI*vitII Pr > |t| for H0: LSMean(i)=LSMean(j) Dependent Variable: prirast i/j 1 2 3 4 1 0.9433 0.9799 0.0238 2 0.9433 0.9981 0.0701 3 0.9799 0.9981 0.0506 4 0.0238 0.0701 0.0506

Page 93: Biometrika i Planiranje Istrazivanja 2010

90

13 Hijerarhijski pokusni planovi

- Uzorci se biraju u dva ili više koraka. - dvo-, tro- ili više hijerarhijski planovi Primjer :

- 3 razine faktora A - 3 razine faktora B unutar razina faktora A - slučajni uzorak unutar razina B

A 1 2 3

6 744 84 4

6 744 844

6 744 844

B 1 2 3 4 5 6 7 8 9 y111 y121 y131 y141 y151 y161 y171 y181 y191 y112 y122 y132 y142 y152 y162 y172 y182 y192 y11n y12n y13n y14n y15n y16n y17n y18n y19n Statistički model:

yijk = µ + Ai + B(A)ij + εijk i = 1,....,a; j = 1,....,b; n = 1,......,n

yijk = k-to opažanje za razinu i faktora A i razinu j faktora B µ = ukupni prosjek korigiran na sve utjecaje, Ai = utjecaj i razine faktora A B(A)ij = utjecaj razine j faktora B unutar razine i faktora A εijk - ostatak, slučajni N(0, σ2) - razine faktora B nezavisne između različitih razina faktora A. Sume kvadrata: SSUKUP = SSA + SSB(A) + SSUnutar B stupnjevi slobode: (abn–1) = (a–1) + (b–1) + a(b–1) + ab(n–1) Sume kvadrata definirane su kao:

∑ ∑ ∑ −=i j k ijkUKUP yySS 2...)(

∑∑ ∑ ∑ −=−=i ii j k iA yybnyySS 22 ...)..(...)..(

∑ ∑∑ ∑ ∑ −=−=i j iiji j k iijAB yynyySS 22

)( ..).(..).(

∑∑ ∑ −=i j k ijijkBUNUTAR yySS 2

.)(

Page 94: Biometrika i Planiranje Istrazivanja 2010

91

Skraćeni način računanja:

1) Ukupna suma: Σi Σj Σk yijk 2) Korekcijski faktor za srednju vrijednost:

( ) ( )opazanja broj ukupni

sumaukupna 22

==∑ ∑ ∑

abn

yC i j k ij

3) SSUKUP = Σi Σj Σk (yijk)2 – C

4) ( )

Cnb

ySS

i

j k ijk

A −= ∑∑ ∑ 2

5) ( )

CSSn

ySS Ai j

k ijkAB −−= ∑∑ ∑ 2

)(

6) SSUnutar B = SSUKUP – SSA – SSB(A) ANOVA tablica: Izvor SS df MS=SS/df A SSA a–1 MSA B unutar A SSB(A) a(b–1) MSB(A) Unutar B SSUnutar B ab(n–1) MSUnutar B Ukupno SSUKUP abn–1 Utjecaj 'Unutar B' je neprotumačeni utjecaj ili ostatak. Očekivanja prosjeka kvadrata (E(MS)) ovise da li su utjecaji A i B fiksni ili slučajni: E(MS) (A fix i B fix) (A fix i B sluč.) (A sluč. i B sluč.) E(MSA) E(MSB(A)) E(MSUntr B)

σ2 + Q(A) σ2 + Q(B(A)) σ2

σ2 + n σ2B + Q(A)

σ2 + n σ2B

σ2

σ2 + n σ2B + nb σ2

A σ2 + n σ2

B σ2

n = broj razina unutar B Q = neki fiksni, izračunati broj Definicija pokusne greške, a time i F provjera ovisi da li su utjecaji (faktori) fiksni ili slučajni. Najčešće je B slučajan:

- pokusna greška za provjeru utjecaja A je: MSB(A) - pokusna greška za utjecaj B je: MSUnutar B.

F-statistika za utjecaj A:

)( AB

A

MSMS

F =

F-statistika za utjecaj B:

UnutarB

AB

MSMS

F )(=

Page 95: Biometrika i Planiranje Istrazivanja 2010

92

13.1 SAS primjer za hijerarhijski plan

Primjer: Cilj pokusa je bio utvrditi utjecaj majki i očeva na varijabilnost porodne težine prasadi. Upotrijebljen je hijerarhijski plan: Slučajno je izabrano 4 nerasta, po svakom nerastu dvije krmače i po svakoj krmači dva praseta. Podaci, zajedno sa sumama i kvadratima po nerastovima i krmačama, prikazani su u slijedećoj tablici: Nerast Krmača Prase Težina 1 1 1 1.2 1 1 2 1.2 1 2 3 1.2 1 2 4 1.3 1 3 5 1.1 1 3 6 1.2 2 4 7 1.2 2 4 8 1.2 2 5 9 1.1 2 5 10 1.2 2 6 11 1.2 2 6 12 1.1 3 7 13 1.2 3 7 14 1.2 3 8 15 1.3 3 8 16 1.3 3 9 17 1.2 3 9 18 1.2 4 10 19 1.3 4 10 20 1.3 4 11 21 1.4 4 11 22 1.4 4 12 23 1.3 4 12 24 1.3

SAS program za MIXED proceduru: DATA pig; INPUT boar sow piglet por_tezina @@; DATALINES; 1 1 1 1.2 1 1 2 1.2 1 2 1 1.2 1 2 2 1.3 1 3 1 1.1 1 3 2 1.2 2 1 1 1.2 2 1 2 1.2 2 2 1 1.1 2 2 2 1.2 2 3 1 1.2 2 3 2 1.1 3 1 1 1.2 3 1 2 1.2 3 2 1 1.3 3 2 2 1.3 3 3 1 1.2 3 3 2 1.2 4 1 1 1.3 4 1 2 1.3 4 2 1 1.4 4 2 2 1.4 4 3 1 1.3 4 3 2 1.3 ; PROC MIXED DATA=pig METHOD = TYPE3; CLASS boar sow; MODEL por_tezina = / DDFM = KENWARDROGER; RANDOM boar sow(boar)/S; RUN;

Page 96: Biometrika i Planiranje Istrazivanja 2010

93

SAS ispis MIXED procedure Type 3 Analysis of Variance Sum of Source DF Squares Mean Square Expected Mean Square boar 3 0.093333 0.031111 Var(Residual)+2Var(sow(boar))+6Var(boar) sow(boar) 8 0.040000 0.005000 Var(Residual)+2Var(sow(boar)) Residual 12 0.020000 0.001667 Var(Residual) Error Source Error Term DF F Value Pr > F boar MS(sow(boar)) 8 6.22 0.0174 sow(boar) MS(Residual) 12 3.00 0.0424 Residual . . . .

Covariance Parameter Estimates Cov Parm Estimate boar 0.004352 sow(boar) 0.001667 Residual 0.001667 Solution for Random Effects Std Err Effect boar sow Estimate Pred DF t Value Pr > |t| boar 1 -0.02798 0.04239 3.96 -0.66 0.5456 boar 2 -0.05595 0.04239 3.96 -1.32 0.2579 boar 3 3.26E-15 0.04239 3.96 0.00 1.0000 boar 4 0.08393 0.04239 3.96 1.98 0.1195 sow(boar) 1 1 -0.00357 0.03390 7.87 -0.11 0.9187 sow(boar) 1 2 0.02976 0.03390 7.87 0.88 0.4060 sow(boar) 1 3 -0.03690 0.03390 7.87 -1.09 0.3085 sow(boar) 2 1 0.01508 0.03390 7.87 0.44 0.6684 sow(boar) 2 2 -0.01825 0.03390 7.87 -0.54 0.6051 sow(boar) 2 3 -0.01825 0.03390 7.87 -0.54 0.6051 sow(boar) 3 1 -0.02222 0.03390 7.87 -0.66 0.5308 sow(boar) 3 2 0.04444 0.03390 7.87 1.31 0.2268 sow(boar) 3 3 -0.02222 0.03390 7.87 -0.66 0.5308 sow(boar) 4 1 -0.01151 0.03390 7.87 -0.34 0.7431 sow(boar) 4 2 0.05516 0.03390 7.87 1.63 0.1430 sow(boar) 4 3 -0.01151 0.03390 7.87 -0.34 0.7431

Page 97: Biometrika i Planiranje Istrazivanja 2010

94

14 Pokusni planovi sa kavezima i pregonima

Pojedinačni tretman životinja: Blok

I II T2 T1

T1 T2

T1 T2

T1 T2

4 životinja po svakom bloku i na njih slučajno primijenimo 2 tretmana. ANOVA tablica: Izvor Stupnjevi slobode Blok (b–1) = 1 Tretman (a–1) = 1 Blok x tretman (b–1)(a–1) = 1 Ostatak (Greška) ab(n–1)= 4 Ukupno (abn–1)= 7 Često je nemoguće životinje tretirati pojedinačno cijeli kavez (boks, pregon) je pokusna jedinica. Blok

I II T1 T1

T2 T2

T2 T2

T1 T1

2 životinje u svakom kavezu po 2 kaveza u bloku na svaki kavez u bloku je slučajno primijenjen tretman ANOVA tablica: Izvor Stupnjevi slobode Blok (b–1) = 1 Tretman (a–1) = 1 Pokusna greška = Blok × tretman (b–1)(a–1) = 1 Ostatak ab(n–1)= 4 Ukupno (abn–1)= 7 Pokusna greška za tretman ovdje je jednaka interakciji blok × tretman

Page 98: Biometrika i Planiranje Istrazivanja 2010

95

pokusna jedinica je kavez (kombinacija blok × tretman) Interakcija blok × tretman provjerava se ostatkom Linearni model takvog plana je: yijk = µ + τi + βj + δij + εijk i = 1,......,a; a = broj tretmana j = 1,......,b; b = broj blokova k = 1,.....,n; n = broj ponavljanja Gdje su: yijk = opažanje k za tretman i u bloku j µ, = ukupni prosjek τi = fiksni utjecaj tretmana i βj = fiksni utjecaj bloka j δij = slučajna greška između pokusnih jedinica za provjeru tretmana s prosjekom 0 i varijancom σ2

δ, (interakcija tretman x blok) εij = slučajna greška unutar pokusne jedinice s prosjekom 0 i varijancom σ2 Hipoteze: H0: τ1 = τ2 =... = τa , nema utjecaja tretmana H1: τi ≠ τi’ za barem jedan par (i,i’), razlika između tretmana postoji Očekivanja od MS: E(MSpok gr) σ2 + n σ2

δ E(MSOST) σ2

Page 99: Biometrika i Planiranje Istrazivanja 2010

96

15 Dvostruki blokovi

Primjer: 3 tretmana, 2 spol, 4 bloka prema početnoj težini (8 blokova, 4 bloka unutar spola) Ukupno trebamo 3×2×4=24 životinje. Moguća shema plana pokusa:

Muški Ženke Blok I

T1 T2 T3

Blok II T2 T1 T3

Blok V T3 T2 T1

Blok VI T1 T2 T3

Blok III T1 T3 T2

Blok IV T2 T1 T3

Blok VII T2 T1 T3

Blok VIII T3 T2 T1

broj spolova, s = 2, broj blokova unutar spola: b = 4, broj tretmana: a = 3. Izvor Stupnjevi slobode Blok (2b–1) = 7 Spol (s–1) = 1 Blok unutar spola s(b–1) = 6 Tretman (a–1) = 2 Blok x tretman (2b–1)(a–1) = 14 Spol x tretman (s–1)(a–1) = 2 Ostatak s(b–1)(a–1) = 12 Ukupno (abs–1) = 23 Pokusni plan i statistički model ovisi da li se neki utjecaj definira kao blok ili tretman

Page 100: Biometrika i Planiranje Istrazivanja 2010

97

Primjer: 3 tretmana (a = 3) 2 pasmine (p = 2) 4 Bloka (broj laktacije, b = 4) Pokusni plan 1): Pasmina kao blok - zanima nas najveća preciznost provjere utjecaja tretmana

Pasmina A

Pasmina B

Lakt. I T1 T2 T3

Lakt. II T2 T1 T3

Lakt. I T3 T2 T1

Lakt. II T1 T2 T3

Lakt. III T1 T3 T2

Lakt. IV T2 T1 T3

Lakt. III T2 T1 T3

Lakt. IV T3 T2 T1

ANOVA tablica je: Izvor Stupnjevi slobode Pasmina (p–1)= 1 Laktacija unutar pasmine p(b–1)= 6 Tretman (a–1)= 2 Pasmina × tretman (p–1)(a–1)= 2 Ostatak p(b–1)(a–1)= 2 Ukupno (abp–1)= 23 Pokusni plan 2): Pasmina kao tretman faktorijalni plan (2 × 3), postavljenih u slučajni blok plan (laktacije) preciznija provjera utjecaja pasmine i pasmina × tretman

Lakt. I Lakt. II Lakt. III Lakt. IV

A T1 B T2 B T3 A T2 B T1 A T3

B T3 A T2 A T1 A T1 B T2 A T3

A T1 B T3 B T2 A T2 B T1 A T3

A T2 A T1 B T3 A T3 B T2 B T1

A i B su pasmine

Page 101: Biometrika i Planiranje Istrazivanja 2010

98

ANOVA tablica: Izvor Stupnjevi slobode Laktacija (b–1)= 3 Pasmine (p–1)= 1 Tretman (a–1)= 2 Pasmina × tretman (p–1)(a–1)= 2 Ostatak (b–1)[(p–1)+(a–1)+(p–1)(a–1)] = 15 Ukupno (abp–1)= 23 Pokusni plan 3): a) grupiramo prema laktaciji u četiri bloka;. b) blokove podijelimo u dva boksa i u svaki od njih slučajno rasporedimo jednu pasminu; c) na svaku pasminu unutar bloka primijenimo slučajno tretmane. Split plot plan - Dvije ‘vrste’ pokusnih jedinica:

- pasmina unutar laktacije - tretman unutar pasmine unutar laktacije

- Dvije različite pokusne greške Lakt. I Lakt. II

Pasmina A T1 T2 T3

Pasmina B T2 T1 T3

Pasmina B T3 T2 T1

Pasmina A T1 T2 T3

Lakt. III Lakt. IV

Pasmina B T1 T3 T2

Pasmina A T2 T1 T3

Pasmina A T2 T1 T3

Pasmina B T3 T2 T1

ANOVA tablica: Izvor Stupnjevi slobode Laktacija (b–1)= 3 Pasmine (p–1)= 1 Greška a (Laktacija × Pasmina) (b–1)(p–1)= 3 Glavni plot (b–1)+(p–1)+(b–1)(p–1) = 7 Tretman (a–1) = 2 Pasmina × tretman (p–1)(a–1) = 2 Greška b p(a–1)(b–1) = 12 Ukupno (abp–1) = 23 Izbor plana ovisi o: - mogućnosti smještaja - željenoj preciznosti pokusa za pojedine faktore

Page 102: Biometrika i Planiranje Istrazivanja 2010

99

Redoslijed preciznosti pokusa za pojedine faktore: Plan 1 Plan 2 Plan 3 Tretman 1 3 2 Pasmina 3 1 2 Pasmina × Trtetman 3 1 1

Page 103: Biometrika i Planiranje Istrazivanja 2010

100

16 Split plot pokusni plan

Značajke: - pokusni materijal podjeli u više glavnih jedinica (plotovi) na koje se apliciraju razine nekog faktora, a zatim se cijele jedinice podijele u podjedinice (split plotovi) na koje se primjenjuju razine drugog faktora - plan može uključiti jedan ili više potpuno slučajni, slučajni blok plan ili latinski kvadrat koji se primjenjuju na jedinice ili podjedinice - tretmani se dodjeljuju slučajno u dvije stepenice: 1. razine faktora A slučajno na glavne jedinice (plotove) 2. razine faktora B se slučajno na svaku podjedinicu (subplotove)

Split plot plan se može koristiti: 1. kada jedan faktor zahtjeva više pokusnog materijala nego neki drugi faktor. - u poljskim ili laboratorijskim pokusima. - pripreme zemlje (A) varijetet (B) 2. Kada se jedan faktor primjenjuje kasnije. Taj faktor se primjenjuje na subjedinice (faktor B). 3. Varijabilnost između cijelih jedinica se očekuje da će biti veća nego ona između subjedinica. 4. Ako je veća preciznost potrebna za jedan od faktora. Taj faktor se primjenjuje na subjedinice

(faktor B).

16.1 Faktor A (glavni faktor) kao slučajni blok plan

Blok 1 Blok 2 Blok 3

B2 B2 B1 B2 B1 B2 B1 B1 B2 B1 B2 B1

B1 B1 B2 B1 B2 B1 B2 B2 B1 B2 B1 B2

A4 A1 A2 A3 A2 A1 A4 A3 A1 A2 A4 A3

Model:

yijk = µ + Blokk + Ai + δik + Bj +(AB)ij + εijk i = 1,....,a; j = 1,....,b ; k = 1,......,n

yijk = k-to opažanje za razinu i faktora A i razinu j faktora B µ = ukupni prosjek korigiran na sve utjecaje Blokk = utjecaj bloka Ai = utjecaj faktora A Bj = utjecaj faktora B (AB)ij = utjecaj interakcije A × B

Page 104: Biometrika i Planiranje Istrazivanja 2010

101

δik = cijeli plot greška N(0, σ2t) = interakcija Blokk × Ai

εijk = split plot greška N(0, σ2) Također je µij = Ai + Bj +(AB)ij = prosjek ij-te A x B kombinacije. a = broj razina tretmana A b = broj razina tretmana B n = broj blokova (ponavljanja) Cijeli plot greška i split plot greška su nezavisni. Primjer:

a = 4, b = 2, n = 3 ANOVA tablica Izvor Stupnjevi slobode Blok (n–1) = 2 Tretmani A (a–1) = 3 Cijeli plot greška

(n–1)(a–1) = 6

Tretmani B (b–1) = 1 A x B (a–1)(b–1)= 3 Split plot greška a(b–1)(n–1) = 8 Ukupno (abn–1)= 23 F provjera za faktor A:

geskaplot CijeliMSMSF A=

Cijeli plot pokusna greška je prosjek kvadrata za interakcija blok × A. F-provjera za faktor B:

greskaplot Split MSMSF B=

Split plot greška je prosjek kvadrata ostatka. F-provjera za interakciju A × B:

greskaplot Split MSMSF AxB=

16.1.1 SAS Primjer: Split plot plan, glavne jedinice kao slučajni blokovi

SAS program za primjer s utjecajem četiri tretmana na pašnjacima i dva dodatka minerala na mliječnost krava je slijedeći. Načini tretiranja pašnjaka primijenjeni su na glavne jedinice kao slučajni blok plan.

Page 105: Biometrika i Planiranje Istrazivanja 2010

102

SAS program: DATA spltblk; INPUT blok past min milk @@; DATALINES; 1 4 2 30 1 4 1 29 1 1 2 27 1 1 1 25 1 2 1 26 1 2 2 28 1 3 2 26 1 3 1 24 2 2 1 32 2 2 2 37 2 1 2 30 2 1 1 31 2 4 1 34 2 4 2 37 2 3 1 33 2 3 2 32 3 1 2 34 3 1 1 31 3 2 1 30 3 2 2 31 3 4 2 36 3 4 1 38 3 3 1 33 3 3 2 32 ; PROC MIXED DATA = spltblk; CLASS blok past min; MODEL milk =past min past*min / DDFM = KENWARDROGER; RANDOM blok blok*past/; LSMEANS past min past*min / DIFF ADJUST=TUKEY ; RUN;

SAS ispis: Covariance Parameter Estimates

Cov Parm Estimate blok 12.7431 blok*past 1.0486 Residual 2.2500

Type 3 Tests of Fixed Effects

Num Den Effect DF DF F Value Pr > F past 3 6 5.46 0.0377 min 1 8 3.63 0.0932 past*min 3 8 0.86 0.4981 Least Squares Means Standard Effect past min Estimate Error DF t Value Pr > |t| past 1 29.6667 2.2298 2.51 13.30 0.0022 past 2 30.6667 2.2298 2.51 13.75 0.0020 past 3 30.0000 2.2298 2.51 13.45 0.0021 past 4 34.0000 2.2298 2.51 15.25 0.0015 min 1 30.5000 2.1266 2.09 14.34 0.0041 min 2 31.6667 2.1266 2.09 14.89 0.0038 past*min 1 1 29.0000 2.3124 2.9 12.54 0.0013 past*min 1 2 30.3333 2.3124 2.9 13.12 0.0011 past*min 2 1 29.3333 2.3124 2.9 12.69 0.0013 past*min 2 2 32.0000 2.3124 2.9 13.84 0.0010 past*min 3 1 30.0000 2.3124 2.9 12.97 0.0012 past*min 3 2 30.0000 2.3124 2.9 12.97 0.0012 past*min 4 1 33.6667 2.3124 2.9 14.56 0.0008 past*min 4 2 34.3333 2.3124 2.9 14.85 0.0008

Page 106: Biometrika i Planiranje Istrazivanja 2010

103

Differences of Least Squares Means Standard Effect past min _past _min Estimate Error DF t Value Pr>|t| Adjust Adj P past 1 2 -1.0000 1.2038 6 -0.83 0.4379 Tuk-Kr 0.8385 past 1 3 -0.3333 1.2038 6 -0.28 0.7911 Tuk-Kr 0.9918 past 1 4 -4.3333 1.2038 6 -3.60 0.0114 Tuk-Kr 0.0427 past 2 3 0.6667 1.2038 6 0.55 0.5997 Tuk-Kr 0.9421 past 2 4 -3.3333 1.2038 6 -2.77 0.0325 Tuk-Kr 0.1135 past 3 4 -4.0000 1.2038 6 -3.32 0.0159 Tuk-Kr 0.0587 min 1 2 -1.1667 0.6124 8 -1.91 0.0932 Tuk-Kr 0.0932 past*min 1 1 1 2 -1.3333 1.2247 8 -1.09 0.3080 Tuk-Kr 0.9425 past*min 1 1 2 1 -0.3333 1.4829 11.5 -0.22 0.8261 Tuk-Kr 1.0000 past*min 1 1 2 2 -3.0000 1.4829 11.5 -2.02 0.0669 Tuk-Kr 0.5207 past*min 1 1 3 1 -1.0000 1.4829 11.5 -0.67 0.5134 Tuk-Kr 0.9955 past*min 1 1 3 2 -1.0000 1.4829 11.5 0.67 0.5134 Tuk-Kr 0.9955 past*min 1 1 4 1 -4.6667 1.4829 11.5 -3.15 0.0088 Tuk-Kr 0.1407 past*min 1 1 4 2 -5.3333 1.4829 11.5 -3.60 0.0039 Tuk-Kr 0.0792 past*min 1 2 2 1 1.0000 1.4829 11.5 0.67 0.5134 Tuk-Kr 0.9955 ... ... past*min 3 1 3 2 -222E-18 1.2247 8 -0.00 1.0000 Tuk-Kr 1.0000 past*min 3 1 4 1 -3.6667 1.4829 11.5 -2.47 0.0301 Tuk-Kr 0.3217 past*min 3 1 4 2 -4.3333 1.4829 11.5 -2.92 0.0133 Tuk-Kr 0.1868 past*min 3 2 4 1 -3.6667 1.4829 11.5 -2.47 0.0301 Tuk-Kr 0.3217 past*min 3 2 4 2 -4.3333 1.4829 11.5 -2.92 0.0133 Tuk-Kr 0.1868 past*min 4 1 4 2 -0.6667 1.2247 8 -0.54 0.6011 Tuk-Kr 0.9988

16.2 Faktor A (glavni faktor) kao potpuno slučajni plan

B2 B2 B1 B2 B1 B2 B1 B1

B1 B1 B2 B1 B2 B1 B2 B2

A4 A1 A2 A3 A2 A1 A4 A3

Model:

yijk = µ + Ai + δik + Bj +(AB)ij + εijk i = 1,....,a; j = 1,....,b ; k = 1,......,n

ANOVA tablica Izvor Stupnjevi slobode Tretman A (a–1) = 3 Cijeli plot greška

a(n–1) = 8

Tretman B (b–1) = 1 A × B (a–1)(b–1)= 3 Split plot greška a(b–1)(n–1) = 8 Ukupno (abn–1)= 23

Page 107: Biometrika i Planiranje Istrazivanja 2010

104

F provjera za A:

geskaplot CijeliMSMS

F A=

Cijeli plot pokusna greška je prosjek kvadrata između plotova. F-provjera za B:

greskaplot Split MSMS

F B=

Split plot greška je prosjek kvadrata ostatka. F-provjera za interakciju A × B:

greskaplot Split MSMS

F AxB=

16.2.1 SAS primjer: Glavne jedinice u potpuno slučajnom planu

SAS program za primjer s utjecajem četiri tretmana na pašnjacima i dva dodatka minerala na mliječnost krava kada su tretmani pašnjaka primijenjeni na glavne jedinice kao potpuno slučajni plan. SAS program: DATA splt; INPUT plot pas min milk @@; DATALINES; 1 4 2 30 1 4 1 29 2 1 2 27 2 1 1 25 3 2 1 26 3 2 2 28 4 3 2 26 4 3 1 24 5 2 1 32 5 2 2 37 6 1 2 30 6 1 1 31 7 4 1 34 7 4 2 37 8 3 1 33 8 3 2 32 9 1 2 34 9 1 1 31 10 2 1 30 10 2 2 31 11 4 2 36 11 4 1 38 12 3 1 33 12 3 2 32 ; PROC MIXED DATA = splt; CLASS plot pas min; MODEL milk =pas min pas*min / DDFM = KENWARDROGER; RANDOM plot(pas) /; LSMEANS pas min pas*min / DIFF ADJUST=TUKEY ; RUN;

SAS ispis: Covariance Parameter Estimates Cov Parm Estimate plot(pas) 13.7917 Residual 2.2500 Type 3 Tests of Fixed Effects Num Den Effect DF DF F Value Pr > F pas 3 8 0.80 0.5302 min 1 8 3.63 0.0932 pas*min 3 8 0.86 0.4981

Page 108: Biometrika i Planiranje Istrazivanja 2010

105

Least Squares Means Standard Effect pas min Estimate Error DF t Value Pr > |t| pas 1 29.6667 2.2298 8 13.30 <.0001 pas 2 30.6667 2.2298 8 13.75 <.0001 pas 3 30.0000 2.2298 8 13.45 <.0001 pas 4 34.0000 2.2298 8 15.25 <.0001 min 1 30.5000 1.1562 9.2 26.38 <.0001 min 2 31.6667 1.1562 9.2 27.39 <.0001 pas*min 1 1 29.0000 2.3124 9.2 12.54 <.0001 pas*min 1 2 30.3333 2.3124 9.2 13.12 <.0001 pas*min 2 1 29.3333 2.3124 9.2 12.69 <.0001 pas*min 2 2 32.0000 2.3124 9.2 13.84 <.0001 pas*min 3 1 30.0000 2.3124 9.2 12.97 <.0001 pas*min 3 2 30.0000 2.3124 9.2 12.97 <.0001 pas*min 4 1 33.6667 2.3124 9.2 14.56 <.0001 pas*min 4 2 34.3333 2.3124 9.2 14.85 <.0001 Differences of Least Squares Means Stand Effect past min _pas _min Estimate Error DF t Pr>|t| Adj Adj P pas 1 2 -1.0000 3.1535 8 -0.32 0.7593 Tuk-Kr 0.9881 pas 1 3 -0.3333 3.1535 8 -0.11 0.9184 Tuk-Kr 0.9995 pas 1 4 -4.3333 3.1535 8 -1.37 0.2067 Tuk-Kr 0.5469 pas 2 3 0.6667 3.1535 8 0.21 0.8379 Tuk-Kr 0.9964 pas 2 4 -3.3333 3.1535 8 -1.06 0.3214 Tuk-Kr 0.7231 pas 3 4 -4.0000 3.1535 8 -1.27 0.2403 Tuk-Kr 0.6053 min 1 2 -1.1667 0.6124 8 -1.91 0.0932 Tuk-Kr 0.0932

Page 109: Biometrika i Planiranje Istrazivanja 2010

106

17 Analiza kovarijance

Karakteristike: - kategoričke + numeričke nezavisne varijable - numerička varijabla = kovarijabla (kovarijanta) Analiza kovarijance se koristi za: - kontrolu pokusne greške i povećanja preciznosti - korigiranje prosjeka tretmana na temelju nezavisne varijable - procjena izgubljenih podataka - procjena razlika nagiba krivulja između tretmana

17.1 Potpuno slučajni pokusni plan sa kovarijablom

- Za korigiranje prosjeka tretmana - Kontrola pokusne greške - Povećanje preciznosti Model: yij = β0 + β1xij + τi + εij i = 1,.....,a j = 1,...,n Gdje su: yij = Opažanje jedinice j u grupi i (tretmanu i) β0 = odsječak na y osi β1 = regresijski koeficijent xij = kontinuirana nezavisna varijabla sa prosjekom µx τi = fiksni utjecaj grupe ili tretmana i εij = slučajna greška Ukupni prosjek: µ = β0 + β1µx , Prosjek grupe i: µi = β0 + β1µx + τi . µx = prosjek kovarijable x. Pretpostavke su slijedeće: 1) kovarijabla je fiksna i nezavisna od tretmana 2) greške su nezavisne jedna od druge 3) greška ima normalnu raspodjelu sa prosjekom 0 i homogenom varijancom.

Page 110: Biometrika i Planiranje Istrazivanja 2010

107

Površina ispod standardne normalne krivulje (z > zα)

α

zα 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641 0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247 0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859 0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483 0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121

0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776 0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451 0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148 0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867 0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611

1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379 1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170 1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985 1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823 1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681

1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559 1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455 1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367 1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294 1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233

2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183 2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143 2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110 2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084 2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064

2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048 2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036 2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026 2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019 2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014

3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010 3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007 3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005 3.3 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003 3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002

Page 111: Biometrika i Planiranje Istrazivanja 2010

108

Kritične vrijednosti studentove t-raspodjele (t > tα)

α

Stupnjevi slobode t0.1 t0.05 t0.025 t0.01 t0.005 t0.001

1 3.078 6.314 12.706 31.821 63.656 318.289 2 1.886 2.920 4.303 6.965 9.925 22.328 3 1.638 2.353 3.182 4.541 5.841 10.214 4 1.533 2.132 2.776 3.747 4.604 7.173 5 1.476 2.015 2.571 3.365 4.032 5.894

6 1.440 1.943 2.447 3.143 3.707 5.208 7 1.415 1.895 2.365 2.998 3.499 4.785 8 1.397 1.860 2.306 2.896 3.355 4.501 9 1.383 1.833 2.262 2.821 3.250 4.297 10 1.372 1.812 2.228 2.764 3.169 4.144

11 1.363 1.796 2.201 2.718 3.106 4.025 12 1.356 1.782 2.179 2.681 3.055 3.930 13 1.350 1.771 2.160 2.650 3.012 3.852 14 1.345 1.761 2.145 2.624 2.977 3.787 15 1.341 1.753 2.131 2.602 2.947 3.733

16 1.337 1.746 2.120 2.583 2.921 3.686 17 1.333 1.740 2.110 2.567 2.898 3.646 18 1.330 1.734 2.101 2.552 2.878 3.610 19 1.328 1.729 2.093 2.539 2.861 3.579 20 1.325 1.725 2.086 2.528 2.845 3.552

21 1.323 1.721 2.080 2.518 2.831 3.527 22 1.321 1.717 2.074 2.508 2.819 3.505 23 1.319 1.714 2.069 2.500 2.807 3.485 24 1.318 1.711 2.064 2.492 2.797 3.467 25 1.316 1.708 2.060 2.485 2.787 3.450

26 1.315 1.706 2.056 2.479 2.779 3.435 27 1.314 1.703 2.052 2.473 2.771 3.421 28 1.313 1.701 2.048 2.467 2.763 3.408 29 1.311 1.699 2.045 2.462 2.756 3.396 30 1.310 1.697 2.042 2.457 2.750 3.385

40 1.303 1.684 2.021 2.423 2.704 3.307 50 1.299 1.676 2.009 2.403 2.678 3.261 60 1.296 1.671 2.000 2.390 2.660 3.232 120 1.289 1.658 1.980 2.358 2.617 3.160 ∝ 1.282 1.645 1.960 2.326 2.576 3.090

Page 112: Biometrika i Planiranje Istrazivanja 2010

109

Kritične vrijednosti hi-kvadrat raspodjele, χ2 > χ2α,

χα

α

Stupnjevi slobode χ2

0.1 χ20.05 χ2

0.025 χ20.01 χ2

0.005 χ20.001

0.1000 0.0500 0.0250 0.0100 0.0050 0.0010

1 2.706 3.841 5.024 6.635 7.879 10.827 2 4.605 5.991 7.378 9.210 10.597 13.815 3 6.251 7.815 9.348 11.345 12.838 16.266 4 7.779 9.488 11.143 13.277 14.860 18.466 5 9.236 11.070 12.832 15.086 16.750 20.515

6 10.645 12.592 14.449 16.812 18.548 22.457 7 12.017 14.067 16.013 18.475 20.278 24.321 8 13.362 15.507 17.535 20.090 21.955 26.124 9 14.684 16.919 19.023 21.666 23.589 27.877 10 15.987 18.307 20.483 23.209 25.188 29.588

11 17.275 19.675 21.920 24.725 26.757 31.264 12 18.549 21.026 23.337 26.217 28.300 32.909 13 19.812 22.362 24.736 27.688 29.819 34.527 14 21.064 23.685 26.119 29.141 31.319 36.124 15 22.307 24.996 27.488 30.578 32.801 37.698

16 23.542 26.296 28.845 32.000 34.267 39.252 17 24.769 27.587 30.191 33.409 35.718 40.791 18 25.989 28.869 31.526 34.805 37.156 42.312 19 27.204 30.144 32.852 36.191 38.582 43.819 20 28.412 31.410 34.170 37.566 39.997 45.314

21 29.615 32.671 35.479 38.932 41.401 46.796 22 30.813 33.924 36.781 40.289 42.796 48.268 23 32.007 35.172 38.076 41.638 44.181 49.728 24 33.196 36.415 39.364 42.980 45.558 51.179 25 34.382 37.652 40.646 44.314 46.928 52.619

26 35.563 38.885 41.923 45.642 48.290 54.051 27 36.741 40.113 43.195 46.963 49.645 55.475 28 37.916 41.337 44.461 48.278 50.994 56.892 29 39.087 42.557 45.722 49.588 52.335 58.301 30 40.256 43.773 46.979 50.892 53.672 59.702

40 51.805 55.758 59.342 63.691 66.766 73.403 50 63.167 67.505 71.420 76.154 79.490 86.660 60 74.397 79.082 83.298 88.379 91.952 99.608 70 85.527 90.531 95.023 100.425 104.215 112.317 80 96.578 101.879 106.629 112.329 116.321 124.839 90 107.565 113.145 118.136 124.116 128.299 137.208 100 118.498 124.342 129.561 135.807 140.170 149.449

Page 113: Biometrika i Planiranje Istrazivanja 2010

110

Kritične vrijednosti F raspodjele, F> Fα, α = 0.05

α

Stupnjevi slobode brojnika

1 2 3 4 5 6 7 8

1 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82

6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07

11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64

16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45

21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34

26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27

40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 70 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 80 3.96 3.11 2.72 2.49 2.33 2.21 2.13 2.06 90 3.95 3.10 2.71 2.47 2.32 2.20 2.11 2.04 100 3.94 3.09 2.70 2.46 2.31 2.19 2.10 2.03

Stup

njev

i slo

bode

naz

ivni

ka

120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02

Page 114: Biometrika i Planiranje Istrazivanja 2010

111

Kritične vrijednosti F raspodjele, F> Fα, α = 0.05

α

Stupnjevi slobode brojnika

9 10 12 15 20 24 30 60 120

1 240.54 241.88 243.90 245.95 248.02 249.05 250.10 252.20 253.25 2 19.38 19.40 19.41 19.43 19.45 19.45 19.46 19.48 19.49 3 8.81 8.79 8.74 8.70 8.66 8.64 8.62 8.57 8.55 4 6.00 5.96 5.91 5.86 5.80 5.77 5.75 5.69 5.66 5 4.77 4.74 4.68 4.62 4.56 4.53 4.50 4.43 4.40

6 4.10 4.06 4.00 3.94 3.87 3.84 3.81 3.74 3.70 7 3.68 3.64 3.57 3.51 3.44 3.41 3.38 3.30 3.27 8 3.39 3.35 3.28 3.22 3.15 3.12 3.08 3.01 2.97 9 3.18 3.14 3.07 3.01 2.94 2.90 2.86 2.79 2.75 10 3.02 2.98 2.91 2.85 2.77 2.74 2.70 2.62 2.58

11 2.90 2.85 2.79 2.72 2.65 2.61 2.57 2.49 2.45 12 2.80 2.75 2.69 2.62 2.54 2.51 2.47 2.38 2.34 13 2.71 2.67 2.60 2.53 2.46 2.42 2.38 2.30 2.25 14 2.65 2.60 2.53 2.46 2.39 2.35 2.31 2.22 2.18 15 2.59 2.54 2.48 2.40 2.33 2.29 2.25 2.16 2.11

16 2.54 2.49 2.42 2.35 2.28 2.24 2.19 2.11 2.06 17 2.49 2.45 2.38 2.31 2.23 2.19 2.15 2.06 2.01 18 2.46 2.41 2.34 2.27 2.19 2.15 2.11 2.02 1.97 19 2.42 2.38 2.31 2.23 2.16 2.11 2.07 1.98 1.93 20 2.39 2.35 2.28 2.20 2.12 2.08 2.04 1.95 1.90

21 2.37 2.32 2.25 2.18 2.10 2.05 2.01 1.92 1.87 22 2.34 2.30 2.23 2.15 2.07 2.03 1.98 1.89 1.84 23 2.32 2.27 2.20 2.13 2.05 2.01 1.96 1.86 1.81 24 2.30 2.25 2.18 2.11 2.03 1.98 1.94 1.84 1.79 25 2.28 2.24 2.16 2.09 2.01 1.96 1.92 1.82 1.77

26 2.27 2.22 2.15 2.07 1.99 1.95 1.90 1.80 1.75 27 2.25 2.20 2.13 2.06 1.97 1.93 1.88 1.79 1.73 28 2.24 2.19 2.12 2.04 1.96 1.91 1.87 1.77 1.71 29 2.22 2.18 2.10 2.03 1.94 1.90 1.85 1.75 1.70 30 2.21 2.16 2.09 2.01 1.93 1.89 1.84 1.74 1.68

40 2.12 2.08 2.00 1.92 1.84 1.79 1.74 1.64 1.58 50 2.07 2.03 1.95 1.87 1.78 1.74 1.69 1.58 1.51 60 2.04 1.99 1.92 1.84 1.75 1.70 1.65 1.53 1.47 70 2.02 1.97 1.89 1.81 1.72 1.67 1.62 1.50 1.44 80 2.00 1.95 1.88 1.79 1.70 1.65 1.60 1.48 1.41 90 1.99 1.94 1.86 1.78 1.69 1.64 1.59 1.46 1.39 100 1.97 1.93 1.85 1.77 1.68 1.63 1.57 1.45 1.38

Stup

njev

i slo

bode

naz

ivni

ka

120 1.96 1.91 1.83 1.75 1.66 1.61 1.55 1.43 1.35

Page 115: Biometrika i Planiranje Istrazivanja 2010

112

Kritične vrijednosti F raspodjele, F> Fα, α = 0.01

α

Stupnjevi slobode brojnika

1 2 3 4 5 6 7 8

1 4052.18 4999.34 5403.53 5624.26 5763.96 5858.95 5928.33 5980.95 2 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29

6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06

11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00

16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 17 8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79 18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56

21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32

26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17

40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 50 7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 70 7.01 4.92 4.07 3.60 3.29 3.07 2.91 2.78 80 6.96 4.88 4.04 3.56 3.26 3.04 2.87 2.74 90 6.93 4.85 4.01 3.53 3.23 3.01 2.84 2.72 100 6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69

Stup

njev

i slo

bode

naz

ivni

ka

120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66

Page 116: Biometrika i Planiranje Istrazivanja 2010

113

Kritične vrijednosti F raspodjele, F> Fα, α = 0.01

α

Stupnjevi slobode brojnika

9 10 12 15 20 24 30 60 120

1 6022.40 6055.93 6106.68 6156.97 6208.66 6234.27 6260.35 6312.97 6339.512 99.39 99.40 99.42 99.43 99.45 99.46 99.47 99.48 99.493 27.34 27.23 27.05 26.87 26.69 26.60 26.50 26.32 26.224 14.66 14.55 14.37 14.20 14.02 13.93 13.84 13.65 13.565 10.16 10.05 9.89 9.72 9.55 9.47 9.38 9.20 9.11

6 7.98 7.87 7.72 7.56 7.40 7.31 7.23 7.06 6.977 6.72 6.62 6.47 6.31 6.16 6.07 5.99 5.82 5.748 5.91 5.81 5.67 5.52 5.36 5.28 5.20 5.03 4.959 5.35 5.26 5.11 4.96 4.81 4.73 4.65 4.48 4.4010 4.94 4.85 4.71 4.56 4.41 4.33 4.25 4.08 4.00

11 4.63 4.54 4.40 4.25 4.10 4.02 3.94 3.78 3.6912 4.39 4.30 4.16 4.01 3.86 3.78 3.70 3.54 3.4513 4.19 4.10 3.96 3.82 3.66 3.59 3.51 3.34 3.2514 4.03 3.94 3.80 3.66 3.51 3.43 3.35 3.18 3.0915 3.89 3.80 3.67 3.52 3.37 3.29 3.21 3.05 2.96

16 3.78 3.69 3.55 3.41 3.26 3.18 3.10 2.93 2.8417 3.68 3.59 3.46 3.31 3.16 3.08 3.00 2.83 2.7518 3.60 3.51 3.37 3.23 3.08 3.00 2.92 2.75 2.6619 3.52 3.43 3.30 3.15 3.00 2.92 2.84 2.67 2.5820 3.46 3.37 3.23 3.09 2.94 2.86 2.78 2.61 2.52

21 3.40 3.31 3.17 3.03 2.88 2.80 2.72 2.55 2.4622 3.35 3.26 3.12 2.98 2.83 2.75 2.67 2.50 2.4023 3.30 3.21 3.07 2.93 2.78 2.70 2.62 2.45 2.3524 3.26 3.17 3.03 2.89 2.74 2.66 2.58 2.40 2.3125 3.22 3.13 2.99 2.85 2.70 2.62 2.54 2.36 2.27

26 3.18 3.09 2.96 2.81 2.66 2.58 2.50 2.33 2.2327 3.15 3.06 2.93 2.78 2.63 2.55 2.47 2.29 2.2028 3.12 3.03 2.90 2.75 2.60 2.52 2.44 2.26 2.1729 3.09 3.00 2.87 2.73 2.57 2.49 2.41 2.23 2.1430 3.07 2.98 2.84 2.70 2.55 2.47 2.39 2.21 2.11

40 2.89 2.80 2.66 2.52 2.37 2.29 2.20 2.02 1.9250 2.78 2.70 2.56 2.42 2.27 2.18 2.10 1.91 1.8060 2.72 2.63 2.50 2.35 2.20 2.12 2.03 1.84 1.7370 2.67 2.59 2.45 2.31 2.15 2.07 1.98 1.78 1.6780 2.64 2.55 2.42 2.27 2.12 2.03 1.94 1.75 1.6390 2.61 2.52 2.39 2.24 2.09 2.00 1.92 1.72 1.60100 2.59 2.50 2.37 2.22 2.07 1.98 1.89 1.69 1.57

Stup

njev

i slo

bode

naz

ivni

ka

120 2.56 2.47 2.34 2.19 2.03 1.95 1.86 1.66 1.53

Page 117: Biometrika i Planiranje Istrazivanja 2010

114

Kritične vrijednosti studentiziranog raspona, q(a,v) a = broj grupa v = stupnjevi slobode pokusne greške α = 0.05 Broj grupa (a)

V 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

1 18.00 27.00 32.80 37.20 40.50 43.10 45.40 47.30 49.10 50.60 51.90 53.20 54.30 55.40 56.302 6.09 8.33 9.80 10.89 11.73 12.43 13.03 13.54 13.99 14.39 14.75 15.08 15.38 15.65 15.913 4.50 5.91 6.83 7.51 8.04 8.47 8.85 9.18 9.46 9.72 9.95 10.16 10.35 10.52 10.694 3.93 5.04 5.76 6.29 6.71 7.06 7.35 7.60 7.83 8.03 8.21 8.37 8.52 8.67 8.80

5 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17 7.32 7.47 7.60 7.72 7.836 3.46 4.34 4.90 5.31 5.63 5.89 6.12 6.32 6.49 6.65 6.79 6.92 7.04 7.14 7.247 3.34 4.16 4.68 5.06 5.35 5.59 5.80 5.99 6.15 6.29 6.42 6.54 6.65 6.75 6.848 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 6.18 6.29 6.39 6.48 6.579 3.20 3.95 4.42 4.76 5.02 5.24 5.43 5.60 5.74 5.87 5.98 6.09 6.19 6.28 6.36

10 3.15 3.88 4.33 4.66 4.91 5.12 5.30 5.46 5.60 5.72 5.83 5.93 6.03 6.12 6.2011 3.11 3.82 4.26 4.58 4.82 5.03 5.20 5.35 5.49 5.61 5.71 5.81 5.90 5.98 6.0612 3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.40 5.51 5.61 5.71 5.80 5.88 5.9513 3.06 3.73 4.15 4.46 4.69 4.88 5.05 5.19 5.32 5.43 5.53 5.63 5.71 5.79 5.8614 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36 5.46 5.56 5.64 5.72 5.79

15 3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20 5.31 5.40 5.49 5.57 5.65 5.7216 3.00 3.65 4.05 4.34 4.56 4.74 4.90 5.03 5.15 5.26 5.35 5.44 5.52 5.59 5.6617 2.98 3.62 4.02 4.31 4.52 4.70 4.86 4.99 5.11 5.21 5.31 5.39 5.47 5.55 5.6118 2.97 3.61 4.00 4.28 4.49 4.67 4.83 4.96 5.07 5.17 5.27 5.35 5.43 5.50 5.5719 2.96 3.59 3.98 4.26 4.47 4.64 4.79 4.92 5.04 5.14 5.23 5.32 5.39 5.46 5.53

20 2.95 3.58 3.96 4.24 4.45 4.62 4.77 4.90 5.01 5.11 5.20 5.28 5.36 5.43 5.5024 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 5.10 5.18 5.25 5.32 5.3830 2.89 3.48 3.84 4.11 4.30 4.46 4.60 4.72 4.83 4.92 5.00 5.08 5.15 5.21 5.2740 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.74 4.82 4.90 4.98 5.05 5.11 5.17

60 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 4.81 4.88 4.94 5.00 5.06120 2.80 3.36 3.69 3.92 4.10 4.24 4.36 4.47 4.56 4.64 4.71 4.78 4.84 4.90 4.95∝ 2.77 3.32 3.63 3.86 4.03 4.17 4.29 4.39 4.47 4.55 4.62 4.68 4.74 4.80 4.84