Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
1
ANALIZA
VARIANCE
1.del
Doc.dr. Tadeja Kraner Šumenjak
Delovna verzija
2
PREDPOSTAVKE:
•Y naj bo slučajna spremenljivka, ki meri izid poskusa.
•Yi naj opisuje izid pri i-tem obravnavanju (obravnavanja so
lahko različne sorte, gostote setve)
•Yi so normalno porazdeljene
•Variance po obravnavanjih so homogene (enake).
•Zagotovljena mora biti medsebojna neodvisnost obravnavanj.
ENOSMERNA ANALIZA VARIANCE
(slučajne skupine)
3
Vzorec velikosti n enot razdelimo na p razredov,
ki se ločijo po enem faktorju.
Torej imamo p neodvisnih spremenljivk:
Njihova matematična upanja naj bodo (so
neznana):
1 2, ,..., pY Y Y
1 2, ,..., p
4
Izmerjeni podatki za slučajne
spremenljivke:
1
2
1 11 12 1
2 21 22 2
1 2
: , ,...,
: , ,...,
: , ,...,p
n
n
P p p pn
Y Y Y Y
Y Y Y Y
Y Y Y Y
Model lahko zapišemo, če
Naključne
spremenljivke so
neodvisne.
5
Ničelna hipoteza:
Proti hipotezi H1, ki pravimo, da je vsaj eno povprečje
različno od nič.
6
2 2 2
1 1 1 1 1
( ) ( ) ( )i i
i
n nk k k
iij ij i
i j i i j
x x n x x x x
Skupna vsota kvadratov
Merjena z vsoto kvadratov
odklonov opazovanih
vrednosti od aritmetične
sredine
Vsota kvadratov
pojasnjena z
obravnavanji
(Zaradi razlik med
obravnavanji)
Nepojasnjena
variabilnost,
znotraj skupine
Ostanek,
napaka
je število ponovitev
je število ponovitev v skupinii
k
n
Različni viri variiranja
Q = Qn+Qg
7
Vir variabilnosti
Vsota
kvadrato
v
Število
prostostnih
stopenj
Srednji
kvadriran
odklon
F
Fkritični
OBRAVNAVANJE
(med obravnavanji)
Qg
k - 1
2
gs 2
2
n
g
s
s
tabelirana
vrednost
NAPAKA
(znotraj
obravnavanj)
Qn
n - k
2
ns
Skupaj
Q
n - 1
Povprečje vsote kvadratov dobimo:
kn
Qs
k
Qs
nn
g
g
2
2
1
8
V primeru, ko je ničelna hipoteza pravilna, je
kvocient (statistika)
2
2
n
g
s
sF
porazdeljen(a) po Fisherjevi F(k1, Nk) porazdelitvi.
Ničelno hipotezo, ki pravi, da so aritmetične sredine
posameznih skupin enake zavrnemo takrat, ko pri
dani stopnji značilnosti
velja F F , kjer je F kritična vrednost F statistike.
9
10
Primer1
11
Primer 2
12
R.MEAD-NASVET
Potrebno število enot n v poskusu:
10 20df
df za ostanek
Več kot 20 ni potrebno,
10 je premalo.
13
Primer
Na polju je bi izveden poskus z namenom, da
bi primerjali povprečne pridelke 4 novih
kultivarjev koruze. Za poskus so imeli na voljo
homogeno polje. Poskus so izvedli v 6
ponovitvah.
14
Načrt poskusa
D D C B
C A D A
C A B A
D B A D
D C B B
A C B C
15
Pridelki koruze na parcelo
Parcela/
Obr
A B C D
1 25,12 40,25 18,30 28,05
2 17,25 35,25 22,60 28,55
3 26,42 31,98 25,90 23,20
4 16,08 36,52 15,05 31,68
5 22,15 43,32 11,42 30,32
6 15,92 37,10 23,68 37,58
16
Levene's Test of Equality of Error
Variancesa
Dependent Variable:pridelek
F df1 df2 Sig.
,583 3 20 ,633
Tests the null hypothesis that the error
variance of the dependent variable is equal
across groups.
a. Design: Intercept + sorta
SKLEP: ne moremo trditi, da so variance po obravnavanjih različne.
Kontrola ustreznosti modela-grafični
prikazi
Ostanki so
normalno
porazdeljeni,če
ležijo ob premici.
Normalna
porazdelitev
ostankov.
Ostanki so neodvisni. Iz
razporeditve točk v obliki
horizontalnega linearnega pasu
sklepamo, da vrednosti ostankov
niso odvisne od vrednosti ocen
odvisne spremenljivke.
Ni nobenega vzorca.
.
20
SKLEP: s tveganjem manjšim od 0.05 trdimo, da povprečni pridelki
na parcelo niso enaki.
21
4. Z dejavnikom, za katerega se izkaže da statistično značilno vpliva na izid (hibrid), gremo v nadaljnjo
analizo: srednje vrednosti nivojev dejavnika med sabo primerjamo s testi mnogoterih primerjav:
Post-hoc testiranje:
Če je splošni F test značilen, to še ne pomeni, da obstajajo razlike med vsemi pari obravnavanj.
Ali obstajajo razlike med pari, bi lahko testirali s t-testi, toda pri tem bi dobili preveliko alfa napako. To pomeni,
da bi ničelno hipotezo prehitro zavrnili.
Izbira testa je odvisna tudi od normalnosti porazdelitve odvisne spremenljivke in homogenosti varianc. Saj so
nekateri testi bolj in drugi manj občutljivi na kršitve. Pred odločitvijo o izbiri testa je dobro preveriti podatke in
poiskati ustrezen test.
Včasih se zgodi, da rezultati ANOVE in HSD niso skladni (F statistično značilen, HSD ne najde razlik).
Klasični testi (zahtevajo homogenost varianc): HSD (Tukeyev test), LSD, S-N-K (Student-Newman-Keuls),
Duncanov test, Scheffejev test, …
Dunettov test: kadar nas zanimajo samo primerjave s kontrolno skupino.
Testi, ki ne zahtevajo enakih varianc: Tamhanejev T2, Dunnettov T3 in C, Games-Howellov test.
22
HOMOGENOST VARIANC:
Če ni izpolnjena predpostavka ANOVE o homogenosti varianc po obravnavanjih, tedaj podatke transformiramo (npr.
korenimo, logaritmiramo). S tem se lahko odpravi morebitna asimetričnost, hkrati pa zmanjša morebitna nehomogenost
varianc. SPSS uporablja za test homogenosti varianc Levenovo testno statistiko (z gumbom Options zahtevamo test
homogenosti varianc). Ta test je man občutljiv na morebitno
odstopanje podatkov od normalne porazdelitve.
Obstajajo še drugi testi: Cochran’s C test, Bartlett’s test, Hartley’s test (SPSS jih nima).
Ho: σ12= σ2
2 =…= σk2
H1: σi2≠ σj
2 za vsaj en par varianc.
NORMALNA PORAZDELITEV:
Za testiranje ali je porazdelitev normalna (ni tako pomembno, razen če pričakujemo velika odstopanja) lahko
uporabimo Kolmogorov Smirnov test. Uporaben je pri zveznih porazdelitvah in to najbolj zanesljivo v primeru velikih
vzorcev. Ta test ima vgrajen tudi program SPSS pod imenom One-Sample Kolmogorov-Smirnov Test (SPSS:
Analyze/Nonparametric Test/One-Sample Kolmogorov Smirnov Test).
23
Testi se ločijo po
tem, kako
izračunajo kritično
razliko.
Zelo
strog.
Ni statistično
značilne razlike
med povprečnima
pridelkoma koruze
hibridov A in C in B
in D