Upload
ngothu
View
248
Download
2
Embed Size (px)
Citation preview
23/11/2016
1
ANOVA
• Novembar 2016
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
2
Analiza varijanse (ANOVA)
• Analiza varijanse sa jednim faktorom• Proširena ANOVA tabela
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
3
Analiza varijanse sa jednim faktorom
Decembar 2012 Istraž ivanje trž ištaEkonomski fakultet, Beograd
4
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
23/11/2016
2
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
5
Univarijacione tehnike za analizu podataka
Neparametarske statističke tehnike
Parametarske statističke tehnike
Podaci su nemetrički (nominalna i ordinalna skala)
Podaci su metrički (intervalna i skala odnosa)
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
6
Parametarske statističke tehnike
- t-test- z-test
Postoji samo jedan uzorak
Postoje dva ili više uzoraka
Nezavisni uzorci
Zavisni uzorci
- t-test- z-test- ANOVA
- Upareni t-test
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
7
Koncepti eksperimentalne analize na koje se pozivamo
U istraživanjima kadkažemo faktor češćemislimo na faktor u
faktorskoj analizi
• Varijabla ishoda – zavisna varijabla• “Faktori” – nezavisne varijable• Tretmani – različiti nivoi nezavisnih varijabli, t.j.
faktora• Svrha većine statističkih eksperimenata je:
1. Da se utvrdi da li različiti tretmani imaju različite efekte na varijablu ishoda, i
2. Ako imaju različite efekte, onda se želi oceniti (izmeriti) ta razlika.
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
8
Analiza varijanse sa jednim faktorom
• Naziva se i jednosmerna analiza varijanse;• Mere se efekti r tretmana jednog faktora na (jednu)
varijablu ishoda• Zatim se proverava da li postoje značajne razlike
između srednjih vrednosti različitih tretmana:H0: µ1 = µ2 = µ3 = . . . = µr
Ha: najmanje 2 od µ1, µ2, µ3, . . . , µr su različiti• Računa se odnos između varijanse „između-tretmana“
i varijanse „unutar-tretmana“• Ako je varijansa „između“ značajno veća nego
varijansa „unutar“, odbacuje se nulta hipoteza
23/11/2016
3
Pretpostavke modela
Pre početka analize se uvek formalno proveravaispunjenost pretpostavki modela:1. Reziduali po grupama imaju normalnu raspodelu
- proveravamo Kolmogorov-Smirnovljevimtestom normalnosti;
2. Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovimtestom homogenosti varijanse;
3. U pitanju su nezavisni slučajni uzorci.
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
9 Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
10
Ukupna i srednje vrednosti grupa, kao i njihova odstupanja
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
11
Varijansa između tretmana
– Ocena varijanse „između“ tretmana se zasniva na varijaciji između srednjih vrednosti dobijenih za svaki nivo tretmana:
, t.j.:
SSb – suma kvadrata između nivoa tretmana – srednja vrednost za tretman p– ukupna srednja vrednost
np – broj opservacija za tretman pr – ukupan broj tretmana
€
SSb = np X p − X ( )2
p =1
r
∑
pXX €
MSSb =SSbr −1
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
12
Varijansa unutar tretmana
– Ocena varijanse „unutar“ tretmana se zasniva na varijaciji u okviru svakog nivoa tretmana (“neobjašnjena”):
, t.j.:
SSw – suma kvadrata unutar tretmana – srednja vrednost za tretman p– realizacija i za nivo tretmana p
np – ukupan broj opservacija za tretman pr – ukupan broj tretmanaN – ukupna veličina uzorka
pXipX€
SSw = xip − X p( )2
p =1
r
∑i=1
n p
∑
€
MSSw =SSwN − r
23/11/2016
4
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
13
Ukupna, objašnjena i neobjašnjena varijansa
• Varijansa između tretmana se naziva i varijansom “objašnjenom” nivoom tretmana
• Varijansa unutar tretmana se naziva i varijansom “neobjašnjenom” nivoom tretmana
• Ukupna (totalna) varijacija ili totalna suma kvadrata je:
wbt SSSSSS +=
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
14
ANOVA tabela
€
SSb = np X p − X ( )2
p =1
r
∑
€
MSSb =SSbr −1
€
MSSbMSSw
€
SSw = xip − X p( )2
p =1
r
∑i=1
k
∑
€
MSSw =SSwN − r
€
SSt = xip − X ( )2
p =1
r
∑i=1
k
∑
Izvor varijacije
Varijacija, suma kvadrata (SS)
St. slo-bode (df)
Ocena varijanse (MSS) F-odnos
Objašnje-na varijacija
r – 1
Neobjaš-njena varijacija
N – r
Ukupno N – 1
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
15
F-statistika
• Ako bi nulta hipoteza bila istinita (nivoi tretmana nemaju značajan efekat) onda bi F-odnos trebalo da bude blizu 1; u suprotnom F-odnos ima veće vrednosti
• Čita se vrednost iz tablica F-rasporeda za (r-1) i (N-r) stepeni slobode
• Na osnovu toga se zaključuje da li postoji razlika uslovljena nivoom tretmana i za koji nivo značajnosti ova razlika postoji
€
F =MSSbMSSw
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
16
Jačina povezanostiρ - deskriptivni statistički pokazatelj, mera jačine
povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka :
– Vrednost ρ na bazi uzorka teži da bude pristrasna naviše, pa je bolje koristiti :
t
b
SSSS
=ρ
€
ˆ ω 2 =SSb − (r −1)MSSw
SSt + MSSw
23/11/2016
5
Primer: Koliko sati učišnedeljno?
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
17
Primer: Koliko sati učiš nedeljno? –Provera pretpostavki modela
Pre početka analize se uvek formalno proveravaispunjenost pretpostavki modela:1. Varijanse reziduala različitih grupa su jednake
(homoskedastičnost) - proveravamo Levinovimtestom homogenosti varijanse;
2. Reziduali po grupama imaju normalnu raspodelu- proveravamo Kolmogorov-Smirnovljevimtestom normalnosti;
3. U pitanju su nezavisni slučajni uzorci.
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
18
Primer: Koliko sati učiš nedeljno? –1. Test homogenosti varijanse
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
19
p=0,027 < α=0,05 è odbacujemo nultu hipotezu
Nulta hipoteza je da su varijanse reziduala različitih grupa jednake, t.j. da postoji homoskedastičnost, ili homogenost varijansi, putem Levinovog testa:
Respecifikacija varijabli putem logaritamske transformacije!
Primer: Koliko sati učiš nedeljno? –Logaritmovani podaci
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
20
23/11/2016
6
Primer: Koliko sati učiš nedeljno? –Ponovljeni test homogenosti varijanse
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
21
➔ Ne odbacujemo nultu hipotezu - na logaritmovanimpodacima varijanse se statistički ne razlikuju;
➔ Možemo nastaviti analizu proverom ispunjenostiuslova normalnosti.
Primer: Koliko sati učiš nedeljno? –2. Kolmogorov-Smirnovljev test
normalnosti
• Koristi se za testiranje hipoteze o normalnostiraspodele
• Nulta hipoteza je da varijabla prati normalanraspored, a alternativna je da ne prati
• Dakle, nastavićemo sa daljom analizom samoako test pokaže da se ne odbacuje nultahipoteza.
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
22
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
23
• Sve tri p-vrednosti su veće od 0,05, pa ne odbacujemonultu hipotezu o normalnosti rasporele!
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
24
Ukupna i srednje vrednosti grupa, kao i njihova odstupanja
23/11/2016
7
Primer: Koliko sati učiš nedeljno? –ANOVA izlazna tabela
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
25
➔ Na nivou značajnosti od 5% ne bismo odbacili Ho; ➔ Na nivou značajnosti od 10% bismo odbacili Ho i zaključili
bismo da postoje razlike po godinama u odnosu na vremeprovedeno u učenju tokom semestra.
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
26
Analiza varijanse sa više faktora
Decembar 2012 Istraž ivanje trž ištaEkonomski fakultet, Beograd
27
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
28
Multivarijacione tehnike
Tehnike zavisnosti
Fokus na vari-jablama
Fokus na predmetima posmatranja
- Faktorska analiza
- Analiza skupina
- Višedimen-zionalno skaliranje
Jedna zavisna varijabla
Više zavisnih varijabli
- ANOVA i ANCOVA- Višestruka regresija- Diskriminaciona anal.- Analiza združenih
efekata
- MANOVA i MANCOVA
- Kanonička korelacija
Tehnike međuzavisnosti
23/11/2016
8
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
29
Proširena ANOVA tabela
• U ovom modelu postoji više varijabli tretmana (faktora)– Dodavanjem nove varijable tretmana tipično se povećava
objašnjeni varijabilitet– Druga varijabla tretmana se naziva blok-varijabla, jer se
formira jedan ili više blokova– Takođe je moguće da se uključi više varijabli tretmana
• Interakcija– Efekat interakcije znači da uticaj jednog tretmana neće biti
isti za svaki nivo onog drugog tretmana– Hipoteza o tome da nema interakcije se može testirati
korišćenjem ANOVA tabele
Primer dvofaktorske analize: Koliko sati učiš nedeljno?
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
30
• Putem dvofaktorske analize varijanse u ovom primeru možemo testirati sledeće hipoteze:
H0: ne postoji razlika među polovima u odnosu na brojčasova provedenih u učenju,
Ha: postoji razlika među polovima u odnosu na brojčasova provedenih u učenju;
H0: korišćenje Fejsbuka ne utiče na broj časovaprovedenih u učenju,
Ha: korišćenje Fejsbuka utiče na broj časova provedenihu učenju;
H0: nema interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju,
Ha: postoje interakcije između pola i korišćenja Fejsbukau odnosu na broj časova provedenih u učenju.
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
31
Levinov test jednakosti varijansireziduala
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
32
p=0,021 < α=0,05 è odbacujemo nultu hipotezuRespecifikacija varijabli putem logaritamske transformacije!
23/11/2016
9
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
33
Respecifikovane varijable (logaritmovanje) Ponovljeni test homogenosti varijanse
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
34
➔ Ne odbacujemo nultu hipotezu - nalogaritmovanim podacima varijanse se statistilčkine razlikuju.
• Hipoteze koje testiramo:H0: ne postoji razlika među polovima u odnosu na broj
časova provedenih u učenju,Ha: postoji razlika među polovima u odnosu na broj
časova provedenih u učenju;H0: korišćenje Fejsbuka ne utiče na broj časova
provedenih u učenju,Ha: korišćenje Fejsbuka utiče na broj časova provedenih
u učenju;H0: nema interakcije između pola i korišćenja Fejsbuka u
odnosu na broj časova provedenih u učenju,Ha: postoji interakcije između pola i korišćenja Fejsbuka u
odnosu na broj časova provedenih u učenju.
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
35 Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
36
Koje od navedenih hipoteza ćemo odbaciti, a kojenećemo?