9
23/11/2016 1 ANOVA Novembar 2016 Novembar 2016 Istraživanje trži šta Ekonomski fakultet , Beograd 2 Analiza varijanse (ANOVA) Analiza varijanse sa jednim faktorom Proširena ANOVA tabela Novembar 2016 Istraživanje trži šta Ekonomski fakultet , Beograd 3 Analiza varijanse sa jednim faktorom Decembar 2012 Istraživanje trži šta Ekonomski fakultet , Beograd 4 Tehnike za analizu podataka Univarijacione tehnike Multivarijacione tehnike Posmatra se samo jedna promenljiva Posmatra se vi še promenljivih istovremeno

ANOVA Analiza varijanse (ANOVA) - ekof.bg.ac.rs · b – suma kvadrata između nivoa tretmana ... • Čita se vrednost iz tablica F-rasporeda za (r ... Na nivou značajnosti od 10%

  • Upload
    ngothu

  • View
    248

  • Download
    2

Embed Size (px)

Citation preview

23/11/2016

1

ANOVA

• Novembar 2016

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

2

Analiza varijanse (ANOVA)

• Analiza varijanse sa jednim faktorom• Proširena ANOVA tabela

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

3

Analiza varijanse sa jednim faktorom

Decembar 2012 Istraž ivanje trž ištaEkonomski fakultet, Beograd

4

Tehnike za analizu podataka

Univarijacione tehnike

Multivarijacione tehnike

Posmatra se samo jedna promenljiva

Posmatra se više promenljivih istovremeno

23/11/2016

2

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

5

Univarijacione tehnike za analizu podataka

Neparametarske statističke tehnike

Parametarske statističke tehnike

Podaci su nemetrički (nominalna i ordinalna skala)

Podaci su metrički (intervalna i skala odnosa)

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

6

Parametarske statističke tehnike

- t-test- z-test

Postoji samo jedan uzorak

Postoje dva ili više uzoraka

Nezavisni uzorci

Zavisni uzorci

- t-test- z-test- ANOVA

- Upareni t-test

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

7

Koncepti eksperimentalne analize na koje se pozivamo

U istraživanjima kadkažemo faktor češćemislimo na faktor u

faktorskoj analizi

• Varijabla ishoda – zavisna varijabla• “Faktori” – nezavisne varijable• Tretmani – različiti nivoi nezavisnih varijabli, t.j.

faktora• Svrha većine statističkih eksperimenata je:

1. Da se utvrdi da li različiti tretmani imaju različite efekte na varijablu ishoda, i

2. Ako imaju različite efekte, onda se želi oceniti (izmeriti) ta razlika.

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

8

Analiza varijanse sa jednim faktorom

• Naziva se i jednosmerna analiza varijanse;• Mere se efekti r tretmana jednog faktora na (jednu)

varijablu ishoda• Zatim se proverava da li postoje značajne razlike

između srednjih vrednosti različitih tretmana:H0: µ1 = µ2 = µ3 = . . . = µr

Ha: najmanje 2 od µ1, µ2, µ3, . . . , µr su različiti• Računa se odnos između varijanse „između-tretmana“

i varijanse „unutar-tretmana“• Ako je varijansa „između“ značajno veća nego

varijansa „unutar“, odbacuje se nulta hipoteza

23/11/2016

3

Pretpostavke modela

Pre početka analize se uvek formalno proveravaispunjenost pretpostavki modela:1. Reziduali po grupama imaju normalnu raspodelu

- proveravamo Kolmogorov-Smirnovljevimtestom normalnosti;

2. Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovimtestom homogenosti varijanse;

3. U pitanju su nezavisni slučajni uzorci.

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

9 Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

10

Ukupna i srednje vrednosti grupa, kao i njihova odstupanja

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

11

Varijansa između tretmana

– Ocena varijanse „između“ tretmana se zasniva na varijaciji između srednjih vrednosti dobijenih za svaki nivo tretmana:

, t.j.:

SSb – suma kvadrata između nivoa tretmana – srednja vrednost za tretman p– ukupna srednja vrednost

np – broj opservacija za tretman pr – ukupan broj tretmana

SSb = np X p − X ( )2

p =1

r

pXX €

MSSb =SSbr −1

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

12

Varijansa unutar tretmana

– Ocena varijanse „unutar“ tretmana se zasniva na varijaciji u okviru svakog nivoa tretmana (“neobjašnjena”):

, t.j.:

SSw – suma kvadrata unutar tretmana – srednja vrednost za tretman p– realizacija i za nivo tretmana p

np – ukupan broj opservacija za tretman pr – ukupan broj tretmanaN – ukupna veličina uzorka

pXipX€

SSw = xip − X p( )2

p =1

r

∑i=1

n p

MSSw =SSwN − r

23/11/2016

4

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

13

Ukupna, objašnjena i neobjašnjena varijansa

• Varijansa između tretmana se naziva i varijansom “objašnjenom” nivoom tretmana

• Varijansa unutar tretmana se naziva i varijansom “neobjašnjenom” nivoom tretmana

• Ukupna (totalna) varijacija ili totalna suma kvadrata je:

wbt SSSSSS +=

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

14

ANOVA tabela

SSb = np X p − X ( )2

p =1

r

MSSb =SSbr −1

MSSbMSSw

SSw = xip − X p( )2

p =1

r

∑i=1

k

MSSw =SSwN − r

SSt = xip − X ( )2

p =1

r

∑i=1

k

Izvor varijacije

Varijacija, suma kvadrata (SS)

St. slo-bode (df)

Ocena varijanse (MSS) F-odnos

Objašnje-na varijacija

r – 1

Neobjaš-njena varijacija

N – r

Ukupno N – 1

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

15

F-statistika

• Ako bi nulta hipoteza bila istinita (nivoi tretmana nemaju značajan efekat) onda bi F-odnos trebalo da bude blizu 1; u suprotnom F-odnos ima veće vrednosti

• Čita se vrednost iz tablica F-rasporeda za (r-1) i (N-r) stepeni slobode

• Na osnovu toga se zaključuje da li postoji razlika uslovljena nivoom tretmana i za koji nivo značajnosti ova razlika postoji

F =MSSbMSSw

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

16

Jačina povezanostiρ - deskriptivni statistički pokazatelj, mera jačine

povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka :

– Vrednost ρ na bazi uzorka teži da bude pristrasna naviše, pa je bolje koristiti :

t

b

SSSS

ˆ ω 2 =SSb − (r −1)MSSw

SSt + MSSw

23/11/2016

5

Primer: Koliko sati učišnedeljno?

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

17

Primer: Koliko sati učiš nedeljno? –Provera pretpostavki modela

Pre početka analize se uvek formalno proveravaispunjenost pretpostavki modela:1. Varijanse reziduala različitih grupa su jednake

(homoskedastičnost) - proveravamo Levinovimtestom homogenosti varijanse;

2. Reziduali po grupama imaju normalnu raspodelu- proveravamo Kolmogorov-Smirnovljevimtestom normalnosti;

3. U pitanju su nezavisni slučajni uzorci.

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

18

Primer: Koliko sati učiš nedeljno? –1. Test homogenosti varijanse

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

19

p=0,027 < α=0,05 è odbacujemo nultu hipotezu

Nulta hipoteza je da su varijanse reziduala različitih grupa jednake, t.j. da postoji homoskedastičnost, ili homogenost varijansi, putem Levinovog testa:

Respecifikacija varijabli putem logaritamske transformacije!

Primer: Koliko sati učiš nedeljno? –Logaritmovani podaci

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

20

23/11/2016

6

Primer: Koliko sati učiš nedeljno? –Ponovljeni test homogenosti varijanse

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

21

➔ Ne odbacujemo nultu hipotezu - na logaritmovanimpodacima varijanse se statistički ne razlikuju;

➔ Možemo nastaviti analizu proverom ispunjenostiuslova normalnosti.

Primer: Koliko sati učiš nedeljno? –2. Kolmogorov-Smirnovljev test

normalnosti

• Koristi se za testiranje hipoteze o normalnostiraspodele

• Nulta hipoteza je da varijabla prati normalanraspored, a alternativna je da ne prati

• Dakle, nastavićemo sa daljom analizom samoako test pokaže da se ne odbacuje nultahipoteza.

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

22

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

23

• Sve tri p-vrednosti su veće od 0,05, pa ne odbacujemonultu hipotezu o normalnosti rasporele!

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

24

Ukupna i srednje vrednosti grupa, kao i njihova odstupanja

23/11/2016

7

Primer: Koliko sati učiš nedeljno? –ANOVA izlazna tabela

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

25

➔ Na nivou značajnosti od 5% ne bismo odbacili Ho; ➔ Na nivou značajnosti od 10% bismo odbacili Ho i zaključili

bismo da postoje razlike po godinama u odnosu na vremeprovedeno u učenju tokom semestra.

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

26

Analiza varijanse sa više faktora

Decembar 2012 Istraž ivanje trž ištaEkonomski fakultet, Beograd

27

Tehnike za analizu podataka

Univarijacione tehnike

Multivarijacione tehnike

Posmatra se samo jedna promenljiva

Posmatra se više promenljivih istovremeno

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

28

Multivarijacione tehnike

Tehnike zavisnosti

Fokus na vari-jablama

Fokus na predmetima posmatranja

- Faktorska analiza

- Analiza skupina

- Višedimen-zionalno skaliranje

Jedna zavisna varijabla

Više zavisnih varijabli

- ANOVA i ANCOVA- Višestruka regresija- Diskriminaciona anal.- Analiza združenih

efekata

- MANOVA i MANCOVA

- Kanonička korelacija

Tehnike međuzavisnosti

23/11/2016

8

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

29

Proširena ANOVA tabela

• U ovom modelu postoji više varijabli tretmana (faktora)– Dodavanjem nove varijable tretmana tipično se povećava

objašnjeni varijabilitet– Druga varijabla tretmana se naziva blok-varijabla, jer se

formira jedan ili više blokova– Takođe je moguće da se uključi više varijabli tretmana

• Interakcija– Efekat interakcije znači da uticaj jednog tretmana neće biti

isti za svaki nivo onog drugog tretmana– Hipoteza o tome da nema interakcije se može testirati

korišćenjem ANOVA tabele

Primer dvofaktorske analize: Koliko sati učiš nedeljno?

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

30

• Putem dvofaktorske analize varijanse u ovom primeru možemo testirati sledeće hipoteze:

H0: ne postoji razlika među polovima u odnosu na brojčasova provedenih u učenju,

Ha: postoji razlika među polovima u odnosu na brojčasova provedenih u učenju;

H0: korišćenje Fejsbuka ne utiče na broj časovaprovedenih u učenju,

Ha: korišćenje Fejsbuka utiče na broj časova provedenihu učenju;

H0: nema interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju,

Ha: postoje interakcije između pola i korišćenja Fejsbukau odnosu na broj časova provedenih u učenju.

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

31

Levinov test jednakosti varijansireziduala

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

32

p=0,021 < α=0,05 è odbacujemo nultu hipotezuRespecifikacija varijabli putem logaritamske transformacije!

23/11/2016

9

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

33

Respecifikovane varijable (logaritmovanje) Ponovljeni test homogenosti varijanse

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

34

➔ Ne odbacujemo nultu hipotezu - nalogaritmovanim podacima varijanse se statistilčkine razlikuju.

• Hipoteze koje testiramo:H0: ne postoji razlika među polovima u odnosu na broj

časova provedenih u učenju,Ha: postoji razlika među polovima u odnosu na broj

časova provedenih u učenju;H0: korišćenje Fejsbuka ne utiče na broj časova

provedenih u učenju,Ha: korišćenje Fejsbuka utiče na broj časova provedenih

u učenju;H0: nema interakcije između pola i korišćenja Fejsbuka u

odnosu na broj časova provedenih u učenju,Ha: postoji interakcije između pola i korišćenja Fejsbuka u

odnosu na broj časova provedenih u učenju.

Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

35 Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd

36

Koje od navedenih hipoteza ćemo odbaciti, a kojenećemo?