9
1 MARKETINŠKO ISTRAŽIVANJE Novembar 2013 Novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd 2 IX. Analiza podataka (2) 1. Diskriminaciona analiza 2. Kanonička korelaciona analiza 3. Faktorska analiza 4. Analiza skupina 5. Multidimenzionalno skaliranje 6. Analiza združenih efekata Novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd 3 IX.1. Diskriminaciona analiza Koncept diskriminacione analize Diskriminaciona analiza za dve grupe Višestruka diskriminaciona analiza novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd 4 Tehnike za analizu podataka Univarijacione tehnike Multivarijacione tehnike Posmatra se samo jedna promenljiva Posmatra se više promenljivih istovremeno

MARKETINŠKO ISTRAŽIVANJE IX. Analiza podataka (2)w3.ekof.bg.ac.rs/nastava/istrazivanje_trzista_mis/13-14... · 1 MARKETINŠKO ISTRAŽIVANJE • Novembar 2013 Novembar 2013 Istraživanje

Embed Size (px)

Citation preview

Page 1: MARKETINŠKO ISTRAŽIVANJE IX. Analiza podataka (2)w3.ekof.bg.ac.rs/nastava/istrazivanje_trzista_mis/13-14... · 1 MARKETINŠKO ISTRAŽIVANJE • Novembar 2013 Novembar 2013 Istraživanje

1

MARKETINŠKO ISTRAŽIVANJE

•  Novembar 2013

Novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

2

IX. Analiza podataka (2) 1.  Diskriminaciona analiza 2.  Kanonička korelaciona analiza 3.  Faktorska analiza 4.  Analiza skupina 5.  Multidimenzionalno skaliranje 6.  Analiza združenih efekata

Novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

3

IX.1. Diskriminaciona analiza

• Koncept diskriminacione analize • Diskriminaciona analiza za dve grupe • Višestruka diskriminaciona analiza

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

4

Tehnike za analizu podataka

Univarijacione tehnike

Multivarijacione tehnike

Posmatra se samo jedna promenljiva

Posmatra se više promenljivih istovremeno

Page 2: MARKETINŠKO ISTRAŽIVANJE IX. Analiza podataka (2)w3.ekof.bg.ac.rs/nastava/istrazivanje_trzista_mis/13-14... · 1 MARKETINŠKO ISTRAŽIVANJE • Novembar 2013 Novembar 2013 Istraživanje

2

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

5

Multivarijacione tehnike

Tehnike zavisnosti

Fokus na varijablama

Fokus na objektima

-  Faktorska analiza

-  Analiza skupina

-  Višedimen-zionalno skaliranje

Jedna zavisna varijabla

Više zavisnih varijabli

-  ANOVA i ANCOVA -  Višestruka regresija - Diskriminaciona anal. -  Analiza združenih

efekata

- MANOVA i MANCOVA

-  Kanonička korelacija

Tehnike međuzavisnosti

Novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

6

Koncept diskriminacione analize

•  Ciljevi diskriminacione analize •  Koncept diskriminacione analize •  Metodologija diskriminacione analize

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

7

Šta je diskriminaciona analiza? •  Diskriminaciona analiza je tehnika koja se koristi

za klasifikaciju jedinica posmatranja u jednu od dve ili više alternativnih grupa (populacija) na osnovu određenog skupa merenja

•  Razgraničenje po kome se jedinice posmatranja dodeljuju grupama definiše diskriminaciona funkcija

•  Diskriminacionom analizom se identifikuju varijable kojima se vrše diskriminacija (razgraničenje, razlikovanje) između jedinica posmatranja deleći ih u dve ili više grupa.

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

8

Ciljevi diskriminacione analize 1.  Određivanje linearne kombinacije nezavisnih varijabli

kojima bi se odvojile grupe tako da se maksimizira varijabilitet između grupa, u odnosu na varijabilitet unutar grupa (t.j. predmeti posmatranja u različitim grupama su maksimalno razdvojeni)

2.  Razvoj procedura kojima se novi predmeti posmatranja sa poznatim profilima dodeljuju jednoj od dve (ili više) grupa

3.  Testiranje značajnosti razlika između dve grupe na osnovu centroida grupe

4.  Određivanje koje varijable imaju najznačajniji uticaj u objašnjavanju razlike između grupa.

Page 3: MARKETINŠKO ISTRAŽIVANJE IX. Analiza podataka (2)w3.ekof.bg.ac.rs/nastava/istrazivanje_trzista_mis/13-14... · 1 MARKETINŠKO ISTRAŽIVANJE • Novembar 2013 Novembar 2013 Istraživanje

3

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

9

Tačka razdvajanja, C

Procenat članova populacije 1 pogrešno klasifikovanih u

populaciju 2

Procenat članova populacije 2 pogrešno klasifikovanih u

populaciju 1

X2 X1

Populacija 2 Populacija 1

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

10

Koncept diskriminacione analize •  Potrebno je razdvojiti dve populacije po

promenljivoj X, čija je srednja vrednost jednaka za populaciju 1 i za populaciju 2

•  Ako obe populacije imaju istu varijansu, onda je C obično dato sa:

•  Tada su verovatnoće za obe greške jednake •  U praksi se populacije odvajaju po više od jedne

varijable, odnosno treba da se formira linearna kombinacija tih varijabli.

1X2X

2X X 21 +=C

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

11

Metodologija diskriminacione analize

•  Traži se linearna kombinacija nezavisnih varijabli kako bi se na najbolji način razdvojile unapred definisane grupe

•  Odgovarajući kriterijum je da se varijansa između grupa maksimizira u odnosu na varijanse unutar grupa

•  Tako se dobija: Z = b1X1 + b2X2 + b3X3 + . . . + bnXn

Z → diskriminacioni skor (diskriminaciona funkcija ili osa) b → diskriminacioni ponderi X → nezavisne varijable (prediktori).

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

12

Centroidi •  Za testiranje hipoteze o jednakosti sredina grupa za

dve ili više grupa koriste se diskriminaciona analiza i ANOVA

•  U diskriminacionoj analizi se računa diskriminacioni skor za svaku jedinicu posmatranja u svakoj grupi, a zatim računa prosečna vrednost skora za svaku grupu

•  Sredina grupe, definisana kao vektor čiji su elementi srednje vrednosti grupe za svaku od opserviranih promenljivih, se naziva centroid grupe

•  Poređenje centroida grupa pokazuje koliko su grupe međusobno udaljene od diskriminacione funkcije.

Page 4: MARKETINŠKO ISTRAŽIVANJE IX. Analiza podataka (2)w3.ekof.bg.ac.rs/nastava/istrazivanje_trzista_mis/13-14... · 1 MARKETINŠKO ISTRAŽIVANJE • Novembar 2013 Novembar 2013 Istraživanje

4

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

13

Diskriminaciona analiza za dve grupe

•  Diskriminaciona funkcija •  Skor odsecanja za dve grupe •  Ocenjivanje diskriminacione funkcije •  Testiranje značajnosti •  Tumačenje diskriminacionih pondera

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

14

Pregled postupka diskriminacione analize

•  Za sprovođenje diskriminacione analize treba preduzeti sledeće postupke: 1.  Formirati grupe 2.  Oceniti diskriminacionu funkciju 3.  Odrediti značajnost funkcije i varijabli 4.  Interpretirati diskriminacionu funkciju, i 5.  Izvesti klasifikaciju i validaciju.

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

15

Diskriminaciona funkcija •  Diskriminacione funkcija se određuje

korišćenjem generalizovane mere udaljenosti između centroida grupa

•  Ova mera se izračunava poređenjem raspodele diskriminacionih skorova za dve ili više grupa

•  Diskriminaciona funkcija dobro odvaja grupe ako je preklapanje raspodela diskriminacionih skorova malo, i obrnuto

•  Primer sa dve grupe, A i B, i dve mere, X1 i X2 za svakog člana ove dve grupe, čime se dobija...

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

16

Page 5: MARKETINŠKO ISTRAŽIVANJE IX. Analiza podataka (2)w3.ekof.bg.ac.rs/nastava/istrazivanje_trzista_mis/13-14... · 1 MARKETINŠKO ISTRAŽIVANJE • Novembar 2013 Novembar 2013 Istraživanje

5

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

17

Skor odsecanja za dve grupe •  Na osnovu diskriminacione funkcije formulišu se

(jednodimenzioni) Z-diskriminacioni skorovi i dobija jednodimenzionalna raspodela na Z-osi

•  Njihova srednja vrednost za svaku grupu je centroid grupe

•  Proporcija pogotka, t.j. procenat pravilno klasifikovanih slučajeva se određuje računanjem jedinstvenog skora odsecanja

•  Vrednosti ispod skora odsecanja idu u prvu grupu, a one iznad se klasifikuju u drugu grupu

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

18

Dodeljivanje grupama za dve jednake grupe

AZ BZKlasifikuje se kao grupa A

Klasifikuje se kao grupa B

2Z Z BA +=odseZ

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

19

Dodeljivanje grupama za dve grupe različite veličine

AZ BZ

Optimalna,

poderisana tačka odsecanja

Neponderisana tačka odsecanja

nn

Zn Zn

BA

BAABsecod +

+=Z

Klasifikovano u grupu A Klasifikovano u

grupu B novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

20

Poređenje regresione i diskriminacione analize

•  Posmatrano kao skup simbola, ove dve tehnike izgledaju isto. Ipak, razlike su koceptualno suštinske: –  Cilj regresione analize je da oceni populacijsku srednju

vrednost zavisne varijable na osnovu poznatih vrednosti nezavisnih varijabli. Na osnovu određenih pretpostavki se ocenjuju parametri koji imaju željene karakteristike

–  Cilj diskriminacione analize je da se pronađe linearna kombinacija nezavisnih varijabli kojom se maksimizira diskriminacija između dve grupe i minimizira verovatnoća pogrešnog klasifikovanja u odgovarajuće grupe. Formuliše se strategija za precizno klasifikovanje predmeta posmatranja u odgovarajuće grupe

Page 6: MARKETINŠKO ISTRAŽIVANJE IX. Analiza podataka (2)w3.ekof.bg.ac.rs/nastava/istrazivanje_trzista_mis/13-14... · 1 MARKETINŠKO ISTRAŽIVANJE • Novembar 2013 Novembar 2013 Istraživanje

6

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

21

Ocenjivanje diskriminacione funkcije

•  Broj diskriminacionih funkcija koje se mogu izvesti je min (m – 1, p), gde je m broj modaliteta zavisne varijable, a p broj nezavisnih promenljivih

•  Kod direktne metode ocenjivanja sve nezavisne varijable su uključene u diskriminacionu funkciju

•  Parametri - diskriminacioni ponderi - se ocenjuju tako da se maksimizira varijabilitet između grupa, u odnosu na varijabilitet unutar grupa

•  Time se obezbeđuje maksimalna razdvojenost grupa

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

22

Testiranje značajnosti

•  Statistički se testira značajnost razlike centroida H0: µA = µB Ha: µA ≠ µB

–  Vilksovo λ predstavlja proporciju varijabiliteta unutar grupe u odnosu na ukupan varijabilitet

–  Vrednost Vilksovog λ se nalazi u intervalu (0,1) –  Veće vrednosti λ ukazuju da se sredine grupa ne

razlikuju i obrnuto –  Značajnost se testira korišćenjem F-rasporeda –  Ako se odbaci nulta hipoteza, rezultat se interpretira.

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

23

Tumačenje diskriminacionih pondera

•  Mogu se tumačiti slično kao regresioni koeficijenti, i govore o jačini uticaja odgovarajuće varijable

1.  Visoke standardizovane vrednosti diskriminacionih pondera znače da odgovarajuće varijable više doprinose diskriminacionoj snazi funkcije

2.  Relativni značaj nezavisnih varijabli proizilazi i iz koeficijenata korelacije strukture (prosta korelacija između svakog prediktora i diskriminacione funkcije), koji se zovu i kanonička opterećenja ili diskriminaciona opterećenja

•  Obe vrednosti su osetljive na veličinu uzorka u odnosu na broj nezavisnih varijabli (min. 20:1)

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

24

Diskriminacija i validacija (1) Metoda zadržavanja: •  Uzorak se deli na dva poduzorka. Jedan poduzorak se koristi

za ocenu pravila za klasifikaciju, a drugi, koji se zadržava, se koristi za validaciju.

•  Klasifikaciona (diskriminaciona) matrica se sastoji iz brojeva koji otkrivaju moć predviđanja diskriminacione funkcije. Na glavnoj dijagonali se nalaze ispravne klasifikacije, a brojevi van dijagonale pokazuju pogrešne klasifikacije.

•  Proporcija pogotka, t.j. procenat ispravno klasifikovanih slučajeva, je suma sa glavne dijagonale podeljena sa ukupnim brojem elemenata

•  U postupku validacije, diskriminacioni ponderi ocenjeni prvim poduzorkom se primenjuju na nezavisne varijable drugog poduzorka i dobija ocena zavisne promenljive za drugi poduzorak koja se poredi sa realizacijama.

Page 7: MARKETINŠKO ISTRAŽIVANJE IX. Analiza podataka (2)w3.ekof.bg.ac.rs/nastava/istrazivanje_trzista_mis/13-14... · 1 MARKETINŠKO ISTRAŽIVANJE • Novembar 2013 Novembar 2013 Istraživanje

7

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

25

Diskriminacija i validacija (2)

U-metod, t.j. unakrsna validacija: •  U svakom trenutku se, sukcesivno, zadržava po jedna

opservacija, dok se diskriminaciona funkcija ocenjuje na osnovu preostalih n1 + n2 – 1 opservacija i zadržana opservacija klasifikuje na osnovu upravo ocenjene diskriminacione funkcije

•  Postupak se ponavlja sve dok se ne klasifikuju sve opservacije. Ako označimo sa m1 i m2 broj pogrešno klasifikovanih opservacija iz prvog i drugog uzorka, onda je ocenjena stopa greške klasifikacije (diskriminacije) data sa

•  P1 = m1/n1 i P2 = m2/n2. novembar 2013 Istraživanje tržišta

Ekonomski fakultet, Beograd 26

Višestruka diskriminaciona analiza

• Diskriminacione funkcije • Statistička značajnost

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

27

Diskriminacione funkcije kod višestruke diskriminacije

•  Isto se traži osa sa osobinom da se maksimizira odnos varijabiliteta između grupa i varijabiliteta unutar grupa, a koji su projektovani na ovu osu

•  Komplikovanije je ovo obaviti sa tri i više grupa, te značajan potencijal diskriminacije ostaje neiskorišćen

•  Za m grupa i p nezavisnih varijabli ukupan broj mogućih diskriminacionih funkcija je min (m – 1, p)

•  Od, obično, m-1 diskriminacionih funkcija neće sve biti statistički značajne

•  Tada se postiže ušteda u broju dimenzija.

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

28

Značajnost i interpretacija diskriminacionih funckija

•  Ako se nekoliko funkcija testira istovremeno, Vilksovo λ se dobija kao proizvod jednodimenzionih λ svake pojedinačne funkcije

•  Postupak interpretacije se ne menja •  Određivanje pripadnosti grupi se komplikuje

kada postoji više diskriminacionih funkcija i grupa.

Page 8: MARKETINŠKO ISTRAŽIVANJE IX. Analiza podataka (2)w3.ekof.bg.ac.rs/nastava/istrazivanje_trzista_mis/13-14... · 1 MARKETINŠKO ISTRAŽIVANJE • Novembar 2013 Novembar 2013 Istraživanje

8

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

29

IX.2. Kanonička korelaciona analiza

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

30

Tehnike za analizu podataka

Univarijacione tehnike

Multivarijacione tehnike

Posmatra se samo jedna promenljiva

Posmatra se više promenljivih istovremeno

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

31

Multivarijacione tehnike

Tehnike zavisnosti

Fokus na varijablama

Fokus na objektima

-  Faktorska analiza

-  Analiza skupina

-  Višedimen-zionalno skaliranje

Jedna zavisna varijabla

Više zavisnih varijabli

-  ANOVA i ANCOVA -  Višestruka regresija - Diskriminaciona anal. -  Analiza združenih

efekata

- MANOVA i MANCOVA

-  Kanonička korelacija

Tehnike međuzavisnosti

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

32

Kanonička korelaciona analiza

•  Primenjuje se kada postoje dve ili više varijabli kriterijuma (zavisnih) i više prediktora (nezavisnih varijabli)

•  Predstavlja proširenje koncepta višestruke regresije

•  Posmatra se povezanost između dva skupa varijabli (skupa zavnisnih varijabli i skupa nezavisnih varijabli) definisanih na intervalnoj skali

Page 9: MARKETINŠKO ISTRAŽIVANJE IX. Analiza podataka (2)w3.ekof.bg.ac.rs/nastava/istrazivanje_trzista_mis/13-14... · 1 MARKETINŠKO ISTRAŽIVANJE • Novembar 2013 Novembar 2013 Istraživanje

9

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

33

Postupak kanoničke korelacione analize (1)

Kanonička korelacija može da se definiše kao korelacija između linearne kombinacije zavisnih varijabli i linearne kombinacije

nezavisnih varijabli. –  Maksimizira se korelacija dve linearne kombinacije varijabli –  Skup kanoničkih koeficijenata ili pondera se određuje za

skup nezavisnih varijabli (prediktora): U = a1X1 + a2X2 + ... + aqXq,

–  Skup kanoničkih koeficijenata ili pondera se određuje i za skup kriterijuma (zavisnih varijabli) V = b1Y1 + b2Y2 + ... + bpYp

–  Korelacija između U i V se naziva kanoničkom korelacijom. novembar 2013 Istraživanje tržišta

Ekonomski fakultet, Beograd 34

Postupak kanoničke korelacione analize (2)

Kanonička korelacija može da se definiše kao korelacija između linearne kombinacije zavisnih varijabli i linearne kombinacije

nezavisnih varijabli. –  Dakle, prva kanonička korelacija se dobija tako što se

maksimizira korelacija između U i V, po koeficijentima a i b –  Pošto se izračuna prva kanonička korelacija i odrede prvi

kanonički par (U1 i V1), na isti način se određuje sledeći, uz uslov da su nekorelirani (ortogonalni) na prethodno određene kanonike

–  Ukupan broj kanoničkih funkcija je određen sa min (p, q)

novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd

35

Tumačenje kanoničkih funkcija •  Da bi video da li postoji smislena interpretacija, istraživač

ispituje relativnu vrednost i znake nekoliko pondera koji određuju svaku jednačinu

•  Svaki kanonički faktor, odnosno kanonici (U-ovi i V-ovi) se tumači na osnovu –  Nivoa značajnosti faktora, –  Veličine kanoničke korelacije, i –  Dela varijabiliteta jednog skupa varijabli koji je objašnjen drugim skupom

varijabli. •  Osim toga, kanonička opterećenja (a-ovi i b-ovi), koja

predstavljaju korelaciju između originalnih varijabli i kanoničkih faktora, mogu se koristiti da bi se interpretirala ova funkcija.