Upload
hoangdung
View
217
Download
2
Embed Size (px)
Citation preview
1
MARKETINŠKO ISTRAŽIVANJE
• Novembar 2013
Novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
2
IX. Analiza podataka (2) 1. Diskriminaciona analiza 2. Kanonička korelaciona analiza 3. Faktorska analiza 4. Analiza skupina 5. Multidimenzionalno skaliranje 6. Analiza združenih efekata
Novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
3
IX.1. Diskriminaciona analiza
• Koncept diskriminacione analize • Diskriminaciona analiza za dve grupe • Višestruka diskriminaciona analiza
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
4
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
2
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
5
Multivarijacione tehnike
Tehnike zavisnosti
Fokus na varijablama
Fokus na objektima
- Faktorska analiza
- Analiza skupina
- Višedimen-zionalno skaliranje
Jedna zavisna varijabla
Više zavisnih varijabli
- ANOVA i ANCOVA - Višestruka regresija - Diskriminaciona anal. - Analiza združenih
efekata
- MANOVA i MANCOVA
- Kanonička korelacija
Tehnike međuzavisnosti
Novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
6
Koncept diskriminacione analize
• Ciljevi diskriminacione analize • Koncept diskriminacione analize • Metodologija diskriminacione analize
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
7
Šta je diskriminaciona analiza? • Diskriminaciona analiza je tehnika koja se koristi
za klasifikaciju jedinica posmatranja u jednu od dve ili više alternativnih grupa (populacija) na osnovu određenog skupa merenja
• Razgraničenje po kome se jedinice posmatranja dodeljuju grupama definiše diskriminaciona funkcija
• Diskriminacionom analizom se identifikuju varijable kojima se vrše diskriminacija (razgraničenje, razlikovanje) između jedinica posmatranja deleći ih u dve ili više grupa.
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
8
Ciljevi diskriminacione analize 1. Određivanje linearne kombinacije nezavisnih varijabli
kojima bi se odvojile grupe tako da se maksimizira varijabilitet između grupa, u odnosu na varijabilitet unutar grupa (t.j. predmeti posmatranja u različitim grupama su maksimalno razdvojeni)
2. Razvoj procedura kojima se novi predmeti posmatranja sa poznatim profilima dodeljuju jednoj od dve (ili više) grupa
3. Testiranje značajnosti razlika između dve grupe na osnovu centroida grupe
4. Određivanje koje varijable imaju najznačajniji uticaj u objašnjavanju razlike između grupa.
3
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
9
Tačka razdvajanja, C
Procenat članova populacije 1 pogrešno klasifikovanih u
populaciju 2
Procenat članova populacije 2 pogrešno klasifikovanih u
populaciju 1
X2 X1
Populacija 2 Populacija 1
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
10
Koncept diskriminacione analize • Potrebno je razdvojiti dve populacije po
promenljivoj X, čija je srednja vrednost jednaka za populaciju 1 i za populaciju 2
• Ako obe populacije imaju istu varijansu, onda je C obično dato sa:
• Tada su verovatnoće za obe greške jednake • U praksi se populacije odvajaju po više od jedne
varijable, odnosno treba da se formira linearna kombinacija tih varijabli.
1X2X
2X X 21 +=C
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
11
Metodologija diskriminacione analize
• Traži se linearna kombinacija nezavisnih varijabli kako bi se na najbolji način razdvojile unapred definisane grupe
• Odgovarajući kriterijum je da se varijansa između grupa maksimizira u odnosu na varijanse unutar grupa
• Tako se dobija: Z = b1X1 + b2X2 + b3X3 + . . . + bnXn
Z → diskriminacioni skor (diskriminaciona funkcija ili osa) b → diskriminacioni ponderi X → nezavisne varijable (prediktori).
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
12
Centroidi • Za testiranje hipoteze o jednakosti sredina grupa za
dve ili više grupa koriste se diskriminaciona analiza i ANOVA
• U diskriminacionoj analizi se računa diskriminacioni skor za svaku jedinicu posmatranja u svakoj grupi, a zatim računa prosečna vrednost skora za svaku grupu
• Sredina grupe, definisana kao vektor čiji su elementi srednje vrednosti grupe za svaku od opserviranih promenljivih, se naziva centroid grupe
• Poređenje centroida grupa pokazuje koliko su grupe međusobno udaljene od diskriminacione funkcije.
4
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
13
Diskriminaciona analiza za dve grupe
• Diskriminaciona funkcija • Skor odsecanja za dve grupe • Ocenjivanje diskriminacione funkcije • Testiranje značajnosti • Tumačenje diskriminacionih pondera
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
14
Pregled postupka diskriminacione analize
• Za sprovođenje diskriminacione analize treba preduzeti sledeće postupke: 1. Formirati grupe 2. Oceniti diskriminacionu funkciju 3. Odrediti značajnost funkcije i varijabli 4. Interpretirati diskriminacionu funkciju, i 5. Izvesti klasifikaciju i validaciju.
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
15
Diskriminaciona funkcija • Diskriminacione funkcija se određuje
korišćenjem generalizovane mere udaljenosti između centroida grupa
• Ova mera se izračunava poređenjem raspodele diskriminacionih skorova za dve ili više grupa
• Diskriminaciona funkcija dobro odvaja grupe ako je preklapanje raspodela diskriminacionih skorova malo, i obrnuto
• Primer sa dve grupe, A i B, i dve mere, X1 i X2 za svakog člana ove dve grupe, čime se dobija...
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
16
5
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
17
Skor odsecanja za dve grupe • Na osnovu diskriminacione funkcije formulišu se
(jednodimenzioni) Z-diskriminacioni skorovi i dobija jednodimenzionalna raspodela na Z-osi
• Njihova srednja vrednost za svaku grupu je centroid grupe
• Proporcija pogotka, t.j. procenat pravilno klasifikovanih slučajeva se određuje računanjem jedinstvenog skora odsecanja
• Vrednosti ispod skora odsecanja idu u prvu grupu, a one iznad se klasifikuju u drugu grupu
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
18
Dodeljivanje grupama za dve jednake grupe
AZ BZKlasifikuje se kao grupa A
Klasifikuje se kao grupa B
2Z Z BA +=odseZ
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
19
Dodeljivanje grupama za dve grupe različite veličine
AZ BZ
Optimalna,
poderisana tačka odsecanja
Neponderisana tačka odsecanja
nn
Zn Zn
BA
BAABsecod +
+=Z
Klasifikovano u grupu A Klasifikovano u
grupu B novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
20
Poređenje regresione i diskriminacione analize
• Posmatrano kao skup simbola, ove dve tehnike izgledaju isto. Ipak, razlike su koceptualno suštinske: – Cilj regresione analize je da oceni populacijsku srednju
vrednost zavisne varijable na osnovu poznatih vrednosti nezavisnih varijabli. Na osnovu određenih pretpostavki se ocenjuju parametri koji imaju željene karakteristike
– Cilj diskriminacione analize je da se pronađe linearna kombinacija nezavisnih varijabli kojom se maksimizira diskriminacija između dve grupe i minimizira verovatnoća pogrešnog klasifikovanja u odgovarajuće grupe. Formuliše se strategija za precizno klasifikovanje predmeta posmatranja u odgovarajuće grupe
6
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
21
Ocenjivanje diskriminacione funkcije
• Broj diskriminacionih funkcija koje se mogu izvesti je min (m – 1, p), gde je m broj modaliteta zavisne varijable, a p broj nezavisnih promenljivih
• Kod direktne metode ocenjivanja sve nezavisne varijable su uključene u diskriminacionu funkciju
• Parametri - diskriminacioni ponderi - se ocenjuju tako da se maksimizira varijabilitet između grupa, u odnosu na varijabilitet unutar grupa
• Time se obezbeđuje maksimalna razdvojenost grupa
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
22
Testiranje značajnosti
• Statistički se testira značajnost razlike centroida H0: µA = µB Ha: µA ≠ µB
– Vilksovo λ predstavlja proporciju varijabiliteta unutar grupe u odnosu na ukupan varijabilitet
– Vrednost Vilksovog λ se nalazi u intervalu (0,1) – Veće vrednosti λ ukazuju da se sredine grupa ne
razlikuju i obrnuto – Značajnost se testira korišćenjem F-rasporeda – Ako se odbaci nulta hipoteza, rezultat se interpretira.
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
23
Tumačenje diskriminacionih pondera
• Mogu se tumačiti slično kao regresioni koeficijenti, i govore o jačini uticaja odgovarajuće varijable
1. Visoke standardizovane vrednosti diskriminacionih pondera znače da odgovarajuće varijable više doprinose diskriminacionoj snazi funkcije
2. Relativni značaj nezavisnih varijabli proizilazi i iz koeficijenata korelacije strukture (prosta korelacija između svakog prediktora i diskriminacione funkcije), koji se zovu i kanonička opterećenja ili diskriminaciona opterećenja
• Obe vrednosti su osetljive na veličinu uzorka u odnosu na broj nezavisnih varijabli (min. 20:1)
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
24
Diskriminacija i validacija (1) Metoda zadržavanja: • Uzorak se deli na dva poduzorka. Jedan poduzorak se koristi
za ocenu pravila za klasifikaciju, a drugi, koji se zadržava, se koristi za validaciju.
• Klasifikaciona (diskriminaciona) matrica se sastoji iz brojeva koji otkrivaju moć predviđanja diskriminacione funkcije. Na glavnoj dijagonali se nalaze ispravne klasifikacije, a brojevi van dijagonale pokazuju pogrešne klasifikacije.
• Proporcija pogotka, t.j. procenat ispravno klasifikovanih slučajeva, je suma sa glavne dijagonale podeljena sa ukupnim brojem elemenata
• U postupku validacije, diskriminacioni ponderi ocenjeni prvim poduzorkom se primenjuju na nezavisne varijable drugog poduzorka i dobija ocena zavisne promenljive za drugi poduzorak koja se poredi sa realizacijama.
7
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
25
Diskriminacija i validacija (2)
U-metod, t.j. unakrsna validacija: • U svakom trenutku se, sukcesivno, zadržava po jedna
opservacija, dok se diskriminaciona funkcija ocenjuje na osnovu preostalih n1 + n2 – 1 opservacija i zadržana opservacija klasifikuje na osnovu upravo ocenjene diskriminacione funkcije
• Postupak se ponavlja sve dok se ne klasifikuju sve opservacije. Ako označimo sa m1 i m2 broj pogrešno klasifikovanih opservacija iz prvog i drugog uzorka, onda je ocenjena stopa greške klasifikacije (diskriminacije) data sa
• P1 = m1/n1 i P2 = m2/n2. novembar 2013 Istraživanje tržišta
Ekonomski fakultet, Beograd 26
Višestruka diskriminaciona analiza
• Diskriminacione funkcije • Statistička značajnost
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
27
Diskriminacione funkcije kod višestruke diskriminacije
• Isto se traži osa sa osobinom da se maksimizira odnos varijabiliteta između grupa i varijabiliteta unutar grupa, a koji su projektovani na ovu osu
• Komplikovanije je ovo obaviti sa tri i više grupa, te značajan potencijal diskriminacije ostaje neiskorišćen
• Za m grupa i p nezavisnih varijabli ukupan broj mogućih diskriminacionih funkcija je min (m – 1, p)
• Od, obično, m-1 diskriminacionih funkcija neće sve biti statistički značajne
• Tada se postiže ušteda u broju dimenzija.
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
28
Značajnost i interpretacija diskriminacionih funckija
• Ako se nekoliko funkcija testira istovremeno, Vilksovo λ se dobija kao proizvod jednodimenzionih λ svake pojedinačne funkcije
• Postupak interpretacije se ne menja • Određivanje pripadnosti grupi se komplikuje
kada postoji više diskriminacionih funkcija i grupa.
8
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
29
IX.2. Kanonička korelaciona analiza
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
30
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
31
Multivarijacione tehnike
Tehnike zavisnosti
Fokus na varijablama
Fokus na objektima
- Faktorska analiza
- Analiza skupina
- Višedimen-zionalno skaliranje
Jedna zavisna varijabla
Više zavisnih varijabli
- ANOVA i ANCOVA - Višestruka regresija - Diskriminaciona anal. - Analiza združenih
efekata
- MANOVA i MANCOVA
- Kanonička korelacija
Tehnike međuzavisnosti
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
32
Kanonička korelaciona analiza
• Primenjuje se kada postoje dve ili više varijabli kriterijuma (zavisnih) i više prediktora (nezavisnih varijabli)
• Predstavlja proširenje koncepta višestruke regresije
• Posmatra se povezanost između dva skupa varijabli (skupa zavnisnih varijabli i skupa nezavisnih varijabli) definisanih na intervalnoj skali
9
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
33
Postupak kanoničke korelacione analize (1)
Kanonička korelacija može da se definiše kao korelacija između linearne kombinacije zavisnih varijabli i linearne kombinacije
nezavisnih varijabli. – Maksimizira se korelacija dve linearne kombinacije varijabli – Skup kanoničkih koeficijenata ili pondera se određuje za
skup nezavisnih varijabli (prediktora): U = a1X1 + a2X2 + ... + aqXq,
– Skup kanoničkih koeficijenata ili pondera se određuje i za skup kriterijuma (zavisnih varijabli) V = b1Y1 + b2Y2 + ... + bpYp
– Korelacija između U i V se naziva kanoničkom korelacijom. novembar 2013 Istraživanje tržišta
Ekonomski fakultet, Beograd 34
Postupak kanoničke korelacione analize (2)
Kanonička korelacija može da se definiše kao korelacija između linearne kombinacije zavisnih varijabli i linearne kombinacije
nezavisnih varijabli. – Dakle, prva kanonička korelacija se dobija tako što se
maksimizira korelacija između U i V, po koeficijentima a i b – Pošto se izračuna prva kanonička korelacija i odrede prvi
kanonički par (U1 i V1), na isti način se određuje sledeći, uz uslov da su nekorelirani (ortogonalni) na prethodno određene kanonike
– Ukupan broj kanoničkih funkcija je određen sa min (p, q)
novembar 2013 Istraživanje tržišta Ekonomski fakultet, Beograd
35
Tumačenje kanoničkih funkcija • Da bi video da li postoji smislena interpretacija, istraživač
ispituje relativnu vrednost i znake nekoliko pondera koji određuju svaku jednačinu
• Svaki kanonički faktor, odnosno kanonici (U-ovi i V-ovi) se tumači na osnovu – Nivoa značajnosti faktora, – Veličine kanoničke korelacije, i – Dela varijabiliteta jednog skupa varijabli koji je objašnjen drugim skupom
varijabli. • Osim toga, kanonička opterećenja (a-ovi i b-ovi), koja
predstavljaju korelaciju između originalnih varijabli i kanoničkih faktora, mogu se koristiti da bi se interpretirala ova funkcija.