20
ANALIZA SKUPINA 1

ANALIZA SKUPINA

Embed Size (px)

DESCRIPTION

ANALIZA SKUPINA. A naliza skupina. Za razliku od diskriminacione analize ovde broj grupa i njihove karakteristike nisu unapred poznate. Cilj je otkriti prirodne grupe medju jedinicama posm atranja u odnosu na posmatrane karakteristike (npr. dohodak i zaduženost). - PowerPoint PPT Presentation

Citation preview

Page 1: ANALIZA SKUPINA

ANALIZA SKUPINA

1

Page 2: ANALIZA SKUPINA

Analiza skupina

• Za razliku od diskriminacione analize ovde broj grupa i njihove karakteristike nisu unapred poznate.

• Cilj je otkriti prirodne grupe medju jedinicama posmatranja u odnosu na posmatrane karakteristike (npr. dohodak i zaduženost)

2

Page 3: ANALIZA SKUPINA

3

Page 4: ANALIZA SKUPINA

• Prema čemu se grupišu opservacije u skupine?

• Prema nekoj meri sličnosti. Najsličnije opservacije treba da budu u istoj skupini

• Koje mere sličnosti se koriste u analizi skupina?

1. Euklidsko odstojanje – mera različitosti2. Koeficijenti korelacije – mera bliskosti3. Koeficijenti povezanosti – mera bliskosti (za binarne atribute)

4

Page 5: ANALIZA SKUPINA

Euklidsko odstojanje – mera različitostiproizvodi/varijable Zadovoljstvo

ukusomZadovoljstvo ambalažom

proizvod A 1 2

proizvod B 2 2

proizvod C 6 7

5

Koji proizvodi su najsličniji? ABKoji proizvodi su najrazličitiji?AC

Page 6: ANALIZA SKUPINA

6

Page 7: ANALIZA SKUPINA

Koeficijent povezanosti – mera bliskosti

• Izračunati koeficijent sličnosti između televizora marke Samsung i Neo (1-poseduje karakteristiku, 0-ne poseduje datu karakteristiku)

a-broj karakteristika koje poseduju oba brenda

b-broj karakteristika koje poseduje samo prvi brend

c-broj karakteristika koje poseduje samo drugi

d-broj karakteristika koje ne poseduje ni jedan brend

Sličnost SAMSUNG-NEO==(a+d)/(a+b+c+d)=2/4=0.5

Karakteristika Samsung Neo LG

Garancija 2 godine

1 1 0

Servis 1 0 1

Mogućnost prikazivanja digitalne televizije

0 0 1

LCD 1 0 1

7

Page 8: ANALIZA SKUPINA

Koeficijent korelacije – mera sličnosti

• Posmatramo dinamiku gledanosti po nedeljama tri televizijske stanice (PINK, FOX, RTS)

8

Page 9: ANALIZA SKUPINA

9

Korelacija gledanosti PINK FOX RTS1

PINK 1 0,97 0,32

FOX 0,97 1 0,12

RTS1 0,32 0,12 1

Ko ima najsličniju dinamiku gledanosti?PINK i FOX

Page 10: ANALIZA SKUPINA

Analiza skupina

• Koje procedure grupisanja postoje?1. Hijerarhijska – nema unapred definisan broj

skupina. Polazi se od toga da je svaka jedinica zasebna skupina pa se na osnovu mera sličnosti povezuju u sve manji broj skupina dok ne postanu jedna (može i obratno)

2. Nehijerarhijska – unapred definisan broj skupina. Preporučuje se primena obe procedure prvo

hijerarhijske pa nehijerarhijske.

10

Page 11: ANALIZA SKUPINA

Analiza skupina• Kod hijerarhijske analize u svakoj iteraciji spajaju se najsličnije grupe• Kako merimo udaljenost (sličnost) izmedju GRUPA?

1. Jednostruko povezivanje

2. Potpuno povezivanje

3. Prosečno povezivanje

4. Metod centroida

5. Vordov metod

11

Page 12: ANALIZA SKUPINA

Jednostruko povezivanje• Metod najbližih suseda (euklidsko-mera sličnosti)

12

Koja je udaljenost ove dve skupine po metodu najbližij suseda?Ono je jednako euklidskom odstojanju proizvodaE i C

Page 13: ANALIZA SKUPINA

13

Page 14: ANALIZA SKUPINA

Potpuno povezivanje

• Naziva se još i metod najudaljenijih suseda

14

Page 15: ANALIZA SKUPINA

Metod prosečnog povezivanja

• Uzima se prosek distanci jedinica iz obe skupine. Primer: neka jednu skupinu čine jedinice AiB, a drugu skupinu neka čini samo C

• Udaljenost prema ovom metodu (7,07+6,4)/2=6,735

15

Page 16: ANALIZA SKUPINA

16

(AC + BC)/2 = 6,735

Page 17: ANALIZA SKUPINA

Analiza skupina – hijerarhijski metod

17

Page 18: ANALIZA SKUPINA

Analiza skupina• Uzimajući u obzir sledeće mere bliskosti odrediti koji proizvodi pripadaju

kojim skupinama po metodu najbližih suseda koristeći DENDROGRAM

• AB i D jedna skupina• EC druga skupina

A B C D E

A - .85 .15 .25 .16

B .85 - .08 .86 .23

C .15 .08 - .1 .62

D .25 .86 .1 - .27

E .16 .23 .62 .27 -

18

Page 19: ANALIZA SKUPINA

Analiza skupina• Uzimajući u obzir sledeće mere različitosti odrediti koji proizvodi pripadaju

kojim skupinama po metodu najbližih suseda koristeći DENDROGRAM

• B, C i D jedna skupina• E i A druga skupina

A B C D E

A - .85 .45 .25 .14

B .85 - .08 .86 .23

C .45 .08 - .1 .62

D .25 .86 .1 - .27

E .14 .23 .62 .27 -

19

Page 20: ANALIZA SKUPINA

Zadatak• Izračunati koeficijent sličnosti između

televizora marke Samsung i Neo (1-postoji karakteristika, 0-ne postoji karakteristika)

A-broj karakteristika koje poseduju oba brenda

B-broj karakteristika koje poseduje samo Samsung

C-broj karakteristika koje poseduje samo Neo

D-broj karakteristika koje ne poseduje ni jedan brend

s=(a+d)/(a+b+c+d)=4/8=0.5

Karakteristika Samsung Neo

Garancija 2 godine

1 1

Servis 1 0

Mogućnost prikazivanja digitalne televizije

0 0

LCD 1 0

Plazma 0 1

Crna boja 1 1

Srebrna boja 1 0

Držač za TV gratis

1 1

20