50
Analiza czynnikowa Analiza głównych składowych Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS Joanna Ciecieląg, Marek Pęczkowski WNE UW

Analiza czynnikowa Analiza głównych składowychcoin.wne.uw.edu.pl/jcieciel/czynnikowa_FINAL_NOWE.pdf · Analiza badanych zjawisk z punktu widzenia nowych, syntetycznych kategorii,

Embed Size (px)

Citation preview

Analiza czynnikowa Analiza głównych składowych

Wielowymiarowa Analiza Danychz wykorzystaniem pakietu SPSS

Joanna Ciecieląg, Marek Pęczkowski

WNE UW

Modelowanie strukturalne Analiza profili ukrytych

Analiza cech ukrytych Analiza klas ukrytch

Wskazniki

Zmienna ukryta

Metryczne

Metryczna

Kategorialne

Kategorialna

Metody czynnikowe Ogólne modele mieszanek

Źródło: A.Sagan „ Skalowanie w badaniach marketingowych”http://www.smbsuj.republika.pl/abc/3warsztaty/skalowanie_w_bm.ppt

Rola metod czynnikowych

Mają charakter eksploracyjny – wyodrębniają zmienne ukryte a posteriori

Wykorzystują metodę dekompozycji wg wartości własnych Zmienne ukryte wyjaśniają maksymalną ilość zmienności lub

powiązań w oryginalnym zbiorze danych Są interpretowane jako skorelowane lub niezależne wymiary leżące u

podstaw kształtowania się zjawiska Pozwalają na redukcję danych zastępując wiele zmiennych

skorelowanych nowym zbiorem zmiennych U podstaw redukcji leży zasada kompromisu między uproszczeniem

struktury a jakością odwzorowania

Źródło: A.Sagan „ Skalowanie w badaniach marketingowych”http://www.smbsuj.republika.pl/abc/3warsztaty/skalowanie_w_bm.ppt

Zastosowanie

Główne zastosowania czynnikowych technik analitycznych:

1) redukcja liczby zmiennych

2) wykrywanie struktury w związkach między zmiennymi – formułowanie i weryfikacja hipotez dotyczących istnienia i charakteru prawidłowości kształtujących związki między zmiennymi (klasyfikacja zmiennych)

Przykład 1ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani oceniali wiele jej różnych cech (smak, zapach, konsystencja, kolor, kształt, opakowanie itp.) Wykorzystując analizę czynnikową można sprawdzić, czy możliwe jest wyodrębnienie kilku ogólnych, ukrytych czynników, warunkujących stosunek respondentów do nowego produktu (np. wymiary "łączna ocena smaku i zapachu" czy „ocena wyglądu”).

Przykład 2badanie satysfakcji klientów danej firmyZestaw wielu pytań dotyczących różnych aspektów działania firmy –analizowanie każdego pytania osobno daje wiele szczegółowych informacji, analiza czynnikowa pozwala natomiast na uzyskanie ogólnego, syntetycznego obrazu powodów wpływających na satysfakcję klientów.

Przykłady

Punkt wyjścia

Pierwszym krokiem w tworzeniu modelu czynnikowego jest zbudowanie macierzy korelacji między zmiennymi pierwotnymi i jej wstępna analiza.

Macierz korelacji zwykle powstaje na bazie zmiennych standaryzowanych

Jeżeli współczynniki korelacji są niskie, lub żadna ze zmiennych nie koreluje wysoko z którąkolwiek z pozostałych, to stosowanie dalszej procedury opartej o model czynnikowy może prowadzić do niewiarygodnych wyników. Zwykle macierz korelacji poddaje się dalszej analizie, jeżeli przeciętnie współczynniki korelacji są większe od 0.3 (=> testy)

Jeśli w zbiorze znajdują się pewne odrębne grupy zmiennych wysoko ze sobąskorelowanych, to oznacza, że niosą one te same informacje.

Każda taka grupa może być zastąpiona jednym czynnikiem – syntetyczną miarąinformacji zawartej w danej grupie zmiennych

Ogólny podział metod analizy czynnikowej

A. Model "klasyczny" analizy czynnikowej (podział wariancji całkowitej zmiennych na dwie części: wariancję wspólną i wariancję specyficzną) ‏

klasyczna analiza czynnikowa

analiza kanoniczna

B. Model "komponentowy" analizy czynnikowej (nieuwzględnianie

struktury wariancji)‏

metoda głównych składowych

analiza współzależności

Czynniki

Czynnik jest nową zmienną, która nie jest bezpośrednio obserwowalna, ale jest

wyznaczana na podstawie zmiennych pierwotnych.

Czynniki te odzwierciedlają w zwięzły (syntetyczny) sposób znaczącą część

informacji zawartą w zbiorze danych, a jednocześnie każdy z nich niesie nowe

treści merytoryczne.

Mogą one też być postrzegane jako pewne „identyfikatory” grupujące wyjściowe

zmienne w spójne pod względem merytorycznym grupy.

Czynniki – wykorzystanie

Analiza badanych zjawisk z punktu widzenia nowych, syntetycznych kategorii, którymi są wyodrębnione czynniki

Tworzenie skal i miar złożonych z kilku pytań

Ustalanie wag określających znaczenie, jakie należy przypisać

poszczególnym zmiennym i czynnikom w trakcie analiz

Ortogonalizacja przestrzeni, w której rozpatrywane są obiekty, będące

przedmiotem badań

Konstruowanie modeli ekonometrycznych (regresja)

Przykład

Mamy dwa pytania: Czy są zadowoleni ze swojego hobby? Jak intensywnie uprawiają hobby?Odpowiedzi będą ze sobą wysoce skorelowane, możemy więc

wnioskować, że są one redundantne. Połączenie dwóch zmiennych w jeden czynnik:Dopasowanie linii, która "najlepiej" oddaje związek liniowy między

oboma zmiennymi. Gdybyśmy mogli zdefiniować taką zmienną, która w przybliżeniu określałaby linię regresji na wykresie rozrzutu, wówczas zmienna ta obejmowałaby większość informacji zawartej w obu pytaniach. W kolejnych analizach można by było wykorzystaćtaki nowy czynnik, w zastępstwie pierwotnych pytań. Jest to w pewnym sensie redukcja dwóch zmiennych do jednego czynnika. Nowy czynnik jest w rzeczywistości kombinacją liniową tych dwóch zmiennych.

Dane

Zmienne mierzone na skali przedziałowej lub ilorazowej (skala Likerta, dyferencjał semantyczny)

Zmienne, które są wskaźnikami ukrytych konceptów (nie przypadkowe )

Odpowiednie próby: zaleca się aby było przynajmniej cztery lub pięć razy tyle obserwacji (rozmiar próby) ile jest zmiennych.

Procedura

Wybór zmiennych do analizy

Wyznaczenie macierzy korelacji (kowariancji)

Stwierdzenie zasadności przeprowadzenia analizy czynnikowej

Wybór modelu czynnikowego

Wyznaczenie głównych składowych / czynników – wybór ich liczby

Rotacja

Interpretacja

MetodologiaPrzedmiot analizy:

macierz danych, zawierająca n realizacji m zmiennych:

Zmienne pierwotne podlegają standaryzacji:

nimj

xxX ijij ,...,2,1,...,2,1

,0,

Z= [ zij]

Podstawą do wyznaczania elementów macierzy współczynników

czynników jest macierz korelacji:

mjpzzn

ZZn

rR ij

n

iipij ...1,1'1

1

Wariancje na głównej przekątnej są miarą zasobów informacyjnych

zmiennych pierwotnych.

Metodologia

Model czynnikowy

Jeżeli macierz korelacji zmiennych pierwotnych jest odpowiednia do zastosowania analizy czynnikowej można przejść do następnego etapu - wyboru modelu czynnikowego. Określa on sposób identyfikacji czynników.

Metody czynnikowe dzieli się najogólniej na dwie podstawowe grupy: analiza głównych składowych metody klasycznej analizy czynnikowej (np. metoda osi głównych,

metoda największej wiarygodności)

Analiza czynnikowa

... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych powiązań między zmiennymi

Pozwala na sprowadzenie dużej liczby badanych zmiennych do znacznie mniejszej liczby wzajemnie niezależnych (nieskorelowanych) czynników

Analiza czynnikowa to metoda modelowania liniowego – zakłada się, że zmienne można przedstawić za pomocą liniowej funkcji zmiennych nieobserwowalnych (czynników), przy czym wszystkie zmienne przedstawiane są jako funkcje tych samych czynników

W praktyce – poszukujemy modelu czynnikowego, który by pasował do zastanej macierzy korelacji zmiennych pierwotnych

Analiza głównych składowych

… jest metodą transformacji zmiennych w nowe, ortogonalne zmienne, tzw. główne składowe.

To przede wszystkim procedura ortogonalizacji zmiennych ułatwiająca budowę teoretycznego modelu opisującego strukturę i związki między badanymi zjawiskami.Klasyczna analiza czynnikowa zaś sama w sobie jest takim modelem

=> Mimo podobnych celów i wyników NIE SĄ tym samym – metodologia się różni !!

17

Metoda głównych składowych

polega na przekształceniu obserwowalnych zmiennych wejściowych w nowe, nieobserwowalne i zarazem nieskorelowane zmienne nazywane głównymi składowymi

każda z głównych składowych jest liniową funkcją zmiennych wejściowych główne składowe są tak uporządkowane, aby wariancje kolejnych głównych

składowych (stanowiące miarę ich zasobów informacyjnych o badanym zjawisku) były coraz mniejsze

suma wariancji wszystkich zmiennych wejściowych jest równa sumie wariancji głównych składowych, co oznacza że przekształcenie zmiennych wejściowych w główne składowe nie prowadzi do żadnych strat informacji o badanym zjawisku

kilka pierwszych głównych składowych zawiera zdecydowaną większośćinformacji o badanym zjawisku, dostarczanych przez zmienne wejściowe, co pozwala na redukcję liczby głównych składowych przy możliwie małej stracie informacji wejściowych

W praktyce chodzi o sprawdzenie, czy kilka nowych zmiennych wyjaśnia maksymalnie dużo zmienności wyjściowego układu przy zachowaniu nieskorelowania, co daje w efekcie redukcję wymiaru.

Metoda głównych składowych

Metoda głównych składowych

Zmienne pierwotne po standaryzacji można przedstawić jako liniową kombinację

głównych składowych:

ZT = AGT

G = AT Z

gdzie:

Z - macierz i standaryzowanych zmiennych pierwotnych

A - macierz współczynników składowych głównych

G - macierz i składowych głównych

20

Pierwsza główna składowa G1 jest taką kombinacją zmiennych pierwotnych, dla której wariancja próbkowa jest największa wśród wszystkich kombinacji liniowych (przy warunku jednoznacznego wyznaczenia wektora współczynników).

Druga główna składowa G2 - analogicznie - jest kombinacją liniową zmiennych pierwotnych , dla której wariancja próbkowa jest kolejna największa

(przy warunku jednoznacznego wyznaczenia wektora współczynników oraz dodatkowym, zapewniającym ortogonalność powstałych składowych -konsekwencją tego jest sumowanie się kolejnych wariancji głównych składowych do wariancji całkowitej).

Metoda głównych składowych

Każda i-ta główna składowa jest liniowa kombinacją zmiennych pierwotnych i

wyjaśnia i-tą część całkowitej zmienności.

Kolejne główne składowe są tak wyznaczane, aby wariancje kolejnych

składowych były coraz mniejsze.

Można wyznaczyć tyle głównych składowych, ile mamy zmiennych

wyjściowych, jednak zazwyczaj kilka pierwszych wystarcza do wyjaśnienia

większości wariancji układu zmiennych.

Metoda głównych składowych

Znaczenie i użyteczność składowej głównej jest mierzona wielkością wyjaśnianej

przez nią całkowitej zmienności. I tak, jeśli w układzie sześciu zmiennych

pierwsza składowa wyjaśnia np. 85% zmienności, to znaczy to, że niemal cała

zmienność tego układu da się przedstawić na prostej zamiast w sześciu

wymiarach.

W efekcie powstaje nam tyle głównych składowych, ile było początkowo

zmiennych: nadal mamy układ m-wymiarowy. Ale w praktyce ograniczamy się do

kilku pierwszych głównych składowych, które wyjaśniają z góry ustaloną część

wariancji całkowitej, np. 75%.

Klasyczna analiza czynnikowa

analiza czynnikowa jest metodą badania struktury wewnętrznych zależności obserwacji wielowymiarowych

każda zmienna obserwowalna (wejściowa) przedstawiana jest jako kombinacja liniowa pewnej liczby nieobserwowalnych zmiennych, zwanych czynnikami, wspólnych dla całego zbioru zmiennych wejściowych oraz jednego nieobserwowalnego czynnika swoistego dla tej zmiennej

czynniki wspólne i czynniki swoiste nie są ze sobą skorelowane. celem analizy czynnikowej jest znalezienie takiego zbioru czynników

wspólnych oraz określenie ich relacji ze zmiennymi obserwowalnymi, który pozwala na wyjaśnienie struktury powiązań między zmiennymi obserwowalnymi

Klasyczna analiza czynnikowa

Zakładamy, że źródłem wzajemnych zależności (skorelowania) między

zmiennymi są ukryte wspólne czynniki, które można uznać za nośniki tej

samej informacji, chcemy zatem je wyodrębnić w formie nowych,

syntetycznych zmiennych.

Jednak zakładamy też, że nie cała wariancja zmiennych jest powodowana

tymi ukrytymi wspólnymi czynnikami – każda zmienna pierwotna

charakteryzuje się też pewnymi specyficznymi właściwościami.

Zatem każda z obserwowalnych zmiennych Z jest funkcją liniową zmiennych

nieobserwowalnych (czynników wspólnych) oraz pojedynczej zmiennej

specyficznej:

Z = AF + BUgdzie:Z - macierz j standaryzowanych zmiennych pierwotnychA - macierz ładunków czynnikowych czynników wspólnychF - macierz czynników wspólnychB – macierz (diagonalna) ładunków czynnikowych czynników specyficznychU - macierz czynników specyficznych

Założenia:- czynniki wspólne nie są skorelowane ze sobą- czynniki specyficzne również nie są ze sobą skorelowane- czynniki wspólne nie są skorelowane z czynnikami specyficznymi

26

Klasyczna analiza czynnikowa

Podstawą identyfikacji składników wspólnych i specyficznych w macierzy R jest w

analizie czynnikowej podział wariancji poszczególnych zmiennych na wariancję

wspólną i specyficzną:

h j2 - zasób zmienności wspólnej /communality/ - część wariancji

objaśniona przez czynniki wspólne

- zasób zmienności swoistej - pozostałość po odjęciu zasobuzmienności wspólnej od wariancji całkowitejw j

2

Klasyczna analiza czynnikowa

Dążymy do eliminacji wpływu czynników specyficznych na rzecz czynników

wspólnych. W tym celu zastępujemy w macierzy R współczynniki korelacji na

głównej przekątnej zasobami zmienności wspólnej, otrzymując tzw. zredukowaną

macierz korelacji :

~ ~~Rr r dla i jr h dla i jij ij

ij j

2

Klasyczna analiza czynnikowa

Wartości hj2 ustala się na poziomie:

średniej arytmetycznej współczynników korelacji danej zmiennej z

innymi zmiennymi: hj2 =

najwyższego co do modułu współczynnika korelacji j-tej zmiennej

z pozostałymi: hj2 = max [|rij |], i ≠ j

współczynnika determinacji wielorakiej R2 danej zmiennej z innymi

zmiennymi

m

iijrm 1

1

Klasyczna analiza czynnikowa

Kolejne wartości i wektory własne służą do uzyskania ładunków czynnikowych

kolejnych czynników.

Ładunki te odzwierciedlają korelację pomiędzy j-tą zmienną pierwotną i l-tym

wspólnym czynnikiem.

Najczęściej wybierane metody wyodrębniania czynników:

• Metoda Osi Głównych (Principal Axis Factor)

• Metoda Największej Wiarygodności (Maximum Likelihood)

Klasyczna analiza czynnikowa

Kryteria stosowalności analizy czynnikowej

Silne korelacje między zmiennymi

Indeks KMO (Kaiser-Meyer-Olkin)– indeks ten porównuje cząstkowe współczynniki korelacji z

dwuzmiennowymi współczynnikami korelacji. Przyjmuje wartości od 0 do 1, gdzie ) oznacza, że spodziewana redukcja będzie niewielka, więc stosowanie analizy czynnikowej nie ma sensu. Jest sens, gdy KMO jest większe od 0.5

Test Sferyczności Bartletta- test hipotezy, że macierz współczynników korelacji jest macierzą

jednostkową, co oznacza, że nie ma istotnych korelacji między zmiennymi. Odrzucenie hipotezy zerowej świadczy o zasadności przeprowadzenia analizy

33

KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of Sampling Adequacy. ,831

Bartlett's Test of Sphericity Approx. Chi-Square 11905,395

df 300Sig. ,000

Kryteria wyboru liczby czynników

1. Kryterium Kaisera - metoda "wartości własnej (lambda) większej od jedności" - jest najczęściej stosowana. Jej podstawą jest to, że każda główna składowa powinna wyjaśniać przynajmniej tyle, ile jedna zmienna pierwotna. Metoda ta powinna być stosowana gdy ilość zmiennych jest większa od 20. Gdy liczba zmiennych jest mniejsza istnieje tendencja wyodrębniania zbyt małej ilości czynników

2. Kryterium Joliffe’a – j.w., lecz graniczna wartość to 0,7. Korekta wynika stąd, że główne składowe, które w populacji mają wartość własną >1 mogąmieć w próbie tę wartość mniejszą niż 1, ze względu na błąd losowy próby

Kryteria wyboru liczby czynników

3. Wykres osypiska (kryterium Cattella) – wykres ilości czynników i ich wartości własnych. Identyfikujemy na nim "punkt załamania", w którym kąt załamania krzywej ("rumowisko"). Punkt ten określa liczbę czynników kwalifikujących się do dalszej analizy. Chodzi o to, aby uchwycić punkt, w którym dalsze zwiększanie liczby czynników będzie powodowało jedynie niewielkie przyrosty w sensie wyjaśnianej wariancji (gdy wykres zaczyna się„wypłaszczać”). Metoda ta jest nieco bardziej "liberalna" niż metoda >1, pozwala włączyć do dalszej analizy nieco większą liczbę czynników

4. Skumulowany procent wyjaśnionej wariancji analizowanych zmiennych - do ogólnej liczby wybranych czynników zalicza się te czynniki, które w sumie wyjaśniają np.. 75%, 80% lub 90% wariancji, a żaden następny nie tłumaczy więcej niż 5% wariancji

5. Interpretowalność merytoryczna czynników

36

Składowa

Początkowe wartości własneSumy kwadratów ładunków po

wyodrębnieniuSumy kwadratów ładunków po rotacji

Ogółem%

wariancji%

skumulowany Ogółem%

wariancji%

skumulowany Ogółem%

wariancji%

skumulowany

1 13,843 55,373 55,373 13,843 55,373 55,373 6,552 26,208 26,208

2 1,609 6,436 61,809 1,609 6,436 61,809 4,068 16,274 42,482

3 1,200 4,800 66,610 1,200 4,800 66,610 3,207 12,828 55,311

4 ,875 3,501 70,110 ,875 3,501 70,110 3,039 12,157 67,468

5 ,768 3,072 73,182 ,768 3,072 73,182 1,429 5,714 73,182

6 ,718 2,872 76,054

7 ,596 2,383 78,438

8 ,578 2,311 80,749

9 ,504 2,016 82,765

10 ,455 1,818 84,583

11 ,390 1,561 86,144

12 ,374 1,495 87,640

13 ,344 1,375 89,015

14 ,316 1,262 90,277

15 ,291 1,164 91,441

16 ,280 1,120 92,562

17 ,268 1,072 93,634

18 ,254 1,015 94,649

19 ,230 ,920 95,569

20 ,221 ,885 96,454

21 ,211 ,843 97,297

22 ,192 ,769 98,066

23 ,179 ,718 98,784

24 ,168 ,672 99,456

Metoda wyodrębniania czynników - Głównych składowych.

Kryteria wyboru liczby czynników

Najrozsądniejszą zasadą jest zatrzymanie się na takiej liczbie czynników, które są sensowne.

Jeśli czynnik, który miałby być wyłączony przestaje być sensowny, to nie powinien być uwzględniany.

=> Wybór liczby czynników jest zazwyczaj bardzo subiektywny

Interpretacja

Czynnik jest interpretowany na podstawie ładunków czynnikowych (ew. rotowanych)Ładunki czynnikowe są korelacjami miedzy czynnikami a początkowymi zmiennymi => dostarczają informacji do subiektywnego zidentyfikowania i nazwania nieobserwowalnych czynników głównych (wymiarów)

Każdy czynnik podlega interpretacji ze względu na te zmienne pierwotne, które mają wysokie ładunki czynnikowe. Istotne ładunki czynnikowe to najczęściej > 0.3

Ideanie byłoby, gdyby każda zmienna miała duży ładunek tylko dla jednego czynnika – jeśli jest inaczej, zmienną pierwotną należy uwzględnić w interpretacji wszystkich czynników, dla których jej ładunek jest istotny.

Zmienne pierwotne bez dużych ładunków w żadnym z czynników – usunąć z analizy.

Czynniki zadowolenia z pracy na stacji

4.7

4.4

4.5

4.4

4.2

4.4

3.9

4.2

4.5

4.0

4.1

4.0

3.5

4.0

3.7

4.0

3.6

3.54.4

Prowadzący [N=450]Pracownik [N=675]

Ocena aspektów w podziale na prowadzących i pracowników stacji

(skala: 1 – zdecydowanie się nie zgadzam 5 – zdecydowanie się zgadzam)

Zmienne wpływające na satysfakcje z pracy zostały w drodze analizy czynnikowej podzielone na dwa czynniki. Pierwsza skupia te aspekty, które mówią o satysfakcji z siebie, jako pracownika i własnych osiągnięć, a druga aspekty związane z dbałością firmy i możliwościami jakie daje FIRMA.

Przykład 1a.Badanie satysfakcji pracowników FIRMY X

Firma

Czynniki wyodrębnione – miejsce pracownika w społeczności FIRMY X

4.7

4.7

4.7

4.6

3.7

3.7

3.9

4.6

4.6

4.5

4.4

3.4

3.5

3.4

3.5

Prowadzący [N=450]Pracownik [N=675]

Ocena aspektów w podziale na prowadzących i pracowników

(skala: 1 – zdecydowanie się nie zgadzam 5 – zdecydowanie się zgadzam)

wartość istotnie większa

Przykład 1b.Badanie satysfakcji pracowników FIRMY X

Firmy

Firmy

Prowadzący

Firma

Firmą

Składowa

1 2 3 4 5

Lubię poprawiać sobie nią nastrój ,787 ,302 ,200

Marka dla ludzi takich jak ja ,783 ,213 ,219 ,291

Poleciłbym tę markę innym ,739 ,352 ,241 ,337

Ta marka wódki jest ceniona przez znajomych, z którymi ją piję ,716 ,361 ,203 ,223

Na spotkania z przyjaciółmi ,691 ,464 ,250 ,219

Po wypiciu nawet dużej ilości wódki tej marki, następnego dnia czuję się dobrze ,670 ,225 ,216 ,366

Zakupił(a)bym tę markę organizując ważne przyjęcie dla dużej liczby osób ,660 ,478 ,257

Wódka tej marki łatwo wchodzi ,631 ,360 ,313 ,261

Marka warta swej ceny ,592 ,310 ,208 ,530

Wódka tej marki jest mocna ,714 ,322

Marka dobra na prezent ,361 ,635 ,340

Odpowiednia do uczczenia specjalnych okazji ,476 ,618 ,361

Nie wstydził(a)bym się wódką tej marki poczęstować gości ,435 ,597 ,291 ,308

Nadaje się do dobrej zabawy w męskim towarzystwie ,583 ,594 ,272

Prestiżowa marka ,495 ,567 ,263 ,363

Odrobina wódki tej marki pomaga rozkręcić zabawę / imprezę ,458 ,520 ,306 ,249 ,249

Jest odpowiednia przede wszystkim dla kobiet ,774

Pasuje do deseru ,259 ,765

Wódka tej marki nie ma ostrego zapachu ,328 ,682 ,224

Jest na tyle łagodna, że nie trzeba jej zagryzać ani popijać ,270 ,567 ,315 ,438

Marka naprawdę inna od pozostałych ,394 ,223 ,725

Osobom, które jej nigdy nie próbowały jej smak może nie przypaść do gustu ,690 ,338

Wódka tej marki ma oryginalny smak ,250 ,310 ,271 ,620 ,253

Marka bardzo wysokiej jakości ,493 ,421 ,256 ,583

Można używać jej w celach leczniczych, np. w trakcie przeziębienia ,226 ,203 ,718

Przykład 2. Alkohole – wymiary oceny

Przykład 2 cd.

1. to marka moja i moich znajomych: Lubię poprawiać sobie nią nastrój, Marka dla ludzi takich jak ja, Poleciłbym tę markę innym, Ta marka wódki jest ceniona przez znajomych, z którymi ją piję, Na spotkania z przyjaciółmi, Po wypiciu nawet dużej ilości wódki tej marki, następnego dnia czuję się dobrze, Zakupił(a)bym tę markę organizując ważne przyjęcie dla dużej liczby osób, Wódka tej marki łatwo wchodzi, Marka warta swej ceny

2. dobra do zabawy: Wódka tej marki jest mocna, Marka dobra na prezent, Odpowiednia do uczczenia specjalnych okazji, Nie wstydził(a)bym się wódkątej marki poczęstować gości, Nadaje się do dobrej zabawy w męskim towarzystwie, Prestiżowa marka, Odrobina wódki tej marki pomaga rozkręcićzabawę / imprezę

3. kobieca, delikatna: Jest odpowiednia przede wszystkim dla kobiet, Pasuje do deseru, Wódka tej marki nie ma ostrego zapachu, Jest na tyle łagodna, że nie trzeba jej zagryzać ani popijać,

4. wyjątkowa, wysokiej jakości, inna: Marka naprawdę inna od pozostałych, Istnieje krąg ludzi lubiących tę markę ale osobom, które jej nigdy nie próbowały jej smak może nie przypaść do gustu, Wódka tej marki ma oryginalny smak, Marka bardzo wysokiej jakości

5. lecznicza: Można używać jej w celach leczniczych, np. w trakcie przeziębienia

Wyznaczanie wartości czynników

Na koniec najczęściej potrzebny jest sposób wyznaczenia wartości

poszczególnych czynników dla kolejnych obserwacji.

Jest wiele metod szacowania wartości czynników (np. w SPSS są 3):

• Regresyjna (daje oszacowania najbliższe rzeczywistym wartościom czynnikowym)

• Bartletta

• Andersona-Rubina

Na ogół dąży się do tego, aby ładunki czynnikowe, tj. współczynniki korelacji między poszczególnym wskaźnikiem a danym czynnikiem, miały wartości bliskie 0 lub bliskie maksymalnej wartości +1 lub –1.

Poszukuje się takiego układu czynnikowego, aby każdy wskaźnik miał wysoki ładunek tylko na jednym czynniku i aby każdy czynnik miał wartości tych ładunków bliskie 0 dla kilku wskaźników i bliskie wartościom maksymalnym dla pozostałych.

Nie zawsze bezpośrednio osiągalne = > rotacja

Rotacja polega na sprowadzeniu struktury ładunków do prostej struktury, w której punkty reprezentujące zmienne skupiają się wokół osi czynników, co zapewniła możliwie najłatwiejszą interpretację czynników.

Rotacja

Rotacja

Najczęściej stosuje się procedury rotacji ortogonalnej:

VARIMAX upraszcza interpretację czynników (minimalizuje liczbę zmiennych

potrzebnych do wyjaśnienia danego czynnika) QUARTIMAXupraszcza

interpretację zmiennych (minimalizuje liczbę czynników potrzebnych do

wyjaśnienia danej zmiennej).

Rotacje nieortogonalne – dopuszczamy skorelowanie powstałych czynników!

47

Analiza czynnikowa Analiza głównych składowychCh. Spearman (1904), L.L. Thurstone (1913) H. Hotteling (1933)

orientacja kowariancyjna: punktem wyjścia jest zredukowana macierz korelacji

orientacja wariancyjna: punktem wyjścia jest zwykła macierz korelacji

model otwarty: obok wariancji cech uwzględnia się także wariancjęnieobjaśnianą (zm. pominięte, losowośćobserwacji)

model zamknięty: uwzględnia się wyłącznie wariancję badanych zmiennych

każda zmienna pierwotna jest funkcjąnieobserwowanych czynników wspólnych i czynnika swoistego

zmienne pierwotne są liniową funkcjąskładowych głównych (a główne składowe można przedstawić jako kombinacje liniowe zmiennych pierwotnych)

buduje się teoretyczny model zjawiska i sprawdza, czy jest zgodny z danymi empirycznymi

wychodzi się od obserwacji empirycznych, a następnie buduje model teoretyczny

Celem analizy jest identyfikacja ukrytych zmiennych

Celem analizy jest uproszczenie struktury danych

równanie podstawowe: Z=AF + BU równanie podstawowe: ZT = AGT / G = AT Z

Podsumowanie

48

PCAComponent

FAFactor

1 2 3 4 1 2 3 4Z1b. I try to buy products which are currently advertised ,740 ,110 Z1b. I am curious about new products which

appear in shops,671 ,267

Z1b. I am curious about new products which appear in shops

,721 ,232 -,108 Z1b. I try to buy products which are currently advertised

,660 ,102

Z1b. I just enjoy spending my free time in a store ,652 ,183 Z1b. I just enjoy spending my free time in a store ,564 ,200 ,111

Z1b. I often shop for products I need at parties, social gatherings etc.

,635 ,182 Z1b. I often shop for products I need at parties, social gatherings etc.

,542 ,185

Z1b. I often buy ready-to-use products or instant products ,572 -,151 Z1b. I often buy ready-to-use products or instant products

,469

Z1b. When I shop, I often opt for diet/light products ,425 ,119 ,252 ,374 Z1b. Most of my shopping is unplanned / decide to buy things on impulse, on the spur of the moment

,410 -,233

Z1b. I take a lot of care to learn what my loved ones really like and I shop to with their preferences in mind

,677 ,197 Z1b. When I shop, I often opt for diet/light products

,365 ,138 ,171 ,354

Z1b. It is very important for me that products I buy are really healthful/natural

,676 ,277 Z1b. It is very important for me that products I buy are really healthful/natural

,633 ,180

Z1b. I spend considerable time looking for fresh/safe products

,195 ,591 ,148 ,207 Z1b. I take a lot of care to learn what my loved ones really like and I shop to with their preferences in mind

,540 ,212

Z1b. Most of my shopping is unplanned / decide to buy things on impulse, on the spur of the moment

,440 -,471 ,282 Z1b. I spend considerable time looking for fresh/safe products

,143 ,499 ,127 ,245

Z1b. I try to choose stores where I know the sales staff and I can have a nice chat with them

-,230 ,156 ,656 ,212 Z1b. When shopping I want to show I am a good homemaker/host to make sure nobody can blaming for not taking enough care of my home

,196 ,346 ,619

Z1b. It is important for me that products I buy are recognised and appreciate by people around me and impress others

,392 ,168 ,650 Z1b. It is important for me that products I buy are recognised and appreciate by people around me and impress others

,363 ,152 ,610

Z1b. When shopping I want to show I am a good homemaker/host to make sure nobody can blaming for not taking enough care of my home

,226 ,391 ,629 Z1b. I try to choose stores where I know the sales staff and I can have a nice chat with them

-,137 ,204 ,353 ,187

Z1b. As a rule, I do not hesitate to make comments to the staff if things in a store are not the way think they should be

-,166 ,204 ,739 Z1b. I enjoy shopping with a shopping list I prepared earlier

,219 ,389

Z1b. I enjoy shopping with a shopping list I prepared earlier

,396 -,197 ,675 Z1b. As a rule, I do not hesitate to make comments to the staff if things in a store are not the way think they should be

,379

Zwyczaje zakupowe

ANALIZA CZYNNIKOWA

Analiza eksploracyjnaczynniki są początkowo nieznane i zostają wyodrębnione dzięki analizie: dane

grupowane są w zbiory zmiennych najsilniej ze sobą skorelowanych →wykrywanie związków między zmiennymi bez wstępnych założeń

Analiza konfirmacyjna → weryfikacja hipotez co do określonej z góry struktury czynników i estymacja parametrów założonego modelu

Dziękuję za uwagę