Upload
doankien
View
239
Download
0
Embed Size (px)
Citation preview
Analiza czynnikowa Analiza głównych składowych
Wielowymiarowa Analiza Danychz wykorzystaniem pakietu SPSS
Joanna Ciecieląg, Marek Pęczkowski
WNE UW
Modelowanie strukturalne Analiza profili ukrytych
Analiza cech ukrytych Analiza klas ukrytch
Wskazniki
Zmienna ukryta
Metryczne
Metryczna
Kategorialne
Kategorialna
Metody czynnikowe Ogólne modele mieszanek
Źródło: A.Sagan „ Skalowanie w badaniach marketingowych”http://www.smbsuj.republika.pl/abc/3warsztaty/skalowanie_w_bm.ppt
Rola metod czynnikowych
Mają charakter eksploracyjny – wyodrębniają zmienne ukryte a posteriori
Wykorzystują metodę dekompozycji wg wartości własnych Zmienne ukryte wyjaśniają maksymalną ilość zmienności lub
powiązań w oryginalnym zbiorze danych Są interpretowane jako skorelowane lub niezależne wymiary leżące u
podstaw kształtowania się zjawiska Pozwalają na redukcję danych zastępując wiele zmiennych
skorelowanych nowym zbiorem zmiennych U podstaw redukcji leży zasada kompromisu między uproszczeniem
struktury a jakością odwzorowania
Źródło: A.Sagan „ Skalowanie w badaniach marketingowych”http://www.smbsuj.republika.pl/abc/3warsztaty/skalowanie_w_bm.ppt
Zastosowanie
Główne zastosowania czynnikowych technik analitycznych:
1) redukcja liczby zmiennych
2) wykrywanie struktury w związkach między zmiennymi – formułowanie i weryfikacja hipotez dotyczących istnienia i charakteru prawidłowości kształtujących związki między zmiennymi (klasyfikacja zmiennych)
Przykład 1ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani oceniali wiele jej różnych cech (smak, zapach, konsystencja, kolor, kształt, opakowanie itp.) Wykorzystując analizę czynnikową można sprawdzić, czy możliwe jest wyodrębnienie kilku ogólnych, ukrytych czynników, warunkujących stosunek respondentów do nowego produktu (np. wymiary "łączna ocena smaku i zapachu" czy „ocena wyglądu”).
Przykład 2badanie satysfakcji klientów danej firmyZestaw wielu pytań dotyczących różnych aspektów działania firmy –analizowanie każdego pytania osobno daje wiele szczegółowych informacji, analiza czynnikowa pozwala natomiast na uzyskanie ogólnego, syntetycznego obrazu powodów wpływających na satysfakcję klientów.
Przykłady
Punkt wyjścia
Pierwszym krokiem w tworzeniu modelu czynnikowego jest zbudowanie macierzy korelacji między zmiennymi pierwotnymi i jej wstępna analiza.
Macierz korelacji zwykle powstaje na bazie zmiennych standaryzowanych
Jeżeli współczynniki korelacji są niskie, lub żadna ze zmiennych nie koreluje wysoko z którąkolwiek z pozostałych, to stosowanie dalszej procedury opartej o model czynnikowy może prowadzić do niewiarygodnych wyników. Zwykle macierz korelacji poddaje się dalszej analizie, jeżeli przeciętnie współczynniki korelacji są większe od 0.3 (=> testy)
Jeśli w zbiorze znajdują się pewne odrębne grupy zmiennych wysoko ze sobąskorelowanych, to oznacza, że niosą one te same informacje.
Każda taka grupa może być zastąpiona jednym czynnikiem – syntetyczną miarąinformacji zawartej w danej grupie zmiennych
Ogólny podział metod analizy czynnikowej
A. Model "klasyczny" analizy czynnikowej (podział wariancji całkowitej zmiennych na dwie części: wariancję wspólną i wariancję specyficzną)
klasyczna analiza czynnikowa
analiza kanoniczna
B. Model "komponentowy" analizy czynnikowej (nieuwzględnianie
struktury wariancji)
metoda głównych składowych
analiza współzależności
Czynniki
Czynnik jest nową zmienną, która nie jest bezpośrednio obserwowalna, ale jest
wyznaczana na podstawie zmiennych pierwotnych.
Czynniki te odzwierciedlają w zwięzły (syntetyczny) sposób znaczącą część
informacji zawartą w zbiorze danych, a jednocześnie każdy z nich niesie nowe
treści merytoryczne.
Mogą one też być postrzegane jako pewne „identyfikatory” grupujące wyjściowe
zmienne w spójne pod względem merytorycznym grupy.
Czynniki – wykorzystanie
Analiza badanych zjawisk z punktu widzenia nowych, syntetycznych kategorii, którymi są wyodrębnione czynniki
Tworzenie skal i miar złożonych z kilku pytań
Ustalanie wag określających znaczenie, jakie należy przypisać
poszczególnym zmiennym i czynnikom w trakcie analiz
Ortogonalizacja przestrzeni, w której rozpatrywane są obiekty, będące
przedmiotem badań
Konstruowanie modeli ekonometrycznych (regresja)
Przykład
Mamy dwa pytania: Czy są zadowoleni ze swojego hobby? Jak intensywnie uprawiają hobby?Odpowiedzi będą ze sobą wysoce skorelowane, możemy więc
wnioskować, że są one redundantne. Połączenie dwóch zmiennych w jeden czynnik:Dopasowanie linii, która "najlepiej" oddaje związek liniowy między
oboma zmiennymi. Gdybyśmy mogli zdefiniować taką zmienną, która w przybliżeniu określałaby linię regresji na wykresie rozrzutu, wówczas zmienna ta obejmowałaby większość informacji zawartej w obu pytaniach. W kolejnych analizach można by było wykorzystaćtaki nowy czynnik, w zastępstwie pierwotnych pytań. Jest to w pewnym sensie redukcja dwóch zmiennych do jednego czynnika. Nowy czynnik jest w rzeczywistości kombinacją liniową tych dwóch zmiennych.
Dane
Zmienne mierzone na skali przedziałowej lub ilorazowej (skala Likerta, dyferencjał semantyczny)
Zmienne, które są wskaźnikami ukrytych konceptów (nie przypadkowe )
Odpowiednie próby: zaleca się aby było przynajmniej cztery lub pięć razy tyle obserwacji (rozmiar próby) ile jest zmiennych.
Procedura
Wybór zmiennych do analizy
Wyznaczenie macierzy korelacji (kowariancji)
Stwierdzenie zasadności przeprowadzenia analizy czynnikowej
Wybór modelu czynnikowego
Wyznaczenie głównych składowych / czynników – wybór ich liczby
Rotacja
Interpretacja
MetodologiaPrzedmiot analizy:
macierz danych, zawierająca n realizacji m zmiennych:
Zmienne pierwotne podlegają standaryzacji:
nimj
xxX ijij ,...,2,1,...,2,1
,0,
Z= [ zij]
Podstawą do wyznaczania elementów macierzy współczynników
czynników jest macierz korelacji:
mjpzzn
ZZn
rR ij
n
iipij ...1,1'1
1
Wariancje na głównej przekątnej są miarą zasobów informacyjnych
zmiennych pierwotnych.
Metodologia
Model czynnikowy
Jeżeli macierz korelacji zmiennych pierwotnych jest odpowiednia do zastosowania analizy czynnikowej można przejść do następnego etapu - wyboru modelu czynnikowego. Określa on sposób identyfikacji czynników.
Metody czynnikowe dzieli się najogólniej na dwie podstawowe grupy: analiza głównych składowych metody klasycznej analizy czynnikowej (np. metoda osi głównych,
metoda największej wiarygodności)
Analiza czynnikowa
... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych powiązań między zmiennymi
Pozwala na sprowadzenie dużej liczby badanych zmiennych do znacznie mniejszej liczby wzajemnie niezależnych (nieskorelowanych) czynników
Analiza czynnikowa to metoda modelowania liniowego – zakłada się, że zmienne można przedstawić za pomocą liniowej funkcji zmiennych nieobserwowalnych (czynników), przy czym wszystkie zmienne przedstawiane są jako funkcje tych samych czynników
W praktyce – poszukujemy modelu czynnikowego, który by pasował do zastanej macierzy korelacji zmiennych pierwotnych
Analiza głównych składowych
… jest metodą transformacji zmiennych w nowe, ortogonalne zmienne, tzw. główne składowe.
To przede wszystkim procedura ortogonalizacji zmiennych ułatwiająca budowę teoretycznego modelu opisującego strukturę i związki między badanymi zjawiskami.Klasyczna analiza czynnikowa zaś sama w sobie jest takim modelem
=> Mimo podobnych celów i wyników NIE SĄ tym samym – metodologia się różni !!
17
Metoda głównych składowych
polega na przekształceniu obserwowalnych zmiennych wejściowych w nowe, nieobserwowalne i zarazem nieskorelowane zmienne nazywane głównymi składowymi
każda z głównych składowych jest liniową funkcją zmiennych wejściowych główne składowe są tak uporządkowane, aby wariancje kolejnych głównych
składowych (stanowiące miarę ich zasobów informacyjnych o badanym zjawisku) były coraz mniejsze
suma wariancji wszystkich zmiennych wejściowych jest równa sumie wariancji głównych składowych, co oznacza że przekształcenie zmiennych wejściowych w główne składowe nie prowadzi do żadnych strat informacji o badanym zjawisku
kilka pierwszych głównych składowych zawiera zdecydowaną większośćinformacji o badanym zjawisku, dostarczanych przez zmienne wejściowe, co pozwala na redukcję liczby głównych składowych przy możliwie małej stracie informacji wejściowych
W praktyce chodzi o sprawdzenie, czy kilka nowych zmiennych wyjaśnia maksymalnie dużo zmienności wyjściowego układu przy zachowaniu nieskorelowania, co daje w efekcie redukcję wymiaru.
Metoda głównych składowych
Metoda głównych składowych
Zmienne pierwotne po standaryzacji można przedstawić jako liniową kombinację
głównych składowych:
ZT = AGT
G = AT Z
gdzie:
Z - macierz i standaryzowanych zmiennych pierwotnych
A - macierz współczynników składowych głównych
G - macierz i składowych głównych
20
Pierwsza główna składowa G1 jest taką kombinacją zmiennych pierwotnych, dla której wariancja próbkowa jest największa wśród wszystkich kombinacji liniowych (przy warunku jednoznacznego wyznaczenia wektora współczynników).
Druga główna składowa G2 - analogicznie - jest kombinacją liniową zmiennych pierwotnych , dla której wariancja próbkowa jest kolejna największa
(przy warunku jednoznacznego wyznaczenia wektora współczynników oraz dodatkowym, zapewniającym ortogonalność powstałych składowych -konsekwencją tego jest sumowanie się kolejnych wariancji głównych składowych do wariancji całkowitej).
Metoda głównych składowych
Każda i-ta główna składowa jest liniowa kombinacją zmiennych pierwotnych i
wyjaśnia i-tą część całkowitej zmienności.
Kolejne główne składowe są tak wyznaczane, aby wariancje kolejnych
składowych były coraz mniejsze.
Można wyznaczyć tyle głównych składowych, ile mamy zmiennych
wyjściowych, jednak zazwyczaj kilka pierwszych wystarcza do wyjaśnienia
większości wariancji układu zmiennych.
Metoda głównych składowych
Znaczenie i użyteczność składowej głównej jest mierzona wielkością wyjaśnianej
przez nią całkowitej zmienności. I tak, jeśli w układzie sześciu zmiennych
pierwsza składowa wyjaśnia np. 85% zmienności, to znaczy to, że niemal cała
zmienność tego układu da się przedstawić na prostej zamiast w sześciu
wymiarach.
W efekcie powstaje nam tyle głównych składowych, ile było początkowo
zmiennych: nadal mamy układ m-wymiarowy. Ale w praktyce ograniczamy się do
kilku pierwszych głównych składowych, które wyjaśniają z góry ustaloną część
wariancji całkowitej, np. 75%.
Klasyczna analiza czynnikowa
analiza czynnikowa jest metodą badania struktury wewnętrznych zależności obserwacji wielowymiarowych
każda zmienna obserwowalna (wejściowa) przedstawiana jest jako kombinacja liniowa pewnej liczby nieobserwowalnych zmiennych, zwanych czynnikami, wspólnych dla całego zbioru zmiennych wejściowych oraz jednego nieobserwowalnego czynnika swoistego dla tej zmiennej
czynniki wspólne i czynniki swoiste nie są ze sobą skorelowane. celem analizy czynnikowej jest znalezienie takiego zbioru czynników
wspólnych oraz określenie ich relacji ze zmiennymi obserwowalnymi, który pozwala na wyjaśnienie struktury powiązań między zmiennymi obserwowalnymi
Klasyczna analiza czynnikowa
Zakładamy, że źródłem wzajemnych zależności (skorelowania) między
zmiennymi są ukryte wspólne czynniki, które można uznać za nośniki tej
samej informacji, chcemy zatem je wyodrębnić w formie nowych,
syntetycznych zmiennych.
Jednak zakładamy też, że nie cała wariancja zmiennych jest powodowana
tymi ukrytymi wspólnymi czynnikami – każda zmienna pierwotna
charakteryzuje się też pewnymi specyficznymi właściwościami.
Zatem każda z obserwowalnych zmiennych Z jest funkcją liniową zmiennych
nieobserwowalnych (czynników wspólnych) oraz pojedynczej zmiennej
specyficznej:
Z = AF + BUgdzie:Z - macierz j standaryzowanych zmiennych pierwotnychA - macierz ładunków czynnikowych czynników wspólnychF - macierz czynników wspólnychB – macierz (diagonalna) ładunków czynnikowych czynników specyficznychU - macierz czynników specyficznych
Założenia:- czynniki wspólne nie są skorelowane ze sobą- czynniki specyficzne również nie są ze sobą skorelowane- czynniki wspólne nie są skorelowane z czynnikami specyficznymi
26
Klasyczna analiza czynnikowa
Podstawą identyfikacji składników wspólnych i specyficznych w macierzy R jest w
analizie czynnikowej podział wariancji poszczególnych zmiennych na wariancję
wspólną i specyficzną:
h j2 - zasób zmienności wspólnej /communality/ - część wariancji
objaśniona przez czynniki wspólne
- zasób zmienności swoistej - pozostałość po odjęciu zasobuzmienności wspólnej od wariancji całkowitejw j
2
Klasyczna analiza czynnikowa
Dążymy do eliminacji wpływu czynników specyficznych na rzecz czynników
wspólnych. W tym celu zastępujemy w macierzy R współczynniki korelacji na
głównej przekątnej zasobami zmienności wspólnej, otrzymując tzw. zredukowaną
macierz korelacji :
~ ~~Rr r dla i jr h dla i jij ij
ij j
2
Klasyczna analiza czynnikowa
Wartości hj2 ustala się na poziomie:
średniej arytmetycznej współczynników korelacji danej zmiennej z
innymi zmiennymi: hj2 =
najwyższego co do modułu współczynnika korelacji j-tej zmiennej
z pozostałymi: hj2 = max [|rij |], i ≠ j
współczynnika determinacji wielorakiej R2 danej zmiennej z innymi
zmiennymi
m
iijrm 1
1
Klasyczna analiza czynnikowa
Kolejne wartości i wektory własne służą do uzyskania ładunków czynnikowych
kolejnych czynników.
Ładunki te odzwierciedlają korelację pomiędzy j-tą zmienną pierwotną i l-tym
wspólnym czynnikiem.
Najczęściej wybierane metody wyodrębniania czynników:
• Metoda Osi Głównych (Principal Axis Factor)
• Metoda Największej Wiarygodności (Maximum Likelihood)
Klasyczna analiza czynnikowa
Kryteria stosowalności analizy czynnikowej
Silne korelacje między zmiennymi
Indeks KMO (Kaiser-Meyer-Olkin)– indeks ten porównuje cząstkowe współczynniki korelacji z
dwuzmiennowymi współczynnikami korelacji. Przyjmuje wartości od 0 do 1, gdzie ) oznacza, że spodziewana redukcja będzie niewielka, więc stosowanie analizy czynnikowej nie ma sensu. Jest sens, gdy KMO jest większe od 0.5
Test Sferyczności Bartletta- test hipotezy, że macierz współczynników korelacji jest macierzą
jednostkową, co oznacza, że nie ma istotnych korelacji między zmiennymi. Odrzucenie hipotezy zerowej świadczy o zasadności przeprowadzenia analizy
33
KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of Sampling Adequacy. ,831
Bartlett's Test of Sphericity Approx. Chi-Square 11905,395
df 300Sig. ,000
Kryteria wyboru liczby czynników
1. Kryterium Kaisera - metoda "wartości własnej (lambda) większej od jedności" - jest najczęściej stosowana. Jej podstawą jest to, że każda główna składowa powinna wyjaśniać przynajmniej tyle, ile jedna zmienna pierwotna. Metoda ta powinna być stosowana gdy ilość zmiennych jest większa od 20. Gdy liczba zmiennych jest mniejsza istnieje tendencja wyodrębniania zbyt małej ilości czynników
2. Kryterium Joliffe’a – j.w., lecz graniczna wartość to 0,7. Korekta wynika stąd, że główne składowe, które w populacji mają wartość własną >1 mogąmieć w próbie tę wartość mniejszą niż 1, ze względu na błąd losowy próby
Kryteria wyboru liczby czynników
3. Wykres osypiska (kryterium Cattella) – wykres ilości czynników i ich wartości własnych. Identyfikujemy na nim "punkt załamania", w którym kąt załamania krzywej ("rumowisko"). Punkt ten określa liczbę czynników kwalifikujących się do dalszej analizy. Chodzi o to, aby uchwycić punkt, w którym dalsze zwiększanie liczby czynników będzie powodowało jedynie niewielkie przyrosty w sensie wyjaśnianej wariancji (gdy wykres zaczyna się„wypłaszczać”). Metoda ta jest nieco bardziej "liberalna" niż metoda >1, pozwala włączyć do dalszej analizy nieco większą liczbę czynników
4. Skumulowany procent wyjaśnionej wariancji analizowanych zmiennych - do ogólnej liczby wybranych czynników zalicza się te czynniki, które w sumie wyjaśniają np.. 75%, 80% lub 90% wariancji, a żaden następny nie tłumaczy więcej niż 5% wariancji
5. Interpretowalność merytoryczna czynników
Składowa
Początkowe wartości własneSumy kwadratów ładunków po
wyodrębnieniuSumy kwadratów ładunków po rotacji
Ogółem%
wariancji%
skumulowany Ogółem%
wariancji%
skumulowany Ogółem%
wariancji%
skumulowany
1 13,843 55,373 55,373 13,843 55,373 55,373 6,552 26,208 26,208
2 1,609 6,436 61,809 1,609 6,436 61,809 4,068 16,274 42,482
3 1,200 4,800 66,610 1,200 4,800 66,610 3,207 12,828 55,311
4 ,875 3,501 70,110 ,875 3,501 70,110 3,039 12,157 67,468
5 ,768 3,072 73,182 ,768 3,072 73,182 1,429 5,714 73,182
6 ,718 2,872 76,054
7 ,596 2,383 78,438
8 ,578 2,311 80,749
9 ,504 2,016 82,765
10 ,455 1,818 84,583
11 ,390 1,561 86,144
12 ,374 1,495 87,640
13 ,344 1,375 89,015
14 ,316 1,262 90,277
15 ,291 1,164 91,441
16 ,280 1,120 92,562
17 ,268 1,072 93,634
18 ,254 1,015 94,649
19 ,230 ,920 95,569
20 ,221 ,885 96,454
21 ,211 ,843 97,297
22 ,192 ,769 98,066
23 ,179 ,718 98,784
24 ,168 ,672 99,456
Metoda wyodrębniania czynników - Głównych składowych.
Kryteria wyboru liczby czynników
Najrozsądniejszą zasadą jest zatrzymanie się na takiej liczbie czynników, które są sensowne.
Jeśli czynnik, który miałby być wyłączony przestaje być sensowny, to nie powinien być uwzględniany.
=> Wybór liczby czynników jest zazwyczaj bardzo subiektywny
Interpretacja
Czynnik jest interpretowany na podstawie ładunków czynnikowych (ew. rotowanych)Ładunki czynnikowe są korelacjami miedzy czynnikami a początkowymi zmiennymi => dostarczają informacji do subiektywnego zidentyfikowania i nazwania nieobserwowalnych czynników głównych (wymiarów)
Każdy czynnik podlega interpretacji ze względu na te zmienne pierwotne, które mają wysokie ładunki czynnikowe. Istotne ładunki czynnikowe to najczęściej > 0.3
Ideanie byłoby, gdyby każda zmienna miała duży ładunek tylko dla jednego czynnika – jeśli jest inaczej, zmienną pierwotną należy uwzględnić w interpretacji wszystkich czynników, dla których jej ładunek jest istotny.
Zmienne pierwotne bez dużych ładunków w żadnym z czynników – usunąć z analizy.
Czynniki zadowolenia z pracy na stacji
4.7
4.4
4.5
4.4
4.2
4.4
3.9
4.2
4.5
4.0
4.1
4.0
3.5
4.0
3.7
4.0
3.6
3.54.4
Prowadzący [N=450]Pracownik [N=675]
Ocena aspektów w podziale na prowadzących i pracowników stacji
(skala: 1 – zdecydowanie się nie zgadzam 5 – zdecydowanie się zgadzam)
Zmienne wpływające na satysfakcje z pracy zostały w drodze analizy czynnikowej podzielone na dwa czynniki. Pierwsza skupia te aspekty, które mówią o satysfakcji z siebie, jako pracownika i własnych osiągnięć, a druga aspekty związane z dbałością firmy i możliwościami jakie daje FIRMA.
Przykład 1a.Badanie satysfakcji pracowników FIRMY X
Firma
Czynniki wyodrębnione – miejsce pracownika w społeczności FIRMY X
4.7
4.7
4.7
4.6
3.7
3.7
3.9
4.6
4.6
4.5
4.4
3.4
3.5
3.4
3.5
Prowadzący [N=450]Pracownik [N=675]
Ocena aspektów w podziale na prowadzących i pracowników
(skala: 1 – zdecydowanie się nie zgadzam 5 – zdecydowanie się zgadzam)
wartość istotnie większa
Przykład 1b.Badanie satysfakcji pracowników FIRMY X
Firmy
Firmy
Prowadzący
Firma
Firmą
Składowa
1 2 3 4 5
Lubię poprawiać sobie nią nastrój ,787 ,302 ,200
Marka dla ludzi takich jak ja ,783 ,213 ,219 ,291
Poleciłbym tę markę innym ,739 ,352 ,241 ,337
Ta marka wódki jest ceniona przez znajomych, z którymi ją piję ,716 ,361 ,203 ,223
Na spotkania z przyjaciółmi ,691 ,464 ,250 ,219
Po wypiciu nawet dużej ilości wódki tej marki, następnego dnia czuję się dobrze ,670 ,225 ,216 ,366
Zakupił(a)bym tę markę organizując ważne przyjęcie dla dużej liczby osób ,660 ,478 ,257
Wódka tej marki łatwo wchodzi ,631 ,360 ,313 ,261
Marka warta swej ceny ,592 ,310 ,208 ,530
Wódka tej marki jest mocna ,714 ,322
Marka dobra na prezent ,361 ,635 ,340
Odpowiednia do uczczenia specjalnych okazji ,476 ,618 ,361
Nie wstydził(a)bym się wódką tej marki poczęstować gości ,435 ,597 ,291 ,308
Nadaje się do dobrej zabawy w męskim towarzystwie ,583 ,594 ,272
Prestiżowa marka ,495 ,567 ,263 ,363
Odrobina wódki tej marki pomaga rozkręcić zabawę / imprezę ,458 ,520 ,306 ,249 ,249
Jest odpowiednia przede wszystkim dla kobiet ,774
Pasuje do deseru ,259 ,765
Wódka tej marki nie ma ostrego zapachu ,328 ,682 ,224
Jest na tyle łagodna, że nie trzeba jej zagryzać ani popijać ,270 ,567 ,315 ,438
Marka naprawdę inna od pozostałych ,394 ,223 ,725
Osobom, które jej nigdy nie próbowały jej smak może nie przypaść do gustu ,690 ,338
Wódka tej marki ma oryginalny smak ,250 ,310 ,271 ,620 ,253
Marka bardzo wysokiej jakości ,493 ,421 ,256 ,583
Można używać jej w celach leczniczych, np. w trakcie przeziębienia ,226 ,203 ,718
Przykład 2. Alkohole – wymiary oceny
Przykład 2 cd.
1. to marka moja i moich znajomych: Lubię poprawiać sobie nią nastrój, Marka dla ludzi takich jak ja, Poleciłbym tę markę innym, Ta marka wódki jest ceniona przez znajomych, z którymi ją piję, Na spotkania z przyjaciółmi, Po wypiciu nawet dużej ilości wódki tej marki, następnego dnia czuję się dobrze, Zakupił(a)bym tę markę organizując ważne przyjęcie dla dużej liczby osób, Wódka tej marki łatwo wchodzi, Marka warta swej ceny
2. dobra do zabawy: Wódka tej marki jest mocna, Marka dobra na prezent, Odpowiednia do uczczenia specjalnych okazji, Nie wstydził(a)bym się wódkątej marki poczęstować gości, Nadaje się do dobrej zabawy w męskim towarzystwie, Prestiżowa marka, Odrobina wódki tej marki pomaga rozkręcićzabawę / imprezę
3. kobieca, delikatna: Jest odpowiednia przede wszystkim dla kobiet, Pasuje do deseru, Wódka tej marki nie ma ostrego zapachu, Jest na tyle łagodna, że nie trzeba jej zagryzać ani popijać,
4. wyjątkowa, wysokiej jakości, inna: Marka naprawdę inna od pozostałych, Istnieje krąg ludzi lubiących tę markę ale osobom, które jej nigdy nie próbowały jej smak może nie przypaść do gustu, Wódka tej marki ma oryginalny smak, Marka bardzo wysokiej jakości
5. lecznicza: Można używać jej w celach leczniczych, np. w trakcie przeziębienia
Wyznaczanie wartości czynników
Na koniec najczęściej potrzebny jest sposób wyznaczenia wartości
poszczególnych czynników dla kolejnych obserwacji.
Jest wiele metod szacowania wartości czynników (np. w SPSS są 3):
• Regresyjna (daje oszacowania najbliższe rzeczywistym wartościom czynnikowym)
• Bartletta
• Andersona-Rubina
Na ogół dąży się do tego, aby ładunki czynnikowe, tj. współczynniki korelacji między poszczególnym wskaźnikiem a danym czynnikiem, miały wartości bliskie 0 lub bliskie maksymalnej wartości +1 lub –1.
Poszukuje się takiego układu czynnikowego, aby każdy wskaźnik miał wysoki ładunek tylko na jednym czynniku i aby każdy czynnik miał wartości tych ładunków bliskie 0 dla kilku wskaźników i bliskie wartościom maksymalnym dla pozostałych.
Nie zawsze bezpośrednio osiągalne = > rotacja
Rotacja polega na sprowadzeniu struktury ładunków do prostej struktury, w której punkty reprezentujące zmienne skupiają się wokół osi czynników, co zapewniła możliwie najłatwiejszą interpretację czynników.
Rotacja
Rotacja
Najczęściej stosuje się procedury rotacji ortogonalnej:
VARIMAX upraszcza interpretację czynników (minimalizuje liczbę zmiennych
potrzebnych do wyjaśnienia danego czynnika) QUARTIMAXupraszcza
interpretację zmiennych (minimalizuje liczbę czynników potrzebnych do
wyjaśnienia danej zmiennej).
Rotacje nieortogonalne – dopuszczamy skorelowanie powstałych czynników!
47
Analiza czynnikowa Analiza głównych składowychCh. Spearman (1904), L.L. Thurstone (1913) H. Hotteling (1933)
orientacja kowariancyjna: punktem wyjścia jest zredukowana macierz korelacji
orientacja wariancyjna: punktem wyjścia jest zwykła macierz korelacji
model otwarty: obok wariancji cech uwzględnia się także wariancjęnieobjaśnianą (zm. pominięte, losowośćobserwacji)
model zamknięty: uwzględnia się wyłącznie wariancję badanych zmiennych
każda zmienna pierwotna jest funkcjąnieobserwowanych czynników wspólnych i czynnika swoistego
zmienne pierwotne są liniową funkcjąskładowych głównych (a główne składowe można przedstawić jako kombinacje liniowe zmiennych pierwotnych)
buduje się teoretyczny model zjawiska i sprawdza, czy jest zgodny z danymi empirycznymi
wychodzi się od obserwacji empirycznych, a następnie buduje model teoretyczny
Celem analizy jest identyfikacja ukrytych zmiennych
Celem analizy jest uproszczenie struktury danych
równanie podstawowe: Z=AF + BU równanie podstawowe: ZT = AGT / G = AT Z
Podsumowanie
48
PCAComponent
FAFactor
1 2 3 4 1 2 3 4Z1b. I try to buy products which are currently advertised ,740 ,110 Z1b. I am curious about new products which
appear in shops,671 ,267
Z1b. I am curious about new products which appear in shops
,721 ,232 -,108 Z1b. I try to buy products which are currently advertised
,660 ,102
Z1b. I just enjoy spending my free time in a store ,652 ,183 Z1b. I just enjoy spending my free time in a store ,564 ,200 ,111
Z1b. I often shop for products I need at parties, social gatherings etc.
,635 ,182 Z1b. I often shop for products I need at parties, social gatherings etc.
,542 ,185
Z1b. I often buy ready-to-use products or instant products ,572 -,151 Z1b. I often buy ready-to-use products or instant products
,469
Z1b. When I shop, I often opt for diet/light products ,425 ,119 ,252 ,374 Z1b. Most of my shopping is unplanned / decide to buy things on impulse, on the spur of the moment
,410 -,233
Z1b. I take a lot of care to learn what my loved ones really like and I shop to with their preferences in mind
,677 ,197 Z1b. When I shop, I often opt for diet/light products
,365 ,138 ,171 ,354
Z1b. It is very important for me that products I buy are really healthful/natural
,676 ,277 Z1b. It is very important for me that products I buy are really healthful/natural
,633 ,180
Z1b. I spend considerable time looking for fresh/safe products
,195 ,591 ,148 ,207 Z1b. I take a lot of care to learn what my loved ones really like and I shop to with their preferences in mind
,540 ,212
Z1b. Most of my shopping is unplanned / decide to buy things on impulse, on the spur of the moment
,440 -,471 ,282 Z1b. I spend considerable time looking for fresh/safe products
,143 ,499 ,127 ,245
Z1b. I try to choose stores where I know the sales staff and I can have a nice chat with them
-,230 ,156 ,656 ,212 Z1b. When shopping I want to show I am a good homemaker/host to make sure nobody can blaming for not taking enough care of my home
,196 ,346 ,619
Z1b. It is important for me that products I buy are recognised and appreciate by people around me and impress others
,392 ,168 ,650 Z1b. It is important for me that products I buy are recognised and appreciate by people around me and impress others
,363 ,152 ,610
Z1b. When shopping I want to show I am a good homemaker/host to make sure nobody can blaming for not taking enough care of my home
,226 ,391 ,629 Z1b. I try to choose stores where I know the sales staff and I can have a nice chat with them
-,137 ,204 ,353 ,187
Z1b. As a rule, I do not hesitate to make comments to the staff if things in a store are not the way think they should be
-,166 ,204 ,739 Z1b. I enjoy shopping with a shopping list I prepared earlier
,219 ,389
Z1b. I enjoy shopping with a shopping list I prepared earlier
,396 -,197 ,675 Z1b. As a rule, I do not hesitate to make comments to the staff if things in a store are not the way think they should be
,379
Zwyczaje zakupowe
ANALIZA CZYNNIKOWA
Analiza eksploracyjnaczynniki są początkowo nieznane i zostają wyodrębnione dzięki analizie: dane
grupowane są w zbiory zmiennych najsilniej ze sobą skorelowanych →wykrywanie związków między zmiennymi bez wstępnych założeń
Analiza konfirmacyjna → weryfikacja hipotez co do określonej z góry struktury czynników i estymacja parametrów założonego modelu