81
Faktorska analiza (Factor Analysis) Faktorskom se analizom ispituju međuzavisnosti unutar velikog broja varijabli, te ih sa nastoji objasniti pomoću malog broja zajedničkih faktora.

Faktorska analiza ( Factor Analysis)

  • Upload
    alva

  • View
    99

  • Download
    4

Embed Size (px)

DESCRIPTION

Faktorska analiza ( Factor Analysis). Faktorskom se analizom ispituju međuzavisnosti unutar velikog broja varijabli, te ih sa nastoji objasniti pomoću malog broja zajedničkih faktora. Faktorska analiza ubraja se u metode međuzavisnosti, a primjenjuje se: Za redukciju podataka - PowerPoint PPT Presentation

Citation preview

Page 1: Faktorska analiza  ( Factor Analysis)

Faktorska analiza (Factor Analysis)

Faktorskom se analizom ispituju međuzavisnosti unutar velikog broja varijabli, te ih sa nastoji objasniti pomoću malog broja zajedničkih faktora.

Page 2: Faktorska analiza  ( Factor Analysis)

Faktorska analiza ubraja se u metode međuzavisnosti, a primjenjuje se:

• Za redukciju podataka

• Za otkrivanje strukture povezanosti među varijablama, odnosno za klasifikaciju varijabli

Page 3: Faktorska analiza  ( Factor Analysis)

• Osnovni cilj faktorske analize je sažeti informacije sadržane u velikom broju izvornih varijabli u manji broj zajedničkih faktora uz minimalan gubitak informacija, te postići bolje razumijevanje odnosa među varijablama.

Page 4: Faktorska analiza  ( Factor Analysis)

U faktorskoj analizi su izvorne varijable prikazane kao linearne kombinacije faktora

U analizi glavnih komponenata su glavne komponente predočene kao linearna kombinacija izvornih varijabli

Page 5: Faktorska analiza  ( Factor Analysis)

Izvorne varijable manifestne varijable

Faktori latentne varijable

Page 6: Faktorska analiza  ( Factor Analysis)

Zadaci faktorske analize:

• određivanje faktora i faktorskih bodova • objašnjavanje većeg broja varijabli na

osnovi manjeg broja faktora

• identificiranje dimenzija koje se ne mogu odmah uočiti

Page 7: Faktorska analiza  ( Factor Analysis)

Eksploratorna faktorska analiza EFA

• EFA je postupak redukcije podataka

• Traže se faktori (latentni korijeni) koji se mogu upotrijebiti za opisivanje velikog broja ulaznih varijabli

• Koliko faktora treba odabrati da gubitak informacija ne bude velik?

Konfirmatorna faktorska analiza CFA

• CFA je postupak kojeg je razvio Spearman početkom 20. stoljeća da potvrdi tzv. “dvofaktorsku teoriju” inteligencije. U stvari je bio specificiran samo jedan faktor, a drugi se faktor sastojao od niza faktora specifičnih za svaku pojedinu varijablu

Page 8: Faktorska analiza  ( Factor Analysis)

Pretpostavlja se da su sve varijable unutar pojedine grupe visoko korelirane, te da su slabo korelirane s varijablama iz ostalih grupa.

Tada svaka grupa varijabli reprezentira jedan faktor (latentnu varijablu), odgovoran za opažene korelacije.

Page 9: Faktorska analiza  ( Factor Analysis)

Prije provođenja faktorske analize:

Definirati problemUtvrditi koje i koliko izvornih varijabli će se

analiziratiUtvrditi metrička svojstva varijabliOdabrati veličinu uzorka Ispitati prikladnost podataka za primjenu

FA.

Page 10: Faktorska analiza  ( Factor Analysis)

izlučivanje faktora

interpretacija izlučenih faktora.

Rotacija izlučenih faktora

Interpretacija i validacija rotiranih faktora

Page 11: Faktorska analiza  ( Factor Analysis)

Vrste faktora u faktorskoj analiziZajednički faktori Specifični faktori

Karakteristični za barem dvije varijable

Nisu međusobno korelirani, a nisu korelirani niti sa specifičnim faktorima.

Određenim postupcima zajednički faktori mogu se dovesti u korelaciju ukoliko to zahtijeva priroda pojave koju se analizira.

Odnose se na samo jednu varijablu. Nisu međusobno korelirani

Page 12: Faktorska analiza  ( Factor Analysis)

Osnovni model faktorske analize

mmpmpppp

mm

mm

eFFFX

eFFFX

eFFFX

...

.

...

...

2211

2222212122

1121211111

Pretpostavka je da postoje originalne ili izvorne varijable

piX i ,,2,1, koje će se povezati u manji broj latentnih faktora

Page 13: Faktorska analiza  ( Factor Analysis)
Page 14: Faktorska analiza  ( Factor Analysis)
Page 15: Faktorska analiza  ( Factor Analysis)
Page 16: Faktorska analiza  ( Factor Analysis)
Page 17: Faktorska analiza  ( Factor Analysis)

• U modelu (2.1) p odstupanja izvornih varijabli izraženo je pomoću p+m neopservabilnih slučajnih varijabli (m zajedničkih i p specifičnih faktora). Tu je razlika između faktorskog modela i modela multiple linearne regresije. U regresijskom modelu nezavisne varijable (čije je mjesto u modelu (2.1) popunjeno zajedničkim faktorima) su opservabilne.

• Polazne pretpostavke i relacija (2.2) određuju ortogonalni faktorski model s m zajedničkih faktora:

Page 18: Faktorska analiza  ( Factor Analysis)
Page 19: Faktorska analiza  ( Factor Analysis)

LFLFLFLFXX ))((

LLELFELFELFFEL

XXEXCov

LL

I

)()()()(

))(()(

00

Matrica varijanci i kovarijanci vektora X:

Page 20: Faktorska analiza  ( Factor Analysis)
Page 21: Faktorska analiza  ( Factor Analysis)
Page 22: Faktorska analiza  ( Factor Analysis)

FFLFFLFFX )()(

LFEFFELFFLFE

FLFEFXEFXCov

I

0

)()()(

)()(),(

[1]

Dokaz za 2:

Page 23: Faktorska analiza  ( Factor Analysis)
Page 24: Faktorska analiza  ( Factor Analysis)
Page 25: Faktorska analiza  ( Factor Analysis)

iiii h 2

Varijanca varijable Xi:

Kovarijanca varijabli Xi i Xj:

m

jljijil

1

Page 26: Faktorska analiza  ( Factor Analysis)

Primjer

može se provjeriti pomoću matrične algebre.

Page 27: Faktorska analiza  ( Factor Analysis)
Page 28: Faktorska analiza  ( Factor Analysis)

1211

212

21111 )( h

21721419var.

22

)1(

spectkomunaliteXVar

Page 29: Faktorska analiza  ( Factor Analysis)
Page 30: Faktorska analiza  ( Factor Analysis)
Page 31: Faktorska analiza  ( Factor Analysis)
Page 32: Faktorska analiza  ( Factor Analysis)
Page 33: Faktorska analiza  ( Factor Analysis)

• Postoje različite metode za provođenje rotacije faktora. Dvije su osnovne skupine metoda:

• metode ortogonalne (orthogonal) rotacije i

• metode kosokutne (oblique) rotacije faktora.

Page 34: Faktorska analiza  ( Factor Analysis)
Page 35: Faktorska analiza  ( Factor Analysis)
Page 36: Faktorska analiza  ( Factor Analysis)

Korelacijske matrice u faktorskoj

• Korelacijska matrica osnova je provođenja faktorske analize, a sadrži koeficijente korelacije između izvornih varijabli.

• S obzirom na vrijednosti koje se nalaze na glavnoj dijagonali korelacijske matrice razlikuju se

potpuna i reducirana korelacijska matrica.

Page 37: Faktorska analiza  ( Factor Analysis)

Kod potpune korelacijske matrice na glavnoj dijagonali nalaze se jedinice, a naziva se potpuna jer se zasniva na ukupnoj varijanci.

Kod reducirane korelacijske matrice na glavnoj dijagonali nalaze se procjene komunaliteta, a naziva se reducirana jer se zasniva na zajedničkoj varijanci.

Page 38: Faktorska analiza  ( Factor Analysis)

Ovisno o polaznoj matrici postoje brojne varijacije faktorskih modela. Najčešće primjenjivane su:

• faktorska analiza glavnih komponenata (principal component factor analysis)

• polazi od potpune korelacijske matrice.

• faktorska analiza zajedničkih faktora polazi od reducirane korelacijske matrice

Page 39: Faktorska analiza  ( Factor Analysis)

Faktorska analiza glavnih komponenata

→odabrati nekoliko prvih glavnih komponenata kao nerotirane faktore.

U faktorskoj analizi glavnih komponenata model ne diferencira zajedničku i specifičnu varijancu

→ komponente se zasnivaju na ukupnoj varijanci. Stoga izlučene komponente sadrže i specifičnu

varijancu. • Faktorska analiza glavnih komponenata se

provodi na potpunoj korelacijskoj matrici, → na glavnoj dijagonali se nalaze jedinice čime se uključuje ukupna varijanca.

Page 40: Faktorska analiza  ( Factor Analysis)
Page 41: Faktorska analiza  ( Factor Analysis)
Page 42: Faktorska analiza  ( Factor Analysis)
Page 43: Faktorska analiza  ( Factor Analysis)
Page 44: Faktorska analiza  ( Factor Analysis)
Page 45: Faktorska analiza  ( Factor Analysis)
Page 46: Faktorska analiza  ( Factor Analysis)
Page 47: Faktorska analiza  ( Factor Analysis)
Page 48: Faktorska analiza  ( Factor Analysis)
Page 49: Faktorska analiza  ( Factor Analysis)
Page 50: Faktorska analiza  ( Factor Analysis)

Faktorska analiza zajedničkih faktora

Page 51: Faktorska analiza  ( Factor Analysis)

Faktorska analiza zajedničkih faktora

Page 52: Faktorska analiza  ( Factor Analysis)
Page 53: Faktorska analiza  ( Factor Analysis)
Page 54: Faktorska analiza  ( Factor Analysis)
Page 55: Faktorska analiza  ( Factor Analysis)

Osnova za provođenje faktorske analize zajedničkih faktora je reducirana korelacijska matrica na čijoj se glavnoj dijagonali nalaze procjene komunaliteta. Postoje različiti načini procjene komunaliteta:

• kvadrati koeficijenata multiple korelacije između neke od promatranih varijabli i preostalih p-1 varijabli

• kvadrati najvećeg koeficijenta korelacije koji neka promatrana varijabla ima s nekom drugom varijablom.

Page 56: Faktorska analiza  ( Factor Analysis)

Razlike između faktorske analize zajedničkih

faktora i faktorske analize glavnih komponenti • Osnovna razlika između faktorske analize glavnih

komponenata i faktorske analize zajedničkih faktora proizlazi iz koncepcije kompozicije ukupne varijance.

• Faktorska analiza glavnih komponenata polazi od ukupne varijance, te se izlučeni faktori zasnivaju na ukupnoj varijanci, dok faktorska analiza zajedničkih faktora diferencira zajedničku i specifičnu varijancu, te se izlučeni faktori zasnivaju na zajedničkoj varijanci.

Page 57: Faktorska analiza  ( Factor Analysis)

• Faktorska analiza zajedničkih faktora primjenjuje se ako istraživač ne može sa sigurnošću pretpostaviti kolika je količina specifične varijance i želi je isključiti.

• Suprotno tome faktorska analiza glavnih komponenata primjenjuje se ako prethodne spoznaje ukazuju da specifična varijanca čini manju proporciju ukupne varijance.

Page 58: Faktorska analiza  ( Factor Analysis)

PRIMJER• Primjer se zasniva na skupu fiktivnih

podataka koji opisuju studiju o zadovoljstvu životom. Anketni upitnik sastoji se od 10 pitanja na koje je odgovaralo 100 slučajno odabranih ispitanika. Pitanja (varijable) su mjerila zadovoljstvo poslom, hobijima, kod kuće i općenito zadovoljstvo u nekim drugim područjima života. Rezultati za sve anketirane osobe zabilježeni su uz pomoć računala i skalirani su tako da je prosjek za sva pitanja približno jednak 100.

Page 59: Faktorska analiza  ( Factor Analysis)
Page 60: Faktorska analiza  ( Factor Analysis)

• Osnovni cilj analize je naučiti više o povezanosti zadovoljstava u različitim domenama, pronaći broj faktora kojim se opisuju različita područja zadovoljstva i protumačiti njihovo značenje.

Page 61: Faktorska analiza  ( Factor Analysis)

MD=missed data

Page 62: Faktorska analiza  ( Factor Analysis)
Page 63: Faktorska analiza  ( Factor Analysis)
Page 64: Faktorska analiza  ( Factor Analysis)

Sve korelacije su pozitivne. Neke su i vrlo velike (Hobby_1 i Miscel_1 (0.90)A neke su niske (među varijablama koje mjere zadovoljstvo poslom I zadovoljstvo kod kuće)

Page 65: Faktorska analiza  ( Factor Analysis)
Page 66: Faktorska analiza  ( Factor Analysis)
Page 67: Faktorska analiza  ( Factor Analysis)
Page 68: Faktorska analiza  ( Factor Analysis)

• U skladu s Kaiserovim kriterijem (1960) ostavit će se samo faktori sa svojstvenom vrijednosti većom od 1. U tom bi slučaju broj faktora bio m=2.

• Scree test. (Cattell, 1966)

Page 69: Faktorska analiza  ( Factor Analysis)
Page 70: Faktorska analiza  ( Factor Analysis)

• Faktorska opterećenja

• -mogu se tumačiti kao korelacije između faktora i ulaznih varijabli, te na taj način sadrže najvažniju informaciju na kojoj se zasniva interpretacija faktora.

Page 71: Faktorska analiza  ( Factor Analysis)
Page 72: Faktorska analiza  ( Factor Analysis)

• Nije iznenađujuće da prvi factor ima najveća faktorska opterećenja jer je poredak faktora definiran proporcijom ukupne varijance protumačene određenim faktorom.

Page 73: Faktorska analiza  ( Factor Analysis)

• Orjentacija faktora u faktorskom prostoru je proizvoljna i svaka će rotacija faktora jednako dobro reproducirati korelacije. Faktori se rotiraju da bi se postigla faktorska struktura jednostavnija za interpretaciju.

• Pojam „jednostavne strukture“ uveo je Thurstone (1947) da bi opisao uvjet kad su faktori označeni visokim opterećenjima za neke varijable i malim za ostale.

• Analiza će početi s m=3 faktora

Page 74: Faktorska analiza  ( Factor Analysis)
Page 75: Faktorska analiza  ( Factor Analysis)
Page 76: Faktorska analiza  ( Factor Analysis)

• Na prvom su faktoru velika opterećanja za sve varijable osim za one koje su povezane sa zadovoljstvom kod kuće.

• Drugi faktor ima visoka opterećenja za sve varijable osim za one koje su povezane s poslom.

• Treći faktor ima samo veće opterećenje uz varijablu Home_1.

Page 77: Faktorska analiza  ( Factor Analysis)
Page 78: Faktorska analiza  ( Factor Analysis)

Na prvom su faktoru velika opterećanja za sve varijable osim za one koje su povezane sa zadovoljstvom kod kuće, najniža za varijable povezane zadovoljstvom kod kuće, a ostala su srednje veličine. Drugi factor ima visoka opterećenja za varijable povezane zadovoljstvom kod kuće, a niska za varijable koje su povezane s poslom.

Prvi se faktor može interpretirati kao zadovoljstvo posloma drugi kao zadovoljstvo kod kuće.

Page 79: Faktorska analiza  ( Factor Analysis)
Page 80: Faktorska analiza  ( Factor Analysis)

• Kako dobro se može reproducirati korelacijska matrica iz dvofaktorskog rješenja?

• Rezidualne se korelacije računaju kao razlika između opaženih korelacija i reproduciranih, a veličina svakog pojedinog elementa je iznos korelacije koji nije moguće protumačit s odabrana 2 faktora.

Page 81: Faktorska analiza  ( Factor Analysis)