46
SLIDE 1 Faktör Analizi Yaşar Tonta H.Ü. BBY tonta@ hacettepe .edu.tr yunus.hacettepe.edu.tr/~tonta/courses/ spring2008/bby208/

Faktor Analizi

  • Upload
    mesut

  • View
    34

  • Download
    0

Embed Size (px)

DESCRIPTION

factor analysis

Citation preview

PowerPoint PresentationSLIDE *
Not: Sunu slaytlar Andy Field’n Discovering Statistics Using SPSS (Sage, 2005) adl eserinin 15. bölümünden ve kitapta kullanlan veri setlerinden yararlanlarak hazrlanmtr.
SLIDE *
Tükenii dorudan ölçemeyebilirsiniz ama bunun birçok boyutu var (motivasyon, stres düzeyi, kiinin yeni fikirleri olup olmamas vs.)
Baka bir deyile bu deikenler acaba tek bir deikenle (tükeni) ilgili olabilir mi?
Faktör analizi deiken gruplarn/kümelerini saptamak için kullanlr
SLIDE *
Faktör analizinin kullanm alanlar
Bir dizi deikenin yapsn anlamak (ör., Spearman ve Thurstone FA’y “zeka” kavramn anlamak için kullanmlar)
Tek bir deikeni (ör., tükeni) ölçmek için anket gelitirmek
Özgün bilgiyi olabildiince koruyarak veri setini azaltmak
SLIDE *
Faktörler
Ör., kiiyi popüler yapan özellikler nelerdir? (toplumsal beceriler, bencillik, bakalarnn o kiiye ilgi göstermesi, o kiinin bakalar hakknda konumas, o kiinin kendisi hakknda konumas, yalan söyleme)
Bu deiken çiftleri için korelasyon matrisi oluturulduunu varsayalm.
SLIDE *
olabilir.
0,074
-0,120
0,054
1,000
Bencil
-0,131
0,031
-0,101
0,441
1,000
Yalan
0,068
0,012
0,110
0,361
0,277
1,000
SLIDE *
Yorum
Bir kiinin toplumsal becerileriyle o kiinin bakalar hakknda konumas ve o kiiye bakalarnn ilgi göstermesi birbiriyle ilikili
Yani kiinin toplumsal becerileri arttkça daha ilginç ve konukan biri olma ihtimali artyor
Öte yandan, kiiler kendileri hakknda ne kadar çok konuuyorsa bencil olma ve yalan yapma ihtimalleri de o derecede artyor
Yani bencillikle yalan söyleme ve kendi hakknda konuma arasnda bir iliki var.
Sonuç olarak, ilk faktör sosyal olup olmamayla, ikinci faktör bakalarna kar davranlarla ilgili.
Bu nedenle kiinin popülaritesi sadece sosyal olmanzla deil, bakalarna kar nasl davrandnzla da ilgili.
SLIDE *
arasndaki korelasyonu gösterir
Faktöri = b1Deiken1 + b2Deiken2+ …bnDeikenn) + ei
Sosyalliki = b1Konuma 11 + b2TopBeceriler2+ b3lgi3+ b4Konuma 24+ b5Bencillik5+ b6Yalanclk6) + ei
Sencilliki = b1Konuma 11 + b2TopBeceriler2+ b3lgi3+ b4Konuma 24+ b5Bencillik5+ b6Yalanclk6) + ei
Örnek:
Sosyalliki = 0,87*Konuma 11 + 0,96*TopBeceriler2+ 0,92*lgi + 0,00*Konuma 2 + 0,10*Bencillik + 0,09*Yalanclk) + ei
Sosyallik faktörü için ilk üç b deeri yüksek, dierleri düük.Yani bu üç deiken sosyallik faktörü için çok önemli.
Bu formülle Konuma 1, TopBeceriler vd. deerleri (diyelim 1 ile 10 arasnda) verilen bir kiinin sosyallik faktörü hesaplanabilir (basit yöntem). Regresyon yöntemi ise deikenlerin kendi aralarndaki balangç korelasyonlarn da hesaba katarak faktör skorunu hesaplar.
SLIDE *
Örneklem bulgularn genellemek mi istiyorsunuz? (çkarmsal yöntem)
Yoksa verileri incelemek veya spesifik bir hipotezi test mi etmek istiyorsunuz? (dorulayc faktör analizi)
SLIDE *
FA verilerdeki belirleyici boyutlar ortaya çkarr ve dolaysyla ortak varyansla ilgilidir.
TBA ise özgün verileri bir dizi dorusal deiken olarak kabul edip her deikenin temel bileene katksn ortaya çkarmaya çalr (MANOVA ve diskriminant analizine benzer)
Birbirinden pek farkl deil.
Eigen deerleri (eigenvalues) büyük olan faktörler kullanlmal. (Eigenvalue kabaca iki deiken arasndaki korelasyonu gösterir. Korelasyon varsa d snrlar elipse benzer.)
Eigen deerinin büyüklüüne nasl karar vereceiz?
Güzellik
M
a
a

Güzellik
M
a
a

SLIDE *
Grafik
Her eigen deeriyle (y ekseni) ilgili olduu faktörün (x ekseni) grafii çizilir (scree plot)
Krlma noktas
kabul edilmesini öneriyor.
aznn açklanmas anlamna geliyor.
lk faktör alkolizmle ilgili deikenler kümesi kadeh says, bamllk ve obsesif kiilik
kinci faktör baaryla ilgili deikenler maa, statü ve yayn says
Balangçta krmz noktalar faktör 2’ye (baar) yüklenmi, mavi noktalar faktör 1’e (alkolizm)
Eksenler döndürülünce (noktal çizgiler) deiken kümeleri en ilgili olduklar faktörle kesiirler.
Döndürmeden sonra deiken yüklemeleri ilgili faktör üzerine maksimize edilir, ilgisiz faktör üzerine minimize edilir.
lgisiz rotasyon (soldaki ekil) faktörleri birbirinden bamsz olarak döndürmeyi ifade eder. Döndürmeden önce tüm faktörler bamszdr. (Döndürmeden sonra eksenler birbirine dik)
Eik rotasyondaysa faktörlerin birbiriyle ilikili olmasna izin verilir (sadaki ekil)
Hangi döndürme yönteminin kullanlaca faktörlerin birbiriyle ilgili ya da bamsz olmas konusunda salam kuramsal nedenler olmasna bal
Alkolizmin baardan tamamen bamsz olduunu söyleyemeyiz (yüksek baar -> ar stres -> alkol tüketimi)
SLIDE *
Üç ilgisiz rotasyon (varimax, quartimax ve equamax)
ki eik rotasyon (direct oblimin ve promax)
lk analiz için varimax’ seçmekte yarar var (faktörlerin yorumlanmas basit)
SLIDE *
Aratrmaclar 0,3’ü önemli sayyorlar
Ama örneklem büyüklüü de önemli (p = 0,01 için)
Örneklem büyüklüü 50 için 0,722 anlaml
Örneklem büyüklüü 100 için 0,512 anlaml
Örneklem büyüklüü 200 için 0,364 anlaml
Örneklem büyüklüü 300 için 0,298 anlaml
Örneklem büyüklüü 600 için 0,210 anlaml
Örneklem büyüklüü 1000 için 0,162 anlaml
Bir deikenin bir faktördeki varyansn ne kadarn açkladn bulmak için faktör yüklemesinin karesi alnr
Bazlar faktör yüklemesi 0,4 (varyansn %16’sn açklyor) ve üzeri olanlarn alnmasn öneriyor
SLIDE *
Örnek: Anket gelitirme (SPSS kaygs)
23 önerme, 5’li Likert ölçei (1: Kesinlikle katlyorum, 5: -Kes. katlmyorum)
SLIDE *
Her deiken için en az 10-15 ölçüm gerekli
Faktör analizi için örneklem büyüklüü 100 yetersiz, 300 idare eder, 1000 mükemmel.
SLIDE *
Bir baka deikenle 0,9 veya üzeri korelasyon (multicollinearity) ile mükemmel korelasyon (singularity) olan deikenler de çkarlmal
SLIDE *
SLIDE *
Bilgisayarn en iyi çözümü bulmak için maksimum tekrar says
SLIDE *
Factor Scores
Veri editörüne her denein her faktörle ilgili skorlarn kaydeder. Daha sonraki
analizler için yararl olabilir (ör., belli faktörler için yüksek skoru olan denekler)
Anderson-Rubin yöntemi faktörlerin ilgisiz olduunu varsayyor (ilgiliyse
Regression seçilmeli)
0,4’ten yüksek faktör yüklemesi olanlarn seçilmesi
SLIDE *
0,93 bu veriler için faktör analizinin mükemmel bir biçimde
kullanlabileceini gösteriyor (0,7-0,8 iyi, 0,5-0,7 aras orta, en az 0,5 olmal)
0,5’ten küçükse daha fazla veri toplanmal
Bartlett testi özgün korelasyon matrisi kimlik matrisi (tüm korelasyon katsaylar
sfr) ile ayndr bo hipotezini test ediyor. Bu test anlaml olmal –ki burada öyle-
çünkü aksi takdirde deikenler arasnda iliki olmad anlamna gelir
SLIDE *
0,5’ten küçük olanlar çkarlp test yeniden yaplmal.
SLIDE *
rotasyondan sonra eigenvalues.
lk faktör varyansn yaklak %32’sini açklyor.
Rotasyon faktörlerin göreli önemini eitliyor
(faktör 1’in katks %32’den %16’ya düüyor).
4 faktör toplam varyansn yaklak yarsn
açklyor.
önce
lk sütundaki tüm deerler 1, çünkü temel bileen analizi
tüm varyansn ortak olduunu varsayyor.
Faktör çkarmadan sonra varyansn ne kadarnn ortak
olduu konusunda daha iyi bir fikrimiz oluyor. Örnein,
Soruyla ilgili varyansn %43,5’i ortak.
Eigen deeri 1’den küçük olan faktörler atld için
bilgi kayb var. Mevcut 4 faktörün varyansn
tümünü açklamas mümkün deil, ama bir ksmn
açklyor
SLIDE *
deikenler ilk faktörle ilikili. SPSS 4 faktöre karar verdi. Ama
Bu hususu SPSS’e brakmamak lazm (örneklem büyüklüü,
Eigenvalue’nun 1 yerine 0,7’den büyük olmas, deiken says
vs. bu sayy etkiler. Scree plot’a bakmakta yarar var.
Grafik ya 2 ya da 4 faktör
olabileceini gösteriyor.
(slayt 34) karlatrnz. 1. ve 2. sorular arasndaki gözlenen verilere
dayal korelasyon -0,099 (slayt 29). Modelde (bu slayt) ise -0,091.
Aradaki fark tablonun altndaki “Residual” ksmnda veriliyor.
SLIDE *
Residuals
deerlere sahipse kayglanmak gerekli
SLIDE *
rotasyondan sonra daha dengeli hale geldi.
Bundan sonraki adm faktörleri oluturan deikenlerin ortak
temas olup olmadna bakmak. Örnein, Faktör 1 bilgisayar
Korkusuyla, faktör 2 istatsitik korkusuyla, faktör 3 matematik
Korkusuyla, faktör 4 arkadalarn negatif
deerlendirmelerinden korkmayla ilgili. Yani anketin dört
alt ölçei var.
ki olaslk var: Ya SPSS kaygs anketi SPSS kaygsn ölçmüyor
ama baz ilgili yaplar ölçüyor, ya da bu 4 alt bileen SPSS
Kaygsnn alt bileenleri. SPSS hangisi olduunu
söylemiyor.
SLIDE *
SLIDE *
Cronbach alfa deeri en az 0,7 olmal
Bu deer ölçekteki soru saysyla da ilgili
Çok soru varsa alfa yüksek olabilir ama bu, ölçein güvenilir olduunu göstermeyebilir.
Belirleyici faktör says da önemli. Tek faktörle de 0,8 gibi bir deer elde edilebilir, iki orta düzeyde ilikili ve iki ilikisiz faktörle de.
Olumsuz önermelerin doru kodlanmas lazm (olumsuz önermelerde seçenek saysna bir ekleyip cevab bu saydan çkardktan sonra girmek gerekli- bunun için “TransformCompute komutu kullanlabilir)
SLIDE *
SLIDE *
Mönüden AnalyzeScaleReliability analysis’i seçin. Bilgisayar korkusu ile
ilgili sorular (6, 7, 10, 13, 14, 15, 18) Items’a aktarn. Statistics’i ekildeki gibi iaretleyin.
SLIDE *
SLIDE *
0,3’ten düük olanlar çkarlmal.
Korelasyon eksi çkarsa yanl kodlama
yaplm demektir.
0,824’e çkyor ama bu, çok önemli
bir art deil. Dier sorular çkarrsak
toplam alfa hep düüyor
Ve dier alt bileenler
statistik (1, 3, 4, 5, 12, 14, 10 ve 21 no’lu sorular), matematik (8, 11, 17 no’lu sorular) ve arkada deerlendirme korkularyla (2, 9, 19, 22 ve 23 nô’lu sorular) ilgili güvenilirlik analizleri de benzeri bir ekilde yaplabilir.
Alfa deerleri srasyla 0,828, 0,605 ve 0,819.
SLIDE *
Scree Plot
Component Number
All computers hate me
mention of central
irreparable damage
SPSS makes statistics
doesn't
thinking that I am trapped
under a normal distribtion
Computers have minds of
their own and deliberately
them
at school
whenever I see an
attacking me with
me
mathematics
of eigen vectors
statistics than me
to cope with SPSS
SPSS than I am
computers
friends will think I'm a
nerd
1
2
3
4
Component
4 components extracted.
Rotation Method: Varimax with Kaiser Normalization.
Rotated Component Matrix
thinking that I am trapped
under a normal distribtion
of eigen vectors
attacking me with
SPSS makes statistics
doesn't
mention of central
computers
irreparable damage
them
me
mathematics
at school
whenever I see an
statistics than me
to cope with SPSS
SPSS than I am
Everybody looks at me
when I use SPSS
Rotation Method: Varimax with Kaiser Normalization.
Rotation converged in 6 iterations.
a.