Upload
jeroen
View
107
Download
2
Embed Size (px)
DESCRIPTION
THY SPSS UYGULAMASI 1.SORU:Kİ-KARE ANALİZİ. Feyza TAŞKIN Aygül DÖNMEZ Aralık, 2009. Ki-Kare Analizi. Yaygın kullanımın en önemli nedenleri , çok basit bir analiz türü olması, kullanım alanının çok geniş olması, esnekliğinin fazla olması, varsayımlarının azlığı ve - PowerPoint PPT Presentation
Citation preview
THY SPSS UYGULAMASI1.SORU:Kİ-KARE ANALİZİ
Feyza TAŞKINAygül DÖNMEZ
Aralık, 2009
Ki-Kare Analizi
Yaygın kullanımın en önemli nedenleri, çok basit bir analiz türü olması, kullanım alanının çok geniş olması, esnekliğinin fazla olması, varsayımlarının azlığı ve çok güçsüz ölçeklerde (örneğin nominal ölçekte)
ölçülmüş verilere uygulanabilmesidir.
Amaçları Örnek değerlerinin dağılımının belirli bir teorik dağılıma
uyma derecesinin saptanması (uygunluk testi).
İki veya daha fazla nitelik esas alınarak sınıflandırılan veriler değerlenerek bu nitelikler arasındaki ilginin derecesinin belirlenmesi (bağımsızlık testi veya kontenjans tablosu analizi).
Ki- kare analizi iki veya daha fazla veri seti arasında önemli bir farkın olup olmadığını belirlemede araştırmacının kullanabileceği bir istatistiksel analiz yöntemidir.
Bu yöntemde gözlem verileri ile beklenen veriler kıyaslanır.
Ki-Kare Uygulanmasının Şartları
Analiz oranlara uygulanamaz. Gerçek değerlerin esas alınması gerekir.
Gözlenen değerler sıfır olamaz. Beklenen değerlerin %20’sinden fazlası 5’ten küçük
olamaz. Beşten az gözlemin yer aldığı tablolar olursa, en az beş gözlemi tamamlayacak şekilde satırlar veya sütunlar arası birleşmelere gidilir.
Ki-Kare analizi frekans dağılımları üzerinden hesaplanır.
Ki-Kare Hesaplanması
oij: i. satır ve j. sütundaki şıkka ait gözlem değeri
(gözlenen frekans) eij: i. satır ve j. sütundaki şıkka ait beklenen değer
(teorik frekans- beklenen frekans)
22 ( )
İJ
ij ij
ij
o eX
e
22 ( )ij ij
ij ij
o ex
e
Ki-Kare Homojenlik Testi
İki ya da daha fazla bağımsız örneklemin, aynı ana kütleden seçilip seçilmediğinin araştırılmasında kullanılır.
Hipotezler:H0: İki örneklem de aynı ana kütleden seçilmiştir.
H1: Örneklemler farklı ana kütlelerden seçilmiştir.
Ki-Kare Uygunluk Testi Gözlenen değerlerin belirli bir dağılıma uygun olup
olmadığının sınanmasına Ki-Kare Uygunluk testi denir. Hipotezleri:H0: Örnek değerlerinin dağılımı belirli bir teorik dağılıma
uymaktadır.H1:Örnek değerlerinin dağılımı belirli bir teorik dağılıma
uymamaktadır.Örnek: bir cevaplayıcı grubunun kullandıkları şampuan
markaları arasında dağılımın seyri örnek olarak gösterilebilir. Tercihler belirli markalarda mı yoğunlaşmaktadır; yoksa markalar arasında eşit bir dağılım mı göstermektedir?
(Gözlem değerlerinin oran şeklinde olması halinde Kolmogorov- Simirnov test istatistiğinden yararlanılır)
Ki-Kare Bağımsızlık Testi
(ilgi testi-Pearson ki-kare testi) İki değişken arasında bir ilgi olup olmadığını, yani iki değişkenin
birbirinden bağımsız olup olmadığını belirlemek amacıyla kullanılır.
Ki-kare bağımsızlık testi, uygunluk testindeki hesaplamalardan farksızdır. Ancak bu testte teorik (beklenen) frekansların hesaplanması farklıdır.
Bağımsızlık için ki-kare testi, ikisi de sınıflama veya biri sınıflama diğeri sıralama (ordinal) düzeyinde ölçülen iki değişkenin ilişkili olup olmadığını belirlemeye yönelik parametrik olmayan bir testtir.
Örneğin: “gelir düzeyi ile siyasi parti seçimi”, “eğitim düzeyi ile okunan gazete”, “iş tatmini düzeyi (evet, kısmen, hayır) ile ücret” değişkenleri arasındaki ilişkiler Ki – Kare Bağımsızlık Testi ile incelenebilir.
Hipotezler:H0:İki nitelik birbirinden bağımsızdır.
H1:İki nitelik birbirinden bağımsız değildir.
serbestlik Dercesi (δ)=(c-1)(r-1) dir. Serbestlik derecesi arttıkça "Ki-kare" testi normal
dağılıma benzemeye başlar. Ayrıca "Ki-kare" değeri serbestlik derecesine bağlı olduğundan, analizde yer alan gözlem sayısı arttıkça "Ki-kare" değeri de artar. Sonuçta anlamlı farklılıkların varlığına ilişkin işaretler elde etme olasılığı da artar.
THY VAKASI 1. SORU
THY verilerinde yer alan genellikle tercih edilen bilet sınıfı (v4) ile yolcuların geliri (v12) arasında anlamlı bir ilginin olup olmadığını ki-kare analizi ile inceleyip yorumlayınız.
Genellikle tercih edilen bilet sınıfı (v4) Ekonomi Business
Aylık gelir (v12) 1.000.000.000 ve altı 1.000.000.001-2.000.000.000 2.000.000.001-3.000.000.000 3.000.000.001-4.000.000.000 4.000.000.001-5.000.000.000 5.000.000.001 ve üstü
Gelir
Bilet Sınıfı 1.000.000
ve altı 1.000.000.001-
2.000.000.000
2.000.000.001-
3.000.000.000
3.000.000.001-
4.000.000.000
4.000.000.001-
5.000.000.000
5.000.000.001
ve üstü
Toplam
Ekonomi 32 58 55 49 34 111 339
Business 6 6 24 14 22 100 172
Toplam 38 64 79 63 56 211 511
Beklenen Değerin Hesaplanması
Sütun veya satırların birbirinden bağımsız olduğunu varsaydığımızda örnekteki herhangi bir yolcunun ekonomi sınıfını tercih etmesi ve 1.000.000.000 ve altı gelire sahip bir yolcu olması olasılığı herhangi bir yolcunun 1. satır ve 1. sütunda olması olasılıklarının çarpımına eşittir. Bu da:
11339 38511 511
e x
Bilet sınıfı ekonomi olan ve 1.000.000.000 ve altı gelire sahip olan yolcuların teorik veya beklenen sayısı ise olasılıkla örnek sayısının çarpımına eşittir. Yani:
11339 38 511511 511
e x x
11
12
13
14
15
16
339 38 25,21511
339 64 42,46511
339 79 52,41511
339 63 41,80511
339 56 37,15511
339 211 140511
xe
xe
xe
xe
xe
xe
21
22
23
24
25
26
172 38 12,8511
172 64 21,54511
172 79 26,6511
172 63 21,2511
172 56 18,85511
172 211 71,02511
xe
xe
xe
xe
xe
xe
Hücreler Gözlenen Beklenen X2= (oij-eij)2
e ij e11 32 25,21 1,83
e12 58 42,46 5,7
e13 55 52,41 0,13
e14 49 41,80 1,24
e15 34 37,15 0,26
e16 111 140 6
e21 6 12,8 3,61
e22 6 21,54 11,21
e23 24 26,6 0,25
e24 14 21,2 2,44
e25 22 18,85 0,58
e26 100 71,02 11,82
Toplam 511 511 45,02
Karar
Hesaplanan X2 değeri (45,02), teorik X2 değerinden (11,07) büyük olduğundan %5 önem derecesinde H0 hipotezi red edilecek, H1 hipotezi kabul edilecektir.
Yolcuların sahip oldukları gelir ile tercih etmiş oldukları bilet sınıfı arasında %5 önem derecesinde bir ilişki vardır, yani bu iki nitelik birbirinden bağımsız değildir.
Bu sonuçlar, şu sorumuza da cevap bulabilir:
Bu farklılığa en çok ve en az sebep olan kesim kimlerdir?
Farklılığa en çok sebep olan kesim X2' si en yüksek çıkan e26 ve e22 hücresi, yani 5.000.001 ve üstü gelire sahip olup Business bilet sınıfını seçenler ile 1.000.000.001-2.000.000.000 gelire sahip olup Business bilet sınıfını seçen yolcular olmuştur(Çünkü beklenen değer, gözlenen değerden en uzak noktadadır).
THY ÖRNEĞİ SPSS UYGULAMASI
SORU 1: THY verilerinde yer alan genellikle tercih edilen bilet sınıfı (v4) ile yolcuların geliri (v12) arasında anlamlı bir ilginin olup olmadığını ki-kare analizi ile inceleyip yorumlayınız.
THY ÖRNEK UYGULAMASI
DEĞİŞKENLER:
Genellikle tercih edilen bilet sınıfı (v4)
Ekonomi Business
Aylık gelir (v12) 1.000.000.000 ve altı 1.000.000.001-2.000.000.000 2.000.000.001-3.000.000.000 3.000.000.001-4.000.000.000 4.000.000.001-5.000.000.000 5.000.000.001 ve üstü
İlgili Değişkenler Değişkenin Tanımı Ölçek Türü
v4 DeğişkeniGenellikle tercih edilen
bilet sınıfı Nominal(Sınıflama)
v12 Değişkeni Gelir Ordinal(Sıralama)
THY ÖRNEK UYGULAMASI
Hipotezler H0:Genellikle tercih edilen bilet sınıfı (v4) ile gelir (v12)
arasında anlamlı bir ilişki yoktur. H1:Genellikle tercih edilen bilet sınıfı (v4) ile gelir (v12)
arasında anlamlı bir ilişki vardır. Anlamlılık Derecesi
α=0.05 olarak belirlenmiştir.
Karar Kriteri %5 önem derecesinde ve 5 serbestlik derecesinde teorik χ2
değeri, χ2 tablosundan χ2 (0,05;5) =11,07 olarak bulunur.
THY Kİ-KARE SPSS UYGULAMASI
SPSS 16.0 programı kullanılarak THY verilerinden “Genellikle Tercih Edilen Bilet Sınıfı(v4)” “Gelir(v12)” verileri arasında anlamlı bir ilişki olup olmadığı Ki-Kare analizi ile test edilmiştir. SPSS programında bu analizin nasıl yapılacağı aşağıda 4 adımda gösterilmektedir:
1. ADIM: SPSS Genel Penceresi
2. ADIM: Beklenen Değer Tablosu İçin Satır ve Sütun Seçimi: (CrossTabs Ayarları)
3. ADIM: Uygulanan İstatistiksel Analizin Seçimi (Crostabs: Statistics Ayarları)
4. ADIM: Beklenen Değer Tablosu için Gerekli Ayarların Yapılması(Cell Display Ayarları)
THY Kİ-KARE SPSS UYGULAMASI
THY verilerinden; Hangi verilerin hangi analize
tabi tutularak bu çıktının alındığını gösteren özet tablodur.
Genellikle tercih edilen bilet sınıfı (v4) ile Gelir(v12) ilişkilendirilmesinin yapılarak Ki-Kare Analizine tabi tutulan SPSS özet çıktı penceresi yanda görülmektedir.
THY Kİ-KARE SPSS SONUÇLARI
SPSS Ki-Kare analizi sonucu çıkan bu tabloda;- 511 tane örnekten alınan verilerin tamamının uygun veriler olduğu,
- Yani ankette “Genellikle tercih edilen bilet sınıfı ve Gelir” sorularının tümüne cevap verildiği hiç boş veya yanlış işaretlenen soru bulunmadığı anlamına gelmektedir.
Kontenjans Tablosu
THY Kİ-KARE SPSS SONUÇLARI
Kontenjans Tablosunun Sonuçları Bu tabloda hangi gelir düzeyine sahip kişilerin
hangi bilet türünü seçtiği gözlenen değerler ve beklenen değerler şeklinde gösterilmiştir.
Ayrıca bu değerlerin toplam satır(genellikle tercih edilen bilet sınıfı) ve toplam sütun(gelir) değerlerine göre yüzdeleri de tabloda açıklanmaktadır.
THY Kİ-KARE SPSS SONUÇLARI
χ2 (0,05;5) =11,07 < χ2 = 45.025
Hesaplanan Ki-Kare değeri tablo değerinden büyük olduğu için H0 hipotezi reddedilecektir. Bunun Anlamı;- Yolcuların sahip olduğu gelir ile tercih edilen bilet sınıfı birbirinden bağımsız değildir. - THY ile ilgili Ki-kare araştırma sonuçlarına göre v4 (Genellikle tercih edilen bilet sınıfı)ve v12 (Gelir) değişkenleri arasında anlamlı bir ilişki bulunduğu görülmektedir.
THY Kİ-KARE SPSS SONUÇLARI
SPPS Chi-Square Test Tablosunun;
- Assymp.Sig. sütunun en üstündeki anlamlılık değerinin p = 0,00 olduğu görülmektedir. Bu değer p < 0,05 şartını karşıladığından bilet sınıfı ile gelir arasındaki ilişkinin anlamlı olduğu söylenebilir.
- %5 önem derecesinde H0 hipotezi red edilecek, H1 hipotezi kabul edilecektir. Bu ilginin kaynağını belirlemek için ise farklılığa en çok sebep olan kesimi bulmak gerekmektedir.
THY Kİ-KARE SPSS SONUÇLARI Farklılığa en çok sebep olan beklenen değeri, gözlenen değerden en
uzak olan kesimdir. Farklılığa sebep olan değerler Kontenjas Tablosunda görüldüğü
gibi; e26= 5.000.001 ve üstü gelire sahip olup Business bilet sınıfını seçen
yolcular (bu grubun beklenenden daha fazla business bilet sınıfı tercih ettikleri söylenebilir)
e22=1.000.000.001-2.000.000.000 gelire sahip olup Business bilet sınıfını seçen yolculardır (bu grubun beklenenden daha az business bilet sınıfı tercih ettikleri söylenebilir)