16
Parametrik Olmayan İstatistik Prof. Dr. Cenk ÖZLER

Parametrik Olmayan İstatistik - DEUkisi.deu.edu.tr/murat.tanik/Poi 7_ hafta .pdfParametrik Olmayan İstatistik Prof. Dr. enk ÖZLER ağımsızlık Testleri ^º µv< P} ] ] ^ f Kategorisi

  • Upload
    others

  • View
    20

  • Download
    0

Embed Size (px)

Citation preview

Parametrik Olmayan İstatistik

Prof. Dr. Cenk ÖZLER

Bağımsızlık Testleri

Sütun Kategorisi

Satır Kategorisi I II III Satır Toplamı

A

B

Sütun Toplamı Genel Toplam

Bu kategorilere dayanarak A nın olasılığı P(A);

𝑃 𝐴 =𝐴′𝑛ı𝑛 𝑠𝑎𝑡ı𝑟 𝑡𝑜𝑝𝑙𝑎𝑚ı

𝐺𝑒𝑛𝑒𝑙 𝑇𝑜𝑝𝑙𝑎𝑚

elde edilir. Sütun kategorisi I olduğunda A’nın olasılığı;

𝑃 𝐴 𝐼 =𝐴 𝑣𝑒 𝐼′𝑑𝑎𝑘𝑖𝑙𝑒𝑟𝑖𝑛 𝑠𝑎𝑦ı𝑠ı

𝐼 𝑠ü𝑡𝑢𝑛 𝑡𝑜𝑝𝑙𝑎𝑚ı

olur. Bağımsızlık tanımından 𝑃 𝐴 = 𝑃 𝐴 𝐼 ise;

𝐴′𝑛ı𝑛 𝑠𝑎𝑡ı𝑟 𝑡𝑜𝑝𝑙𝑎𝑚ı

𝐺𝑒𝑛𝑒𝑙 𝑇𝑜𝑝𝑙𝑎𝑚=

𝐴 𝑣𝑒 𝐼′𝑑𝑎𝑘𝑖𝑙𝑒𝑟𝑖𝑛 𝑠𝑎𝑦ı𝑠ı

𝐼 𝑠ü𝑡𝑢𝑛 𝑡𝑜𝑝𝑙𝑎𝑚ı

buradan Ave I’dakilerin sayısı;

Ave I’dakilerin sayısı =𝐴′𝑛ı𝑛 𝑠𝑎𝑡ı𝑟 𝑡𝑜𝑝𝑙𝑎𝑚ı 𝑥 𝐼 𝑠ü𝑡𝑢𝑛 𝑡𝑜𝑝𝑙𝑎𝑚ı

Genel Toplam

bulunur.

Bağımsızlık TestleriHipotezler

𝐻0:𝑆𝑎𝑡ı𝑟 𝑣𝑒 𝑆ü𝑡𝑢𝑛 𝑘𝑎𝑡𝑒𝑔𝑜𝑟𝑖𝑙𝑒𝑟𝑖 𝑏𝑖𝑟𝑏𝑖𝑟𝑖𝑛𝑑𝑒𝑛 𝑏𝑎ğı𝑚𝑠ı𝑧𝑑ı𝑟.

𝐻1:𝑆𝑎𝑡ı𝑟 𝑣𝑒 𝑆ü𝑡𝑢𝑛 𝑘𝑎𝑡𝑒𝑔𝑜𝑟𝑖𝑙𝑒𝑟𝑖 𝑏𝑖𝑟𝑏𝑖𝑟𝑖𝑛𝑑𝑒𝑛 𝑏𝑎ğı𝑚𝑠ı𝑧 𝑑𝑒ğ𝑖𝑙𝑑𝑖𝑟.

Test İstatistiği

𝜒2 = (𝐺𝑖𝑗 − 𝐵𝑖𝑗 )2

𝐵𝑖𝑗

𝐺𝑖𝑗 = i. satır j. sütunda gözlenen değer

𝐵𝑖𝑗 = i. satır j. sütunda beklenen değer

Ret Bölgesi

Eğer 𝜒2 > 𝜒2𝛼 , 𝑟−1 (𝑐−1) ise 𝐻0reddedilir.

r= satır sayısı

c= sütun sayısı

Varsayımlar

1. Örneklemler aynı populasyondan seçilmişlerdir

Bağımsızlık Testleri

• Örnek: David Gallano adında bir şarap tüccarı rastgele seçtiği bir grupmüşterisine üzüm şarabının kalitesiyle ilgili fikirlerini sormuştur. Müşterilerülkenin 3 farklı bölgesinde yetişen üzümlerden yapılan şarapları tatmışlar ve 1en iyi ve 4 en kötü olacak şekilde 1’den 4’e kadar puanlamışlardır. Verilertablodadır. %5 önem seviyesinde şarap kalitesinin üretildikleri bölgelerdenbağımsız olduğu söylenebilir mi?

Kalite Derecesi I II III

1 15 10 6

2 7 13 12

3 11 12 8

4 3 8 15

Yetiştirilen Bölge

Bağımsızlık Testleri

Kalite Derecesi I II III Satır Toplamı

1 15 (9,3) 10 (11,1) 6 (10,6) 31

2 7 (9,6) 13 (11,5) 12 (10,9) 32

3 11 (9,3) 12 (11,1) 8 (10,6) 31

4 3 (7,8) 8 (9,3) 15 (8,9) 26

Sütun Toplamı 36 43 41 120

Yetiştirilen Bölge

𝐻0: Ş𝑎𝑟𝑎𝑝𝑙𝑎𝑟ı𝑛 ü𝑟𝑒𝑡𝑖𝑙𝑑𝑖𝑘𝑙𝑒𝑟𝑖 𝑏ö𝑙𝑔𝑒𝑙𝑒𝑟 𝑖𝑙𝑒 𝑘𝑎𝑙𝑖𝑡𝑒 𝑝𝑢𝑎𝑛𝑙𝑎𝑟ı 𝑏𝑖𝑟𝑏𝑖𝑟𝑖𝑛𝑑𝑒𝑛 𝑏𝑎ğı𝑚𝑠ı𝑧𝑑ı𝑟.

𝐻1: Ş𝑎𝑟𝑎𝑝𝑙𝑎𝑟ı𝑛 ü𝑟𝑒𝑡𝑖𝑙𝑑𝑖𝑘𝑙𝑒𝑟𝑖 𝑏ö𝑙𝑔𝑒𝑙𝑒𝑟 𝑖𝑙𝑒 𝑘𝑎𝑙𝑖𝑡𝑒 𝑝𝑢𝑎𝑛𝑙𝑎𝑟ı 𝑏𝑖𝑟𝑏𝑖𝑟𝑖𝑛𝑑𝑒𝑛 𝑏𝑎ğı𝑚𝑠ı𝑧 𝑑𝑒ğ𝑖𝑙𝑑𝑖𝑟.

İlk satır ve sütun için

𝐵1,1 =31∗36

120= 9,3

𝜒2 =(15−9,3)2

9,3+ ⋯ +

(15−8,9)2

8,9= 14.9475 elde edilir

r= 4 ve c= 3 olduğundan

𝜒20.05, 4−1 (3−1) = 12.592 bulunur.

𝜒2 > 𝜒20.05, 4−1 (3−1) olduğundan 𝐻0 reddedilir.

2’den Fazla Oranın Eşitliğinin TestiHipotezler

𝐻0:𝑝1 = 𝑝2 = ⋯ = 𝑝𝑘 (𝐻𝑒𝑟 𝑏𝑖𝑟 𝑠𝑎𝑡ı𝑟𝑑𝑎𝑘𝑖 (𝑣𝑒𝑦𝑎 𝑠ü𝑡𝑢𝑛𝑑𝑎𝑘𝑖) 𝑕ü𝑐𝑟𝑒𝑙𝑒𝑟𝑖𝑛 𝑜𝑟𝑎𝑛𝑙𝑎𝑟ı 𝑒ş𝑖𝑡𝑡𝑖𝑟. )

𝐻1:𝑝𝑖 ≠ 𝑝𝑗 (𝑒𝑛 𝑎𝑧 𝑏𝑖𝑟 𝑖 ≠ 𝑗 𝑖ç𝑖𝑛)(𝐸𝑛 𝑎𝑧 𝑏𝑖𝑟 𝑕ü𝑐𝑟𝑒𝑛𝑖𝑛 𝑜𝑟𝑎𝑛ı 𝑑𝑖ğ𝑒𝑟𝑙𝑒𝑟𝑖𝑛𝑑𝑒𝑛 𝑓𝑎𝑟𝑘𝑙ı𝑑ı𝑟. )

Test İstatistiği

𝜒2 = (𝐺𝑖𝑗 − 𝐵𝑖𝑗 )2

𝐵𝑖𝑗

𝐺𝑖𝑗 = i. satır j. sütunda gözlenen değer

𝐵𝑖𝑗 = i. satır j. sütunda beklenen değer

Ret Bölgesi

Eğer 𝜒2 > 𝜒2𝛼 , 𝑟−1 (𝑐−1) ise 𝐻0reddedilir.

r= satır sayısı

c= sütun sayısı

Varsayımlar

Örneklemler aynı populasyondan seçilmişlerdir

2’den Fazla Oranın Eşitliğinin Testi

• Örnek: Bir işletmede son 1 ayda üretilen partilerin vardiyalara göre uygun veuygun olmayan miktarları tabloda verilmiştir. Buna göre %1 önem seviyesindekusurlu partilerin oranı değişik vardiyalara göre farklılık göstermekte midir?

Parti Durumu Gündüz Akşam Gece

İyi Parti Sayısı 427 273 240

Kötü Parti Sayısı 23 27 10

Vardiyalar

2’den Fazla Populasyon Oranın Eşitliği Testi

𝑝1= Gündüz vardiyasında iyi partilerin oranı

𝑝2= Akşam vardiyasında iyi partilerin oranı

𝑝3= Gece vardiyasında iyi partilerin oranı

𝐻0:𝑝1 = 𝑝2 = 𝑝3

𝐻1:𝑝𝑖 ≠ 𝑝𝑗 (𝑒𝑛 𝑎𝑧 𝑏𝑖𝑟 𝑖 ≠ 𝑗 𝑖ç𝑖𝑛)

İlk satır ve sütun için

𝐵1,1 =450∗940

1000= 423

𝜒2 =(427 − 423)2

423+ ⋯ +

(10 − 15)2

15= 7.194

r= 2 ve c= 3 olduğundan

𝜒20.01, 2−1 (3−1) = 9.21 bulunur.

𝜒2 < 𝜒20.01, 2−1 (3−1) olduğundan 𝐻0 reddedilemez.

Parti Durumu Gündüz Akşam Gece Satır Toplamı

İyi Parti Sayısı 427(423) 273 (282) 240 (235) 940

Kötü Parti Sayısı 23 (27) 27 (18) 10 (15) 60

Sütun Toplamı 450 300 250 Genel Toplam=1000

Vardiyalar

Homojenlik TestleriHipotezler

𝐻0:𝑛 𝑎𝑑𝑒𝑡 ö𝑟𝑛𝑒𝑘 𝑎𝑦𝑛ı 𝑝𝑜𝑝𝑢𝑙𝑎𝑠𝑦𝑜𝑛𝑑𝑎𝑛 𝑔𝑒𝑙𝑚𝑒𝑘𝑡𝑒𝑑𝑖𝑟.

𝐻1:𝑛 𝑎𝑑𝑒𝑡 ö𝑟𝑛𝑒𝑘 𝑎𝑦𝑛ı 𝑝𝑜𝑝𝑢𝑙𝑎𝑠𝑦𝑜𝑛𝑑𝑎𝑛 𝑔𝑒𝑙𝑚𝑒𝑚𝑒𝑘𝑡𝑒𝑑𝑖𝑟.

Test İstatistiği

𝜒2 = (𝐺𝑖𝑗 − 𝐵𝑖𝑗 )2

𝐵𝑖𝑗

𝐺𝑖𝑗 = i. satır j. sütunda gözlenen değer

𝐵𝑖𝑗 = i. satır j. sütunda beklenen değer

Ret Bölgesi

Eğer 𝜒2 > 𝜒2𝛼 , 𝑟−1 (𝑐−1) ise 𝐻0reddedilir.

r= satır sayısı

c= sütun sayısı

Not

1. Bağımsızlık testinde örneklem tek bir populasyondan seçilmiştir. Ancak Homojenlik testinde 2

veya daha fazla bağımsız rassal örneklemin aynı populasyondan gelip gelmediği incelenecektir.

Homojenlik Testleri

• Örnek: Bir liseden 4 adet birbirinden bağımsız öğrenci grubu seçilmiştir.Bunlardan 100 tanesi Lise 1, 95 tanesi Lise 2, 95 tanesi Lise 3 ve 90 tanesi Lise4 öğrencisidir. Her bir öğrenciye bir konu hakkındaki görüşleri sorulmuş vesoruya Evet, Hayır yada Farketmez olarak cevap vermeleri istenmiştir. %5önem seviyesinde bu 4 örneğin aynı populasyondan geldikleri söylenebilir mi?

Sınıf Evet Hayır Farketmez

Lise 1 60 20 20

Lise 2 60 30 5

Lise 3 70 10 15

Lise 4 80 5 5

Soruya Verilen Cevaplar

Homojenlik Testleri

𝐻0: 4 𝑎𝑑𝑒𝑡 ö𝑟𝑛𝑒𝑘 𝑎𝑦𝑛ı 𝑝𝑜𝑝𝑢𝑙𝑎𝑠𝑦𝑜𝑛𝑑𝑎𝑛 𝑔𝑒𝑙𝑚𝑒𝑘𝑡𝑒𝑑𝑖𝑟.

𝐻1: 4 𝑎𝑑𝑒𝑡 ö𝑟𝑛𝑒𝑘 𝑎𝑦𝑛ı 𝑝𝑜𝑝𝑢𝑙𝑎𝑠𝑦𝑜𝑛𝑑𝑎𝑛 𝑔𝑒𝑙𝑚𝑒𝑚𝑒𝑘𝑡𝑒𝑑𝑖𝑟.

İlk satır ve sütun için

𝐵1,1 =270∗100

380= 71.05

𝜒2 =(60−71.05)2

71.05+ ⋯ +

(5−10.66)2

10.66= 43.86 elde edilir

r= 4 ve c= 3 olduğundan

𝜒20.05, 4−1 (3−1) = 12.592 bulunur.

𝜒2 > 𝜒20.05, 4−1 (3−1) olduğundan 𝐻0 reddedilir.

Sınıf Evet Hayır Farketmez Satır Toplamı

Lise 1 60 (71.05) 20 (17.11) 20 (11.84) 100

Lise 2 60 (67.5) 30 (16.25) 5 (11.25) 95

Lise 3 70 (67.5) 10 (16.25) 15 (11.25) 95

Lise 4 80 (63.95) 5 (15.39) 5 (10.66) 90

Sütun Toplamı 270 65 45 Genel Toplam=380

Soruya Verilen Cevaplar

MC – NEMAR Testi (Bağlantılı Örnekler)Hipotezler

𝑝1 = 𝑜𝑙𝑎𝑦 𝑣𝑒𝑦𝑎 𝑖ş𝑙𝑒𝑚 ö𝑛𝑐𝑒𝑠𝑖 (+) 𝑜𝑙𝑢𝑝 𝑜𝑙𝑎𝑦 𝑣𝑒𝑦𝑎 𝑖ş𝑙𝑒𝑚 𝑠𝑜𝑛𝑟𝑎𝑠𝚤 – 𝑜𝑙𝑎𝑛𝑙𝑎𝑟ın oranı

𝑝2 = 𝑜𝑙𝑎𝑦 𝑣𝑒𝑦𝑎 𝑖ş𝑙𝑒𝑚 ö𝑛𝑐𝑒𝑠𝑖 − 𝑜𝑙𝑢𝑝 𝑜𝑙𝑎𝑦 𝑣𝑒𝑦𝑎 𝑖ş𝑙𝑒𝑚 𝑠𝑜𝑛𝑟𝑎𝑠𝚤 + 𝑜𝑙𝑎𝑛𝑙𝑎𝑟𝚤𝑛 𝑜𝑟𝑎𝑛𝚤

𝐻0:𝑝1 = 𝑝2

𝐻1:𝑝1 ≠ 𝑝2

Test İstatistiği

𝜒2 = 𝐵 − 𝐶 − 1 2

𝐵 + 𝐶

Ret Bölgesi

Eğer 𝜒2 > 𝜒2𝛼 ,1 ise 𝐻0 reddedilir.

Not

1.Örnekler bağımlıdır.

Önce

(+) (-)

Son

ra

(+) A(+,+) B(-,+)

(-) C(+,-) D(-,-)

MC – NEMAR Testi (Bağlantılı Örnekler)

• Örnek: 50 ekonomiste yeni seçilen Merkez Bankası başkanının ekonomipolitikalarını destekleyip desteklemedikleri sorulmuştur. Aynı ekonomistgrubuna 1 yıl geçtikten sonra aynı soru sorulmuş ve cevaplar tablodaki gibielde edilmiştir. %5 önem seviyesinde ekonomistlerin başkanın ekonomipolitikalarına destekleri ile ilgili görüşlerin değişip değişmediğini araştırınız.

Destekleyen Desteklemeyen

Destekleyen 20 5

Desteklemeyen 15 10

1 yıl sonra

Ön

ce

MC – NEMAR Testi (Bağlantılı Örnekler)

𝑝1 = Ö𝑛𝑐𝑒 𝑏𝑎ş𝑘𝑎𝑛𝚤 𝑑𝑒𝑠𝑡𝑒𝑘𝑙𝑒𝑦𝑖𝑝 𝑑𝑎𝑕𝑎 𝑠𝑜𝑛𝑟𝑎 𝑑𝑒𝑠𝑡𝑒𝑘𝑙𝑒𝑚𝑒𝑦𝑒𝑛𝑙𝑒𝑟𝑖𝑛 𝑜𝑟𝑎𝑛𝚤

𝑝2 = Ö𝑛𝑐𝑒 𝑏𝑎ş𝑘𝑎𝑛𝚤 𝑑𝑒𝑠𝑡𝑒𝑘𝑙𝑒𝑚𝑒𝑦𝑖𝑝 𝑑𝑎𝑕𝑎 𝑠𝑜𝑛𝑟𝑎 𝑑𝑒𝑠𝑡𝑒𝑘𝑙𝑒𝑦𝑒𝑛𝑙𝑒𝑟𝑖𝑛 𝑜𝑟𝑎𝑛𝚤

𝐻0:𝑝1 = 𝑝2

𝐻1:𝑝1 ≠ 𝑝2

𝜒2 = 15 − 5 − 1 2

15 + 5= 4.05

Eğer 𝜒2 > 𝜒2𝛼 ,1 = 3.84 olduğundan 𝐻0 reddedilir.

Destekleyen Desteklemeyen

Destekleyen 20 5

Desteklemeyen 15 10

1 yıl sonra

Ön

ce