1
1
PARAMETRİK OLMAYAN
İSTATİSTİKSEL TEKNİKLER
Prof. Dr. Ali ŞEN
2
Ki- kare Bağımsızlık TestiDaha önceki bölümlerde ölçümler arasındaki ilişkilerin nasıl inceleneceğini gördük. Ancak sıklıkla ilgilenilen veriler ölçüm yerine satır ve sütun kategorilerinde yer alan gözlem adeti şeklindedir. Ve araştırmacılarkategorilerin birbirleri ile bağımlı veya bağımsız olup olmadıklarını anlamaya çalışırlar.
2
3
Ki- kare Bağımsızlık Testi
4
Ki- kare Bağımsızlık TestiTestin gerçekleştirilmesi için kontenjans tablosu denilen tablonun kurulmuş olması gerekir. Bu tablo, incelenen iki değişkenin şıklarına düşen gözlenen frekansların yazıldığı, yatay ve düşey bantlardan oluşan bir bölünmüş tablodur. Bu tabloya her hücreye düşmesi beklenen gözlem adetleri yerleştirilir ve gözlenen ile beklenen değerlerin birbirlerinden uzaklaşmaları dikkate alınarak test gerçekleştirilir.
3
5
Ki- kare Bağımsızlık TestiRxC Tabloları ile Bağımsızlık TestiBayan televizyon izleyicilerinin öğrenim düzeyleri ve TV programlarından tercih ettikleri türler sorgulanarak, bu iki değişken arasında bir bağlantı bulunup-bulunmadığı yani iki değişkenin birbirinden bağımsız olup-olmadığı ortaya konmaya çalışılacaktır.
6
Ki- kare Bağımsızlık TestiBu amaçla 300 izleyiciyi kapsayan bir örneklem üzerindeki gözlemler yandaki sonucu vermiştir. 30011010090Toplam
7532376Magazin
85601114Sanat ve Kültür
6083220Eğlence
80102050Dizi Film
ToplamYüksekOrtaİlk
Öğrenim Düzeyi
Tercih edilen TV programı Türü
4
7
Ki- kare Bağımsızlık Testi
Eğer bayan izleyicilerin tercih ettikleri TV programı türü onların öğrenim düzeyleri ile ilişkili değilse, her gözde beklenen frekansların, parantez içindekiler gibi bir dağılım gerçekleşmesi gerekirdi.
8
Ki- kare Bağımsızlık Testi
Gerçektende toplam 300 bireyden dizi film tercih edenler 80 kişi olup öğrenim düzeyine bakılmaksızın, bu denemede yer alan her bayanın dizi filmi tercih etmesi olasılığı 80/300’dür. Bu bayanlar ilk öğrenimli olsalar, bu oran (80/300) olarak gözlenecektir.
5
9
Ki- kare Bağımsızlık Testi
Oysa ilk öğrenimli 90 bayan var ve bunların 80/300’ü 90(80/300)=24 kişi eder, buna karşılık ilk öğrenimli 50 bayanın bu programı izlediği gözlenmiş, 24 kişilik beklentiye karşılık 50 kişilik bir gerçekleşme var.
10
Ki- kare Bağımsızlık TestiP(Dizi/İlkokul)=P(Dizi) olursa iki olay bağımsızdır. İncelenen iki kategogirinin bağımsız olabilmesi için tüm satır sütun kombinasyonlarının
bu şartı sağlaması gerekir
Toplam dizi izleyicisi
P(Dizi)= Genel Toplam
Dizi, İlkokul hücresindeki sayıP(Dizi/İlkokul)=
İlkokul sütunun toplamı
Bağımsızlık için P(Dizi/İlkokul)=P(Dizi) olmalı öyle ise
6
11
Ki- kare Bağımsızlık TestiDizi, İlkokul hücresindeki sayı Toplam dizi izleyicisi
İlkokul sütunun toplamı Genel Toplam
Toplam dizi izleyicisi x İlkokul sütunun toplamıDizi, İlkokul hücresindeki sayı =
Genel Toplam
(80) x (90)= = 24
200
12
Ki- kare Bağımsızlık TestiAynı teknikle, her göz için birer beklenen frekans hesaplanarak gözlerde parantez içerisinde gösterilmiştir.
30011010090Toplam
7532(27.5)37(25.0)6(22.5)Magazin
8560(31.2)11(28.3)14(25.5)Sanat ve Kültür
608(22.0)32(20.0)20(18)Eğlence
8010(29.3)20(26.7)50(24)Dizi Film
ToplamYüksekOrtaİlk
Öğrenim Düzeyi
Tercih edilen TV programı Türü
7
13
Ki- kare Bağımsızlık TestiH0: Gözlerdeki gözlenen ve beklenen frekanslar arasındaki farklar, çok küçük farklardır, tesadüfe bağlı olarak ortaya çıkmışlardır, öğrenim düzeyi ile TV programı birbirinden bağımsız değişkenlerdir. Bu iki değişken arasında ilişki yoktur.
14
Ki- kare Bağımsızlık TestiH1: Gözlerdeki gözlenen ile beklenen frekanslar arasındaki farklar tesadüfe bağlı olmayacak kadar büyüktür, öğrenim düzeyi ile TV programı arasında bir ilişki vardır.
8
15
Ki- kare Bağımsızlık Testiİstatistiksel Test:
Gözlenen ve beklenen frekanslara dayanan ve iki değişkenin arasındaki ilişkinin varlığını araştıran bir test olan testi olmalıdır.
2χ
16
Ki- kare Bağımsızlık TestiAnlamlılık Düzeyi:
ve n=300 olsun.
İşlem ve Karar:
Gözlenen ve beklenen frekansların farklarına dayalı olarak her göz için hesaplanan değerleri toplanarak, test istatistiğini oluşturacak bulunacaktır.
2χ
05.0=α
2hχ
9
17
Ki- kare Bağımsızlık Testi
Serbestlik derecesi
v=(R-1)(C-1)= (3-1)(4-1)= 6’dır.
82.1195.27)5.2732(...
18)1820(
24)2450( 222
2 =−
++−
+−
=χh
592.1226;05.0 =χ
∑−
=χ=
k
i i
iih B
BG
1
22 )(
18
Ki- kare Bağımsızlık Testi592.1282.119 2
6;05.02 =χ>=χh
Nedeniyle Ho hipotezi reddedilecektir, H1 kabul edilecektir. Sonuç olarak, “bayan izleyicilerin öğrenim düzeyleri ile onların izlemeyi tercih ettikleri TV programı türüarasında istatistik bakımından anlamlı, önemli bir bağlantı” vardır.
10
19
PARAMETRİK OLMAYAN
İSTATİSTİKSEL TEKNİKLER
Prof. Dr. Ali ŞEN
20
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Birçok durumda seride bulunan birimlerin rasgele olarak seçilip seçilmediğini bilmek isteriz. Örneğin istatistiki analizlerde verilen kararların dayandığı temel varsayım alınacak kararların rasgele örneklere bağlıolmasıdır.
11
21
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Rasgelelik yaklaşımının olup olmadığıdurumlara örnek vermek gerekirse:
Bazı kalite kontrol prosedürlerinde kontrol grafikleri üretim süreçlerinin çıktıları arasında standartlara uymayanların oranını belirleyip kontrol altına almada kullanılır.
22
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Üretilen mamüllerden belirli aralıklarla örnekler alınır ve bu örnekler itibariyle standartlara uymayan mamül oranıbelirlenir. Araştırmacı, belirli bir örnekteki standartlara uymayan mamül oranını, tüm prosesdeki standartlara uymayan mamüloranı ile karşılaştırılır.
12
23
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Burada araştırmacı, aldığı örneğin rasgele bir örnek olup olmadığınıbilmek ister. Rasgeleleğinin olmamasıüretim sürecinin kontrolde olmadığını gösterir.
24
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar -RunTesti
İkinci olarak, regresyon analizinde, bağımlı değer ile bu değere karşılık gelen tahmini değer arasındaki fark artık olarak adlandırılır. Artıklar hem pozitif hem de negatif olabilir. Örnek verilerin tesadüflüğünü anlamak için pozitif ve negatif artık değerlerin sayısını test ederiz.
13
25
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Rasgeleliği araştıran prosedürler üzerinde durulan verilerdeki dizilerin sayılarına ve doğasına dayanır. Dizi ard arda birbirini takip eden benzer olay, birim veya sembollerdir. Bir seride çok sayıda veya çok az sayıda dizi varsa, söz konusu serinin rasgeleliğinden şüphelenir.
26
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Örneğin 10 kişilik bir örnek psikolojik denemeye alınacaktır. Eğer üzerinde deneme yapılacak kişiler cinsiyetlerine göre:
E K E K E K E K E K
şeklinde teste tabi tutulursa, bu örneğin rasgeleliğinden şüpheleniriz.
14
27
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Bu durumda çok sayıda dizinin (10 dizi) olmasıyüzünden örneğe birim seçerken sistematik bir prosedürün takip edildiğini söyleyebiliriz. Eğer denemeye çağrılacak kişilerin sırası:
E E E E E K K K K K
şeklinde olsaydı, bu durumda sadece iki dizinin ayrı olması yüzünden rasgelelikten şüphelenecektir.
28
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Varsayımlar:
Analizde kullanılacak veriler, vuku bulma sıralarına göre kaydedilmiş, başlıca iki kategori tipi içerisinde toplanabilecek bir seriden oluşmaktadır. Toplam örnek sayısın ise, n1 birinci tip örnek sayısı, n2 birinci tip örnek sayısı olsun.
15
29
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Hipotezler:
A. (Çift yönlü)
H0: İki örnek tipinin vuku bulmasıdurumu tesadüfi bir sürecin sonucudur.
H1: Vuku bulma durumu tesadüfi değildir.
30
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
B. (Tek Yönlü)
H0: İki örnek tipinin vuku bulması durumu tesadüfi bir sürecin sonucudur.
H1: Şanstan ileri geldiğini kabul edemeyeceğimiz kadar az dizinin olmasısebebiyle vuku bulma durumu rasgele değildir.
16
31
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
C. (Tek Yönlü)
H0: İki örnek tipinin vuku bulması durumu tesadüfi bir sürecin sonucudur.
H1: Şanstan ileri geldiğini kabul edemeyeceğimiz kadar çok dizinin olmasısebebiyle vuku bulma durumu rasgele değildir.
32
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Test istatistiği:
Test istatistiği r, toplam
dizi sayısıdır.
r adet dizi
gözlemlemenin olasılığı
⎟⎟⎠
⎞⎜⎜⎝
⎛ +
⎟⎟⎠
⎞⎜⎜⎝
⎛−−
⎟⎟⎠
⎞⎜⎜⎝
⎛−−
=
1
21
21
11
11
2)(
nnnkn
kn
rf
⎟⎟⎠
⎞⎜⎜⎝
⎛ +
⎟⎟⎠
⎞⎜⎜⎝
⎛ −⎟⎟⎠
⎞⎜⎜⎝
⎛−−
+⎟⎟⎠
⎞⎜⎜⎝
⎛−−
⎟⎟⎠
⎞⎜⎜⎝
⎛ −
=
1
21
2121 111
111
)(
nnn
kn
kn
kn
kn
rf
r çift iken
r tek iken
17
33
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Karar Modeli:
A. Sıfır hipotezi yön belirtmediği için çift yönlü hipotez testi yapılabilir. Böylece test istatistiği için alt ve üst kritik değerlerini belirlememiz gerekir.
34
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
r değeri, alt kritik değere eşit veya küçük ise veya üst kritik değere eşit veya büyük ise rastgeleleğin olduğunu iddia eden sıfır hipotezi reddedilir. En fazla 20’ye kadar olan n1 ve n2 değerleri itibari ile tablo kritik değerleri ( ve ) verir verir. '
2/αu 2/αu
18
35
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
B. n1 ve n2 değerleri itibari ile ilk Tabloya bakınız r değeri tablodaki test istatistiğinden küçük veya eşit ise önem seviyesinde Ho hipotezini redderiz.
α
36
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar Testi
C. n1 ve n2 değerleri itibari ile tabloya bakınız. r değeri tablodaki test istatistiğinden büyük veya eşit ise
önem seviyesinde Ho hipotezini redderiz. α
19
37
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Örnek: Bir kasaba yolu üzerinde dikilen karağaçlarınyol boyunca hasta ve sağlıklı olmalarına göre dizilişi şu şekildedir.
HHHHDDDHHHHHHHDDHHDDDD
Buna göre dizilişin rastgele olup olmadığını araştırın (0,05 önem seviyesinde)
38
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
HHHHDDDHHHHHHHDDHHDDDD
H0 : Diziliş rastgeledir
H1 : Diziliş rastgele değildir
n1 = 13 ve n2 = 9
Tablodan üst kritik değer = 17 ve alt kritik değer
= 6 okunur
“r” run sayısı 6 olduğundan
H0 hipotezi reddedilir
'2/αu
2/αu
20
39
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Büyük Örnek Yaklaşımı:
n1 ve n2 değerlerinden birisi 20’yi geçtiğinde hipotezlerimizi test etmede normal dağılım yakınsaması yapılabilir Büyük örnekler için z değeri Ho hipotezi doğru iken standart normal dağılıma yaklaşır.
[ ]{ }
)1()()2(21)/()2(
212
21
212121
2121
−++
−−++−
=
nnnnnnnnnn
nnnnrz
40
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
Büyük Örnek Yaklaşımı:
Bir rock konserinde bilet almak için sıraya dizilen erkek “E” ve kadınların “K” dizilişi aşağıdaki gibidir
EKEKEEEKEKEEEKKEEEEKKEKEEEKEEEKKKEKEEEKEKEEEEKKE
Buna göre 0,05 önem seviyesinde dizilişin rastgeleliğiniaraştırın
21
41
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
EKEKEEEKEKEEEKKEEEEKKEKEEEKEEEKKKEKEEEKEKEEEEKKE
H0 = Diziliş rastgeledir
H1= Diziliş rastgele değildir.
42
Rasgelleliği Anlamada Tek Örnek Dizi Sayılar-Run Testi
5,231183018.30.2
=++
=μ 21,3)11830()1830()183018.30.2(18.30.2
2 =−++−−
=σ
σμ−
=uz İken z<1,96 ve z>1,96 ise H0 reddedilecektir
09,121,35,2327=
−=z H0 reddedilemez