Upload
others
View
15
Download
2
Embed Size (px)
Citation preview
Hipotez Testleri
• Hipotez – teori, önerme yada birinin araştırdığı bir
iddiadır.
• Boş Hipotez, H0 – popülasyon parametresi ile ilgili şu
anda kabul edilen değeri tanımlamaktadır.
• Alternatif Hipotez, Ha – test edilen iddiayı
tanımlamaktadır; boş hipotezin matematiksel olarak
karşıtıdır.
• Hipotez Testi – rakip durumdaki iki hipotezin, toplanan
verilere dayanarak, karşılaştırılmasıdır.
Tanımlar:
Hipotez Testinin Temelleri
Hipotez Testi:
• Hipotez testi, popülasyon parametreleri hakkında
yapılmış olan varsayımların, belli bir güven
derecesinde kabul veya reddedilme sürecidir.
• Toplanan verilerden, boş hipotezi çürütecek kadar
kuvvetli bir kanıt elde edilmedikçe, boş hipotez
doğru olarak kabul edilir.
Boş ve alternatif hipotezleri belirtiniz:
Eğitimciler, öğrencilerin genel olarak haftada ortalama 15
saat ve daha az çalıştığını belirtmektedirler. Eğitim
araştırmaları yapan bir Profesör ise aslında öğrencilerin
genel kabul görmüş ortalamadan daha fazla ders
çalıştıklarını öne sürmektedir.
İddia:
m > 15
Matematik karşıtı:
H0:
Ha:
Çözüm:
Öğrenciler haftada 15 saatten daha
fazla ders çalışmaktadırlar.
m ≤ 15
m > 15
m ≤ 15
• Test İstatistiği – örneklemden toplanan verilere
dayanarak hesaplanan ve hipotez testi için kullanılan bir
değerdir.
• Anlamlılık Düzeyi, a – test edilen iddiayı
tanımlamaktadır; boş hipotezin matematiksel karşıtıdır.
Güven düzeyinin de tamamlayıcısıdır.
• a = 1 – c.
Tanımlar:
Hipotez Testi’nin Aşamaları
1. Boş ve alternatif hipotezler belirlenir.
2. Test istatistiği belirlenir.
3. a değerine bağlı olarak red bölgesi
oluşturulur.
4. Veriler toplanır ve gerekli olan örnek
istatistiği hesaplanır.
5. Sonuca varılır.
Hipotez Testlerindeki Muhtemel Sonuçlar
1. Boş hipotez reddedilir.
2. Boş hipotez reddedilmez.
Hipotez Testi Türleri:
Alternatif Hipotez
< değer
> değer
≠ değer
Test Türü
Sol kuyruk testi
Sağ kuyruk testi
Çift kuyruk test
Küçük Örneklemler, n < 30, İçin Test İstatistiği:
s.d. = n – 1
Örneklemden toplanan verilere dayanarak hesaplanan
test istatistiğinin istatistiki olarak anlamlı olup olmadığının
belirlenmesi için kritik değere bakılır.
Küçük örneklemler için kritik değerler için t-dağılımından
faydalanılır.
Ortalamalar İçin Hipotez Testi (Küçük Örneklemler)
Red Bölgesinin Bulunması İçin Gerekenler:
1. Hipotez testinin türü.
2. Anlamlılık düzeyi, a.
Red Bölgesinin Bulunması:
1. Red bölgesinin sınırını belirlemek için kritik
değere, tc, bakılır.
2. Örnekleme dayanarak hesaplanan test istatistiği,
a alanının içine denk geliyorsa, H0 reddedilir.
Sol kuyruk testleri için red bölgesi [Ha “<“ içerir]:
t ≤ –ta ise reddet
Reddet Reddetme
Sağ kuyruk testleri için red bölgesi [Ha “>“ içerir]:
t ≥ ta ise reddet
Reddet Reddetme
Çift kuyruk testleri için red bölgesi [Ha “≠” içerir]:
| t | ≥ ta/2 ise reddet
Reddet Reddetme Reddet
Aşağıdaki durum için sonuca ulaşınız:
Öğrencilerin dönem başına ortalama 9’dan daha fazla park
cezası aldığı iddia edilmektedir. Bunu test etmek için 27
öğrenciden oluşan bir örneklem seçilmiş olup, dönem başına
alınan park cezası ort. = 9.8 ve s.s.=1.5 olarak hesaplanmıştır
(a = 0.10).
Çözüm:
n = 27, m = 9, = 9.8, s = 1.5, s.d. = 26, a = 0.10
t0.10 =
t istatistiği, ta değerinden büyüktür; boş hipotez reddedilir.
1.315
2.771
Ha: m > 9
H0: m ≤ 9
Hipotezi test edip sonuca ulaşınız:
Bir mağazanın eski yöneticisi, pazarlama stratejisini
müşterilerin ortalama 100TL ve daha az para harcadığı
üzerine oluşturmuştur. Yeni gelen mağaza yöneticisi ise,
müşterilerin daha fazla para harcadığını öne sürmektedir. 24
müşteriden veri toplanmış olup, ort.=104.93TL harcadıkları
tespit edilmiştir (s.s.=9.07). Yeni mağaza yöneticisinin
iddiasını, 0.010 anlamlılık düzeyinde test ediniz.
Çözüm:
H0:
Ha:
s.d. = 23, a = 0.010
t0.010 =
t ≥ ta (yada t > 2.500) ise reddet.
m ≤ 100
m > 100
2.500
Çözüm (devam):
n = 24, m = 100, = 104.93, s = 9.07,
Hesaplanan t değeri, ta dan büyük olduğu için, boş hipotez
reddedilir.
2.663
Büyük Örneklemler İçin Test İstatistiği, n ≥ 30:
Örnekleme dayanarak hesaplanan test istatistiğinin
istatistiki olarak anlamlı olup olmadığını tespit etmek
için kritik değere bakılır.
c Tek kuyruk testi Çift kuyruk testi
0.90 1.28 ±1.645
0.95 1.645 ±1.96
0.98 2.05 ±2.33
0.99 2.33 ±2.575
Ortalamalar İçin Hipotez Testi (Büyük Örneklemler)
Hipotezi test edip sonuca ulaşınız:
2006’da yayınlanan bir raporda Türkiye’de bayanlar için ortalama evlenme
yaşı 25 olduğu belirtilmiştir. Bir araştırmacı ise bu yaşın İstanbul için çok
düşük olduğunu öne sürmektedir. 213 bayandan oluşan bir örnekleme
dayanarak ortalama evlenme yaşını 25.4 olarak hesaplamıştır (s.s.=2.3). %95
güven düzeyine dayanarak, toplanan verilerin araştırmacının iddiasını
destekleyip desteklemediğini test ediniz.
Çözüm:
H0:
Ha:
c = 0.95
zc =
z ≥ zc , yani z ≥ 1.645 ise reddet.
m ≤ 25
m > 25
1.645
Çözüm (devamı):
n = 213, m = 25, = 25.4, s = 2.3,
Hesaplanan z değeri, zc den daha büyüktür; boş hipotez
reddedilir.
2.54
p-değeri:
• p-değeri , boş hipotezin (H0) reddini sağlayan en küçük
anlamlılık düzeyidir.
• p-değeri, aynı zamanda gözlemlenen anlamlılık düzeyi
olarak da ifade edilmektedir.
p-değerini hesaplayınız:
Aşağıdaki değerlere göre p-değerini hesaplayınız.
Test istatistiği: z = –1.34.
Hipotezler:
H0: m ≥ 0.15
Ha: m < 0.15
Çözüm:
Alternatif hipoteze göre sol kuyruk testi olduğu anlaşılmaktadır.
Bu ise z nin -1.34 den daha az olma olasılığını belirtir.
p = 0.0901
p-değerini hesaplayınız:
Aşağıdaki değerlere göre p-değerini hesaplayınız.
Test istatistiği: z = 2.78.
Hipotezler:
H0: m ≤ 0.43
Ha: m > 0.43 Çözüm:
Alternatif hipoteze göre sağ kuyruk testi olduğu
anlaşılmaktadır. Bu ise z nin 2.78 den daha fazla olma
olasılığını belirtir.
p = 0.0027
p-değerini hesaplayınız:
Aşağıdaki değerlere göre p-değerini hesaplayınız.
Test istatistiği: z = -2.15.
Hipotezler:
H0: m = 0.78
Ha: m ≠ 0.78 Solution:
Alternatif hipoteze göre çift kuyruk testi olduğu anlaşılmaktadır.
Bu ise z nin -2.15 den daha az veya 2.15 den daha fazla olma
olasılığını belirtir.
p = 0.0158 (2) = 0.0316
p-değeri kullanılarak yapılan hipotez testi sonuçları:
1. p ≤ a ise boş hipotez reddedilir.
2. p > a ise boş hipotez reddedilmez.
Aşağıdaki durum için sonuca ulaşınız:
Aşağıdaki veriler için p-değerini hesaplayınız ve ilgili alpha
değeri için sonuca ulaşınız.
a. z = –1.34 için sol kuyruk testi (a = 0.05).
p = 0.0901 dir, yani 0.05 den büyüktür. Boş hipotez
reddedilmez.
b. z = –2.15 için çift kuyruk tesi (a = 0.10).
p = 0.0158(2) = 0.0316 dir, yani 0.10 dan küçüktür. Boş
hipotez reddedilir.
p-değeri kullanılarak yapılan hipotez testi aşamaları:
1. Boş ve alternatif hipotezler belirlenir.
2. Test istatistiği hesaplanır.
3. Anlamlılık düzeyi belirlenir.
4. Veriler toplanır ve gerekli olan örnek
istatistikleri hesaplanır.
5. p-değeri, belirlenen anlamlılık düzeyi ile
karşılaştırılır.
6. Sonuca ulaşılır.
Hipotezi test edip sonuca ulaşınız:
Yapılan bir araştırmaya göre Avrupa’daki kadınların ortalama olarak 1.48
çocuğu olduğu tespit edilmiştir. Dünya çapında faaliyet gösteren bir kuruma
göre ise Almanya’daki doğurganlık oranlarının farklı olduğunu ileri sürmektedir.
Bu iddiayı test etmek için, 128 Alman bayanla yapılan anket sonuçlarına göre
Alman bayanların ort. 1.39 çocuğu olduğunu belirlemiştir (s.s.=0.84). %90
güven düzeyine göre, verilerin bu iddiayı destekleyip desteklemediğini test
ediniz.
Çözüm:
H0:
Ha:
c = 0.90
a = 0.10
p < a (veya p < 0.10) ise reddet.
m = 1.48
m ≠ 1.48
Çözüm (devamı):
n = 128, m = 1.48, = 1.39, s = 0.84,
Çift kuyruk testidir; p = 0.1131(2) = 0.2262.
p , a dan büyük olduğu için boş hipotez reddedilmemiştir. Veri
toplanarak elde edilen kanıt ilgili kurumun iddiasını %90 güven
düzeyinde desteklememiştir.
–1.21
Hipotez Testleri
(İki yada Daha Fazla Popülasyon İçin)
Boş ve alternatif hipotezi belirleyiniz:
Popülasyon 1’in ortalamasının Popülasyon 2’nin
ortalamasından daha az olduğu varsayımına dayanarak
hipotezleri yazınız.
İddia:
m1 < m2 yada m1 – m2 < 0
Matematiksel karşıtı:
H0:
Ha:
Çözüm:
Popülasyon 1’in ortalamasının Popülasyon 2’nin
ortalamasından daha az.
m1 ≥ m2 yada m1 – m2 ≥ 0
m1 – m2 < 0
m1 – m2 ≥ 0
İki Ortalama İçin Hipotez Testi (Büyük ve Bağımsız Örneklemler)
Popülasyon 1’in ortalamasının Popülasyon 2’nin
ortalamasından 20 birim daha fazla olduğu varsayımına
dayanarak hipotezleri yazınız.
İddia:
m1 > m2 + 20 yada m1 – m2 > 20
Matematiksel karşıtı:
H0:
Ha:
Çözüm:
Popülasyon 1’in ortalaması Popülasyon 2’nin
ortalamasından 20 birim daha fazla.
m1 ≤ m2 + 20 yada m1 – m2 ≤ 20
m1 – m2 > 20
m1 – m2 ≤ 20
Boş ve alternatif hipotezi belirleyiniz:
Boş ve alternatif hipotezi belirleyiniz:
Popülasyon 1’in ortalamasının Popülasyon 2’nin
ortalamasına eşit olmadığı varsayımına dayanarak
hipotezleri yazınız.
İddia:
m1 ≠ m2 yada m1 – m2 ≠ 0
Matematiksel karşıtı:
H0:
Ha:
Çözüm:
Popülasyon 1’in ortalaması Popülasyon 2’nin
ortalamasına eşit değil.
m1 = m2 yada m1 – m2 = 0
m1 – m2 ≠ 0
m1 – m2 = 0
Büyük Örneklemler, n ≥ 30, İçin Test İstatistiği:
• p-değerini bulmak için öncelikle örneklemden
toplanan verilere dayanarak z-değeri hesaplanır.
• Sonra ilgili z-değerine karşılık gelen olasılık
değeri bulunur.
p-değerini kullanarak yapılan hipotez testi sonuçları:
1. p ≤ a ise boş hipotez reddedilir.
2. p > a ise boş hipotez reddedilmez.
Hipotezi test edip sonuca ulaşınız:
Türkiye’de bulunan iki üniversitenin spor akademileri, kendi öğrencilerinin
fiziksel durumlarının daha iyi olduklarını düşünmektedir. Araştırmacı olarak iki
üniversitenin spor akademisi öğrencilerinin spora ayırdıkları toplam saat
arasında bir fark olduğunu test etmeniz istenmektedir. Birinci üniversiteden
seçilen 36 öğrencinin haftada ortalama 2.9 saat spor yaptıkları (s.s.=1.1 saat),
ikinci üniversiteden seçilen 38 öğrencinin ise haftada ortalama 2.7 saat spor
yaptıkları (s.s.=1.0 saat) belirlenmiştir. 0.05 lik bir anlamlılık düzeyi kullanarak,
hipotez testini uygulayınız.
Solution:
H0:
Ha:
a = 0.05
p < a (yada p < 0.05) ise reddet.
m1 – m2 = 0
m1 – m2 ≠ 0
Çözüm (devamı):
n1 = 36, 1 = 2.9, s1 = 1.1, n2 = 38, 2 = 2.7, s2 = 1.0
Çift kuyruklu test olduğu için, p = 0.2061(2) = 0.4122.
p, a dan büyük olduğu için boş hipotez reddedilmemiştir.
0.05 almalılık düzeyinde, öğrencilerin fiziksel durumları
arasında bir farkın olduğuna yönelik yeterli kanıt
bulunamamıştır.
0.82
Kriterler:
• Örneklemler bağımsızdır.
• Örneklemlerin seçildiği her bir popülasyonun dağılımı
normaldir.
• Bir yada her bir örneklem için n < 30.
• Her bir popülasyon için bilinmemektedir.
İki Ortalama İçin Hipotez Testi (Küçük ve Bağımsız Örneklemler)
Küçük Örnekler, n < 30, İçin Test İstatistiği:
s.d.= n1 – 1 ve n2 – 1 den küçük olanı
Red Bölgeleri:
• Sol kuyruk testi için, t ≤ –ta ise H0 reddedilir.
• Sağ kuyruk testi için, t ≥ ta ise H0 reddedilir.
• Çift kuyruk testi için, | t | ≥ ta/2 ise H0 reddedilir.
Aşağıdaki durum için sonuca ulaşınız:
A şirketi, B şirketine nazaran,vergi beyannamesini kendilerinde yapan
mükelleflerin daha fazla vergi iadesi aldıklarını iddia etmektedir. Seçilen 15
kişiye dayanarak A firmasının mükelleflerinin ort. $942 vergi iadesi
(s.s.=$103); seçilen 18 kişiye dayanarak B firmasının mükelleflerinin $898
vergi iadesi (s.s.=$95) aldığı belirlenmiştir. İddiayı 0.05 düzeyinde test ediniz.
Popülasyonların normal olarak dağıldığını varsayınız. Her iki firma büyük bir
şehrin iki farklı bölgesinde faaliyet gösterdiği için, iki popülasyonun
varyanslarının eşit olmadığını varsayınız.
Çözüm:
H0:
Ha:
a = 0.05, s.d. = 14
t0.05 =
t ≥ ta (yada t ≥ 1.761) ise reddet.
m1 – m2 ≤ 0
m1 – m2 > 0
1.761
Çözüm (devamı):
n1 = 15, 1 = 942, s1 = 103, n2 = 18, 2 = 898, s2 = 95
1.266
t , ta dan küçük olduğundan dolayı, boş hipotez
reddedilmemiştir.
0.05 anlamlılık düzeyinde, A firmasının mükelleflerinin B
firmasından daha fazla vergi iadesi aldıkları konusunda yeterli
kanıt bulunamamıştır.
ANOVA (ANalysis Of VAriance ) – Varyans Analizi
1. Tüm popülasyonların dağılımı yaklaşık olarak normaldir.
2. Popülasyonların varyansı aynıdır.
3. Her bir popülasyondan rastsal ve bağımsız örneklemler
seçilmektedir.
ANOVA Testi:
Boş ve Alternatif Hipotezler
H0: m1 = m2 = … = mn.
Ha: En az bir ortalama diğerlerinden farklıdır.
ANOVA Tablosu:
Değişim Kaynağı
Kareler Toplamı Serbestlik Derecesi
Ortalama Kare
F İstatistiği
Gruplar Arası
GAKT k – 1 GAKT/k – 1 GAKT/k – 1 GIKT/n – k
Gruplar İçi
GIKT n – k GIKT/n – k
Toplam GAKT+GIKT n – 1
Gruplar Arası Kareler Toplamı (GAKT):
k = popülasyon sayısı
ni = popülasyon i nin örneklem büyüklüğü
= i. popülasyondan gelen örneklem ortalaması
Gruplar İçi Kareler Toplamı (GIKT):
Gruplar Arası Ortalama Kare:
GAKT / k – 1
Gruplar İçi Ortalama Kare:
GIKT / n – k
ANOVA İçin Test İstatistiği
Örneklemden toplanan verilere dayanarak hesaplanan
test istatistiğinin istatistiki olarak anlamlı olup
olmadığının belirlenmesi için kritik değere bakılır.
Kritik değerler için F-dağılımı tablosu kullanılmaktadır.
F kritik değer F a, k-1, n-k
F = (GAKT / k – 1) / (GIKT / n – k)
Reddet Reddetme
Red Bölgesi:
Ftest > F a, k-1, n-k ise H0 reddedilir.
yada p ≤ a ise H0 reddedilir.
Aşağıdaki durum için sonuca ulaşınız:
C Vitamininin soğuk algınlığına etkisini araştıran tıp araştırmacıları, yaptıkları
akademik çalışmaya katılanları 3 gruba ayırmıştır: 1) günlük 1000 mg C
Vitamini alanlar, 2) günlük 500 mg C Vitamini alanlar, 3) C Vitamini almayanlar.
Çalışmaya katılanlar bir yıl takip edilmiştir ve soğuk algınlığına yakalanma
zamanı ve sayıları belirlenmiştir. Bu verileri kullanarak, ANOVA testi
uygulanmış olup, aşağıdaki tabloda ANOVA sonuçları verilmiştir. Ne yazık ki,
ANOVA tablosundaki bazı hücreler silinmiştir!!!
a. ANOVA tablosundaki boşlukları doldurunuz.
b. Belli bir miktar C Vitamini alanlar ve hiç C Vitamini almayanlar arasında yıl
başına düşen soğuk algınlığı sayısı bakımından bir fark olup olmaması
konusunda araştırmacıların elinde yeterli kanıt var mıdır (0.05 anlamlılık
düzeyinde)?
c. ANOVA tablosuna dayanarak, bir grubun diğer bir gruptan daha az soğuk
algınlığına yakalandığı sonucuna varılabilir mi?
Kareler
Toplamı S.D.
Ortalama
Kare F İstatistiği p-değeri
F
Kritik
değer
Gruplar Arası 2 1.4288 0.4288
Gruplar
İçi 49.2030
Total 52.0606 32
C Vitamininin soğuk algınlığına etkisini araştıran tıp araştırmacıları, yaptıkları
akademik çalışmaya katılanları 3 gruba ayırmıştır: 1) günlük 1000 mg C
Vitamini alanlar, 2) günlük 500 mg C Vitamini alanlar, 3) C Vitamini almayanlar.
Çalışmaya katılanlar bir yıl takip edilmiştir ve soğuk algınlığına yakalanma
zamanı ve sayıları belirlenmiştir. Bu verileri kullanarak, ANOVA testi
uygulanmış olup, aşağıdaki tabloda ANOVA sonuçları verilmiştir. Ne yazık ki,
ANOVA tablosundaki bazı hücreler silinmiştir!!!
a. ANOVA tablosundaki boşlukları doldurunuz.
b. Belli bir miktar C Vitamini alanlar ve hiç C Vitamini almayanlar arasında yıl
başına düşen soğuk algınlığı sayısı bakımından bir fark olup olmaması
konusunda araştırmacıların elinde yeterli kanıt var mıdır (0.05 anlamlılık
düzeyinde)?
c. ANOVA tablosuna dayanarak, bir grubun diğer bir gruptan daha az soğuk
algınlığına yakalandığı sonucuna varılabilir mi?
Kareler
Toplamı S.D.
Ortalama
Kare F İstatistiği p-değeri
F
Kritik
değer
Gruplar Arası 2.8576 2 1.4288 0.8712 0.4288 3.3158
Gruplar
İçi 49.2030 30 1.6401
Total 52.0606 32
Aşağıdaki durum için sonuca ulaşınız:
Çözüm:
b. Boş ve alternatif hipotezleri belirleyiniz:
H0:
Ha:
m1 = m2 = … = mn.
En az bir ortalama diğerlerinden farklıdır.
a = 0.05 ve p = 0.4288 dir.
p, a dan büyük olduğundan dolayı boş hipotez reddedilmez.
Sonuç: Belli bir miktar C Vitamini alanlar ve hiç C Vitamini
almayanlar arasında yıl başına düşen soğuk algınlığı sayısı
bakımından bir fark olup olmaması konusunda araştırmacıların
elinde, 0.05 anlamlılık düzeyinde, yeterli kanıt yoktur.
Çözüm:
c. ANOVA testi, popülasyon ortalamalarından en azından
birinin diğerlerinden farklı olduğunu gösterir; fakat hangi
popülasyon ortalamasının ne kadar fark gösterdiğini
belirtmez.
Dolayısıyla ANOVA tablosu, hangi grubun daha az sayıda
soğuk algınlığına yakalandığı konusunda bilgi vermez.