10
1 ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI Ders 4 Minitabda İstatiksel Çıkarım-I (Ortalamalar ve Oranlar İçin Hipotez Testi) Hipotez Testi İstatistiksel Hipotezler İstatistiksel hipotez testi ve parametrelerin güven aralığı tahmini, karşılaştırmalı bir deneyin (örneğin belirlenmiş bir değerle bir kitlenin ortalamasının karşılaştırılması gibi) veri analizi a ş amasında kullanılan temel metotlardır. Tanım İstatistiksel hipotez, bir yada daha çok kitlenin parametreleri hakkındaki bir ifadedir. Hipotez Testi Örneğin, bir montaj hattındaki krtitik bir işlemin tamamlanma süresiyle ilgilendiğimizi varyasalım. İşlem süresi olasılık dağılımı ile tanımlanabilen rassal bir değişkendir. Dağılımın bir parametresi olan ortalama işlemin tamamlanma süresi ile ilgilendiğimizi düşünelim. Özellikle, ortalama işlem süresinin 130 saniye olup olmadığına karar vermekle ilgileniyoruz Hipotez Testi Sıfır Hipotezi Alternatif Hipotez Tek Taraflı Alternatif Hipotezler Çift Taraflı Alternatif Hipotez yada 0 1 : 130 sn H : 130 sn H μ μ = 0 1 : 130 sn H : 130 sn H μ μ = < 0 1 : 130 sn H : 130 sn H μ μ = >

Hipotez Testi İSTATİSTİK VE YAZILIMLA İstatistiksel ...w3.balikesir.edu.tr/~ocaktan/ist_yl_hafta4.pdf · Tek Taraflı Testler Montaj işlem süresi problemini düşünelim. Eğer

  • Upload
    phamthu

  • View
    225

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Hipotez Testi İSTATİSTİK VE YAZILIMLA İstatistiksel ...w3.balikesir.edu.tr/~ocaktan/ist_yl_hafta4.pdf · Tek Taraflı Testler Montaj işlem süresi problemini düşünelim. Eğer

1

ENM 5210

İSTATİSTİK VE YAZILIMLA UYGULAMALARI

Ders 4

Minitab’da İstatiksel Çıkarım-I

(Ortalamalar ve Oranlar İçin Hipotez Testi)

Hipotez Testi

İstatistiksel Hipotezler İstatistiksel hipotez testi ve parametrelerin güven aralığı

tahmini, karşılaştırmalı bir deneyin (örneğin belirlenmiş bir değerle bir kitlenin ortalamasının karşılaştırılması gibi) veri analizi aşamasında kullanılan temel metotlardır.

Tanım

İstatistiksel hipotez, bir yada daha çok kitlenin parametreleri hakkındaki bir ifadedir.

Hipotez Testi

Örneğin, bir montaj hattındaki krtitik bir işlemin tamamlanma süresiyle ilgilendiğimizi varyasalım.

§  İşlem süresi olasılık dağılımı ile tanımlanabilen rassal bir değişkendir.

§  Dağılımın bir parametresi olan ortalama işlemin tamamlanma süresi ile ilgilendiğimizi düşünelim.

§  Özellikle, ortalama işlem süresinin 130 saniye olup olmadığına karar vermekle ilgileniyoruz

Hipotez Testi

Sıfır Hipotezi Alternatif Hipotez

Tek Taraflı Alternatif Hipotezler

Çift Taraflı Alternatif Hipotez

yada

0

1

: 130 snH : 130 snH µ

µ=≠

0

1

: 130 snH : 130 snH µ

µ=<

0

1

: 130 snH : 130 snH µ

µ=>

Page 2: Hipotez Testi İSTATİSTİK VE YAZILIMLA İstatistiksel ...w3.balikesir.edu.tr/~ocaktan/ist_yl_hafta4.pdf · Tek Taraflı Testler Montaj işlem süresi problemini düşünelim. Eğer

2

Bir Hipotezin Testi

Bir Hipotezin Testi • Belirli bir hipotez hakkında bir karara yol açan bir prosedürdür. •  Hipotez testi prosedürü, kitleden alınan bir rasgele örneklemdeki bilginin kullanılmasına dayanır. •  Eğer bu bilgi hipotezle tutarlı ise, hipotezin doğru olduğu sonucuna; eğer bu bilgi hipotez ile tutarlı değilse, hipotezin yanlış olduğu kararına varırız.

Hipotez Testlerinde I.Tip ve II.Tip Hatalar

H0 doğru olduğu halde reddedildiğinde I. Tip Hata yapılır.

KARAR H0 Kabul H0 Red

H0 Doğru Doğru Karar I. Tip Hata H0 Yanlış II. Tip Hata Doğru Karar

α=P(H0 red/H0 doğru)=P(I.Tip Hata)

β=P(H0 kabul/H0 yanlış)=P(II. Tip Hata)

H0 yanlış olduğu halde kabul edildiğinde II.Tip Hata yapılır.

Anakitle Parametresi İçin Hipotez Testi ve Güven Aralığı

•  Anakitle Ortalaması İçin İstatistiksel Çıkarım Ø Anakitle standart sapması biliniyor. Ø Anakitle standart sapması bilinmiyor.

•  Anakitle Oranı İçin İstatistiksel Çıkarım

Bilinen Varyansla Normal Dağılıma Sahip Bir Kitlenin Ortalaması İçin

Hipotez Testi

Ortalama İçin Hipotez Testi

Test İstatistiği:

Page 3: Hipotez Testi İSTATİSTİK VE YAZILIMLA İstatistiksel ...w3.balikesir.edu.tr/~ocaktan/ist_yl_hafta4.pdf · Tek Taraflı Testler Montaj işlem süresi problemini düşünelim. Eğer

3

Bilinen Varyansla Normal Dağılıma Sahip Bir Kitlenin Ortalaması İçin

Hipotez Testi

Çift taraflı hipotez testi için H0=µ0 doğru iken Z0‘ın dağılımı ve kritik bölgeler

Kritik bölge Kritik bölge

Kabul bölgesi

Bilinen Varyansla Normal Dağılıma Sahip Bir Kitlenin Ortalaması İçin

Hipotez Testi

H0=µ0 doğru iken Z0‘ın dağılımı ve tek taraflı üst hipotez testi için kritik bölge

Alternatif Hipotezin tek taraflı olduğu durumda, ortalamanın (µ) hipotez testi için prosedürler geliştirebiliriz.

Kritik bölge

Kabul bölgesi

Bilinen Varyansla Normal Dağılıma Sahip Bir Kitlenin Ortalaması İçin

Hipotez Testi

Kabul bölgesi

Kritik bölge

H0=µ0 doğru iken Z0‘ın dağılımı ve tek taraflı alt hipotez testi için kritik bölge

P-Değeri Yaklaşımı

Tanım P değeri, verilen veriyle (H0) sıfır hipotezinin reddedilmesine yol açan en küçük anlam seviyesidir.

0 0 0 0 1 0

0 0 0 0 1 0

0 0 0 1 0

2 ( ), 0 : : için çift taraflı test2 ( ), 0 : : için çift taraflı test( ) : : için üst tek taraflı test (

P Z z z H HP Z z z H H

PP Z z H HP Z

µ µ µ µµ µ µ µ

µ µ µ µ

> ≥ = ≠< < = ≠

=> = >

0 0 0 1 0

) : : için alt tek taraflı test z H Hµ µ µ µ

⎧⎪⎪⎨⎪⎪ < = <⎩

Page 4: Hipotez Testi İSTATİSTİK VE YAZILIMLA İstatistiksel ...w3.balikesir.edu.tr/~ocaktan/ist_yl_hafta4.pdf · Tek Taraflı Testler Montaj işlem süresi problemini düşünelim. Eğer

4

Hipotez Testinin Adımları (P Değeri Yaklaşımı)

1. Problemin içeriğinden ilgili parametreyi tanımla.

2. Sıfır Hipotezini (H0 )ifade et.

3. Uygun bir alternatif hipotez (H1) belirt.

4. Bir anlam düzeyi (önem düzeyi) α seç.

5. Uygun bir test İstatistiği belirle.

6. Örneklem verisinden H0 hipotezinin reddedilmesini gerektirecek en küçük anlam düzeyi P değerini hesapla.

7. P<α ise H0 hipotezini reddet, aksi halde H0 hipotezini reddetme. Problem bağlamında bunu rapor et.

Tek Taraflı Testler Montaj işlem süresi problemini düşünelim. Eğer ortalama işlem süresi 130 sn’den uzunsa, bunu güçlü bir kararla göstermek istediğimizi farz edelim. Hipotez aşağıdaki gibi ifade edilir: Burada kritik alan dağılımının alt ucunda (kuyruğunda) uzanır. H0’ın reddi daima güçlü bir karar olduğu için, hipotezin bu ifadesi H0 reddedildiğinde istenen sonucu üretecektir. H0 hipotezi eşitlikle ifade edilmesine rağmen, alternatif hipotezle belirtilmeyen herhangi bir µ değerini içerdiği anlaşılır. Bu nedenle, H0’ı reddetme hatası tam olarak µ=130 sn’yi kastetmez, ancak biz H1’i destekte güçlü delile sahip değiliz.

X

0

1

: 130 snH : 130 snH µ

µ=>

Bilinen Varyansla Normal Dağılıma Sahip Bir Kitlenin Ortalaması İçin

Hipotez Testi

Örnek 1  Bilgisayar klavyesi montajı yapan bir üretim hattının şefi, montaj hattına yeni bir süreç kurulduğundan kritik bir parçadaki hatalı montaj sayısının arttığını ve darboğazların oluştuğunu fark etmiştir. Üretim şefi yeni süreci gözden geçirdiğinde üretim sürecinin kritik bir parçası olan bir montajın tamamlanma süresinin ortalaması 130 saniye ve standart sapması 15 saniye olan Normal Dağılıma uyduğunun kabul edildiğini ve bu şekilde sürecin kurulduğunu görmüştür. Oysa üretim şefi, bu kritik montajın tamamlanma süresinin 15 standart sapmayla Normal Dağılıma uyduğunu kabul etmekle birlikte, ortalama tamamlanma süresinin 130 saniye olduğundan emin değildir. Şef, üretim hattında bir ayarlama gerekip gerekmediğine karar vermek için kritik parça montajı sırasında rastgele 100 parçanın tamamlanma süresini ölçmüş ve örneklem ortalamasını 126,8 olarak bulmuştur. olarak alınırsa ne gibi sonuçlar çıkarılabilir?  

0,05α =

Bilinen Varyansla Normal Dağılıma Sahip Bir Kitlenin Ortalaması İçin

Hipotez Testi

0

1

0

Problemi hipotez testi adımlarını takip ederek çözebiliriz.

1. İlgilenilen parametre ortalama işlem süresi 'dür.

2. : 130 sn

3. : 130 sn

4. =0.05

5. Test istatistiği z

H

H

x

µ

µ

µ

α

=

−= 0

/ nµ

σ

Page 5: Hipotez Testi İSTATİSTİK VE YAZILIMLA İstatistiksel ...w3.balikesir.edu.tr/~ocaktan/ist_yl_hafta4.pdf · Tek Taraflı Testler Montaj işlem süresi problemini düşünelim. Eğer

5

Bilinen Varyansla Normal Dağılıma Sahip Bir Kitlenin Ortalaması İçin

Hipotez Testi

6. Bu soruda çift taraflı test kurulduğu için her iki uçtaki alanı bularak P-değerini hesaplayabiliriz.

! = ! ! < −2,13 + ! ! > 2,13 = 0,0166+ 0,0166 = 0,0332

Yada P değerini bir uçtaki olasılığı ikiyle çarparak da bulabiliriz. Genel olarak çift taraflı testlerde P değeri ! = 2!(! > ! ) ile bulunabilir.

P değerini, ortalaması 0 ve standart sapması 1 olan Normal Dağılımı kullanarak Minitab’da hesaplayın.

Bilinen Varyansla Normal Dağılıma Sahip Bir Kitlenin Ortalaması İçin

Hipotez Testi

H0 :µ = 130 reddedilir. Yani 100 ölçümlük örnekleme dayanarak, ortalama islem süresi 130 sn'den farklıdır. Ortalama islem süresinin 130 sn'den düsük olduguna iliskin güçlü bir delil vardır.

p=0.0332

Ho Kabul

Ho Red

0 1

P=0,0332<α=0,05 olduğu için H0 red

7.

Bilinen Varyansla Normal Dağılıma Sahip Bir Kitlenin Ortalaması İçin

Hipotez Testi

Örnek 2   Bir mağaza yöneticisi yeni bir faturalandırma sistemi üzerine çalışmaktadır. Gerekli finansal analizler yapılmıştır. Yeni geliştirilen sistem eğer müşterilerinin aylık hesabı 170 TL’den fazla ise maliyetleri azaltacaktır. Rassal olarak seçilen 400 müşterinin hesapları incelenmiş ve ortalaması 178 TL olarak bulunmuştur. Yönetici hesapların, standart sapması 65 TL olan normal dağılıma uyduğunu bilmektedir. Yönetici bu veriler ışığında, yeni sisteme geçmenin maliyeti düşüreceğini söyleyebilir mi?  

( =0.05)α

Bilinen Varyansla Normal Dağılıma Sahip Bir Kitlenin Ortalaması İçin

Hipotez Testi

0

1

00

Çözüm:

1. İlgilenilen parametre ortalama aylık hesap miktarı 'dür.

2. : 170 TL

3. : 170

4. =0.05

5. Test istatistiği z/

H

H TL

xn

µ

µ

µ

α

µσ

=

>

−=

Page 6: Hipotez Testi İSTATİSTİK VE YAZILIMLA İstatistiksel ...w3.balikesir.edu.tr/~ocaktan/ist_yl_hafta4.pdf · Tek Taraflı Testler Montaj işlem süresi problemini düşünelim. Eğer

6

Bilinen Varyansla Normal Dağılıma Sahip Bir Kitlenin Ortalaması İçin

Hipotez Testi

Seçilecek anlam düzeyinin 0,0069 dan küçük olması durumunda H0 hipotezi reddedilemeyecek, 0,0069’dan büyük o lması durumunda H0 h ipo tez i reddedilecektir.

6.

7.

Sonuç: H0 :µ = 170 reddedilir. Yani 400 ölçümlük

örnekleme dayanarak, ortalama hesap miktarı 170 TL'den farklıdır.Dolasıyla, ortalama hesap miktarının 170 TL'denfazla olduguna iliskingüçlü bir delil vardır. Yeni sisteme geçis maliyetleri azaltır.

Hipotez Testleri ve Güven Aralıkları Arasındaki İlişki

Sözgelimi θ gibi herhangi bir kitle parametresi hakkındaki bir hipotez testi ve bu θ için güven aralığı arasında yakın bir ilişki mevcuttur. [l,u], θ parametresi için % 100(1-α) güven aralığı ise, θ0 sadece ve sadece % 100(1- α) güven aralığı sınırları içinde değilse H0 reddedilir.

0 0

1 0

::

HH

θ θθ θ=≠

Örnek

Ortalama işlem süresinin % 95 güven aralığı:

130 değeri % 95 güven aralığında olmadığı için H0:µ=130 sıfır hipotezi reddedilir.

Montaj işlem süresi örneğine geri dönersek kurulan hipotez aşağıda verilmiştir.

0

1

: 130 snH : 130 snH µ

µ=≠

Anakitle Ortalaması İçin Hipotez Testi ve Güven Aralığı

Anakitle standart sapması biliniyor.

Örnek: Bir deterjan paketi doldurma hattı her bir pakete 4 kg. deterjan doldurmaktadır. 20 birimlik bir örneklem alinmış ve ölçülen gram ağırlıkları aşağıda verilmiştir:

Geçmiş veriler standart sapmanın 25 gramdır. Sürecin dağılımını ve paket ağırlık ortalamasının 4 kg. olup olmadığını araştırın.

Page 7: Hipotez Testi İSTATİSTİK VE YAZILIMLA İstatistiksel ...w3.balikesir.edu.tr/~ocaktan/ist_yl_hafta4.pdf · Tek Taraflı Testler Montaj işlem süresi problemini düşünelim. Eğer

7

Anakitle Ortalaması İçin Hipotez Testi ve Güven Aralığı

Anakitle standart sapması biliniyor.

Örneklem verileri özet haldeyse bu bölümü kullan

Anakitle Ortalaması İçin Hipotez Testi ve Güven Aralığı

Anakitle standart sapması biliniyor.

Örneklem verisinin istatistiksel özeti

Anakitle ortalamasının % 95’lik güven aralığı. Hesaplanan aralık % 95 güvenle anakitle ortalamasını kapsar. Daha yüksek bir güven düzeyi seçilirse, örneklem büyüklüğü arttırılmadığı sürece aralık genişler.

1000 defa örneklem alıp aralık hesaplasak ve H0 h ipotez in i reddetsek, bunların yalnızca 11’inde reddetmememiz gerektiği halde H0’ı reddederiz.

Anakitle Ortalaması İçin Hipotez Testi ve Güven Aralığı

Anakitle standart sapması biliniyor.

Aralığın güven düzeyini bu bölümden değiştirebilirsiniz.

Alternatif hipotezin tipi, bu bölümden tanımlanabilir.

Anakitle Ortalaması İçin Hipotez Testi ve Güven Aralığı

Anakitle standart sapması biliniyor.

Page 8: Hipotez Testi İSTATİSTİK VE YAZILIMLA İstatistiksel ...w3.balikesir.edu.tr/~ocaktan/ist_yl_hafta4.pdf · Tek Taraflı Testler Montaj işlem süresi problemini düşünelim. Eğer

8

Anakitle Ortalaması İçin Hipotez Testi ve Güven Aralığı

Anakitle standart sapması bilinmiyor.

Anakitle Ortalaması İçin Hipotez Testi ve Güven Aralığı

Anakitle standart sapması bilinmiyor.

Anakitle standart sapması bilinmiyorsa, referans dağılım t dağılımıdır

Anakitle Oranı İçin Hipotez Testi ve Güven Aralığı

Bir otomobil üreticisi, Still paketine fiyatı arttıran otomatik park özelliğini eklemeyi düşünmektedir. Ancak, bu özelliğin çok az sürücü tarafından kullanılacağı ve bu özelliği satın almaya istekli olacağı düşünülmektedir. Bu düşünceyi onaylamak için rassal olarak seçilmiş 200 sürücüye bir anket uygulanmış ve bu sürücülerden sadece 17’sinin bu özelliği satın almak isteyeceği görülmüştür.

a) Otomatik park özelliğini satın alacak sürücülerin oranı için % 95’lik güven aralığı hesaplayın.

b) Üretici, eğer otomatik park özelliğini satın alacak müşterilerin oranının % 10’dan küçük olduğuna ilişkin delil bulabilirse, bu özelliği Still paketine eklemekten vazgeçecektir. 0,05 anlam seviyesi için bu durumu analiz edin.

Anakitle Oranı İçin Hipotez Testi ve Güven Aralığı

Bu bölümü örneklem verisini sayısal (0/1) yada (Evet/Hayır) şeklinde sütuna girdiyseniz kullanın.

Varsayılan değerler

Elle yapılırken np>5 ve n(1-p)>5 için Binom dağılımına Normal Dağılımla yaklaşılabilir. Minitab, gerçek dağılımı kullanır.

Page 9: Hipotez Testi İSTATİSTİK VE YAZILIMLA İstatistiksel ...w3.balikesir.edu.tr/~ocaktan/ist_yl_hafta4.pdf · Tek Taraflı Testler Montaj işlem süresi problemini düşünelim. Eğer

9

Anakitle Oranı İçin Hipotez Testi ve Güven Aralığı

Problemde p’nin %10’dan küçük olduğunu göstermek istediğiniz için alternatif hipotezin ‘less than’ olarak formüle edildiğine dikkat edin.

P=0,285 değeri anlam düzeyi 0,05’ten çok küçük olduğu için H0 hipotezini reddedemeyiz. Buna göre otomatik park özelliğini kullanmak isteyen sürücülerin oranı % 10’dan azdır. Firma bu sonuca göre bu özelliği Still paketine eklemekten vazgeçecektir.

Normallik Testi

Bu bölümde ya verilerin yüzdelik değerlerini yada veri değerlerini girebilir yada none seçeneğini seçebilirsiniz. Test tipi. Varsayılan o l a r a k A n d e r s o n -Darling testi kullanılır.

Deterjan örneğindeki ağırlık verilerinin dağılımının Normal Dağılıma uygunluğunun testi için: Stat>Basic Statistics>Normality Test

Normallik Testi Normallik Testi

Page 10: Hipotez Testi İSTATİSTİK VE YAZILIMLA İstatistiksel ...w3.balikesir.edu.tr/~ocaktan/ist_yl_hafta4.pdf · Tek Taraflı Testler Montaj işlem süresi problemini düşünelim. Eğer

10

Normallik Testi