31
Hipotez Testi 21/03/2012 AYŞE S. ÇAĞLI [email protected] İSTATİSTİK 2 1

İSTATİSTİK 2 - Beykentkampus.beykent.edu.tr/Paylasim/Dosyalar/DERS4_hipotez...Örnek 3 Futbol hakemleri tarafından kuralların yeniden yorumlanması sonucunda maç başına düşen

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Hipotez Testi

21/03/2012

AYŞE S. ÇAĞLI [email protected]

İSTATİSTİK 2

1

Güven aralığı ve Hipotez testi

2

Veriler , bir değer aralığında hangi değeri gösteriyor?

(Parametrenin gerçek değeri hakkında bir bilgimiz yok.)

Veriler , daha önceden belirlenmiş bir değeri

gösteriyor mu?

(Parametrenin değeri hakkında bir fikrimiz var.)

µ? µ?

µ 0?

Güven aralığı

Hipotez nedir?

3

Hipotez, karşılaşılan bir durum hakkında

yapılan bir önermedir.

İstatistikte, hipotez, bir anakütle

paramatresi hakkında yapılan

bir önermedir:

Mesela, anakütle ortalaması

Örnek: Bu şehirdeki ortalama aylık cep

telefonu faturası μ = 42TL

Hipotez Testi nedir?

4

Bir hipotez testi, iki tür hipotez oluşturmakla başlar:

Sıfır hipotezi

Alternatif (Karşıt) hipotez

Sıfır hipotezi, “arada fark yoktur”, “fark sıfırdır” şeklinde kurulur.

Hipotez testi, sıfır hipotezinin (H0) doğru olduğu varsayımı ile başlar.

Bir hipotez testinin amacı, sıfır hipotezinin (karşıt hipotez leyhine) reddedilip edilmemesine karar vermektedir.

Sıfır hipotezi, H0

5

Test edilecek varsayımı ifade eder.

Örnek: Amerikan evlerindeki ortalama TV sayısı 3’tür.

Her zaman bir anakütle parametresi hakkındadır,

asla örneklem istatistiği hakkında değildir.

3μ:H0

3μ:H0 3X:H0

Sıfır hipotezi, H0

6

Anakütle parametresinin önceden belirlenmiş,

bilinen değerinde herhangi bir farklılığın

beklenmediğini ifade eden hipotezdir.

Her zaman şu işaretleri içerir : “=” , “≤” , “≥”

H0’a aykırı yeterli kanıt bulunmadıkça bu hipotez

geçerli sayılır.

Suçluluğu ispat edilene kadar masum olma durumu

gibi.

Alternatif (Karşıt) Hipotez, H1

7

İlgili anakütle parametresinin bilinen değerinde

istatistiksel olarak anlamlı farkların beklendiğini

ifade eder.

Ör. Amerikan evlerindeki ortalama TV sayısı 3 değildir:

( H1: μ ≠ 3 )

Asla şu işaretleri içermez : “=” , “≤” , “≥”

Eğer doğru olduğunu destekleyen yeterli kanıt

bulunursa, H1 desteklenir ve H0 reddedilir.

8

Alternatif (Karşıt) Hipotez, H1

Eğer amaç, µ ‘nün belirli bir değerden (µ₀), farklı olup

olmadığını belirlemek ise, alternatif hipotezi şu şekilde yazılır :

H1: µ ≠ µ₀ Bu durumda, hipotez testine iki-yönlü denir.

Eğer amaç, µ ‘nün belirli bir değerden (µ₀) düşük olup

olmadığını belirlemek ise, alternatif hipotezi şu şekilde yazılır :

H1: µ < µ₀ Bu durumda, hipotez testine tek yönlü (sol taraflı)

denir.

Eğer amaç, µ ‘nün belirli bir değerden (µ₀) yüksek olup

olmadığını belirlemek ise, alternatif hipotezi şu şekilde yazılır :

H1: µ > µ₀ Bu durumda, hipotez testine tek yönlü (sağtaraflı)

denir.

Hipotezleri tanımlama

Örnek : Anakütle ortalamasının 3 olmadığını test edin.

Etaplar:

Soruyu istatistiksel olarak yazın : (µ ≠ 3)

Sorunun tersini istatistiksel olarak yazın (µ = 3)

Bağdaşmaz ve bütünü kapsayıcı olacak şekilde olmalı.

Alternatif hipotezi seçin (µ ≠ 3)

Yazılmış olan iki önermeden içinde şu işaretlerden birini

bulunduranı seçin : ≠, <, >

Sıfır hipotezini seçin (µ = 3)

9

Soruyu istatistiksel olarak yazın : µ = 12

Sorunun tersini istatistiksel olarak yazın: µ ≠ 12

Alternatif hipotezi seçin : H1: µ ≠ 12

Sıfır hipotezini seçin : H0: µ = 12

Anakütlenin ortalama TV seyretme süresi

12 saat midir?

Hipotezleri tanımlama

10

Soruyu istatistiksel olarak yazın : µ ≠ 12

Sorunun tersini istatistiksel olarak yazın: µ = 12

Alternatif hipotezi seçin : H1: µ ≠ 12

Sıfır hipotezini seçin : H0: µ = 12

Anakütlenin ortalama TV seyretme süresi

12 saatten farklı mıdır?

Hipotezleri tanımlama

11

Soruyu istatistiksel olarak yazın : µ ≤ 20

Sorunun tersini istatistiksel olarak yazın : µ > 20

Alternatif hipotezi seçin : H1: µ > 20

Sıfır hipotezini seçin : H0: µ = 20

Bir şapkanın ortalama maliyeti 20$’dan az

ya da ona eşit midir?

Hipotezleri tanımlama

12

Soruyu istatistiksel olarak yazın µ > 25

Sorunun tersini istatistiksel olarak yazın : µ ≤ 25

Alternatif hipotezi seçin : H1: µ > 25

Sıfır hipotezini seçin : H0: µ = 25

Bir kitapçıda yapılan ortalama harcama

25 $’dan fazla mıdır?

Hipotezleri tanımlama

13

Hipotez testinde yapılan hatalar

Karar Doğal durum

H0 Doğru H0 Yanlış

H0’ın red edilmemesi

Doğru karar

Olasılık :1 – α II. Tip hata

Olasılık : β

H0’ın reddi I. Tip hata

Olasılık : α

(anlamlılık düzeyi)

Doğru karar

Olasılık :1 – β

( testin gücü)

14

I. Ve II. Tip Hatalar arasındaki ilişki

15

I. ve II. Tip hatalar aynı anda gerçekleşemez.

I. Tip hata yalnızca H0 doğru olduğunda olur.

II. Tip hata yalnızca H0 yanlış olduğunda olur.

Eğer I. Tip hata olasılığı artarsa (), II. Tip hata

olasılığı azalır (β)

Anlamlılık seviyesi () arttıkça, testin gücü de

(1 – β) artar.

Anlamlılık seviyesi,

16

H0 doğru olduğunda, örneklem istatistiğinin

alabileceği pek mümkün olmayan değerlerin

oranını verir.

Örnekleme dağılımında red bölgesini tanımlar.

, ile gösterilir

Yaygın kullanılan seviyeler 0,01 ; 0,05 ; 0,10

Araştırmacı tarafından test başlangıcında

belirlenir.

Testin kritik değer(ler)ini verir.

Anlamlılık seviyesi ve Red bölgesi

17

H0: μ ≥ 3

H1: μ < 3 0

H0: μ ≤ 3

H1: μ > 3

Kritik değer

Sol taraflı test

Anlamlılık seviyesi =

0 Sağ taraflı test

İki yönlü test

Red bölgesi

taralı olarak

gösteriliyor.

/2

0

/2 H0: μ = 3

H1: μ ≠ 3

Ortalama için Hipotez testi (σ biliniyor)

18

Amaç : Anakütle ortalaması, µ, için hipotez testi uygulamak

Varsayımlar: Rasgele örneklem

Normal anakütle

σ biliniyor

Etap 1: Sıfır hipotezi H0 : µ = µ₀, belirlenir. Alternatif

hipotez olarak da aşağıdaki 3 durumdan biri belirlenir.

H1: µ ≠ µ₀ veya H1: µ < µ₀ veya H1: µ > µ₀

(iki yönlü) (sol taraflı) (sağ taraflı)

Etap 2: Anlamlılık seviyesi α belirlenir

Etap 3: Sıfır hipotezinde geçen değerin z değeri hesaplanır.

𝑧0 =𝑥 − 𝜇0

𝜎/ 𝑛

Step 4: Kritik değerler bulunur

±zα/2 veya – zα veya zα

(İki yönlü) (Sol taraflı) (Sağ taraflı)

19

Ortalama için Hipotez testi (σ biliniyor)

Etap 5: Eğer z0 red bölgesine düşüyorsa, H0 reddedilir,

yoksa, H0 reddedilmez.

Etap 6 : Hipotez testinin sonuçları yorumlanır.

20

Ortalama için Hipotez testi (σ biliniyor)

İki yönlü Sol taraflı Sağ taraflı

red red red red

H0 red edilemez H0 red

edilemez H0 red

edilemez

Tek taraflı Test İki taraflı Test

H0: µ = µ0 H0: µ = µ0

Ha: µ < or > µ0 Ha: µ ≠ µ0

Test istatistiği: Test istatistiği:

Red bölgesi: Red bölgesi:

| z | > zα | z | > zα/2

x

xz

0

x

xz

0

Ortalama için Hipotez testi (σ biliniyor)

21

Örnek1: Ortalama için sağ taraflı test

22

Telefon sanayiindeki bir yönetici müşterilerin

aylık cep telefonu faturalarında bir artış

olduğunu ve artık ortalama faturanın 52TL’nin

üstünde olduğunu düşünüyor. Şirket bu

düşünceyi test etmek istiyor. ( = 10)

H0: μ ≤ 52 ortalama 52 TL‘den yüksek değil.

H1: μ > 52 ortalama 52 TL‘den yüksek.

(yani, yöneticinin düşüncesini destekleyen yeterli

kanıt var.)

Hipotezleri tanımla:

Örnek1: Red bölgeleri bulunur.

23

Test için anlamlılık seviyesi = 0.10 seçildi.

Red bölgesi:

H0 Reddedilir H0 reddedilemez

= 0.10

1.28 0

H0 red

1.28nσ/

μxz 0

Eğer ise, H0 reddedilir.

24

Örneklemden yola çıkarak, test istatistiği hesaplanır

Şu değerleri veren bir örneklem varsayıyoruz:

n = 64, x = 53.1

( = 10)

Test istatistiği:

0.88

64

10

5253.1

n

σ

μxz 0

Örnek1 : Örneklem sonucu

Örnek1 : Karar

25

H0 reddedilir H0 reddedilemez

= 0.10

1.28 0

H0 reddilir

H0 reddedilemez çünkü z = 0.88 < 1.28

Yorum: telefon faturalarının 52 TL’nin üstünde olduğunu destekleyen yeterli kanıt yoktur.

z = 0.88

Örnek 2

26

«Amerika’da evlerde bulunan ortalama

TV sayısı 3’tür» önermesini test edin. (σ = 0.8 olarak varsayalım)

Sıfır ve alternatif hipotezleri yazın

H0: μ = 3 , H1: μ ≠ 3 (Bu bir iki yönlü test olacaktır)

Anlamlılık seviyesini belirleyin

Bu test için = 0.05 seçilmiş olsun

Örneklem büyüklüğü seçin.

n = 100 olacak şekilde bir örneklem seçilmiştir.

Örnek 2

27

2.00.08

.160

100

0.8

32.84

n

σ

μXz 0

Kritik değerleri belirleyin

= 0.05 için kritik z değerleri ±1.96’dır.

Test istatistiğini hesaplayın

Örneklem sonuçlarının şu şekilde olduğunu varsayalım.

n = 100, x = 2.84 (σ = 0.8)

Öyleyse, test istatistiği :

Örnek 2

28

Test istatistiği red bölgesinde mi?

H0 reddedilir H0 reddedilemez

= 0.05/2

– z = – 1.96 0

Eğer z < –1.96

veya z > 1.96

ise, H0’ı

reddederiz.

Aksi durumda,

H0 reddedilmez.

= 0.05/2

H0 reddedilir

+z = +1.96

z = – 2.0 < – 1.96, Demekki

test istatistiği red bölgesinde.

Örnek 2

29

Sonucu yorumla!!!

–2.0

z = – 2.0 < – 1.96 olduğu için sıfır hipotezini reddettik.

Demekki, Amerika’da evlerde bulunan ortalama TV

sayısının 3 olmadığı yönünde yeterli kanıt vardır.

= 0.05/2

–z = –1.96 0

= 0.05/2

+z = +1.96

H0 reddedilir H0 reddedilemez H0 reddedilir

Örnek 3

Futbol hakemleri tarafından kuralların yeniden yorumlanması

sonucunda maç başına düşen sarı kart sayısında bir artış

olması bekleniyor. Şimdiye kadar maç başına düşen ortalama

sarı kart sayısı 4, standart sapması da 0,5 olsun.

121 maçlık bir örneklemden elde edilen verilere göre maç

başına ortalama 4,7 sarı kart çıktığı hesaplanmıştır.

%5’lik anlamlılık seviyesinde, gerçekten sarı kartlarda

artış olmuş mudur?

30

• Hipotezleri oluşturun:

• H0: μ = 4 , H1: μ ≠ 4 ( İki yönlü test)

• Anlamlılık seviyesi 0,05

• Kritik z değerleri ±1,96’dır.

Örnek 3

31

Örneklem ortalaması 𝒙 = 4,7 Örneklem büyüklüğü n = 121

Test istatiğini hesaplayın:

Sonuç ve yorum: z₀ red bölgesine düştüğü için, H0 reddedilir.

Demekki,sarı kart sayısında bir artış olduğu konusunda yeterli

kanıt vardır.

94,10064,0

47,400

xs

xz

H0 reddedilmez

H0 reddedilir H0 reddedilir

0,025 0,025

-1,96 +1,96 10,94