Upload
buituong
View
229
Download
0
Embed Size (px)
Citation preview
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 1
HĠPOTEZ TESTLERĠ VE ARALIK TAHMĠNĠ (GÜVEN ARALIĞI)
(konuların özeti)
1. Populasyon ortalaması( ) ve oranı (p)için
1.1 Büyük örneklerde n>30 ya da populasyon varyansı biliniyorsa
1.1.1 için
1.1.2 1
- 2 için ( bağımsız örnekler )
1.1.3 p için
1.1.4 1p - 2p için
1.2 Küçük örneklerde n 30 ve populasyon varyansı 2 bilinmiyor
1.2.1 için
1.2.2 1
- 2 için eĢleĢtirilmiĢ gözlemlerde
1.2.3 1
- 2 için eĢleĢtirilmemiĢ gözlemlerde
2. Populasyon varyansı için
2.1 2 için
2.2 2
2
2
1 / için
3. Örnek büyüklüğünün tespiti
4. Testin Gücü
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 2
ĠSTATĠSTĠKSEL YORUMLAMA
Örnekten elde edilmiĢ istatistikler varken ,örnek özelliklerine dayanılarak
populasyon parametreleri hakkında genellemeler yapmak gerekir. Bu iĢleme istatistiksel
yorumlama denir.
Ġstatistiksel yorumlama iki tip problemden oluĢur.
1.Tahmin
2.Hipotez testi
Hipotez testi yapılırken örnek istatistiğine karĢılık gelen (değeri bilinmeye
çalıĢılan)populasyon parametresine uygun olup olmadığının saptanmasına çalıĢılır.
Bir istatistik yardımı ile parametre tahmini yapılırken mutlaka belli bir
seviyede belirsizlik olacaktır. Sınırlı fayda çalıĢılan örnek istatistiği ile populasyon
parametresi arasında bir fark oluĢur. Bu durumda tahmin yapılırken hata yapma riski ile
karĢı karĢıya kalınır.
Bir hipotez kurulduğunda, bir tahmini kullanabilmek için bu tahmine ne derece güvenle
bakıldığının bilinmesi gerekir. Diğer taraftan da hangi tür hatalar ile karĢı karĢıya
kalındığının bilinmesi gerekir.
Hipotez Test Sonucu
RED KABUL
I. tip hata Doğru karar
DOĞRU 1-
(önem seviyesi) (güven aralığı)
0H hipotezi
Doğru karar II. tip hata
YANLIġ 1-
(testin gücü) (testin zayıflığı)
0H doğru olduğu hallerde hipotezin red edilmesi olasılığı ( ) ne kadar küçük ise bu
tercih edilen bir durumdur.
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 3
BĠR HĠPOTEZ TESTĠNĠN AġAMALARI
1.Hipotez kurulur.0H ve
1H belirlenir.
Bu aĢamada testin tek veya çift yönlü olduğu belirlenir.
a)Çift yönlü hipotez testi
00 : H
01 : H
REDRED1-α
α/2α/2
b)Tek yönlü hipotez testi
0 0
1 0
:
:
H
H
RED1-αα
veya
0 0
1 0
:
:
H
H
RED 1-αα
2) I. tip hata ( ) belirlenir, ya uygun örnek hacminde belirlenir, ve yı
sınırlayan n bulunur
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 4
3)Test istatistiği belirlenir.
a)Populasyon ortalaması( ) ve populasyon oranı için(p) için
2 biliniyorsa Z istatistiği
2 bilinmiyor ve n30 ise Z istatistiği
2 bilinmiyor ve n 30 ise t istatistiği
b)Populasyon varyansı ( 2 ) için 2 istatistiği
c)Ġki populasyon varyansının karĢılaĢtırılması için F istatistiği kullanılır.
4)Kritik tablo değeri bulunur.
-Bu değer 3. adımda kullanılan test istatistiği ve onun dağılıĢına bağlıdır.
-Tablonun nasıl kullanılacağı,tablo üzerindeki Ģekile göre farklılık gösterebilir.
-1. aĢamada belirtilen alternatif hipotez testi
çift yönlü ise 2
tek yönlü ise değerleri kullanılır.
5)Örneğe iliĢkin test istatistiği hesaplanır.
6)Karar: Kritik tablo değeri ile hesaplanan test istatistiği karĢılaĢtırılır,hipotez hakkında
karar verilir ve sonuç yorumlanır.
Hesaplanan test istatistiği Kritik tablo değeri ise 0H red edilir
Hesaplanan test istatistiği Kritik tablo değeri ise 0H kabul edilir.(red edilmez)
Diğer bazı hipotez testleri;
:0H 0
klasik teori geçerli
:1H 0
:0H 0
klasik teori geçersiz
11 : H
00 : H
klasik test teorisi kullanılamaz.
11 : H (ardıĢık analizler)
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 5
1.1.1 BÜYÜK ÖRNEKLERDE POPULASYON ORTALAMASI ĠÇĠN
HĠPOTEZ TESTĠ ( 2 BĠLĠNĠYOR)
ÖRNEK : Bilye üreten bir iĢletmede bilyelerin ağırlıklarının ortalaması 5 gr, standart
sapması 0,1 gr olan bir normal dağılıma uymaktadır.ĠĢletmede belli bir değiĢiklik yapılmıĢ
ve bu değiĢikliğin bilye ağırlıklarını arttırdığı düĢünülmektedir.Bu amaçla üretimden 16
rassal örnek alınmıĢ ve bu örneğin ortalaması 5,038 gr bulunmuĢtur.Bu verilere
dayanılarak 0.05 önem seviyesinde populasyon ortalamasının 5 gr.dan artıp artmadığını
test ediniz.
H0: =5
H 1 : >5
05.0
Z =
n
X
0
x
z
1.52
Red
Bölgesi
Red Edememe
Bölgesi
1.645
0.4500 0.05
olduğu için
H 0 red edilemez!!
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 6
H0 hipotezinin red edilebileceği en küçük anlamlılık düzeyine, hipotezin olasılık
değeri(p) denir.
(p)
0
0.5
1.28 1.52 1.645
0.10 0.643 0.05
Z=
n
X
H0: 5 Ģeklinde belirlense de
H 1 : 5 için aynı karar kuralı geçerli olur.
0.064
3
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 7
GÜVEN ARALIĞI 1-
P( ZX X )=1-
1-
0
x
z
1.645
5.079
Gerçek populasyon ortalaması için 0,95 güven aralığı
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 8
Örnek: Bir cıvata üreten fabrikada, belli bir tezgahta ortalaması 2 mm ve standart
sapması 0.06 mm olan normal dağılıĢa uygun cıvata üretilmektedir. Tezgahın doğru çalıĢıp
çalıĢmadığını test etmek amacıyla 9 rassal örnek alınmıĢ ve ortalaması 1.95 mm
bulunmuĢtur. 0.05 önem seviyesinde tezgahın doğru çalıĢıp çalıĢmadığını test ediniz.
-1.96 1.96
Red Edememe Bölgesi
(Kabul Bölgesi)Red Bölgesi
Red Bölgesi
-2.50
z
x
0
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 9
95,01 Güven Aralığı
nZx
nZxP
22
-1.96 1.96
x
z
21.9108 1.9892
0
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 10
1.1.2 BÜYÜK ÖRNEKLEMDE ĠKĠ POPULASYON ARASINDAKĠ FARK
21 ĠÇĠN HĠPOTEZ TESTĠ VE GÜVEN ARALIĞI
(varyanslar biliniyor veya büyük örnek,bağımsız örnekler.)
Belli bir soruya verilen cevaplar ile ilgili bir araĢtırmada (ankette)verilen cevaplar
1=kesinlikle karĢıyım ile 5=kesinlikle katılıyorum arasında bir ölçekte değerlendirme
istenmiĢtir. AraĢtırmaya 186 erkek cevap vermiĢ,cevapların ortalaması 4,059 ve standart
sapması 0,839 bulunmuĢ,172 kadın katılmıĢ yanıt ortalaması 3,68 ,standart sapması ise
0,966 bulunmuĢtur.0,01 lik önem seviyesinde erkeklerin cevaplarının gerçek ortalamasının
kadınlarınkinden daha yüksek olup olmadığını test ediniz.
0
1
: 0
: 0
0.01
E K
E K
H
H
KE xx
KEKE
S
xxz
K
K
E
Exx
n
S
n
SS
KE
22
0
x
z
2.33
Red
Bölgesi
3.95
E-K=0
0.49
.
95,333,2 hZZ olduğu için 0H red
Var( )x(Var)x(Var)xx 2121
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 11
98,01 Güven aralığı
01,02
1
22KEKE xxKExxKE SzSzxxP
-2.33 2.33
x
z
20.1556 0.6024
1-
E-
K
0
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 12
1.1.3.BÜYÜK ÖRNEKLERDE POPULASYON ORANI (p) ĠÇĠN HĠPOTEZ
TESTĠ
( 2 BĠLĠNĠYOR VEYA n>30)
Bir süpermarkette 802 müĢterinin 378’i belli bir malı alıĢveriĢ arabasına koyduktan
hemen sonra doğru fiyatı söyleyebilmiĢtir.MüĢterilerin ancak (en az) yarısının doğru fiyatı
söyleyebileceği hipotezini 0,1 seviyesinde test ediniz.
H 0 = p 0,5 (veya p=p0 da olabilir)
H 1 = p< 0,5
=0,1 (p 00 , H doğru iken oran)
p
pp
ˆ
0ˆ
n
ppp
)1( 00ˆ
0-1.28
p
z
1-α
α=0.1
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 13
Açıklama:
Binom dağılıĢında x Ģans değiĢkeni için
E(x)=np
Var(x)=npq
n
xp
Var(p)=Var )(n
x= )(
1)(
122
npqn
xVarn
=n
pq
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 14
1- =0.90 Güven Aralığı
ˆ/ 2ˆ 1pP p p
-1.28
z
0.448
1-
0
pp
=0.1
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 15
1.1.4 BÜYÜK ÖRNEKLERDE ĠKĠ POPULASYON ORANI ARASINDAKĠ
FARK (p1-p2) ĠÇĠN HĠPOTEZ TESTĠ
( 2 BĠLĠNĠYOR VEYA n>30)
Tesadüfi olarak seçilen 203 Ġngiliz ticari dergi reklamından 52’sinde gülme unsuru
varken,270 Amerikan ticari dergi reklamından 56’sında gülme unsuru iĢlenmektedir. Tüm
Ġngiliz ve Amerikan ticari dergi reklamlarında gülme unsuru iĢlenme oranlarının aynı olup
olmadığının testi için kritik değeri bulun ve buna karĢılık gelen 0H red olasılığının limit
değerini hesaplayınız.
0:
0:
1
0
yx
yx
ppH
ppH
0
56 56ˆ 0.228
203 270
x y
x x y y x y
x y x y x y
x yn n
n p n p n n x yp
n n n n n n
2 2 2
ˆ ˆ ˆ ˆ
ˆ ˆˆ ˆx y x y
y yx xp p p p
x y
p qp q
n n
0H doğru iken 0p̂pp yx olacağına göre
2
ˆ ˆ
ˆ ˆ ˆ ˆ 1 1ˆ ˆ ˆ ˆ
x y
x y
p p
x y x y x y
n npq pqpq pq
n n n n n n
olur.
yx
yxyx
x
nnqp
pppp
11ˆˆ
ˆˆ
00
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 16
-1.26 1.26
z
0
0.3962
px-py
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 17
1- 90.0 Güven Aralığı
P 1ˆˆˆˆˆˆ2/ˆˆ2/ yxyx ppyxyxppyx pppppp
-1.645 1.645
z
1-
0
px-py-0.0148 0.1128
px-py
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 18
1.2.1 KÜÇÜK ÖRNEKLERDE POPULASYON ORTALAMASI ĠÇĠN
HĠPOTEZ TESTĠ( 2 bilinmiyor, ve n < 30)
Bir mağaza zincirinde Aralık ayı satıĢlarının Kasım ayı satıĢlarından 0,20 daha fazla
olduğu bilinmektedir. Bu amaçla 6 ayrı mağazadaki Aralık ayı satıĢ artıĢ yüzdeleri
alınmıĢtır. Bu verilere gör, populasyon dağılımının normal olduğu varsayımı altında Aralık
ayı satıĢ ortalamalarındaki gerçek artıĢın 0,20 olduğu hipotezini 0,1 anlamlılık düzeyinde
test ediniz.
Mağaza No
6 ayrı mağazadaki
Kasım–Aralık SatıĢ ArtıĢ %si
x
2
ix
1 19,2 368,64
2 18,4 338,56
3 19,8 392,04
4 20,2 408,04
5 20,4 416,16
6 19,00 361,00
Toplam 117 2,284,44
20: 00 H
20:1 H
1,0
nS
x
S
xt
x
n
1,
5,196
117
n
xx
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 19
-2.015 2.015
1-
0
-0.0148 0.1128
t /2,n-1
x
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 20
99,01 Güven Aralığı
1
1,2
1,2
xnxnStxStxP
-2.015 2.015
x
1-
0
18.82 20.17
t /2,n-1
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 21
1.2.2 KÜÇÜK ÖRNEKLERDE ĠKĠ POPULASYON ORTALAMASI
ARASINDAKI FARK )( 21 ĠÇĠN HĠPOTEZ TESTĠ : EġLEġTĠRĠLMĠġ
BAĞIMLI GÖZLEMLER bilinmiyor2( ve )30n
Ġki ayrı TV program kuĢağında 10 ayrı reklam kiĢilere izlettirilmiĢ ve 24 saat sonra, iki
ayrı kuĢaktaki reklamlardan hatırlanma indeksleri elde edilmiĢtir.
Ürün Sabah
KuĢağı
AkĢam
KuĢağı id 2
id
1 137 53 84 7,056
2 135 114 21 441
3 83 81 2 4
4 125 86 39 1,521
5 47 34 13 169
6 46 66 -20 400
7 114 89 25 625
8 157 113 44 1,936
9 57 88 -31 961
10 144 111 23 1,089
Toplam 210 14,202
Ġki ayrı kuĢakta izlenen reklamların hatırlanması indeksleri karĢılaĢtırıldığında sabah
kuĢağının hatırlanması indeksinin daha yüksek olup olmadığını 05,0 seviyesinde test
ediniz.
00 0: DH aB
0:1 aBH
d
nS
Ddt 0
1,
2110
210
n
dd
i
n
SS d
d
2
2
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 22
0 1.833
d
t ,n-1
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 23
Açıklama :
Eğer gözlemler bağımlı ise ;
2
,
222
212121
2xxxxxx
n
xxCov
nn
xx 21
2
2
1
2,
221
222
21 xx ve nnn 21 ise
n
xxCov
nn
21
22 ,2
n
xxCov
n
21
2 ,22
olur.
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 24
90,01 Güven Aralığı
1**
1,2
1,2 agag xxnagagxxnag StxxStxxP
-1.833 1.833
1-
0
1.869 40.13D0
d
t /2,n-1
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 25
1.2.3 KÜÇÜK ÖRNEKLERDE ĠKĠ POPULASYON ORTALAMASI
ARASINDAKĠ FARK )( 21 ĠÇĠN HĠPOTEZ TESTĠ:
EĢleĢtirilmemiĢ (bağımsız) gözlemler ( varyanslar eĢit, 2 bilinmiyor ve n 30 )
Belli bir kuĢ cinsinde erkek ve diĢi ağırlıklarının eĢit olup olmadığı araĢtırılmaktadır.
AĢağıdaki verilere göre bu hipotezi 0.05 seviyesinde test ediniz.
Örnek hacmi(n) ortalama( x ) varyans( 2 )
Erkek 10 90.80 55.2
DiĢi 9 81.52 66.2
H0: 1 - 2 = 0
H 1 : 1 - 2 0
= 0.05
2
)1()1(
)11
(
)()(
21
2
22
2
112
21
22
2121
21
21
nn
SnSnS
nnSS
S
xxt
xx
xx
( 22
2
2
1 SSS varsayımı ile )
0
x1-x2
-2,110 2,110
t /2,n1+n 2-1
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 26
Açıklama.:
22
2
2
1 değil ise
2
2
2
1
2
1
21_
n
S
n
Sxx olur.
tt
n
S
n
S
xxt
2
2
2
1
2
1
2121 )()( dağılıĢı gösterir.
2
2
2
1
2
1
1,
2
2
21,
1
2
1
21
221121
**
n
s
n
s
tn
st
n
S
ww
twtwt
nn
t
olur.
Eğer 1n = nn 2 ise
1,
2
2
1
2
2
2
1
1,
2
2
2
1
1,
2
21,
2
1
)(1
)(
nt
n
nn
t
tt
ssn
ssn
t
n
s
n
s
tn
st
n
s
t
dağılıĢı gösterdiği görülür.
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 27
95.01 GÜVEN ARALIĞI
1)()(
2121 1,2
21211,
2
21 xxn
xxn
stxxstxxP
0
x1-x2
-2,110 2,110
1.7473 16.81271-
2
t /2,n1+n 2-2
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 28