Upload
others
View
10
Download
0
Embed Size (px)
Citation preview
ÖRNEKLEME TEORİSİ VE
TAHMİN TEORİSİ
1
TEMEL KAVRAMLAR
PARAMETRE:
• Populasyonun sayısal açıklayıcı bir ölçüsüdür ve anakütledeki tüm elemanlar dikkate alınarak hesaplanabilir.
• Anakütledeki tek bir eleman dahi işlemin dışında kalır ise elde edilen sonuç parametre olarak kabul edilemez.
ÖRNEK İSTATİSTİĞİ
(PARAMETRE TAHMİNLEYİCİSİ):
• Bir örneğin sayısal betimsel ölçüsüdür ve örnekteki gözlemlerden hesaplanır.
• Diğer bir deyişle bilinmeyen bir parametrenin sayısal değerini bulabilmek (tahminlemek) için kullanılır.
2
PARAMETRE VE ÖRNEK
İSTATİSTİKLERİ İÇİN ÖRNEKLER
Parametre
• Anakütle ortalaması
• Anakütle Medyanı M
• Anakütle Varyansı 2
• Anakütle Standart
Sapması
• Anakütle Oranı P
Örnek istatistiği
• Örnek ortalaması
• Örnek Medyanı m
• Örnek Varyansı s2
• Örnek Standart
Sapması s
• Örnek Oranı p
x
3
Bir Populasyon Parametresi Hakkında
En Geniş Bilgiyi Hangi Örnek İstatistiğinin İçerdiğine
Nasıl Karar Verilecek?
Örneğin anakütle ortalaması için
• Aritmetik ortalama
• Geometrik ortalama
• Harmonik ortalama
• Medyan
vb. örnek istatistiklerinden hangisi tercih edilmelidir.
4
Örnek 1a
Bir zar atılışında x üst yüzdeki sayıyı göstersin. E(x)= anakütle parametresini (anakütle ortalamasını) bulunuz.
x 1 2 3 4 5 6
P(x) 1/6 1/6 1/6 1/6 1/6 1/6
xP(x) 1/6 2/6 3/6 4/6 5/6 6/6
6
1
1 2 6 21( ) ( ) ...... 3,5
6 6 6 6x
E x xP x
5
Örnek 1b
• Ancak bu değerinin bir an için bilinmediği
ve bunu tahmin etmek için populasyondan
3 örnek alındığını varsayılsın.
6
• Zar 3 kez atılsın ve örnek sonuçları; x1=2, x2=2,
x3=6 elde edilsin.
333,33
10
3
622
n
xx ve m=2 hesaplanabilir. m:medyan
1 2 3 4 5 6
m=2
X=3.3
=3.5
SONUÇ: x değeri değerine daha yakındır.
7
• Zar 3 kez daha atılsın ve örnek sonuçları; x1=3, x2=4,
x3=6 elde edilsin.
3,43
13x ve m=4
1 2 3 4 5 6
m
x
SONUÇ: m değeri değerine daha yakındır.
8
Örnek için Yorum
2. Ne örnek aritmetik ortalaması
Ne de örnek medyanı (m),
populasyon ortalamasına daima daha yakındır
denilemez.
Sonuçların genellenebilmesi için örnek istatistiklerinin
dağılışına gerek duyulmaktadır.
x
1. Örnekten hesaplanan örnek istatistikleri (tahminleyiciler)
birer şans değişkenidir.
9
ÖRNEKLEME DAĞILIMLARI
10
• Anakütleden n adet ölçümden x1, …, xn
oluşan bir örnekten alınmış olsun.
• Anakütledeki eleman sayısı N olsun.
• Anakütleden alınabilecek her biri n adet
eleman içeren tüm mümkün örnek sayısı:
Nk
n
11
• Bu koşullar (N, n) altında hesaplanabilecek
örnek istatistiği sayısı k adettir.
• Örnek istatistiğinin anakütlesindeki eleman
sayısı k olur.
• Örnek verilerinden hesaplanan bir örnek
istatistiği için elde edilen bu anakütle
örnekleme dağılışı olarak adlandırılır.
ÖRNEKLEME DAĞILIMLARI
12
ÖRNEKLEME DAĞILIMLARI
• Örnekleme dağılımı bu istatistiğin bir
olasılık dağılışıdır.
• Örnekleme dağılımı anakütledeki eleman
sayısı N ve n örnek hacminin bir
fonksiyonudur.
Örnek 2
13
• Büyük bir populasyondan alınmış 3 ölçümün (0, 3, 12)
olasılık dağılışı aşağıdaki gibidir;
n = 3
a) Örnek ortalaması ( )’nın örnekleme dağılışı
b) Örnek medyanı (m)’nın örnekleme dağılışını bulunuz.
• DİKKAT: ANAKÜTLEDEKİ ELEMAN SAYISI N
BİLİNMİYOR. FAKAT ŞANS DEĞİŞKENİNİN OLASILIK
DAĞILIMI P(x) BİLİNİYOR.
x 0 3 12
P(x) 1/3 1/3 1/3
x
Mümkün Örnekler x m Olasılık p= x / n
(x tek sayı
gelmesi durumu)
0 0 0 0 0 1/27 0/3
0 0 3 1 0 1/27 1/3
0 0 12 4 0 1/27 0/3
0 3 0 1 0 1/27 1/3
0 3 3 2 3 1/27 2/3
0 3 12 5 3 1/27 1/3
0 12 0 4 0 1/27 0/3
0 12 3 5 3 1/27 1/3
0 12 12 8 12 1/27 0/3
3 0 0 1 0 1/27 1/3
3 0 3 2 3 1/27 2/3
3 0 12 5 3 1/27 1/3
3 3 0 2 3 1/27 2/3
3 3 3 3 3 1/27 3/3
3 3 12 6 3 1/27 2/3
3 12 0 5 3 1/27 1/3
3 12 3 6 3 1/27 2/3
3 12 12 9 12 1/27 1/3
12 0 0 4 0 1/27 0/3
12 0 3 5 3 1/27 1/3
12 0 12 8 12 1/27 0/3
12 3 0 5 3 1/27 1/3
12 3 3 6 3 1/27 2/3
12 3 12 9 12 1/27 1/3
12 12 0 8 12 1/27 0/3
12 12 3 9 12 1/27 1/3
12 12 12 12 12 1/27 0/3
Örnek 2 Örnek 3 14
15
Örnek 2
• Aritmetik Ortalama Örnekleme Dağılışı
• Medyan Örnekleme Dağılışı
0 1 2 3 4 5 6 8 9 12
P( ) 1/27 3/27 3/27 1/27 3/27 6/27 3/27 3/27 3/27 1/27
xx
m 0 3 12
P(m) 7/27 13/27 7/27
16
Niçin Örnek? Anakütle parametrelerinin örnek değerleri (örnek istatistikleri)
yardımıyla tahmin edilmesine imkan sağlamak modern
istatistiğin önemli bir görevidir.
Anakütlenin tamamı incelenmez.
Anakütleden bir şans örneği alınır.
Elde edilen örnek değerlerinin anakütle parametresi yerine
kullanılması için iki şart vardır:
a. Örnek şans örneği olmalı. Anakütledeki her birimin örneğe
girme şansı eşit olmalı
b. Örnek yeterince büyük olmalı
17
Tahminleyicilerin Özellikleri
Sapmasız Sapmalı
B A X
)(XP
1. Sapmasızlık
N birimlik aynı anakütleden farklı sayıda örneklem
seçilebileceği için tahmin edicinin değeri de seçilen
örnekleme göre değişmektedir. Bu durumda örneklem
sayısı kadar elde edilen tahmin edici, bir rassal
değişken olup, ortalaması ve varyansı olan bir olasılık
dağılımına sahiptir. Bu dağılımın beklenen değerinin
anakütle parametresine eşit olmasına, diğer bir ifadeyle
bir istatistiğin beklenen değeri ile bilinmeyen anakütle
parametresi arasındaki farkın sıfıra eşit olmasına
“sapmasızlık” denir. E(X) E(X) 0
18
Tahminleyicilerin Özellikleri
2. Tutarlılık (Kararlılık)
Küçük örnek hacmi
Büyük örnek hacmi
A
B
)X(P
X
Örneklemdeki birim sayısı sonsuza doğru arttırıldığında, tahmin edicinin değerinin anakütle değerine yaklaşması ve n=N olması durumunda aralarındaki farkın sıfıra inmesi özelliğine “tutarlılık” denir.
nlim P 1
,’nın tutarlı tahmincisidir.
19
Tahminleyicilerin Özellikleri
3. Etkinlik
A
B
X
)X(P
Birden fazla sapmasız ve tutarlı tahminci olması
durumunda, bir tahmincinin varyansının, aynı
anakütle parametresinin başka bir tahmincisinin
varyansından daha küçük olması durumunda elde
edilen tahmincilere “etkin” tahminci adı verilmektedir.
Etkin Tahminci
Örnek hacmi büyüdükçe tahminleyicinin varyansı küçülür.
X
P(X)
A
BKüçük
örnek
hacimli
durum
Büyük
örnek
hacimli
durum
ÖRNEKLEME DAĞILIMI ÖRNEK
HACMİNİN BİR FONKSİYONUDUR
20
• Örnek 2 verileri için aritmetik ortalama ve
örnek medyanının tahminleyici özelliklerini
araştırınız.
21
Örnek 3
Örnek 3
22
Aritmetik ortalama , anakütle ortalamasının sapmasız
bir tahminleyicisi midir?
x
x 0 3 12
P(x) 1/3 1/3 1/3
1
( )N
i ii
E x x P x
1 1 10 3 12
3 3 3
5
Örnek 3
23
0 1 2 3 4 5 6 8 9 12
P( ) 1/27 3/27 3/27 1/27 3/27 6/27 3/27 3/27 3/27 1/27
xx
1
( )N
x i ii
E x x P x
1 3 10 1 12
27 27 27
5
Örnek 3
24
Sonuç:
E x
olduğundan aritmetik ortalama (tahminleyici), anakütle
ortalamasının (parametrenin) sapmasız bir tahminleyicisidir.
Örnek 3
25
Örnek medyanı m, anakütle ortalamasının sapmasız
bir tahminleyicisi midir?
m 0 3 12
P(m) 7/27 13/27 7/27
7 13 7
0 3 1227 27 27
i ii
E m m P m
4.56
E m
Örnek 3
26
Sonuç:
olduğundan örnek medyanı (tahminleyici), anakütle
ortalamasının (parametrenin) sapmalı bir tahminleyicisidir.
E m
Örnek 3
27
• Aritmetik ortalama , anakütle ortalamasının Minimum
Varyanslı bir tahminleyicisi midir?
x
x 0 3 12
P(x) 1/3 1/3 1/3
x2 0 9 144
x2P(x) 0 9/3 144/3
2 2 153( )
3i iE x x P x
22 2
x V x E x E x
21535
3
26
Örnek 3
28
Aritmetik ortalamanın varyansı 2
x
0 1 2 3 4 5 6 8 9 12
P( ) 1/27 3/27 3/27 1/27 3/27 6/27 3/27 3/27 3/27 1/27
0 1 4 9 16 25 36 64 81 144
P( ) 0 3/27 12/27 9/27 48/27 150/27 108/27 192/27 243/27 144/27
ix
2
ix
ix
2
ixix
2 2 909
27i iE x x P x
22( ) ( )V x E x E x
2909(5)
27
= 8,66
Örnek 3
29
mi 0 3 12
P(mi) 7/27 13/27 7/27
0 9 144
P(mi) 0 117/27 1008/27
Örnek medyanının varyansı 2
m
2
im2
im
2 2 41.66i iE m m P m
22( ) ( )V m E m E m
241.66 (4.56)
=20.86
Örnek 3
30
Sonuç:
Aritmetik ortalama , anakütle ortalamasının Sapmasız ve
Minimum Varyanslı bir tahminleyicisidir.
V x V m
x
BEKLENEN DEĞER VE VARYANS
OPERATÖRLERİNİN ÖZELLİKLERİ
31
BEKLENEN DEĞER OPERATÖRÜ E(.)
• Şans değişkeni x anakütle ortalaması ve
anakütle varyansı 2 olsun.
• a ile b birer sabit sayı olmak üzere,
E(a)=a
E(ax)=aE(x)=a
E(ax+b)=aE(x)+b=a+b
32
BEKLENEN DEĞER VE VARYANS
OPERATÖRLERİNİN ÖZELLİKLERİ
VARYANS OPERATÖRÜ V(.)
• Şans değişkeni x anakütle ortalaması ve
anakütle varyansı 2 olsun.
• a ile b birer sabit sayı olmak üzere,
V(a)=0
V(ax)=a2V(x)= a22
V(ax+b)= a2V(x)= a22
MERKEZİ LİMİT TEOREMİ
33
• Şans değişkeni x’in dağılımı ne olursa olsun bu
anakütleden alınan n hacimli örneklerden
hesaplanan aritmetik ortalamanın dağılımı
yaklaşık olarak normal dağılıma sahiptir.
x
x• Örnek hacmi büyüdükçe aritmetik ortalamanın
dağılımının normal dağılıma yakınsaması artar.
Şans Değişkenlerinin
Standartlaştırılması
• Standart değişkenler genellikle z ile gösterilir.
• Ortalaması sıfır, E(z)=0
• Varyansı bir, V(Z)=1.
şans değişkeni-anakütle ortalaması
anakütle standart sapmasız
34
35
BAZI ÖNEMLİ TAHMİNLEYİCİLER İÇİN ÖRNEKLEME
DAĞILIMLARININ BELİRLENMESİ
• Aritmetik ortalama
• Örnek varyansı s2
• Örnek oranı p
x
BİR DAĞILIMIN BELİRLENMESİ
• Dağılışın tipinin belirlenmesi,
(Normal, Üstel, Poisson vb.)
• Dağılımın parametrelerinin belirlenmesi
36
37
ARİTMETİK ORTALAMA İÇİN
ÖRNEKLEME DAĞILIMI
x
Şans değişkeni x anakütle ortalaması ve anakütle varyansı
2 olsun.
1 1 2
n
ii nx x x x
xn n
?E x
?V x
Cevaplanması gereken sorular
• Dağılımın tipi?
• Parametreleri;
DAĞILIMIN TİPİ
• Merkezi limit teoremine göre aritmetik
ortalamanın dağılımı yaklaşık olarak
normal dağılıma sahiptir.
• Normal dağılımın parametreleri:
– Anakütle ortalaması
– Anakütle varyansı
38
Dağılımın Parametreleri: Aritmetik Ortalama
için Anakütle Ortalaması
39
11
1n
iin
xE x E E x E x
n n
1 n
E xn n
E x
Dağılımın Parametreleri: Aritmetik Ortalama
için Anakütle Varyansı
40
112
1n
iin
xV x V V x V x
n n
2
2 2
2 2
1 nV x
n n
2
V xn
2
2~ ; ; xx x xx N N
n
41
ARİTMETİK ORTALAMA İÇİN ÖRNEKLEME
DAĞILIMI
x
Aritmetik Ortalamanın Standartlaştırılması
42
- x
x
xz
- x
x
xz
n
43
Normal populasyondan örnekleme
• Merkezi eğilim
• Yayılım
– yerine koyarak
örnekleme
Populasyon dağılımı
Örnekleme dağılımı
n =16 X = 2.5
n = 4 X = 5
= 10
X
nX
X
50X
50 X
X
Merkezi Limit Teoremi
xn
x
Örnek
hacmi
yeterince
büyükse
(n 30) ... Örnekleme
dağılışı
hemen hemen
normal olur.
44
45
Alıştırma
• Türk Telekom’da çalışan bir operatörsünüz. Uzun
mesafeli telefon görüşmeleri = 8 dk. & = 2 dk. ile
normal dağılmaktadır. Eğer 25’lik örnekler seçerseniz
örnek ortalamalarının % kaçı 7.8 & 8.2 dk. arasında
olacaktır?
46
Çözüm
Örnekleme
dağılımı
.3830
.1915 .1915
Standart normal
dağılım
Z X
n
Z X
n
7 8 8
2 25 50
8 2 8
2 25 50
. .
. .
8
X
= .4
7.8 8.2 0
Z = 1
-.50 Z .50 X
47
ÖRNEK ORANI: p
• Anakütle başarı olasılığını “P” ’yi tahminlemek amacıyla
populasyondan alınan örnekten elde edilen bilgiler
doğrultusunda örnek oranı p hesaplanır.
• İlgilenilen başarı olasılığının P’nin bilinmediği durumlarda n
hacimlik örnek alındığında ve x örnekteki başarı sayısı olarak
ele alındığında, örnekten elde edilen başarı olasılığı (örnek
oranı); x
pn
48
ÖRNEK ORANI p İÇİN ÖRNEKLEME DAĞILIMI
xp
n
?p E p
2 ?p V p
Şans değişkeni x sabit n hacimli denemede ortaya çıkan
başarı sayısı olsun. x~B(n;P)
Örnek oranı:
Cevaplanması gereken sorular
• Dağılımın tipi?
• Parametreleri;
DAĞILIMIN TİPİ
• Merkezi limit teoremine göre örnek oranının
dağılımı eğer n örnek hacmi yeterince büyük ise
yaklaşık olarak normal dağılıma sahiptir.
• Bunun temel sebebi örnek oranının, n adet
denemede ortaya çıkan ortalama başarı sayısını
temsil etmesidir.
• Normal dağılımın parametreleri:
– Anakütle ortalaması
– Anakütle varyansı
49
Dağılımın Parametreleri: Örnek Oranı için
Anakütle Ortalaması
50
1x
E p E E xn n
Not: x şans değişkeni binom dağılımına sahip olduğundan:
E(x)=nP
E(x)=nP
n
nPpE
PpE
Dağılımın Parametreleri: Örnek Oranı için
Anakütle Varyansı
51
2
1xV p V V x
n n
Not: x şans değişkeni binom dağılımına sahip olduğundan:
V(x)=nP(1-P)
V(x)=nP(1-P)
2
1
n
PnPpV
n
PPpV
1
52
ÖRNEK ORANI p İÇİN ÖRNEKLEME
DAĞILIMI
n
PPPNN pp
1;; 2p ~
Örnek Oranının Standartlaştırılması
53
- p
p
pz
nPP
Ppz
1
Örnek Hacminin Örnek Oranı
Üzerindeki Etkisi
54
Anakütle oranı P sabitken örnek hacmi arttığında örnek
oranının standart hatası küçülür.
Aşağıdaki şekilde görüldüğü gibi örnek hacmi arttığında p’in
kendi ortalaması etrafında yoğunlaştığı görülmektedir.
( )f p
.72 .88 .92.84.80.76.68
n=400
n=100
p
55
Örnek 4
pi 0/3 1/3 2/3 3/3
0/9 1/9 4/9 9/9
P(pi) 8/27 12/27 6/27 1/27
2
ip
( ) i i
i
E p p P p
( ) pE p
8 0 12 1 6 2 1 3( ) 0.33
27 3 27 3 27 3 27 3E p
Büyük bir populasyondan alınan 3 ölçüm ile ilgili örneğe
dönersek x başarı sayısının örnekte tek sayı gelme olayını
göstermek üzere örnek oranının beklenen değerini ve
varyansını bularak dağılımını elde ediniz.
Örnek 4
56
22 2( ) ( )p E p E p
2 2( ) i i
i
E p p P p
2 8 0 12 1 6 4 1 9( ) 0.185
27 9 27 9 27 9 27 9E p
22 2 2( ) ( ) 0.185 (0.33) 0.074p E p E p
I. YÖNTEM
II. YÖNTEM
n
PPpVp
12
074.0
3
33.0133.012
n
PPp
Örnek 5
57
• Gelirler Genel Müdürlüğü’ne göre, bütün vergi
beyannamelerinin % 75’i vergi iadesine yol açmaktadır.
100 beyannamelik bir rassal örneklem alınmıştır.
a) Vergi iadesine yol açan beyannamelerin örneklem
oranının ortalaması kaçtır?
b) Örneklem oranının varyansı kaçtır?
c) Örneklem oranının standart hatası kaçtır?
d) Örneklem oranının 0,8’den büyük olma olasılığı kaçtır?
Örnek 5
58
2 0,75(1 0,75)0,001875
100p
2 0,001875 0,0433p p
Çözüm:
a)
b)
c) Standart Sapma (ya da Standart Hata)
75.0 PpE
n
PPp
12
Örnek 5
59
( 0,8) ?P p d)
pp
PPpPpP
8.08.0
0433.0
75.08.0zP
1251.03749.05.015.1 zP
n = örnek miktarı
s 2 = örnek varyansı
2 = anakütle varyansı
df = serbestlik derecesi = n – 1=v
Ki-Kare Dağılışı
= 2
(n - 1) s 2 2
v
60
Ki-Kare Dağılışı
61
• Ki-kare dağılımının tek bir parametresi vardır: v
• Bu parametre genel olarak serbestlik derecesi olarak
adlandırılır.
• şeklinde gösterilir.
• Ki-kare dağılımı normal (standart normal) dağılıma sahip
şans değişkenlerinden elde edilir.
2
v
Ki-Kare Dağılışı
62
2
2
1
ix xs
n
221 in s x x
22
2
12 2
1 i
n
x xn s
Şans değişkenleri xi‘ler normal dağılıma sahip olmak üzere,
örnek varyansı:
Eşitliğin her iki tarafı anakütle varyansına bölünerek
Ki-Kare Dağılışı
63
2
vE v
2 2vV v
Ki-kare şans değişkeninin beklenen değeri:
Ki-kare şans değişkeninin varyansı:
Ki-kare istatistiğinin dağılışının
özellikleri
1. ki-kare dağılışı simetrik değildir
2. Serbestlik derecesi arttıkça, dağılış daha simetrik hale gelir (normale yaklaşır).
0 5 10 15 20 25 30 35 40 45
df = 10
df = 20
Tüm değerler sıfır veya pozitif
Simetrik değil
x2
0
64
ÖRNEK VARYANSININ ÖRNEKLEME
DAĞILIMI
65
Anakütle ortalaması μx ve anakütle varyansı olan
bilinmeyen bir populasyondan x1, x2,…, xn ile gösterilen n
adet rassal bir örnek alındığında populasyon varyansı
aşağıdaki gibi bir beklenen değer ifadesine eşittir:
2
x
2 2( )x i xE x
Populasyon ortalaması μx bilinmediğinde yerine
konularak örnek varyansı aşağıdaki gibi tanımlanır.
x
2 2
1
1( )
1
n
x i
i
s x xn
ÖRNEK VARYANSININ ÖRNEKLEME
DAĞILIMI
66
• Varyansı olan bir populasyondan alınan
n hacimlik bir örneğin örnek varyansı
olarak ifade edildiğinde;
2
x
2
xs
2
2
12
1 x
n
n s
2 22 1
1
x nxs
n
ÖRNEK VARYANSININ ÖRNEKLEME
DAĞILIMI
67
• ’nin örnekleme dağılımının ortalaması ’dir. 2
xs 2
x
2 2 212
1
1 1
x n x
x
E nE s
n n
2 2( )x xE s
ÖRNEK VARYANSININ ÖRNEKLEME
DAĞILIMI
68
• ’nin örnekleme dağılımının varyansı,
örnekleme dağılımın Ki-Kare dağılımına
uygun olduğunu sonucundan hareketle;
2
xs
4 22 212 1
21 1
x nx nx
VV s V
n n
4
2
2
2 1
1
x
x
nV s
n
42 2
1
xxV s
n
69
ORTALAMALAR ARASI FARKLARIN
ÖRNEKLEME DAĞILIMI
Ortalamalar arası farkın örnek dağılımının ortalaması μ1 – μ2
ve standart hatası da 1 - 2 ile gösterilir.
1 2
2 2
1 2
X X
1 2n n
1 2 1 2
2 2
1 2
1 2
X XZ
n n
70
ORTALAMALAR ARASI FARKLARIN
ÖRNEKLEME DAĞILIMI
Örnek: İki farklı un fabrikasında paketlenen standart 1 kg’lık
un paketleri test edilmiş ve birinci fabrikadan alınan 100
paketin ortalaması 1.03 kg, standart sapması 0.04 kg; ikinci
fabrikadan alınan 120 paketin ortalaması 0.99 kg, standart
sapması 0.05 kg bulunmuştur. Anakütle standart sapmaları
bilinmediği için örnek standart sapmalarından hareketle
ortalamalar arası farkın standart hatası;
1 2
2 2 2 2
1 2 1 2X X
1 2 1 2
2 2
s s
n n n n
(0.04) (0.05) =
100 120
= 0.006
71
ORANLAR ARASI FARKLARIN
ÖRNEKLEME DAĞILIMI
Oranlar arası farkın örnek dağılımının ortalaması P1 - P2 ve
standart hatası da 1 - 2 ile gösterilir.
1 2
1 1 2 2
P P
1 2
P 1 P P 1 P
n n
1 2 1 2
1 1 2 2
1 2
p p P PZ
P 1 P P 1 P
n n
72
ORANLAR ARASI FARKLARIN
ÖRNEKLEME DAĞILIMI
Örnek: Birinci fabrikadaki kusurlu mamul oranının 0.08 ve ikinci
fabrikadaki kusurlu mamul oranının 0.05 olduğu bilinmektedir.
Tesadüfi olarak birinci fabrikadan 100, ikinci fabrikadan 150
mamul seçilmiş ve birinci örnekteki kusurlu mamul oranı 0.09,
ikinci örnekteki kusurlu mamul oranı 0.06 olarak gözlenmiştir.
Buna göre kusur oranları arasındaki farkın standart hatası:
1 2
1 2
1 2
1 1 2 2
P P
1 2
P P
P P
P 1 P P 1 P
n n
0.08 0.92 0.05 0.95
100 150
0.0324
73
İstatistiksel Tahminleme
Nokta Tahmini Aralık Tahmini
Pp
σs
μ
X
.035P0.25
3.4σ2.5
60μ20
2
Populasyon parametresinin
tek bir tahmin değerini verir.
Populasyon parametresinin tahmin
aralığını verir. Nokta tahmini
kullanılarak hesaplanır.
74
• Örneğin yeterince büyük olmaması veya bir örnekten elde
edilen istatistiğin bir başka örnekten sağlanan istatistikle
aynı olmayışı yüzünden anakütle parametresini bir noktada
tahmin etmek yanlış sonuçlar doğurabilir.
• Bu yüzden anakütle parametresi belirli bir hata seviyesi
göz önüne alınarak belirli bir aralıkta aranır. Hata terimini a
ile gösterirsek, 1- a güven seviyesinde aralık tahmini
yapabiliriz.
• Hata terimi normal eğrinin her iki ucunda eşit olarak yer
alır.
75
Bu a/2 lik hata terimine karşılık gelen ± Z değerleri
belirlenerek örnek dağılımının standart hatası ile
çarpıldığında hata payı elde edilir.
Hata payının örnek istatistiğine eklenip çıkarılması ile aralık
tahmini yapılır. Bu şekilde, anakütle parametresinin belirli
aralıkta yer aldığını, 1-a güven seviyesinde söyleyebiliriz.
Güven sınırlarından küçük olanına alt güven sınırı, büyüğüne
ise üst güven sınırı denir.
Hata terimi küçüldükçe güven aralığı genişler. Güven
sınırlarının belirleneceği olasılık seviyesine göre Z değeri
değişir.
76
Güven Aralığı Tahmininin Elemanları
Güven aralığı
Örnek istatistiği
Alt güven sınırı Üst güven sınırı
Populasyon parametresinin aralık içinde bir yere düşmesinin
olasılığı
Güven Aralığı Tahmini
Bir değer aralığı verir.
Populasyon parametresine yakınlık hakkında bilgi verir.
Olasılık terimleriyle ifade edilir.
77
Güven Aralığı Tahminleri
Ortalama
Güven Aralıkları
Oran
bilinmiyor biliniyor
Varyans
n<30 n30
t dağılımı Z dağılımı
78
ORTALAMALAR İÇİN GÜVEN ARALIĞI
Bir örnekten elde edilen istatistiği anakütle ortalaması x‘in
nokta tahminidir.
Gerçek anakütle ortalaması, 1-a güven seviyesinde
X
X X2 X 2P X z X z 1
n na a
a
aralığında yer alır.
79
Güven aralığı
Örneklerin 90%
Örneklerin 95%
Örneklerin 99%
x _
X Z X ZnX
X2.58 1.645 1.645 2.58X X X X
X X X X
1.96 1.96X XX X
80
Aralıklar ve güven seviyesi
Ortalamanın
örnekleme
dağılımı
Çok sayıda aralık
Aralık,
Aralıkların
%(1 - a)‘ı
’yü kapsar.
%a‘sı
kapsamaz.
x
=
1 - a a /2 a /2
X
_
x _
.'
'
uzanirkadaraX
ZX
danX
ZX
81
• Bilinmeyen populasyon parametresinin aralık içine
düşme olasılığıdır.
• %(1 - a güven seviyesi
• a : Parametrenin aralık içinde olmaması olasılığıdır.
• Tipik değerler %99, %95, %90
Güven Seviyesi
82
%95 güven sınırları belirlenirken a hatası 1-0.95=0.05 dir. Bu
hata normal eğrinin sağ ve sol ucuna eşit olarak dağıtıldığında
a /2 =0.05/2=0.025 dur.
Bu alanları belirleyen biri negatif, diğeri pozitif iki Z değeri
vardır.
Normal eğri alanları tablosunda
0.50-0.025=0.4750 değerini gösteren Z= ±1.96 değerleri
aradığımız Z değerleridir.
83
%99 güven sınırları belirlenirken
a hatası 1-0.99=0.01’dir.
Bu hata normal eğrinin sağ ve sol ucuna eşit olarak dağıtıldığında
a/2=0.01/2=0.005 bulunur.
Normal eğri alanları tablosunda
0.5-0.005=0.4950 değerini gösteren Z= ±2.58 değerleri aradığımız
Z değerleridir.
84
Aralık genişliğini etkileyen faktörler
• Verilerin yayılımı (
• Örnek hacmi
• Güven seviyesi (1 - a)
x
xn
Aralık
uzanır.
ya'dan'X
ZXX
ZX
85
Örnek: Bir fabrikada üretilen 100 mamulün ortalama ağırlığı
1040 gr standart sapması 25 gr bulunmuştur. Bu imalat
prosesinde üretilen mamullerin ortalama ağırlığı %95 güvenle
hangi aralıktadır?
Z =0 z=1.96
a/2=0.05/2=0.025
%95 için z değeri ± 1.96
0.475
z=-1.96
86
X X2 X 2P X z X z 1
n na a
a
X
25 25P 1040 1.96 1040 1.96 0.95
100 100
XP 1035.1 1044.9 0.95
87
Örnek
• n = 25 hacimli bir şans örneğinin ortalamasıX = 50’dir.
Populasyonun standart sapmasının X=10 olduğu
bilindiğine göre X için %95‘lik güven aralığını
oluşturunuz.
92 . 53 08 . 46
25 10 96 . 1 50
25 10 96 . 1 50
x x
α/2 α/2P(X Z μ X Z ) 1 αn n
P( )=0.95
P( )=0.95
88
Populasyonun standart sapması X bilinmediğinde
ve n 30 olduğunda ortalama için güven aralığı
1. Varsayımlar:
Popülasyonun standart sapması bilinmiyor,
Populasyon normal dağılımlı.
2. Merkezi limit teoremi kullanılarak Z Dağılımı
kullanılır.
3. Güven aralığı tahmini:
Örneğin standart sapması
α1)n
SZXμ
n
SZXP( x
α/2x
α/2
89
Örnek
• Bir ampul şirketi yeni bir ampul geliştirerek piyasaya
sürüyor. Üretim bandından 100 tanesi rassal olarak seçiliyor
ve bunların standart sapması 140 saat, kulanım süreleri de
ortalama olarak 1280 saat bulunuyor. a=0.05 için
populasyon ortalamasının güven aralığını bulunuz.
100
14096.11280
100
14096.11280
95.0)44.130756.1252(P
α1)n
SZXμ
n
SZXP( x
α/2x
α/2
Yorum: Şirketin ürettiği ampullerin ortalama ömrü, 0.95
olasılıkla 1252.56 ile 1307.44 saat arasındadır.
P( )=0.95
90
Student t Dağılımı
• Küçük örneklerden (n<30) elde edilen
istatistiklerin dağılımı Student t dağılımına uyar.
• Küçük örnek istatistiklerinin gösterdiği dağılım
normal eğri gibi simetriktir. Normal eğriye göre
daha basık ve yaygın bir şekil alır. Böylece eğrinin
kuyruklarında daha büyük bir alan oluşur.
• Küçük örnekler için z cetveli yerine, çeşitli örnek
büyüklükleri ve olasılık seviyeleri için ayrı ayrı
hesaplanmış t cetvelleri kullanılır.
91
z
t
0
t (sd = 5)
Standart
Normal
t (sd = 13)
Çan şekilli
simetrik,
‘Tombul’
kuyruklar
92
Üst kuyruk alanı
sd .25 .10 .05
1 1.000 3.078 6.314
2 0.817 1.886 2.920
3 0.765 1.638 2.353
t 0
Student t Tablosu
n = 3
sd = n - 1 = 2
a = .10
a/2 =.05
olsun:
2.920 t değerleri
.05
93
Populasyonun standart sapması X bilinmediğinde
ve n< 30 olduğunda ortalama için güven aralığı
1. Varsayımlar:
Popülasyonun standart sapması bilinmiyor
Populasyon normal dağılımlıdır.
2. Student’ın t Dağılımı kullanılır.
3. Güven aralığı tahmini:
Örneğin standart sapması
x x
v;α/2 v;α/2
s sX t X t
n-1 n-1
94
ORTALAMA İÇİN GÜVEN ARALIĞI
Populasyonun standart sapması X bilinmediğinde ve
populasyonun normal dağıldığı varsayımı altında güven aralığı
tahmini:
/2 a /2 a a 1 -
11,2
n
stX na 1
1,2
n
stX na
2at 2at
s
x x
v;α/2 v;α/2
s sX t X t
n-1 n-1
95
ÖRNEK
• Bir fabrikada rasgele üretilen 25 ürünün ortalama ağırlığı
1040 gr standart sapması 25 gr bulunmuştur. %95 güvenle
bu imalat prosesinde üretilen ürünlerin ortalama ağırlığı hangi
aralıkta yer alır?
125
25064.21040
125
25064.21040
53.105047.1029
x x
v;α/2 v;α/2
s sX t X t
n-1 n-1
96
Bir Oranın Güven Aralığı
1. Varsayımları
– İki kategorik çıktı vardır.
– Populasyon binom dağılımı gösterir.
2. Güven aralığı tahmini:
α/2 p α/2 pP(p Z .S P p Z .S ) 1 α
.p
p qS
n
xp
n
Örnek
hacmi
Özellikli
birim sayısı
Örnek oranı p anakütle oranı P’nin nokta tahminidir.
97
• 400 lise öğrencisinden oluşan bir örnekte 32 öğrenci üniversite
sınavını kazanmıştır. Üniversite öğrencilerinin sınavı kazanma
oranı için %95’lik güven aralığını bulunuz.
α/2 p α/2 pP(p Z .S P p Z .S ) 1 α
320.08
400p
ÖRNEK
0.08 1 0.08 0.08 1 0.08P 0.08 1.96 P 0.08 1.96 0.95
400 400
P 0.053 P 0.107 0.95
98
İki Ortalamanın Farkı için Güven Aralığı
Örnek ortalamalarından büyük olan ile gösterilirse örnek
ortalamaları arasındaki farktan hareketle anakütle ortalamaları
arasındaki farkın güven sınırları aşağıdaki gibi olur.
1X
Populasyon Varyansları Biliniyorsa:
a
aa
1
nnZXX
nnZXXP
2
22
1
21
2/2121
2
22
1
21
2/21
α1n
S
n
SZXXμμ
n
S
n
SZXXP
2
22
1
21
α/2,2121
2
22
1
21
α/2,21
Populasyon Varyansları Bilinmiyor fakat n > 30 olduğunda:
99
Örnek
Bir yabancı dil kursunun A sınıfında bilgisayar destekli ve B
sınıfında klasik yöntemlerle eğitim verilmektedir. Kursun
başlangıcından 6 hafta sonra her iki sınıfa da aynı test
uygulanarak sonuçlar karşılaştırılmıştır. A sınıfından rassal
olarak seçilen 40 öğrencinin test sonucunda elde ettiği ortalama
başarı notu 86 ve standart sapması 12, B sınıfından rassal
olarak seçilen 35 öğrencinin ortalama başarı notu 72 ve
standart sapması 14’tür. Her iki sınıftaki öğrencilerin ortalama
başarı notları arasındaki farkın güven aralığını %99 olasılıkla
belirleyiniz.
100
1 1 1
2 2 2
X 86 S 12 n 40
X 72 S 14 n 35
2 2 2 2
1 2 1 21 2 α/2 1 2 1 2 α/2
1 2 1 2
S S S SP X X μ μ X X 1 α
n n n nZ Z
99.035
14
40
1258.22768μμ
35
14
40
1258.27268P
22
21
22
99.082.21μμ18.6P 21
Örnek
101
Örnek
İki anakütleden tesadüfi olarak seçilen ve hacimlerindeki
iki küçük örnekten hareketle anakütle ortalamaları arasındaki
farkın güven sınırları belirlenebilir.
Birinci örneğin serbestlik derecesi n1 -1 ve ikinci örneğin
serbestlik derecesi n2 – 1 dir ve toplam serbestli derecesi
Anakütle ortalamaları arasındaki farkın güven aralığı
belirlenirken serbestlik derecesine
ve hata payına göre t tablo değerleri bulunur.
1n 2n
221 nnv
2a
221 nnv olur.
1 2 1 2
2 2 2 2
1 2 1 21 2 α/2,n n 2 1 2 1 2 α/2,n n 2
1 2 1 2
s s s sPr X X t μ μ X X t 1 α
n 1 n 1 n 1 n 1
102
ÖRNEK 13 deneme sonrasında bir benzin pompası ortalama 125 ml
fazla benzin ölçümü yaparken standart sapma 17 ml
olmuştur. Bir başka benzin pompası ise 10 deneme
sonrasında deneme başına ortalama 110 ml fazla benzin
ölçümü yapılmış ve standart sapması 19 ml bulunmuştur.
Anakütle ortalamaları arasındaki farkın %99 güven sınırlarını
bulunuz.
2121013 v 831.2tabt
110
19
113
17831.2)110125(
22
1 27.68 37.68
Pompaların fazla ölçümleri arasındaki fark %99 güvenle -7.68 ml
ile 37.68 ml arasındadır.
α11n
s
1n
stXXμμ
1n
s
1n
stXXPr
2
2
2
1
2
12nnα/2,2121
2
2
2
1
2
12nnα/2,21 2121
103
İki Oran Farkının Güven Aralığı
1. Varsayımları
İki kategorik çıktı vardır.
Populasyonlar binom dağılımı gösterir.
2. Güven aralığı tahmini:
1 2 1 21 2 α/2 p p 1 2 1 2 α/2 p pPr p p Z S P P p p Z S 1 a
İki oran farkının
standart sapması 1 2
1 1 2 2
1 2
. .p p
p q p qS
n n
Örnek oranlarından büyük olan p1 ile gösterilirse örnek oranları
arasındaki farktan hareketle anakütle oranları arasındaki farkın
güven sınırları aşağıdaki gibi olur.
104
İki Oran Farkının Güven Aralığına Örnek
İki farklı ilacın bir hastalığı tedavi etme oranlarının farklı olup
olmadığı kontrol edilmek istenmektedir. Bu amaçla 1000’er adet
hasta üzerinde A ve B ilaçları denensin. Tedavi sonunda A ve B
ilaçlarının uygulandığı hastaların sırasıyla 825 ve 760’ının iyileştiği
gözlendiğine göre ilaçların hastalığı tedavi etme oranlarının
farkının %95’lik güven aralığını bulunuz.
n1 = 1000, n2 = 1000 1 2
825 7600.825 0.760
1000 1000p p
1 2
1 1 2 2
1 2
. . 0.825.(1 0.825) 0.760.(1 0.760)
1000 1000
0.018
p p
p q p qS
n n
105
95.0018.096.1760.082.0PP018.096.1760.082.0Pr 21
a 1SZPPSZPr2121 α/22121α/221 pppp pppp
95.010.0PP029.0Pr 21
106
Eşleştirilmiş Örnek t Testi
1. İki ilişkili populasyonun ortalamasını test eder.
– Çift ya da eşleştirilmiş
– Tekrarlı gözlemler (önce/sonra)
2. Nesneler arasındaki varyasyonu ortadan kaldırır.
Varsayımları
– İki populasyon da normal dağılımlıdır.
– Eğer normal değilse normale yaklaşmaktadır.
(n1 30 & n2 30 )
Aynı veya benzer denekler üzerinde birbirinden farklı iki işlemin
uygulanması sonucu elde edilen verilere eşleştirilmiş örnekler
denir.
107
İki komisyoncunun aynı evlere farklı fiyatlar verdiği iddia edilmektedir. İddiayı test
etmek için 12 ev seçiliyor ve komisyonculardan bu evlere 1000$ bazında fiyat
vermeleri isteniyor. Elde edilen sonuçlar aşağıdaki gibidir. İki komisyoncunun fiyat
ortalamaları arasındaki farka ilişkin güven aralığını hesaplayınız.
Eşleştirilmiş Örnek t Testi
Komisyoncular
Evler A B D D2
1 181.0 182.0 -1.0 1.00
2 179.9 180.0 -0.1 0.01
3 163.0 161.5 1.5 2.25
4 218.0 215.0 3.0 9.00
5 213.0 216.5 -3.5 12.25
6 175.0 175.0 0.0 0.00
7 217.9 219.5 -1.6 2.56
8 151.0 150.0 1.0 1.00
9 164.9 165.5 -0.6 0.36
10 192.5 195.0 -2.5 6.25
11 225.0 222.7 2.3 5.29
12 177.5 178.0 -0.5 0.25
Toplam -2.0 40.22
108
D 2D 0.167
n 12
2 2
2
D
D 2D 40.22
n 12s 1.904n 1 12 1
ttab : t11,0.05 = ± 2.201 1 12 1 11 . .v n s d
, 1 , 12 2
D D Dn nD t s D t sa a
)904.1(201.2167.0)904.1(201.2167.0 D
023.4357.4 D
BİR POPULASYON VARYANSI İÇİN GÜVEN
ARALIKLARI
Bir anakütle varyansı için de güven aralığı bulmak gerekir.
Bu tahminler örneklem varyansına dayanır.
Varyansı olan bir normal anakütleden n gözlemli rassal
bir örneklem seçilsin. Örneklem varyansı da s2 ile gösterilsin.
2
22
1 2
( 1) xn
n S
Rassal değişkeni, (n-1) serbestlik dereceli ki-kare dağılımına
uymaktadır. Bu bulgu, normal bir dağılımdan örneklem
alındığında anakütle varyansı için güven aralıklarının
türetilmesinin temelini oluşturur.
Örneklem varyansının gözlenen belli değeri ise, anakütle
varyansının güven aralığı aşağıdaki gibidir:
2xs
2 2
2
2 2
, 1 1 , 12 2
1 11
n n
n S n SP
a a
a
an
an
Red BölgesiRed
Bölgesi1-a
Örneğin a=0.05 n=10 olsun
2
0.975;9 2
0.025;9
111
Örnek
Bir çimento fabrikasında üretilen çimentodan yapılan betonların
sağlamlığının incelenmesi amacıyla 10 beton örneği alınmış ve
bu örneklerin sağlamlılıkları saptanmıştır. Bu örneklerin
ortalama ve varyansı olarak bulunmuştur. Fabrikanın ürettiği tüm betonların varyansına ilişkin güven
aralığını hesaplayınız.
2312 195x s
1 0.90a
a n
a n
Red BölgesiRed
Bölgesi
2
0.95;9 3.33 2
0.05;9 16.92
a=0.10
112
1 0.90a
2 2
2
2 2
, 1 1 , 12 2
1 11
n n
n s n sP
a a
a
2
2 2
0.05;9 0.95;9
9 195 9 1950.90P
29 195 9 1950.90
16.92 3.33P
2103.72 527.02 0.90P
3.33 16.92
103.72 527.02S
2
an
1-a
2312 195x s 0.10a
Örnek
Denenen bir motorun 16 deneme sürüşündeki yakıt
tüketimlerinin standart sapması 2.2 golondur. Motorun yakıt
tüketiminin gerçek değişkenliğini ölçen anakütle varyansının
% 99 güven aralığını hesaplayınız. n=16 s=2.2
an
an
Red BölgesiRed
Bölgesi
a
aa
1)1()1(
2
1,2
1
22
2
1,2
2
nn
snsnP
01.0a
2 20.005,15
, 12
32.80n
a
2 20.995,15
1 , 12
4.60n
a
2 22
2 2
, 1 1 , 12 2
( 1) ( 1)1
n n
n s n sP
a a
a
99.060.4
)2.2(15
80.32
)2.2(15 22
2
P
99.078.1521.2 2 P
n=16 s=2.2
115
İKİ POPULASYON VARYANSININ KARŞILAŞTIRILMASI Normal dağılımlı iki populasyonun varyanslarının oranı F
dağılımına uymaktadır. F dağılışı simetrik olmayan bir
dağılıştır. Bu nedenle güven aralığının hesaplanmasında her
iki F değeri için F tablosuna bakmak gerekmektedir.
1 2
2
1
2
1n 1,n 1 2
2
2
2
s
Fs
a
a
aa
aa
1
1/
/
1,1;2
2
2
2
1
2
2
2
1
1,1;2
12
2
2
1
1,1;2
2
2
2
2
2
1
2
1
1,1;2
1
2121
2121
nnnn
nnnn
Fs
sF
s
sP
Fs
sFP
116
1 2
2 1
1 ; 1, 12
; 1, 12
1
n n
n n
FF
a
a
a
a
a
a
aa
11
1
1,1;2
2
2
2
1
2
2
2
1
1,1;2
2
2
2
1
1,1;2
2
2
2
1
2
2
2
1
1,1;2
12
2
2
1
21
12
2121
nn
nn
nnnn
Fs
s
Fs
sP
Fs
sF
s
sP
117
İKİ POPULASYON VARYANSININ KARŞILAŞTIRILMASI
Normal dağılımlı iki populasyonun varyanslarının oranına
ilişkin güven aralığı :
F 0
1 2α/ 2;n 1,n 1,F 1 21-α/2;n 1,n 1,F
a
a
a
11
1,1;2
2
2
2
1
2
2
2
1
1,1;2
2
2
2
1
21
12
nn
nn
Fs
s
Fs
sP
118
İKİ POPULASYON VARYANSININ KARŞILAŞTIRILMASI Aşağıda verilen bilgiler yardımıyla pazara sunulan iki ayrı
bağımsız hisse senedinin değişkenliklerinin oranına ilişkin
çift yönlü güven aralığını bulunuz.
2
1 123.38s 2
2 8.02s 02.0a
0.99;16,10
0.01;10,16
1 10.271
3.69F
F
1 2
2 1
1 ; 1, 12
; 1, 12
1
n n
n n
FF
a
a
2 11n1 17n
a
a
a
11
1,1;2
2
2
2
1
2
2
2
1
1,1;2
2
2
2
1
21
12
nn
nn
Fs
s
Fs
sP
56.410.16,01.01,1;
221
FFnn
a
119
2
1 123.38S 2
2 8.02S 2 11n 1 17n
a
156.4
02.8
38.123
69.3
1
02.8
38.1232
2
2
1P
a
1
110,16;01.02
2
2
1
2
2
2
1
16,10;01.0
2
2
2
1 Fs
s
Fs
sP
98.067.69168.4
98.0)56.4(38.15)271.0(38.15
2
2
2
1
2
2
2
1
P
P
85.2
49.2
10,16,05.0
16,10,05.0
F
F
ÖRNEK Pazara yeni sürülmüş on yedi AAA dereceli sınai tahvilden oluşan rassal
bir örneklemde vadelerin varyansı 123.35’tir. On bir yeni CCC dereceli
sınai tahvilden oluşan bağımsız bir rassal örneklemde vadelerin varyansı
8.02’dir. Bu iki tahvilin değişkenliklerinin %90 güven aralığını bulunuz.
n1=17 s12=123.35 s2
2=8.02 n1-1=16 n2-1=10 sd.
n2=11
a
a
a
11
1,1;2
2
2
2
1
2
2
2
1
1,1;2
2
2
2
1
21
12
nn
nn
Fs
s
Fs
sP
38.1502.8
35.1232
2
2
1 s
s
121
90.0)85.2(38.15)49.2
1(38.15
2
2
2
1
P
90.083.4318.62
2
2
1
P
90.0)85.2(38.15)402.0(38.152
2
2
1
P
a
a
a
11
1,1;2
2
2
2
1
2
2
2
1
1,1;2
2
2
2
1
21
12
nn
nn
Fs
s
Fs
sP
85.2
49.2
10,16,05.0
16,10,05.0
F
F