Prof.Dr.Levent ŞENYAY V- 1 ÖrneklemeYöntemleri
5 BASİT ŞANS ÖRNEKLEMESİ
5.1 Aritmetik ortalamanın tahmini
5.1.1. Aritmetik ortalamanın varyansı
5.1.2. Aritmetik ortalama için güven aralığı
5.1.3. Aritmetik ortalamanın tahmininde örnek hacmi ve duyarlılık arasındaki ilişki
5.2 Toplamın tahmini
5.2.1. Toplamın varyansı
5.2.2. Toplam için güven aralığı
5.2.3. Toplamın tahmininde örnek hacmi ve duyarlılık arasındaki ilişki
5.3. Oranın tahmini
5.3.1. Oranın varyansını
5.3.2. Oran için güven aralığı
5.3.3. Oranın tahmininde örnek hacmi ve duyarlılık arasındaki ilişki
Prof.Dr.Levent ŞENYAY V- 2 ÖrneklemeYöntemleri
Bu ve bundan sonraki örnekleme yöntemleri incelenirken üzerinde durulacak noktalar sırasıyla;
1. hangi örnekleme yönteminin Niçin? Seçileceği,
2. ilgilenilen parametreler sırasıyla, populasyon ortalaması, populasyon toplamı ve populasyon oranı
tahmin edicilerinin bulmak,
3. tahmin edicilerin duyarlılığını değerlendirebilmek amacı ile bu tahmin edicilerin standart hatalarını
bulmak,
4. populasyon parametre tahminleri için güven aralıkları oluşturmak.
5. Duyarlılık ve gerekli örneğin hacmini bulmak. Uygulamada bu ikinci adımda yer alır.
Örnekleme kuramı sonlu N sayıda populasyon birimi içeren populasyondan n hacimli örnekler seçme
ve seçilen örneklerden tahminler yapma yöntemlerini inceler. Her bir örneğin eşit seçilme şansına sahip
olduğu seçme işlemine Basit Şans Örneklemesi denir.
Örnek Seçimi
Basit Şans Sayıları Tablosu
En çok kullanılan basit şans sayıları tablosu Kendall ve Smith’in Basit Şans Sayıları Tablosudur.
Örneğin; 300 öğrenci olduğunu ve bu öğrencilerin ortalama ağırlığını tahmin etmek için 8 kişilik bir
şans örneği seçilmek istendiğini varsayılsın. Öğrencilerin bir listesi yapılmış ve her bir öğrenciye
001’den 300’e kadar seri numarası verilmiş olsun. 300 rakamı üç basamaklı sayı olduğundan önce üç
kolon kullanılır. Tesadüfi sayılar tablosundan aşağıdaki sayılar bulunur
231 117 070 092 978
055 433 433 979 891
148 938 615 937 259
389 495 313 726 814
973 367 570 610 113
örnek için aşağıdaki 8 sayı seçilir:
231, 55, 148, 117, 70, 92, 259, 113
ancak yukarıda 25 sayıdan sadece 8 sayı seçilmiş, şans sayılarının yaklaşık 2/3’lük bir kısmı
kaybolmuştur. Bunu önlemenin bir yolu seçilen numaralardan sabit bir sayı çıkarmaktır.
Prof.Dr.Levent ŞENYAY V- 3 ÖrneklemeYöntemleri
Örnekte 300 sabit sayısı belirlenir.
Şans Sayıları Sabiti Çıkarma alınan örnek örnek no
231 231 1
055 055 2
148 148 3
389 -300 89 4
973 Atla
117 117 5
433 -300 133 6
983 Atla
495 -300 195 7
367 -300 67 8
Burada sadece 10 sayı seçilerek şans sayıları belirlenmiştir.
5.1. Aritmetik Ortalamanın Tahmini
5.1.1. X ’nın tahminleyicisi
Örnek ortalaması, populasyon ortalamasının sapmasız, tutarlı ve minimum varyanslı tahmin edicisidir.
X1, X2, .....,XN N hacimli populasyon ve x1, x2,......,xn n hacimli örnek olsun;
Popülasyon ortalaması : X = NXXXN
......1
21
Örnek ortalaması : nxxxn
x .......1
21
x ’nın populasyon ortalaması X ’nın sapmasız bir tahminleyicisi olduğunu göstermek için şu şekilde
ifade edilebilir:
xX ˆ
E( x )= X x X ’nın sapmasız bir tahminleyicisidir.
Prof.Dr.Levent ŞENYAY V- 4 ÖrneklemeYöntemleri
5.1.1. Aritmetik ortalamanın Varyans
Xi’nin Varyansı
Örnekleme teorisinde Xi’nin varyansının iki alternatif tanımı vardır:
2
1
22 1)(
N
i
i XXN
XXE populasyon varyansıdır. İkincisi ise
S2=
N
i
i XXN 1
2)(1
1 şeklinde tanımlanır ve N yerine N-1 kullanılır.
x ’nın varyansı
Xi’nin varyansı tanımlandıktan sonra x ’nın varyansı aşağıdaki gibi tanımlanır.
222 )())(( XxExExEx
buradan aşağıdaki ifadelerin sağlandığı görülebilir:
Aşağıdaki popülasyona ait varyans tanımları esas olarak teorik sonuçları türetmek için kullanılır.
Özellikle varyans analizi ile ilgili tekniklerde S tanımı daha kullanıllıdır. Uygulamalarda ise populasyon
varyansı yerine daha çok bunların tahminleri olan örnek varyansları (s) kullaılır.
2
x2
*1 nN
nN
yerine koymaksızın (iadesiz) örnekleme
2
x2
*n
S
N
nN yerine koymaksızın (iadesiz) örnekleme
2
x2
n
yerine koyarak (iadeli) örnekleme
2
x2
*1
n
S
N
N yerine koyarak (iadeli) örnekleme
Yukarıdaki ifadelerde 1
N
nN ve
N
nN varyans için sonlu populasyon düzeltme katsayısı (fpc= finite
population correction) olarak adlandırılır. Burada
N
nN =1-(n/N)
Prof.Dr.Levent ŞENYAY V- 5 ÖrneklemeYöntemleri
f=n/N örnekleme oranı olarak adlandırılır. N, n’e oranla büyük olduğunda sonlu populasyon düzeltme
katsayısı 1’e yakınsar. f=n/N 0.05 ise fpc ihmal edilebilir. f=n/N, %5’ten daha küçük olacak şekilde
N belli bir büyüklüğü aştığında, populasyon hacminin standart hatası üzerine etkisi olmayacaktır.
Ayrıca iadeli örneklemede
n
2
2
*1
n
S
N
N idi. Uygulamalarda hemen hemen tüm durumlarda N yeterince büyüktür ve
dolayısıyla 11
N
N alınabilir ve iadesiz örneklemede
2
n
n
S 2
ifadesine ulaşılır.
Takip eden araştırmalarda bu yaklaşım kullanılacak ve esas olarak kullanılacak iki formül aşağıdaki gibi
kullanılacaktır.
2
x2
*n
S
N
nN Yerine koymaksızın (iadesiz) örnekleme
2
x2
n
S Yerine koyarak (iadeli)
Alıştırma:
X1=1, X2=2, X3=3 populasyonuna sahip olunduğunu ve n=2 hacimli örnekler seçildiği varsayılsın.
Hesaplamalar şu sonucu verecektir.
2
1
22 1)(
N
i
i XXN
XXE =2/3
S2=
N
i
i XXN 1
2)(1
1=1
2
x ’yı hesaplamak için
2
x 2
1 M
i XxM
orijinal formülü kullanalım. Burada M, tüm mümkün örnek ortalamalarının
sayısıdır. Önce yerine koymaksızın (iadesiz) örnekleme durumu incelenmektedir. Örnekler Tablo 5.1 de
verimeltedir.
Tablo 5.1
Prof.Dr.Levent ŞENYAY V- 6 ÖrneklemeYöntemleri
M Örnekler x x - X ( x - X )2
1 1,2 1.5 -0.5 0.25
2 1,3 2.0 0 0
3 2,3 2.5 0.5 0.25
0.50
dolayısıyla 2
x 5.03
1=
6
1 olur. Teorik formülümüzden
2
x2
*n
S
N
nN =
2
1
3
23=
6
1 elde ederiz ve görüldüğü gibi 2
x6
1 olarak aynı
sonuç elde edilir.
İkinci olarak yerine koyarak (iadeli) örnekleme dikkate alınmaktadır. Örnekler Tablo 5.2 de
verilmektedir. M=9
Tablo 5.2
M Örnekler x x - X ( x - X )2
1 1,1 1.0 -1.0 1.00
2 1,2 1.5 -0.5 0.25
3 1,3 2.0 0 0
4 2,1 1.5 -0.5 0.25
5 2,2 2.0 0 0
6 2,3 2.5 0.5 0.25
7 3,1 2.0 0 0
8 3,2 2.5 0.5 0.25
9 3,3 3.0 1.0 1.00
3.00
NXxx /22
böylece 2
x 39
1=
3
1
2
x2
*1
n
S
N
N =
3
1
2
1*
3
13
elde ederiz ve görüldüğü gibi 2
x3
1 olarak aynı sonucu
buluruz.
Bununla birlikte uygulamada N genellikle büyük olduğundan 2
x S2/n varsayılacaktır.
Not1: Genellikle yerine koyarak örnekleme için elde edilen varyans yerine koymadan örnekleme için
elde edilen varyanstan daha büyük olur.
Not2: Genellikle gerçek yaşamda S2’nin örnekten elde edilen bir tahmin edicisine ihtiyaç duyulur.
Prof.Dr.Levent ŞENYAY V- 7 ÖrneklemeYöntemleri
2
x ’nın tahminleyicisi
Gerçek yaşamdaki uygulamalar için 2
x ’nın bir tahmin edicisinin bulunması gerekir. 2
x ,S2 ye (ya da
2 ye )bağımlı olduğu için, 2
x ’nın sapmasız bir tahmin edicisini bulma problemi, S2 (ya da 2 nin )
bir tahmin edicisini bulmayı gerektirecektir. S2 nin sapmasız tahmin edicisi daha sonra 2
x ’nın sapmasız
bir tahmin edicisini bulmak için kullanılacak örnek varyansını verecektir.
i) Örnek varyansı
Uygulamada daha çok örnek varyansı kullanılır
s2 =
2
1
1xx
ni n>1
= 0 n=1
biçimindedir.
ii) populasyon varyansının sapmasız tahmin edicisi
s2,S2(ve 2 )nin sapmasız bir tahmin edicisidir.
E(s2)= 2 yerine koyarak örnekleme yapıldığında
E(s2)=S2 yerine koymaksızın örnekleme yapıldığında
Örnekleme genellikle yerine koymaksızın yapıldığı için esas olarak ikinci durum dikkate alınmaktadır.
Bununla birlikte, N büyük olduğunda, N-1=N ve dolayısıyla S2=2 olacak, böylece S2 ve yaklaşık
olarak eşit olacaktır.
Alıştırma: Populasyonun N=3 öğrenciden oluştuğunu ve n=2 hacimli örnekler seçildiğini varsayalım.
Öğrencilerin 2$, 3$ ve 4$ paraları olsun. Populasyon varyansı
2
1
22 1)(
N
i
i XXN
XXE şeklinde iken örnek varyansı s2=
2
1
1xx
ni yerine
koyarak örnekleme yapıldığında 2 ’nin sapmasız bir tahminidir.
2
1
22 1)(
N
i
i XXN
XXE =2/3
Prof.Dr.Levent ŞENYAY V- 8 ÖrneklemeYöntemleri
M Örnekler x s2=
2
1
1xx
ni
1 2,2 2.0 0.0 = 0)12/()22()22( 22 ((2-2)
2 2,3 2.5 0.5
3 2,4 3.0 2.0
4 3,2 2.5 0.5
5 3,3 3.0 0.0
6 3,4 3.5 0.5
7 4,2 3.0 2.0
8 4,3 3.5 0.5
9 4,4 4.0 0.0
6.0
E(s2) = )(2 sps
E(s2) =3
2
9
0.05.0.....5.00.0
E(s2)=2 olur ve dolayısıyla s2 yerine koyarak örnekleme yapıldığında
2 nin sapmasız bir tahmin
edicisidir.
Alıştırma
Yerine koymaksızın örnekleme yapıldığı zaman , populasyon varyansı
S2=
N
i
i XXN 1
2)(1
1=1 olarak bulunur. Tüm mümkün örnekleri türetelim ve örnekler için s2 yi
hesaplayalım.
M=3
M Örnekler x s2=
2
1
1xx
ni
1 2,3 2.5 0.5= 5,0)12/()5,23()5,22( 22
2 2,4 3.0 2.0
3 3,4 3.5 0.5
Böylece E(s2)= 13
0.3
3
5.00.25.0
Prof.Dr.Levent ŞENYAY V- 9 ÖrneklemeYöntemleri
Örnekleme yerine konulmaksızın yapıldığı zaman E(s2)=S2=1 dir. s2, S2’nin sapmasız bir tahmin
edicisidir denir.
s2 nin karekökü
s=
2
1
1xx
ni örnek standart sapması olarak adlandırılır. s, S’nin sapmasız bir
tahmin edicisi değildir. Ancak n büyük olduğunda (n>30) sapma küçülecek ve s, S’nin tahmin edicisi
olarak kullanılabilecektir.
2
x ’nın tahmini
s2 kullanılarak kolaylıkla 2
x ’nin sapmasız bir tahmin edicisi bulunabilir. Formüllerde S2 yerine s2
koyularak aşağıdaki sonuçlara ulaşılır.
(a) n
s
N
nNx
22 *ˆ
yerine koymaksızın
n
s
N
Nx
22 *
1ˆ
yerine koyarak
n
sx
22ˆ yerine koyarak
(a) nolu eşitliğin sağ tarafının beklenen değeri alınırsa
)*(2
n
s
N
nNE
n
S
N
nN 2
*
olur ve böylece 2ˆx ,
2
x nin sapmasız tahmin edicisi olur. Aynı
zamanda aşağıdaki notasyon kullanılacaktır:
2
xs =n
s
N
nN 2
*
yerine koymaksızın
2
xs =n
s2
yerine koyarak
Prof.Dr.Levent ŞENYAY V- 10
ÖrneklemeYöntemleri
5.1.2. Aritmetik ortalama için güven aralığı
Populasyon ortalaması için güven aralığı
xx szxXszx 2/2/ şeklinde ifade edilir.
Güven aralığı
P( x -z x < X < x +z x )=1-
şeklinde ifade edilebilir.
Xx =z x duyarlılığı gösterir.
Güven aralığını elde etmek için x ’yı bulmak gereklidir. Temel istatistikte yerine koyarak örnekleme
için verilen x tanımı x =n
dir ve ’ya bağlıdır. x ’yı bulmak için önce 2 tanımlanmalıdır.
Alıştırma : Büyük bir öğrenci grubunun ortalama I.Q.’sunu tahmin etmek için n=100 hacimli bir
örnek seçilmiş olsun. Örnek ortalaması x =110 ve s=12 puandır. X için %99 güvenilirlik düzeyine
(z/2=3) göre güven aralığını elde ediniz.
N=100 , x = 110 , s = 12 , Z=3 xs =n
s=
100
12=1.2
P( xx szxXszx 2/2/ )=%99
P(106.4< X <113.6) = 0,99
Prof.Dr.Levent ŞENYAY V- 11
ÖrneklemeYöntemleri
5.1.3. Aritmetik ortalamanın tahmininde örnek hacmi ve duyarlılık
Duyarlılık, güvenilirlik ve standart hata arasındaki temel ilişki
x
XxZ
2/
xzdXx 2/
22
2/
2
xzd şeklindedir
2
xs , 2
x ’nın tahmin edicisidir.
Yerine koyarak örnekleme için bu ilişki
xZdXx 2/
n
SZSZd x
22
2/
222/
22
2
2
2/
d
SZn
Örnekleme yerine konulmaksızın yapıldığında sonlu populasyon düzeltmesi
N
nN gerekli olur
ve ilişki şu hale gelir:
nN
nSZ
nN
NSZ
N
nN
n
sZd
22
2/
22
2/
22
2/
2
N
SZd
n
sZ
22
2/22
2
2/
22
2/
22
2/
222
2/2
2
2/
2
/.
11
SZ
NSZd
N
SZd
ZSn
22/
2
2
2/ )(
SZNd
SZNn
elde edilir.
Açıklamalı [l1]:
Prof.Dr.Levent ŞENYAY V- 12
ÖrneklemeYöntemleri
Alıştırma: Çok sayıda büyükbaş hayvan bulunduğunu ve varyansın s2=600 olarak tahmin edilmiş
olduğunu varsayalım. Büyükbaş hayvanların ortalama ağırlığını 5br sınırları içinde %99 olasılıkla,
(Z=3) olarak tahmin etmek istiyoruz.
a) Hangi büyüklükte örnek seçilmelidir?
2
2
2/
d
szn = 216
25
600*9
böylece güven aralığı
xx szxXszx 2/2/
5216
60032/
n
sz olur
Büyükbaş hayvanların ortalama ağırlığı hemen %99 güvenilirlikle, populasyon ortalamasının 5br’lik
sınırları içinde olacaktır.
b) Toplam büyükbaş hayvan sayısı N=2000 ‘dir. Sonlu populasyon düzeltmesi kullanılarak örnek hacmi
f= 05.02000
216
Nn olduğu için,
22/
2
2
2/ )(
szNd
szNn
= 195
)600*9()25*2000(
600*9*2000
olarak elde edilir.
N=20000 ise bu durumda n=214 olur.
Hesaplamalar özetlenirse;
N = 2000 iken n=195
N = 20000iken n=214
N sonsuz iken n=216 dır.
Prof.Dr.Levent ŞENYAY V- 13
ÖrneklemeYöntemleri
Dolayısıyla populasyon hacminin örnek hacmi üzerine çok az etkisi bulunmaktadır. Belli bir duyarlılık
ve güvenilirlik için, N = 20000 nüfuslu bir şehirden seçilmesi gereken örnek hacmi, tüm A.B.D’den
seçilmesi gereken örnek hacmine yaklaşık olarak eşittir.
Bu sonuç populasyon hacmi ve duyarlılık bakımından ifade edilebilir. Örnekleme varyansı
n
S
N
nNx
22 *
şeklinde verilir. Bu, N çok büyük olduğunda
N
nN teriminin 1 e
yaklaşacağını ve 2
x üzerinde çok az etkiye sahip olduğunu gösterir. Buna göre 2
x ’yi en çok
etkileyebilecek olan örnek hacmi n’dir. Populasyon hacmi N büyük olduğunda çok az etkiye sahip iken,
tahmin edicinin duyarlılığı üzerinde örnek hacmi en büyük etkiye sahiptir.
c) Aynı örnekte büyük baş hayvan ağırlıklarının ortalaması 250 br ve C=0,097olduğuna göre,
ortalamanın %5 br sınırları içinde %99 olasılıkla, (z=3) olarak tahminlemek için ne büyüklükte
örnek seçilmelidir?
X
d
X
Xxd
'
X
nZ
XZ
X
dd xx /'
n
CZd '
097.0250
600
XC X
355,34
)05,0(
)097.0.3(2
2
2'
2
d
ZCn gerekli örnek hacmi elde edilir,
5.2. Toplam tahminleyicisi
Toplam=(birim sayısı)*(ortalama)
= N X veya ∑X=N X
Populasyon ortalaması( X )’nın tahmin edicisi olan örnek ortalaması ( x ) toplam değeri tahmin etmekte
kullanılmaktadır.
Prof.Dr.Levent ŞENYAY V- 14
ÖrneklemeYöntemleri
Toplam değerin tahmin edicisi
xNX ˆ
E( )X E( xN )=NE( x )=N X =X şeklindedir, yani toplamın tahminleyicisi toplamın
sapmasız bir tahminidir.. Çünkü, E( x )= X sapmasız old. için.
Alıştırma: N=1000 öğrenciden oluşan grubun sahip olduğu toplam kitap sayısı tahmin edilmek
istenmektedir ve bu amaçla n=50 öğrenciden oluşan bir şans örneği seçilmiştir. Öğrenci başına düşen
ortalama kitap sayısının 12 olarak bulunduğu varsayılırsa toplam kitap sayısını tahmin ediniz.
xNX ˆ =1000*12=12000 kitap olur.
5.2.1. Toplamın tahmininin varyansı
V( X )=22 )()ˆ( XNxNEXXE
=22 )( XxEN
=N
nN
n
SN
*
22
yerine koymaksızın
=n
SN
22
yerine koyarak, N-1/N 1
S2 genellikle bilinmediğinden, bunun tahmin edicisi(örnek varyansı s2) kullanılır. Bu da V X nin
sapmasız tahmin edicilerini verir.
V X =N
nN
n
sN
*
22
yerine koymaksızın
=n
sN
22
yerine koyarak, N-1/N 1
Prof.Dr.Levent ŞENYAY V- 15
ÖrneklemeYöntemleri
Alıştırma: Yukarıdaki örnekte n=50 öğrencinin kitaplarının dağılımının örnek varyansının s2=10
olduğunu varsayalım. Bu durumda, N=1000 olduğuna göre X ’nin varyansının tahmini
V X =N
nN
n
sN
*
22
= 1900001000
501000*
50
10)1000( 2
olur.
V X ’yı 2
Xs =V X =190000 olarak tanımlayalım.
Böylece X ’nin standart hatası X
s ˆ =436 kitap. Olur.
5.2.3. Toplam için güven aralığı
Xs ˆ ’yı tahmin ettikten sonra, 2/z güvenilirlik katsayısı olmak üzere toplam değer X için güven aralığı
XX
szXXszX ˆ2/ˆ2/ˆˆ
olur.
190000645.1000.12
Alıştırma: Belirli bir lisedeki öğrencilerin hergün tükettikleri toplam süt miktarı tahmin edilmek
istenmektedir. Okulda N=2000 öğrenci vardır. Şansa bağlı olarak n=100 öğrenci seçilmiş ve süt
tüketiminin örnek ortalaması x =0.8 litre ve standart sapması 0.3 olarak bulunmuştur.
a) Toplam tüketilen süt miktarını tahmin ediniz.
b) Tahmininin varyansını elde ediniz.
c) Toplam tüketilen süt miktarı için %95’lik güven aralığını oluşturunuz.
a) xNX ˆ =2000*0.8=1600 litre
b) V X =N
nN
n
sN
*
22
=
34202000
1002000*
100
3.02000
22
c) XX
szXXszX ˆ2/ˆ2/ˆˆ
X
s ˆ = 3420 =58.5 litre
P(1600-1.96*58.5<X<1600+1.96*58.5)=%95
P(1485,34<X<1714,66)=%95
Prof.Dr.Levent ŞENYAY V- 16
ÖrneklemeYöntemleri
5.2.4. Toplamın tahmininde örnek hacmi ve duyarlılık
(1) 2
ˆ
2
2/
2
Xszd şeklindedir.
Burada XX ˆ ’dir.
(2) 2
Xs =
N
nN
n
sN
*
22
yerine koymaksızın (iadesiz)
(3) 2
Xs =
n
sN
22
yerine koyarak, N-1/N 1 (iadeli)
şeklinde idi. (2) ve (3) nolu eşitlikleri (1) nolu eşitlikte yerine koyup n için çözdüğümüzde
(4) 22/
2
2
2/
2 )(
szNd
szNn
yerine koymaksızın,
(5)
2
2
2/
2
d
szNno
yerine koyarak
(4) nolu eşitlik pay ve paydası d(kare) bölünür
2222
222
/)(/
/)(
dZSNdd
dZSNn
ve burada (5) yerine konursa,
Nn
nn
/1 0
0
sonucuna ulaşılır. Bu iadesiz ve f=n/N>0,05 olduğu durumlarda kullanılır.
Alıştırma: Belirli bir lisedeki öğrencilerin her gün tükettikleri toplam süt miktarı tahmin edilmek
istenmektedir. Okulda N=2000 öğrenci vardır. Şansa bağlı olarak n=100 öğrenci seçilmiş ve süt
tüketiminin örnek ortalaması x =0.8 litre olarak bulunmuştur. %99 güvenilirlikle hatanın 100 litre
içinde kalması arzu edildiği varsayıldığına göre hangi büyüklükte bir örnek seçilmelidir?(s=0.3)
CZdo 2/
2
2
2/
2
d
szNno
=
324100
3.0*32000
2
22
Prof.Dr.Levent ŞENYAY V- 17
ÖrneklemeYöntemleri
164.02000/324/0 Nn 05.0 olduğundan dolayı n hesaplanmalıdır.
Nn
nn
/1 0
0
= 279
164.01
324
Duyarlılık, göreli ifade edildiğinde ilişki
(6) 2
ˆ
2
2/
2
Xo Czd
Duyarlılık, XXd ˆ
Nispi duyarlılık, XXXd /ˆ0
2
2ˆ
X
XXdo biçimindedir. C ve C( X )-bazı durumlarda xC ˆ olarak da gösterilecektir-
2 ’ye bağlı olarak ifade edilmiştir. Bu ifadeler S2 ler cinsinden yazıldığında
xC ˆ =N
nN
n
S
X
N
X
XV **
)ˆ( 2
2
2
2 xNVXV )ˆ(
2
2
2ˆ
)ˆ(
X
S
X
XVC
X
Pay ve payda N(kare)ye bölünürse C(kare) elde edilir
xC ˆ =N
nN
n
S
X
**
1 2
2
(7) xC ˆ =N
nN
n
C *
2
yerine koymaksızın
(8) xC ˆ =n
C 2
yerine koyarak
C2=22 / X yerine C2=S2/
2X yazılacaktır.
Bu iki değer arasındaki ilişki ((N-1) = N2 olduğundan)
Prof.Dr.Levent ŞENYAY V- 18
ÖrneklemeYöntemleri
C2=N
N
X
S
X
1*
2
2
2
2
olur.
Böylece N büyük olduğunda N-1/N 1olarak alınır ve (7) ve (8) nolu eşitliklerde kullanılan
C2=2
2
2
2
X
S
X
ifadesine ulaşılır. (7) ve (8) nolu eşitlikler (6) nolu eşitlikte yerine konur ve
n için çözülürse
(9) 22/
2
2
2/ )(
CzNd
CzNn
o
yerine koymaksızın
10)
2
0
2
2/
d
Czno
yerine koyarak elde edilir. (9) ve (10) nolu eşitliklerden
Nn
nn
/1 0
0
elde edilir.
Uygulamalarda C ve C( X )’nin tahmin edicileri, S2 yerine bunun tahmin edicisi s2 alınarak elde edilir.
Alıştırma: N=2000 öğrenciden oluşan bir populasyondan , n=100 öğrencilik bir örnek seçilmiştir.
Öğrencilerin ağırlıkları araştırılmış ve x =70 kg. ve s=10 kg. olarak bulunmuştur. xXCCC ,, ˆ ’nın
tahminlerini elde ediniz.
n/N=0,05
1-(n/N) 1 alınacaktır.
2
2
2
22
70
10ˆx
sC 0.02 C 0.14
100
02.0ˆˆˆ
222
ˆn
CCC xX
0.0002
xXCC ˆˆ
ˆ 0.014 olarak bulunur.
C 0.14 olması göreli olarak 1 standart sapma büyüklüğünü gösterir. Ağırlıklar normal dağılmışsa, bu
durumda C 0.14olması ağırlıkların yaklaşık olarak %68’inin ortalama ağırlık X ’nın %14 sınırları
Prof.Dr.Levent ŞENYAY V- 19
ÖrneklemeYöntemleri
içinde olacağını gösterir. X
C ˆˆ 0.014 olması ise tahmin edilen toplamın ( X ) yaklaşık %68’inin, toplam
X’in %1.4’lük sınırları içinde kalacağını gösterir.
Alıştırma: Bir şehirde yaşayan 5000 aile olduğunu ve her bir aile tarafından bir haftada tüketilen
ortalama yumurta sayısının tahmin edilmek istendiği varsayılmaktadır. Duyarlılığın ortalamanın %5’i
kadar olması istenmektedir. n=100 aile üzerinde yapılan bir ön çalışmada s=12 yumurta ve x =36
yumurta olarak bulunmuştur.
a)Değişim katsayısını elde ediniz.
b) Duyarlılığın ortalamanın %5’i kadar olması istendiğine göre kaç aile ile daha görüşülmelidir?
c)Populasyon ortalaması için %90’lık güven aralığını oluşturunuz.
a) 2
2
2
22
36
12ˆx
sC C 1/3 olur.
b) 22/
2
2
2/ )(
CzNd
CzNn
o
=
22
2
)3/1*64,1()05.0(5000
)3/1*64,1(5000
=118
118-100=18 aile ile daha görüşülmelidir.
18 aile daha ilave edilerek x =38 yumurta ve s=12 yumurta olarak bulunmuştur.
c) Populasyon ortalaması için %90’lık güven aralığı
P( xx szxXszx 2/2/ )=1-
n/N 0.05
n
ssx =
118
12 şeklinde idi.
P(38-1,64118
12< X <38+1,64
118
12)=0.90
P(36.2< X <39.8)=0.90 olarak bulunur.
Prof.Dr.Levent ŞENYAY V- 20
ÖrneklemeYöntemleri
5.3. Populasyon orani P’nin tahmini
P oranı daha çok pazarlama araştırması, kamuoyu araştırmaları ve kalite kontrolü
çalışmalarında kullanılır.
Populasyon Oranı
P oranına Xi şans değişkeninin sadece 0 ve 1 değerlerini aldığı özel bir durum olarak bakılabilir.
Örneğin, K marka sabun kullanan insanların oranı bulunmak istenildiğini varsayalım. N sayıda insan
olduğunu düşünelim ve kişi K marka sabunu kullandığında Xi=1 ve kullanmadığında ise Xi=0 olsun.
Bu durumda,
N
iX NXXX ........21
K marka sabunu kullananların sayısı olacak ve
(1) N
X
P
N
i ifadesi de K marka sabunu kullananların oranı olacaktır.
(1) nolu denklem populasyon ortalaması için verilen formülün aynısıdır. Buradaki tek fark Xi
değişkeni sadece 0 ve 1 değerlerini almaktadır.
Örnek oranı p, P’nin sapmasız bir tahmin edicisidir
N hacimli bir populasyondan seçilen n hacimli bir tesadüfi örneğin elemanları x1,x2,.........,xn
olsun. Örnek oranı, xi=1 yada 0 olmak üzere
(2) p=n
xn
i olarak tanımlanır. Bu şekilde tanımlanmış p, populasyon oranı P’nin sapmasız
tahmin edicisidir. p’nin P’nin sapmasız bir tahmin edicisi olduğunu göstermek için (2)
nolu denklemin her iki tarafının beklenen değeri alınır.
E(p)=
n
ixEn
1
n
xEpE )( 1.0x
Prof.Dr.Levent ŞENYAY V- 21
ÖrneklemeYöntemleri
E(p)= in
xEn
1
PxN
XxEN
ii 1
)(
E(p)= i
N
xN
nn
11=P
Buradan E(p)=P olduğu görülmektedir.
Alıştırma: N= 1000 öğrenci olduğunu, n=50 öğrencilik tesadüfi örnek seçildiğini ve bunlardan
20’sinin sigara içtiğinin saptandığını varsayalım. Sigara içen öğrencilerin oranını tahmin ediniz.
40.050
20ˆ pP
Alıştırma: N=5 öğrenci olduğunu ve bunlardan 3’ünün sigara içtiğini varsayalım. Bu şu şekilde
olsun:XA=1, XB=1, XC=1, XD=0 ve XE=0. Yerine koymaksızın n=2 hacimli tesadüfi örnekler seçelim.
Aşağıda verildiği gibi
2
5=10 tane mümkün örnek bulunmaktadır.
Örnekler ix ix p= ix /n
AB 1,1 2 1
AC 1,1 2 1
AD 1,0 1 0,5
AE 1,0 1 0,5
BC 1,1 2 1
BD 1,0 1 0,5
BE 1,0 1 0,5
CD 1,0 1 0,5
CE 1,0 1 0,5
DE 0,0 0 0
6
E(p)=(1/n)∑p=(1+1+0,5+ … + 0)=6/10=3/5
P=(1+1+1+0+0)/5=3/5
E(p)=P bu nedenle p P’nin sapmasız bir tahmin edicisidir.
Prof.Dr.Levent ŞENYAY V- 22
ÖrneklemeYöntemleri
5.3.1. Populasyon oranının varyansı
N kişilik bir grup olduğunu ve bunlardan A tanesinin sigara içtiği varsayılsın. Sigara içenler için X i=1 ve
içmeyenler için Xi=0 olmak üzere , N kişi X1, X2,.........,Xn ile gösterilebilir. Bu durumda
N
iX =A ve populasyon oranı P ise P=A/N olur. Tanım gereği, Xi’nin varyansı,
S2=
N
ii XNXN
XXN
222
1
1)(
1
1= PQ
N
NNPNP
N
1)(
1
1 2
biçimindedir. Xi=1 yada 0 olduğundan ∑X=A dır.
NPAXN
i 2 P
N
AX P
N
A
N
X
2
22 PX olur, dolayısıyla varyans S2
S2= PQN
NNPNP
N
1)(
1
1 2 olur. Burada PQ 1 ’dir. S2’nin, P’nin değil
Xi’nin varyansı olduğuna dikkat edilmelidir.
Örneğin, N=100 öğrenci olsun ve sigara içenler için Xi=1,içmeyenler için Xi=0 olmak üzere ,
populasyonu oluşturan öğrenciler X1,X2,.......,X100 ile gösterilsin.
A=60 öğrencinin sigara içtiğini varsayalım. Bu durumda P=0,60 ve Xi’nin varyansı
V(Xi)=S2= 24.0)4.0)(6.0(1100
100
Bu sonuç Xi’lerin dağılması hakkında bilgi verir.
Örnekteki Xi’lerin varyansı
n öğrenciden oluşan bir örnek verilmiş olsun ve bunlarsan a tanesi sigara içsin. Sigara içenlerin
oranı , p=a/n dir. Sigara içenler xi=1 ve içmeyenler xi=0 olmak üzere
bu örnek x1,x2,........,xn ile gösterilebilir. Bu durumda,
Prof.Dr.Levent ŞENYAY V- 23
ÖrneklemeYöntemleri
n
i
n
i xnxn
xxn
s 22
2
2
1
1
1
1
Fakat xi=1 yada xi=0 olduğundan
npaxn
i 2
n
a
n
xpx
22 px olur. Dolayısıyla, örnek varyansı s2, q=1-p olmak üzere
s2= pqn
nnpnp
n 11
1 2
biçimine gelir.
Örneğin, N=100 öğrencilik bir populasyondan n=50 öğrenci seçilsin ve bunlardan a=25
öğrenci sigara içiyor olsun. Bu durumda p=25/50=0.5 olur. Böylece örnek varyansı s2,
s2= pqn
nnpnp
n 11
1 2
= 25.0)5.0)(5.0(
150
50
Örnek oranı p’nin varyansı
Xi’nin varyansı tanımını kullanarak örnek oranı p’nin varyansı tanımlanabilir. Tanımdan
V(p)=E(p-E(p))2=E(p-P)2
)(111
)(22
2
22xVar
n
s
nnxnVar
nxVar
nn
xVar
n
aVarpVar i
xp
biçimindedir. Daha önce,
(3) V( x )= )(*
2
pVarn
S
N
nN
yerine koymaksızın (iadesiz) örnekleme
V( x )= )(
2
pVarn
S yerine koyarak (iadeli) örnekleme
Olduğu görülmüştü. Aynı zamanda Xi=1 yada 0 aldığımızda ,
Prof.Dr.Levent ŞENYAY V- 24
ÖrneklemeYöntemleri
p= xn
xn
i
P= XN
XN
i
olduğunu görmüştük. Böylece V(p), (3) nolu eşitlikte x =p alınarak
(4) V( p )=
2
*n
S
N
nN yerine koymaksızın (iadesiz) örnekleme
V( p )=
2
n
S yerine koyarak (iadeli) örnekleme
bulunur. Burada , ix =1 ve ya 0 dır.
S2= PQN
NNPNP
N
1)(
1
1 2 yi formülde yerine koyduğumuzda V(p) şu hale gelir.
V(p)=
2
*n
S
N
nN =
N
nN
nPQ
N
N
*
1
1
=1
*1
N
nN
nPQ Yerine koymaksızın
=PQn
1 Yerine koyarak
1
1N
N
Örneğin, N=4000 öğrenciden oluşan 50 öğrencilik bir tesadüfi örnek seçildiğini varsayalım. Sigara
içenlerin populasyon oranı P=0,3 ise,
örnek oranı varyansı
05.00125.04000
50
N
n olduğu için (1-f) faktörüne gerek yoktur , böylece
V(p)= 0042.050
)7.0)(3.0( olur. Varyans %0,4 civarındadır. Bu örnek oranı p’nin örnekleme
dağılımının varyansıdır.
Prof.Dr.Levent ŞENYAY V- 25
ÖrneklemeYöntemleri
V(p)’nin sapmasız tahmin edicisi
s2, S2’nin sapmasız bir tahmin edicisidir. Bu durumda
s2= pqn
n
1 S2= PQ
N
N
1’nun sapmasız bir tahmin edicisidir.bu durumda
)(ˆ pV =1
*1
1
N
nN
npq Yerine koymaksızın
= pq1
1
n Yerine koyarak
elde edilir.
5.3.3. Oran için güven aralığı
P(p-z/2sp<P<p+z/2sp)=1-
p değerleri Normal dağılım yaklaşımını kullanabilmek için n’ye ilişkin alt sınır
0.5 30
0.4 veya 0.6 50
0.3 veya 0.7 80
0.2 veya 0.8 200
0.1veya 0.9 600
0.05 veya 0.95 1400
Alıştırma: Bir şehirdeki 2 yada daha fazla radyoya sahip ailelerin oranı tahmin edilecektir. N=8000 aile
bulunmaktadır ve bunlardan n=101 ailelik tesadüfi bir örnek seçilmiş ve p=0.6 olarak bulunmuştur.
Şehirdeki iki veya daha fazla radyoya sahip ailelerin oranı için %95’lik güven aralığını hesaplayınız.
n/N =101/8000 <0,05 olduğundan
2
ps =1
1
npq =(0.6)(0.4)
1101
1
=0.0024
ps =0.05
Prof.Dr.Levent ŞENYAY V- 26
ÖrneklemeYöntemleri
pszp 2/
P(0.6-(1.96)0.05<P<0.6+(1.96)0.05)=0,95
P(0.502<P<0.698)=1-
5.3.4. Populasyon oranı tahmininde örnek hacmi ve duyarlılık n için formül
Duyarlılık, güvenilirlik ve standart hata arasındaki temel ilişki şu şekilde açıklanabilir
Duyarlılık=(güvenilirlik) x(standart hata)
d=ZS
Populasyon oranı P’nin tahmin edicisi p’nin duyarlılığını ele aldığımızda
2
ps =N
nN
npq
*
1
1 ifadesi standart hata olarak kullanılabilir. Uygulamadaki amaçlar için,n-1
yerine n kullanılabilir. Bu durumda ilişki
N
nN
n
pqzd
2
2/
2
yerine koymaksızın
2d =
n
pqz 2
2/ yerine koyarak
şeklinde ifade edilebilir.
Buradan belli bir d duyarlılığı ve belli bir z/2 güvenilirliği için gerekli örnek hacmi
pqzNd
pqNzn
2
2/
2
2
2/
yerine koymaksızın
2
2
2/
d
pqzn yerine koyarak , şeklinde yazılabilir.
Prof.Dr.Levent ŞENYAY V- 27
ÖrneklemeYöntemleri
Alıştırma: N=4000 öğrenciden n=50 birimlik bir ön örnek tesadüfi seçilmiş ve a=30 öğrencinin sigara
içtiği görülmüştür. P’yi tahmin etmenin duyarlılığı %5 sınırı içinde hemen hemen kesin olacak (0.999)
şekilde hangi büyüklükte bir ön örnek seçilmelidir?
6.050
30p
pqzNd
pqNzn
2
2/
2
2
2/
= 711
)4.0)(6.0()3()05.0(4000
)4.0)(6.0(3)4000(22
2
n’i bulmanın daha kolay ve alternatif bir yolu
864
05.0
4.06.0922
2
2/
0
d
pqzn iken
4000/8641
864
/1 0
0
Nn
nn = 711
2
2/
2
2
2/ pqzNd
pqNz
şeklindedir.
Alıştırma:1998-99 öğretim yılında Dokuz Eylül Üniversitesi'ne kayıtlı bulunan 12023 öğrenciden 1426
öğrenci BŞÖ yöntemi ile çekilmiştir. Çekilen öğrencilerin üniversite öncesi eğitimlerine ilişkin dağılımı
aşağıdadır.
Bitirilen Okul Sayısı (a)
Kolej 145
Devlet Lisesi 1083
Meslek Lisesi 187
Diğerleri 11
Toplam
1426
Bitirilen okul türüne göre oranları tahmin ederek %95 olasılıkla içinde bulundukları sınırları
tahmin ediniz.
n
ap
Prof.Dr.Levent ŞENYAY V- 28
ÖrneklemeYöntemleri
Çözüm :
Belli özelliğe sahip birimler oranı tahmini,
bulunur.
Varyanslar ise,
N
nf
elde edilir.
Bu değerler yardımıyla tahminlerin %95 olasılıkla içinde bulundukları sınırlar tahmin edilebilir. z=1.96
0077.01426
11
1311.01426
187
7595.01426
1083
1017.01426
145
D
ML
DL
K
p
p
p
p
0021.0
0000046.00000053.0*8814.011426
9923.0*0077.0
12023
14261
11
0084.0
0000704.00000799.0*8814.011426
8689.0*1311.0
12023
14261
11
0106.0)(
0001129.00001281.0*8814.011426
2405.0*7595.0
12023
14261
1)1(
0075.0)(
000057.00000641.0*8814.011426
8983.0*1017.0
12023
14261
1)1(
)(
)(
)(
)(
D
p
ML
p
DL
p
K
p
psh
n
pqfV
psh
n
pqfV
psh
n
pqfV
pst
n
pqfV
D
ML
DL
K
Prof.Dr.Levent ŞENYAY V- 29
ÖrneklemeYöntemleri
Yukarıdaki 1/2n ifadesi süreklilik düzeltmesidir.
Buradan kolej için,
Olduğundan %95 olasılıkla p 0.0866 ile 0.1168 arasındadır.
Devlet lisesi için,
Olduğundan %95 olasılıkla p 0.7385 ile 0.7805 arasındadır.
Meslek lisesi için,
Olduğundan %95 olasılıkla p 0.114 ile 0.148 arasındadır.
Diğer okulları için,
Olduğundan %95 olasılıkla p 0.0032 ile 0.0122 arasındadır.
npszp
2
1
0151.01017.0
000351.0*0147.01017.01426*.2
10075.0*96.11017.0
021.07595.0000351.00106.0*96.17595.0
016851.01311.0000351.00165.01311.0000351.00084.0*96.11311.0
0045.00077.0000351.00021.0*96.10077.0
Prof.Dr.Levent ŞENYAY V- 30
ÖrneklemeYöntemleri
Alıştırma: İzmir ili merkez ilçesinde bulunan 100 hane BŞÖ ile çekilmiş ve her bir hanede yaşayan kişi
sayısı, ev sahibi-kiracı olma durumları ve araba sahibi olmalarına göre aşağıdaki dağılım elde edilmiştir.
Hane Sayısı Yaşayan Kişi Sayısı
Ev sahibi 40 234
Arabası olan 30 120
Arabası olmayan 10 114
Kiracı 60 427
Arabası olan 30 150
Arabası olmayan 30 277
Toplam 100 661
Bu çalışmada örnek oranı f=n/N=0.001 olduğuna göre
a)Bu örnek, ev sahibi-kiracı olan hanelerin oranını, arabası olan ev sahibi ve kiracı hanelerin oranlarını,
arabalı aile oranını ve yaklaşık standart hataları tahmin ediniz.
b)Merkez ilçe nüfusunu tahmin ediniz. Ev sahibi-kiracı olan hane sayısını, arabası olan ev sahiplerinin
ve kiracıların hane sayısını, yaklaşık standart hatalarını tahmin ediniz.
Çözüm :
Oran tahminleri (p=a/n)
Ev sahibi 40/100=0.40
Evsah.ve arabalı 30/100=0.30
Kiracı 60/100=0.60
Kir.ve arabalı 30/100=0.30
Arabalılar (30+30)/100=0.60
Prof.Dr.Levent ŞENYAY V- 31
ÖrneklemeYöntemleri
Standart hata tahminleri
b) Örnek oranı f=0.001 olduğuna göre,
n/N=f 100/N=0.001 N=100/0.001 N=100,000 hane olur.
Hanelerde yaşayan kişi sayısı,
n
ap
N
AP
İle tahmin edilebilir. n
qpNpNSNpsAsh
.)()(ˆ
Bulunur.
Sayı tahminleri ( pNA .ˆ )
Ev sahibi 100000*0.40=40000
Evsah.ve arabalı 100000*0.30=30000
Kiracı 100000*0.60=60000
Kir.ve arabalı 100000*0.30=30000
Arabalılar 100000*0.60=60000
npqstd P /
049.0100/040*60.0
046.0100/70.0*30.0
049.0100/40.0*60.0
046.0100/70.0*30.0
049.0100/60.0*40.0
NpA ˆ
661000100
661100000ˆ A
Standart hata tahminleri n
qpNAsh
.ˆ
4900100
60.0.40.0100000
4600100
70.0.30.0100000
4900100
40.0.60.0100000
4600100
70.0.30.0100000
4900100
40.0.60.0100000