Upload
syafaqatul-humairoh-elyakin
View
56
Download
18
Embed Size (px)
DESCRIPTION
Teknik Pengambilan Sampel
Citation preview
PENARIKAN SAMPEL BANYAK TAHAP
9.1 PROSEDUR SAMPLING
Di dalam bab 8, kita sudah membahas penarikan sampel berkelompok di mana kelompok dipertimbangkan sebagai unit sampling dan semua elemen dalam kelompok yang terpilih disebut satu per satu secara lengkap. Telah disebutkan bahwa penarikan sampel berkelompok itu, hemat dalam keadaan tertentu tetapi metode ini membatasi penyebaran dari sampel populasi yang hasilnya biasanya meningkatkan pendugaan terhadap varians. Oleh karena itu, wajar mengharapkan efisiensi dari estimator akan meningkat dengan cara pendistribusian elemen dalam jumlah besar dari kelompok dan hanya suatu contoh unit pada setiap kelompok terpilih sebagai wakil dengan menyebut satu per satu semua elemen sampel dari kelompok. Penarikan sampel jenis ini, yang terdiri dari pertama, pemilihan kelompok dan kemudian pemilihan secara spesifik beberapa elemen dari setiap kelompok terpilih yang dikenal sebagai sub-sampling atau teknik penarikan sampel dua tahap. Dalam desain sampling, kelompok yang terbentuk dari pemilihan unit sampling pertama disebut unit-unit pada tahap pertama atau unit-unit pada sampel utama dan elemen dalam kelompok disebut unit-unit pada tahap pertama. Prosedur ini dapat disamaratakan untuk tiga tahapan atau lebih dan dimasukkan dalam penarikan sampel banyak tahap. Sebagai contoh, dalam menyurvei panen untuk memperkirakan hasil dari panen di suatu daerah, suatu blok mungkin dipertimbangkan sebagai suatu unit sampel utama, desa/kampung sebagai unit sampel dalam langkah yang kedua, area panen sebagai unit sampel pada langkah yang ketiga, dan suatu plot dari ukuran yang tetap dari unit sampling yang terakhir.
Penarikan sampel banyak tahap telah ditemukan untuk menjadi hal yang sangat bermanfaat dalam hal praktik dan prosedur ini biasanya digunakan dalam survei berskala besar. Mahalonobis (1940) telah menggunakan prosedur ini dalam survei panen dan Ganguli memasukkan multi-stage sampling (penarikan sampel banyak tahap) ini dalam penarikan sampel bersarang. Chocran (1939), Hansen dan Hurwitz (1934), Sukhatme (1953), dan Lahiri (1954) sudah membahas penggunaannya dalam bidang pertanian dan survei populasi. Roy (1957) dan Singh (1958) telah mempertimbangkan komponen penduga varians untuk desain sampling. Prosedur penarikan sampel banyak tahap menjadi kombinasi yang lebih baik dari penarikan sampel acak danpenarikan sampel berkelompok. Itu diharapkan menjadi (i) kurang efisien dibanding penarikan sampel acak satu tahap dan lebih efisien dibanding penarikan sampel banyak tahap dari sudut pandang variabilitas sampling, dan (ii) lebih efisien dibanding penarikan sampel acak satu tahap dan kurang efisien dibanding
pengelompokan dari sudut pandang biaya dan operasional. Keuntungan utama dari prosedur sampling ini adalah bahwa pada langkah yang pertama, kerangka dari unit-unit pada tahap pertama diperlukan agar bisa disiapkan dengan mudah. Pada langkah yang kedua, kerangka dari unit-unit pada tahap kedua diperlukan hanya untuk yang terpilih unit-unit pada tahap pertama dan seterusnya. Desain ini menjadi lebih fleksibel, yaitu seperti memperbolehkan penggunaan prosedur penarikan sampel yang berbeda dalam tahapan yang berbeda. Itu juga bisa dikatakan bahwa penarikan sampel banyak tahap itu mungkin hanya satu-satunya pilihan dalam sejumlah situasi praktis di mana suatu kerangka sampel yang lengkap dari unit pada tahapan terakhir tidak tersedia dan membutuhkan biaya besar untuk memperoleh kerangka seperti itu.
9.2 PENARIKAN SAMPEL DUA TAHAP DENGAN UKURAN UNIT SAMA PADA TAHAP PERTAMA: MEMPERKIRAKAN RATA-RATA DAN VARIANS POPULASI
Karena, pada penarikan sampel dua tahap, unit-unit dipilih pada tiap tahapan dengan mempertimbangkan struktur peluang pada tiap tahap, prosedur pemilihan pada kedua tahapan adalah mempertimbangkan pada turunan dari nilai harapan dan varian dari penduga berdasarkan pada jumlah observasi yang diambil pada sampel dari unit-unit pada tahap kedua. untuk mendapatkan nilai harapan dan varian sampel dari estimator berdasarkan pada unit-unit yang dipilih dengan memperhatikan asas randomisasi pada tahap dua, kita mungkin mengikuti hasil yang diberikan pada Teorema 1.3.7 dan 1.3.8 yang dirangkum di bawah ini.
( ) ( )tEEtE 21= (9.2.1)
( ) ( ) ( )tVEtEVtV 2121 += (9.2.2)
dimana E1 dan V1 adalah ekspektasi dan varian dari tahap pertama dan E2 dan V2 adalah ekspektasi bersyarat dan varian dari tahap kedua untuk sampel dari unit-unit pada tahap pertama .
Mari kita asumsikan bahwa populasi terdiri dari NM elemen yang dikelompokkan pada N unit-unit tahap kedua dari tiap M pada unit-unit tahap kedua. maka n menjadi nomor unit-unit pada tahap pertama pada sampel dan m adalah nomor unit-unit pada tahap kedua yang terpilih dari setiap unit sampel tahap pertama. Kita juga mengasumsikan bahwa unit-unit pada tiap tahap dipilih denga peluang yang sama. Di bawah ini adalah notasi yang digunakan :
==∑
M
yiY
M
iij Rata-rata setiap elemen pada unit-unit tahap pertama
==∑
N
YY
N
i
i Rata-rata setiap elemen populasi
( )( ) =
−
−=
∑)1
2
2
N
YYS
N
i
i
b
varian sebenarnya antara rata-rata unit pada tahap pertama
( )=
−
−=
∑∑)1(
2
2
MN
YyS
N
i
M
i
iij
w
varian sebenarnya antara unit-unit dengan rata-rata pada
tahap pertama
==∑
m
y
y
m
jij
i
rata-rata sampel tiap unit-unit pada tahap kedua dalam uni-unit pada
tahap pertama
==∑
n
yy
n
ij rata-rata semua sampel tiap elemen
Teorema 9.2.1
Jika n adalah dari setiap fsu adalah dipilih dengan metode simple random sampling, wor, y adalah unbiased estimator bagi Y dengan varian sampel
( ) ( )mn
S
M
mM
n
S
N
nNyV wb
22)( −+−= (9.9.3)
Pembuktian : Menggunakan persamaan (9.2.1) untuk mendapatkan ekspektasi, maka
( ) ( ) ( ) YYEiyEEyE ij === 1121 /
Itu menunjukkan bahwa rata-rata semua elemen sampel adalah unbiased estimator bagi rata-rata populasi.
Untuk memperoleh estimasi dari varians, dengan menghubungkan pada (9.2.2), kita punya
( ) ( )[ ] ( )[ ]iyVEiyEVyV // 2121 +=
( )
−+= ∑
n
iii S
MmnEYV 2
211
111
( ) ( )n
S
mM
mMS
nN
nN wb
22 −+−=
Dimana ∑=N
iiw S
NS 22 1
Jika f1 = n/N dan f2 = m/M adalah fraksi sampel pada tahap pertama dan kedua, hasilnya bisa dituliskan sebagai
( ) ( ) ( ) 2221 11wb S
nm
fS
n
fyV
−+
−= (9.2.4)
Varians ditunjukkan pada persamaan (9.2.3) pada penarikan sampel dua tahap terdiri dari dua komponen. Komponen satu berasal dari variabilitas dari unit-unit pada tahap kedua di dalam unit-unit pada tahap kedua dan kedua muncul dari varian unit-unit pada tahap pertama. Jika pemilihan unit-unit pada tahap satu disebutkan satu per satu secara lengkap atau, dengan kata lain m = M, varian dari rata-rata sampel akan diberikan hanya oleh komponen pertama dan kondisi ini telah dibahas pada bab 8. jika n = N atau dengan kata lain setiap unit-unit pada sampel pertama dalam populasi terlibat dalam sampel, kemudian untuk metode stratifikasi dengan unit-unit pada sampel pertama sebagai strata terdiri dari dua komponen, dan teknik penarikan sampel acak sederhana dari m unit-unit sampel pada tahap kedua di peroleh dari tiap strata
Kesimpulan 1 Berdasarkan teorema 9.2.1, penduga tak bias dari ( )yV adalah
( ) ( ) ( ) 2221 11wb s
nm
fs
n
fyv
−+
−= (9.2.5)
Dimana( )( )1
2
2
−
−=
∑n
yys
n
ii
b
( )( )1
2
2
−
−=
∑∑mn
yy
s
n
i
m
jiij
b
Kesimpulan 2 Tunjukkan bahwa unbiased estimator dari 2bS adalah
( ) 2222 1ˆwbb s
m
fsS
−−= (9.2.6)
Kesimpulan 3 Jika n fsu’s dipilih secara acak dengan pengembalian (pemulihan) dan m ssu’s dari setiap unit terpilih, dipilih dengan penarikan sampel acak sederhana, wor, y adalah unbiased estimator dari Y dengan varians sampel
( ) ( )mn
Sf
n
SyV wb
2
2
2
1−+= (9.2.7)
Kesimpulan 4 Jika n fsu’s dipilih secara acak, wor, dan m ssu’s dari setiap pemilihan unit dipilih secara random, wr, y adalah unbiased estimator Y dari dengan varians
( ) ( )mn
S
n
SfyV wb
22
11 +−= (9.2.8)
Kesimpulan 5 Jika n fsu’s dan m ssu’s dari setiap pemilihan unit dipilih dengan penarikan sampel acak sederhana, wor, y adalah unbiased estimator Y dari dengan varians
( )mn
S
n
SyV wb
22
+= (9.2.9)
Kesimpulan 6 Jika n fsu’s dan m ssu’s dari setiap pemilihan unit dipilih dengan penarikan sampel acak sederhana, wor, estimator
∑=n
i
i
n
yNMY (9.2.10)
Adalah penduga tak bias dari total populsi Y dan varian sampel adalah
( ) ( )mn
SMN
n
SfMNyV wb
222
2
122 1 +−= (9.2.11)
9.3 ALOKASI OPTIMUM : UNIT-UNIT BERUKURAN SAMA PADA TAHAP PERTAMA
Efisiensi dari penarikan sampel dua tahap sangat tergantung pada nilai m dan n, ini wajar untuk memperoleh nilai optimal m dan n dalam praktiknya. Pada desain penarikan sampel dua tahap, fungsi biaya dari sampel pada survey bisa dituliskan sebagai
21 nmcncaC ++= (9.3.1)
Dimana a adalah biaya umum, 1c adalah biaya yang melibatkan fsu pada sampel dan
2c adalah biaya yang melibatkan ssu pada sampel.
Dalam prakteknya, 1c nampaknya akan lebih besar dibandingkan 2c . Oleh karena
itu, meningkatnya n akan meningkatkan biaya yang lebih besar dari meningkatnya unit m. Mari kita juga mempertimbangkan varian sampel dari penduga. Kita menemukan bahwa varian total pada penarikan sampel dua tahap terdiri dari dua bagian (1) varian antara unit-unit pada tahap pertama dan (2) varians di dalam unit-unit pada tahap pertama. Pada kenyataannya, pendugaan dari varian sampel, pada desain dua tahap, bisa dituliskan sebagai
++=
m
AA
nAV o
21
1(9.3.2)
Dimana ,N
SA
nb
o = ,2
21 M
SSA w
b −= 22 wSA =
Itu dapat dilihat bahwa komponen perbedaan dalam kaitan dengan pengurangan unit-unit pada tahap pertama dengan suatu peningkatan n hanya ketika perbedaan komponen karena pengurangan unit-unit pada tahap kedua dengan meningkatkan n dan m.
Jadi, fungsi biaya dan varian berlawanan arah untuk meningkatkan n dan m, supaya efisiensi tiap unit dari biaya menjadi maksimum atau biaya tiap unit minimum untuk nilai tertentu dari efisiensi.
(a) Jika Biaya Tetap Asumsi bahwa biaya C adalah tetap, katakan Co. Menggunakan metode faktor pengali Lagrange, fungsi yang terbentuk adalah
( ) ( ) ( )021,, CnmcncayVmnL −+++= λλ (9.3.3)
Menurunkan L terhadap n dan m, menyamakan turunan parsial dengan nol dan mengeliminasi λ , kita mendapatkan
( )[ ] 2
122
21
212
1
21
12
/
/
MSS
ccS
cA
cAm
wb
wo p t
−=
= (9.3.4)
Substitusikan nilai dari m pada persamaan (9.3.1), kita memperoleh nilai optimum dari n sebagai
( ) ( )( ) ( ) 2
1
222
1
11
21
11 /
cAcA
cAaCn oo p t
+−= (9.3.5)
Substitusikan nilai dari optm dan optn pada persamaan untuk varian, kita
mendapatkan varian minimum, yaitu
( ) [ ]( )aC
cAcAAyV
oo −
++= 2211
min (9.3.6)
(b) Jika Varians Tetap Misalkan varians V dari penduga pada penarikan sampel dua tahap tetap, katakana Vo. kemudian, nilai dari n dan m, dengan meminimumkan biaya diberikan oleh metode factor pengali Lagrange. Aplikasikan metode yang sama di (a) di atas, kita akan mendapatkan
21
21
12
=
cA
cAmopt
Substitusikan nilai dari m ke persamaan (9.3.2), kita nakan mendapatkan nilai optimum dari n yaitu
1
12211
c
A
AV
cAcAn
ooopt −
+= (9.3.7)
Substitusikan nilai dari optm dan optn pada persamaan biaya, kita akan
mendapatkan biaya minimum yaitu
[ ]0
2
2211
AV
cAcAaC
o −+
+= (9.3.8)
Contoh 9.1 Pada suatu percobaan, ada 100 lahan yang disebar benih gandum. Tiap lahan dibagi menjadi 16 bidang dengan ukuran yang sama (1/16 hektar). Dari 100 lahan, dipilih 10 dengan teknik penarikan sampel acak sederhana, wor. Dari tiap lahan yang terpilih, 4 plot dipilih secara acak, wor. Lahan dalam kg/bidang diberikan di bawah ini :
Selected Plots
Field 1 2 3 4
1 4.32 4.84 3.96 4.04
2 4.16 4.36 3.50 5.00
3 3.06 4.24 4.76 3.12
4 4.00 4.84 4.32 3.72
5 4.12 4.68 3.46 4.02
6 4.08 3.96 3.42 3.08
7 5.16 4.24 4.96 3.84
8 4.40 4.72 4.04 3.98
9 4.20 4.66 3.64 5.00
10 4.28 4.36 3.00 3.52
(i) Perkirakan rata-rata gandum per hektar dalam percobaan beserta kesalahan bakunya (standard error).
(ii) Bagaimana perkiraan bisa diperoleh dari penarikan sampel acak dari 40 bidang yang dibandingkan dengan perkiraan yang diperoleh pada (i)?
(iii) Tentukan n dan m optimum dengan fungsi biaya nmn += 4100
Diberikan, N = 100, M = 16, n =10, dan m = 4
Perhitungan yang diperoleh ditunjukkan di bawah ini:
S. N.
(1) (2) (3) (4) (5) (6) (7)
1 17.16 4.290 0.0267 74.091 18.404 0.475
2 17.02 4.255 0.0165 73.565 18.105 1.145
3 15.18 3.795 0.4469 59.733 14.402 2.125
4 16.88 4.220 0.0087 71.925 71.808 0.694
5 16.28 4.070 0.0143 67.009 16.545 0.749
6 14.54 3.635 0.2586 53.511 13.213 0.659
7 18.20 4.550 0.1794 83.950 20.703 1.138
∑4
iijy
ijy ( ) 2yyij − ∑=
4
1
2
j
ijy ijy 2
−∑
422
j
ijij ymy
8 17.14 4.285 0.0251 73.800 17.361 0.356
9 17.50 4.375 0.0618 77.605 19.141 1.041
10 15.16 3.790 0.4402 58.718 14.364 1.262
Total 41.265 1.478 693.908 9.644
(i) Pendugaan dari rata-rata lahan gandum, dengan rumus umum, adalah
1265.410
265.411 === ∑n
iiy
ny
Pendugaan dari varians y adalah
( ) 22 111|
11wb s
Mmns
Nnyv
−+
−=
Menghitung nilai 2bs , kita mendapatkan
( ) 1642.09
4782.1
1
12
1
2 ==−−
= ∑n
ib yyn
s
dan,
( ) ( ) 3215.030
644.9
1
12
2 ==−−
= ∑∑n
i
m
jiijb yy
mns
Oleh karena itu,
( ) 0145.03215.016
1
4
1
100
11642.0
100
1
10
1 =
−+
−=yv
Dan kesalahan baku (standard error) dari y = 120.00145.0 =
(ii) Pada penarikan sampel acak sederhana, estimasi dari varians diperoleh
( ) 211s
NMnmyvran
−=
Perkiraan dari 2S , menggunakan desain sampel dua tahap, bisa dituliskan sebagai,
( ) ( ) ( ) ( )
−−−−+−
−= 222 1
111
1wb s
m
NmMMNsNM
NMs
−+
−= 3215.0
4
1299151001642.09916
11600
1 xxxx
= 4045.0
Jadi, ( ) 0099.04045.01600
1
40
1 =
−=yvran
(iii) Fungsi biaya dari bentuk persamaan nmcncC 21 += dengan c1= 4, c2= 1, dan C = 100. Nilai optimum dari m adalah
21
22
2
2
1
−=
m
ss
s
c
cm
wb
wopt
= ( )2
1
43215.01642.0
3215.0
1
4
−x = 4
Substitusi nilai dari m pada fungsi biaya yang diberikan, nilai optimum dari n adalah
138
100 ≅=optm
9.4 THREE-STAGE SAMPLING DENGAN PELUANG YANG SAMA
Prosedur two stage sampling dapat dipindahkan sepertiga oleh sampling ssu’s sebagai ganti menyebut satu per satu dengan sepenuhnya. Sebagai contoh, di dalam panen mensurvei untuk menaksir hasil rata-rata, suatu desa dipertimbangkan unit percontohan langkah yang pertama .Di dalam suatu yang terpilih, hanya sebagian dari bidang yang bertumbuh panen terpilih dan diambil [ketika;seperti] sampling langkah yang kedua. Ketika suatu bidang yang terpilih, kemaluan yang hanya tertentu tentangnya adalah sampel,dimana mungkin memasukkan third-stage unit ( tsu). begitu hasil dari tiga sampling langkah dapat diperoleh dengan berkembang mereka yang dua sampling langkah, dengan asumsi yang masing-masing ssu mempunyai L third-stage unit. Ini juga mengira bahwa unit terpilih dengan kemungkinan yang sama.
Nilai ijky diperoleh untuk kth third-stage unit di jth unit langkah yang kedua dari ith langkah
yang pertama unit itu. Relevan populasi berarti tiap element adalah sebagai berikut:
∑=L
k
ijkij L
yY
∑∑ ′=
M
j
L
k
ijki ML
yY
∑∑∑=N
i
M
j
L
k
ijk
LMN
yY
,, iij yy dan y akan mendanakan bersesuaian nilai-nilai untuk contoh, bersesuaian varians
populasi nantinya:
∑ −−
=N
i
ib N
YYS
)1(
)( 22
∑∑ −−
=M
i
iiN
ib MN
YYS
)1(
)( 22
∑∑∑ −−
=L
k
ijijkN
i
M
jb LNM
YyS
)1(
)( 22
TEOREMA 9.4.1 jika n fsu’s, m ssu’s dan l unit yang terakhir terpilih oleh percontohan acak yang sederhana, wor, y adalah unbiased estimator dari Y dengan varian
23221 )1()1()1()( uwb S
nml
fS
nm
fS
N
fyV
−+
−+
−= ( 9.4.1)
Di mana L
lf
M
mf
N
nf === 321 ,, pecahan sampling pada tiga langkah-langkah, berturut-
turut. bukti adalah jelas nyata.
Varians yang diberi oleh hubungan ( 9.4.1) terdiri dari tiga komponen yang sesuai dengan yang three-stage dari sampling. Komponen yang pertama adalah variabilitas dari fsu’s, yang kedua ke variasi dari ssu’s dan yang ketiga ke tsu’s. jika m= M dan l= L, yaitu. masing-masing dari n fsu’s adalah dengan sepenuhnya disebut satu per satu, varians dari sampel berarti akan diberi oleh komponen yang pertama saja, mewakili varians dari sampling langkah yang tunggal. Dengan cara yang sama, jika masing-masing dari nm terpilih unit langkah yang kedua adalah dengan sepenuhnya disebut satu per satu, yaitu. l= L, varians dari contoh berarti akan diberi oleh dua hal pertama itu terminologi saja, mewakili varians dari dua orang – langkah yang sampling disain. Di (dalam) n= N atau di kata-kata yang lain, tiap-tiap fsu di populasi dimasukkan di contoh, varians dari contoh berarti akan mempunyai
[bertahan/berlangsung] dua terminologi, yaitu. sesuai dengan suatu dibuat stratifikasi dua sampling langkah mendesain dengan fsu’s strata.
KESIMPULAN 1 jika sampling telah selesai dengan penggantian pada tiap-tiap langkah, adalah suatu penduga yang unbiased dari dengan sampling varians
nml
S
nm
S
N
SyV uwb
222
)( ++= ( 9.4.2)
KESIMPULAN 2 suatu penduga yang unbiased dari )(yV yang diberikan oleh
232122121 )1()1()1()( uwb S
nml
fffS
nm
ffS
n
fyv
−+
−+
−= (9.4.3)
Di manakah 222 ,, uwb sss nilai-nilai contoh sesuai dengan, 222 ,, uwb SSS berturut-turut.
KESIMPULAN 3 Dengan fungsi biaya dari format
C = a + nc1 + nmc2 + nmlc3
Dan fungsi varians dari format
nml
A
nm
A
n
AAyV 321
0)( +++=
Nilai-Nilai jumlah maksimum dari l, m dan n yang memperkecil varians diberi oleh
2/1
32
23
=
cA
cAlopt
2/1
21
12
=
cA
cAmopt (9.4.5)
2/133
2/122
2/111
2/1110
)()()(
)/)((
cAcAcA
cAaCnopt ++
−=
Dengan nilai yang minimum dari varians untuk ditetapkan;perbaiki C, katakan C0
)(
])()()[(min
0
22/133
2/122
2/111
0 aC
cAcAcAAV
−++
= (9.4.6)
KESIMPULAN 4 Dengan notasi yang yang serupa seperti di kesimpulan 3, nilai-nilai jumlah maksimum dari l, m, dan n yang memperkecil biaya ,diberi oleh
2/1
32
23
=
cA
cAlopt
2/1
21
12
=
cA
cAmopt (9.4.7)
2/11100
2/133
2/122
2/111
)/)((
)()()(
AcAV
cAcAcAnopt −
++=
Dengan biaya yang minimum untuk suatu varians yang spesifik. katakan V0,
)(
])()()[(
00
22/133
2/122
2/111
AV
cAcAcAaC
−++
+= (9.4.8)
9.5 STRATIFIED MULTI-STAGE SAMPLING
Disain yang paling umum di survei yang besar-besaran dibuat stratifikasi multi-stage sampling. Tidak prinsip yang baru dilibatkan ketika obyek adalah untuk menaksir rata-rata dari suatu populasi dibagi menjadi k strata dan sampling di dalam masing-masing lapisan adalah mandiri. Populasi dari fsu’s dibagi lagi ke dalam k strata. Di dalam masing-masing lapisan, suatu contoh fsu’s terpilih dan masing-masing dari terpilih fsu’s adalah sub-sampled.
Biarkan hth lapisan berisi Nh unit langkah yang pertama, masing-masing dengan Mh unit langkah yang kedua. Bersesuaian angka-angka contoh menjadi nh dan mh. Penduga dari populasi berarti tiap unit langkah yang kedua diberi oleh
∑∑
∑==
k
hhhk
hhh
k
hhhh
st yWMN
yMNy ( 9.5.1)
Di mana hy contoh berarti di hth lapisan, dan ∑=
k
h
NhMh
NhMhWh
adalah penimbang dari
lapisan dalam kaitan dengan ssu’s
Menerapkan TEOREMA 9.2.1 di dalam masing-masing lapisan, kita mempunyai
])1()1(
[)( 22212wh
hh
hbh
h
hk
hst S
mn
fS
n
fWhyV
−+
−= ∑ ( 9.5.2)
Di manah
hh
h
hh M
mf
N
nf == 21 ,
Dengan cara yang sama, suatu penduga yang unbiased tentang sampling varians diberi oleh
])1()1(
[)( 221212wh
hh
hhbh
h
hk
hst S
mn
ffS
n
fWhyv
−+
−= ∑ ( 9.5.3)
Untuk mendiskusikan kasus dari alokasi jumlah maksimum, kita dapat tulis fungsi biaya sebagai
∑∑ +=k
hhhhh
k
hh mncncC 21 ( 9.5.4)
Dari hubungan ( 9.5.2), varians mungkin ditulis [ketika;seperti]
][)( 210
2 +++= ∑hh
h
h
hh
k
hhst mn
A
n
AAWyV
dimana 22
22
1
2
,, whhwhbh
hbh
ch SAmh
SSA
Nh
SA =
−=−=
Karenanya, memperkecil V untuk ditetapkan;perbaiki C, atau sebaliknya, kita dapat menggunakan Lagrange’S metoda dari pengali yang tak dapat ditentukan. Pembedaan secara parsial w.r.t nh dan mh dan penyamaan pada nol, kita mendapatkan
2/122
2/121
2/1
21
12
)/(
)/(
MhSS
ccS
cA
cAm
whbh
hhwh
hh
hhh −
=
= (9.5.5)
2/111
2/111
)/(
)(
h
hhh chAWh
cAnWhn
∑= (9.5.6)
2/1
122
2/11
22
]/)/([
]/)/[(
hwhbh
hwhbh
cMhSSWh
cMhSSnWh
−−
=∑
Karena; Wh ≈ NhMh kita boleh menyatakan
h
hwhbhhhh
c
MSSWNn
1
2/122 ]/[ −≈
≈
h
h
c
SNhMh
1
′
Di mana
2/122
−=′
Mh
SSS wh
bhh
dapat dilihat dengan mudah dari yang tersebut di atas hubungan bahwa rumusan untuk mh jumlah maksimum. Apakah secara tepat sama halnya di sampling yang tidak dibuat stratifikasi. Dengan cara yang sama, nilai jumlah maksimum dari nh yang sama membentuk perihal sampling yang dibuat stratifikasi uni-stage.
9.6 TWO-STAGE SAMPLING WITH UNEQUAL FIRST STAGE UNITS ESTIMATORS OF MEAN DAN THEIR VARIANCES
Durbin ( 1953), Des Raj ( 1966) dan Rao ( 1975) sudah membahas berbagai pen duga dari multi-stage sampling .Bagian ini diabdikan bagi suatu uraian tentang beberapa penduga yang bersama-sama menggunakan. Biarkan populasi dalam pembahasan terdiri dari N unit langkah yang pertama. Ith fsu berisi Mi unit langkah yang kedua. Lebih jauh, unit terpilih tanpa penggantian, dengan kemungkinan berbeda atau sama. Suatu contoh n fsu’s terpilih dan dari ith terpilih fsu, suatu contoh mi, ssu’s terpilih.
Mari kita tentukan
Mi = banyaknya ssu’s di ith fsu ( i=1,2,……,N)
Mo== total jumlah ssu’s di populasi
mi = banyaknya ssu’s untuk terpilih dari ith fsu dimasukkan di contoh
mo== total jumlah ssu’s di contoh
MiyYMi
jiji ∑= = ith fsu berarti
NYYN
jiN ∑= = keseluruhan cara fsu berarti
∑
∑=
N
i
N
i
Mi
iYMiY =∑
N
i
iYWi == rata-rata tiap ssu atau populasi berarti unsur
Ada beberapa penduga dari populasi berarti tetapi kita mengusulkan hanya untuk belajar sebagian dari yang metode yang praktis adalah,
Mn
yMyu
ny
n
iiin
iii
∑∑ == 1 (9.6.1)
n
yy
n
ii∑
=1
(9.6.2)
∑
∑=
n
n
iii
Mi
yMy
1
(9.6.3)
Di mana ∑=mi
j i
ij
m
yy .1 ,
N
MoM = , dan
M
Miui =
TEOREMA 9.6.1 menujukkan bahwa penduga yang diberi oleh hubungan ( 9.6.1) adalah unbiased dan sampling variansnya diberi oleh
])1()1(
[)(2
22221
mi
S
MnN
fMiS
n
fyv wih
N
ib
−+
−= ∑ (9.6.4)
Di mana )1(
)( 2
2
−
−=
∑N
YYuS
N
iii
b
dan )1(
)( 2
2
−
−=
∑Mi
Yy
Swi
Mi
jiij
Bukti untuk membuktikan
n
yuy
n
iii∑
= adalah suatu penduga yang unbiased, kita dapat tulis
1)( EyE =]
)|([
2
n
iyuEn
iii∑
= ∑∑
==n
iii
n
iii
YYuEnn
YuE )(
1][ 11
Sampling varians dari penduga diberi oleh
)|()|()( 2121 nyVEnyEVyV +=
+
= ∑∑
n
ii
in
iii nyV
M
M
nEYu
nV )|(
11.2
2
211
mi
S
MnN
fM
n
Sf w
N
i
iib2
22
22
1
)1()1( ∑ −
+−=
Unit terpilih dengan kemungkinan yang sama di metode ini dan kontribusi dibuat oleh fsu’s kepada komponen dari varians ini tergantung pada variasi antar fsu total. Jika unit berubah-ubah sesuai ukurannya maka ukuran, komponen ini akan jadi besar. Komponen yang kedua dari varians adalah juga besar seperti nampaknya akan ada korelasi yang positif antar Mi dan.
2.wiS . Sering, komponen ini menjadi sangat besar bahwa penduga tidaklah lebih disukai
KESIMPULAN 1 Menunjukkan bahwa perkiraan penduga ∑=n
i n
iyNMiY
.ˆ secara
unbiased populasi total Y dan sampling varians nya akan [jadi] diberi oleh
2
222212 )1()1(
)ˆ( wii
n
iib S
Mnmi
fNMS
n
fNyV
−+
−= ∑ ( 9.6.5)
KESIMPULAN 2 Suatu penduga yang unbiased tentang varians di (dalam) hubungan ( 9.6.4) diberi oleh
22221 )1()1()( iwi
in
ib uS
nmiN
fS
n
fyv
−+
−= ∑ (9.6.6)
Di mana 2bS dan dan 2
wiS adalah mempunyai; maksud/arti umum mereka
TEOREMA 9.6.2 Menunjukkan bahwa penduga yang diberi oleh hubungan (9.6.2) bias dan biasnya diberi oleh
MNYMMiB i /)(∑ −−= ( 9.6.7)
Dan sampling varians oleh
22211
)1(1)1()( wi
iN
ib S
mi
f
nNS
n
fyV
−+′−
= ∑ ( 9.6.8)
Di mana ∑ −−
=N
i
ib N
YYS
)1(
)( 22
dan 2wiS adalah seperti biasanya
Bukti Untuk membuktikan 1y adalah suatu penduga yang bias, kita dapat mendapatkan
EyE =)( 1}{ 1∑
n
n
y=
])|.(
[2
1 n
iyEE
n
ii∑
=YY
n
YE N
n
ii
≠=∑
][1
Yang mana menunjukkan 1y adalah suatu penduga yang bias.
Biasnya dapat diperoleh
∑ ∑−−=−=N
i
N
i
iiN MN
YMi
N
YYYB
= ])([1 ∑∑ −−
N
ii
N
ii YMYMi
MN
= ∑ −−N
iiYMMi
MN])([
1
Sampling varians dari penduga diberi oleh
)|()|()( 221121 nyVEnyEVyV +=
+
= ∑∑
n
ii
n
ii iyV
nEY
nV )|(
11.2211
])1(1
[)1(2
221
2
1 mi
Sf
nE
n
Sf wi
n
i
ib ∑ −+
′−=
mi
Sf
nNn
Sf wi
n
i
ib2
22
1
)1(1)1( ∑ −
+′
−=
Bias di penduga 1y nampak dalam kaitan dengan fakta bahwa kemungkinan dari pemilihan
dari ssu’s bertukar-tukar dari satu unit ke lain, di fsu’s, dalam kaitan dengan ukuran berbeda mereka. Jika Mi’S tidak bertukar-tukar dengan sangat dan variabel studi tidaklah dihubungkan dengan Mi. bias tidak boleh besar. Di sini, MSE dari akan terdiri dari tiga komponen: satu dari bias, satu dari variasi di dalam fsu’s dan seseorang timbul dari variasi antar rata-rata dari fsu’s. Nilai-Nilai dari mi’s tidaklah ditetapkan dan suatu pilihan yang sesuai tentang mi dapat sangat menolong di dalam mengendalikan komponen ini.
KESIMPULAN 1 Suatu penduga yang unbiased dari bias diperoleh oleh
B = ∑ −′−−
−−n
ii yyMMi
nMN
N))(([
)1(
)1(1. (9.6.9)
dimana
n
MiM
n
i∑
=′
KESIMPULAN 2 Suatu unbiased estimators dari varians diberi oleh
mi
S
nN
f
n
Sfyv wi
n
i
ib2
22
11
)1()1()( ∑ −
+′
−= (9.6.10)
dimana )1(
)( 2
2
−
−=
∑n
yyS
n
ii
b dan
)1(
)( 2
2
−
−=
∑mi
yy
Swi
mi
jiij
TEOREMA 9.6.3 Menunjukkan bahwa penduga yang dihubungkan oleh ( 9.6.3) adalah bias dan biasnya adalah
−
−=
Y
SSY
NnyBias My
M2
2
11)( ( 9.6.11)
Dan sampling variansnya adalah
mi
S
M
fM
nN
S
NnyV wi
N
i
iib2
222
2
)1(1)
11()( ∑ −
+′
−= ( 9.6.12)
Di mana)1(
)1( 2
2
−
−=
∑NM
M
S
n
i
i
M
)1(
)(1(
−
−−=∑
N
YM
iYMi
M
M
S
n
i
i
yM
)1(
)(
2
22
2
−
−=
∑NM
YYMiSb
n
ii
Dan 2wiS seperti biasa
Bukti: Jika kita mengambil ynM
yMin
i
i =∑ . dan unMMin
i
=∑ kemudian penduga 2y
dapat ditulis penduga perbandingan uy . Menerapkan hubungan (6.3.2) dan (6.4.1.) kita dapat temukan varians dan bias
Benar-Benar 2y adalah perbandingan ke penduga ukuran, di mana pengetahuan dari M
tidaklah perlu. Pada bentuk yang yang serupa, seseorang boleh menggambarkan penduga kemunduran dan bias nya, dan sampling varians dapat diperoleh tanpa kesukaran.
Dengan membandingkan V( 2y ) dan V( y ), seseorang boleh menyimpulkan bahwa istilah
yang kedua di (dalam) hubungan (9.6.12) adalah serupa dengan istilah yang kedua dalam hubungan (9.6.4). Istilah yang pertama bagaimanapun, diharapkan untuk kurang dari bersesuaian istilah di yang sama jika fsu’s szes dan total mereka adalah secara positif dihubungkan dan koefisien korelasi adalah lebih besar dari separuh perbdaningan dari CV’S
mereka. Dengan Cara Yang Sama, jika Mi dan )( YYi − adalah secara positif dihubungkan
dan bias di 1y adalah sepele, kemudian V( 2y ) akan [jadi] lebih besar dari V( 1y ). Secara
umum, jika Mi’S bertukar-tukar dengan sangat, penduga, yang disajikan n adalah danMi yang cukup besar adalah sangat dihubungkan dengan variabel studi. Di panen mensurvei di
(dalam) India, suatu studi yang empiris pada efisiensi yang relatif dari tiga penduga,, y , 1y
, dan 2y telah dibuat ketika diamati bahwa yang sederhana rata-rata mempunyai standar
paling sedikit kesalahan. Hasil yang yang serupa dipertunjukkan di (dalam) contoh 9.2. Mi’S ditemukan untuk bertukar-tukar dengan sangat dari desa ke desa dan bias ditemukan untuk sepele. Penduga telah diamati untuk secara komparatif lebih sedikit efisien
Penduga yang tidak bias untuk varians ( 2) adalah sebagai berikut
v( 2) =
Contoh 9.2 Untuk latihan penelitian memberi makan dan membesarkan domba dan bulunya
di negara Rajashtan, selama tahun 1980-81, desain sampel dua tahap dengan tehsils sebagai
tahap pertama dan desa sebagai tahap kedua yang digunakan dalam metode ini. Data yang
diberikan di bawah ini adalah populasi domba yang tetap di desa yang terpilih dari 4 tehsil
yang terpilih dari 12 tehsil dari divisi Ajmer, data ini dihitung dari survei dengan jumlah
desa di tehsil.
Tehsil
terpilih
Jumlah desa di
setiap tehsil (Mi)
Populasi domba di desa terpilih
Behrar 102 266,890,311,46,174,31,17,186,224,31,162,46,31,
109,275,128,125,267,153,152,84,21,52,10,0,48,9
4,123,87,89,109,0,310,3Bairath 105 129,57,64,11,163,77,278,50,26,127,252,194,350,
0,572,149,275,114,387,53,34,150,224,185,157,24
4,466,203,354,816,242,140,66,590,747,147Ajmer 200 247,622,225,278,181,132,659,403,281,236,595,2
65,431,190,348,232,88,1165,831,120,987,938,19
7,614,187,896,330,485,60,60,1051,651,552,968,9
87Bansur 88 347,362,34,11,133,36,34,61,249,170,112,42,161,
75,68,0,247,186,473,0,143,198,65,0,308,122,345,
0,223,302,219,120,199,35,0,0
Hitunglah rata-rata dari populasi domba di desa Ajmer selama tahun 1980-81, dengan
standard errornya jika =124.
Didapatkan
=124, M1 = 102, M2 = 105, M3 = 200, M4 = 88,
N= 4, m1 = 34, m2 = 36, m3 = 35, m4 =
36,
= 135, = 225, = 471, = 141,
dan
(i) Cara pertama. Penduga yang tidak bias dari rata-rata populasi domba
adalah sebagai berikut
=
Jadi,
=
=
Estimasi dari V( ) adalah
v( ) =
dimana
nilainya,
=
=
dan
=
= =154.87
Jadi,
v( )=
standard error dari = = 94.94
(ii) Cara kedua. Penduga yang lain dari populasi domba adalah
=
=
Varians estimator dari adalah sebgai berikut
v( ) =
dimana
dan
didapatkan
Dan telah dihitung sebelumnya.
Jadi,
v( )
= 4214
standard error dari = =64.92
(iii) Cara Ketiga Kita juga mempunyai yang merupakan estimator dari
rata-rata populasi yaitu
Kita menghitung,
= 0.998
karena itu
begitu juga, estimasi dari V( ) adalah
v( ) =
dimana
maka
= 38401.87
Dan bagian kedua dari varians telah ada di (i).
Jadi v( ) =
= 6555.19
standard error dari adalah =
9.7 Alokasi optimum : unit yang berbeda tahap pertama
Di bagian 9.3, kita telah membicarakan alokasi optimum untuk tahap pertama
jika unit-unitnya mempunyai ukuran yang sama. Fungsi dari biaya dan varians
mempunyai lawan dalam perlakuan peningkatan jumlah n dan m, dan hal itu
penting untuk dipertimbangkan sebelum alokasi optimum dibicarakan lebih
lanjut.
Fungsi Biaya. Di desain penarikan contoh untuk dua tahap, biaya survey dapat
dituliskan sebagai berikut
(9.7.1)
Dimana adalah biaya tidak tetap, adalah biaya rata-rata per fsu, dan
adalah biaya rata-rata per ssu.
Dalam kenyataannya, kelihatan lebih besar dari . Karena itu, peningkatan
jumlah unit (n) meningkatkan biaya yang dapat dibandingkan dengan
peningkatan . Jadi, komponen kedua dari fungsi biaya akan berbeda dari setiap
sampel yang satu dengan sampel yang lainnya untuk jumlah n tertentu dan oleh
karena itu, itu menjadi hal yang penting untuk diketahui dari alokasi optimum
dari jumlah total sampel berdasarkan ssu yang terpilih, jadi rata-rata jumlah
sampel ssu yang terpilih untuk setiap fsu adalah m. Masalah ini telah dibicarakan
oleh Rangarajan (1957) dan Rao (1961). Mereka memberikan metode yang
berbeda dengan dengan m adalah nilai rata-rata atau dengan
adalah konstanta positif. Maka kita mepertimbangkan bahwa biaya rata-rata
dari pembicaraan sebelumnya dapat dituliskan sebagai berikut
(9.7.2)
Fungsi Varians Dari pernyataan varians penarikan contoh yang dibahas pada
bagian sebelumnya, kita dapat berkata bahwa varians total dalam penarikan
contoh dua tahap dapat dituliskan dalam rumus
V( ) (9.7.3)
Dimana adalah konstanta yang independen dari dan , dan dan
fungsi dari populasi parameter yang analog dengan dan , jumlah sampel
yang independen yaitu
dan . Jika , dimana m adalah rata-rata dari jumlah unit yang terpilih
per ssu,
= E( ) dan tergantung dari metode yang menentukan sekelompok nilai dari
, maka hubungan (9.7.3) diambil dari rumus
V( ) (9.7.4)
Peningkatan dari n dan m mebuat perubahan yang signifikan yaitu penurunan
varians. Singh (1958) telah membicarakan perlakuan dari varians dan efisiensi
ketika jumlah dari fsu dan ssu tetap. Petunjuk yang mendasar untuk alokasi
optimum, adalah utnuk meminimalkan varians untuk biaya tetap, efisiensi setiap
unit dari biaya adalah maksimum atau meminimumkan biaya dengan varians
tertentu, biaya per unti adalah minimum untuk suatu nilai efisiensi tertentu. Kita
harus membicarakan kedua kasus di atas.
(a) Jika biaya tetap. Andaikan biaya tetap, katakanlah dan estimator
digunakan. Dengan memproses apa yang kita bicarakan di bagian 9.3 maka
kita mempunyai
(9.7.5)
Dimana (9.7.6)
(9.7.7)
Dengan mensubstitusi nilai dan ke rumus varians maka kita
mendapatkan rumus varians minimum adalah sebagai berikut
(9.7.8)
Andaikan telah ditentukan sebagai penimbang yang proporsional untuk
, jika , dimana adalah konstanta positif dan bisa didapatkan
sebagai
(9.7.9)
Jika ukuran ssu adalah sama, nilai optimum dari m dan n adalah sebagai
berikut
(9.7.10)
(9.7.11)
Rumus di atas dapat dibandingkan dengan nilai yang diberikan dalam
hubungan (9.3.7) dan (9.3.5)
(b) Jika varians ditentukan. Andaikan varians ditentukan oleh suatu nilai
tertentu, katakanlah . Dengan prosedur yang biasa, kita mendapat nilai
yang sama dari sebagai hubungan dari (9.7.5). Selanjutnya, kita
mempunyai rumus sebagai berikut
(9.7.12)
Dengan mensubstitusi nilai dari dan di fungsi biaya, kita
mendapat biaya minimum sebagi berikut
(9.7.13)
Dalam praktik, pengambil sampel akan mempunyai pertimbangan akan faktor
lain seperti adminstratif dan kenyamanan pelayanan di lapangan sebagai
tambahan untuk pendekatan varians-biaya. Dalam survei skala besar,
kegiatan yang ada di lapangan akan selalu mempunyai peran yang
mendominasi dan pengambil sampel akan memutuskan pilihan sesuai
keputusannya sendiri.
9.8 Metode PPS dua tahap
Di bagian pembahasan, teori untuk metode yang memiliki tahap banyak
dengan peluang yang sama dari setiap tahap yang terpilih telah dibicarakan.
Jika fsu adalah besar dan berbeda dalam ukurannya, maka lebih dianjurkan
untuk memakai metode pps, ukuran menjadi ’s. Sistem dari metode ini
terbentuk dari penggunaan peluang yang bervariasi dan metode ini telah
digunakan oleh Hansen dan Hurwitz (1943,1949). Singh (1954)
membandingkan dua estimator dalam desain penarikan contoh dua tahap
dimana fsu dipilih dengan peluang yang bervariasi, tanpa pengembalian, dan
ssu dengan peluang yang sama, dengan pengembalian, dan tanpa
pengembalian. Penduga alternatif disarankan oleh Rao (1966). Metode yang
sederhana dari pendugaan varians telah ditemukan oleh Durbin (1967).
Brewer dan Hanif (1970) telah memperbaiki dan memperluas metode untuk
estimator yang lain.
Andaikan sampel dari n fsu dipilih dengan pps, WR. Dari sampel terpilih
dengan fsu, pilihan dari ssu’s dibuat dengan SRS,WOR. Jika fsu terpilih
lebih dari sekali, kemudian akan timbul kebebasan dari ssu’s yang
disebabkan oleh pengambilan sampel WOR dari fsu yang lengkap setiap saat.
Estimator yang tidak bias dari Y adalah
(9.8.1)
Dimana p adalah peluang untuk memeilih sampel dari fsu dari setiap
pengambilan
, dan
Estimator dari varians sampel adalah sebagai berikut
(9.8.2)
Estimator yang tak bias bagi adalah
(9.8.3)
Yang memberikan prosedur yang baik dari pendugaan, metode apasaja dari
pemilihan yang diambil pada tahap kedua, menyediakan fsu yang dipilih
dengan pengembalian. Jika tertarik dalam menduga varians di dalam populasi
dan antar populasi kemudian komponen antar populasi bisa didapatkan
dengan menggabungkan komponen dalam populasi dengan (9.8.3).
Komponen varians fsu dalam populasi dapat diduga secara tidak bias melalui
(9.8.4)
9.9 Desain tertimbang sendiri
Dalam survei skala besar, estimator didefinisikan dalam rumus (9.8.1)
termasuk pernyataan yang akan bervariasi dari unit yang satu ke unit
yang lain. Dikarenakan kerumitan dari keragaman yang alami, analisis dari
data akan cukup tidak praktis. Dalam situsi ini, teknik sampel tertimbang
sendiri dijelaskan di bagian 3.7.2 akan terbukti sangat berguna. Desainnya
menyediakan timbangan tunggal umum untuk seluruh unit sampel yang
dikenali sebagai desain tertimbang sendiri, dan sering disebut desain
tertimbang yang sama. Desain ini bisa dibuat dengan tahap penduga dimana
tiap unit mempunyai timbangan sendiri-sendiri. Jika pemilihan dari unit
dilakukan untuk membuat seluruh timbangan sama satu sama lain maka
desainnya dinamakan desain tertimbang sendiri pada tahap lapangan.
Contohnya, desain tahap bertingkat bisa dibuat dari tahap desain tertimbang
sendiri dengan pilihan yang tepat dari jumlah unit untuk setiap tahap yang
dipilih dalam tahap penarikan contoh yang terakhir. Jika metode ini dipakai
melalui beberapa penduga pada setiap tahap maka desain ini disebut desain
tertimbang sendiri pada tahap penduga.
Biasanya desain ini dibuat dan dipakai karena faktor-faktor yang berada di
lapangan seperti biaya dan kenyamanan operasional. Contohnya, dalam
survei panen padi, hal itu mungkin akan menjadi sulit dalam membuat
kerangka dari pertumbuhan semua padi yang ada, dimana kerangka dari
setiap desa mungkin mudah didapatkan. Begitu juga susunan dari kerangka
padi tersebut akan menaikkan biaya, menghabiskan tenaga, dan usaha yang
lain, bila faktor-faktor ini minimum dari desa yang terpilih dan lahan yang
terpilih pada setiap desa yang terpilih. Bagaimanapun juga, itu mungkin tidak
selalu merujuk pada desain tersebut karena dalam praktiknya sulit untuk
mempunyai timbangan yang sama untuk seluruh unit sampel. Pada beberapa
kasus, dua atau lebih timbangan digunakan, menyediakan jumlah timbangan
yang umum itu hampir kecil. Kadang-kadang itu menjadi hal yang penting
untuk membuat desain tertimbang sendiri pada tahap pendugaan. Metode
yang bervariasi tersedia untuk tujuan ini. Pada bagian ini, kedua situasi dalam
membuat desain di lapangan dan pada tahap pendugaan dipertimbangkan.
Prosedur dalam membuat desai tertimbang sendiri pada tahap lapangan telah
dipikirkan oleh Hansen (1953) dan Lahiri (1954). Masalah dalam membuat
desain tertimbang sendiri pada tahap pendugaan telah dibicarakan oleh
Murthy dan Sethi (1959,1961). Som (1959) telah memberikan prosedur untuk
membuat desain tertimbang sendiri dua tahap dalam suatu strata dengan
jumlah unit terpilih pada setiap fsu pada tahap terkahir metode adalah sama.
Dalam stratifikasi, kita telah mengetahui bahwa alokasi proporsional
mengacu pada desain sampel yang tertimbang sendiri. Dengan kata lain, jika
bahwa penimbangnya adalah sama untuk setiap unit sehingga (i)tabulasi menjadi lebih mudah, (ii) analisis menjadi lebih mudah, dan (iii) biaya diminimumkan. Keuntungan lain dari desain penimbang sendiri adalah memberikan ukuran sample yang konstan dari setiap fsu terpilih. Jadi, para peneliti tidak bertanggung jawab terhadap hasil yang berbeda dari fsu yang berbeda. Kelemahan sistem ini hanya bahwa beberapa metode menghasilkan estimasi yang bias meskipun, di beberapa kasus, dengan varians yang lebih kecil.
CONTOH 9.3 Untuk mengestimasi total populasi domba di Divisi Ajmer Rajashtan tahun 1980-81, desain survey yang digunakan adalah penarikan sampel dua tahap dengan tehsil
sebagai unit tahap pertama(fsu) dan jumlah desa pada tehsil sebagai unit tahap kedua(ssu). Tehsil diambil dengan pengembalian dan dengan peluang mengacu pada populasi domba(pps) dalam sensus peternakan tahun 1976, dimana desa-desa pada setiap tehsil diambil dengan peluang yang sama serta tanpa pengembalian. Data yang diberikan menunjukkan populasi domba di desa terpilih pada Divisi Ajmer yang merupakan hasil penghitungan survey putaran kedua.
Tehsil Terpilih
No. Desa pada
Tehsil (Mi)
Peluang Tehsil
Terpilih (pi)
Populasi Domba pada Desa Terpilih
Behrar 102 0.008568 266, 174, 224, 66, 109, 267, 21, 48, 87, 890, 31, 31, 102, 275, 153, 52, 94, 89, 311, 17, 108, 46, 128, 152, 10, 123, 109, 46, 186, 128, 39, 126, 84, 0
Bairath 105 0.015079 129, 163, 26, 350, 275, 34, 157, 354, 66, 57, 77, 127, 0, 114, 150, 244, 816, 590, 64, 278, 252, 572, 387, 224, 466, 242, 747, 11, 50, 194, 149, 53, 185, 203, 140, 174
Ajmer 200 0.073556 247, 181, 403, 265, 232, 130, 197, 330, 1051, 622, 987, 281, 431, 88, 987, 614, 485, 651, 225, 132, 236, 190, 1165, 938, 187, 60, 552, 278, 650,595, 348, 831, 968, 895, 60,570
Bansur 88 0.012632 347, 133, 249, 161, 247, 143, 308, 223, 120, 362, 36, 170, 75, 186, 198, 122, 302, 199, 34, 112, 68, 43, 65, 345, 219, 35, 11, 61, 42, 0, 0, 0, 0
Perkirakan total populasi domba pada Divisi Ajmer tahun 1980-81 serta standar error-nya.
Penyelesaiannya adalah sebagai berikut :
No. Tehsil M i pi mi ∑
iij
y ∑j
iji yM pm ii ∑j
ii
iji
pm
yM
1 102 0.008568
34 4592 468384 0.291312
1,607,843.1372
2 105 0.015079
36 8120 852600 0.542844
1,570,616.9728
3 200 0.073556
36 17062 3412400 2.648016
1,288,662.9084
4 88 0.012632
34 5080 447040 0.429488
1,040,867.2652
5,507,290.2836
Sebuah estimasi yang tidak bias terhadap total populasi domba diberikan sebagai
57.1377072
2836.55082904
1
1
ˆ
ˆ
ˆ
=
×=
= ∑∑
Y
Y
pm
yMY
pps
pps
n
i jii
iji
pps
m
n
i
Estimasi terhadap ( )Y ppsV ˆ adalah sebagai berikut
( ) ( )
( ) ( )
( ) 9167.01760340438
0257584488460516779605351234
1
1
1
1
ˆ
ˆ
ˆ
22
=
−×
=
∑ ∑−∑−
=
∑
Y
Y
pm
yM
pm
yMY
pps
pps
n
ipps
v
v
n
i
mi
jii
iji
n
mi
jii
iji
nnv
∴Standar error dari 54.1327799167.01760340438ˆ ==Y pps dan persentase relatif
standar error 61.910057.1377072
54.132779 =×=
9.10 Penarikan Sampel pps Tiga Tahap
Kita telah membahas penarikan sample pps dua tahap pada bagian sebelumnya, yang dapat dikembangkan menjadi tiga tahap atau lebih. Sebuah sample dari nml unit dipilih dalam 3 tahap dengan mengunakan pps, dengan pengembalian, pada setiap tahap. Misalkan sebanyak n fsu terpilih dengan pi menyatakan peluang terpilih untuk fsu ke-i (i=1, … ,N). Dari setiap fsu terpilih sebanyak mi ssu dipilih dengan pij menyatakan peluang terpilih untuk ssu ke-j (j=1, … ,Mi) dan dari setiap ssu terpilih sebanyak l unit tahap ketiga (tsu) dipilih dengan pijk
menyatakan peluang terpilih untuk tsu ke-k dari ssu ke-j pada fsu ke-i p(k=1, …, Lij). yijk
menyatakan nilai dari tsu ke-k pada ssu ke-j dari fsu ke-i (i = 1, …,n; j = 1, …,m; k = 1, …, l) pada sample. Sebuah penduga populasi total Y didefinisikan sebagai
∑∑∑=l
kijk
ijkm
jij
n
i py
ppnmlY
111ˆ
1
(9.10.1)
Dapat ditunjukkan dengan mudah bahwa penduga tersebut tidak bias yaitu
( ) ( ) YYYE EEE == ˆˆ321
Dengan ragam penduga diperoleh dari
( ) ( ) ( ) ( )YYYYV VEEEVEEEV ˆˆˆˆ321321321
++=
Sehingga,
( ) ∑ ∑ ∑∑ ∑∑
−+
−+
−=
N
i i kijiji
N
i iiji
N
ii
M L
ijijk
nml
M
iij
nmi
nYV
i iji
yp
y
ppYpY
pYpY 2
2
2
2
2
2
111111ˆ
(9.10.2)
Sebuah penduga tidak bias ( )YV ˆ diberikan oleh
( ) ( )
−⋅−
= ∑n
i ninnYv Yy
ˆ 22
1
1ˆ (9.10.3)
Dimana ∑ ∑
=
⋅
m
j
l
ki j k
i j k
i ji
i py
ppy 11
Harus diingat bahwa, seperti pada penarikan sample dua tahap, fungsi ragam penarikan sample pada penarikan sample tiga tahap juga dapat ditulis sebagai
( )nmlnmn
YV AAA 321ˆ ++=
Demikian juga, fungsi biaya dapat ditulis dalam bentuk
ccc nm lnmnaC321
+++= (9.10.4)
Dimana a adalah biaya tambahan dan c1, c2 serta c3 seperti pengertian biasanya.
(i) Jika biaya survey tetap, katakan C0, maka nilai optimum dari n, m,dan l diberikan sebagai
( ) ( )( ) ( ) ( )
++
−=
=
=
cAcAcAcAc
n
cA
cAm
cA
cAl
aopt
opt
opt
331211
11
21
12
32
23
212121
21
0
21
21
(9.10.5)
Dengan mensubstitusi nilai-nilai l, m dan n, kita memperoleh ragam minimum sebagai
( ) ( ) ( ) ( ){ }( )a
Yc
cAcAcAV −
=++
0
2
m in33
2122
2111
21ˆ (9.10.6)
(ii) Jika ragamnya ditentukan, katakan V0, nilai-nilai optimum n, m dan l diberikan sebagai
( ) ( ) ( )( )
++=
=
=
AcVcAcAcA
n
cA
cAm
cA
cAl
o
opt
opt
opt
11
332211
21
12
32
23
21
212121
21
21
(9.10.7)
Dengan mensubstitusi nilai-nilai l, m dan n, kita memperoleh biaya minimum sebagai
( )cAcAcAVaC
3322111 2
0
+++= (9.10.8)
Kumpulan Soal
9.1 Definisikan penarikan sample multi-tahap dan tuliskan kegunaannya dibandingkan skema penarikan sample lainnya. Tuliskan penduga tidak bias dari total populasi dan tentukan ragam penarikan sampelnya.
9.2 Apakah yang dimaksud dengan penarikan sample multi-tahap? Berikan persamaan penduga ragam dari total populasi untuk desain penarikan sample tiga tahap yang sesuai saat setiap unit memiliki ukuran yang berbeda pada setiap tahap penarikan sample. Berikan struktur analisis ragam pada penarikan sample tiga tahap dan jelaskan bagaimana analisis tersebut dapat digunakan dalam merencanakan survey selanjutnya.
9.3 Misalkan sebanyak n fsu dipilih dengan pps, dengan pengembalian, dan, dari setiap fsu terpilih, dipilih sebanyak m ssu dengan penarikan sample acak sederhana, tanpa pengembalian. Berikan penduga tidak bias dari total populasi Y dan tentukan penduga tidak bias dari ragam penarikan sample dari penduga tersebut.
9.4 Jika f1 dan f2 adalah fsu penarikan sample dua tahap yang sama dengan ukuran fsu yang sama dan fungsi biaya adalah linear, tunjukkan bahwa m = 2 menghasilkan nilai
( )YV yang lebih kecil daripada m = 1 jika
SS
cc
w
b2
2
1 2>
9.5 Jika ρ adalah koefisien korelasi antara ssu pada fsu yang sama, buktikan bahwa
( )
S
SS
w
wb
MNN
2
22
1
1
−−
=− ρρ
9.6 Sebuah populasi memiliki N fsu, masing-masing memiliki M ssu. Untuk mengestimasi proporsi P dari unit yang memiliki sifat tertentu , sebanyak n fsu dipilih dengan penarikan sample acak sederhana, tanpa pengembalian, dan dari setiap fsu terplih sebanyak m ssu dipilih dengan penarikan sample acak sederhana, tanpa pengembalian. Jika pi menyatakan proporsi sifat pada fsu terpilih ke-i, tunjukkan
bahwa ∑=n
ii
nP pˆ merupakan penduga yang tidak bias dari proporsi populasi P.
Tentukan ragam dari penduga tersebut dan tunjukkan bahwa penduga tidak bias dari ( )PV ˆ adalah
( ) ( ) ( )( ) ( ) ( )
( )∑∑−
−
−−+
−−=
n
i
iin
i mNnnniPv
ppf
Ppf
1
11
11ˆ
2
2
1
ˆ
Dimana f1 dan f2 pada pengertian seperti biasanya.
9.7 Pada sebuah survey pendahuluan dengan desain penarikan sample dua tahap, sebanyak m ssu dipilih dari setiap n fsu. Perkirakan ( )yV , saat sample fsu lainnya diambil dari n dan dari setiap fsu terpilih, diadakan pemilihan ssu sebanyak m. Tunjukkan bahwa penduga tidak bias dari ( )yV adalah
( ) ( ) ( )nm
m
nyv Sfff
mSf wb
2
211'
2
1111
−−−+−=
Dimana S b
2 dan S w
2 diperoleh dari sample pendahuluan.
9.8 Definisikan desain penimbang sendiri dan diskusikan keulebihan dan kelemahannya secara singkat. Tunjukkan bahwa sebuah desain dua tahap, dimana sebanyak n desa dipilih dengan peluang mengacu kepada jumlah rumah tangga yang dimilikinya, pada tahap pertama, dan sebanyak m rumah tangga dipilih dengan peluang yang sama tanpa pengembalian pada tahap kedua, dari setiap desa terpilih, merupakan penimbang sendiri. Tentukan penduga tidak bias dari ragam penduga penimbang sendiri.
9.9 Sebuah populasi dibagi ke dalam k lapisan dengan Mi merupakan fsu pada lapisan ke-i (i = 1, …, k). Setiap fsu memiliki sebanyak N ssu. Sebuah sample acak dari m fsu dipilih sari setiap lapisan dan sebuah sample acak dari n ssu diambil untuk penelitian pada setiap fsu terpilih. Bagaimana cara Anda untuk memperoleh sebuah perkiraan yang tidak bias dari populasi total karakteristik sample? Tentukan sebuah rumusan untuk menduga perbedaan antara ragam perkiraan total penarikan sample dengan ragam penduga tidak bias linear dari populasi yang sama yang mugkin dapat diperoleh dari sebuah sample acak yang tidak berlapis dari fsu sebanyak km dengan sebanyak n ssu diambil untuk penelitian pada masing-masing fsu.
9.10 Sebuah sample dengan fsu sebanyk n dipilih dengan penarikan sample acak sederhana , tanpe pengembalian, dan dari setiap fsu terpilih diambil sebuah fraksi tetap ssu yaitu f2. Jika ri dari mi ssu pada fsu ke-i menyatakan sebuah sifat, tunjukkan bahwa penduga
rasio pada ukuran ( )∑∑= mr iip menduga proporsi populasi sifat tsb dan
perkiraan ragamnya adalah
( )( ) ( ) ( ) ( )∑∑
−−
−
−+
−
−=
n
iii
i
iin
ii pp
mmM
nffpp
MM
fMmn
i
npv 1
1
1
1
12
21
2
2
21
Dimana
mrp
i
i
i=
(Cochran, 1977)
9.11 Pada penarikan contoh dua tahap, sebanyak n fsu dipilih dengan metode peluang mengacu pada ukuran(pps), dengan pengembalian, dan dari fsu terpilih ke-i dengan Mi unit, sebanyak mi ssu dipilih dengan penarikan sample acak sederhana, dengan
pengembalian. Untuk memperkirakan populasi total Y, urutan sub-penarikan sample mi ditetapkan sebagai (i) nilai harapan dari mi, ditentukan pada m, atau (ii) jumlah sample ssu ditentukan sebagai m0. Tentukan nilai optimum mi pada kedua kasus tsb sehingga ragam penduganya minimum. Serta bandingkan ragam minimum keduanya.
(Rangarajan, 1957)
9.12 Pada penarikan sample dua tahap, sebanyak n fsu dipilih dengan metode pps, dengan pengembalian. Jika fsu ke-i muncul sebanyak ri kali dalam sample, salah satu prosedur berikut dapat digunakan untuk penarikan sample tahap kedua :(i) ri mi ssu dipilih dengan penarikan sample acak sederhana, tanpa pengembalian;(ii) diambil ri sample mi ssu saling bebas( diperoleh dengan penarikan sample
acak sederhana, tanpa pengembalian); dan(iii) Sebanyak mi unit dipilih tanpa pengembalian dan observasi ditimbang oleh ri.Tentukan penduga tidak bias dari populasi total Y dan ragam penarikan samplenya untuk semua kasus tsb. Jika V1 ,V2 dan V3 adalah ragam penduga, tunjukkan bahwa, untuk ukuran sample harapan yang sama,
VVV 321≤≤ (Rao, 1961)
9.13 Pada penarikan sample dua tahap, sebanyak n fsu ipilih dengan pps, tanpa pengembalian. Dari setiap sample fsu, sebanyak m ssu dipilih dengan penarikan sample acak sederhana, tanpa pengembalian. Perkirakan sebuah penduga tidak bias
untuk populasi total. Sebuah penduga untuk populasi total adalah ∑=N
iiiYY ˆˆ β
dimana Y iˆ merupakan penduga tidak bias dari fsu ke-i dan β
i merupakan
bilangan riil, telah ditentukan sebelumnya untuk setiap sample dengan batasan bahwa
βi adalah 0 jika fsu ke-i tidak temasuk dalam sample. Tunjukkan bahwa
penduganya tidak bias. Tentukan penduga tidak bias bagi ragamnya.(Des Raj, 1966)
9.14 Berikut ini diberikan skema penarikan sample untuk meperkirakan rata-rata populasi sebuah karakteristik :(i) Populasi dibagi menjadi N kluster masing-masing sebanyak M unit serta dengan menerapkan penarikan sample dua tahap dipilih sebanyak n kluster dan m unit dari setiap kluster terpilih dengan penarikan sample acak sederhana, dengan pengembalian, (ii) Populasi dibagi ke dalam kluster dengan masing-masing m unit dan sample dari kluster dipilih dengan penarikan sample acak sederhana, dengan pengembalian.Tunjukkan bahwa, pada kedua kasus tsb rata-rata sample merupakan penduga tidak bias bagi rata-rata populasi dan tentukan ragam bagi kedua kasus tsb. Tunjukkan bahwa efisiensi dari kedua skema ini akan sama saat nm=n’m’.
(Singh. D. ,1956)
9.15 Dalam sebuah survey sample untuk memperkirakan jumlah standar kertas dalam sebuah tehsil dengan 72 desa, sample yang terdiri dari 12 desa dipilih dengan metode penarikan sample acak sederhana, tanpa pengembalian, dan dari setiap desa terpilih sebanyak 5 kluster yang masing-masing terdiri dari 20 lahan dipilih dengan metode penaarikan sample acak sederhana, tanpa pengembalian. Berikut diberikan data kluster pada desa sample dan data jumlah standar pada kluster sample:
Desa Sampel Jumlah KlusterJumlah Standar pada kluster sample
1 2 3 4 5
1 27 430 402 363 975 389
2 24 586 1234 100 368 344
3 14 1164 546 3060 1724 1274
4 116 693 218 836 1218 575
5 25 191 270 4502 4184 243
6 118 1036 1333 1179 728 1957
7 147 1555 254 950 382 355
8 36 910 452 129 122 243
9 91 340 0 92 28 340
10 171 57 59 0 0 21
11 86 159 45 242 1075 539
12 88 84 462 147 16 10
Tentukan penduga tidak bias bagi jumlah standar total pada tehsil dan tentukan standar errornya.
9.16 Wol mentah terdiri dari berbagai jenis lemak, kotoran dan lainnya, kualitasnya diukur dari persentase berat wol bersih, yaitu isi bersihnya. Untuk memperkirakan isi bersih, digunakan sebuah mesin penarik inti elektris yang menarik inti sekitar 1/4pon per bal, yang kemudian diberikan pada laboratoriu analisis. Dalam sebuah percobaan , sebanyak 6 bal diambil dari tumpukan besar dengan peluang yang sama dan dari setiap bal diambil 4 core secara acak dan kemudian isi bersihnya ditentukan. Hasil percobaan ini adalah sebagai beikut :
Core Sampel Bal
1 2 3 4 5 6
1 54.3 57.0 54.6 54.9 59.9 57.8
2 56.2 58.7 57.5 60.1 57.8 59.7
3 58.9 58.2 59.3 58.7 60.9 59.6
4 55.5 57.1 57.5 55.6 57.5 58.1
(i) Perkirakan rata-rata isi bersih wol dalam tumpukan tsb dan tentukan perkiraan untuk standar errornya.(ii) Tentukan efisiensi dari penarikan sample 12 bal dan 2 inti pada setiap bal serta bandingkan dengan skema di atas.
9.17 Untuk memperkirakan total panen padi di suatu wilayah, digunakan penarikan sample dua tahap berlapis dimana dari setiap lapisan dipilih 4 desa, dengan pps, dengan pengembalian, dan area geografis sebagai ukurannya. Empat bidang lahan diambil dari setiap desa sample dengan sirkuler, secara sistematik, untuk menyatakan panen padi. Berikut diberikan data panen padi untuk bidang sample :
Lapisan Desa SampelInvers
PeluangJumlah Bidang
Panen Padi (kg)
1 2 3 4
1 1 440,21 28104
182
148
87
2 660.43 84108
64132
156
3 31.50 240100
115
50 172
4 113.38 76346
350
157
119
2 1 21.00 256124
111
135
216
2 16.80 288123
177
106
138
3 24.76 222264
78144
55
4 49.09 69300
114
68 111
3 1 67.68 189110
281
120
114
2 339.14 42 80 61118
124
3 100.0 134121
212
174
106
4 68.07 161243
116
314
129
Perkirakan total panen padi dan tentukan penduga standar errornya.
9.18 Sebuah survey panen potong di suatu wilayah menggunakan metode penarikan sample acak multi tahap berlapis, pada jumlah panen rami, untuk memperkirakan rata-rata berat rami hijau untuk wilayah tsb, dengan tiga sub-divisi administratif pada setiap strata. Pada setiap sub-divisi administatif, sejumlah desa dipilih secara acak. Tiga lahan rami dipilih secara acak dari total lahan rami di desa tsb. Pada setiap lahan, dibuat bidang seluas 1/60 acre, baik rami yang telah dipanen maupun yang masih hijau dicatat dalam kg. Berikut adalah datanya:
Sub-DivisiTotal Area Rami dalam
acrePanen Rami Hijau dalam kg per Bidang untuk
desa dan Lahan Terpilih
1 5089 86, 85, 57, 81, 71, 92, 72, 37, 51, 81, 50, 43, 78, 71, 79
2 4133 86, 45, 81, 55, 56, 55, 91, 70, 64, 19, 62, 41
3 3007 81, 8, 43, 67, 48, 47, 35, 34, 37
Perkirakan rata-rata berat panen rami dalam kg per acre untuk wilayah tsb dan hitunglah standar errornya.
DAFTAR PUSTAKA
Brewer, K.W.R. and M. Hanif, “Durbins’ new multi-stage variance estimator,” J.R. Statist. Soc., 32B, 302-311, (1970)
Cochran, W.G., “The use of analysis of variance in enumeration by sampling,” J. Amer Statist. Assoc., 34, 492-510, (1939)
---Sampling Techniques, Third Edition, Jhon Wiley and Sons, NewYork, (1977)
Des Raj, “Some remarks on a simple procedure of sampling without replacement,” J. Amer. Statist. Assoc., 61, 391-397, (1966)
Durbin, J., “Some results in sampling theory when the units ares selected with unequal probabilities,” J.R. Statist. Soc., 15B, 262-269, (1953)
---“Design of multi-stage surveys for the estimaton of sampling errors,” Applied Statistics, 16, 152-164, (1967)
Ganguli, M., “A note on nested sampling,” Sankhya, 5, 449-452, (1941)
Hansen, M.H. and W.N. Hurwitz, “On the theory of sampling from finite populations,” Ann. Math. Statist., 14, 333-362, (1943)
---“On the determination of optimum probabilities in sampling, ” Ann. Math. Statist.,20, 426-432, (1949)
---and W.G. Madow, Sample Survey Methods and Theory, Vol. I, Jhon Wiley and Sons, New York, (1953)
Lahiri, D.N., ”Technical paper on some aspects of the development of the sample design,” Sankhya, 14, 332-362, (1954)
Mahalanobis, P.C., Report on the Sample Census of Jute in Bengal, Ind. Central Jute Committee, (1940)
Murthy, M.N. and V.K. Sethi, “Self-weighting design at tabulation stage,” National Sample Survey Working Paper, No. 5 (1959); (also Sankhya, 27B, 201-210, (1959))
---“Randomized rounded off multipliers,” J. Amer. Statist. Assoc., 56, 328-334, (1961)
Rangarajan, R., “A note o two-stage sampling,” Sankhya, 17, 373-376, (1957)
Rao, J.N.K., “On sampling with varying probabilities in sub-sampling designs,” J. Ind. Soc. Agr. Statis., 13, 211-217, (1961)
---“Alternative estimators in pps sampling for multiple characteristics,” Sankhya, 23A, 47-60, (1966)
---“Unbiased variance estimation for multi-stage designs,” Sankhya, 32A, (1975)
Roy, J., “A note on estimation of variance components in multi-stage sampling with varying probabilities,” Sankhya, 17, 367-372, (1957)
Singh, D., “The sampling with varying probabilities without replacement,” J. Ind. Soc. Agr. Statist., 6, 48-57, (1954)
---“On efficiency of cluster sampling,” J. Ind. Soc. Agr. Statist., 8, 44-55, (1956)
---“Estimates of variance components in finite populatons,” J. Ind. Soc. Agr. Statist., 10, 1-15, (1958)
Som, R.K., “Self-weignting sample design with an equal number of ultimate stage units in each of the selected penultimate stage units,” Bull. Cal. Statist. Assoc., 8, 59-66, (1959)
Sukhatme, P.V., “Efficiency of sub-sampling designs in yield surveys,” J. Ind. Soc. Agr. Statist., 2, 212-228, (1950)