Multi Stage SampLing

PENARIKAN SAMPEL BANYAK TAHAP

9.1 PROSEDUR SAMPLING

Di dalam bab 8, kita sudah membahas penarikan sampel berkelompok di mana kelompok dipertimbangkan sebagai unit sampling dan semua elemen dalam kelompok yang terpilih disebut satu per satu secara lengkap. Telah disebutkan bahwa penarikan sampel berkelompok itu, hemat dalam keadaan tertentu tetapi metode ini membatasi penyebaran dari sampel populasi yang hasilnya biasanya meningkatkan pendugaan terhadap varians. Oleh karena itu, wajar mengharapkan efisiensi dari estimator akan meningkat dengan cara pendistribusian elemen dalam jumlah besar dari kelompok dan hanya suatu contoh unit pada setiap kelompok terpilih sebagai wakil dengan menyebut satu per satu semua elemen sampel dari kelompok. Penarikan sampel jenis ini, yang terdiri dari pertama, pemilihan kelompok dan kemudian pemilihan secara spesifik beberapa elemen dari setiap kelompok terpilih yang dikenal sebagai sub-sampling atau teknik penarikan sampel dua tahap. Dalam desain sampling, kelompok yang terbentuk dari pemilihan unit sampling pertama disebut unit-unit pada tahap pertama atau unit-unit pada sampel utama dan elemen dalam kelompok disebut unit-unit pada tahap pertama. Prosedur ini dapat disamaratakan untuk tiga tahapan atau lebih dan dimasukkan dalam penarikan sampel banyak tahap. Sebagai contoh, dalam menyurvei panen untuk memperkirakan hasil dari panen di suatu daerah, suatu blok mungkin dipertimbangkan sebagai suatu unit sampel utama, desa/kampung sebagai unit sampel dalam langkah yang kedua, area panen sebagai unit sampel pada langkah yang ketiga, dan suatu plot dari ukuran yang tetap dari unit sampling yang terakhir.

Penarikan sampel banyak tahap telah ditemukan untuk menjadi hal yang sangat bermanfaat dalam hal praktik dan prosedur ini biasanya digunakan dalam survei berskala besar. Mahalonobis (1940) telah menggunakan prosedur ini dalam survei panen dan Ganguli memasukkan multi-stage sampling (penarikan sampel banyak tahap) ini dalam penarikan sampel bersarang. Chocran (1939), Hansen dan Hurwitz (1934), Sukhatme (1953), dan Lahiri (1954) sudah membahas penggunaannya dalam bidang pertanian dan survei populasi. Roy (1957) dan Singh (1958) telah mempertimbangkan komponen penduga varians untuk desain sampling. Prosedur penarikan sampel banyak tahap menjadi kombinasi yang lebih baik dari penarikan sampel acak danpenarikan sampel berkelompok. Itu diharapkan menjadi (i) kurang efisien dibanding penarikan sampel acak satu tahap dan lebih efisien dibanding penarikan sampel banyak tahap dari sudut pandang variabilitas sampling, dan (ii) lebih efisien dibanding penarikan sampel acak satu tahap dan kurang efisien dibanding

pengelompokan dari sudut pandang biaya dan operasional. Keuntungan utama dari prosedur sampling ini adalah bahwa pada langkah yang pertama, kerangka dari unit-unit pada tahap pertama diperlukan agar bisa disiapkan dengan mudah. Pada langkah yang kedua, kerangka dari unit-unit pada tahap kedua diperlukan hanya untuk yang terpilih unit-unit pada tahap pertama dan seterusnya. Desain ini menjadi lebih fleksibel, yaitu seperti memperbolehkan penggunaan prosedur penarikan sampel yang berbeda dalam tahapan yang berbeda. Itu juga bisa dikatakan bahwa penarikan sampel banyak tahap itu mungkin hanya satu-satunya pilihan dalam sejumlah situasi praktis di mana suatu kerangka sampel yang lengkap dari unit pada tahapan terakhir tidak tersedia dan membutuhkan biaya besar untuk memperoleh kerangka seperti itu.

9.2 PENARIKAN SAMPEL DUA TAHAP DENGAN UKURAN UNIT SAMA PADA TAHAP PERTAMA: MEMPERKIRAKAN RATA-RATA DAN VARIANS POPULASI

Karena, pada penarikan sampel dua tahap, unit-unit dipilih pada tiap tahapan dengan mempertimbangkan struktur peluang pada tiap tahap, prosedur pemilihan pada kedua tahapan adalah mempertimbangkan pada turunan dari nilai harapan dan varian dari penduga berdasarkan pada jumlah observasi yang diambil pada sampel dari unit-unit pada tahap kedua. untuk mendapatkan nilai harapan dan varian sampel dari estimator berdasarkan pada unit-unit yang dipilih dengan memperhatikan asas randomisasi pada tahap dua, kita mungkin mengikuti hasil yang diberikan pada Teorema 1.3.7 dan 1.3.8 yang dirangkum di bawah ini.

( ) ( )tEEtE 21= (9.2.1)

( ) ( ) ( )tVEtEVtV 2121 += (9.2.2)

dimana E1 dan V1 adalah ekspektasi dan varian dari tahap pertama dan E2 dan V2 adalah ekspektasi bersyarat dan varian dari tahap kedua untuk sampel dari unit-unit pada tahap pertama .

Mari kita asumsikan bahwa populasi terdiri dari NM elemen yang dikelompokkan pada N unit-unit tahap kedua dari tiap M pada unit-unit tahap kedua. maka n menjadi nomor unit-unit pada tahap pertama pada sampel dan m adalah nomor unit-unit pada tahap kedua yang terpilih dari setiap unit sampel tahap pertama. Kita juga mengasumsikan bahwa unit-unit pada tiap tahap dipilih denga peluang yang sama. Di bawah ini adalah notasi yang digunakan :

==∑

M

yiY

M

iij Rata-rata setiap elemen pada unit-unit tahap pertama

==∑

N

YY

N

i

i Rata-rata setiap elemen populasi

( )( ) =

−

−=

∑)1

2

2

N

YYS

N

i

i

b

varian sebenarnya antara rata-rata unit pada tahap pertama

( )=

−

−=

∑∑)1(

2

2

MN

YyS

N

i

M

i

iij

w

varian sebenarnya antara unit-unit dengan rata-rata pada

tahap pertama

==∑

m

y

y

m

jij

i

rata-rata sampel tiap unit-unit pada tahap kedua dalam uni-unit pada

tahap pertama

==∑

n

yy

n

ij rata-rata semua sampel tiap elemen

Teorema 9.2.1

Jika n adalah dari setiap fsu adalah dipilih dengan metode simple random sampling, wor, y adalah unbiased estimator bagi Y dengan varian sampel

( ) ( )mn

S

M

mM

n

S

N

nNyV wb

22)( −+−= (9.9.3)

Pembuktian : Menggunakan persamaan (9.2.1) untuk mendapatkan ekspektasi, maka

( ) ( ) ( ) YYEiyEEyE ij === 1121 /

Itu menunjukkan bahwa rata-rata semua elemen sampel adalah unbiased estimator bagi rata-rata populasi.

Untuk memperoleh estimasi dari varians, dengan menghubungkan pada (9.2.2), kita punya

( ) ( )[ ] ( )[ ]iyVEiyEVyV // 2121 +=

( )

−+= ∑

n

iii S

MmnEYV 2

211

111

( ) ( )n

S

mM

mMS

nN

nN wb

22 −+−=

Dimana ∑=N

iiw S

NS 22 1

Jika f1 = n/N dan f2 = m/M adalah fraksi sampel pada tahap pertama dan kedua, hasilnya bisa dituliskan sebagai

( ) ( ) ( ) 2221 11wb S

nm

fS

n

fyV

−+

−= (9.2.4)

Varians ditunjukkan pada persamaan (9.2.3) pada penarikan sampel dua tahap terdiri dari dua komponen. Komponen satu berasal dari variabilitas dari unit-unit pada tahap kedua di dalam unit-unit pada tahap kedua dan kedua muncul dari varian unit-unit pada tahap pertama. Jika pemilihan unit-unit pada tahap satu disebutkan satu per satu secara lengkap atau, dengan kata lain m = M, varian dari rata-rata sampel akan diberikan hanya oleh komponen pertama dan kondisi ini telah dibahas pada bab 8. jika n = N atau dengan kata lain setiap unit-unit pada sampel pertama dalam populasi terlibat dalam sampel, kemudian untuk metode stratifikasi dengan unit-unit pada sampel pertama sebagai strata terdiri dari dua komponen, dan teknik penarikan sampel acak sederhana dari m unit-unit sampel pada tahap kedua di peroleh dari tiap strata

Kesimpulan 1 Berdasarkan teorema 9.2.1, penduga tak bias dari ( )yV adalah

( ) ( ) ( ) 2221 11wb s

nm

fs

n

fyv

−+

−= (9.2.5)

Dimana( )( )1

2

2

−

−=

∑n

yys

n

ii

b

( )( )1

2

2

−

−=

∑∑mn

yy

s

n

i

m

jiij

b

Kesimpulan 2 Tunjukkan bahwa unbiased estimator dari 2bS adalah

( ) 2222 1ˆwbb s

m

fsS

−−= (9.2.6)

Kesimpulan 3 Jika n fsu’s dipilih secara acak dengan pengembalian (pemulihan) dan m ssu’s dari setiap unit terpilih, dipilih dengan penarikan sampel acak sederhana, wor, y adalah unbiased estimator dari Y dengan varians sampel

( ) ( )mn

Sf

n

SyV wb

2

2

2

1−+= (9.2.7)

Kesimpulan 4 Jika n fsu’s dipilih secara acak, wor, dan m ssu’s dari setiap pemilihan unit dipilih secara random, wr, y adalah unbiased estimator Y dari dengan varians

( ) ( )mn

S

n

SfyV wb

22

11 +−= (9.2.8)

Kesimpulan 5 Jika n fsu’s dan m ssu’s dari setiap pemilihan unit dipilih dengan penarikan sampel acak sederhana, wor, y adalah unbiased estimator Y dari dengan varians

( )mn

S

n

SyV wb

22

+= (9.2.9)

Kesimpulan 6 Jika n fsu’s dan m ssu’s dari setiap pemilihan unit dipilih dengan penarikan sampel acak sederhana, wor, estimator

∑=n

i

i

n

yNMY (9.2.10)

Adalah penduga tak bias dari total populsi Y dan varian sampel adalah

( ) ( )mn

SMN

n

SfMNyV wb

222

2

122 1 +−= (9.2.11)

9.3 ALOKASI OPTIMUM : UNIT-UNIT BERUKURAN SAMA PADA TAHAP PERTAMA

Efisiensi dari penarikan sampel dua tahap sangat tergantung pada nilai m dan n, ini wajar untuk memperoleh nilai optimal m dan n dalam praktiknya. Pada desain penarikan sampel dua tahap, fungsi biaya dari sampel pada survey bisa dituliskan sebagai

21 nmcncaC ++= (9.3.1)

Dimana a adalah biaya umum, 1c adalah biaya yang melibatkan fsu pada sampel dan

2c adalah biaya yang melibatkan ssu pada sampel.

Dalam prakteknya, 1c nampaknya akan lebih besar dibandingkan 2c . Oleh karena

itu, meningkatnya n akan meningkatkan biaya yang lebih besar dari meningkatnya unit m. Mari kita juga mempertimbangkan varian sampel dari penduga. Kita menemukan bahwa varian total pada penarikan sampel dua tahap terdiri dari dua bagian (1) varian antara unit-unit pada tahap pertama dan (2) varians di dalam unit-unit pada tahap pertama. Pada kenyataannya, pendugaan dari varian sampel, pada desain dua tahap, bisa dituliskan sebagai

++=

m

AA

nAV o

21

1(9.3.2)

Dimana ,N

SA

nb

o = ,2

21 M

SSA w

b −= 22 wSA =

Itu dapat dilihat bahwa komponen perbedaan dalam kaitan dengan pengurangan unit-unit pada tahap pertama dengan suatu peningkatan n hanya ketika perbedaan komponen karena pengurangan unit-unit pada tahap kedua dengan meningkatkan n dan m.

Jadi, fungsi biaya dan varian berlawanan arah untuk meningkatkan n dan m, supaya efisiensi tiap unit dari biaya menjadi maksimum atau biaya tiap unit minimum untuk nilai tertentu dari efisiensi.

(a) Jika Biaya Tetap Asumsi bahwa biaya C adalah tetap, katakan Co. Menggunakan metode faktor pengali Lagrange, fungsi yang terbentuk adalah

( ) ( ) ( )021,, CnmcncayVmnL −+++= λλ (9.3.3)

Menurunkan L terhadap n dan m, menyamakan turunan parsial dengan nol dan mengeliminasi λ , kita mendapatkan

( )[ ] 2

122

21

212

1

21

12

/

/

MSS

ccS

cA

cAm

wb

wo p t

−=

= (9.3.4)

Substitusikan nilai dari m pada persamaan (9.3.1), kita memperoleh nilai optimum dari n sebagai

( ) ( )( ) ( ) 2

1

222

1

11

21

11 /

cAcA

cAaCn oo p t

+−= (9.3.5)

Substitusikan nilai dari optm dan optn pada persamaan untuk varian, kita

mendapatkan varian minimum, yaitu

( ) [ ]( )aC

cAcAAyV

oo −

++= 2211

min (9.3.6)

(b) Jika Varians Tetap Misalkan varians V dari penduga pada penarikan sampel dua tahap tetap, katakana Vo. kemudian, nilai dari n dan m, dengan meminimumkan biaya diberikan oleh metode factor pengali Lagrange. Aplikasikan metode yang sama di (a) di atas, kita akan mendapatkan

21

21

12

=

cA

cAmopt

Substitusikan nilai dari m ke persamaan (9.3.2), kita nakan mendapatkan nilai optimum dari n yaitu

1

12211

c

A

AV

cAcAn

ooopt −

+= (9.3.7)

Substitusikan nilai dari optm dan optn pada persamaan biaya, kita akan

mendapatkan biaya minimum yaitu

[ ]0

2

2211

AV

cAcAaC

o −+

+= (9.3.8)

Contoh 9.1 Pada suatu percobaan, ada 100 lahan yang disebar benih gandum. Tiap lahan dibagi menjadi 16 bidang dengan ukuran yang sama (1/16 hektar). Dari 100 lahan, dipilih 10 dengan teknik penarikan sampel acak sederhana, wor. Dari tiap lahan yang terpilih, 4 plot dipilih secara acak, wor. Lahan dalam kg/bidang diberikan di bawah ini :

Selected Plots

Field 1 2 3 4

1 4.32 4.84 3.96 4.04

2 4.16 4.36 3.50 5.00

3 3.06 4.24 4.76 3.12

4 4.00 4.84 4.32 3.72

5 4.12 4.68 3.46 4.02

6 4.08 3.96 3.42 3.08

7 5.16 4.24 4.96 3.84

8 4.40 4.72 4.04 3.98

9 4.20 4.66 3.64 5.00

10 4.28 4.36 3.00 3.52

(i) Perkirakan rata-rata gandum per hektar dalam percobaan beserta kesalahan bakunya (standard error).

(ii) Bagaimana perkiraan bisa diperoleh dari penarikan sampel acak dari 40 bidang yang dibandingkan dengan perkiraan yang diperoleh pada (i)?

(iii) Tentukan n dan m optimum dengan fungsi biaya nmn += 4100

Diberikan, N = 100, M = 16, n =10, dan m = 4

Perhitungan yang diperoleh ditunjukkan di bawah ini:

S. N.

(1) (2) (3) (4) (5) (6) (7)

1 17.16 4.290 0.0267 74.091 18.404 0.475

2 17.02 4.255 0.0165 73.565 18.105 1.145

3 15.18 3.795 0.4469 59.733 14.402 2.125

4 16.88 4.220 0.0087 71.925 71.808 0.694

5 16.28 4.070 0.0143 67.009 16.545 0.749

6 14.54 3.635 0.2586 53.511 13.213 0.659

7 18.20 4.550 0.1794 83.950 20.703 1.138

∑4

iijy

ijy ( ) 2yyij − ∑=

4

1

2

j

ijy ijy 2

−∑

422

j

ijij ymy

8 17.14 4.285 0.0251 73.800 17.361 0.356

9 17.50 4.375 0.0618 77.605 19.141 1.041

10 15.16 3.790 0.4402 58.718 14.364 1.262

Total 41.265 1.478 693.908 9.644

(i) Pendugaan dari rata-rata lahan gandum, dengan rumus umum, adalah

1265.410

265.411 === ∑n

iiy

ny

Pendugaan dari varians y adalah

( ) 22 111|

11wb s

Mmns

Nnyv

−+

−=

Menghitung nilai 2bs , kita mendapatkan

( ) 1642.09

4782.1

1

12

1

2 ==−−

= ∑n

ib yyn

s

dan,

( ) ( ) 3215.030

644.9

1

12

2 ==−−

= ∑∑n

i

m

jiijb yy

mns

Oleh karena itu,

( ) 0145.03215.016

1

4

1

100

11642.0

100

1

10

1 =

−+

−=yv

Dan kesalahan baku (standard error) dari y = 120.00145.0 =

(ii) Pada penarikan sampel acak sederhana, estimasi dari varians diperoleh

( ) 211s

NMnmyvran

−=

Perkiraan dari 2S , menggunakan desain sampel dua tahap, bisa dituliskan sebagai,

( ) ( ) ( ) ( )

−−−−+−

−= 222 1

111

1wb s

m

NmMMNsNM

NMs

−+

−= 3215.0

4

1299151001642.09916

11600

1 xxxx

= 4045.0

Jadi, ( ) 0099.04045.01600

1

40

1 =

−=yvran

(iii) Fungsi biaya dari bentuk persamaan nmcncC 21 += dengan c1= 4, c2= 1, dan C = 100. Nilai optimum dari m adalah

21

22

2

2

1

−=

m

ss

s

c

cm

wb

wopt

= ( )2

1

43215.01642.0

3215.0

1

4

−x = 4

Substitusi nilai dari m pada fungsi biaya yang diberikan, nilai optimum dari n adalah

138

100 ≅=optm

9.4 THREE-STAGE SAMPLING DENGAN PELUANG YANG SAMA

Prosedur two stage sampling dapat dipindahkan sepertiga oleh sampling ssu’s sebagai ganti menyebut satu per satu dengan sepenuhnya. Sebagai contoh, di dalam panen mensurvei untuk menaksir hasil rata-rata, suatu desa dipertimbangkan unit percontohan langkah yang pertama .Di dalam suatu yang terpilih, hanya sebagian dari bidang yang bertumbuh panen terpilih dan diambil [ketika;seperti] sampling langkah yang kedua. Ketika suatu bidang yang terpilih, kemaluan yang hanya tertentu tentangnya adalah sampel,dimana mungkin memasukkan third-stage unit ( tsu). begitu hasil dari tiga sampling langkah dapat diperoleh dengan berkembang mereka yang dua sampling langkah, dengan asumsi yang masing-masing ssu mempunyai L third-stage unit. Ini juga mengira bahwa unit terpilih dengan kemungkinan yang sama.

Nilai ijky diperoleh untuk kth third-stage unit di jth unit langkah yang kedua dari ith langkah

yang pertama unit itu. Relevan populasi berarti tiap element adalah sebagai berikut:

∑=L

k

ijkij L

yY

∑∑ ′=

M

j

L

k

ijki ML

yY

∑∑∑=N

i

M

j

L

k

ijk

LMN

yY

,, iij yy dan y akan mendanakan bersesuaian nilai-nilai untuk contoh, bersesuaian varians

populasi nantinya:

∑ −−

=N

i

ib N

YYS

)1(

)( 22

∑∑ −−

=M

i

iiN

ib MN

YYS

)1(

)( 22

∑∑∑ −−

=L

k

ijijkN

i

M

jb LNM

YyS

)1(

)( 22

TEOREMA 9.4.1 jika n fsu’s, m ssu’s dan l unit yang terakhir terpilih oleh percontohan acak yang sederhana, wor, y adalah unbiased estimator dari Y dengan varian

23221 )1()1()1()( uwb S

nml

fS

nm

fS

N

fyV

−+

−+

−= ( 9.4.1)

Di mana L

lf

M

mf

N

nf === 321 ,, pecahan sampling pada tiga langkah-langkah, berturut-

turut. bukti adalah jelas nyata.

Varians yang diberi oleh hubungan ( 9.4.1) terdiri dari tiga komponen yang sesuai dengan yang three-stage dari sampling. Komponen yang pertama adalah variabilitas dari fsu’s, yang kedua ke variasi dari ssu’s dan yang ketiga ke tsu’s. jika m= M dan l= L, yaitu. masing-masing dari n fsu’s adalah dengan sepenuhnya disebut satu per satu, varians dari sampel berarti akan diberi oleh komponen yang pertama saja, mewakili varians dari sampling langkah yang tunggal. Dengan cara yang sama, jika masing-masing dari nm terpilih unit langkah yang kedua adalah dengan sepenuhnya disebut satu per satu, yaitu. l= L, varians dari contoh berarti akan diberi oleh dua hal pertama itu terminologi saja, mewakili varians dari dua orang – langkah yang sampling disain. Di (dalam) n= N atau di kata-kata yang lain, tiap-tiap fsu di populasi dimasukkan di contoh, varians dari contoh berarti akan mempunyai

[bertahan/berlangsung] dua terminologi, yaitu. sesuai dengan suatu dibuat stratifikasi dua sampling langkah mendesain dengan fsu’s strata.

KESIMPULAN 1 jika sampling telah selesai dengan penggantian pada tiap-tiap langkah, adalah suatu penduga yang unbiased dari dengan sampling varians

nml

S

nm

S

N

SyV uwb

222

)( ++= ( 9.4.2)

KESIMPULAN 2 suatu penduga yang unbiased dari )(yV yang diberikan oleh

232122121 )1()1()1()( uwb S

nml

fffS

nm

ffS

n

fyv

−+

−+

−= (9.4.3)

Di manakah 222 ,, uwb sss nilai-nilai contoh sesuai dengan, 222 ,, uwb SSS berturut-turut.

KESIMPULAN 3 Dengan fungsi biaya dari format

C = a + nc1 + nmc2 + nmlc3

Dan fungsi varians dari format

nml

A

nm

A

n

AAyV 321

0)( +++=

Nilai-Nilai jumlah maksimum dari l, m dan n yang memperkecil varians diberi oleh

2/1

32

23

=

cA

cAlopt

2/1

21

12

=

cA

cAmopt (9.4.5)

2/133

2/122

2/111

2/1110

)()()(

)/)((

cAcAcA

cAaCnopt ++

−=

Dengan nilai yang minimum dari varians untuk ditetapkan;perbaiki C, katakan C0

)(

])()()[(min

0

22/133

2/122

2/111

0 aC

cAcAcAAV

−++

= (9.4.6)

KESIMPULAN 4 Dengan notasi yang yang serupa seperti di kesimpulan 3, nilai-nilai jumlah maksimum dari l, m, dan n yang memperkecil biaya ,diberi oleh

2/1

32

23

=

cA

cAlopt

2/1

21

12

=

cA

cAmopt (9.4.7)

2/11100

2/133

2/122

2/111

)/)((

)()()(

AcAV

cAcAcAnopt −

++=

Dengan biaya yang minimum untuk suatu varians yang spesifik. katakan V0,

)(

])()()[(

00

22/133

2/122

2/111

AV

cAcAcAaC

−++

+= (9.4.8)

9.5 STRATIFIED MULTI-STAGE SAMPLING

Disain yang paling umum di survei yang besar-besaran dibuat stratifikasi multi-stage sampling. Tidak prinsip yang baru dilibatkan ketika obyek adalah untuk menaksir rata-rata dari suatu populasi dibagi menjadi k strata dan sampling di dalam masing-masing lapisan adalah mandiri. Populasi dari fsu’s dibagi lagi ke dalam k strata. Di dalam masing-masing lapisan, suatu contoh fsu’s terpilih dan masing-masing dari terpilih fsu’s adalah sub-sampled.

Biarkan hth lapisan berisi Nh unit langkah yang pertama, masing-masing dengan Mh unit langkah yang kedua. Bersesuaian angka-angka contoh menjadi nh dan mh. Penduga dari populasi berarti tiap unit langkah yang kedua diberi oleh

∑∑

∑==

k

hhhk

hhh

k

hhhh

st yWMN

yMNy ( 9.5.1)

Di mana hy contoh berarti di hth lapisan, dan ∑=

k

h

NhMh

NhMhWh

adalah penimbang dari

lapisan dalam kaitan dengan ssu’s

Menerapkan TEOREMA 9.2.1 di dalam masing-masing lapisan, kita mempunyai

])1()1(

[)( 22212wh

hh

hbh

h

hk

hst S

mn

fS

n

fWhyV

−+

−= ∑ ( 9.5.2)

Di manah

hh

h

hh M

mf

N

nf == 21 ,

Dengan cara yang sama, suatu penduga yang unbiased tentang sampling varians diberi oleh

])1()1(

[)( 221212wh

hh

hhbh

h

hk

hst S

mn

ffS

n

fWhyv

−+

−= ∑ ( 9.5.3)

Untuk mendiskusikan kasus dari alokasi jumlah maksimum, kita dapat tulis fungsi biaya sebagai

∑∑ +=k

hhhhh

k

hh mncncC 21 ( 9.5.4)

Dari hubungan ( 9.5.2), varians mungkin ditulis [ketika;seperti]

][)( 210

2 +++= ∑hh

h

h

hh

k

hhst mn

A

n

AAWyV

dimana 22

22

1

2

,, whhwhbh

hbh

ch SAmh

SSA

Nh

SA =

−=−=

Karenanya, memperkecil V untuk ditetapkan;perbaiki C, atau sebaliknya, kita dapat menggunakan Lagrange’S metoda dari pengali yang tak dapat ditentukan. Pembedaan secara parsial w.r.t nh dan mh dan penyamaan pada nol, kita mendapatkan

2/122

2/121

2/1

21

12

)/(

)/(

MhSS

ccS

cA

cAm

whbh

hhwh

hh

hhh −

=

= (9.5.5)

2/111

2/111

)/(

)(

h

hhh chAWh

cAnWhn

∑= (9.5.6)

2/1

122

2/11

22

]/)/([

]/)/[(

hwhbh

hwhbh

cMhSSWh

cMhSSnWh

−−

=∑

Karena; Wh ≈ NhMh kita boleh menyatakan

h

hwhbhhhh

c

MSSWNn

1

2/122 ]/[ −≈

≈

h

h

c

SNhMh

1

′

Di mana

2/122

−=′

Mh

SSS wh

bhh

dapat dilihat dengan mudah dari yang tersebut di atas hubungan bahwa rumusan untuk mh jumlah maksimum. Apakah secara tepat sama halnya di sampling yang tidak dibuat stratifikasi. Dengan cara yang sama, nilai jumlah maksimum dari nh yang sama membentuk perihal sampling yang dibuat stratifikasi uni-stage.

9.6 TWO-STAGE SAMPLING WITH UNEQUAL FIRST STAGE UNITS ESTIMATORS OF MEAN DAN THEIR VARIANCES

Durbin ( 1953), Des Raj ( 1966) dan Rao ( 1975) sudah membahas berbagai pen duga dari multi-stage sampling .Bagian ini diabdikan bagi suatu uraian tentang beberapa penduga yang bersama-sama menggunakan. Biarkan populasi dalam pembahasan terdiri dari N unit langkah yang pertama. Ith fsu berisi Mi unit langkah yang kedua. Lebih jauh, unit terpilih tanpa penggantian, dengan kemungkinan berbeda atau sama. Suatu contoh n fsu’s terpilih dan dari ith terpilih fsu, suatu contoh mi, ssu’s terpilih.

Mari kita tentukan

Mi = banyaknya ssu’s di ith fsu ( i=1,2,……,N)

Mo== total jumlah ssu’s di populasi

mi = banyaknya ssu’s untuk terpilih dari ith fsu dimasukkan di contoh

mo== total jumlah ssu’s di contoh

MiyYMi

jiji ∑= = ith fsu berarti

NYYN

jiN ∑= = keseluruhan cara fsu berarti

∑

∑=

N

i

N

i

Mi

iYMiY =∑

N

i

iYWi == rata-rata tiap ssu atau populasi berarti unsur

Ada beberapa penduga dari populasi berarti tetapi kita mengusulkan hanya untuk belajar sebagian dari yang metode yang praktis adalah,

Mn

yMyu

ny

n

iiin

iii

∑∑ == 1 (9.6.1)

n

yy

n

ii∑

=1

(9.6.2)

∑

∑=

n

n

iii

Mi

yMy

1

(9.6.3)

Di mana ∑=mi

j i

ij

m

yy .1 ,

N

MoM = , dan

M

Miui =

TEOREMA 9.6.1 menujukkan bahwa penduga yang diberi oleh hubungan ( 9.6.1) adalah unbiased dan sampling variansnya diberi oleh

])1()1(

[)(2

22221

mi

S

MnN

fMiS

n

fyv wih

N

ib

−+

−= ∑ (9.6.4)

Di mana )1(

)( 2

2

−

−=

∑N

YYuS

N

iii

b

dan )1(

)( 2

2

−

−=

∑Mi

Yy

Swi

Mi

jiij

Bukti untuk membuktikan

n

yuy

n

iii∑

= adalah suatu penduga yang unbiased, kita dapat tulis

1)( EyE =]

)|([

2

n

iyuEn

iii∑

= ∑∑

==n

iii

n

iii

YYuEnn

YuE )(

1][ 11

Sampling varians dari penduga diberi oleh

)|()|()( 2121 nyVEnyEVyV +=

+

= ∑∑

n

ii

in

iii nyV

M

M

nEYu

nV )|(

11.2

2

211

mi

S

MnN

fM

n

Sf w

N

i

iib2

22

22

1

)1()1( ∑ −

+−=

Unit terpilih dengan kemungkinan yang sama di metode ini dan kontribusi dibuat oleh fsu’s kepada komponen dari varians ini tergantung pada variasi antar fsu total. Jika unit berubah-ubah sesuai ukurannya maka ukuran, komponen ini akan jadi besar. Komponen yang kedua dari varians adalah juga besar seperti nampaknya akan ada korelasi yang positif antar Mi dan.

2.wiS . Sering, komponen ini menjadi sangat besar bahwa penduga tidaklah lebih disukai

KESIMPULAN 1 Menunjukkan bahwa perkiraan penduga ∑=n

i n

iyNMiY

.ˆ secara

unbiased populasi total Y dan sampling varians nya akan [jadi] diberi oleh

2

222212 )1()1(

)ˆ( wii

n

iib S

Mnmi

fNMS

n

fNyV

−+

−= ∑ ( 9.6.5)

KESIMPULAN 2 Suatu penduga yang unbiased tentang varians di (dalam) hubungan ( 9.6.4) diberi oleh

22221 )1()1()( iwi

in

ib uS

nmiN

fS

n

fyv

−+

−= ∑ (9.6.6)

Di mana 2bS dan dan 2

wiS adalah mempunyai; maksud/arti umum mereka

TEOREMA 9.6.2 Menunjukkan bahwa penduga yang diberi oleh hubungan (9.6.2) bias dan biasnya diberi oleh

MNYMMiB i /)(∑ −−= ( 9.6.7)

Dan sampling varians oleh

22211

)1(1)1()( wi

iN

ib S

mi

f

nNS

n

fyV

−+′−

= ∑ ( 9.6.8)

Di mana ∑ −−

=N

i

ib N

YYS

)1(

)( 22

dan 2wiS adalah seperti biasanya

Bukti Untuk membuktikan 1y adalah suatu penduga yang bias, kita dapat mendapatkan

EyE =)( 1}{ 1∑

n

n

y=

])|.(

[2

1 n

iyEE

n

ii∑

=YY

n

YE N

n

ii

≠=∑

][1

Yang mana menunjukkan 1y adalah suatu penduga yang bias.

Biasnya dapat diperoleh

∑ ∑−−=−=N

i

N

i

iiN MN

YMi

N

YYYB

= ])([1 ∑∑ −−

N

ii

N

ii YMYMi

MN

= ∑ −−N

iiYMMi

MN])([

1

Sampling varians dari penduga diberi oleh

)|()|()( 221121 nyVEnyEVyV +=

+

= ∑∑

n

ii

n

ii iyV

nEY

nV )|(

11.2211

])1(1

[)1(2

221

2

1 mi

Sf

nE

n

Sf wi

n

i

ib ∑ −+

′−=

mi

Sf

nNn

Sf wi

n

i

ib2

22

1

)1(1)1( ∑ −

+′

−=

Bias di penduga 1y nampak dalam kaitan dengan fakta bahwa kemungkinan dari pemilihan

dari ssu’s bertukar-tukar dari satu unit ke lain, di fsu’s, dalam kaitan dengan ukuran berbeda mereka. Jika Mi’S tidak bertukar-tukar dengan sangat dan variabel studi tidaklah dihubungkan dengan Mi. bias tidak boleh besar. Di sini, MSE dari akan terdiri dari tiga komponen: satu dari bias, satu dari variasi di dalam fsu’s dan seseorang timbul dari variasi antar rata-rata dari fsu’s. Nilai-Nilai dari mi’s tidaklah ditetapkan dan suatu pilihan yang sesuai tentang mi dapat sangat menolong di dalam mengendalikan komponen ini.

KESIMPULAN 1 Suatu penduga yang unbiased dari bias diperoleh oleh

B = ∑ −′−−

−−n

ii yyMMi

nMN

N))(([

)1(

)1(1. (9.6.9)

dimana

n

MiM

n

i∑

=′

KESIMPULAN 2 Suatu unbiased estimators dari varians diberi oleh

mi

S

nN

f

n

Sfyv wi

n

i

ib2

22

11

)1()1()( ∑ −

+′

−= (9.6.10)

dimana )1(

)( 2

2

−

−=

∑n

yyS

n

ii

b dan

)1(

)( 2

2

−

−=

∑mi

yy

Swi

mi

jiij

TEOREMA 9.6.3 Menunjukkan bahwa penduga yang dihubungkan oleh ( 9.6.3) adalah bias dan biasnya adalah

−

−=

Y

SSY

NnyBias My

M2

2

11)( ( 9.6.11)

Dan sampling variansnya adalah

mi

S

M

fM

nN

S

NnyV wi

N

i

iib2

222

2

)1(1)

11()( ∑ −

+′

−= ( 9.6.12)

Di mana)1(

)1( 2

2

−

−=

∑NM

M

S

n

i

i

M

)1(

)(1(

−

−−=∑

N

YM

iYMi

M

M

S

n

i

i

yM

)1(

)(

2

22

2

−

−=

∑NM

YYMiSb

n

ii

Dan 2wiS seperti biasa

Bukti: Jika kita mengambil ynM

yMin

i

i =∑ . dan unMMin

i

=∑ kemudian penduga 2y

dapat ditulis penduga perbandingan uy . Menerapkan hubungan (6.3.2) dan (6.4.1.) kita dapat temukan varians dan bias

Benar-Benar 2y adalah perbandingan ke penduga ukuran, di mana pengetahuan dari M

tidaklah perlu. Pada bentuk yang yang serupa, seseorang boleh menggambarkan penduga kemunduran dan bias nya, dan sampling varians dapat diperoleh tanpa kesukaran.

Dengan membandingkan V( 2y ) dan V( y ), seseorang boleh menyimpulkan bahwa istilah

yang kedua di (dalam) hubungan (9.6.12) adalah serupa dengan istilah yang kedua dalam hubungan (9.6.4). Istilah yang pertama bagaimanapun, diharapkan untuk kurang dari bersesuaian istilah di yang sama jika fsu’s szes dan total mereka adalah secara positif dihubungkan dan koefisien korelasi adalah lebih besar dari separuh perbdaningan dari CV’S

mereka. Dengan Cara Yang Sama, jika Mi dan )( YYi − adalah secara positif dihubungkan

dan bias di 1y adalah sepele, kemudian V( 2y ) akan [jadi] lebih besar dari V( 1y ). Secara

umum, jika Mi’S bertukar-tukar dengan sangat, penduga, yang disajikan n adalah danMi yang cukup besar adalah sangat dihubungkan dengan variabel studi. Di panen mensurvei di

(dalam) India, suatu studi yang empiris pada efisiensi yang relatif dari tiga penduga,, y , 1y

, dan 2y telah dibuat ketika diamati bahwa yang sederhana rata-rata mempunyai standar

paling sedikit kesalahan. Hasil yang yang serupa dipertunjukkan di (dalam) contoh 9.2. Mi’S ditemukan untuk bertukar-tukar dengan sangat dari desa ke desa dan bias ditemukan untuk sepele. Penduga telah diamati untuk secara komparatif lebih sedikit efisien

Penduga yang tidak bias untuk varians ( 2) adalah sebagai berikut

v( 2) =

Contoh 9.2 Untuk latihan penelitian memberi makan dan membesarkan domba dan bulunya

di negara Rajashtan, selama tahun 1980-81, desain sampel dua tahap dengan tehsils sebagai

tahap pertama dan desa sebagai tahap kedua yang digunakan dalam metode ini. Data yang

diberikan di bawah ini adalah populasi domba yang tetap di desa yang terpilih dari 4 tehsil

yang terpilih dari 12 tehsil dari divisi Ajmer, data ini dihitung dari survei dengan jumlah

desa di tehsil.

Tehsil

terpilih

Jumlah desa di

setiap tehsil (Mi)

Populasi domba di desa terpilih

Behrar 102 266,890,311,46,174,31,17,186,224,31,162,46,31,

109,275,128,125,267,153,152,84,21,52,10,0,48,9

4,123,87,89,109,0,310,3Bairath 105 129,57,64,11,163,77,278,50,26,127,252,194,350,

0,572,149,275,114,387,53,34,150,224,185,157,24

4,466,203,354,816,242,140,66,590,747,147Ajmer 200 247,622,225,278,181,132,659,403,281,236,595,2

65,431,190,348,232,88,1165,831,120,987,938,19

7,614,187,896,330,485,60,60,1051,651,552,968,9

87Bansur 88 347,362,34,11,133,36,34,61,249,170,112,42,161,

75,68,0,247,186,473,0,143,198,65,0,308,122,345,

0,223,302,219,120,199,35,0,0

Hitunglah rata-rata dari populasi domba di desa Ajmer selama tahun 1980-81, dengan

standard errornya jika =124.

Didapatkan

=124, M1 = 102, M2 = 105, M3 = 200, M4 = 88,

N= 4, m1 = 34, m2 = 36, m3 = 35, m4 =

36,

= 135, = 225, = 471, = 141,

dan

(i) Cara pertama. Penduga yang tidak bias dari rata-rata populasi domba

adalah sebagai berikut

=

Jadi,

=

=

Estimasi dari V( ) adalah

v( ) =

dimana

nilainya,

=

=

dan

=

= =154.87

Jadi,

v( )=

standard error dari = = 94.94

(ii) Cara kedua. Penduga yang lain dari populasi domba adalah

=

=

Varians estimator dari adalah sebgai berikut

v( ) =

dimana

dan

didapatkan

Dan telah dihitung sebelumnya.

Jadi,

v( )

= 4214

standard error dari = =64.92

(iii) Cara Ketiga Kita juga mempunyai yang merupakan estimator dari

rata-rata populasi yaitu

Kita menghitung,

= 0.998

karena itu

begitu juga, estimasi dari V( ) adalah

v( ) =

dimana

maka

= 38401.87

Dan bagian kedua dari varians telah ada di (i).

Jadi v( ) =

= 6555.19

standard error dari adalah =

9.7 Alokasi optimum : unit yang berbeda tahap pertama

Di bagian 9.3, kita telah membicarakan alokasi optimum untuk tahap pertama

jika unit-unitnya mempunyai ukuran yang sama. Fungsi dari biaya dan varians

mempunyai lawan dalam perlakuan peningkatan jumlah n dan m, dan hal itu

penting untuk dipertimbangkan sebelum alokasi optimum dibicarakan lebih

lanjut.

Fungsi Biaya. Di desain penarikan contoh untuk dua tahap, biaya survey dapat

dituliskan sebagai berikut

(9.7.1)

Dimana adalah biaya tidak tetap, adalah biaya rata-rata per fsu, dan

adalah biaya rata-rata per ssu.

Dalam kenyataannya, kelihatan lebih besar dari . Karena itu, peningkatan

jumlah unit (n) meningkatkan biaya yang dapat dibandingkan dengan

peningkatan . Jadi, komponen kedua dari fungsi biaya akan berbeda dari setiap

sampel yang satu dengan sampel yang lainnya untuk jumlah n tertentu dan oleh

karena itu, itu menjadi hal yang penting untuk diketahui dari alokasi optimum

dari jumlah total sampel berdasarkan ssu yang terpilih, jadi rata-rata jumlah

sampel ssu yang terpilih untuk setiap fsu adalah m. Masalah ini telah dibicarakan

oleh Rangarajan (1957) dan Rao (1961). Mereka memberikan metode yang

berbeda dengan dengan m adalah nilai rata-rata atau dengan

adalah konstanta positif. Maka kita mepertimbangkan bahwa biaya rata-rata

dari pembicaraan sebelumnya dapat dituliskan sebagai berikut

(9.7.2)

Fungsi Varians Dari pernyataan varians penarikan contoh yang dibahas pada

bagian sebelumnya, kita dapat berkata bahwa varians total dalam penarikan

contoh dua tahap dapat dituliskan dalam rumus

V( ) (9.7.3)

Dimana adalah konstanta yang independen dari dan , dan dan

fungsi dari populasi parameter yang analog dengan dan , jumlah sampel

yang independen yaitu

dan . Jika , dimana m adalah rata-rata dari jumlah unit yang terpilih

per ssu,

= E( ) dan tergantung dari metode yang menentukan sekelompok nilai dari

, maka hubungan (9.7.3) diambil dari rumus

V( ) (9.7.4)

Peningkatan dari n dan m mebuat perubahan yang signifikan yaitu penurunan

varians. Singh (1958) telah membicarakan perlakuan dari varians dan efisiensi

ketika jumlah dari fsu dan ssu tetap. Petunjuk yang mendasar untuk alokasi

optimum, adalah utnuk meminimalkan varians untuk biaya tetap, efisiensi setiap

unit dari biaya adalah maksimum atau meminimumkan biaya dengan varians

tertentu, biaya per unti adalah minimum untuk suatu nilai efisiensi tertentu. Kita

harus membicarakan kedua kasus di atas.

(a) Jika biaya tetap. Andaikan biaya tetap, katakanlah dan estimator

digunakan. Dengan memproses apa yang kita bicarakan di bagian 9.3 maka

kita mempunyai

(9.7.5)

Dimana (9.7.6)

(9.7.7)

Dengan mensubstitusi nilai dan ke rumus varians maka kita

mendapatkan rumus varians minimum adalah sebagai berikut

(9.7.8)

Andaikan telah ditentukan sebagai penimbang yang proporsional untuk

, jika , dimana adalah konstanta positif dan bisa didapatkan

sebagai

(9.7.9)

Jika ukuran ssu adalah sama, nilai optimum dari m dan n adalah sebagai

berikut

(9.7.10)

(9.7.11)

Rumus di atas dapat dibandingkan dengan nilai yang diberikan dalam

hubungan (9.3.7) dan (9.3.5)

(b) Jika varians ditentukan. Andaikan varians ditentukan oleh suatu nilai

tertentu, katakanlah . Dengan prosedur yang biasa, kita mendapat nilai

yang sama dari sebagai hubungan dari (9.7.5). Selanjutnya, kita

mempunyai rumus sebagai berikut

(9.7.12)

Dengan mensubstitusi nilai dari dan di fungsi biaya, kita

mendapat biaya minimum sebagi berikut

(9.7.13)

Dalam praktik, pengambil sampel akan mempunyai pertimbangan akan faktor

lain seperti adminstratif dan kenyamanan pelayanan di lapangan sebagai

tambahan untuk pendekatan varians-biaya. Dalam survei skala besar,

kegiatan yang ada di lapangan akan selalu mempunyai peran yang

mendominasi dan pengambil sampel akan memutuskan pilihan sesuai

keputusannya sendiri.

9.8 Metode PPS dua tahap

Di bagian pembahasan, teori untuk metode yang memiliki tahap banyak

dengan peluang yang sama dari setiap tahap yang terpilih telah dibicarakan.

Jika fsu adalah besar dan berbeda dalam ukurannya, maka lebih dianjurkan

untuk memakai metode pps, ukuran menjadi ’s. Sistem dari metode ini

terbentuk dari penggunaan peluang yang bervariasi dan metode ini telah

digunakan oleh Hansen dan Hurwitz (1943,1949). Singh (1954)

membandingkan dua estimator dalam desain penarikan contoh dua tahap

dimana fsu dipilih dengan peluang yang bervariasi, tanpa pengembalian, dan

ssu dengan peluang yang sama, dengan pengembalian, dan tanpa

pengembalian. Penduga alternatif disarankan oleh Rao (1966). Metode yang

sederhana dari pendugaan varians telah ditemukan oleh Durbin (1967).

Brewer dan Hanif (1970) telah memperbaiki dan memperluas metode untuk

estimator yang lain.

Andaikan sampel dari n fsu dipilih dengan pps, WR. Dari sampel terpilih

dengan fsu, pilihan dari ssu’s dibuat dengan SRS,WOR. Jika fsu terpilih

lebih dari sekali, kemudian akan timbul kebebasan dari ssu’s yang

disebabkan oleh pengambilan sampel WOR dari fsu yang lengkap setiap saat.

Estimator yang tidak bias dari Y adalah

(9.8.1)

Dimana p adalah peluang untuk memeilih sampel dari fsu dari setiap

pengambilan

, dan

Estimator dari varians sampel adalah sebagai berikut

(9.8.2)

Estimator yang tak bias bagi adalah

(9.8.3)

Yang memberikan prosedur yang baik dari pendugaan, metode apasaja dari

pemilihan yang diambil pada tahap kedua, menyediakan fsu yang dipilih

dengan pengembalian. Jika tertarik dalam menduga varians di dalam populasi

dan antar populasi kemudian komponen antar populasi bisa didapatkan

dengan menggabungkan komponen dalam populasi dengan (9.8.3).

Komponen varians fsu dalam populasi dapat diduga secara tidak bias melalui

(9.8.4)

9.9 Desain tertimbang sendiri

Dalam survei skala besar, estimator didefinisikan dalam rumus (9.8.1)

termasuk pernyataan yang akan bervariasi dari unit yang satu ke unit

yang lain. Dikarenakan kerumitan dari keragaman yang alami, analisis dari

data akan cukup tidak praktis. Dalam situsi ini, teknik sampel tertimbang

sendiri dijelaskan di bagian 3.7.2 akan terbukti sangat berguna. Desainnya

menyediakan timbangan tunggal umum untuk seluruh unit sampel yang

dikenali sebagai desain tertimbang sendiri, dan sering disebut desain

tertimbang yang sama. Desain ini bisa dibuat dengan tahap penduga dimana

tiap unit mempunyai timbangan sendiri-sendiri. Jika pemilihan dari unit

dilakukan untuk membuat seluruh timbangan sama satu sama lain maka

desainnya dinamakan desain tertimbang sendiri pada tahap lapangan.

Contohnya, desain tahap bertingkat bisa dibuat dari tahap desain tertimbang

sendiri dengan pilihan yang tepat dari jumlah unit untuk setiap tahap yang

dipilih dalam tahap penarikan contoh yang terakhir. Jika metode ini dipakai

melalui beberapa penduga pada setiap tahap maka desain ini disebut desain

tertimbang sendiri pada tahap penduga.

Biasanya desain ini dibuat dan dipakai karena faktor-faktor yang berada di

lapangan seperti biaya dan kenyamanan operasional. Contohnya, dalam

survei panen padi, hal itu mungkin akan menjadi sulit dalam membuat

kerangka dari pertumbuhan semua padi yang ada, dimana kerangka dari

setiap desa mungkin mudah didapatkan. Begitu juga susunan dari kerangka

padi tersebut akan menaikkan biaya, menghabiskan tenaga, dan usaha yang

lain, bila faktor-faktor ini minimum dari desa yang terpilih dan lahan yang

terpilih pada setiap desa yang terpilih. Bagaimanapun juga, itu mungkin tidak

selalu merujuk pada desain tersebut karena dalam praktiknya sulit untuk

mempunyai timbangan yang sama untuk seluruh unit sampel. Pada beberapa

kasus, dua atau lebih timbangan digunakan, menyediakan jumlah timbangan

yang umum itu hampir kecil. Kadang-kadang itu menjadi hal yang penting

untuk membuat desain tertimbang sendiri pada tahap pendugaan. Metode

yang bervariasi tersedia untuk tujuan ini. Pada bagian ini, kedua situasi dalam

membuat desain di lapangan dan pada tahap pendugaan dipertimbangkan.

Prosedur dalam membuat desai tertimbang sendiri pada tahap lapangan telah

dipikirkan oleh Hansen (1953) dan Lahiri (1954). Masalah dalam membuat

desain tertimbang sendiri pada tahap pendugaan telah dibicarakan oleh

Murthy dan Sethi (1959,1961). Som (1959) telah memberikan prosedur untuk

membuat desain tertimbang sendiri dua tahap dalam suatu strata dengan

jumlah unit terpilih pada setiap fsu pada tahap terkahir metode adalah sama.

Dalam stratifikasi, kita telah mengetahui bahwa alokasi proporsional

mengacu pada desain sampel yang tertimbang sendiri. Dengan kata lain, jika

bahwa penimbangnya adalah sama untuk setiap unit sehingga (i)tabulasi menjadi lebih mudah, (ii) analisis menjadi lebih mudah, dan (iii) biaya diminimumkan. Keuntungan lain dari desain penimbang sendiri adalah memberikan ukuran sample yang konstan dari setiap fsu terpilih. Jadi, para peneliti tidak bertanggung jawab terhadap hasil yang berbeda dari fsu yang berbeda. Kelemahan sistem ini hanya bahwa beberapa metode menghasilkan estimasi yang bias meskipun, di beberapa kasus, dengan varians yang lebih kecil.

CONTOH 9.3 Untuk mengestimasi total populasi domba di Divisi Ajmer Rajashtan tahun 1980-81, desain survey yang digunakan adalah penarikan sampel dua tahap dengan tehsil

sebagai unit tahap pertama(fsu) dan jumlah desa pada tehsil sebagai unit tahap kedua(ssu). Tehsil diambil dengan pengembalian dan dengan peluang mengacu pada populasi domba(pps) dalam sensus peternakan tahun 1976, dimana desa-desa pada setiap tehsil diambil dengan peluang yang sama serta tanpa pengembalian. Data yang diberikan menunjukkan populasi domba di desa terpilih pada Divisi Ajmer yang merupakan hasil penghitungan survey putaran kedua.

Tehsil Terpilih

No. Desa pada

Tehsil (Mi)

Peluang Tehsil

Terpilih (pi)

Populasi Domba pada Desa Terpilih

Behrar 102 0.008568 266, 174, 224, 66, 109, 267, 21, 48, 87, 890, 31, 31, 102, 275, 153, 52, 94, 89, 311, 17, 108, 46, 128, 152, 10, 123, 109, 46, 186, 128, 39, 126, 84, 0

Bairath 105 0.015079 129, 163, 26, 350, 275, 34, 157, 354, 66, 57, 77, 127, 0, 114, 150, 244, 816, 590, 64, 278, 252, 572, 387, 224, 466, 242, 747, 11, 50, 194, 149, 53, 185, 203, 140, 174

Ajmer 200 0.073556 247, 181, 403, 265, 232, 130, 197, 330, 1051, 622, 987, 281, 431, 88, 987, 614, 485, 651, 225, 132, 236, 190, 1165, 938, 187, 60, 552, 278, 650,595, 348, 831, 968, 895, 60,570

Bansur 88 0.012632 347, 133, 249, 161, 247, 143, 308, 223, 120, 362, 36, 170, 75, 186, 198, 122, 302, 199, 34, 112, 68, 43, 65, 345, 219, 35, 11, 61, 42, 0, 0, 0, 0

Perkirakan total populasi domba pada Divisi Ajmer tahun 1980-81 serta standar error-nya.

Penyelesaiannya adalah sebagai berikut :

No. Tehsil M i pi mi ∑

iij

y ∑j

iji yM pm ii ∑j

ii

iji

pm

yM

1 102 0.008568

34 4592 468384 0.291312

1,607,843.1372

2 105 0.015079

36 8120 852600 0.542844

1,570,616.9728

3 200 0.073556

36 17062 3412400 2.648016

1,288,662.9084

4 88 0.012632

34 5080 447040 0.429488

1,040,867.2652

5,507,290.2836

Sebuah estimasi yang tidak bias terhadap total populasi domba diberikan sebagai

57.1377072

2836.55082904

1

1

ˆ

ˆ

ˆ

=

×=

= ∑∑

Y

Y

pm

yMY

pps

pps

n

i jii

iji

pps

m

n

i

Estimasi terhadap ( )Y ppsV ˆ adalah sebagai berikut

( ) ( )

( ) ( )

( ) 9167.01760340438

0257584488460516779605351234

1

1

1

1

ˆ

ˆ

ˆ

22

=

−×

=

∑ ∑−∑−

=

∑

Y

Y

pm

yM

pm

yMY

pps

pps

n

ipps

v

v

n

i

mi

jii

iji

n

mi

jii

iji

nnv

∴Standar error dari 54.1327799167.01760340438ˆ ==Y pps dan persentase relatif

standar error 61.910057.1377072

54.132779 =×=

9.10 Penarikan Sampel pps Tiga Tahap

Kita telah membahas penarikan sample pps dua tahap pada bagian sebelumnya, yang dapat dikembangkan menjadi tiga tahap atau lebih. Sebuah sample dari nml unit dipilih dalam 3 tahap dengan mengunakan pps, dengan pengembalian, pada setiap tahap. Misalkan sebanyak n fsu terpilih dengan pi menyatakan peluang terpilih untuk fsu ke-i (i=1, … ,N). Dari setiap fsu terpilih sebanyak mi ssu dipilih dengan pij menyatakan peluang terpilih untuk ssu ke-j (j=1, … ,Mi) dan dari setiap ssu terpilih sebanyak l unit tahap ketiga (tsu) dipilih dengan pijk

menyatakan peluang terpilih untuk tsu ke-k dari ssu ke-j pada fsu ke-i p(k=1, …, Lij). yijk

menyatakan nilai dari tsu ke-k pada ssu ke-j dari fsu ke-i (i = 1, …,n; j = 1, …,m; k = 1, …, l) pada sample. Sebuah penduga populasi total Y didefinisikan sebagai

∑∑∑=l

kijk

ijkm

jij

n

i py

ppnmlY

111ˆ

1

(9.10.1)

Dapat ditunjukkan dengan mudah bahwa penduga tersebut tidak bias yaitu

( ) ( ) YYYE EEE == ˆˆ321

Dengan ragam penduga diperoleh dari

( ) ( ) ( ) ( )YYYYV VEEEVEEEV ˆˆˆˆ321321321

++=

Sehingga,

( ) ∑ ∑ ∑∑ ∑∑

−+

−+

−=

N

i i kijiji

N

i iiji

N

ii

M L

ijijk

nml

M

iij

nmi

nYV

i iji

yp

y

ppYpY

pYpY 2

2

2

2

2

2

111111ˆ

(9.10.2)

Sebuah penduga tidak bias ( )YV ˆ diberikan oleh

( ) ( )

−⋅−

= ∑n

i ninnYv Yy

ˆ 22

1

1ˆ (9.10.3)

Dimana ∑ ∑

=

⋅

m

j

l

ki j k

i j k

i ji

i py

ppy 11

Harus diingat bahwa, seperti pada penarikan sample dua tahap, fungsi ragam penarikan sample pada penarikan sample tiga tahap juga dapat ditulis sebagai

( )nmlnmn

YV AAA 321ˆ ++=

Demikian juga, fungsi biaya dapat ditulis dalam bentuk

ccc nm lnmnaC321

+++= (9.10.4)

Dimana a adalah biaya tambahan dan c1, c2 serta c3 seperti pengertian biasanya.

(i) Jika biaya survey tetap, katakan C0, maka nilai optimum dari n, m,dan l diberikan sebagai

( ) ( )( ) ( ) ( )

++

−=

=

=

cAcAcAcAc

n

cA

cAm

cA

cAl

aopt

opt

opt

331211

11

21

12

32

23

212121

21

0

21

21

(9.10.5)

Dengan mensubstitusi nilai-nilai l, m dan n, kita memperoleh ragam minimum sebagai

( ) ( ) ( ) ( ){ }( )a

Yc

cAcAcAV −

=++

0

2

m in33

2122

2111

21ˆ (9.10.6)

(ii) Jika ragamnya ditentukan, katakan V0, nilai-nilai optimum n, m dan l diberikan sebagai

( ) ( ) ( )( )

++=

=

=

AcVcAcAcA

n

cA

cAm

cA

cAl

o

opt

opt

opt

11

332211

21

12

32

23

21

212121

21

21

(9.10.7)

Dengan mensubstitusi nilai-nilai l, m dan n, kita memperoleh biaya minimum sebagai

( )cAcAcAVaC

3322111 2

0

+++= (9.10.8)

Kumpulan Soal

9.1 Definisikan penarikan sample multi-tahap dan tuliskan kegunaannya dibandingkan skema penarikan sample lainnya. Tuliskan penduga tidak bias dari total populasi dan tentukan ragam penarikan sampelnya.

9.2 Apakah yang dimaksud dengan penarikan sample multi-tahap? Berikan persamaan penduga ragam dari total populasi untuk desain penarikan sample tiga tahap yang sesuai saat setiap unit memiliki ukuran yang berbeda pada setiap tahap penarikan sample. Berikan struktur analisis ragam pada penarikan sample tiga tahap dan jelaskan bagaimana analisis tersebut dapat digunakan dalam merencanakan survey selanjutnya.

9.3 Misalkan sebanyak n fsu dipilih dengan pps, dengan pengembalian, dan, dari setiap fsu terpilih, dipilih sebanyak m ssu dengan penarikan sample acak sederhana, tanpa pengembalian. Berikan penduga tidak bias dari total populasi Y dan tentukan penduga tidak bias dari ragam penarikan sample dari penduga tersebut.

9.4 Jika f1 dan f2 adalah fsu penarikan sample dua tahap yang sama dengan ukuran fsu yang sama dan fungsi biaya adalah linear, tunjukkan bahwa m = 2 menghasilkan nilai

( )YV yang lebih kecil daripada m = 1 jika

SS

cc

w

b2

2

1 2>

9.5 Jika ρ adalah koefisien korelasi antara ssu pada fsu yang sama, buktikan bahwa

( )

S

SS

w

wb

MNN

2

22

1

1

−−

=− ρρ

9.6 Sebuah populasi memiliki N fsu, masing-masing memiliki M ssu. Untuk mengestimasi proporsi P dari unit yang memiliki sifat tertentu , sebanyak n fsu dipilih dengan penarikan sample acak sederhana, tanpa pengembalian, dan dari setiap fsu terplih sebanyak m ssu dipilih dengan penarikan sample acak sederhana, tanpa pengembalian. Jika pi menyatakan proporsi sifat pada fsu terpilih ke-i, tunjukkan

bahwa ∑=n

ii

nP pˆ merupakan penduga yang tidak bias dari proporsi populasi P.

Tentukan ragam dari penduga tersebut dan tunjukkan bahwa penduga tidak bias dari ( )PV ˆ adalah

( ) ( ) ( )( ) ( ) ( )

( )∑∑−

−

−−+

−−=

n

i

iin

i mNnnniPv

ppf

Ppf

1

11

11ˆ

2

2

1

ˆ

Dimana f1 dan f2 pada pengertian seperti biasanya.

9.7 Pada sebuah survey pendahuluan dengan desain penarikan sample dua tahap, sebanyak m ssu dipilih dari setiap n fsu. Perkirakan ( )yV , saat sample fsu lainnya diambil dari n dan dari setiap fsu terpilih, diadakan pemilihan ssu sebanyak m. Tunjukkan bahwa penduga tidak bias dari ( )yV adalah

( ) ( ) ( )nm

m

nyv Sfff

mSf wb

2

211'

2

1111

−−−+−=

Dimana S b

2 dan S w

2 diperoleh dari sample pendahuluan.

9.8 Definisikan desain penimbang sendiri dan diskusikan keulebihan dan kelemahannya secara singkat. Tunjukkan bahwa sebuah desain dua tahap, dimana sebanyak n desa dipilih dengan peluang mengacu kepada jumlah rumah tangga yang dimilikinya, pada tahap pertama, dan sebanyak m rumah tangga dipilih dengan peluang yang sama tanpa pengembalian pada tahap kedua, dari setiap desa terpilih, merupakan penimbang sendiri. Tentukan penduga tidak bias dari ragam penduga penimbang sendiri.

9.9 Sebuah populasi dibagi ke dalam k lapisan dengan Mi merupakan fsu pada lapisan ke-i (i = 1, …, k). Setiap fsu memiliki sebanyak N ssu. Sebuah sample acak dari m fsu dipilih sari setiap lapisan dan sebuah sample acak dari n ssu diambil untuk penelitian pada setiap fsu terpilih. Bagaimana cara Anda untuk memperoleh sebuah perkiraan yang tidak bias dari populasi total karakteristik sample? Tentukan sebuah rumusan untuk menduga perbedaan antara ragam perkiraan total penarikan sample dengan ragam penduga tidak bias linear dari populasi yang sama yang mugkin dapat diperoleh dari sebuah sample acak yang tidak berlapis dari fsu sebanyak km dengan sebanyak n ssu diambil untuk penelitian pada masing-masing fsu.

9.10 Sebuah sample dengan fsu sebanyk n dipilih dengan penarikan sample acak sederhana , tanpe pengembalian, dan dari setiap fsu terpilih diambil sebuah fraksi tetap ssu yaitu f2. Jika ri dari mi ssu pada fsu ke-i menyatakan sebuah sifat, tunjukkan bahwa penduga

rasio pada ukuran ( )∑∑= mr iip menduga proporsi populasi sifat tsb dan

perkiraan ragamnya adalah

( )( ) ( ) ( ) ( )∑∑

−−

−

−+

−

−=

n

iii

i

iin

ii pp

mmM

nffpp

MM

fMmn

i

npv 1

1

1

1

12

21

2

2

21

Dimana

mrp

i

i

i=

(Cochran, 1977)

9.11 Pada penarikan contoh dua tahap, sebanyak n fsu dipilih dengan metode peluang mengacu pada ukuran(pps), dengan pengembalian, dan dari fsu terpilih ke-i dengan Mi unit, sebanyak mi ssu dipilih dengan penarikan sample acak sederhana, dengan

pengembalian. Untuk memperkirakan populasi total Y, urutan sub-penarikan sample mi ditetapkan sebagai (i) nilai harapan dari mi, ditentukan pada m, atau (ii) jumlah sample ssu ditentukan sebagai m0. Tentukan nilai optimum mi pada kedua kasus tsb sehingga ragam penduganya minimum. Serta bandingkan ragam minimum keduanya.

(Rangarajan, 1957)

9.12 Pada penarikan sample dua tahap, sebanyak n fsu dipilih dengan metode pps, dengan pengembalian. Jika fsu ke-i muncul sebanyak ri kali dalam sample, salah satu prosedur berikut dapat digunakan untuk penarikan sample tahap kedua :(i) ri mi ssu dipilih dengan penarikan sample acak sederhana, tanpa pengembalian;(ii) diambil ri sample mi ssu saling bebas( diperoleh dengan penarikan sample

acak sederhana, tanpa pengembalian); dan(iii) Sebanyak mi unit dipilih tanpa pengembalian dan observasi ditimbang oleh ri.Tentukan penduga tidak bias dari populasi total Y dan ragam penarikan samplenya untuk semua kasus tsb. Jika V1 ,V2 dan V3 adalah ragam penduga, tunjukkan bahwa, untuk ukuran sample harapan yang sama,

VVV 321≤≤ (Rao, 1961)

9.13 Pada penarikan sample dua tahap, sebanyak n fsu ipilih dengan pps, tanpa pengembalian. Dari setiap sample fsu, sebanyak m ssu dipilih dengan penarikan sample acak sederhana, tanpa pengembalian. Perkirakan sebuah penduga tidak bias

untuk populasi total. Sebuah penduga untuk populasi total adalah ∑=N

iiiYY ˆˆ β

dimana Y iˆ merupakan penduga tidak bias dari fsu ke-i dan β

i merupakan

bilangan riil, telah ditentukan sebelumnya untuk setiap sample dengan batasan bahwa

βi adalah 0 jika fsu ke-i tidak temasuk dalam sample. Tunjukkan bahwa

penduganya tidak bias. Tentukan penduga tidak bias bagi ragamnya.(Des Raj, 1966)

9.14 Berikut ini diberikan skema penarikan sample untuk meperkirakan rata-rata populasi sebuah karakteristik :(i) Populasi dibagi menjadi N kluster masing-masing sebanyak M unit serta dengan menerapkan penarikan sample dua tahap dipilih sebanyak n kluster dan m unit dari setiap kluster terpilih dengan penarikan sample acak sederhana, dengan pengembalian, (ii) Populasi dibagi ke dalam kluster dengan masing-masing m unit dan sample dari kluster dipilih dengan penarikan sample acak sederhana, dengan pengembalian.Tunjukkan bahwa, pada kedua kasus tsb rata-rata sample merupakan penduga tidak bias bagi rata-rata populasi dan tentukan ragam bagi kedua kasus tsb. Tunjukkan bahwa efisiensi dari kedua skema ini akan sama saat nm=n’m’.

(Singh. D. ,1956)

9.15 Dalam sebuah survey sample untuk memperkirakan jumlah standar kertas dalam sebuah tehsil dengan 72 desa, sample yang terdiri dari 12 desa dipilih dengan metode penarikan sample acak sederhana, tanpa pengembalian, dan dari setiap desa terpilih sebanyak 5 kluster yang masing-masing terdiri dari 20 lahan dipilih dengan metode penaarikan sample acak sederhana, tanpa pengembalian. Berikut diberikan data kluster pada desa sample dan data jumlah standar pada kluster sample:

Desa Sampel Jumlah KlusterJumlah Standar pada kluster sample

1 2 3 4 5

1 27 430 402 363 975 389

2 24 586 1234 100 368 344

3 14 1164 546 3060 1724 1274

4 116 693 218 836 1218 575

5 25 191 270 4502 4184 243

6 118 1036 1333 1179 728 1957

7 147 1555 254 950 382 355

8 36 910 452 129 122 243

9 91 340 0 92 28 340

10 171 57 59 0 0 21

11 86 159 45 242 1075 539

12 88 84 462 147 16 10

Tentukan penduga tidak bias bagi jumlah standar total pada tehsil dan tentukan standar errornya.

9.16 Wol mentah terdiri dari berbagai jenis lemak, kotoran dan lainnya, kualitasnya diukur dari persentase berat wol bersih, yaitu isi bersihnya. Untuk memperkirakan isi bersih, digunakan sebuah mesin penarik inti elektris yang menarik inti sekitar 1/4pon per bal, yang kemudian diberikan pada laboratoriu analisis. Dalam sebuah percobaan , sebanyak 6 bal diambil dari tumpukan besar dengan peluang yang sama dan dari setiap bal diambil 4 core secara acak dan kemudian isi bersihnya ditentukan. Hasil percobaan ini adalah sebagai beikut :

Core Sampel Bal

1 2 3 4 5 6

1 54.3 57.0 54.6 54.9 59.9 57.8

2 56.2 58.7 57.5 60.1 57.8 59.7

3 58.9 58.2 59.3 58.7 60.9 59.6

4 55.5 57.1 57.5 55.6 57.5 58.1

(i) Perkirakan rata-rata isi bersih wol dalam tumpukan tsb dan tentukan perkiraan untuk standar errornya.(ii) Tentukan efisiensi dari penarikan sample 12 bal dan 2 inti pada setiap bal serta bandingkan dengan skema di atas.

9.17 Untuk memperkirakan total panen padi di suatu wilayah, digunakan penarikan sample dua tahap berlapis dimana dari setiap lapisan dipilih 4 desa, dengan pps, dengan pengembalian, dan area geografis sebagai ukurannya. Empat bidang lahan diambil dari setiap desa sample dengan sirkuler, secara sistematik, untuk menyatakan panen padi. Berikut diberikan data panen padi untuk bidang sample :

Lapisan Desa SampelInvers

PeluangJumlah Bidang

Panen Padi (kg)

1 2 3 4

1 1 440,21 28104

182

148

87

2 660.43 84108

64132

156

3 31.50 240100

115

50 172

4 113.38 76346

350

157

119

2 1 21.00 256124

111

135

216

2 16.80 288123

177

106

138

3 24.76 222264

78144

55

4 49.09 69300

114

68 111

3 1 67.68 189110

281

120

114

2 339.14 42 80 61118

124

3 100.0 134121

212

174

106

4 68.07 161243

116

314

129

Perkirakan total panen padi dan tentukan penduga standar errornya.

9.18 Sebuah survey panen potong di suatu wilayah menggunakan metode penarikan sample acak multi tahap berlapis, pada jumlah panen rami, untuk memperkirakan rata-rata berat rami hijau untuk wilayah tsb, dengan tiga sub-divisi administratif pada setiap strata. Pada setiap sub-divisi administatif, sejumlah desa dipilih secara acak. Tiga lahan rami dipilih secara acak dari total lahan rami di desa tsb. Pada setiap lahan, dibuat bidang seluas 1/60 acre, baik rami yang telah dipanen maupun yang masih hijau dicatat dalam kg. Berikut adalah datanya:

Sub-DivisiTotal Area Rami dalam

acrePanen Rami Hijau dalam kg per Bidang untuk

desa dan Lahan Terpilih

1 5089 86, 85, 57, 81, 71, 92, 72, 37, 51, 81, 50, 43, 78, 71, 79

2 4133 86, 45, 81, 55, 56, 55, 91, 70, 64, 19, 62, 41

3 3007 81, 8, 43, 67, 48, 47, 35, 34, 37

Perkirakan rata-rata berat panen rami dalam kg per acre untuk wilayah tsb dan hitunglah standar errornya.

DAFTAR PUSTAKA

Brewer, K.W.R. and M. Hanif, “Durbins’ new multi-stage variance estimator,” J.R. Statist. Soc., 32B, 302-311, (1970)

Cochran, W.G., “The use of analysis of variance in enumeration by sampling,” J. Amer Statist. Assoc., 34, 492-510, (1939)

---Sampling Techniques, Third Edition, Jhon Wiley and Sons, NewYork, (1977)

Des Raj, “Some remarks on a simple procedure of sampling without replacement,” J. Amer. Statist. Assoc., 61, 391-397, (1966)

Durbin, J., “Some results in sampling theory when the units ares selected with unequal probabilities,” J.R. Statist. Soc., 15B, 262-269, (1953)

---“Design of multi-stage surveys for the estimaton of sampling errors,” Applied Statistics, 16, 152-164, (1967)

Ganguli, M., “A note on nested sampling,” Sankhya, 5, 449-452, (1941)

Hansen, M.H. and W.N. Hurwitz, “On the theory of sampling from finite populations,” Ann. Math. Statist., 14, 333-362, (1943)

---“On the determination of optimum probabilities in sampling, ” Ann. Math. Statist.,20, 426-432, (1949)

---and W.G. Madow, Sample Survey Methods and Theory, Vol. I, Jhon Wiley and Sons, New York, (1953)

Lahiri, D.N., ”Technical paper on some aspects of the development of the sample design,” Sankhya, 14, 332-362, (1954)

Mahalanobis, P.C., Report on the Sample Census of Jute in Bengal, Ind. Central Jute Committee, (1940)

Murthy, M.N. and V.K. Sethi, “Self-weighting design at tabulation stage,” National Sample Survey Working Paper, No. 5 (1959); (also Sankhya, 27B, 201-210, (1959))

---“Randomized rounded off multipliers,” J. Amer. Statist. Assoc., 56, 328-334, (1961)

Rangarajan, R., “A note o two-stage sampling,” Sankhya, 17, 373-376, (1957)

Rao, J.N.K., “On sampling with varying probabilities in sub-sampling designs,” J. Ind. Soc. Agr. Statis., 13, 211-217, (1961)

---“Alternative estimators in pps sampling for multiple characteristics,” Sankhya, 23A, 47-60, (1966)

---“Unbiased variance estimation for multi-stage designs,” Sankhya, 32A, (1975)

Roy, J., “A note on estimation of variance components in multi-stage sampling with varying probabilities,” Sankhya, 17, 367-372, (1957)

Singh, D., “The sampling with varying probabilities without replacement,” J. Ind. Soc. Agr. Statist., 6, 48-57, (1954)

---“On efficiency of cluster sampling,” J. Ind. Soc. Agr. Statist., 8, 44-55, (1956)

---“Estimates of variance components in finite populatons,” J. Ind. Soc. Agr. Statist., 10, 1-15, (1958)

Som, R.K., “Self-weignting sample design with an equal number of ultimate stage units in each of the selected penultimate stage units,” Bull. Cal. Statist. Assoc., 8, 59-66, (1959)

Sukhatme, P.V., “Efficiency of sub-sampling designs in yield surveys,” J. Ind. Soc. Agr. Statist., 2, 212-228, (1950)

Documents

Multi Stage SampLing