50
LOGO Cluster Sampling By. Kadarmanto, Ph.D

Cluster Sampling

  • Upload
    nasnan

  • View
    155

  • Download
    2

Embed Size (px)

DESCRIPTION

Cluster Sampling. By. Kadarmanto , Ph.D. Isi. Pengertian. 1. Single stage cluster sampling. 2. Equal size cluster sampling. 3. Unequal size cluster sampling. 4. Cluster sampling for proportion. 5. PPS cluster sampling. 6. Stratified cluster sampling. 7. Pengertian. - PowerPoint PPT Presentation

Citation preview

LOGO

Cluster SamplingCluster Sampling

By. Kadarmanto, Ph.D

Isi

Pengertian1

Single stage cluster sampling2

Equal size cluster sampling3

Unequal size cluster sampling4

Cluster sampling for proportion5

PPS cluster sampling6

Stratified cluster sampling7

Pengertian

Tidak tersedia kerangka sampelelemen/unit analisis

Elemen2 dalam populasi dikelompokkan (klaster), setiap

elemen dalam klaster cenderung mirip

Penarikan sampel tidak langsungke elemen/unit analisis, namunmelalui klaster dari unit analisis

/elemen

Cluster Sampling(Sampling Klaster)

Pengertian

Syarat sampling kluster: tidak boleh ada unit sampling yang

tumpah tindih atau terlewat.

Contoh: blok sensus yang terdiri dari kelompok rumah tangga yang berdekatan pada suatu wilayah tertentu dengan batas jelas.

Pengertian

Populasi

Cluster 1

Cluster M

Cluster mCluster

2

Sampel

Cluster 4

Cluster m

Mengapa cluster sampling?

Cluster samplingCluster sampling

Alasanpenggunaan

kerangka sampel ygmemuat seluruh unit

sampel secaralengkap & mutakhir

tidak tersedia

Biaya transporantarunit sampel

mahal & tidaksebanding dg

biaya penelitian perunit sampel

Pengumpulan data& operasi lapangan

mudah, murah,cepat

Kekurangan klaster

Standard error yang dihasilkan sering lebih tinggi dibandingkan dengan metode sampling lain, karena listing unit dalam klaster yang sama sering homogen.

Cara Menentukan unit yang diteliti

1Semua unit yang ada dalam klaster terpilih dimasukkan sebagai anggota sampel dan informasinya dikumpulkan(single stage/one stage cluster sampling)

2

Hanya sebagian unit dalam klaster yang terpilih sebagai sampel.(disebut multistage cluster sampling)

Banyaknya unit/karakteristik dalam klaster dpt dijadikan dasar

penarikan sampel

Peluang terpilih suatu klaster

didasarkan kriteria tertentu

Penarikan sampel berpeluang

Misal: SRS, Stratified, systematic

Contoh penerapan klaster

Klaster Unit listing/daftar unit

Elemen/unit analisis Aplikasi

(1) (2) (3) (4)

1. BS Ruta Orang Estimasi banyaknya ruta/pddk, & karakteristiknya

2. Desa Sekolah Guru/murid Estimasi banyaknya guru/murid, & karakteritiknya

3. Sekolah Kelas Murid Estimasi banyaknya guru/murid, & karakteritiknya

5. Bulan Hari Hari Estimasi rata-rata kepadatan lalu lintas.

Klaster dapat dipilih dengan berbagai metode sampling.

Kerangka sampel tergantung metode samplingnya.

Pada second stage sampling, kerangka sampel tahap kedua dibuat hanya pada usu terpilih.

Klaster vs Strata

Klaster

Stratifikasi

• Pengelompokan bdsrk unit2 yg terdekat

• Karakteristik setiap elemennya mirip

• Dapat dipilih sampel klaster

• Dibentuk bdsrkn karakteristik tertentu

• Karakteristik dalam strata homogen

• Setiap strata harus dipilih sampel

Text

Single Stage Cluster Sampling

Digunakan bila biaya utk menghasilkan setiap unit listing dalam klaster tidak lebih tinggi dari pada biaya menghasilkan sebagian dari unit listing.

Contoh: Sebuah survei ttg riwayat penyakit dimana rumah

sakit sebagai klaster dan pasiennya sebagai listing unit. Bila informasi yg dibutuhkan mengenai rangkuman riwayat pasien suddah tersedia pada database komputer mungkin lebih murah dan enak bila seluruh pasien dijadika unit listing.

Contoh

Survei ttgriwayat

penyakit,RS sbg klaster,

pasien sbgunit listing.

Bila tersediainfo riwayatpasien pddatabase

Seluruh pasiendijadikan unit

listing

Bila tersediainfo riwayatpasien pddatabase

Lebih baikpilih sampel

Equal Size Cluster Sampling (1)

ElemenCluster

1 2 ... i ... N1 Y11 Y21 ... Yi1 ... YM1

2 Y12 Y22 ... Yi2 .... ... ...j Y1j Y2j ... Yij ... YMj

. . . . . . .M Y1n Y2n ... Yin ... YMn

Total Y1. Y2. ... Yi. ... YM.

Mean Y1./n Y1./n ... Y2./n ... YM./n

Umumnya merupakan hasil dari kondisi-kondisi yang direncanakan & jarang sekali terjadi di alam atau dalam masyarakat. Misal: rokok dalam pak, mie dalam kardus, dsb.

Equal Size Cluster Sampling (2)

Rata-rata elemen cluster ke-i

Rata-rata dari rata-rata cluster sampel

Rata-rata dari rata-rata cluster populasi

M

j

iji M

yy .

n

i

in n

yy .

N

i

iN N

yY .

Equal Size Cluster Sampling (3)

Rata-rata elemen populasi

Varians (standard deviasi kuadrat) dari nilai karakteristik dalam klaster ke-i

Rata-rata simpangan kuadrat di dalam klaster (meas square within cluster)

N

i

M

j

ij

NM

yY

M

j

iiji M

yyS

1

2.2

N

i

iw N

SS

22

Equal Size Cluster Sampling (4)

Rata-rata simpangan kuadrat antar rata-rata klaster (mean square between cluster)

Rata-rata simpangan kuadrat antar elemen di dalam populasi (mean square between elemen)

N

j

Nib N

YyS

1

2

.2

N

i

M

j

ij

NM

YyS

1

2

2

Equal Size Cluster Sampling (5)

Koefisien korelasi intraklas (intraclss corelation coefficient) antar elemen di dalam klaster

menunjukkan sejauh mana hubungan karakteristik antara unit-unit dalam klaster

2

1

11 SNMM

YyYyN

i

M

kjikij

11

1 M

Equal Size Cluster Sampling (6)

Hubungan antar karakteristik makin erat

Hubungan antar karakteristik makin renggang/ tidak erat

Makin tinggi

Makin rendah

Equal Size Cluster Sampling (7)

Karakteristik dalam klaster terlalu homogen

Penggunaan klaster 1 tahaptidak efisien, (akan diwakilikarakteristik yang sama)

0 Samplingbertahap

vs metode sampling

Equal Size Cluster Sampling (8)

Teorema:Dalam SRS-WOR dari n klaster yang berisi M elemen yang berasal dari sebuah populasi N klaster, rata-rata adalah perkiraan tak bias dari dengan varians:

M=1, varians klaster akan sama dengan varians SRS (dengan nM elemen).M>1 dan positif, varians klaster akan lebih besar dari varians rata-rata per elemen.M>1 dan negatif, varians klaster akan lebih kecil dari varians rata-rata per elemen.

nyY

1111 22

MSnM

fS

n

fyV bn

Equal Size Cluster Sampling (9)

Teorema:Dalam SRS-WOR dari n klaster yang berisi M elemen yang berasal dari sebuah populasi N klaster, total populasi yang tak bias adalah:

Perkiraan varians yang berdasarkan sampel

1111ˆ 22222

MSn

fMNS

n

fMNYV bc

nc yNMY ˆ

Equal Size Cluster Sampling (10)

Relative Effisiency (Efisiensi relatif)RE merupakan perbandingan varian antara varians sampling dengan SRS.

RE sampling klaster adalah:

dengan

nM

y

ynM

yy

s

n

i

M

jij

n

i

M

jij

1 11 12 dan ;

1

11

11

1

2

2

2

2

MMS

S

Sn

f

SnM

f

yv

yvE

bb

c

SRS

Equal Size Cluster Sampling (11)

Bila klaster homogen sempurna, dan E=1/M, maka sampling klaster tidak efisien.

Bila klaster heterogen sempurna, maka

sampling klaster sangat efisien. Interpretasi RE:

E>1 , berarti klaster lebih efisien E=1, berarti sama efisien E<1, berarti SRS lebih efisien.

1,02 wS

,11dan ,0, 222 MSSS bw

Equal Size Cluster Sampling (12)

Menghitung RE dengan menduga dari sampel.

Untuk N besar, rumus RE dapat disederhanakan menjadi:

22

22

11

wb

wb

sMnMsn

nsMsn

eM

e

sM

sM

Me

b

w

1

1ˆ sehingga ,

1122

2

Equal Size Cluster Sampling (13)

Design effect / Deff (Efek dari desain)Deff klaster yaitu membandingkan metode sampling klaster dengan metode SRS.

rdiperoleh dari survei yang pernah dilakukan dengan menghitung varians dari klaster, dan dari SRS.

Pendekatan deff:

SRS

c

yV

yVMDeff 11

SRS

c

yv

yvrohMDeff 11

Equal Size Cluster Sampling (14)

Ukuran klaster

(M) diketahui

Deff dapat

dihitung

dapat dihitung dari suatu survei

1

1

M

Deff

M dapat disesuaikan untuk mendapatkan deff yang sesuai, sehingga mengarah ke sampling bertahap, dg menyesuaikan n (klaster terpilih) dan m (unit terpilih dalam klaster).

Unequal Size Cluster Sampling (1)

Bila ukuran klaster tidak sama (setiap klaster memiliki banyaknya unit yang berbeda-beda, Mi ≠ M), maka rata-rata unit pada setiap klaster adalah:

iM

jij

ii yM

y1.

.

1

Unequal Size Cluster Sampling (2)

Rata-rata dapat dihitung dengan 3 cara:1) Rata-rata karakteristik per unit dari sebanyak

n sampel klaster, yang diperhitungkan dari rata-rata klater tanpa ditimbang dengan Mi.

Penduga ini bias. Variansnya:

n

iin y

ny

1.

1

2.

2b

2

1

1sdengan

1nibn yy

ns

n

fyv

Unequal Size Cluster Sampling (3)

2) Rata-rata karakteristik per unit dari sebanyak n sampel klaster, yang diperhitungkan dari karakteristik seluruh unit dalam sampel:

Penduga ini bersifat bias, namun konsisten. Variansnya:

;

n

ii

n

i

M

jij

n

ii

n

iii

n

M

y

M

yMy

i

1

1 1

1

1.

2.

2b

2

1

1sdengan

1nibn yy

ns

n

fyv

n

iiMn

M1

.

1

3) Rata-rata karakteristik per unit dari sebanyak n sampel klaster, yang memperhitungkan rata-rata unit per klaster dari populasi:

Penduga ini tak bias. Variansnya:

N

ji

n

i

M

jijn M

NMy

Mny

i

11 1

* 1dengan ,

1

11

1 1

2*.

2**

nn

yM

yM

fsn

fyv

n

in

ii

bn

Unequal Size Cluster Sampling (4)

Dari penghitungan rata-rata , yang

paling sering digunakan adalah estimasi rata-

rata cara ke-2 ( ) , karena telah

memperhitungkan ukuran klaster, dan tidak

berpengaruh terhadap perubahan ukuran

klaster pada frame dan survei.

*,, nnn yyy

ny

Unequal Size Cluster Sampling (5)

Estimasi total dilakukan dg mengalikan dengan banyaknya unit dalam populasi, yaitu:

atau

Bila Mi diketahui untuk N klaster

n

1i

in

MMdengan MN

NMMdengan

N

1i

i

MN

Unequal Size Cluster Sampling (6)

Etimasi total:*ˆatau ˆnyMNYyMNY

Cluster Sampling for Proportion

Misalkan yij merupakan suatu nilai variabel kualitatif, tidak memiliki satuan ukur, dan terdiri atas kategori-kategori yang kongkrit.

Estimator tak bias bagi proporsi elemen-elemen populasi:

tsbkategori memenuhi tidak yangunit utk 0

diteliti yang kategori memenuhi yangunit utk 1ijy

N

ii

N

ii

M

aP

1

1

Cluster Sampling for Proportion

Ada 3 pilihan estimator bagi proporsi elemen-elemen yang memiliki kategori tertentu:

1) Proporsi tak tertimbang

Variansnya

i

ii

n

iinc M

app

nPP

dengan 1ˆ

1

n

ininc pp

nn

fpvPv

11

Cluster Sampling for Proportion

2) Proporsi tertimbang terhadap banyaknya elemen (Mi) dalam sampel klaster

Variansnya

n

ii

n

ii

c

M

apP

1

1

1ˆ2

1

2.

2

nM

ppM

n

fPv

n

iii

c

Cluster Sampling for Proportion

3) Tertimbang terhadap rata-rata banyaknya elemen per klaster dalam sampel populasi:

Variansnya

Mn

apP

n

ii

c

1**ˆ

2

1

**

1

n

i

iic p

M

PM

nn

fPv

PPS Cluster Sampling

Bila peluang terpilihnya setiap klaster tidak sama (pi),

Bila digunakan peluang dengan pemulihan:

atau

N

iip

1

1

n

i

M

jij

i

i

ypn

Y1 1

11ˆX

Xp ii

PPS Cluster Sampling

atau

i

ijiij p

y

M

Mz

0

i

M

jij

i

iii pM

y

p

y

M

Mz

i

0

1.

0.

i

M

jij

i p

y

z

i

1

. n

zz

n

in

n

1

11

2.

nn

zzzv

n

ini

n

PPS Cluster Sampling

Bila digunakan peluang dan dengan ulangan, maka

Dengan varians

0M

Mp ii

n

yz

n

ii

n

1

.

11

2.

nn

yyzv

n

ini

n

Stratified Cluster Sampling

Prinsip strata:membagi populasi menjadi subpopulasi baik untuk efisiensi disesuaikan dengan level penyajian, maupun disesuaikan dengan keadaan administrasi.

Estimasi dilakukan melalui masing-masing strata

Stratified Cluster Sampling

Estimasi strata 1

EstimasiStrata 2

EstimasiStrata n

Estimasi

provinsi

Stratified Cluster Sampling

Secara umum, estimasi total dapat dihitung dg 3 cara (sesuai dg pehitungan rata-ratanya)

1) Estimasi total tak tertimbang

hhnhhst yMNY

h

n

ihi

h n

MM

1

L

h

L

hhnhhst YvyvMNYv

1 1

22 ˆˆ

Stratified Cluster Sampling

2) Estimasi total yang diperhitungkan dari seluruh unit dalam sampel

3) Estimasi total dengan memperhitungkan rata-rata unit per klaster dari populasi

L

hhnhhst hyMNY

1

ˆh

n

ihi

h n

MM

1

L

hhnhhst YvyvMNYv

1

22 ˆˆ

L

hhnhhst hyMNY

1

***ˆh

N

ihi

h N

MM

h

1*

L

hhhhhst YvyvMNYv

1

**2*2* ˆˆ

Standard Error/Sampling Error

Standard Error (se) merupakan akar dari varians:

Relatif kesalahannya (RSE):

c

c

Y

YvRSE

ˆ

ˆ

c

c

Y

YvRSE

ˆ

ˆ

cc YvYse ˆˆ cc YvYse ˆˆ

Ukuran klaster yang optimal (1)

Ukuran klaster biasanya besar, dan homogen

Memperkecil ukuran klaster, dan

memperbesar klaster terpilih

(m↓, n↑)

Klaster 1 tahap kurang efisien

Klaster bertahap

lebih efisien

Ukuran klaster yang optimal (2)

Ukuran sampel

yg optimal

Sebag. Unit dlm klaster yg

diteliti

Banyaknya unit dlm tiap

disesuaikan dg biaya

Mempertim-bangkan tingkat

ketelitian yg dikehendaki

LOGO

Have a nice sampling..