25
97 4 Pengambilan sampel dan distribusi sampling 4.1 Pendahuluan Ilmu Statistik pada dasarnya berkaitan dengan penarikan kesimpulan/generalisasi, yang meliputi pendugaan dan pengujian tentang karakteristik populasi berdasarkan informasi yang diperoleh dari sampel. Misalnya, seorang wartawan mengatakan bahwa 75% penduduk menghendaki agar seorang ‘putra daerah’ dapat terpilih sebagai bupati di daerah tersebut, berdasarkan hasil wawancaranya dengan beberapa orang penduduk di suatu tempat. Pernyataan ini merupakan kesimpulan wartawan tersebut tentang keadaan suatu populasi (penduduk di daerah tersebut) berdasarkan sampel yang diambilnya (beberapa orang penduduk yang diwawan- carainya). Dalam kasus ini, parameter populasinya adalah proporsi keinginan seluruh masyarakat di daerah tersebut, sedangkan statistik sampelnya adalah proporsi keinginan dari penduduk yang diwawancarainya saja. Contoh lain, misalnya suatu perguruan tinggi bermaksud untuk menaikkan uang kuliah bagi mahasiswanya. Salah satu pertimbangan dalam menentukan besar kenaikan uang kuliah tersebut, diantaranya adalah rata-rata penghasilan orang tua mahasiswa di perguruan tinggi tersebut. Untuk mengetahui hal ini, dilakukan sur- vey terhadap 100 mahasiswa yang masing-masing ditanya tentang besar peng- hasilan orang tuanya per bulan. Dalam kasus ini kita melakukan pendugaan terhadap parameter populasi, yaitu rata-rata penghasilan per bulan dari seluruh orang tua mahasiswa di perguruan tinggi tersebut, dengan mengunakan statistik sampel, yaitu rata-rata penghasilan per bulan dari ke 100 orang tua mahasiswa yang disurvey. Prosedur pendugaan parameter populasi akan dibahas secara rinci dalam bab 5. Pada kasus yang lain, misalnya diketahui bahwa rata-rata produksi padi di suatu daerah di Kalimantan Barat adalah 2,65 ton/ha. Akhir-akhir ini Dinas Pertanian di daerah tersebut telah memperkenalkan suatu varietas unggul kepada petani untuk dikembangkan di daerah tersebut. Diharapkan introduksi varietas unggul tersebut dapat meningkatkan produksi padi di daerah tersebut. Untuk menguji anggapan tersebut, maka Dinas Pertanian mengambil sampel berupa beberapa petak sawah di daerah tersebut yang ditanami oleh varietas unggul dimaksud (hal ini biasa dilakukan dengan mengambil sample melalui ‘ubinan’), lalu dihitung rata-rata produksinya. Dalam kasus ini kita dihadapkan pada pengujian hipotesis tentang

4 Dist Sampling

Embed Size (px)

DESCRIPTION

Perkuliahan Dasar Statistik

Citation preview

Page 1: 4 Dist Sampling

97

44444444 PPeennggaammbbii llaann ssaammppeell ddaann

dd iisstt rr iibbuussii ssaammppll iinngg

4.1 Pendahuluan

Ilmu Statistik pada dasarnya berkaitan dengan penarikan kesimpulan/generalisasi, yang meliputi pendugaan dan pengujian tentang karakteristik populasi berdasarkan informasi yang diperoleh dari sampel. Misalnya, seorang wartawan mengatakan bahwa 75% penduduk menghendaki agar seorang ‘putra daerah’ dapat terpilih sebagai bupati di daerah tersebut, berdasarkan hasil wawancaranya dengan beberapa orang penduduk di suatu tempat. Pernyataan ini merupakan kesimpulan wartawan tersebut tentang keadaan suatu populasi (penduduk di daerah tersebut) berdasarkan sampel yang diambilnya (beberapa orang penduduk yang diwawan-carainya). Dalam kasus ini, parameter populasinya adalah proporsi keinginan seluruh masyarakat di daerah tersebut, sedangkan statistik sampelnya adalah proporsi keinginan dari penduduk yang diwawancarainya saja.

Contoh lain, misalnya suatu perguruan tinggi bermaksud untuk menaikkan uang kuliah bagi mahasiswanya. Salah satu pertimbangan dalam menentukan besar kenaikan uang kuliah tersebut, diantaranya adalah rata-rata penghasilan orang tua mahasiswa di perguruan tinggi tersebut. Untuk mengetahui hal ini, dilakukan sur-vey terhadap 100 mahasiswa yang masing-masing ditanya tentang besar peng-hasilan orang tuanya per bulan. Dalam kasus ini kita melakukan pendugaan terhadap parameter populasi, yaitu rata-rata penghasilan per bulan dari seluruh orang tua mahasiswa di perguruan tinggi tersebut, dengan mengunakan statistik sampel, yaitu rata-rata penghasilan per bulan dari ke 100 orang tua mahasiswa yang disurvey. Prosedur pendugaan parameter populasi akan dibahas secara rinci dalam bab 5.

Pada kasus yang lain, misalnya diketahui bahwa rata-rata produksi padi di suatu daerah di Kalimantan Barat adalah 2,65 ton/ha. Akhir-akhir ini Dinas Pertanian di daerah tersebut telah memperkenalkan suatu varietas unggul kepada petani untuk dikembangkan di daerah tersebut. Diharapkan introduksi varietas unggul tersebut dapat meningkatkan produksi padi di daerah tersebut. Untuk menguji anggapan tersebut, maka Dinas Pertanian mengambil sampel berupa beberapa petak sawah di daerah tersebut yang ditanami oleh varietas unggul dimaksud (hal ini biasa dilakukan dengan mengambil sample melalui ‘ubinan’), lalu dihitung rata-rata produksinya. Dalam kasus ini kita dihadapkan pada pengujian hipotesis tentang

Page 2: 4 Dist Sampling

98

rata-rata produksi padi di daerah tersebut. Prosedur pengujian hipotesis tentang parameter populasi akan dibahas dalam bab 6.

Alasan utama dilakukannya pengambilan sampel dalam mengamati suatu pe-nomena pada umumnya adalah karena keterbatasan dalam pembiayaan, tenaga dan waktu yang tersedia. Penggunaan Statistik Inferensial sangat membantu da-lam mengambil kesimpulan tentang keadaan populasi dengan berdasarkan pada informasi yang berasal dari suatu sampel yang ukurannya jauh lebih kecil dari ukuran populasinya.

Dalam setiap kasus di atas, nilai statistik dihitung semata-mata berdasarkan atas sampel yang diambil dari suatu populasi, dan kesimpulan tentang parameter po-pulasi diambil berdasarkan informasi dari sampel tersebut. Kita tidak pernah tahu secara pasti apakah kesimpulan tersebut salah atau benar, karena nilai statistik sampel dapat berubah tergantung pada nilai pengamatan yang terkandung dalam sampel tersebut. Oleh karena itu, statistik sampel juga merupakan suatu variabel acak karena dari suatu populasi yang sama dapat diambil berbagai sampel yang berbeda, masing-masing dengan statistik sampel yang berbeda pula. Sebagai suatu variabel acak, statistik sampel mempunyai distribusi peluang tersendiri yang disebut distribusi sampling. Keragaman statistik sampel tersebut akan sangat tergantung pada ukuran populasi, ukuran sampel dan metode penarikan sampelnya.

Definisi Distribusi peluang statistik sampel disebut distribusi sampling (sampling distribution) dari statistik tersebut.

Bab ini akan membahas beberapa distribusi sampling yang dianggap penting kare-na sering digunakan dalam ilmu statistik. Sedangkan aplikasi dari distribusi sam-pling tersebut akan dibahas secara lebih rinci dalam bab 5 dan 6.

4.2 Penarikan sampel secara acak

Suatu sampel disebut sebagai sampel acak (random sample) jika setiap anggota populasi mempunyai kesempatan yang sama untuk terpilih sebagai anggota sampel tersebut. Salah satu cara untuk melakukan penarikan sampel secara acak adalah menomori setiap anggota populasi. Kemudian menuliskan nomor-nomor tersebut, masing-masing ke dalam secarik kertas, biasanya kertas tersebut digu-lung dan dimasukkan ke dalam sebuah wadah. Gulungan-gulungan kertas tersebut kemudian diaduk, lalu beberapa gulungan (sesuai dengan ukuran sampel yang dikehendaki, n) diambil dari wadah tersebut sebagai sampel. Cara seperti ini biasa dilakukan dalam penentuan pemenang arisan bulanan dan penarikan undian.

Page 3: 4 Dist Sampling

99

Dalam kasus tertentu ada kalanya anggota populasi telah mempunyai nomor tersendiri. Misalnya setiap mahasiswa mempunyai nomor mahasiswa yang khu-sus, nomor induk pegawai bagi pegawai negeri atau pegawai suatu perusahaan, nomor kartu tanda penduduk, dan sebagainya. Dalam hal ini nomor-nomor khusus tersebut dapat langsung digunakan dalam penarikan sampel secara acak.

Dalam kasus lain, nomor khusus yang telah dimiliki anggota populasi kadang-kadang tidak dapat digunakan secara langsung untuk keperluan pengambilan sampel. Misalnya, nomor telepon yang terdaftar dalam buku telepon tidak dapat kita gunakan sebagai sumber pengambilan sampel karena tidak semua orang memiliki telepon dan tidak semua pemilik telepon terdaftar dalam buku tersebut, selain itu ada yang hanya memiliki satu jalur telepon dan ada juga yang memiliki lebih dari satu jalur telepon. Dengan demikian, setiap anggota populasi tidak mempunyai kesempatan yang sama untuk terpilih sebagai anggota sampel.

Setelah semua anggota populasi terdaftar dan masing-masing mempunyai nomor yang khusus, maka penarikan sampel dapat dilakukan dengan memilih nomor-nomor tersebut secara acak. Sampel yang benar-benar acak pada kenyataannya hampir tidak mungkin kita peroleh, karena peluang terpilihnya anggota sampel tidak akan selalu sama persis. Namun demikian, kita dapat berusaha sebaik mungkin, paling tidak untuk meminimumkan unsur subjektifitas dalam pemilihan anggota sampel.

Selain dengan menggunakan gulungan kertas seperti telah dikemukakan di atas, salah satu cara yang biasa dilakukan adalah dengan meng-gunakan bantuan tabel bilangan acak (random numbers). Tabel bilangan acak (lihat Tabel Lampiran 1) adalah suatu tabel yang terdiri atas angka-angka 0 sampai 9 yang dibuat sedemikian rupa sehingga angka-angka tersebut tersebar secara acak dan mempunyai peluang yang sama untuk terjadi. Misalnya, jika kita akan mengambil sampel acak berukuran n = 3 dari suatu populasi yang berukuran 10, maka langkah pertama adalah memberikan nomor kepada setiap anggota populasi tersebut mulai dari 0 sampai 9. Kemudian, tentukan suatu titik awal dalam Tabel Lampiran 1 secara sembarang, tiga angka di sebelah kanan titik awal tersebut dapat digunakan sebagai representasi dari tiga individu yang terpilih sebagai anggota sampel acak yang dimaksud. Ketiga individu anggota sampel acak tersebut dapat juga dipilih dengan cara menentukan tiga angka di sebelah kiri, di atas maupun di bawah titik awal tersebut.

Contoh 4.1

Misalnya kita akan mengambil suatu sampel berukuran n = 14 dari suatu populasi yang terdiri atas 672 orang penduduk di suatu kampung. Untuk itu, setiap penduduk kita beri kode dengan nomor mulai dari 0 sampai 671 (atau dari 1 sampai 672). Ke-14 orang yang akan kita pilih sebagai sampel acak ditentukan dengan menggunakan Tabel Lampiran 1. Misalkan titik awalnya adalah baris ke 13 kolom ke 7 dengan arah menurun. Dengan cara ini maka nomor yang terpilih adalah seperti tercantum dalam tabel berikut:

Page 4: 4 Dist Sampling

100

264 � 031 � 033 � 587 �

705 � 098 � 258 � 671 �

216 � 004 � 748 �

738 � 038 � 167 �

616 � 504 � 201 �

Perhatikan bahwa kita harus mengambil lebih dari 14 nomor dari tabel tersebut karena beberapa nomor yang terpilih harus kita coret (ditandai dengan �) karena lebih besar dari 671 (kode tertinggi yang kita berikan untuk penduduk di kampung tersebut). Sehingga sampel acak yang dimaksud terdiri atas penduduk dengan nomor kode berikut:

264 4 167

216 38 201

616 504 587

31 33 671

98 258

Karena setiap anggota populasi diusahakan agar mempunyai peluang yang sama untuk terpilih sebagai anggota sampel, maka nilai peluang bagi sampel yang diambil secara acak dapat kita tentukan. Nilai peluang tersebut dapat kita gunakan untuk membuat inferens tentang karakteristik populasinya. Sampel yang diambil secara tidak acak (nonrandom samples) tidak kita ketahui peluangnya sehingga tidak dapat kita gunakan untuk melakukan inferens. Selain itu, sampel yang demi-kian seringkali terdistorsi oleh bias, yang terjadi karena terciptanya suatu keadaan yang ‘terlalu mewakili’ atau ‘kurang mewakili’ bagian tertentu dari populasinya.

Pengambilan sampel secara acak dapat dilakukan baik dengan program MINITAB maupun Excel. Untuk itu, daftar individu yang akan disampel harus disimpan dulu dalam suatu kolom, misalnya dalam kolom C1 untuk MINITAB atau dalam kolom A untuk Excel.

Dalam MINITAB penarikan sampel dilakukan dengan memilih menu

Calc ���� Random Data ���� Sample From Columns...

Perintah tersebut akan mengaktifkan jendela Sample From Columns seperti

terlihat dalam gambar 4.1.

Page 5: 4 Dist Sampling

101

Gambar 4.1 Tampilan jendela penarikan sampel dalam MINITAB

Dalam Excel penarikan sampel dilakukan dengan memilih menu

Tools ���� Data Analysis

lalu pilih Sampling dalam jendela Data Analysis. Perintah tersebut akan

mengaktifkan jendela Sampling seperti terlihat dalam gambar 4.2.

Gambar 4.2 Jendela penarikan sampel dalam Excel

Page 6: 4 Dist Sampling

102

4.3 Distribusi sampling bagi nilai rata-rata sampel ( )X

Untuk memberikan ilustrasi tentang betapa pentingnya distribusi sampling dalam statistik inferensial, perhatikan persoalan berikut ini. Sebuah perusahaan besar yang bergerak di bidang pasar swalayan mempunyai ratusan toko yang tersebar di hampir setiap kota besar dengan rata-rata volume penjualan setiap harinya adalah Rp 40 juta per toko. Dalam rangka meningkatkan volume penjualannya, perusa-haan tersebut mengadakan promosi, dimana selama masa promosi tersebut, setiap pembeli mendapat potongan harga sebesar 10%. Misalkan selama masa promosi tersebut diambil secara acak 30 buah toko milik perusahaan tersebut, dan dari sampel tersebut diketahui bahwa rata-rata penjualan per harinya adalah Rp 41 juta, dapatkah kita simpulkan bahwa promosi tersebut telah secara efektif me-ningkatkan volume penjualan perusahaan tersebut?

Dalam kasus di atas, kita dihadapkan pada persoalan yang berkaitan dengan pen-

dugaan dan pengujian tentang parameter populasi µ, yaitu rata-rata volume pen-jualan per hari dari semua toko yang dimiliki oleh perusahaan tersebut. Jika pro-

mosi tersebut telah secara efektif meningkatkan volume penjualan, maka µ harus-lah lebih besar dari Rp 40 juta. Akan tetapi, informasi yang kita punyai hanyalah

statistik x dari 30 buah toko yang merupakan suatu sampel acak. Melihat ke-nyataan tersebut kita dapat serta merta berkesimpulan bahwa promosi tersebut

telah meningkatkan volume penjualan perusahaan tersebut, karena x (= Rp 41 juta) lebih besar dari Rp 40 juta. Akan tetapi, hal ini belum tentu sepenuhnya

benar. Pengambilan keputusan tentang parameter populasi µ sangat tergantung

pada seberapa dekat nilai statistik x terhadap nilai parameter µ. Jika kita percaya

bahwa nilai x sangat mendekati nilai µ, maka dapat kita simpulkan bahwa µ lebih

besar dari Rp 40 juta. Akan tetapi, jika nilai x sangat berbeda dengan nilai µ,

maka nilai µ yang sebenarnya mungkin masih sekitar Rp 40 juta, atau bahkan dapat saja lebih kecil dari Rp 40 juta. Sayangnya, dari informasi yang tersedia,

kita tidak dapat menentukan hubungan kedekatan antara x dengan µ. Untuk

menjawab persoalan tersebut kita harus mengetahui distribusi sampling dari x .

Untuk memberikan gambaran tentang distribusi sampling secara lebih jelas, perhatikan contoh sederhana berikut ini. Misalkan dalam suatu wadah terdapat empat buah kelereng yang yang ditandai dengan angka 5, 6, 7 dan 8. Misalkan keempat kelereng tersebut dapat kita anggap sebagai suatu populasi dari variabel X, yaitu angka yang tertera pada setiap kelereng tersebut. Maka, distribusi peluang bagi variabel X adalah

x 5 6 7 8

p(x) ¼ ¼ ¼ ¼

dan rata-rata populasinya (nilai harapan bagi X) adalah

21

41

41

41

41 6)(8)(7)(6)(5)( =+++=⋅= ∑ xpxxµ

Page 7: 4 Dist Sampling

103

serta varians populasinya adalah

( )

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )41

41

2

21

41

2

21

41

2

21

41

2

21

22

168676665

)(

=⋅−+⋅−+⋅−+⋅−=

⋅−= ∑ xpx xi µσ

Andaikan rata-rata populasi tesebut (µx) tidak kita ketahui dan kita bermaksud menduga nilainya dengan mengambil suatu sampel berukuran n = 2. Pada prakteknya, biasanya kita hanya mengambil satu sampel saja sehingga hanya

akan ada satu nilai x saja, tetapi untuk melihat hubungan antara x dengan µx, kita akan memeriksa semua kemungkinan sampel berukuran n = 2. Misalkan sampel tersebut diambil dengan pengembalian, artinya kita ambil satu buah kelereng lalu angka yang tertera pada kelereng tersebut kita catat, kemudian kelereng tersebut kita kembalikan ke dalam wadah sebelum kita mengambil kelereng yang kedua. Dengan cara ini, akan terdapat 16 kemungkinan sampel yang dapat terambil yang masing-masing menghasilkan satu nilai rata-rata sampel

x . Karena rata-rata sampel x tersebut nilainya bervariasi secara acak dari satu

sampel ke sampel lainnya, maka x dapat dianggap sebagai suatu nilai dari

sebuah variabel baru, yaitu X , yang dibangkitkan oleh prosedur pengambilan sampel tersebut. Ke-16 kemungkinan sampel tersebut beserta nilai rata-ratanya disajikan dalam tabel 4.1.

Tabel 4.1 Daftar semua kemungkinan sampel berukuran n = 2, dengan pengembalian, dari suatu populasi berukuran N = 4

No. Sampel x No. Sampel x

1 5; 5 5 9 7; 5 6

2 5; 6 5½ 10 7; 6 6½

3 5; 7 6 11 7; 7 7

4 5; 8 6½ 12 7; 8 7½

5 6; 5 5½ 13 8; 5 6½

6 6; 6 6 14 8; 6 7

7 6; 7 6½ 15 8; 7 7½

8 6; 8 7 16 8; 8 8

Karena setiap sampel mempunyai peluang yang sama untuk terambil, maka peluang masing-masing sampel tersebut adalah 1/16. Perhatikan bahwa nilai rata-rata sampel bervariasi, mulai dari 5 sampai 8, tergantung pada nilai X yang

terambil sebagai sampel. Nilai x = 5 terjadi hanya satu kali, sehingga peluangnya

adalah 1/16, sedangkan nilai x = 5½ dapat terjadi melalui dua cara, yaitu jika

Page 8: 4 Dist Sampling

104

sampel yang terambil adalah (5; 6) atau (6; 5), sehingga peluangnya adalah 2/16.

Peluang bagi nilai-nilai x lainnya dapat ditentukan dengan cara yang sama. Keseluruhan nilai-nilai tersebut membentuk suatu distribusi peluang bagi rata-rata

sampel yang disebut juga distribusi sampling bagi X . Distribusi sampling bagi X disajikan dalam tabel 4.2.

Tabel 4.2 Distribusi sampling bagi rata-rata sampel

x )(xp

5 1/16

5,5 2/16

6 3/16

6,5 4/16

7 3/16

7,5 2/16

8 1/16

Nilai harapan bagi variabel X adalah

( )( ) ( ) ( ) 5,685,55

)(

161

162

161 =+++=

⋅=

=

∑L

xpx

xExµ

dan variansnya adalah

( )( ) ( )

( ) ( ) ( ) ( ) ( ) ( ) 625,05,685,65,55,65 1612

1622

1612

2

2

=−++−+−=

⋅−=

=

∑L

xpx

xVar

x

x

µ

σ

Distribusi peluang bagi populasi X dan distribusi sampling bagi X disajikan dalam

gambar 4.3. Perhatikan bahwa bentuk distribusi sampling bagi X sangat berbeda dengan distribusi populasi asalnya, akan tetapi nilai harapannya sama dengan nilai

harapan populasi asalnya, yaitu 6,5. Dalam hal ini xµ = µ . Hal lain yang dapat

kita lihat adalah bahwa, varians dari kedua distribusi tersebut ternyata tidak sama.

Hasil perhitungan kita menunjukkan bahwa σ2 = 1,25 sedangkan 625.02 =xσ .

Keadaan ini menunjukkan bahwa varians dari rata-rata sampel lebih kecil daripada varians populasinya, dan hal ini berlaku umum. Perhatikan bahwa

Page 9: 4 Dist Sampling

105

625,02

25,122 ===

nx

σσ . Artinya, semakin besar ukuran sampelnya maka varians

rata-rata sampelnya akan semakin kecil. Simpangan baku dari rata-rata sam-

pel, xσ , disebut sebagai galat baku (standard error) bagi rata-rata, dan

merupakan suatu ukuran keragaman nilai rata-rata dari satu sampel ke sampel lainnya.

0

0.25

5 6 7 8 x

p(x)

0

0.25

5 5,5 6 6,5 7 7,5 8

p(x)

X

(a) Distribusi peluang bagi populasi X (b) Distribusi sampling bagi X

Gambar 4.3 Distribusi peluang bagi X dan X

Andaikan sampel yang kita ambil tanpa pengembalian, artinya kita ambil dua buah kelereng sekaligus, maka dengan cara ini akan terdapat 6 kemungkinan sampel yang terambil (tabel 4.3). Dengan cara inipun, kita peroleh bahwa rata-rata dari ke-6 nilai rata-rata sampel sama dengan rata-rata populasi, yaitu 6½. Sedangkan

variansnya adalah 4167,01252 ==xσ

Tabel 4.3 Daftar semua kemungkinan sampel berukuran n = 2, tanpa pengembalian, dari suatu populasi berukuran N = 4

No. Sampel x

1 5; 6 5½

2 5; 7 6

3 5; 8 6½

4 6; 7 6½

5 6; 8 7

6 7; 8 7½

Page 10: 4 Dist Sampling

106

Secara umum, dapat ditunjukkan bahwa rata-rata dan varians dari suatu distribusi

sampling X tergantung pada nilai rata-rata dan varians populasinya serta ukuran sampelnya.

Aturan 4.1

Jika suatu sampel acak berukuran n diambil dari suatu populasi yang

mempunyai rata-rata µ dan varians σ2, maka:

(i) distribusi sampling dari X akan mempunyai nilai harapan sama

dengan µ

( ) µµ == xXE .......................................................................... [4.1]

(ii) jika populasinya tidak terbatas (sangat besar) atau jika penarikan

sampelnya dilakukan dengan pengembalian maka varians dari X adalah

( )n

XVar x

22 σ

σ == .................................................................... [4.2]

(iii) jika penarikan sampel dilakukan tanpa pengembalian dari suatu

populasi yang berukuran N (terbatas) maka varians dari X adalah

( )

−−

==1

22

N

nN

nXVar x

σσ ....................................................... [4.3]

Dalam contoh di atas terlihat betapa distribusi sampling dari X mempunyai bentuk seperti genta yang simetris (gambar 4.3.b), padahal populasi asalnya mempunyai bentuk distribusi yang seragam (gambar 4.3.a). Sesungguhnya keadaan ini

berlaku umum, yaitu bahwa, bentuk distribusi sampling dari X akan semakin mendekati distribusi Normal dengan semakin besarnya ukuran sampelnya dan hal ini tidak tergantung pada bentuk distribusi populasi asalnya. Keadaan ini dirumuskan dalam sebuah dalil yang sangat penting dalam statistik, yaitu dalil limit pusat (central limit theorem).

Aturan 4.2 Dalil limit pusat

Misalkan x1, x2, ..., xn adalah suatu sampel acak yang diambil dari suatu

populasi yang mempunyai rata-rata µ dan varians σ2. Misalkan pula rata-rata

sampel tersebut adalah X . Jika n cukup besar maka distribusi sampling

Page 11: 4 Dist Sampling

107

bagi X akan mendekati distribusi Normal dengan rata-rata µ dan varians

n

2σ.

Dalil tersebut mungkin tidak akan terlalu bermanfaat jika pendekatan terhadap distribusi Normal tersebut hanya berlaku ketika n sangat besar. Namun demikian, kenyataan menunjukkan bahwa pendekatan tersebut ternyata cukup baik pada banyak kasus, bahkan ketika ukuran sampelnya kecil. Beberapa konvensi yang sering digunakan berkaitan dengan penerapan Dalil limit pusat ini diantaranya adalah sebagai berikut:

(i) pada umumnya, distribusi sampling dari X akan mendekati distribusi Normal jika ukuran sampelnya lebih besar dari 30

(ii) jika distribusi populasi asalnya simetris, maka distribusi sampling dari X akan mendekati distribusi Normal jika ukuran sampelnya lebih besar dari 15

(iii) jika populasi asalnya berdistribusi Normal, maka distribusi sampling dari

X juga akan berdistribusi Normal berapapun ukuran sampelnya

Dalil tersebut memungkinkan kita untuk membuat inferens tentang rata-rata populasi tanpa harus secara khusus mengetahui bentuk distribusi populasinya. Oleh karena itu, dalil limit pusat mempunyai peranan yang penting dalam penggunaan statistik inferensial untuk menarik kesimpulan tentang keadaan populasi.

Contoh 4.2

Sebuah perusahaan pupuk organik cair menjual produksinya dalam botol kemasan berisi 1 liter. Diketahui bahwa isi botol tersebut sebenarnya berdistribusi Normal dengan rata-rata 1,02 liter dan simpangan baku 0,04 liter.

a. Jika seseorang membeli satu botol pupuk cair tersebut, tentukan nilai peluangnya bahwa botol tersebut berisi paling tidak 1 liter larutan

b. Jika seorang ketua kelompok tani membeli 20 botol untuk keperluan anggota kelompok taninya, tentukan peluangnya bahwa rata-rata dari ke-20 botol tersebut paling sedikit adalah 1 liter per botol.

Penyelesaian

a. Dalam hal ini kita harus menentukan nilai P(X > 1) jika diketahui bahwa X

berdistribusi Normal dengan µ =1,02 dan σ = 0,04. Oleh karena itu, nilai peluangnya dapat ditentukan dengan bantuan Tabel Normal baku (Tabel Lampiran 2) dengan terlebih dahulu mentransformasi nilai variabel X menjadi Z. Nilai z untuk x = 1 adalah

Page 12: 4 Dist Sampling

108

5,004,0

02,11−=

−=

−=

σµx

z

dari tabel normal baku diperoleh bahwa P(X > 1) = P(Z > –0,5) = 0,6915

b. Untuk kasus kedua, kita diminta untuk menghitung peluang bahwa rata-rata dari suatu sampel berukuran n = 20 lebih dari 1 liter. Artinya kita ingin

mengetahui P( X > 1). Dengan dalil limit pusat kita tahu bahwa X

merupakan variabel acak yang berdistribusi Normal dengan 02,1== µµ x dan

00894,020

04,0===

nx

σσ . Dengan transformasi Z, maka

( )( ) 9875,024,2

00894,0

02,111

=−>=

−>

−=>

zP

xPXP

x

x

σµ

Pada awal bagian 4.3 ini, dikemukakan persoalan yang dihadapi oleh perusahaan pasar swalayan dalam mengevaluasi rata-rata volume penjualan selama masa promosi. Pada dasarnya, persoalannya adalah: jika dari suatu sampel yang

berukuran n = 30 diperoleh rata-rata penjualan per hari ( x ) sebesar Rp 41 juta per toko, dapatkah kita kita katakan bahwa rata-rata penjualan per hari dari seluruh

toko yang dimiliki perusahaan tersebut (µ) lebih besar dari Rp 40 juta?

Misalkan simpangan baku populasi volume penjualan per harinya (σ) adalah Rp 10

juta. Dengan dalil limit pusat kita ketahui bahwa x akan mendekati distribusi

Normal dengan µµ =x dan 742.825.130

000.000.10===

nx

σσ . Jika kita asum-

sikan bahwa rata-rata volume penjualan selama masa promosi adalah Rp 40 juta, maka

( )( ) 2912,055,0

742.825.1

000.000.40000.000.41000.000.41

=>=

−>

−=>

zP

xPXP

x

x

σµ

Keadaan ini menunjukan bahwa x mempunyai peluang yang cukup besar untuk

bernilai sebesar Rp 41 juta. Artinya, untuk populasi tersebut (dengan µ = Rp 40

juta dan σ = Rp 10 juta), diperolehnya nilai rata-rata sampel sebesar Rp 41 juta merupakan suatu hal yang tidak istimewa. Sehingga dapat kita simpulkan bahwa rata-rata populasi volume penjualan perusahan tersebut selama masa promosi adalah masih sekitar Rp 40 juta. Dengan demikian, dapat kita katakan bahwa

Page 13: 4 Dist Sampling

109

promosi yang dilakukan oleh perusahaan tersebut tidak berhasil meningkatkan volume penjualannya.

Akan tetapi, andaikan simpangan baku populasi volume penjualan per harinya (σ)

adalah Rp 2,5 juta, maka 435.45630

000.500.2===

nx

σσ sehingga

( )( ) 0143,019,2

435.456

000.000.40000.000.41000.000.41

=>=

−>

−=>

zP

xPXP

x

x

σµ

Hal ini menunjukkan bahwa kecil sekali kemungkinannya untuk memperoleh suatu

nilai x yang lebih dari Rp 41 juta, jika rata-rata populasi sebenarnya adalah Rp 40 juta. Oleh karena itu, dalam kasus ini kita dapat mengatakan bahwa promosi yang dilakukan perusahaan tersebut telah berhasil meningkatkan rata-rata volume penjualan per harinya.

Kedua kesimpulan yang saling bertentangan tersebut semata-mata dihasilkan karena adanya perbedaan nilai simpangan baku populasinya (ingat bahwa simpangan baku mencerminkan penyebaran data atau variasi data). Dalam kasus

pertama (σ = Rp 10 juta), volume penjualan perusahaan tersebut sangat bervariasi dari satu toko ke toko lainnya. Sehingga walaupun rata-rata penjualan per bulan seluruh tokonya adalah Rp 40 juta, dapat dipastikan bahwa volume penjualan beberapa buah tokonya bahkan lebih dari Rp 41 juta. Sebaliknya, pada kasus

kedua, variasi volume penjualan sangatlah kecil (σ = Rp 2,5 juta), sehingga jarang sekali ada toko yang volume penjualannya mencapai Rp 41 juta.

4.4 Distribusi sampling bagi selisih rata-rata sampel

Di dalam melakukan suatu penelitian kita seringkali dihadapkan pada persoalan yang melibatkan dua populasi yang berbeda. Misalnya, ketika kita mencoba untuk menjawab persoalan yang dinyatakan dalam bentuk pertanyaan-pertanyaan seperti berikut ini:

1. Apakah rata-rata produksi padi varietas A sama dengan rata-rata produksi padi varietas B?

2. Samakah rata-rata alokasi waktu senggang yang digunakan oleh eksekutif muda wanita dengan yang digunakan oleh eksekutif muda pria untuk bersosialisasi dengan masyarakat di sekitarnya?

3. Apakah rata-rata produksi padi per hektar di daerah S sama dengan rata-rata produksi padi per hektar di daerah T?

Dalam setiap kasus tersebut kita mempunyai dua populasi yang berbeda: populasi

pertama dengan rata-rata µ1 dan varians σ12, dan populasi kedua dengan rata-rata

Page 14: 4 Dist Sampling

110

µ2 dan varians σ22. Misalkan 1X adalah rata-rata dari sampel acak yang beru-

kuran n1 yang diambil dari populasi pertama dan 2X adalah rata-rata dari sampel

acak yang berukuran n2 yang diambil dari populasi kedua.

Telah kita bahas sebelumnya bahwa 1X dan 2X masing-masing adalah variabel

acak yang nilainya bervariasi dari satu sampel ke sampel lainnya. Oleh karena itu,

selisih dari kedua rata-rata sampel tersebut, 21 XX − , juga merupakan suatu

variabel acak yang nilai-nilainya juga bervariasi dari satu sampel ke sampel

lainnya. Distribusi dari selisih antara nilai rata-rata sampel, 21 xx − , disebut

sebagai distribusi sampling dari statistik 21 XX − . Jika n1 cukup besar, maka de-

ngan menggunakan Dalil limit pusat, distribusi sampling bagi 1X akan mendekati

distribusi Normal, hal yang sama juga berlaku untuk distribusi sampling bagi 2X .

Dengan demikian, jika n1 dan n2 cukup besar maka distribusi sampling bagi

21 XX − pun akan mendekati distribusi Normal walaupun populasi asalnya

mungkin tidak berdistribusi normal.

Aturan 4.3 Distribusi sampling bagi 21 XX −

Misalkan dari dua populasi yang berbeda, masing-masing dengan rata-rata µ1

dan µ2 serta varians σ12 dan σ2

2, diambil sampel yang independen, masing-

masing berukuran n1 dan n2, maka distribusi dari selisih antara kedua rata-

rata sampel, 21 XX − akan mendekati distribusi Normal. Nilai harapan bagi

distribusi sampling 21 XX − adalah

( ) 2121 21µµµ −==− −xxXXE ....................................................... [4.4]

dan variansnya adalah

( )2

22

1

21222

21 2121 nnXXVar xxxx

σσσσσ +=+==− − ................................. [4.5]

Oleh karena itu, dengan transformasi Z, maka

2

22

1

21

2121 )()(

nn

xxz

σσ

µµ

+

−−−= ................................................................ [4.6]

merupakan suatu variabel acak yang berdistribusi Normal baku

Page 15: 4 Dist Sampling

111

Contoh 4.3

Rata-rata tinggi badan mahasiswa suatu perguruan tinggi adalah 162 cm dengan simpangan baku 4 cm, sedangkan rata-rata tinggi badan mahasiswinya adalah 158 cm dengan simpangan baku 5 cm. Jika diambil secara acak 36 orang mahasiswa dan 49 orang mahasiswi, berapakah peluang bahwa rata-rata tinggi badan sampel mahasiswa tersebut akan 6 cm lebih tinggi dari sampel mahasiswi?

Penyelesaian:

Diketahui: µ1 = 162; σ1 = 4; n1 = 36

µ2 = 158; σ1 = 5; n1 = 49

Dengan aturan 4.3, maka distribusi sampling bagi 21 XX − akan mendekati

distribusi normal dengan rata-rata dan simpangan baku sebagai berikut:

415816221

=−=−xxµ

977,049

5

36

4 222

21=+=−xxσ

untuk 21 xx − = 6, kita peroleh

01,2997.0

46=

−=z ,

sehingga

( ) ( ) 0222,001,2621 =≥=≥− ZPXXP

4.5 Distribusi sampling bagi proporsi

Dalam kehidupan sehari-hari tidak jarang kita dihadapkan pada suatu persoalan dimana kita perlu mengetahui proporsi suatu populasi yang memiliki karakteristik tertentu. Misalnya, seorang peneliti ingin mengetahui persentase daya berke-cambah dari benih tanaman tertentu, seorang pimpinan suatu perusahaan ingin mengetahui berapa proporsi hasil produksi salah satu pabriknya yang cacat produksi, atau ahli ekonomi ingin mengetahui berapa persen tenaga kerja yang tidak mempunyai pekerjaan.

Dalam setiap kasus di atas, kita perlu menduga parameter suatu populasi, dalam hal ini proporsi populasi, p. Untuk keperluan tersebut misalnya kita mengambil

Page 16: 4 Dist Sampling

112

sampel berukuran n dari populasi tersebut. Andaikan X adalah jumlah penga-matan dalam sampel tersebut yang memiliki karakteristik yang dimaksud, maka

proporsi sampel, nXp =ˆ , dapat digunakan untuk menduga proporsi populasi p.

Seperti juga rata-rata sampel, nilai p̂ bervariasi dari satu sampel ke sampel

lainnya, oleh karena itu nilai-nilai tersebut dapat dianggap sebagai nilai

pengamatan dari suatu variabel acak P̂ . Dalam bagian 3.11 telah kita ketahui

bahwa jika np ≥ 5 dan n(1-p) ≥ 5, maka distribusi dari variabel acak X akan mendekati distribusi Normal dengan rata-rata np dan varians np(1-p). Hal ini juga

berlaku bagi distribusi sampling P̂ , karena pada dasarnya, kedua variabel acak

tersebut (X dan P̂ ) mempunyai bentuk distribusi yang sama, tetapi berbeda dalam skala pengukurannya. Secara formal, hal ini dirumuskan dalam aturan 4.4 berikut:

Aturan 4.4 Distribusi sampling bagi P̂

Misalkan suatu sampel acak berukuran n diambil dari suatu populasi Binomial

dengan rata-rata µ = np dan varians σ2 = np(1-p), maka distribusi sampling

bagi P̂ akan mendekati distribusi Normal dengan nilai harapan

pPE P == µ)ˆ( ................................................................................ [4.7]

dan varians

n

ppPVar P

)1()ˆ( 2 −⋅

== σ ................................................................ [4.8]

Misalkan p̂ adalah proporsi sampel yang merupakan suatu nilai pengamatan

dari variabel acak P̂ , maka dengan menggunakan transformasi Z,

n

pp

ppz

)1(

ˆ

−⋅

−= ............................................................................... [4.9]

merupakan nilai variabel acak Z yang mempunyai distribusi yang mendekati distribusi Normal baku.

Peluang bahwa P̂ akan terletak antara nilai 1p̂ dan 2p̂ bagi suatu sampel beru-

kuran n setara dengan peluang bahwa X akan terletak antara x1 dan x2, dimana

nxp 11ˆ = dan nxp 22

ˆ = . Oleh karena itu, kita dapat menentukan nilai-nilai

peluang bagi P̂ dengan menggunakan pendekatan distribusi normal bagi variabel

Page 17: 4 Dist Sampling

113

acak Binomial X seperti pada bagian 3.11. Jika nilai-nilai peluang bagi P̂ tersebut

dihitung secara langsung dengan menggunakan distribusi sampling bagi P̂ (aturan

4.4), maka faktor koreksi kekontinyuan sebaiknya diterapkan terhadap nilai-nilai p̂ ,

yaitu dengan menambahkan/mengurangkan nilai p̂ tersebut dengan faktor 0,5/n.

Contoh 4.4

Dalam suatu pemilihan kepala desa diketahui bahwa 55% pemilih memilih salah satu kandidat kepala desa, sebut saja A. Misalkan kita ambil suatu sampel acak yang terdiri dari 100 orang pemilih, berapakah peluang bahwa kita akan salah menduga pemenang pemilihan kepala desa tersebut?

Penyelesaian:

Dalam kasus ini diketahui bahwa p = 0,55 dan n = 100. Untuk dapat

menggunakan pendekatan distribusi Normal periksa lebih dulu bahwa np ≥ 5 dan

n(1-p) ≥ 5. Untuk kasus ini np = 55 dan n(1 – p) = 45, sehingga variabel acak akan mendekati distribusi Normal dengan rata-rata p = 0,55 dan varians

σ2 = p(1 – p)/n = 0,002475.

Kita akan salah menduga pemenang pemilihan tersebut jika dari hasil sampel

diperoleh nilai p̂ < 0,5, yaitu kurang dari 50% pemilih memilih kandidat A. Dengan

demikian, kita diminta menentukan P( p̂ < 0,5). Faktor koreksi kekontinyuannya

adalah 0,5/100 = 0,005, sehingga nilai z untuk p̂ = 0,5 + 0,005 = 0,505 adalah

90,0002475,0

55,0505,0−=

−=z

Dengan demikian peluang bahwa kita akan salah menduga pemenang pemilihan kepala desa tersebut adalah

P( p̂ < 0,5) ≈ P(Z < – 0,90) = P(Z > 0,90) = 0,1841

4.6 Distribusi t

Sampai sejauh ini kita telah membahas berbagai distribusi sampling yang umumnya dapat dikelompokkan ke dalam dua kasus berikut:

(i) Populasi asalnya berdistribusi Normal dan varians populasinya diketahui nilainya

Page 18: 4 Dist Sampling

114

(ii) Distribusi populasi asalnya mungkin tidak diketahui, akan tetapi ukuran sampelnya cukup besar (n > 30)

Pendekatan distribusi Normal baku melalui transformasi n

xz

σ

µ)( −= selalu kita

lakukan untuk menentukan nilai-nilai peluang bagi distribusi sampling dari statistik

yang dimaksud. Walaupun nilai σ tidak diketahui, jika ukuran sampelnya cukup

besar, maka simpangan baku sampel s merupakan penduga yang baik bagi σ,

sehingga nilai ns / dapat digunakan sebagai penyebut dalam transformasi z

tersebut dan ns

xz

)( µ−= masih mendekati distribusi Normal baku.

Akan tetapi, jika ukuran sampelnya kecil (n < 30), maka nilai varians sampel s2

akan sangat berfluktuasi dari satu sampel ke sampel lainnya dan nilai-nilai ns

x )( µ−

tidak lagi berdistribusi Normal baku. Dalam hal ini kita berhadapan dengan suatu distribusi dari suatu statistik T, yang nilai-nilainya adalah

ns

xt

)( µ−= .................................................................................... [4.10]

Distribusi dari statistik T tersebut pertama kali diperkenalkan oleh William S. Gosset (1876-1937) pada tahun 1908. Waktu itu dia menggunakan nama samaran ‘Student’ dalam mempublikasikan hasil temuannya tersebut, sehingga distribusi tersebut disebut sebagai distribusi t-Student (Student’s t distribution) atau biasa disebut sebagai distribusi t. Waktu itu W.S. Gosset mengasumsikan bahwa sampelnya diambil dari suatu populasi yang berdistribusi Normal. Namun demikian, dapat ditunjukkan bahwa populasi yang tidak berdistribusi Normalpun masih akan menghasilkan nilai-nilai T yang sangat mendekati distribusi t, asalkan mempunyai bentuk distribusi seperti genta.

Beberapa sifat distribusi t

1. Distribusi t mempunyai beberapa persamaan dengan distribusi Normal baku, yaitu sama-sama simetris terhadap titik 0, mempunyai bentuk

distribusi seperti genta dengan kisaran dari -∝ sampai +∝, dan nilai harapannya adalah 0

2. Distribusi t tergantung pada suatu parameter ν, yang disebut sebagai

derajat bebas (degrees of freedom), dimana ν = n – 1. Jika ukuran sampelnya semakin besar, maka derajat bebasnyapun akan semakin besar dan bentuk distribusinya akan semakin mendekati bentuk distribusi Normal baku.

Page 19: 4 Dist Sampling

115

3. Varians dari distribusi t selalu lebih besar dari 1. Untuk ν > 2, varians

dari distribusi t adalah 2−ν

ν

4. Suatu distribusi t dibedakan dengan distribusi t yang lainnya oleh derajat bebasnya.

Gambar 4.4 memberikan suatu ilustrasi bahwa dengan semakin besarnya derajat bebas dari distribusi t maka bentuk distribusinya semakin mendekati distribusi Normal baku. Kecenderungan ini juga dapat dilihat pada nilai-nilai t dalam Tabel distribusi t (Lampiran 3). Nilai-nilai tersebut semakin mendekati nilai Z ketika derajat bebasnya semakin besar. Nilai t akhirnya sama dengan nilai Z ketika derajat bebasnya = ∞.

-4 -2 0 2 4

distribusi Normal baku

distribusi t, ν = 2

distribusi t, ν = 5

Gambar 4.4 Distribusi Normal baku dan distribusi t dengan νννν = 2 dan 5

Aturan 4.5

Misalkan x dan s2 masing-masing adalah rata-rata dan varians dari suatu

sampel berukuran n yang diambil dari suatu populasi Normal dengan rata-rata

populasi µ dan varians σ2 yang tidak diketahui besarnya, maka

ns

xt

)( µ−=

adalah sebuah nilai dari variabel acak T yang mempunyai distribusi t dengan

derajat bebas ν = n – 1

Page 20: 4 Dist Sampling

116

Karena variabel acak T merupakan variabel acak yang kontinyu, maka nilai-nilai peluangnya dinyatakan sebagai luas di bawah kurva distribusi t yang bersang-kutan. Akan tetapi, karena setiap derajat bebas mendefinisikan suatu distribusi t tertentu, maka sangat tidak mungkin untuk menyajikan luas daerah di bawah setiap kurva distribusi t dalam sebuah tabel. Tabel Lampiran 3 hanya menyajikan nilai-nilai t yang membuat luas daerah di salah satu ujung distribusinya sama

dengan α, untuk beberapa nilai α tertentu saja, yaitu 10%, 5%, 2,5%, 1% dan

0,5%. Dalam tabel tersebut nilai-nilai α dicantumkan pada judul kolom, sedangkan nilai-nilai t tercantum dalam badan tabel. Kolom paling kiri dari tabel tersebut menyajikan derajat bebas dari distribusinya.

Notasi tα biasa digunakan untuk melambangkan nilai t yang membuat luas daerah

di ujung kanan kurva distribusinya sama dengan α. Dengan kata lain, tα adalah nilai t yang memenuhi

P(t > tα) = α .................................................................................... [4.11]

Misalnya, dengan menggunakan Tabel Lampiran 3 kita peroleh bahwa nilai t dengan derajat bebas 10 yang membuat luas daerah di ujung kanan distribusinya sama dengan 0,05 adalah t0,05 = 1,8125, sehingga P(t > 1,8125) = 0,05. Karena

sifat distribusi t yang simetris terhadap nilai harapannya (nilai 0), maka nilai –tα

adalah nilai t yang membuat luas daerah di ujung kiri distribusinya sama dengan α (gambar 4.5). Untuk kasus tersebut di atas, maka P(t < –1,8125) = 0,05.

0 t α t

α

-t α

α

Gambar 4.5 Sifat simetris distribusi t

Contoh 4.5

Sebuah perusahaan memproduksi bola lampu pijar yang pada umumnya diketahui dapat bertahan sampai 500 jam. Untuk menjaga mutu produknya secara rutin dilakukan pengujian terhadap hasil produksinya. Manajemen perusahaan akan merasa puas dengan hasil produksi tersebut jika nilai t yang dihitung dari sampel hasil produksinya terletak antara – t0,05 dan t0,05. Jika dalam suatu pengujian

Page 21: 4 Dist Sampling

117

dengan 25 bola lampu pijar diperoleh rata-rata ketahanan bola lampu sebesar 487 jam dengan simpangan baku 40 jam, dapatkah disimpulkan bahwa telah terjadi penurunan mutu bola lampu hasil produksinya?

Penyelesaian:

Nilai t yang dimaksud dapat diperoleh dari tabel lampiran 3, yaitu nilai t0,05 dengan

derajat bebas ν = 25 – 1 = 24; dalam hal ini t0,05 ; 24 = 1.711. Dengan demikian, manajemen perusahaan akan merasa puas dengan hasil produksi tersebut jika nilai t-nya terletak antara – 1,711 dan 1,711. Berdasarkan informasi sampel kita peroleh

625,12540

500487−=

−=t

Karena nilai t tersebut masih dalam kisaran yang bisa ditolerir oleh manajemen perusahaan, maka hasil produksi tersebut belum menunjukkan adanya penurunan mutu bola lampu pijar secara keseluruhan.

Dengan bantuan komputer, nilai-nilai t untuk sembarang nilai α dapat dihitung dengan menggunakan MINITAB. Hal ini dilakukan dengan memilih menu

Calc ���� Probability Distribution ���� T...

MTB >

MTB > InvCDF .9875;

SUBC> T 15.

Inverse Cumulative Distribution

Function

Student's t distribution with 15 DF

P( X <= x) x

0.9875 2.4899

MTB >

(a) Input (b) Output

Gambar 4.6 Input dan output MINITAB untuk menentukan nilai tα

Page 22: 4 Dist Sampling

118

Perintah tersebut akan mengaktifkan jendela T Distribution (gambar 4.6.a).

Gambar 4.6 merupakan input bagi MINITAB (gambar 4.6.a) untuk menentukan nilai t yang membuat luas di ujung kiri kurva distribusinya sama dengan 0,9875, atau ekivalen dengan membuat luas di ujung kanan kurvanya sama dengan 0,0125 atau 1,25% (Ingat bahwa luas di bawah kurva suatu distribusi peluang ada-lah 1). Nilai t tersebut dihitung dari dari suatu variabel acak yang berdistribusi t dengan derajat bebas 15. Gambar 4.6.b adalah output MINITAB berdasarkan input tersebut. Output tersebut menunjukkan bahwa nilai t yang dimaksud adalah t = 2,4899.

Ketika kita mempunyai dua buah sampel yang independen yang diambil dari dua

populasi Normal yang berbeda, Aturan 4.3 hanya bisa diterapkan jika nilai σ12 dan

σ22 diketahui besarnya atau jika ukuran sampelnya cukup besar. Jika besaran σ1

2

dan σ22 tidak kita ketahui, maka aturan 4.3 tersebut tidak dapat kita terapkan

karena bentuk distribusi samplingnya tidak kita ketahui secara pasti. Akan tetapi jika varians kedua populasi tersebut dapat diasumsikan mempunyai nilai yang

sama, yaitu jika σ12 = σ2

2 = σ2

, maka distribusi sampling bagi 21 XX − akan

mengikuti kaidah distribusi t.

Aturan 4.6

Misalkan dari dua populasi Normal yang berbeda, masing-masing dengan

rata-rata µ1 dan µ2, diambil sampel yang independen, masing-masing

berukuran n1 dan n2. Misalkan 1x dan 21s masing-masing adalah rata-rata

dan varians sampel dari populasi pertama serta 2x dan 22s adalah rata-rata

dan varians sampel dari populasi kedua. Jika varians kedua populasi tersebut tidak diketahui besarnya tetapi dapat dianggap mempunyai nilai yang sama, maka

( ) ( )21

2121

11

)()(

nns

xxt

p +

−−−=

µµ .............................................................. [4.12]

dimana

2

)1()1(

21

222

211

−+

⋅−+⋅−=

nn

snsnsp .................................................. [4.13]

merupakan sebuah nilai pengamatan dari variabel acak T yang bedistribusi t

dengan derajat bebas ν = n1 + n2 – 2.

Page 23: 4 Dist Sampling

119

Soal-soal latihan

4.1 Jelaskan kenapa statistik sampel dapat merupakan suatu variabel acak

4.2 Jelaskan yang dimaksud dengan sampel acak

4.3 Apakah yang dimaksud distribusi sampling?

4.4 Dalam suatu survey diperlukan 25 responden untuk diwawancarai tentang hal-hal yang berkaitan dengan keharmonisan hubungan suami istri. Gunakan tabel lampiran 1 untuk memilih 25 individu sebagai responden dari total populasi yang berjumlah 1.578 individu

4.5 Andaikan dari ke 25 individu yang terpilih sebagai anggota sampel dalam soal 4.4 di atas, 5 orang diantaranya tidak bersedia berpartisipasi dalam survey tersebut. Tentukan 5 orang penggantinya.

4.6 Sebuah populasi terbatas terdiri atas nilai-nilai 4, 2 dan 6

a. Buatlah histogram frekuensi bagi distribusi sampling X untuk sampel berukuran 4 yang dilakukan dengan cara pengembalian

b. Periksa apakah µµ =x dan nx σσ = ?

4.7 Jika dalam soal 4.6 tersebut diambil suatu sampel berukuran 10 dengan pengembalian, berapakah peluang bahwa rata-rata sampelnya akan terletak antara 4,4 dan 5,1?

4.8 Misalkan rata-rata IQ mahasiswa suatu fakultas adalah 125 dengan simpangan baku 12. Andaikan dari populasi tersebut diambil 100 orang mahasiswa sebagai suatu sampel acak, berapakah nilai rata-rata, varians

dan simpangan baku dari distribusi sampling bagi X ?

4.9 Dinas Pariwisata sebuah kota menyatakan bahwa rata-rata belanja seorang wisatawan selama masa kunjungannya di kota tersebut pada tahun 2000 adalah sebesar Rp 5 juta per orang dengan simpangan baku Rp 900 ribu. Baru-baru ini dilakukan suatu penelitian kecil dengan mewawancarai 10 orang wisatawan yang datang ke kota tersebut. Dari sampel tersebut kemudian dihitung rata-rata jumlah uang yang dibelanjakan oleh ke 10 wisatawan tersebut. Berapakah nilai rata-rata, varians dan simpangan baku dari distribusi sampling tersebut?

4.10 Jika dalam soal 4.9 di atas diambil sampel 1500 orang wisatawan, berapakah nilai rata-rata, varians dan simpangan baku dari distribusi

sampling bagi X ? Yakinkah anda bahwa nilai rata-rata sampel tersebut lebih mendekati nilai populasinya dibandingkan dalam soal 4.9?

4.11 Jika suatu sampel berukuran 16 diambil dari suatu populasi normal dengan rata-rata populasi 50 dan simpangan baku populasi 5, berapakah peluang bahwa nilai rata-rata sampel tersebut akan terletak antara 47,55 sampai 52,45?

Page 24: 4 Dist Sampling

120

4.12 Misalkan 1X adalah rata-rata sampel berukuran n1 = 2 yang diambil dengan

pengembalian dari suatu populasi terbatas 2, 3, 7. Misalkan pula 2X

adalah rata-rata sampel berukuran n1 = 2 yang diambil dengan pengembalian dari suatu populasi terbatas 1, 1, 3.

a. Buatlah histogram frekuensi bagi distribusi sampling 21 XX −

b. Periksa apakah 2121µµµ −=−xx dan 2

21

22

121121nn xxxx σσσ +=− ?

4.13 Dari suatu populasi yang berdistribusi Normal dengan rata-rata µ1 = 80 dan

varians σ12 = 25 diambil suatu sampel berukuran n1 = 25 dan dari populasi

normal lainnya dengan rata-rata µ2 = 75 dan varians σ22 = 9 diambil sampel

berukuran n2 = 36. Tentukan peluang bahwa selisih rata-rata kedua sampel

tersebut ( 21 XX − ) bernilai antara 3,4 dan 5,9.

4.14 Dalam soal 4.13, tentukan ( )521 >− XXP

4.15 Rata-rata pendapatan per bulan buruh pelabuhan yang menjadi anggota serikat buruh diketahui Rp 100.000,- lebih besar dari rata-rata pendapatan bukan anggota serikat buruh. Simpangan baku kedua populasi tersebut masing-masing adalah Rp 70.000,-. Jika dari populasi anggota serikat buruh diambil sampel berukuran 50 dan dari bukan anggota serikat buruh diambil sampel berukuran 70, berapakah peluang bahwa perbedaan rata-rata pendapatan buruh dalam kedua sampel tersebut paling tidak sebesar Rp. 150.000,-?

4.16 Suatu populasi Normal diketahui mempunyai rata-rata sebesar 540 dengan varians 250. Jika dari populasi tersebut diambil dua buah sampel independen, masing-masing berukuran 323 dan 50, tentukan nilai-nilai peluang berikut:

a. rata-rata kedua sampel tersebut akan berbeda paling tidak sebesar 20? b. selisih rata-rata kedua sampel tersebut terletak antara nilai 5 dan 10?

4.17 Jika peluang lahirnya bayi laki-laki sama dengan peluang lahirnya bayi perempuan, tentukan peluang bahwa dari 100 kelahiran akan lahir bayi laki-laki sebanyak 52 orang.

4.18 Dalam soal 4.17, berapakah peluang bahwa jumlah bayi laki-laki yang dilahirkan terletak antara 52% sampai 63%?

4.19 Hasil survey sebuah surat kabar menyatakan bahwa 30% siswa SMU sudah pernah menggunakan narkotika. Misalkan dalam suatu penelitian diambil suatu sampel yang terdiri dari 300 orang siswa SMU. Jika pernyataan surat kabar tersebut benar, berapakah peluang bahwa proporsi sampel tersebut akan terletak antara 0,27 dan 0,33?

Page 25: 4 Dist Sampling

121

4.20 Jika dalam soal 4.19 tersebut diambil sampel sebanyak 1000 orang, berapakah peluang bahwa proporsi sampel tersebut akan terletak antara 0,27 dan 0,33?

4.21 Keadaan cuaca di daerah tropis sering berubah-ubah, sehingga terjadi atau tidaknya hujan pada suatu hari tidak tergantung pada terjadi atau tidaknya hujan pada hari-hari sebelumnya. Andaikan rata-rata jumlah hari hujan adalah 122 hari per tahun (30% dari jumlah hari per tahun). Tentukan peluang bahwa selama 100 hari tertentu proporsi terjadinya hujan adalah:

a. lebih dari 0,20 b. lebih dari 0,3 c. Lebih dari 0,4

4.22 Sebuah lembaga konsumen menyatakan bahwa 30% penduduk suatu kota telah menggunakan telepon genggam (mobile phone, HP). Untuk menguji anggapan tersebut diambil sampel sebanyak 400 0rang.

a. Tentukan peluang bahwa proporsi sampel tersebut akan lebih kecil dari 25%

b. Tentukan peluang bahwa proporsi sampel tersebut akan lebih besar dari 20%

c. Jika proporsi sampel yang dihasilkan adalah 27% dapatkah kita simpulkan bahwa pernyataan lembaga konsumen tersebut tidak benar? Jelaskan.

4.23 Tentukan nilai t0,025 untuk sampel-sampel berukuran:

a. 2 b. 5 c. 10 d. 15 e. 25

4.24 Tentukan nilai tα/2 sehingga P(–tα/2 < T < tα/2) = α untuk nilai-nilai berikut:

a. α = 0,90 dengan derajat bebas = 17

b. α = 0,90 dengan derajat bebas = 29

c. α = 0,95 dengan derajat bebas = 17

d. α = 0,95 dengan derajat bebas = 29