44
Pendahuluan Pertemuan I

Pendahuluan - stat.ipb.ac.idstat.ipb.ac.id/en/uploads/STK221/STK221_01.pdf · maka rata-rata pendapatan per kapita kota Bogor tahun ... median, modus, quartil), ukuran penyebaran

Embed Size (px)

Citation preview

Pendahuluan

Pertemuan I

Apa data ?

• Data merupakan hasil pengukuran terhadap suatu objek/individu yang menjadi pusat perhatian.– Pengukuran dapat dilakukan secara kualitatif maupun

kuantitatif– Secara umum, skala pengukuran dibedakan menjadi

nominal, ordinal, interval dan rasio

• Apa beda data dengan informasi ?– Informasi merupakan hasil yang diperoleh dari analisis

data– Misal, data tentang pendapatan kota Bogor tahun 2007

maka rata-rata pendapatan per kapita kota Bogor tahun 2007 merupakan informasi.

Ada berapa jenis data yang Anda kenal?

• Menurut sumbernya data dapat dibedakan menjadi data PRIMER dan SEKUNDER

• Menurut periode pengumpulannya data dibedakan menjadi data TIME SERIES dan data CROSS SECTION

• Menurut skala pengukurannya data dibedakan menjadi data KUALITATIF dan data KUANTITATIF

• Menurut cakupan objeknya data dibedakan menjadi data POPULASI dan data SAMPEL

Bagaimana Teknik Pengumpulan Data ?

observasi

percobaan

survei

Survei didefinisikan sebagai sebuah metode untuk mengumpulkan data

primer yang mendasarkan pada komunikasi dengan perwakilan sampel secara individuo Instrumen: kuesionero Ada aktivitas bertanya melalui wawancara o Ada yang menjawab pertanyaan (individu / klp. individu) responden

Keuntungan survei: proses cepat, tidak mahal, efisien, dan merupakan

sarana yang akurat untuk mengakses informasi yang menyangkut populasi (dengan catatan: survei dilaksanakan dengan tepat dan akurat)

Etika dalam survei: hak pribadi responden, pencegahan penipuan,

penjelasan tujuan survei kepada responden, kerahasiaan, kejujuran dalam pengumpulan data, dan objektivitas dalam melaporkan data

ObservasiObservasi ilmiah merupakan suatu proses pencatatan yang sistematis terhadap pola perilaku orang, objek, dan kejadian-kejadian tanpa bertanya atau berkomunikasi dengan orang, objek atau kejadian tersebut

PENGERTIAN DASAR SURVEI

Wawancara Personal pewawancara bertanya jawab langsung

dengan respondenKeuntungan: responden dapat umpan balik, konfirmasi jawaban, waktu dapat lebih longgar, potensi pengisian kuesioner secara lengkap lebih tinggi, dapat menggunakan alat bantu visual, partisipasi lebih tinggiKerugian: biaya lebih mahal, waktu lebih lama, efek anonimitas responden

Wawancara

Wawancara Telepon pewawancara bertanya jawab dengan

responden melalui teleponKeuntungan: cepat, biaya relatif tidak mahal, mengurangi hal-hal yang bersifat pribadi, ada yang lebih suka diwawancarai via telpon. Kerugian: keterwakilan populasi dapat menjadi masalah karena mungkin tidak semua responden sasaran memiliki telpon, tidak dapat menggunakan media visual, durasi terbatas

Wawancara dapat dilakukan dari rumah kerumah atau di tempat-tempat dimana responden dapat mudah dijumpai misalnya mal, kantor pelayanan pengaduan, dll.

Survei melalui surat/pos

Non Wawancara

Kuesioner tertulis menggunakan jalur distribusi lain Melalui kartu garansi

Melalui majalah dengan pemberian (iming-iming) hadiah tertentu

Survei dengan media internet, dll.

Keuntungan: fleksibilitas geografi, biaya relatif lebih murah, responden lebih nyaman tidak diburu waktu, lebih pas untuk hal yang bersifat pribadi

Kerugian: non respon tinggi, pertanyaan harus standar & terstruktur, sebelum menjawab seringkali responden membaca dulu seluruh pertanyaan kuesioner sehingga dapat menimbulkan bias

Kuesioner Format baku, panjang halaman max 6, bahasa sederhana &

mudah, harus ada pengantar, kadang perlu pemberitahuan awal

ERROR DALAM SURVEI

ilustrasiSebelum kita bicarakan cara pengambilan contohnya, perhatikan ilustrasiberikut (semuanya dikutip dari kuliah STK 211, kelas Prof AHN):

Seorang ibu rumah tangga melewati Jalan Pajajaran di Kota Bogor, dandilihatnya banyak penjual duku Palembang di sepanjang jalan tersebut. Padasaat ingin membeli, penjual menawarkan untuk mencicipi terlebih dahulu. Puasdengan rasanya, ibu tersebut membeli dua kilogram. Sesampai di rumah,ternyata rasa duku yang dia beli tidak manis seperti yang dia rasakan di tempatpenjualan tadi.

BPS mengadakan survei ekonomi dan menyebar beberapa petugas survei keberbagai perumahan di Bogor. Hasil yang diperoleh cukup mengagetkan karenatingkat pendapatan masyarakat di Bogor Baru (salah satu perumahan A diBogor) memiliki rata-rata yang tidak setinggi perkiraan. Setelah diselidikiternyata, petugas di perumahan tersebut adalah petugas yang phobia terhadapanjing. Sehingga rumah yang dia datangi adalah rumah-rumah yang tidakmemelihara anjing, dan rumah yang dilengkapi anjing umumnya lebih kayadaripada yang tidak.

Dua ilustrasi di atas adalah ilustrasi teknik

pengambilan contoh yang salah, hasilnya akan

berbias. Inilah resiko pengambilan kesimpulan

dari data contoh. Jika cara pengambilannya

tidak tepat, maka hanya satu kelompok saja yang

didapatkan dan kesimpulan yang diambil tidak

bisa berlaku umum.

Manajemen Survei: Fieldwork

Seleksi enumerator sehat, memiliki ‘raport’ yg baik, komunikatif, menarik,terdidik, berpengalaman

Pelatihan sangat menentukan kualitas data yang dikumpulkan membekalienumerator tentang: memilih responden, kontak awal, teknikbertanya, probing, menulis jawaban, dan mengakhiri interview

Supervisi meyakinkan bahwa enumerator mengikui prosedur & teknik sesuaidengan yang diterima pada saat pelatihan (termasuk: qualitycontrol, editing, sampling control, control of cheating, progress)

Validasi memverifikasi apakah interview benar-benar dilakukan (ambil 10-25% durasi & kualitas interview, tanggapan thd enumerator,data demografi pokok, dan variabel-variabel kunci)

Evaluasi evaluasi terhadap biaya, waktu, response rates, kualitas interview, &kualitas data

Populasi vs Contoh

himpunan semua objek

yang menjadi minat

pengambilan kesimpulan

himpunan bagian dari

populasi

melakukan pengamatan terhadap seluruh

populasi seringkali tidak mungkin dilakukan

ketika akan membuat kesimpulan, mengapa?

population sample

Mengapa harus dengan contoh?

sumber daya

terbatas waktu yang

tersedia terbatas

pengamatan kadang

bersifat merusah

mustahil mengamati

seluruh anggota populasi

1 2

3 4

bagaimana caranya dengan menggunakan data contoh

kita dapat mengambil kesimpulan terhadap populasi?

INI YANG KITA PELAJARI PADA MATA KULIAH INI

Ilustrasi

Andaikan kita memiliki sepiring sambel buatan ibukita. Berapa banyak yang kita ambil untuk mencicipi rasasambel tersebut ? Sebagian besar orang akanberpendapat bahwa seujung jari sudah cukup untukmengetahui rasa sepiring sambel tersebut. Tidak akanada seorang pun yang menjawab bahwa kita harusmerasakan setengah piring untuk menyatakan rasasambel buatan ibu.

Pengambilan contoh dari sebuah populasi bisadianalogkan dengan mencicipi masakan seperti diatas. Jika data masing-masing objek bermacam-macam,dengan kata lain karakteristik objeknya berbeda-beda,maka perlu diambil contoh yang banyak untuk mewakilisetiap kelompok karakteristik. Namun jika karakteristikobjek pada populasi itu seragam, hampir sama, makacontoh yang sedikit sudah cukup.

Statistika

Populasi

Contoh

Sampling Pendugaan

Tingkat Keyakinan

Ilmu Peluang

Statistika Deskriptif vs

Statistika Inferensia

Deskriptif

Parameter vs Statistik

data populasi parameterolah/analisis

data contoh statistikolah/analisis

Parameter tidak pernah diketahui, yang kita

ketahui adalah statistik. Statistik merupakan

penduga bagi parameter.

Statistika

Populasi : Keseluruhan pengamatan yang menjadi pusat

perhatian kita

Contoh : Himpunan bagian dari populasi (mewakili)

Parameter : Karakteristik numerik dari populasi

Statistik : Karakteristik numerik dari contoh

Peubah / Variabel : Ciri dari objek yang diamati

Skala pengukuran : Nominal, Ordinal, Interval, Rasio

Peubah: Kualitatif vs Kuantitatif, Diskret vs Kontinu

Pengumpulan Data:

Harus dibangkitkan dulu Percobaan

Langsung dikumpulkan Survei/Observasi

Analisis Eksplorasi Data

Eksplorasi Upaya untuk melihat ke dalam data guna mengungkap

informasi yang terkandung dalam data tersebut

manipulasi, penyarian/perangkuman, peragaan

Peragaan : tabel & grafik (histogram, diagram batang, diagram lingkaran/pie

chart, plot, dll.)

Penyarian: ukuran pemusatan (mean, median, modus, quartil), ukuran penyebaran (ragam, standard deviasi, range, jarak antar kuartil)

0

10

20

30

40

50

60

70

80

90

Tw-1 Tw-2 Tw-3 Tw-4

Jabar

Jatim

Lampung79%

21%

Laki-Laki Perempuan

400

500

600

700

800

900

1000

20 40 60 80 100 120

Jarak (1000 Km)E

mis

i H

c (

ppm

)

Teknik Meringkas Dataukuran

pemusatan

ukuran penyebaran

Ukuran Pemusatannilai tempat mengumpulnya sebagian besar data

• Median, membagi data menjadi dua bagian yang sama banyak

Me = data ke-(n+1)/2

• Modus, nilai data yang paling sering muncul

• Rataan/Rata-rata

1

NXi

i 1

N

x1

nXi

i 1

n

mean average

Tentang Rataan

• Rataan bersifat tidak kekar (robust) terhadap adanya data-data bernilai ekstrim.

misal data yang dimiliki:

5, 7, 8, 13, 14, 14, 16, 17, 18, 21

rataan 13.3, median 14

5, 7, 8, 13, 14, 14, 16, 17, 18, 70

rataan 18.2, median 14

• dikenal adanya Truncated Mean (rataan terpangkas) membuang data ekstrim

Ukuran Penyebaransemakin besar nilainya berarti data semakin bervariasi/beragam

• Wilayah (Range), selisih antara nilai data terbesar dengan data terkecil

• Jangkauan antar kuartil (Inter Quartile Range), selisih antara kuartil 1 dengan kuartil 3 kisaran tempat mengumpulnya 50% data bernilai ‘sedang’

• Ragam (variance), rata-rata kuadrat penyimpangan data terhadap rata-ratanya

• Simpangan Baku (standard deviation), akar dari ragam

2 2

1

NXi

i 1

N

( ) s x2 2

1

n - 1Xi

i 1

n

( )

Penyajian dengan: - Diagram Dahan Daun (Stem-and-Leaf Display)

- Diagram Kotak Garis (Box-Plot)

Analisis Eksplorasi Data

Contoh data:25 65 9 26 3 8

65 93 16 29 11 15

82 66 38 23 27 12

37 50 15 17 14 7

54 43 24 10 9 9

41 69 12 17 4 10

48 73 20 53 10 14

76 81 9 13 16 5

54 35 31 8 7 15

39 55 28 12 18 13

24 21 17 12

19 16 11

Contoh1 Contoh2 Contoh3

Analisis Eksplorasi Data

Stem-and-leaf of Contoh3 N =

23

Leaf Unit = 1.0

1 0 3

3 0 45

5 0 77

8 0 899

(4) 1 0011

11 1 223

8 1 4455

4 1 67

2 1 8

1 2

1 2

1 2

1 2 7

Stem-and-Leaf Display

Stem-and-leaf of Contoh1 N =

20

Leaf Unit = 1.0

1 2 5

4 3 579

7 4 138

(4) 5 0445

9 6 5569

5 7 36

3 8 12

1 9 3

Stem-and-leaf of Contoh2 N =

24

Leaf Unit = 1.0

3 0 899

7 1 0223

(6) 1 566779

11 2 01344

6 2 689

3 3 1

2 3 8

1 4

1 4

1 5 3

Analisis Eksplorasi Data

30

20

10

0

Con

toh

3

50

40

30

20

10

Con

toh

2

95

85

75

65

55

45

35

25

Con

toh

1

Boxplot

Langkah Pembuatan Boxp-Plot:

1. Tentukan: nilai terkecil, nilai terbesar, Q1, Median, Q3

2. Lakukan identifikasi pencilan:

dekat: x < Q1 – 3/2 d atau x > Q3 + 3/2 d & jauh: x < Q1 – 3d atau x > Q3 + 3d

3. Gambar !

Sebaran Penarikan Contoh

populasi

ambil contoh

berukuran nambil contoh

berukuran n

ambil contoh

berukuran n

ambil contoh

berukuran n

1x

2x 3

xk

xRata-rata contoh adalah peubah acak yang juga memiliki sebaran

tertentu. Contoh yang berbeda dari populasi yang sama, hampir dapat

dipastikan memiliki rata-rata yang berbeda.

Sebaran Penarikan Contoh

x1, x2, …, xn dari populasi

yang menyebar N(, 2)

x

s

x

menyebar N(, 2/n)

menyebar t-studentdb=n-1

Sifat-sifat Penduga

Penduga bagi suatu parameter , dilambangkan

Sifat yang diinginkan dari suatu penduga parameter adalah:

1. Tak Bias (unbiased)

2. Ragam penduga, , kecil

ˆE

Var

Sifat-sifat Penduga

Tak bias,

ragam kecil

Bias, ragam besarTak bias, ragam

besar

Bias, ragam kecil

Selang Kepercayaan

Menduga nilai parameter menggunakan kisaran nilai antara batas

bawah (LCL=lower confidence limit) dan batas atas (UCL=upper

confidence limit)

x1, x2, …, xn dari populasi

yang menyebar N(, 2)

Selang kepercayaan (1-)x100%

bagi adalah

n

stx

2

Peluang

• Bagaimana membuktikan bahwa sebuah dadu setimbang?

• Empiris Peluang = frekuensi relatif

• Contoh:

• Satu mata uang setimbang dilempar sekali

RC = {M, B}

P({M})=1/2 dan P({B})=1/2

• Satu mata uang setimbang dilempar 3 kali

RC = {BBB,BBM,BMB,MBB,BMM,MBM,MMB,MMM}

P({MMM})=1/8 ; P({BBB})=1/8 ; P({BMB})=1/8

X = Jumlah sisi muka yang muncul (X disebut peubah acak)

Peluang

P(X=0) = P({BBB}) = 1/8

P(X=1) = P({BBM,BMB,MBB}) = 3/8

P(X=2) = P({BMM,MBM,MMB}) = 3/8

P(X=3) = P({MMM}) = 1/8

Sebaran Binom(n,p) sebaran Binom dengan parameter n dan p

(sebaran peluang diskret)

n0,1,2,..., ; )1()(

xpp

x

nxXP xnx

Peubah Acak fungsi yang memetakan anggota

gugus RC ke gugus bilangan nyata

Nilai Harapan & Ragam Peubah Acak X

Nilai Harapan & Ragam : Sebaran Binom(n,p)

,...,nixPxXE i

n

i

ix 0 ; )()(0

222 )()( XEXEx

,...,nixPxXE i

n

i

i 0 ; )()(0

22

X 0 1 2 3

P(X) 0.125 0.375 0.375 0.125

E(X) = 1.5

2 = 0.75

Khusus pada sebaran Binom(n,p) :

E(X) = = np dan 2 = np(1-p)

Contoh: n=3 & p=0.5

Peluang Kontinu

4 0 ; 4

1)( xxf

Sebaran Seragam kontinu

P(X=3) = 0 pada sebaran kontinu, peluang pada satu titik =0

4

3

4

0

4

3|

44

1)()3(

3

0

3

0

3

xdxdxxfXP

4

1

4

2

4

3|

44

1)()32(

3

2

3

2

3

2

x

dxdxxfXP

dxxxfXE x

)()( Nilai harapan

Peluang Normal

- ; 2

1),;(

2

21

2

xexf

x

Sebaran Normal

(fungsi peluang kontinu)

) ,N( ~ X 2

Contoh: Berat ikan di suatu danau mengikuti pola sebaran normal dengan rataan

400g dan standard deviasi 100g. Jika diambil satu ikan secara acak,

berapa peluang mendapatkan ikan yang beratnya lebih dari 500g?

)1 ,0N( ~ Z -X

Z

Tabel-Z

1587.0)1(100

400500)500(

ZPZPXP

Peluang Normal, Z, t, 2, F

Jika X~N(, 2) ~N(, 2/n)

Bagaimana jika sebaran pop tdk normal Dalil Limit Pusat

Apapun sebaran populasinya, ~N(, 2/n) dengan n

Jika 2 tidak diketahui, maka sebaran Normal (Z) sebaran t

Peubah acak Z2 sebaran 2 (Khi-kuadrat)

Rasio dari p.a. sebaran 2 sebaran F

Penggunaan:

Sebaran Z menguji jika 2 diketahui

Sebaran t menguji jika 2 tidak diketahui

Sebaran 2 menguji ragam (2)

Sebaran F Rasio dua ragam

x

x

Pendugaan Parameter

Dugaan Titik

untuk menduga

s2 untuk menduga 2

x

Dugaan Selang

Selang kepercayaan (1-)100% bagi

Jika 2 diketahui:

Jika 2 tdk diketahui:

nzx

nzx

22

n

stx

n

stx

nn )1()1( 22

Dugaan Selang

Selang kepercayaan (1-)100% bagi 1-2

Jika 1 dan 2 tdk diketahui dan diasumsikan sama:

Pendugaan Parameter

2

2

2

1

2

12121

2

2

2

1

2

121

22)()(

nnzxx

nnzxx

21

2

)(2121

21

2

)(21

11)(

11)(

22 nnstxx

nnstxx gabvgabv

2dan 2

)1()1(21

21

2

22

2

112

nnv

nn

snsnsgab

Hipotesis Statistik: Pernyataan/dugaan mengenai parameter

populasi yang ingin dibuktikan kebenarannya

H0 hipotesis nol

H1 atau Ha hipotesis satu atau hipotesis alternatif

Misalnya:

H0: =60 vs H1: ≠60 uji dwi arah

H0: =160 vs H1: >160 uji eka arah

H0: =500 vs H1: <500 uji eka arah

Pengujian Hipotesis

Berdasarkan data yang dikumpulkan, H1 atau H0 yang benar ?

Pengujian Hipotesis

H0 terima H1 terima

Hasil Pengujian

H0 benar Benar Salah Jenis 1

(

Salah Jenis 2

(bH1 benar

Keadaan

SebenarnyaBenar

= Peluang menolak H0 padahal H0 benar

b = Peluang menerima H0 padahal H1 yang benar

Pengujian Hipotesis

Kaidah Keputusan:

Jika p-value < H1 benar

Jika p-value ≥ H0 dianggap benar

taraf nyata pengujian (kesalahan maksimum yang diperbolehkan

jika memutuskan H1 benar)

P-value peluang salah jenis 1 berdasarkan data

Teladan 1:

Pada saat ini diduga terjadi kenaikan rata-rata tinggi badan orang Indonesia dibandingkan

tahun 70-an. Untuk membuktikan dugaan ini diambil contoh acak berukuran 25 dan

diperoleh rataan sebesar 164 cm. Ujilah apakah dugaan tersebut benar. Gunakan =5%.

(Catatan: Tinggi rata-rata tahun 70-an=161 cm, dan 2=81 cm2).

Pengujian Hipotesis

Diketahui: n=25, =164 cm ; 2=81 cm2 ; =5%=0.05.

H0: =161 cm vs H1: >161cm

Z tabel = Z0.05 = 1.65

P-value = P(x>x0 / =161) = P(Z>1.67) = 0.0475

P-value < Tolah H0

(Memang benar sekarang ada kenaikan rata-rata tinggi orang

Indonesia dibandingkan dengan tahun 70-an)

x

67.125/81

161-164

/

-x

nZ

Z > Ztab Tolak H0

Pengujian Hipotesis

Secara Umum:

Satu Nilai Tengah Populasi: H0: = 0 vs H1: 0

H0: 0 vs H1: > 0

H0: 0 vs H1: < 0

Dua Nilai Tengah Populasi:

Saling Bebas Berpasangan

H0: 1= 2 vs H1: 1 2 H0: D = 0 vs H1: D 0

H0: 1 2 vs H1: 1> 2 H0: D 0 vs H1: D > 0

H0: 1 2 vs H1: 1< 2 H0: D 0 vs H1: D < 0

Pengujian HipotesisTeladan-2:

Ada dugaan kuat bahwa latar belakang petambak berpengaruh terhadap keberhasilan

sebagai petambak di CP Bahari. Untuk membuktikan pendapat ini, dipilih 22 petambak

contoh secara acak, dimana 11 orang berlatar belakang petambak dan 11 orang sisanya

berlatar belakang bukan petambak. Jika produksi merupakan ukuran tingkat keberhasilan

petambak, dan produksi terakhir dari ke-22 petambak tersebut seperti tabel di bawah ini,

ujilah apakah dugaan tersebut di atas benar? (Gunakan =5% dan asumsikan ragam

produksi kedua populasi sama).

11.7 9.6 12.2 8.6 9.3 10.1 8.9 9.5 10.4 8.3 9.4

Produksi dari 11 Petambak yang Berlatar Belakang Petambak

7.4 8.5 9.2 8.7 7.8 6.9 10.2 9.4 8.1 8.3 9.0

Produksi dari 11 Petambak yang Berlatar Belakang Bukan Petambak

Bentuk Hipotesis ? Statistik Uji ?

21

2

2121

11

)()(

21

nns

xx

s

xxt

gab

xx

hit

H0: 1 2 vs H1: 1> 2