36

Click here to load reader

Pengolahan Data Numerik

Embed Size (px)

DESCRIPTION

Materi Kuliah Statistik pada Jurusan Analis Kesehatan Poltekkes Kemkes jakarta III

Citation preview

Page 1: Pengolahan Data Numerik

PENGOLAHAN DATA NUMERIK

Oleh

Heru Setiawan

Page 2: Pengolahan Data Numerik

A. Distribusi Frekuensi

B. Nilai Tengah (Central Tendency)

Page 3: Pengolahan Data Numerik

1. Raw data hasil pengukuran data kuantitatif tidak akan memberikan informasi apa-apa jika tidak diolah kedalam suatu distribusi frekuensi.

2. Distribusi frekuensi adalah suatu pengelompokkan data kedalam kelas atau group tertentu.

Page 4: Pengolahan Data Numerik

Istilah dalam Distribusi Frekuensi

a. Jumlah kelas– Biasanya antara 6 – 14 (Umumnya ± 9)– Jika ≥ 250 gunakan kaidah Sturgess– Dihitung dengan rumus Sturgess, yaitu :

k = 1 + 3.3 log n, di mana:

k = jumlah kelas &

n = jumlah pengamatan.

Page 5: Pengolahan Data Numerik

3. Istilah dalam Distribusi Frekuensi

b. Interval• Merupakan jarak antar kelas :

– usahakan sama– tidak ada nila yang tumpang tindih– ada istilah batas bawah (lower limit), batas atas (upper limit)

dan nilai tengah (mid point)– dihitung dengan rumus :

dimana:

I = Interval,

R= Range ( nilai max-min) &

k = jumlah kelas

k

RI

Page 6: Pengolahan Data Numerik

4. Cara menyusun distribusi frekuensi :

a. Carilah nilai terbesar dan terkecil

b. Tentukan jumlah kelas dengan interval yang sama

c. Hitunglah banyak nilai observasi yang masuk kedalam masing-masing kelas (disebut dengan istilah frekuensi)

Page 7: Pengolahan Data Numerik

Keterangan :Kelas : 50 – 54.9; 55 – 59.9; dst.Lower limit kelas: 50 ; 55 ; dst.Upper limit kelas: 54.9 ; 59.9 ; dst.Interval kelas : 5 (Selisih upper limit denganlower limit suatu

kelas)Kelas tertutup : 50 – 54.9Kelas terbuka : - 54.9 atau 70 –

Kelas frekuensi (f)50 51 54 55 55 50 - 54,9 357 58 59 60 61 55 - 59,9 561 61 61 62 62 60 - 64,9 1063 64 64 65 65 65 - 69,9 866 67 67 67 68 70 - 74,9 469 71 71 72 75 Jumlah 30

Page 8: Pengolahan Data Numerik

Nilai Tengah (Central Tendency)

1. Jenis-jenis nilai tengah :

– Mean/Arithmatic mean (x, y)

– Median (Md)

– Modus = Mode (Mo)

– Geometric mean (Gm)

– Harmonic mean (Hm)

– Quadratic mean (Qm)

Sering digunakan dalam bidang ekonomi

Page 9: Pengolahan Data Numerik

Mean = rata-rata hitung (x, y)

• Simbol untuk mean :– x atau y (x bar atau y bar) = untuk sampel (statistik) (miu) = untuk populasi (parameter).

• Merupakan nilai yang mewakili data agregate• Bersifat labil (mudah dipengaruhi oleh nilai ekstrim)• Mudah dihitung dan paling banyak digunakan• Dihitung dengan rumus :

– Data tidak berkelompok :

– Data berkelompok : x = xg + (1/n x fd)

n

xx

i

ii

f

fxx

.

atau

fdxn

xx g

1

n

mpfx

.

Page 10: Pengolahan Data Numerik

Contoh

No. Kelas f mp d fd1 150 - 5 152.5 -15 -752 155 - 10 157.5 -10 -1003 160 - 15 162.5 -5 -754 165 - 35 167.5 0 05 170 - 20 172.5 5 1006 175 - 10 177.5 10 1007 180 - 185 5 182.5 15 75

Jumlah 100 1172.5 0 25

Page 11: Pengolahan Data Numerik

• Diketahui : xg = 167.5

N = 100

fd = 25

• Ditanya mean = ….?

• Jawab : Rumus : x = xg + (1/n x Sfd) = 167.5 + (1/100 x 25) = 167.75

fdxn

xx g

1

Page 12: Pengolahan Data Numerik

Median (Md) = Nilai tengah

• Merupakan nilai yang terletak paling tengah, sehingga membagi data menjadi 2 kelompok yang sama jumlah pengamatannya.

• Relatif stabil (tidak dipengaruhi oleh nilai ekstrim)• Sebelum mencari posisi median, terlebih dahulu data harus diurut• Nilai median adalah nilai observasi pada posisi median• Posisi median ditentukan dengan rumus :

• Data tidak berkelompok :

• Data berkelompok :

2

1n

Md

ix

fMd

fknLlMd

2/1

Page 13: Pengolahan Data Numerik

Contoh

No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75

Jumlah 100 1172,5 0 25

Ditanya median = ….?Jawab : Rumus :

ix

fMd

fknLlMd

2/1

93.1675

35

302/1100165

xMd

Page 14: Pengolahan Data Numerik

Modus/Mode (Mo) = Nilai tengah

• Merupakan nilai yang paling sering muncul dalam pengamatan.

• Pada data yang tidak berkelompok, modus adalah frekuensi pengamatan yang paling besar/banyak.

• Ditentukan dengan rumus :• Data tidak berkelompok :

Mo =

– di mana n = jumlah pengamatan– Contoh :

Data = 11 ; 12 ; 12 ; 13 ; 14 ; 15 ; 15 ; 16 ; 17 ; 18– Modus = 12 dan 15

Page 15: Pengolahan Data Numerik

Modus/Mode (Mo) = Nilai tengah

• Data berkelompok : a. Rumus Delta (Thum method) : sering dipakai untuk

distribusi skewed

– Ll = Lower limit kelas mode– i = interval kelas 1 = Selisih frekuensi kelas mode dengan frekuensi

kelas sebelum kelas mode 2 = Selisih frekuensi kelas mode dengan frekuensi

kelas setelah kelas mode

21

1.

i

LlMo

Page 16: Pengolahan Data Numerik

Contoh

No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75

Jumlah 100 1172,5 0 25

Ditanya modus/mode = ….?Jawab : Rumus :

21

1.

i

LlMo

86.1671520

20.5165

Mo

Page 17: Pengolahan Data Numerik

Modus/Mode (Mo) = Nilai tengah

b. Rumus Empiris : sering dipakai untuk distribusi simetrisMo = x {3(x Md)},

dimana x = Mean dan Md = Median

Diketahui : • x = 167.75 (soal mean data berkelompok)• Md = 167.93 (soal median data berkelompok)• Ditanya modus/mode = ….?• Jawab : Rumus :

MdxxMo 3

29.16893.16775.167375.167 Mo

MdxxMo 3

Page 18: Pengolahan Data Numerik

Hubungan antara nilai Mean, Median dan Modus/Mode

1. Nilai Median selalu berada di antara Mean dan Modus

2. Jika x = Md = Mo (berhimpitan), maka kurvanya disebut simetris

3. Jika x < Md & Mo), maka kurvanya akan menceng ke kiri disebut skewed to the left

4. Jika x > Md & Mo), maka kurvanya akan menceng ke kanan disebut skewed to the right

Page 19: Pengolahan Data Numerik

UKURAN DISPERSI/VARIASI

• Pengertian :

Nilai tengah (ukuran sentral) merupakan wakil dari data yang telah tersusun. Tidak semua nilai bisa diwakili oleh nilai tengah, ada nilai-nilai yang menyimpang dari nilai tengah tersebut.

Ukuran terhadap penyimpangan ini disebut dispersi.

Page 20: Pengolahan Data Numerik

Kegunaan

1. Memberikan informasi deskriptif tentang derajat penyimpangan suatu kelompok data.

2. Menilai ketepatan nilai tengah dalam mewakili distribusinya. Bila nilai dispersi besar berarti nilai tengah kurang mewakili distribusinya, sebaliknya bila nilai dispersi kecil berarti nilai tengah mempunyai ketepatan yang tinggi dalam mewakili distribusinya. (Pengukuran nilai tengah tanpa mengikutsertakan ukuran dispersi akan kurang lengkap).

3. Berguna untuk perhitungan statistik lebih lanjut agar diperoleh informasi yang lebih mendalam tentang data.

Page 21: Pengolahan Data Numerik

Jenis-jenis Ukuran Variasi

1. Range2. Interquartile range3. Mean deviation (Simpangan rata-rata)4. Variance (Variasi)5. Standard Deviation (Simpangan Baku)6. Coefficient of variation (Koefisien variasi)7. Standard Error

• Ukuran dispersi digunakan karena nilai sentral (mean) kadang-kadang kurang berarti jika nilai variasi tidak diketahui.

Page 22: Pengolahan Data Numerik

Contoh

Jika melihat meannya saja Data A = Data B, padahal Data A Data B.

Mean SDData A 60 60 55 60 65 60 60 3.2Data B 90 50 30 70 40 80 60 23.7

Page 23: Pengolahan Data Numerik

Range (Rentang)

• Suatu nilai yang merupakan selisih antara nilai tertinggi dengan nilai terendah

• Hanya ditentukan oleh 2 nilai saja (nilai tertinggi dan nilai terendah)

• Sering dipakai untuk Quality control• Dalam pemakaiannya sering digabung dengan ukuran lain,

(misalnya mean) karena jika hanya range saja yang dipakai kadang-kadang menyesatkan.

Page 24: Pengolahan Data Numerik

Range (Rentang)

Mean RangeData A 3 4 5 6 8 11 15 20 9 17Data B 3 3 4 9 11 11 11 20 9 17Data C 3 4 9 9 9 9 9 20 9 17

Page 25: Pengolahan Data Numerik

Interquartile Range

• Hampir sama dengan range, hanya ditentukan oleh selisih (Q3) kuatil-3 dengan (Q1) kuartil-1.

• Sering digunakan untuk melihat penyebaran pendapatan.

• Dihitung dengan rumus : dQ = (Q3 Q1)/2, di mana dQ = Interquartile range

• Q3 = kuartil-3• Q1 = kuartil-1

Page 26: Pengolahan Data Numerik

Quartile (Kuartil)

• Kuartil adalah suatu ukuran yang membagi distribusi data menjadi 4 bagian yang sama.

• Kuartil-1 (Q1) 25% dari seluruh distribusi• Kuartil-2 (Q2) 50% dari seluruh distribusi (= Median)• Kuartil-3 (Q3) merupakan 75% dari seluruh distribusi• Dihitung dengan rumus sebagai berikut :

Posisi kuartil = (ki * n)/4, – ki = 1, 2, 3 dst. dan n = jumlah pengamatan

• Nilai kuartil = – Ll = Lower limit kelas kuartil– n = jumlah pengamatan– fk = frekuensi kumulatif sebelum kelas kuartil– fki = frekuensi kelas kuartil– i = interval kelas

i

fk

fknk

LlkuartilNilaii

i

.4.

Page 27: Pengolahan Data Numerik

Contoh

No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75

Jumlah 100 1172,5 0 25

Ditanya :

1. kuartil-1/k1 …?

2. Kuartil-2/k2 …?

3. Kuartil-3/k3 …?

Page 28: Pengolahan Data Numerik

Desil

• Suatu ukuran yang membagi kumpulan/distribusi data menjadi 10 bagian yang sama. Prinsipnya sama dengan kuartil, hanya bedanya jika dengan desil kita dapat memperoleh informasi lebih detail.

• Dihitung dengan rumus sebagai berikut :Posisi desil = (di*n)/10, – di = 1, 2, 3 dst. dan n = jumlah pengamatan

Nilai Desil =– Ll = Lower limit kelas desil– n = jumlah pengamatan– fk = frekuensi kumulatif sebelum kelas desil– fdi = frekuensi kelas desil– i = interval kelas

i

fd

fknd

LldesilNilaii

i

.10.

Page 29: Pengolahan Data Numerik

Contoh

No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75

Jumlah 100 1172,5 0 25

Ditanya Desil-1 …?

Page 30: Pengolahan Data Numerik

Persentil • Suatu ukuran yang membagi kumpulan/distribusi data menjadi 100 bagian

yang sama. Prinsipnya sama dengan kuartil/desil, hanya bedanya jika dengan desil kita dapat memperoleh informasi lebih detail lagi.

• Dihitung dengan rumus sebagai berikut :

– pi = 1, 2, 3 dst. dan n = jumlah pengamatan

– Ll = Lower limit kelas persentil– n = jumlah pengamatan– fk = frekuensi kumulatif sebelum kelas persentil– fdi = frekuensi kelas persentil– i = interval kelas

iifp

fknip

LlpersentilNilai .10

.

n

nppersentilPosisi i .

Page 31: Pengolahan Data Numerik

Contoh

No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75

Jumlah 100 1172,5 0 25

Ditanya persentil …?

Page 32: Pengolahan Data Numerik

Mean deviation (Simpangan rata-rata)

• Suatu nilai yang ditentukan oleh perbedaan semua nilai terhadap mean.

• Kadang2 (jika perlu), dapat juga perbedaan semua nilai terhadap median (median deviation)

• Dihitung dengan rumus :

n

xxxd i

n

xmpfxd

n

MdxdMd i

n

MdmpfdMd

Page 33: Pengolahan Data Numerik

Variance (Variasi)

• Merupakan rata-rata kuadrat dari selisih nilai dengan mean• Adalah harga mutlak sehingga sulit untuk dimanipulasi secara

matematik.• Untuk standarisasi, maka harus diakarkan sehingga disebut

sebagai standar deviasi• Dihitung dengan rumus :

1

2

n

xxV i

Page 34: Pengolahan Data Numerik

Standard Deviation (Simpangan Baku)

• Merupakan ukuran yang paling banyak dipakai dalam analisa statistik• Diberi simbol S (parameter) dan (populasi)• Dihitung dengan rumus :1. Untuk data tidak berkelompok :

di mana (n – 1) = Faktor koreksi “Fisher & Willes”

2. Untuk data berkelompok :

1

2

n

xxS i

1

22

nn

xxS

22 ''

n

fd

n

fdiS

1

22

nn

fxfxS

Page 35: Pengolahan Data Numerik

Coefficient of variation (Koefisien variasi)

• Adalah rasio standar deviasi dengan mean, yang dinyatakan dalam persen (%).

• Berfungsi untuk membandingkan antara 2 kelompok yang mempunyai unit pengukuran berbeda (misalnyaTB dan BB) atau unit pengukurannya sama tetapi derajat/gradasinya berbeda.

• Dihitung dengan rumus :

%100xx

SDCoV

Page 36: Pengolahan Data Numerik

Standard Error (SE)

• Merupakan ukuran variasi dari populasi (bukan ukuran variasi dari sampel).

• Muncul karena adanya pengambilan sampel dari populasi.• Suatu populasi dibagi menjadi beberapa kelompok, setiap

kelompok dicari meannya (x) kemudian mean tersebut membentuk suatu kelompok data gabungan:

– Jika kelompok data gabungan itu dicari mean-nya, maka diperoleh mean populasi ().

– Jika kelompok data gabungan itu dicari SD-nya, maka diperoleh SD populasi ()

• Dihitung dengan rumus :

n

SSE

NSE