Diktat Biostatistik

BIOSTATISTIK

MODUL 1MODUL 1KONSEP DASAR STATISTIK UMUM°

1.1. PENGERTIAN STATISTIKASecara umum statistika adalah disiplin ilmu yang mempelajari metode dan

prosedur pengumpulan, penyajian, analisa dan penyimpulan suatu data mentah, agar menghasilkan informasi yang lebih jelas untuk keperluan suatu pendekatan ilmiah (scientific inferences), dan dapat dikelompokkan menjadi dua bagian, yaitu statistik deskriptif dan statistik inferensial.

Statistik deskriptif merupakan metode dan prosedur statistik yang dipakai hanya terbatas pada pengumpulan, penyajian dan analisa data dalam bentuk narasi, tabulasi atau diagram. Ukuran-ukuran yang dapat dihitung dalam analisis ini adalah ukuran tendensi sentral dan ukuran variasi tanpa perlu adanya peramalan (estimasi) dan pembuktian statistik terhadap parameter populasi.

Statistik inferensial (induktif) merupakan alat untuk merancang riset, menganalisis data dan menarik kesimpulan tentang populasi dari data sampel. Namun sebelum proses generalisasi tersebut, kita perlu mengetahui sifat-sifat data sampel itu sendiri, yang pada gilirannya dapat menentukan jenis statistik yang digunakan, apakah statistik parametrik atau non-parametrik.

Pola berfikir yang dipakai dalam inferensi statistik lebih cenderung induksi dari pada deduksi, yaitu prosedur yang berkenaan dengan generalisasi dari khusus ke umum. Ada dua kelompok besar kegunaan statistik inferensi yang dikenal, yaitu : (1) membuat pendugaan (estimasi) tentang parameter populasi, dan (2) melakukan uji hipotesis tentang karakteristik populasi.

Prosedur uji inferensial parametrik dibuat berdasarkan sejumlah asumsi, diantaranya yang paling mendasar adalah data sampel yang digunakan dalam penelitian berasal dari populasi beristribusi normal, atau paling tidak mendekati normal. Disamping normalitas distribusi populasi ini, juga dilengkapi dengan asumsi yang lainnya, yaitu : (1) pemilihan unit sampel dari populasi secara acak (random), (2) pengamatan pada unit observasi independen, (3) untuk pengamatan pada dua atau lebih unit observasi dengan varians (ragam) homogen, dan (4) variabel pengamatan diukur dalam skala interval atau rasio.

Sedangkan prosedur pada statistik uji inferensial non-parametrik dipersiapkan sebagai alternatif jika asumsi pada statistik parametrik tidak terpenuhi. Dengan kata lain, statistik non-parametrik disebut juga bebas distribusi. Hal ini bisa terjadi, karena statistik non-parametrik tidak bertujuan menduga atau menguji parameter populasi, tetapi cukup membandingkan karakteristik populasi-populasi secara umum.

Biostatistik merupakan salah satu aplikasi konsep dan metode statistika yang diterapkan pada ilmu biologi, kedokteran, farmasi dan kesehatan. Sifat aplikatif dari Biostatistik juga bermanfaat untuk menganalisis, membuat interprestasi, dan memahami fakta dan temuan-temuan riset biologi, kedokteran, farmasi dan kesehatan.

1.2. KENGUNAAN STATISTIK

Statistik dapat digunakan dalam bidang administrasi, bidang perencanaan dan evaluasi serta dalam bidang penelitian. Dalam bidang penelitian dapat dimanfaatkan untuk (1) memberikan gambaran tentang suatu objek secara lengkap dan ringkas (2) membandingkan kejadian satu dengan kejadian lainnya dengan dengan beracuan pada

BIOSTATISTIK

waktu dan tempat, dan (3) membuat ramalan pada kejadian yang sama dimasa yang akan datang.

1.3.DATA STATISTIK

1.3.1. Definisi, Karakteristik, Sifat, Jenis dan Sumber Data

Defenisi Data

Data adalah fakta yang dinyatakan dengan angka (bilangan), baik yang diperoleh dengan menghitung maupun mengukur. Disamping itu ada juga data yang hanya bisa diamati, tidak bisa dihitung dan diukur, data yang seperti ini disebut dengan data kualitatif. Untuk maksud tertentu, data kualitatif ini juga bisa disimbolkan dengan angka (bilangan), dengan demikian data kualitatif yang sudah disimbolkan dengan bilangan tadi, dapat dikatakan sebagai data kuantitatif.

Jenis Data

Berdasarkan jenisnya, data dapat dibagi dalam 2 kelompok, yaitu :1. Data kontinu, merupakan variabel numerikal yang nilainya dapat diukur terus

menerus, sampai sekecil-kecilnya atau merupakan bilangan bulat dan pecahan. Misalnya nilai Hb darah = 14,20 gr %, berat badan = 65,75 Kg, dan lain-lain.

2. Data diskrit, merupakan variabel numerikal yang nilai tidak dapat diukur sekecil-kecilnya dan merupakan satu kesatuan atau merupakan bilangan bulat, data diskrit dapat bersifat kuantitatif atau kualitatif. Misalnya jumlah ibu hamil di desa A, nilai pembobotan pada pengukuran skala likert, dan lain-lain.

Sifat Data

1. Data kualitatif, yaitu data yang tidak bisa diukur dan dihitung serta disajikan bukan dalam bentuk angka. Misalnya : agama, jenis kelamin, suku bangsa, dan lain-lain.

2. Data kuantitatif, yaitu data yang bisa diukur dan dihitung serta disajikan dalam bentuk angka. Misalnya Tekanan darah sistolik, jumlah cakupan imunisasi, dan lain-lain.

Sumber Data :

Berdasarkan sumbernya, data dapat dikelompokkan menjadi 3, yaitu :1. Data primer, yaitu data yang dikumpulkan sendiri oleh sipeneliti pada saat

berlangsung suatu penelitian.2. Data sekunder, yaitu data yang dikumpulkan secara rutin oleh instansi tertentu,

yang kemudian digunakan oleh si peneliti.3. Data tertier, yaitu data yang sudah diproses dan dipublikasikan sebagai suatu karya/

karangan ilmiah.

1.3.2. Pengumpulan Data

Dapat dilakukan secara langsung atau tidak langsung, dan tergantung dari kebutuhan informasi yang ingin dikumpulkan, tenaga pelaksana penelitian, serta dana yang tersedia. Ada lima cara yang sering dilakukan dalam kegiatan pempulan data, yaitu :

1. Observasi, merupakan cara pengumpulan data yang dilakukan secara langsung dengan cara mengamati dengan tanpa adanya perlakukan terhadap objek penelitian. Hasil pengukuran dengan cara ini lebih banyak dalam bentuk data kualitatif.

BIOSTATISTIK

2. Interview atau Wawancara, yaitu pengumpulan data yang dilakukan secara langsung di lapangan antara petugas pengumpul data dengan cara mewawancarai secara langsung reponden yang diteliti. Hal ini sangat baik dilakukan untuk mendapatkan informasi (data) yang lebih lengkap dan mendalam.

3. Kuesioner atau Angket, yaitu berupa lembaran berisi pertanyaan-pertanyaan yang disiapkan sedemikian rupa, yang berfungsi sebagai alat pengumpul data panelitian. Biasanya kuesioner dapat digunakan pada saat interview atau wawancara atau dapat juga dilakukan dengan cara mengirimkannya melalui pos kepada responden yang telah terpilih, dengan harapan akan dikembalikan.

4. Registrasi dan Pencatatan, yaitu berupa pengumpulan data secara rutin terhadap setiap kegiatan atau kejadian, dengan menggunakan sistem manajemen data yang baik, seperti angka kelahiran, kematian, kesakitan dan lain-lain.

5. Hasil ujian (test) atau hasil laboratorium, yaitu berupa pengumpulan data yang dilakukan untuk mengukur tingkat pengetahuan atau keahlian seseorang atau pencatatan hasil pemeriksaan laboratorium dan lain sebagainya.

1.3.3. Pengolahan Data

Pengertian Pengolahan DataPengolahan data ialah proses penataan data, karena data hasil pengumpulan merupakan data kasar.

Guna Pengolahan DataPengolahan data digunakan agar data kasar dapat diorganisir, disajikan dan dianalisa hingga dapat ditarik kesimpulan.

Proses Pengolahan DataKegiatan dalam proses pengolahan data adalah :

1. Memeriksa data (editing)Yang dimaksud dengan proses editing ialah memeriksa data yang telah dikumpulkan baik berupa daftar pertanayaan, kartu atau buku register.Pemeriksaan ini meliputi hal-hal senagai berikut :a. Penjumlahan

Menjumlah ialah menghitung banyaknya lembaran daftar pertanyaan yang telah diisi untuk mengetahui apakah sesuai dengan jumlah yang telah ditentukan.

b. KoreksiYang termasuk dalam proses koreksi ialah proses membenarkan atau menyelesaaikan hal-hal yang salah atau kurang jelas

2. Memberi kode (coding)Untuk mempermudahkan pengolahan, sebaiknya semua variabel diberi kode terutama data klasifikasi, misalnya jenis kelamin untuk laki-laki diberi kode 1 dan wanita diberi kode 2.

3. Menyusun data (tabulating)Penyusunan data merupakan pengorganisasian data sedemikian rupa agar dengan mudah dapat dijumlah, disusun dan ditata untuk disajikan dan dianalisisProses tabulasi dapat dilakukan dengan berbagai cara antara lain dengan metode tally, menggunakan kartu dan menggunakan komputer.

Proses Pengolahan dan Analisis Data

Editing Data ?Coding Data ?

Cleaning Data ?

BIOSTATISTIK

Sesuai

Sudah Sesuai

1.4. VARIABEL DAN SKALA PENGUKURAN

1.4.1. Variabel

Variabel adalah karakteristik unit yang diukur dalam pengumpulan data yang nilainya bervariasi misalnya umur, tinggi badan, berat badan, tekanan darah, diagnosis, pengobatan dll

1.4.2. Skala PengukuranSkala pengukuran yang dikembangkan oleh S.S. Stevens, cukup luas digunakan

dalam setiap penelitian yang membagi tingkat ukuran ke dalam empat kategori, yaitu :1. Skala nominal, skala ini merupakan tingkat pengukuran yang paling sederhana.

Numerikal yang diberikan kepada objek tidak mempunyai makna besaran (hanya sekedar label) dan tidak bisa diurut atau dijumlah. Misalnya : Jenis kelamin (1 = Pria; 2 = Wanita), Agama (1 = Islam; 2 = Kristen; 3 = Buddha), Apakah anda suka statistika (1 = Ya; 2 = Tidak), dan lain-lain.

2. Skala ordinal, penomoran pada objek ini disusun menurut besar atau urutan (rank), tetapi nomor-nomor tersebut tidak menunjukkan jarak yang sama antara dua nomor. Misalnya : Stadium penyakit (1 = Berat; 2 = Sedang; 3 = Ringan), Tingkat pendidikan (1 = SD; 2 = SLTP; 3 = SLTA; 4 = Sarjana), dan lain-lain.

3. Skala interval, skala ini mempunyai sifat berurutan. Pada skala ini jarak atau perbedaan antara nilai pengamatan satu dan nilai pengamatan lainnya dapat diketahui dengan pasti. Besar interval dapat ditambah atau dikurangi, dimana yang dijumlahkan bukanlah kuantitas atau besaran, tetapi interval. Misalnya : Temperatur (oC atau oK), Tekanan darah, dan lain-lain. Misalnya, temperatur 36 oC jelas 12 oC lebih panas dari 24 oC, dan tidak dikatakan bahwa 36 oC 1½ kali dari 24 oC. Alasanya, penentuan skala 0 oC bukan keberadaan panas absolut, tetapi hanya merupakan batas pengukuran positif dan negatif. Dengan kata lain, pada skala interval tidak dijumpai nol absolut.

4. Skala rasio, skala ini merupakan tingkat pengukuran tertinggi. Skala rasio selain memiliki sifat skala nominal, ordinal dan interval, juga mempunyai titik nol absolut dengan makna empiris. Pada skala rasio semua operasi matematik (penambahan, penguangan, pengalian dan pembagian) dapat diterapkan. Misalnya : Temperatur yang diukur dalam skala Kelvin, besar penghasilan, berat badan, elektrolit serum, dan denyut nadi.

Data Kasar Edit Data Proses Analisis Data Dengan Komputerisasi

Statistik Uji ?

Hasil Analisis Sudah Sesuai dengan Tujuan penelitian

BIOSTATISTIK

MODUL 2MANFAAT DAN TEKNIK PENYAJIAN DATA

2.1. Pengertian Penyajian Data

Penyajian data merupakan salah satu kegiatan dalam pembuatan laporan hasil penelitian yang telah dilakukan agar dapat dipahami dan dianalisis sesuai dengan tujuan yang diinginkan.

Data yang disajikan harus sederhana dan jelas agar mudak dibaca. Penyajian data juga dimaksudkan agar para pengamat dapat dengan mudah memahami apa yang kita sajikan untuk selanjutnya dilakukan penilaian atau perbandingan, dan lain-lain.2.2. Jenis-Jenis Cara Penyajian Data

Data-data yang telah dikumpulkan, setelah dianalisis sedemikian rupa, perlu disusun secara sistematik agar menjadi sederhana dan mudah dimengerti oleh pengkonsumsi informasi dan juga dapat dipresentarsikan dengan baik. Ada beberapa cara penyajian data, yaitu :

1. Textular (narasi), yaitu penyajian data berupa tulisan atau narasi. Hal ini dapat dilakukan untuk data yang jumlahnya kecil serta memerlukan kesimpulan sederhana.

2. Tabulasi, yaitu penyajian data dalam bentuk table-tabel yang terdiri dari beberapa baris dan beberapa kolom, yang digunakan untuk memaparkan sekaligus beberapa variabel hasil observasi, survei, atau penelitian lainnya, sehingga mudah dibaca dan dipahami.

3. Diagram atau Grafik, yaitu penyajian data dalam bentuk diagram ataupun grafik dapat dilakukan dengan beberapa cara sesuai dengan jenis data dan kebutuhan, seperti terlihat pada table berikut :

Tabel 1.1. Cara penggunaan Jenis Diagram/Grafik.

BIOSTATISTIK

No. Jenis Diagram Variabel Data/Fungsi

1.2.3.4.5.6.

Bar diagram (Horizontal/vertical)Pie ChartLine diagramScatter point/ dot diagramPictogram/Diagram gambarCurtogram/Diagram peta

KategorikalKategorikalNumerikalNumerikalKategorikalKategorikal

Perbandingan frekuensi distribusi dataProporsi dataTrend data (time series study)Korelasi dataPerbandingan frekuensi distribusi dataPerbandingan frekuensi distribusi data

2.3. Jenis Tabel Penyajian DataJenis tabel penyajian data adalah :

1. Tabel distribusi frekuensi2. Tabel frekuensi3. Tabel distribusi relative4. Tabel distribusi kumulatif5. Tabel silang (tabel kontingensi = contingency table = cross tabulation)2.4. Cara Membuat Tabel

Suatu tabel yang lengkap terdiri dari (1) nomor tabel, (2) judul tabel, (3) catatan pendahuluan, (4) badan tabel, (5) catatan kaki, dan (6) sumber data.Tabel 1 Contoh tabel

Judul Tabel

Judul Kompartemen

Judul Kolom Jumlah

Judul Baris Badan Tabel

Cacatan kaki :Sumber :

2.5. Menyajikan Tabel Dalam Bentuk Tabel2.5.1. Tabel Distribusi Frekuensi Contoh Tabel distribusi frekuensi

Kelompok umur (tahun) Frekuensi Persentase (%)15 – 19 5 5,020 – 24 10 10,025 – 29 16 16,030 – 34 43 43,035 – 39 12 12,040 – 44 14 14,0Jumlah 100 100,0

BIOSTATISTIK

2.5.2. Tabel Silang 2 VariabelContoh : Tabel Silang

Status Gizi Diare JumlahSakit Tidak Sakit

Baik 3 9 12Sedang 18 25 43Buruk 29 16 45Jumlah 50 50 100

2.6. Penyajian Data Kualitatif Secara Grafik

Diagram batang (Diagram balok

= Bar diagram = Bar chart)

Pil Suntikan IUD

Alat Kontrasepsi

Gambar 6. J umlah Akseptor KB Tahun 2006(Single Bar)

BIOSTATISTIK

2002 2003 2004 2005 2006

Suntikan

Gambar 7. J umlah Akseptor KB Tahun 2006(Multiple Bar)

50 75 100 150 20075125

2002 2003 2004 2005 2006

Suntikan

Gambar 8. J umlah Akseptor KB Tahun 2006(Subdivided Bar)

BIOSTATISTIK

Proporsi Penderita ISPA, Diare, DHF, Malaria Sumut Bulan Agustus 2010

Histogram

Poligon

BIOSTATISTIK

Tingkat Pendidikan

89.5 109.5 129.5 149.5 169.5 189.5 209.5

Tekanan Darah Sistolik (mmHg)

Less than

More than

Gambar 4. Distribusi Tekanan Darah Sistolik 37 Orang Perokok(Ogive)

Diagram garis (Line diagram)

01 02 03 04 05 06 07 08 09 0

1 2 3 4

K ua rta l

Jumlah

Gambar 5. J umlah Penderita DHF, Diare, I SPA di Puskesmas X Tahun 2006

Sccater Diagram

BIOSTATISTIK

MODUL 3 MENGHITUNG NILAI RATA-RATA SUATU DISTRIBUSI DATA

Penghitungan data-data sampel dalam analisis statistik deskriptif biasa dilakukan dengan memperhatikan jumlah data. Jika jumlah data kecil (biasanya kurang dari 30) dapat dengan mudah langsung dihitung tanpa harus mengelompokkannya dengan tabel distribusi frekuensi (ungrouped data), sedangkan untuk jumlah data besar (biasanya lebih dari 30) untuk memudah perhitungan secara manual dapat dilakukan dengan mengelompokkannya dengan tabel distribusi frekuensi (grouped data). Selanjutnya perhitungan akan dikelompokkan berdasarkan pembagian data ini. Dalam analisis statistik deskriptif ada dua ukuran yang dapat dihitung, yaitu ; (1) ukuran terpusat (central tendency), dan (2) ukuran variasi atau sebaran (variation/dispersion)

3.1. PENGHITUNGAN PADA DATA TIDAK BERKELOMPOK.

3.1.1. Ukuran Terpusat.

Ukuran gejala terpusat menggambarkan suatu nilai (besaran) yang khas atau yang mewakili suatu himpunan data. Nilai yang khas yang demikian cendrung terletak secara terpusat dalam suatu himpunan data yang tersusun menurut besarnya. Ada beberapa ukuran terpusat yang lazim digunakan dalam statistik, antara lain :

a). Rata-rata hitung (mean) yang dinyatakan dengan adalah suatu nilai (besaran) yang menggambarkan keterwakilan dari dari sekumpulan data. Rata-rata hitung ialah jumlah semua hasil pengamatan (∑x) dibagi dengan banyaknya pengamatan (n). Jika suatu himpunan data sebanyak n bilangan, yaitu : , maka (baca : x bar = lambing rata-rata hitung) adalah :

BIOSTATISTIK

…………….

…………………………………………………………………………………..(3.1)

dimana : = rata-rata hitung (mean)

= jumlah seluruh titik data pengamatan

n = jumlah bilangan titik data pengamatan.

Contoh 1. 1. Data berat bayi lahir (Kg) dari ibu perokok :

3,18 2,84 2,90 3,27 3,85 3,52 3,29 2,76 3,60 3,18 3,59

Berapakah : Rata-rata hitungnya ( ) ?

Jawab : =

= = 3,27

Jika bilangan-bilangan masing-masing terjadi kali, maka rata-rata hitungnya adalah :

……………………..……….…………………………………..…………….

dimana : = rata-rata hitung (mean)

= jumlah seluruh titik data pengamatan

n = jumlah bilangan titik data pengamatan.

Contoh 1. 2. Data berat bayi lahir (Kg) dari ibu perokok :

3,18 2,84 2,90 3,27 3,60 3,52 3,18 2,76 3,60 3,18 3,59

Berapakah : Rata-rata hitungnya ( ) ?

Jawab : = =

= = 3,238

BIOSTATISTIK

b). Modus (Mode) yang dinyatakan dengan adalah suatu nilai (besaran) yang terjadi dengan frekuensi terbanyak (nilai yang paling umum).

Dengan mengambil soal pada contoh 1.1., maka : = 3,18 (karena data 3,18

muncul 2 kali ( = 1) atau yang paling banyak)

c). Letak (Posisi) Data Jika data sudah tersusun (array) dengan susunan data terkecil sampai dengan data terbesar atau sebaliknya, maka masing-masing posisi atau letak data tersebut dapat ditentukan, seperti : untuk letak data di pertengahan (Median), letak data di perempatan (Quartil), letak data di persepuluhan (Desil) dan letak data di perseratusan (Persentil).

c.1.) Median (Pertengahan), dari suatu himpunan bilangan yang disusun menurut urutan besarnya (array data) adalah nilai pertengahan atau nilai tengah hitung dari pertengahan, dinyatakan dengan adalah :

………………………..………..………………………………………….

…….(3-3)

dalam bentuk garis bilangan :

Contoh 1.3. Data berat bayi lahir (Kg) dari ibu perokok (data ganjil) :

2,76 2,84 2,90 3,18 3,18 3,27 3,29 3,52 3,59 3,60 3,85

Berapakah : Mediannya ( ) ?

Jawab : = = Data ke 6 = 3,27

Data berat bayi lahir (Kg) dari ibu perokok (data genap) :

2,76 2,842,90 3,18 3,18 3,27 3,29 3,52 3,59 3,60 3,85 4,00

Berapakah : Mediannya (Me) ?

Jawab : = Data ke 6,5 = Data ke 6 + 0,5 (Data ke 7 – Data ke

= 3,27 + 0,5 (3,29 - 3,27) = 3,28

c.2.) Quartil (Perempatan) , dari suatu himpunan bilangan yang disusun menurut urutan besarnya (array data) adalah nilai perempatan atau nilai tengah hitung dari dua nilai tengah dinyatakan dengan adalah :

BIOSTATISTIK

…………..……………..…………………….

………………………………….(3-4)dimana : i =1,2,3.

Dalam bentuk garis bilangan :

= Contoh 1.4. Data berat bayi lahir (Kg) dari ibu perokok :

2,76 2,84 2,90 3,18 3,18 3,27 3,29 2,52 3,59 3,60 3,85

Berapakah : , dan ?

Jawab : = = Data ke 3 = 2,90

= = 3,27

= Data ke 9 = 3,59

c.3.) Desil (Persepuluhan), dari suatu himpunan bilangan yang disusun menurut urutan besarnya (array data) adalah nilai persepuluhan atau nilai-nilai yang membagi data atas sepuluh bagian yang sama, dinyatakan dengan adalah :

…………………………………………………………………………….

…….(3-5)

dimana: i =1,2,3,….,9.

Dalam bentuk garis bilangan :

D1 D2 D3 D4 D5=Q2=Me D6 D7 D8 D9

Contoh 1.5. Data berat bayi lahir (Kg) dari ibu perokok :

2,76 2,84 2,90 3,18 3,18 3,27 3,29 3,52 3,59 3,60 3,85

Berapakah : , dan ?

Jawab : = = Data ke 3,60

= Data ke 3 + 0,6 (Data ke 4 – Data ke 3) = 2,90 + 0,6 (3,18 - 2,90) = 3,068.

= = = 3,27

BIOSTATISTIK

= Data ke 9,6 = Data ke 9 + 0,6 (Data ke 10 – Data

= 3,59 + 0,6 (3,60 – 3,59) = 3,596

c.4.) Persentil (Perseratusan) dari suatu himpunan bilangan yang disusun menurut urutan besarnya (array data) adalah nilai perseratusan atau nilai-nilai yang membagi data atas seratus bagian yang sama, dinyatakan dengan adalah :

………………………………………………………………..…………….

…….(3-6)

dimana : I =1,2,3, …., 99.

2,76 2,84 2,90 3,18 3,18 3,27 3,29 2,52 3,59 3,60 3,85

Berapakah : , dan ?

Jawab : = = Data ke 4,2

= Data ke 4 + 0,2 (Data ke 5 – Data ke 4) = 3,18 + 0,2 (3,18 – 3,18) = 3,18.

= = = = 3,27

= Data ke 8,4 = Data ke 8 + 0,4 (Data ke 9 – Data

= 3,52 + 0,4 (3,59 – 3,52) = 3,548

3.2. PENGHITUNGAN PADA DATA BERKELOMPOK.

Jika data sampel dalam jumlah besar (n > 30) maka data-data ini harus dikelompokk dalam upaya memudah penghitungan jika dilakukan secara manual. Proses mengelompokkan ini dapat dibantu dengan membuat tabel distribusi frekuensi.

3.2.1. Tabel Distribusi Frekuensi.

Langkah-langkah membuat tabel ditribusi frekuensi dapat dilakukan dengan :1. Mencari nilai rangenya : = Data terbesar – Data terkecil.2. Menghitung jumlah kelas dengan rumus Sturgess, yaitu : …………..…...

…….….…(3-7)

BIOSTATISTIK

3. Menghitung lebar kelas (Confidence Interval) : …………………………………..

…………..……(3-8)

Dengan mempedomani perhitungan di atas, selanjutnya dapat dibuat tabel disribusi frekuensi berikut :

1. BB1 – BA1

2. BB2 – BA2

3. BB3 – BA3

…. ….. ….. …… ….. ….. ….. ….. …..

…. ….. ….. …… ….. ….. ….. ….. …..K BBK – BAK

Keterangan :

No. = Nomor kelas= Lebar kelas (Interval kelas) : = BPA – BPB ; BPA = batas paling atas;

dan BPB = batas paling bawah= Jumlah seluruh frekuensi

= Jumlah kumulatif semua frekuensi kelas pada kelas ke-i

= Nilai tengah (mid point), yaitu : = (BPA + BPB)/2= Simpangan, yaitu :

Contoh 1.7. Data berat bayi lahir (bbl) dari 40 anak.

3,18 2,84 2,90 3,27 3,85 3,52 3,23 3,90 3,25 2,502,76 3,60 3,75 3,59 3,63 2,38 2,34 2,75 3,00 2,603,99 3,79 3,60 3,73 3,25 3,60 4,08 3,00 2,75 2,503,61 3,83 3,31 4,13 3,26 3,54 3,51 3,25 3,50 2,65

Langkah-langkah membuat tabel ditribusi frekuensi

= Data terbesar – Data terkecil = : 4,13 – 2,34 = 1,79 Jumlah kelas : = 1 + 3,3 log 40 = 6,29 6

Lebar kelas (Confidence Interval) : = 0,298 0,3

Tabel 2.2. Data berat bayi lahir (bbl) dari 40 anak.

BIOSTATISTIK

1. 2,34-2,63 5 5 2,485 12,425

-4 -20 80

2. 2,64-2,93 6 11 2,785 16,710

-3 -18 54

3. 2,94-3,23 5 16 3,085 15,425

-2 -10 20

4. 3,24-3,53 8 24 3,385 27,080

-1 -8 8

5. 3,54-3,83 11 35 3,685 40,535

6. 3,84-4,13 5 40 3,985 19,925

40 132,100 -51 167

dimana : = 40 ; = 132,100 ; = - 51 ; = 167

Keterangan : Batas bawah (BB) pada kelas nomor 1 = 2,34 Batas Paling Bawah (BPB) = 2,34 – 0,005 = 2,335 Batas Atas (BA) pada kelas nomor 1 = 2,63 Batas paling Atas (BPA) = 2,63 + 0,005 = 2,635 = BPA – BPB = 2,635 – 2,335 = 0,3

= (BPA + BPB)/2 = (2,635+2,335)/2 = 2,485 (nilai tengah pada kelas nomor 1)

= 2,485 + 0,3 = 2,785 (nilai tengan pada kelas nomor 2)

= 2,785 + 0,3 = 3,085 (nilai tengan pada kelas nomor 3), demikian seterusnya

= (3,685-3,685)/0,3 = 0 (simpangan pada kelas nomor 5) = 3,685 yaitu nilai tengah pada kelas nomor 5, yaitu kelas dengan frekuen kelas yang terbesar)

= (3,385-3,685)/0,3 = -1

= (3,085-3,685)/0,3 = -2 (demikian seterusnya)

= (3,985-3,685)/0,3 = 1

3.2.2. Ukuran Terpusat.

Penghitungan ukuran terpusat untuk data berkelompok pada dasarnya sama pada penghitungan data tidak berkelompok.

a). Rata-rata hitung (mean) :

BIOSTATISTIK

…………………………………………………………..………….………….

……..(3-9)dimana :

= rata-rata hitung

= Jumlah hasil kali frekuensi kelas dengan nilai tengah pada kelas yang sama

= Jumlah seluruh frekuensi kelas

Dari tabel 1.2. Diketahui : = 132,100 ; = 40

Jadi : = 3,3025

atau, dengan menggunakan rata-rata sementara :

…………….………………………………….….………(3-

dimana :

= rata-rata hitung

= rata-rata sementara (guessed mean) diambil dari salah satu nilai tengah ( ) dan biasanya pada kelas dengan frekuensi terbesar.

= Lebar kelas (confidence interval)

= Jumlah hasil kali frekuensi kelas dengan simpangan pada kelas yang sama

= Jumlah seluruh frekuensi kelas

Dari tabel 1.2. Diketahui : = -51 ; = 40 ; = 3,685 dan = 0,3

= 3,3025

b). Modus (Mode) :

BIOSTATISTIK

………………………………..…………………………………………….(3-

dimana :

= Batas paling bawah pada kelas modus. Kelas modus adalah kelas dengan frekuensi terbesar.

= Frekuensi kelas modus – frekuensi kelas sebelumnya

= Frekuensi kelas modus – frekuensi kelas sesudahnya

= Lebar kelas

Catatan : BPB = BB – 0,5 ; jika BB bilangan bulat, (mis : BB = 10).BPB = BB – 0,05 ; jika BB bilangan bulat dengan satu desimal, (mis : BB =

10,1).BPB = BB – 0,005 ; jika BB bilangan bulat dengan dua desimal, (mis : BB =

10,01) dan seterusnya.

Dari tabel 1.2.

Diketahui : Kelas Modus ada pada kelas nomor 5 (karena frekuensi yang besar pada kelas nomor 5)

= 3,54 – 0,005 = 3,535

= 0,3 ; = 11 – 8 = 3 ; = 11 – 5 = 6

Jadi : = 3,635

c). Letak data :

c.1.) Median (Pertengahan) :

………………………………………….……………….…….(3-

dimana :

= Batas paling bawah pada kelas median. Kelas median adalah kelas dimana data ke ( ) berada.

= jumlah keseluruhan data

= Frekuensi kumulatif sebelum kelas median atau jumlah seluruh frekuensi kelas sebelum frekuensi kelas median.

= Frekuensi pada kelas median

= Lebar kelas

Dari tabel 1.2.

Diketahui : Kelas Median ada pada kelas nomor 4 (karena data ke 20 pada kelas nomor 4)

= 3,24 – 0,005 = 3,235 ; = 0,3 ; = 5+6+5 = 16 :

= 40 ; = 8

BIOSTATISTIK

Jadi : = 3,385

c.2.) Quartil (Perempatan) :

………………………..……………….………….…...…….(3-

13)dimana :

= Batas Paling Bawah pada kelas Kuartil ke-i. Kelas Kuartil ke-i adalah kelas dimana data ke ( ) berada.

= Frekuensi kumulatif sebelum kelas Kuartil ke-i atau jumlah seluruh frekuensi kelas sebelum frekuensi kelas Kuartil ke-i.

= Frekuensi pada kelas Kuartil ke-i

= Lebar kelas

= 1, 2, dan 3.

Dari tabel 1.2.

Diketahui : Kelas Quartil ke-1 ( ada pada kelas nomor 2 (karena data ke 10 pada kelas nomor 2)

= 2,64 – 0,005 = 2,635 ; = 0,3 ; = 5 : = 40 ;

Jadi : = 2,885

Kelas Quartil ke-3 ( ada pada kelas nomor 5 (karena data ke 30 pada kelas nomor 5)

= 3,54 – 0,005 = 3,535 ; = 0,3 ; = 24 : = 40 ; = 11

Jadi : = 3,698

c.3.) Desil (Persepuluhan :

BIOSTATISTIK

…………………………………..………………..……..…….

(3-14)

dimana :

= Batas Paling Bawah pada kelas Desil ke-i. Kelas Desil ke-i adalah kelas dimana data ke ( ) berada.

= Frekuensi kumulatif sebelum kelas Desil ke-i atau jumlah seluruh frekuensi kelas sebelum frekuensi kelas Desil ke-i.

= Frekuensi pada kelas Desil ke-i

= Lebar kelas

= 1, 2, …….., 9.

Dari tabel 1.2.

Diketahui : Kelas Desil ke-3 ( ada pada kelas nomor 3 (karena data ke 12 pada kelas nomor 3)

= 2,94 – 0,005 = 2,935 ; = 0,3 ; = 11 : = 40

Jadi : = 2,995

Kelas Desil ke-8 ( ada pada kelas nomor 5 (karena data ke 32 pada kelas nomor 5)

= 3,54 – 0,005 = 3,535 ; = 0,3 ; = 24 : = 40 ; = 11

Jadi : = 3,753

c.3.) Persentil (Perseratusan) :

……………………………………………….…………..…….

(3-15)

dimana :

= Batas Paling Bawah pada kelas Persentil ke-i. Kelas Persentil ke-i adalah kelas dimana data ke ( ) berada.

BIOSTATISTIK

= Frekuensi kumulatif sebelum kelas Persentil ke-i atau jumlah seluruh frekuensi kelas sebelum frekuensi kelas Persentil ke-i.

= Frekuensi pada kelas Persentil ke-i

= Lebar kelas

= 1, 2, …….., 9.

Dari tabel 1.2. Diketahui : Kelas Persentil ke-40 ( ada pada kelas nomor 3 (karena data ke

16 pada kelas nomor 3)

= 2,94 – 0,005 = 2,935 ; = 0,3 ; = 11 : =

40 ; = 5

Jadi : = 3,235

Kelas Persentil ke-85 ( ada pada kelas nomor 5 (karena data ke 34 pada kelas nomor 5)

= 3,54 – 0,005 = 3,535 ; = 0,3 ; = 24 : = 40 ; = 11

Jadi : = 3,808

3.3. Nilai Penyebaran/Ukuran Variasi (Sebaran).

3.3.1. Nilai Penyebaran Dengan Data Tidak Berkelompok

Variasi atau sebaran adalah variabelitas data atau titk-titik sebaran sejauh mana data numerik cenderung untuk tersebar disekitas suatu nilai rata-ratanya. Ada beberapa ukuran variasi yang sering digunakan, antara lain :

a). Rentang atau Jangkauan (Range), adalah selisih bilangan terbesar dan terkecil dalam suatu himpunan data, dinyatakan oleh R adalah :

R = Data terbesar – Data tekecil ……………………………….……………………………………………..(3.16)

2,76 2,84 2,90 3,18 3,18 3,27 3,29 3,52 3,59 3,60 3,85

R = 3,85 – 2,76 = 1,0922

BIOSTATISTIK

b). Rata-rata Simpangan (Mean Daviation) suatu himpunan n bilangan dinyatakan dengan MD didefenisikan oleh :

…………………………..………..……………………………(3-

Tabel 1.1. Data bbl dari kelompok ibu perokok

1. 2,76 1 0,51 0,2601 (2.76)2

2. 2,84 1 0,43 0,1849 (2.84)2

3. 2,90 1 0,37 0,1369 (2,90)2

4. 3,18 2 0,18 0,0162 2x(3.18)2

5. 3,27 1 0,00 0,00006. 3,29 1 0,02 0,00047. 3,52 1 0,25 0,06258. 3,59 1 0,32 0,10249. 3,60 1 0,33 0,1089

10. 3,85 1 0,58 0,3364

35,98 11 2,99 1,2087 118,8760

c). Simpangan baku (Standard Daviation) suatu himpunan n bilangan dan dinyatakan dengan S didefenisikan oleh :

BIOSTATISTIK

…………………………..………………………….………(3-

perhatikan tabel 1.1., dimana : = 1,2087 dan = n = 11.

= = 0,348

atau, dengan rumus :

= ……………………………..….………..…………..(3-

perhatikan tabel 1.1., dimana : = 35,98 ; = 118,876 dan = n = 11

= = 0,345

d). Varians atau Ragam (Variance) adalah kuadrat dari simpangan baku, dinyatakan dengan S2 adalah :

……………………………………………………….……….…………

(3-20)

= ……….………………………………..………………..

(3-21)

BIOSTATISTIK

Jika nilai Simpangan baku sudah didapatkan, maka Varians dapat dihitung dengan mengkuadratkan nilai simpangan bakunya, yaitu : = = 0,119

e). Koefisien variasi adalah ukuran variabelitas yang dinyatakan dalam parsentase, dan dinyatakan dengan didefenisikan oleh :

………………..………………………………….

……………………………………………(3-22)Telah diketahui : = 3,27 dan S = 0,345.

Jadi : = 10,55%

f). Koefisien Quartil adalah ukuran variabelitas yang dinyatakan dalam parsentase, dan dinyatakan dengan didefenisikan oleh :

…………….……………………………….

…………………………………………(3-24)

Telah diketahui : = 3,59 dan = 2,90

Jadi : = 10,63%

g). Simpangan Quartil adalah ukuran variabelitas yang dinyatakan dalam parsentase, dan dinyatakan dengan didefenisikan oleh :

………………………….……………….……………………………………………….

……(3-25)Telah diketahui : = 3,59 dan = 2,90

Jadi :

h). Inter Quartil Range adalah ukuran variabelitas yang dinyatakan dalam parsentase, dan dinyatakan dengan didefenisikan oleh :

…………....……………….……………….……………………………………………….……(3-26)

Telah diketahui : = 3,59 dan = 2,90

Jadi : = 0,69

BIOSTATISTIK

3.3.2. Nilai Penyebaran Dengan Data k Berkelompok

Pada dasarnya penghitungan ukuran variasi pada data berkelompok hampir sama dengan penghitungan pada data tidak berkelompok.

a). Rata-rata Simpangan (Mean Daviation) :

…………………………………………..…………..……………..…

(3-27)

= 0,414 Dari tabel 1.2.

Diketahui : = 16,5600 ; = 40

Jadi : =

b). Simpangan baku (Standard Daviation) :

…………………………………………..…..……..…………(3-

Dari tabel 1.2.

Diketahui : = 9,1777 ; = 40

Jadi : = 0,479

Atau dengan rumus ;

BIOSTATISTIK

…………………………………………….(3-

Dari tabel 1.2.

Diketahui : 132,100 ; = 445,4380 dan = 40

= 0,479

…………………………….……..(3-30)

Dari tabel 1.2.

Diketahui : - 51 ; = 167 dan = 40

= 0,479

d). Varians atau Ragam (Variance) :

…………………………………………………………….……(3-

Dari tabel 1.2.

Diketahui : = 9,1777 dan = 40

Jadi : = 0,229

atau, dengan rumus :27

BIOSTATISTIK

………………….……..(3-32)

Dari tabel 1.2.

Diketahui : - 51 ; = 167 dan = 40

Jadi : = 0,229

BIOSTATISTIK

MODUL 4KONSEP DASAR POPULASI DAN SAMPEL

4.1. PENGERTIAN POPULASI DAN SAMPEL

Dalam suatu penelitian, jika kita ingin megamati atau memeriksa secara keseluruhan subjek, hal ini berarti kita mempelajri populasi. Populasi adalah totalitas semua nilai yang mungkin, hasil menghitung ataupun pengukuran kuantitatif maupun kualitatif mengenai karakteristik tertentu dari semua anggota kumpulan yang lengkap dan jelas yang ingin dipelajari sifat-sifatnya. Sangat sering kita mengalami kesulitan untuk mengamati populasi, karena dari segi jumlah subjek, dana, tenaga, dan alat yang dibutuhkan sangat besar, maka dengan teori sampling dapat dilakukan dengan mengamati sebagian dari jumlah populasinya saja.

Pada dasarnya suatu penelitian harus mampu dilaksanakan (feasible), artinya tersedianya subjek penelitian, dana, waktu, alat dan tenaga ahli yang sesuai. Apabila dalam pelaksanaanya ditemukan kendala seperti keterbatasan dana, waktu, alat dan tenaga ahli, tetapi kita harus melakukan pengamatan kritis pada seluruh sabjek penelitian, maka dapat dilakukan pada sebagian subjek yang tersedia saja, hal seperti ini disebut dengan sampling.

Sampling adalah cara pengumpulan data penelitian yang hanya mengamati sebagian (elemen sampel) dari keseluruhan subjek penelitian yang diteliti.Keuntungan-keuntungan dari penarikan sampel, antara lain :1. Dana, waktu, alat dan tenaga ahli yang diperlukan lebih sedikit dibandingkan jika

penelitian dilakukan langsung pada populasi.2. Mudah dan lebih cepat dikerjakan serta hasilnya dapat segera dievaluasi dan

dianalisa.3. Data yang dikumpulkan lebih komprehensif (dengan cakupan lebih besar) dan

representatif, serta merupakan refleksi dari karakteristik populasi yang diteliti.4. Tingkat ketelitian lebih besar, artinya pemeriksaan pada sampel akan lebih teliti dan

sangat objektif daripada pemeriksaan lengkap pada seluruh elemen populasi.Penarikan sampel bila dilakukan dengan prosedur yang sesuai dan benar, maka

suatu sampel dapat merupakan cara yang lebih efisien (cost efficient) untuk mengunpulkan data dari harus meliputi keseluruhan elemen populasi.

Penelitian survei adalah merupakan salah satu penelitan yang dalam penyelidikan kritis-nya dalam rangka memperoleh atau mencari keterangan atas suatu persoalan atau fenomena tertentu dalam suatu daerah atau wilayah tertentu dilakukan dengan mengambil sampel dari suatu populasi yang tersedia. Biasanya alat ukur (instrumen) yang digunakan dalam penelitian survei ini adalah kuesioner. Jadi, pada penelitian survei kesimpulan tentang sifat populasi yang dihasil-kan sangat tergantung pada sampel yang dipelajari, artinya sampel ynag dipelajari ini diperoleh dengan prosedur teknik sampling yang bagaimana.

Sedangkan Sensus adalah cara pengumpulan data atau penelitian yang menggunakan seluruh elemen populasi yang diteliti satu per satu (a complete enumeration) dan hasilnya merupakan data yang sebenarnya (parameter)

BIOSTATISTIK

4.2. Teknik penarikan sampelPeranan yang terpenting dari penarikan sampel dalam suatu penelitian survei

adalah untuk mendapatkan sampel yang betul-betul representatif dan pada gilirannya akan menghasilkan kete-rangan (informasi) yang dapat diandalkan mengenai sifat-sifat populasi yang ingin dijelaskannya.

Disamping itu tujuan mempelajari teknik sampling adalah (1) untuk membuat penarikan sampel menjadi lebih efesien, (2) untuk mengetahui apakah metoda penarikan sampel sudah benar, dan (3) untuk dapat melakukan pendugaan atau pengujian terhadap nilai parameter populasi dengan tingkat ketepatan yang tinggi.

Sesuai dengan tujuan utama melaksanakan survei adalah untuk membuat kesim-pulan tentang sifat-sifat populasi berdasarkan informasi yang terkandung dalam sample.

Untuk mendapatkan ketepatan (precision), kepekaan (sensitivity), dan banyaknya informasi (amount of information) yang terkandung dalam sampel diukur sebagai berbanding terbalik dari ragam (variance) dan nilai rata-rata (mean), dan secara matematis digambarkan sebagai berikut :

…………………………………………………………………….…………….

dimana : I

= banyaknya informasi yang terkandung dalam sample= varians populasi= banyak sample

Dari formula di atas, terlihat bahwa jika varians populasi ( ) besar, maka banyak infor-masi dalam sample berkurang (sedikit), juga apabila ukuran semakin sampel besar, maka banyak informasi dalam sampel akan bertambah. Jadi ada dua faktor yang mempengaruhi banyak atau berkurang informasi yang terkandung dalam sampel, yang pada giliranya akan mempengaruhi ketepatan dari prosedur pembuatan kesimpulan tentang populasi.

Untuk mendapatkan sampel yang benar-benar representatif bagi populasinya dengan mem-perhatikan keragaman data yang ada dalam populasinya, dapat dilakukan dengan teknik pencupli-kan sampel (sampling technique). Dengan teknik sampling ini diharapkan bisa memperoleh informasi yang optimal yang terkandung dalam sampel, sehingga survei yang dilakukan dapat bersifat lebih efesien dalam artian dengan mengeluarkan ongkos yang minimum dapat diperoleh informasi yang maksimal.

Teknik penarikan sampel dapat dikelompok dalam dua bagian, yaitu penarikan sampel acak (probabilitas sampling random) dan pencuplikan sampel tidak acak (non-probabilitas sampling random).

(1) Probability random samling, Hal prinsip pada probability sampling adalah bahwa setiap unit (elemen) dalam

populasi mempunyai kesempatan yang sama untuk terpilih (terambil) sebagai sampel.

1. Penarikan Sampel Acak Sederhana (Simple Random Sampling)

Pada setiap unit (elemen) populasi diberi nomor, kemudian sampel yang diinginkan ditarik secara acak, baik dengan menggunakan tabel random ataupun dengan undian.

2. Penarikan Sampel Acak Sistematik (Systematic Random Sampling)

BIOSTATISTIK

Pada setiap unit (elemen) populasi diberi nomor dan diurut, kemudian ditentukan satu nomor sebagai titik tolak penarikan sampel sampel secara acak. Nomor berikut dapat ditarik dengan kelipatan (K = N/n) yang dilakukan secara sistematis.

3. Penarikan Sampel Acak Berlapis (Stratified Random Sampling)

Populasi dibagi dalam kelompok yang homogen lebih dahulu, atau dalam strata. Elemen sampel dapat ditarik dari setiap strata.

4. Penarikan Sampel Acak Bergerombol (Cluster Random Sampling)

Populasi dibagi dulu atas kelompok berdasarkan area atau cluster. Elemen sub populasi tiap cluster tidak harus homogen. Lakukan sampling acak pada cluster lebih dulu, kemudian pada cluster yang terpilih dapat dilakukan sampling dengan cara simple random sampling atau systematic random sampling ataupun juga dapat langsung mengamati seluruh elemen dalam cluster.

5. Penarikan Sampel Acak Bertahap Ganda (Multistage Random Sampling)

Populasi dibagi dalam beberapa tahap (stage). Tahap pertama menentukan subpopulasi dimana sampel akan ditarik. Jika peneliti ingin menentukan populasi tahap berikutnya dapat dilakukan dengan menentukan sub-sub populasi sampai dimungkinkan pada populasi mana elemen sampel dapat ditarik.

(2) Non probability random sampling.

Penarikan sampel non probability prosedurnya lebih sederhana dan lebih praktis. Oleh karena penarikan sampelnya tidak acak, maka kesahihan sampel non probability tergantung pada sejauh mana penarikan sampel yang dilakukan dapat menyerupai probability sampling. Cara yang dilakukan untuk mendekati prosedure probability sampling yang dimaksdud, dilakukan dengan menentukan kriteria inklusi dan eksklusi terhadap sampel sampel yang ditetapkan berdasarkan pencapaian tujuan penelitian yang diinginkan. Apakah penarikan sampel non probability ini sudah sesuai dengan kriteria inklusi dan eksklusi.

1. Purposive Sampling

Pengambilan sampel ditentukan berdasarkan pertimbangan yang dibuat oleh peneliti sendiri, berdasarkan karakteristik atau sifat populasi yang sudah dikatahui sebelumnya.

2. Quota Sampling

Penarikan sampel dilakukan dengan cara menetapkan sejumlah eleman sampel secara kuota (jatah) sesuai dengan keiinginan peneliti.

3. Convinience Sampling

Sampel dipilih dengan semaunya saja tanpa menggunakan prosedur yang jelas.

4. Consecutive Sampling

Pemilihan sampling ditetapkan berdasarkan kriteria penelitian dalam kurun waktu terentu sampai jumlah sampel yang diinginkan terpenuhi.

5. Judgement Sampling

BIOSTATISTIK

Pada cara ini peneliti memilih subjek penelitian berdasarkan pertimbangan subjektifnya, dengan harapan subjek tersebut nantinya akan mampu memberikan informasi yang memadai untuk menjawab permasalahan penelitian.

6. Panel Sampling

Sampel semi permanen yang dipilih untuk keperluan suatu studi yang berkelanjutan.

4.3. Kriteria rancangan sampel yang dapat diandalkan.

Rancangan sampel yang dapat diandalkan, apabila memenuhi kriteria sebagai berikut : 1. Mempunyai kemampuan untuk mewakili (representativeness). Suatu sampel harus

menjadi wakil dari populasi induknya sehingga penalaran yang diambil dari sampel dapat digene-ralisasi terhadap populasi tersebut dengan tingkat ketepatan dan kepercayaan yang dapat diukur.

2. Efisien dan ekonomis dalam artian rancangan sampling yang disiapkan sedemikian rupa sehingga penghematan waktu dan biaya dapat dicapai tanpa mengurangi pencapaian tujuan penelitian. Dengan kata lain, sampel harus dapat memberikan informasi yang dikehendaki didalam batas kesalahan sampling yang sudah diperkirakan tetapi masih dapat ditoleransi untuk biaya yang paling murah. Sebaliknya, sampel harus dapat meberikan informasi pada suatu biaya pasti dengan kesalahan sampling (sampling error) paling kecil.

3. Terukur (measurability), artinya peneliti dapat memperkirakan sejauh mana temuan-temuan dari sampel cendrung berbeda dari yang akan ia temukan jika ia meneliti seluruh populasi induknya.

4. Ukuran (size) sampel minimal harus cukup besar untuk memperkecil ragam (variabelitas) sampel bagi pendugaan parameter yang harus dibuat dengan tingkat ketepatan (presisi) yang dapat diukur.

5. Prosedur sampling harus sederhana dan praktis sehingga mudah dilaksanakan dilapangan

4.4. Beberapa terminologi dalam sampling

1. Populasi (population), ialah kumpulan yang lengkap dari seluruh elemen yang sejenis, tetapi dapat dibedakan berdasarkan karakteristiknya. Populasi dapat dibagi menjadi dua, yaitu : a. Populasi target (target population) yang ditentukan berdasarkan karakteristik

subjek yang diteliti dan demografis. Misalnya penderita anemia ibu hamil dengan umur kehamilan kurang dari 12 minggu di kota X.

b. Populasi terjangkau (accessible population, source population) disebut juga populasi sampling adalah bagian dari populasi target dengan spesifikasi yang lebih tegas dan terfokus pada subjek yang ingin diteliti dan dibatasi oleh tempat serta waktu. Misalnya Ibu hamil dengan kasus anemia berat yang berkunjung di beberapa Puskesmas di kota X selama tahun 1990-1991.

Catatan, dalam penelitian survei yang dilakukan, populasi yang didefenisikan langsung menggambarkan populasi terjangkau.

2. Elemen (element) ialah sesuatu yang menjadi objek (boleh orang atau benda) yang padanya dapat dilaku-kan pengukuran untuk memperoleh nilai data yang diharapkan.

BIOSTATISTIK

3. Karakteristik (characteristics) ialah sifat-sifat atau ciri-ciri yang melekat (dimiliki) elemen.

4. Unit sampling (sampling units) ialah kumpulan elemen-elemen dari populasi tertentu yang tidak bersifat tumpang tindih.

5. Kerangka sampling (sampling frame) ialah daftar unit-unit sampling.6. Populasi (population) ialah kumpulan yang lengkap dari seluruh elemen yang

sejenis, tetapi dapat dibedakan karena karakteristiknya.7. Parameter (parametric) ialah nilai sesungguhnya dari populasi, dimana nilai ini

bisa diperoleh jika yang diamati (dipelajari) keseluruhan dari elemen populasi.7. Sampel (sample) ialah sebagian elemen dari keseluruhan elemen populasi, Jika n =

jumlah elemen sampel dan N = jumlah elemen populasi, maka n (sampel) lebih kecil dari N (populasi).

9. Statistik (statistics) ialah nilai yang diperoleh dari penghitungan pada sampel dan dapat digunakan untuk menduga (menaksir) parameter populasi.

10. Distribusi sampling (sampling distribution) ialah distribusi penarikan sampel dari nilai-nilai statistik yang didapatkan dari sampel-sampel yang dikumpulkan (baik dengan penarikan sampel dengan atau tampa pengembalian). Jika nilai statistik yang dimaksudkan adalah rata-rata (mean), maka distribusinya disebut distribusi penarikan sampel dari nilai rata-rata (sampling distribution of the mean). Demikian juga dengan ditribusi sampling lainnya, dapat dilakukan dengan nilai statistik seperti simpangan baku, varians, median, proporsi dan nilai-lain.

11. Sampling error ialah kesalahan yang terjadi karena pengukuran data sampel yang dikumpul-kan, sehingga terjadi selisih antara perkiraan statistik dengan parameter.

12. Sampling acak ialah penarikan elemen sampel dari elemen populasi yang dilakukan secara acak (random). Acak adalah memberikan kesempatan yang sama kepada seluruh elemen populasi untuk terpilih sebagai sampel.

MODUL 5PENGUJIAN HIPOTESIS

A. PENDUGAAN PARAMETER

Pendugaan atau estimasi disebut juga dengan penaksiran dan berguna untuk menaksir nilai-nilai parameter populasi atau membuat kesimpulan tentang populasi lewat sampel yang representatif untuk inferensi statistic. Nilai-nilai statistik, misalnya : mean, proporsi dan SD dan sbb

Istilah-istilah yg perlu dipahami

Simpangan baku (standard Deviation) merupakan ukuran variabelitas atau sebaran nilai yg menggambarkan variasi nilai individual sekitar rata-rata.

Kesalahan baku (Standard Error = SD), adalah kesalahan baku rata-rata yg berkaitan dgn ketepatan rata-rata yg diduga sesungguhnya.

BIOSTATISTIK

Galat Pendugaan adalah merupakan perbedaan absolut dari nilai statistik dan parameter, atau suatu nilai yang ditolerir untuk suatu kesalahan dalam pendugaan titik sampel terhadap ruang pupulasi.

Interval kepercayaan (Confidence Interval = CI) atau interval taksiran (Estimasi taksiran), digunakan untuk mendapatkan nilai taksiran yang relatif atas nilai yg diharapkan.

Tingkat kepercayaan (Confidence Level = CL) yang lazim dilambangkan dengan α adalah merupakan kesalahan atas penolakan hipotesis nol yang benar (error tipe I), artinya nilai α ini dalam estimasi berfungsi untuk menunjukkan besarnya probabilitas atau kesalahan tipe I yang berakibat pada tinggi rendahnya tingkat kepercayaan.

B. Uji Hipotesa

Utk membuat suatu keputusan terhadap suatu objek penelitian atau populasi berdasarkan informasi yang berasal dari data sampel, haruslah dimulai dengan suatu asumsi atau penaksiran terhadap segala kemungkinan yg akan terjadi pd suatu populasi, dimana kemungkinan ini dapat diterima atau ditolak, kegiatan ini disebut sebagai Statistical Hypothesis

Dalam uji hipotesis diperoleh kemungkinan menerima atau menolak hipotesis. Bila kita menyatakan bahwa tidak ada perbedaan bermakna secara statistik antara parameter sampel dengan populasi, hal ini disebut dengan hipotesis nol (Ho), sebaliknya bila kita menyatakan ada perbedaan bermakna secara statistik, disebut hipotesis alternatif (Ha).

5.1. PENDUGAAN DAN UJI HIPOTESA SATU PARAMETER

5.1.1. Pendugaan bagi rata-rata populasi () dengan n 30 (sampel besar) dan diketahui

Jika adalah rata-rata sampel acak berukuran n (n 30) yang diambil dari suatu populasi dengan 2 (varians atau ragam) diketahui, maka Interval Kepercayaan (1-).100 % bagi adalah :

…………………….………..………………………………………..(5-1)

dimana

rata-rata sesungguhnya (populasi)rata-rata sampelNilai baku normal berdasarkan error type I () yang ditentukan Simpangan baku populasiJumlah sampel.

)α/,(CC ZZn

σZxμ 250

BIOSTATISTIK

ZC.(/n) adalah batas galat pendugaan bagi , artinya bila (rata-rata sampel) digunakan untuk menduga (rata-rata populasi), maka kita percaya (1-).100 % bahwa galatnya tidak akan lebih dari ZC.(/n).

Galat Pendugaan

-ZC.(/n) + ZC.(/n)

5.1.2. Uji Hipotesis rata-rata populasi ( ) dengan n 30 (sampel besar) dan diketahui

Jika adalah rata-rata sampel acak berukuran n (n 30) yang diambil dari suatu populasi dengan 2 (varians atau ragam) diketahui, maka uji hipotesis rata-rata populasi (sesungguhnya) digunakan statistik uji berikut :

……………………………………………………..…………………………….…………………(5-2)

dimana :

rata-rata sesungguhnya (populasi)rata-rata sampelNilai baku normal yang besarnya tergantung eror type I () yang ditentukan Simpangan baku populasiJumlah sampel.

Pasangan hipotesis dan daerah kritis :

Terima Ho, jika : ; sebaliknya tolak Ho.

dimana : atau : dengan membandingkan nilai probabilitas (Prob.) maksimal penolakan Ho ber-dasarkan data sampel yang diamati, dengan nilai yang ditentukan sebelumnya. Tolak Ho, jika : Prob. < (/2), sebaliknya Ho diterima.

= o > o

Tolak Ho, jika : ; sebaliknya terima Ho.

dimana : atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.

= o < o

Tolak Ho, jika : ; sebaliknya terima Ho.

nσ-μx

BIOSTATISTIK

Contoh : 3.1.

Hasil pemeriksaan oleh tim kesehatan universitas menyatakan bahwa rata-rata tekanan darah sistolik seluruh mahasiswa yang masuk tahun sebelumnya adalah 127,5 mmHg. Seorang mahasiswa FKM ingin membandingkannya dengan mahasiswa yang ada saat ini. Untuk maksud tersebut ia membuat suatu survei mini dan mengambil sampel secara acak sebanyak 50 orang mahasiswa. Diasumsikan data ke 50 mahasiswa ini, data populasinya menyebar normal. Dari data sampel yang dikumpulkan dapat dihitung rata-rata tekanan darah sistoliknya ( ) 124 mmHg dan simpangan baku (S) 26,9 mmHg. Gunakan Confidence Level () 5 %.Pertanyaan :

a). Buatlah taksiran dengan interval kepercayaan 95 % bagi tekanan darah sistolik (tks) mahasiswa sesung-guhnya ?

b). Selanjutnya jelaskan galat pendugaan bagi rata-rata tekanan darah sistolik mahasiswa sesungguhnya oleh titik taksiran sebesar 124 mmHg ?

c). Ujilah, apakah rata-rata tekanan darah sistolik mahasiswa sekarang berbeda dengan tahun sebelumnya ? Gunakan = 0,05.

Jawab :

a). Untuk melakukan pendugaan bagi rata-rata populasi ( ) oleh rata-rata sampel ( ) sebesar 124 mmHg dengan ukuran sampel (n ) sebanyak 50 mahasiswa dapat dilakukan dengan rumus (1-1).

ZC = Z(0,5 - /2) = Z0,4750 = 1,96 (Tabel. II)

Jika (simpangan baku populasi) tidak diinformasikan pada soal, dapat digunakan S (simpangan baku sampel).

Jadi : = 124 7,46

atau : Interval kepercayaan 95 % bagi adalah : [116,54 ; 131,46]Kesimpulan : Kita percaya 95 % bahwa rata-rata sesungguhnya () tekanan darah sistolik mahasiswa ada dalam interval dengan batas bawah 116,54 sampai dengan batas atas 131,46 atau dalam jangkauan sekitar 14,92 mmHg.

b). Dapat dinterpretasikan bahwa jika kita ingin menaksir rata-rata sesungguhnya () dengan mengguna-kan rata-rata sampel ( ) sebesar 124 mmHg dalam interval kepercayan 95%, maka kita boleh membuat kesalahan dalam penaksiran (galat

penduggaan) tidak lebih dari ( ) atau sebesar 7,46 mmHg. Atau dapat juga

dinyatakan bahwa batas galat pendugaan (GBP) dalam pendugaan bagi sama dengan 7,46 mmHg.

c). Ho :

Ha : 127,5 mmHg.

Statistik uji yang digunakan : = -0,92 Nilai Prob. = 0,3576a)

BIOSTATISTIK

Titik kritis : ZC = Z(0,5-/2) = Z0,4750 = 1,96Ternyata : -1,96 <ZH (= -0,92) < 1,96 dapat dinyatakan ZH berada pada daerah penerimaan Ho. atau berdasarkan nilai probabilitas, dimana : Prob. (= 0,3578) > (= 0,025) artinya. Ho diterima.

Kesimpulan : Hasil penyelidikan yang dilakukan mahasiswa AKBID tersebut mendukung pernyataan tim kesehatan terdahulu bahwa rata-rata TKS mahasiswa sekarang sesungguhnya sama dengan mahasiswa tahun sebelumnya pada taraf uji () 5 %

5.1. 3. Pendugaan bagi rata-rata populasi () dengan n < 30 (sampel kecil) tidak diketahui

Jika adalah rata-rata sampel acak berukuran n (n < 30) yang diambil dari suatu populasi dengan 2 (varians atau ragam) tidak diketahui, maka Interval Kepercayaan (1-).100 % bagi adalah :

…………………………….…………..…………..………(5-3)

dimana :

rata-rata sesungguhnya (populasi)rata-rata sampelNilai baku t-student berdasarkan error type I () yang ditentukan Simpangan baku sampel.

5.1.4. Uji Hipotesis rata-rata populasi () dengan n < 30 (sampel kecil) tidak diketahui

Jika adalah rata-rata sampel acak berukuran n (n < 30) yang diambil dari suatu populasi dengan 2 (varians atau ragam) tidak diketahui, maka uji hipotesis bagi rata-rata populasi (sesungguhnya) digunakan statistik uji berikut :

……………………..…………….……..…………..…………………………………….……(5-4)

dimana

rata-rata sesungguhnya (populasi)rata-rata sampelNilai baku t-student yang besarnya bergantung pada yang ditentukanSimpangan baku sampel.

a) Prob. = 2{0,5 – L(ZH = -0,92)} = 2(0,5 – 0,3212) = 0,3576atau : Prob. = 1 – 2{L(ZH = -0,92)} = 1 – 2(0,3212) = 0,357

12 n-dkttn

Stxμ );dk/(CC

- μx t o

BIOSTATISTIK

Terima Ho, jika : ; sebaliknya tolak Ho.

dimana : dk = n - 1atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.

= o > o

Tolak Ho, jika : tH > tC ; sebaliknya terima Ho.

= o < o

Tolak Ho, jika : tH < -tC ; sebaliknya terima Ho.

Contoh : 3.2.

Dari 25 mahasiswa yang diambil secara acak, masing-masing diukur tinggi badan mereka, dan diperoleh data seperti berikut : 160,5 ; 160,0 ; 157,0 ; 154,0 ; 165,0 ; 167,0 ; 170,5 ; 172,5 ; 167,5 ; 174,5 ; 167,0 ; 168,0 ; 150,0 ; 145,0; 150,0 ; 155,0 ; 160,0 ; 162,5 ; 170,0 ; 166,0 ; 165,5 ; 170,0 ; 174,0 ; 155,5 ; 175,0.

= 4082 dan = 668169.

Dari data yang terkumpul diperoleh rata-ratanya adalah 163,28 cm, dan simpangan baku sebesar 8,317 cm. Berdasarkan data tahun sebelumnya rata-rata tinggi badan adalah 165,7 cm. a). Buatlah pendugaan bagi rata-rata tinggi badan mahasiswa yang sesungguhnya (

) pada tingkat keyakinan 99%.b). Jelaskan tentang galat pendugaan bagi pendugaan oleh pada tingkat keyakinan

99%.c). Ujilah apakah tinggi badan mahasiswa tahun sekarang lebih rendah dari tahun

sebelumnya. Gunakan = 0,01.

Jawab :

a). Untuk melakukan pendugaan bagi rata-rata populasi ( ) oleh rata-rata sampel ( ) sebesar 163,28 cm dengan ukuran sampel (n ) sebanyak 25 mahasiswa dapat dilakukan dengan rumus (7-3).

= = 2,797 (Tabel. III)

Jadi : = 163,28 4,65

atau : Interval kepercayaan 99 % bagi adalah : [158,63 ; 167,93]

BIOSTATISTIK

Kesimpulan : Kita percaya 99 % bahwa rata-rata sesungguhnya () tinggi badan mahasiswa ada dalam interval dengan batas 158,63 sampai dengan 167,93 atau dalam jangkauan sekitar 9,3 cm.

b). Dapat dinterpretasikan bahwa jika kita ingin menaksir rata-rata sesungguhnya () dengan menggunakan rata-rata sampel ( ) sebesar 163,28 cm dalam interval kepercayaan 99%, maka kita boleh membuat kesalahan dalam penaksiran (galat

penduggaan) tidak lebih dari ( ) atau sebesar 4,65 cm. Atau dapat juga

dinyatakan bahwa batas galat pendugaan (BGP) dalam pendugaan untuk sama dengan 4,65.

c). Ho :

Ha : = 165,7 cm

Statistik uji : Prob. = 0,165b)

Titik kritis : = = 2,492

Ternyata : (= -1,455) > (= -2,492) Ho diterima. (Prob. (= 0,165) > (= 0,01) Ho diterima).

Kesimpulan : Tidak benar bahwa tinggi badan mahasiswa sekarang lebih rendah dari tinggi badan mahasiswa tahun sebelumnya, pada taraf uji () 1 %.

5.2. PENDUGAAN DAN UJI HIPOTESIS PARAMETER POPULASI DENGAN DUA SAMPEL

5.2.1. Pendugaan beda dua rata-rata populasi : (1-2) dengan 12 dan 2

diketahui

Jika dan masing-masing adalah rata-rata sampel acak berukuran n1 dan n2

yang diambil dari suatu populasi dengan varians dan diketahui (n 30), maka

Interval Kepercayaan (1-).100% bagi (1-2) adalah :

…………………………………..………..(5-5)

dimana :

1-2 = selisih rata-rata sesungguhnya (populasi)- = selisih rata-rata sampel

= varians pada kelompok populasi 1 dan 2

dan = rata-rata sampel pada kelompok populasi 1 dan 2 .

)-αα,(CC Z Z n

σ Zxx -μμ 250

BIOSTATISTIK

5.2.2. Uji Hipotesis perbedaan dua rata-rata populasi : ( ) dengan 12 dan 2

diketahui

Jika dan masing-masing adalah rata-rata sampel acak berukuran n1 dan n2

yang diambil dari suatu populasi dengan varians 12 dan 2

2 diketahui (n 30), maka uji hipotesis beda rata-rata populasi (sesungguhnya) digunakan statistik uji berikut :

……..…………...……………………………………………..……….….…………..(5-6)

dimana :1-2 = beda rata-rata sesungguhnya (populasi)

- = beda rata-rata sampel

12 dan 2

=varians pada kelompok populasi 1 dan 2

dan = rata-rata sampel pada kelompok populasi 1 dan 2 .

d). Interpolasi :

1 2 Terima Ho, jika : ; sebaliknya tolak Ho.

dimana : atau : Tolak Ho, jika : Prob. < , sebaliknya Ho diterima.

1 > 2 Tolak Ho, jika : ; sebaliknya terima Ho.

1 < 2 Tolak Ho, jika : ; sebaliknya terima Ho.

x - x Z H

BIOSTATISTIK

Contoh : 3.5.

Suatu sampel acak mahasiswi berukuran n1 = 25, yang ditarik dari suatu populasi normal dapat dicatat hasil ujian Biostatistik mereka sebagai berikut : 70 ; 80 ; 85 ; 75 ; 60 ; 65 ; 75 ; 60 ; 75 ; 80 ; 85 ; 90 ; 85 ; 70 ; 65 ; 60 ; 65 ; 60 ; 55 ; 85 ; 80 ; 70 ; 75 ; 80 ; dan 60. Dapat dihitung = 72,40 dan S1 = 10,12. Suatu sampel acak lain berukuran n2 = 36 dapat dicatat hasil ujian Biostatistik sebagai berikut : 60 ; 60 ; 65 ; 65 ; 60 ; 75 ; 75 ; 80 ; 80 ; 75 ; 70 ; 65 ; 80 ; 65 ; 75 ; 70 ; 50 ; 50 ; 55 ; 65 ; 60 ; 75 ; 75 ; 80 ; 75 ; 60 ; 60 ; 55 ; 55 ; 50 ; 60 ; 75 ; 70 ; 75 ; 85 ; dan 70. Diperoleh = 67,22 dan S2 = 9,67.

Pertanyaan :a). Buatlah penaksiran terhadap selisih rata-rata sesungguhnya ( pada tingkat

kepercayaan 99 % dan 95 %.c). Jelaskan galat pendugaan bagi penaksiran selisih rata-rata sesungguhnya dengan

menggunakan rata-rata sampel pada intervak kepercayaan 99 % dan 95 %.b). Ujilah apakah kedua kelompok mahasiswi dan mahasiswa tersebut nilai ujiannya

berbeda nyata ? Gunakan = 0,01 dan 0,05.

Jawab :

a). Untuk melakukan taksiran bagi selisih rata-rata populasi ( ) oleh selisih rata-

rata sampel ( ) dengan ukuran sampel n1 dan/atau n2 lebih dari 30 (sampel besar) dapat dilakukan dengan rumus (5-9).

Jika atau (varians populasi) tidak diinformasikan pada soal, dapat digunakan

atau (varians sampel).

Pada = 0,01

atau : Interval kepercayaan 99 % bagi selisih adalah : [-1,48 ; 11,84]

BIOSTATISTIK

Kesimpulan : Kita percaya 99 % bahwa selisih rata-rata sesungguhnya ( ) nilai ujian mahasiswa ada dalam interval dengan batas –1,48 sampai dengan 11,84 atau dalam jangkauan sekitar 13,32.

Pada = 0,05

atau : Interval kepercayaan 95 % bagi selisih adalah : [0,11 ; 10,25]

Kesimpulan : Kita percaya 95 % bahwa selisih rata-rata sesungguhnya ( ) nilai ujian mahasiswa ada dalam interval dengan batas 0,11 sampai dengan 10,25 atau dalam jangkauan sekitar 10,14.

b). Pada = 0,01 Juga dapat dinterpretasikan bahwa jika kita ingin menaksir selisih

rata-rata sesung-guhnya ( ) dengan menggunakan selisih rata-rata sampel (

) sebesar 5,18 maka kita boleh membuat galat pendugaan tidak lebih dari (

) atau sebesar 6,66.

Pada = 0,05 Juga dapat dinterpretasikan bahwa jika kita ingin menaksir selisih

rata-rata sesungguhnya ( ) dengan menggunakan selisih rata-rata sampel (

) sebesar 5,18 maka kita boleh membuat galat pendugaan tidak lebih dari (

c). Ho :

Statisti uji : Prob. = 0,0456

Titik kritis : untuk = 0,01 ZC = Z0,4950 = 2,575 dan = 0,05 ZC = Z0,4750 = 1,96

Ternyata : pada = 0,01 ZH (= 2,002) < ZC (2,575) Ho diterima,dan pada = 0,05 ZH (= 2,002) > ZC (1,96) Ho ditolak. Atau berdasarkan nilai probabiltas, yaitu : Prob. (= 0,0456) > (= 0,01) Ho diterima,

dan Prob. (= 0,0456) < (= 0,05) Ho ditolak.

Kesimpulan : Hasil statistik pada taraf nyata () 1% Ho diterima dan pada taraf nyata () 5% Ho ditolak, hal ini menunjukkan tingkat signifikasi yang tidak terlalu kuat, artinya ada keraguan untuk menyatakan ada perbedaan nilai ujian kedua kelompok mahasiswa tersebut. Oleh karena masih diragukan, maka diperlukan penelitian lanjutan dengan manambah besar sampel.

5.2.3. Pendugaan beda dua rata-rata populasi : ( ) dengan 12 = 2

(Independent samples t-test)

BIOSTATISTIK

Jika dan masing-masing adalah rata-rata sampel acak berukuran kecil n1

dan n2 (n < 30), yang diambil dari dua populasi dengan varians dan tidak diketahui.

Diasumsikan kedua varians sama ( = ), maka Interval Kepercayaan (1-).100 % bagi

(1-2) adalah :

…………….………....(.5-7)dimana :1-2 = selisih rata-rata sesungguhnya (populasi)

- = selisih rata-rata sampel

dan = varians pada sampel dari kelompok populasi 1 dan 2

Sg = simpangan baku gabungan dan = Rata-rata sampel

5.2.4. Uji Hipotesis beda dua rata-rata populasi : ( ) dengan 12 = 2

(Independent samples t- test)

Jika dan masing-masing adalah rata-rata sampel acak berukuran kecil n1

dan n2 (n < 30), yang diambil dari dua populasi dengan varians 12 dan 2

2 tidak diketahui. Diasumsikan kedua varians sama (1

2 = 22), maka uji hipotesis beda dua rata-rata

populasi digunakan statistik uji berikut :

….……………….…..………..……….….(5-8)

Dimana :1-2

2 dan S2

beda rata-rata sesungguhnya (populasi)

beda rata-rata sampelvarians pada sampel dari kelompok populasi 1 dan 2simpangan baku gabunganrata-rata sampel dari kelompok populasi 1 dan 2 .

1 2 Terima Ho, jika : ; sebaliknya tolak Ho.

dimana : dk = n1 + n2 - 2atau :

Tolak Ho, jika : Prob. < , sebaliknya terima Ho.

212121

nn dk t t

)S(n)S(nS

nn..S txx -μμ

):dkα

)S(n)S(n S

xx t g

BIOSTATISTIK

1 > 2 Tolak Ho, jika : ; sebaliknya terima Ho.

1 < 2 Tolak Ho, jika : ; sebaliknya terima Ho.

Contoh : 3.6.

Umur (dalam tahun) mulai gejala penderita kanker wanita dan pria yang independen dapat dicatat sebagai berikut :

Wanita 58 52 50 49 56 52 54 48 41 37 67 70

Pria 26 41 57 66 36 55 41 61 53 50 52 37 50

Sumber : data rekaan.

Pertanyaan :

a). Buatlah pendugaan bagi selisih rata-rata sesungguhnya antara rata-rata umur mulai gejala penderita kanker wanita dan pria pada interval kepercayaan 94 %

b). Jelaskan galat pendugaan bagi pendugaan selisih rata-rata tersebut pada pertanyaan a).

c). Ujilah pada taraf signifikansi 6 %, apakah umur rata-rata mulai gejala penderita kanker wanita lebih tinggi dari umur rata-rata penderita kenker pria ? Untuk kasus ini diasumsikan kedua varians sama.

Jawab :

Dari dapat diketahui : = 12 ; = 634 ; = 34468 ; = 13 ; = 625 dan

= 31567

maka ;

a). Untuk melakukan taksiran bagi selisih rata-rata populasi ( ) oleh selisih rata-rata

sampel ( ) dengan ukuran sampel n1 dan n2 kurang dari 30 (sampel kecil) dan

= dapat dilakukan dengan rumus (1-11).

= = 1.998e)

BIOSTATISTIK

Jadi :

atau : Interval kepercayaan 94 % bagi selisih adalah : [-3,58 ; 13,08]

Kesimpulan : Kita percaya 94 % bahwa selisih rata-rata sesungguhnya ( ) umur pertama kali menderita kanker antara pria dan wanita ada dalam interval dengan batas –3,58 sampai dengan 13,08 atau dalam jangkauan sekitar 16,66.

b). Juga dapat dinterpretasikan bahwa jika kita ingin menaksir selisih rata-rata sesungguhnya ( ) dengan menggunakan selisih rata-rata sampel ( ) sebesar 4,75 maka kita boleh membuat galat pendugaan tidak lebih dari (

c). Ho :

Statistik uji :

e). Dalam tabel t, nilai probabilitas t-student untuk 0.03 tdak dijumpai. Untuk

menghitung nilai baku t-student senilai dengan nilai probabilitas sebesar 0.03 tersebut dapat dilakukan dengan teknik interpolasi.Perhatikan tabel t (tabel III), baris ke 23 kolom 0.05 dan kolom 0.025, selanjut dapat ditulis seperti berikut :

tC = 1,998

prob. = 0,269

Statistik tabel : = 1,635

Kriteria penolakan Ho : Tolak jika

Ternyata :

Atau berdasarkan kriteria nilai probabilitas, ternyata : Prob. (0,269) > (0,05) Ho diterima.

BIOSTATISTIK

Kesimpulan : Terbukti pada taraf signifikansi ( ) 6 % bahwa rata-rata umur mulai gejala penderita kanker wanita tidak lebih tinggi dari rata-rata umur penderita kanker pria.

MODUL 6MODUL 6UJI TABEL SILANG (CROSSTAB TEST) UJI TABEL SILANG (CROSSTAB TEST)

A. PENDAHULUAN Dalam analisis statististik parametrik yang prosedurnya dibuat berdasarkan sejumlah asumsi, antara lain :

(1). sampel yang dicuplik dari populasi yang berdistribusi normal, atau paling sedikit mendekati normal.

(2) pemilihan unit sampel dari populasi harus independen.(3). pengamatan unit observasi juga harus independen.(4). Jika membandingkan dua atau sejumlah sampel, maka varians (ragam)

populasinya harus homogen.(5). Variabel yang diukur dalam skala interval atau dalam skala rasio.

Jika asumsi-asumsi tersebut terpenuhi, maka penggunaan uji statistik parametrik sudah valid. Namun jika terjadi pelanggaran atas asumsi-asumsi ini, sebagai alternatifnya dapat digunakan uji statistik nonparametrik.Uji nonparametrik atau uji bebas sebaran adalah suatu metode statistik yang hanya sedikit membuat dugaan tentang populasi asal sampel. Juga uji ini tidak bertujuan menduga maupun menguji parameter populasi, tetapi cukup membandingkan karakteristik populasi secara umum.

Oleh karena banyaknya kelemahan yang melekat pada uji nonparametrik ini, terutama tidak maksimalnya dalam memanfaatkan informasi yang dikandung sampel, mengakibat uji nonparametrik ini kurang efisien dibandingkan dengan prosedur parametrik jika kedua metode ini dapat diterapkan. Dengan kata lain, jika uji parametrik dan nonparametrik dapat digunakan untuk data yang sama, kita sebaiknya menghindari uji nonparametrik, yang konotasinya “cepat dan mudah” ini dan mengerjakannya dengan teknik parametrik yang lebih efisien.Untuk memberikan gambaran yang lengkap keuntungan dan kelemahan penggunaan statistik nonparametrik, dapat dijelaskan sebagai berikut :

B. Keuntungan :

(1). Dapat digunakan pada ukuran sampel yang relatif kecil.(2). Tidak memerlukan asumsi-asumsi yang ketat.(3). Dapat digunakan pada ukuran skala nominal (kategorikal) atau ordinal

(peringkat).(4). Relatif mudah dilakukan walaupun dengan manual.(5). Mudah dipahami karena memiliki konsep lebih sederhana dibandingkan dengan

prosedur parametrik.

C. Kelemahan :

BIOSTATISTIK

(1). Metode nonparametrik secara statistik kurang kuat (rigorous) daripada metode parametrik, karena didasari oleh persyaratan yang sedikit, bahkan sering tanpa persyaratan sama sekali.

(2). Metode nonparametrik kurang memiliki kuasa uji (power of test), jika dengan ukuran sampel yang sama, metode parametrik dapat diterapkan.

(3). Kecenderungan penyederhanaan data dari skala rasio atau interval menjadi nominal atau ordinal merupakan pemborosan informasi yang sudah dikumpulkan.

Uji tabel silang (crosstab) merupakan uji bivariat yang dapat digunakan untuk melihat ada atau tidaknya perbedaan atau hubungan atau pengaruh dua variabel yang memiliki data distribusi (nominal atau ordinal) yang mana data-data yang dianalisis data populasinya tidak harus menyebar normal. Uji tabel silang meliputi uji Chi Square, uji Chi Square dengan Koreksi Yate, uji Eksaks Fisher dan uji Mc Nemar.

6.1. UJI CHI SQUARE (2)

Uji Chi-Square atau juga dikenal dengan uji Kai-Kuadrat yang dikembangkan oleh Pearson tahun 1900, umumnya digunakan jika data yang tersedia berupa data jumlah atau data yang siap disajikan dalam bentuk frekuensi, misalnya banyak subjek dalam klasifikasi pria dan wanita, banyak subjek dalam kategori terpapar dan tidak terpapar, atau banyaknya penderita diabetes melitus dalam kategori I, II, III dan IV menurut kaparahan penyakitnya.

Pada umumnya, uji Kai-Kuadrat (2) dapat digunakan untuk :

(1). Uji kesesuaian (test of goodness of fit), yaitu untuk memeriksa apakah ada kesesuaian (fit) suatu distribusi data sampel dengan distribusi data populasi tertentu, dimana data yang ingin diuji dalam skala pengukuran nominal atau ordinal.

(2). Uji independensi (test of independence), yaitu untuk memerika apakah dua variabel dari sebuah sampel saling bebas (independen) atau tidak bebas.

(3). Uji homogenitas (test of homogeneity), yaitu untuk memeriksa beberapa data sampel apakah berasal dari populasi-populasi yang sama (homogen) dalam hal variabel tertentu.

6.1.1. SYARAT-SYARAT PENGGUNAAN UJI KAI-KUADRAT

Dalam melakukan uji Kai-Kuadrat, ada syarat-syarat yang harus dipenuhi, antara lain ;

(1). Sampel dipilih acak dan data yang tersedia dalam bentuk jumlah atau diskrit.

(2). Semua pengamatan dilakukan independen

(3). Sel-sel dengan frekuensi harapan (expected value) kurang dari 5 jika ada dapat dibenarkan sekitar 25% dari total sel, dan pada sembarang frekuensi harapan ( ) nilainya paling sedikit 1.

(4). Khusus untuk tabel kontingensi 2x2, syarat tersebut berarti tidak ada satu selpun boleh berisi frekuensi harapan ( ) 5. Jika ada, maka disarankan untuk menggunakan uji Exact Fisher atau uji Chi Square dengan koreksi Yates.

(5). Meskipun dapat diterapkan pada sampel kecil, uji Chi Square sebaiknya pada sampel yang ukuran > 40

6.1.2. LANGKAH-LANGKAH PENGGUNAAN UJI KAI-KUADRAT (2)

BIOSTATISTIK

Uji Chi Square dapat digunakan untuk menetapkan signifikansi perbedaan antara dua kelompok pengamatan (variabel) saling bebas (independen) atau tidak (non-independen). Pengukuran yang dituntut disini dapat selemah skala nominal.

Hipotesis yang diuji biasanya adalah dua kelompok (bivariat), apakah berbeda dalam hal ciri khas tertentu, dengan demikian perbedaan itu berhubungan dengan frekuensi relatif masuknya anggota-anggota kelompok ke dalam beberapa kategori.

Langka-langkah penggunaan statistik uji :

Pasangan hipotesis :

Ho : Kedua variabel tidak saling tergantung (independen)Ha : Kedua variabel saling tergantung (tidak independen), atau

Ho : Tidak ada perbedaan (hubungan) yang signifikan antara variabel pertama dengan variabel kedua.

Ha : Ada perbedaan (hubungan) yang signifikan antara variabel pertama dengan variabel kedua.

Statistik Uji yang digunakan :

……..……………..…………………………….(6-1)

dimana :

= baris ke 1, ke 2, ke 3, ……….., ke b.

= kolom ke 1, ke 2, ke 3, ……….., ke k.

Tabel. 4. Tabel penolong perhitungan Chi Square :

ijijH E

BIOSTATISTIK

…… …… ……. …………….

Titik Kritis : dimana

Daerah Kritis : Tolak Ho, jika , sebaliknya terima Ho.

Catatan : Pada data tabel kontingensi 2x2, uji Kai-Kuadrat sebaiknya tidak digunakan bila :

1). n 20, dianjurkan menggunakan uji Eksak Fisher.2). 20 < n < 40, jika ada 5, dianjurkan menggunakan uji Eksak Fisher.

3). n 40, jika ada 1, dianjurkan menggunakan uji Eksak Fisher. Sebaliknya jika : 1

< 5, dapat diterapkan uji Chi Square dengan koreksi Yate (Continuity corecction)

Pada tabel kontingensi 2x2 berikut :

Tabel 5 : Tabel Kontingensi 2x2

Variabel Pertama Variabel Kedua JumlahKategori 1 Kategori 2

Kategori 1 a b a+b

Kategori 2 c d c+d

Jumlah a+c b+d n

dimana : a, b, c dan c adalah data hasil pengamatann adalah jumlah seluruh pengamatan (n = a+b+c+d)

disamping dapat menggunakan rumus (4-3) juga dapat digunakan rumus berikut :

…………………………………….….(6-2)

Contoh 3 :

dcbadbca

BIOSTATISTIK

Suatu studi dilakukan dengan maksud mengetahui hubungan persepsi seseorang tentang kerentanan terhadap penyakit dan pilihan jenis pelayanan kesehatan yang diinginkan. Hasil pengukuran pada responden disajikan dalan tabel berkut :

Pilihan Pelayanan Kesehatan yang dikehendaki

Persepsi Kerentanan Terhadap Penyakit

Jumlah

Serius Tidak serius

Medis 20 11 31

Tradisional 13 16 29

Jumlah 33 27 60

Ujilah, apakah data yang dikumpulkan dapat menjelaskan bahwa ada hubungan antara persepsi kerentanan terhadap penyakit dengan pilihan pelayanan kesehatan yang diinginkan. Gunakan taraf nyata ( ) 5 %.

Jawab :

Ho : tidak terdapat hubungan antara persepsi kerentanan terhadap penyakit dengan pilihan pelayanan kesehatan yang diinginkan

Ha : terdapat hubungan antara persepsi kerentanan terhadap penyakit dengan pilihan pelayanan kesehatan yang diinginkan

Tabel perhitungan ;

20 17,05 0,510

11 13,95 0,624

13 15,95 0,546

16 13,05 0,667

= 2,347

BIOSTATISTIK

Pemeriksaan pada nilai expected (frekuensi harapan) tidak ditemukan ada < 5, hal ini dibenarkan untuk terus menggunakan statistik uji Chi Square.

Titik Kritis : = 3,841

Daerah Kritis : Tolak Ho, jika ,

ternyata : , artinya Ho diterima.

Kesimpulan : Berdasarkan data sampel yang dikumpulkan dapat menjelaskan bahwa tidak terdapat hubungan antara persepsi kerentanan terhadap penyakit dengan pilihan pelayanan kesehatan yang diinginkan, pada taraf nyata ( ) 5 %.

Atau, dapat juga dengan menggunakan rumus (10-4) :

= 2,347

Jadi, terlihat bahwa hasil yang ditunjukkan dengan rumus (10-3) atau rumus (10-4) sama. Keuntung-an yang diperoleh dengan menggunakan rumus (10-3), kita bisa melihat besaran nilai expectednya, sehingga kita bisa menegaskan apakah uji Chi-Square dapat dilanjutkan. Sebaliknya dengan rumus (10-4) hal yang sama tidak ditemukan.

6.2. UJI EKSAK FISHER (TEST FISHER EXACT)

Uji Eksak Fisher adalah uji independensi dua set pengamatan dengan dua variabel kategorial, menggunakan pendekatan probabilitas pasti (exact probability). (Fisher, 1973).

Uji Eksak Fisher dapat digunakan bila dalam uji Kai-Kuadrat dengan format tabel kontingensi 2x2 dan derajat kebebasan (dk) satu, bila : (1) jumlah seluruh pengamatan (n) kurang dari 20, (2) terdapat sel harapan (expected) kurang dari 5 dengan jumlah pengamatan antara

20 sampai dengan 40, dan (3) jumlah pengamatan (n) lebih besar 40 dan terdapat sel harapan ada yang kurang

dari satu. Prosedur uji pasti Fisher lebih memungkinkan untuk mendapatkan hasil akurat untuk

semua format tabel 2x2, yang nilai-nilai harapannya terlalu kecil untuk dapat dianalisis dengan uji Kai-Kuadrat.

Untuk memperoleh nilai probabilitas pasti Fisher ( ) dapat diperhatikan tabel 5, di atas dengan sel teramati terdiri dari a, b, c dan d adalah sebagai berikut :

………………………..(6-3)

!!.!.!.!.

)!()!()!()!()0(

dbcadcbaaP

BIOSTATISTIK

Langkah-langkah penggunaan uji Eksaks Fisher dapat dimulai dengan membuat tabel konfigurasi yang bertitik tolak dari tabel induknya dengan jumlah pinggir baris dan kolom tetap seperti tabel teramati aslinya (tabel 8-5). Untuk tabel konfigurasi yang mundur akan berhenti jika nilai sel a pada sel utama sama dengan nol, dan untuk tabel konfigurasi yang maju akan berhenti jika nilai sel c pada tabel utama sama dengan nol.

Tabel konfigurasi yang dimaksud dapat dimulai dari tabel utama (tabel pengamatan) dengan asumsi nilai sel a = 3 dan nilai sel b juga = 3, dengan demikian tabel konfogurasi mundur dan maju dapat dibuat sebagai berikut :

0 b+a a+b

a-2 b+2 a+b

a-1 b+1 a+b

c+a d-a c+d c+2 d-2 c+d c+1 d-1 c+d

a+c b+d n a+c b+d n a+c b+d n

Tabel Induk

Misalkan a = 3 dan c = 3 a b a+b dst

c d c+d

dst a+c b+d n

a+1 b-1 a+b

a+2 b-2 a+b

a+c b-c a+b

c-1 d+1 c+d c-2 d+2 c+d 0 d+c c+d

a+c b+d n a+c b+d n a+c b+d n

Dengan mememperhatikan konfigurasi tabel di atas, perhitungan probabilitas dimulai dari tabel ke 1 dengan menyesuaikan rumus (10-7) :

BIOSTATISTIK

Penghitungan probabiltas tabel-tabel berikutnya cukup memakai rumus ulangan seperti berikut :

Dengan memisalkan :

: Kemungkinan kejadian A disebabkan oleh kejadian B, dan

: Kemungkinan kejadian A bukan disebabkan oleh kejadian B.

Maka kriteria keputusan statistiknya dapat mengacu kenilai Probabilitasnya (Probabilitas value) selanjutnya disingkat dengan Prob. Andaikan tabel teramati ialah tabel a dan tabel konfigurasinya adalah 0 sampai dengan k, dengan demikian dapat dibuat kriteria sebagai berikut :

a). Pada uji dua pihak (two tailed test)

Ha : Nilai Prob. = 2 min [P(0) + P(1) + ….+ P(a), P(a) + P(a+1) + ……+ P(k)]Tolak Ho, Jika : Prob. < (yang ditentukan)

b). Pada uji pihak kanan (one tailed test)

Ha : Nilai Prob. = P(a) + P(a+1) + ……+ P(k)Tolak Ho, Jika : Prob. < (yang ditentukan)

c). Pada uji pihak kiri (one tailed test)

Ha : Nilai Prob. = P(0) + P(1) + ….+ P(a)

BIOSTATISTIK

Tolak Ho, Jika : Prob. < (yang ditentukan)

Contoh 7 :

Suatu studi dilakukan untuk melihat kesatuan pendapat tentang paket program kesehatan yang ditawarkan dalam suatu kampanye pemilihan umum berdasarkan tempat tinggal (hunian) kelompok masyarakat dengan kelas social tertentu, yaitu kelompok hunian dikompleks perumahan dan kelompok hunian bukan kompleks perumahan (tinggal terpisah-pisah). Hasil pengumpulan data pada 21 orang di kota besar, dapat dilihat pada tabel berikut :

Pola lokasi hunian kelompok masyarakat dengan kelas sosial tertentu

Kesatuan pendapat diantara anggota kelompok Jumlah

Rendah Tinggi

Tinggal dalam kompleks 4 9 13

Tinggal diluar kompleks 3 5 8

Jumlah 7 14 21

Gunakan = 0,05

Jawab :

Ho : Tidak terdapat hubungan antara kematian karena CVD dengan riwayat konsumsi garam yang tinggi

Ha : Terdapat hubungan antara kematian karena CVD dengan riwayat konsumsi garam yang tinggi.

Penyelidikan terhadap expected value : : ;

BIOSTATISTIK

Dapat dilihat bahwa ditemukan ada sel expected yang kurang dari 5 (50%), dengan demikian disarankan untuk menggunakan uji eksak Fisher.

Kemungkinan konfigurasi tabel dengan jumlah tepi tetap seperti tabel teramati (tabel induk)

BIOSTATISTIK

0 13 13

1 12 13

2 11 13

3 10 13

7 1 8 6 2 8 5 3 8 4 4 8

7 14 21 7 14 21 7 14 21 7 14 21

7 6 13

6 7 13

5 8 13

4 9 13

0 8 8 1 7 8

2 6 8 3 5 8

7 14 21 7 14 21

Tabel Induk

Perhitungan nilai-nilai probabilitas uji eksaks Fisher berdasarkan tabel konfigurasiyang dimungkinkan, adalah sebagai berikut :

Untuk uji dua pihak, nilai :

Prob. = 2.min.

= 2.min. = 2.(0,557275) = 1,114550

Daerah kritis : Tolak Ho, jika nilai Prob. < (yang ditentukan)Ternyata, Prob. (1,114550) > (0,05), artinya Ho diterima.

BIOSTATISTIK

Kesimpulan : Pada taraf nyata ( ) 5 %, diyakini bahwa ada kesatuan pendapat masyarakat tentang paket program kesehatan yang ditawarkan melalui kampanye pemilu, baik untuk masayarakat yang tinggal dalam kompleks hunian ataupun masyarakat yang tinggal secara terpisah-pisah (diluar kompleks hunian)

Diktat Biostatistik

Documents

Biostatistik BK

Biostatistik HMP 1

Hipotesis Penelitian (BIOSTATISTIK)

Ukdi Biostatistik Maya Riska

Biostatistik Fk 2014

Biostatistik Pengantar

HUBUNGAN BIOSTATISTIK DENGAN PENELITIAN

Biostatistik Task. Windi Cs

BIOSTATISTIK DESKRIPTIF '12

tugas biostatistik VITRYA

Biostatistik i

Modul 2 Biostatistik

Biostatistik s 1 Keperawatan 2013

Crashkurs Einf uhrung Biostatistik - UZH · Crashkurs Einf uhrung Biostatistik Prof. Burkhardt Seifert Abteilung Biostatistik, ISPM Universit at Zurich Deskriptive Statistik Wahrscheinlichkeitsrechnung,

Biostatistik HMP 6 biostatistik

Biostatistik Pertemuan II

BIOSTATISTIK ( modus, median,& mean )

Rangkuman Biostatistik

Biostatistik Deskriptif & Teknik Penyajian Data

Modul Sementara Biostatistik