View
238
Download
26
Category
Preview:
Citation preview
BIOSTATISTIK
MODUL 1MODUL 1KONSEP DASAR STATISTIK UMUM°
1.1. PENGERTIAN STATISTIKASecara umum statistika adalah disiplin ilmu yang mempelajari metode dan
prosedur pengumpulan, penyajian, analisa dan penyimpulan suatu data mentah, agar menghasilkan informasi yang lebih jelas untuk keperluan suatu pendekatan ilmiah (scientific inferences), dan dapat dikelompokkan menjadi dua bagian, yaitu statistik deskriptif dan statistik inferensial.
Statistik deskriptif merupakan metode dan prosedur statistik yang dipakai hanya terbatas pada pengumpulan, penyajian dan analisa data dalam bentuk narasi, tabulasi atau diagram. Ukuran-ukuran yang dapat dihitung dalam analisis ini adalah ukuran tendensi sentral dan ukuran variasi tanpa perlu adanya peramalan (estimasi) dan pembuktian statistik terhadap parameter populasi.
Statistik inferensial (induktif) merupakan alat untuk merancang riset, menganalisis data dan menarik kesimpulan tentang populasi dari data sampel. Namun sebelum proses generalisasi tersebut, kita perlu mengetahui sifat-sifat data sampel itu sendiri, yang pada gilirannya dapat menentukan jenis statistik yang digunakan, apakah statistik parametrik atau non-parametrik.
Pola berfikir yang dipakai dalam inferensi statistik lebih cenderung induksi dari pada deduksi, yaitu prosedur yang berkenaan dengan generalisasi dari khusus ke umum. Ada dua kelompok besar kegunaan statistik inferensi yang dikenal, yaitu : (1) membuat pendugaan (estimasi) tentang parameter populasi, dan (2) melakukan uji hipotesis tentang karakteristik populasi.
Prosedur uji inferensial parametrik dibuat berdasarkan sejumlah asumsi, diantaranya yang paling mendasar adalah data sampel yang digunakan dalam penelitian berasal dari populasi beristribusi normal, atau paling tidak mendekati normal. Disamping normalitas distribusi populasi ini, juga dilengkapi dengan asumsi yang lainnya, yaitu : (1) pemilihan unit sampel dari populasi secara acak (random), (2) pengamatan pada unit observasi independen, (3) untuk pengamatan pada dua atau lebih unit observasi dengan varians (ragam) homogen, dan (4) variabel pengamatan diukur dalam skala interval atau rasio.
Sedangkan prosedur pada statistik uji inferensial non-parametrik dipersiapkan sebagai alternatif jika asumsi pada statistik parametrik tidak terpenuhi. Dengan kata lain, statistik non-parametrik disebut juga bebas distribusi. Hal ini bisa terjadi, karena statistik non-parametrik tidak bertujuan menduga atau menguji parameter populasi, tetapi cukup membandingkan karakteristik populasi-populasi secara umum.
Biostatistik merupakan salah satu aplikasi konsep dan metode statistika yang diterapkan pada ilmu biologi, kedokteran, farmasi dan kesehatan. Sifat aplikatif dari Biostatistik juga bermanfaat untuk menganalisis, membuat interprestasi, dan memahami fakta dan temuan-temuan riset biologi, kedokteran, farmasi dan kesehatan.
1.2. KENGUNAAN STATISTIK
Statistik dapat digunakan dalam bidang administrasi, bidang perencanaan dan evaluasi serta dalam bidang penelitian. Dalam bidang penelitian dapat dimanfaatkan untuk (1) memberikan gambaran tentang suatu objek secara lengkap dan ringkas (2) membandingkan kejadian satu dengan kejadian lainnya dengan dengan beracuan pada
1
BIOSTATISTIK
waktu dan tempat, dan (3) membuat ramalan pada kejadian yang sama dimasa yang akan datang.
1.3.DATA STATISTIK
1.3.1. Definisi, Karakteristik, Sifat, Jenis dan Sumber Data
Defenisi Data
Data adalah fakta yang dinyatakan dengan angka (bilangan), baik yang diperoleh dengan menghitung maupun mengukur. Disamping itu ada juga data yang hanya bisa diamati, tidak bisa dihitung dan diukur, data yang seperti ini disebut dengan data kualitatif. Untuk maksud tertentu, data kualitatif ini juga bisa disimbolkan dengan angka (bilangan), dengan demikian data kualitatif yang sudah disimbolkan dengan bilangan tadi, dapat dikatakan sebagai data kuantitatif.
Jenis Data
Berdasarkan jenisnya, data dapat dibagi dalam 2 kelompok, yaitu :1. Data kontinu, merupakan variabel numerikal yang nilainya dapat diukur terus
menerus, sampai sekecil-kecilnya atau merupakan bilangan bulat dan pecahan. Misalnya nilai Hb darah = 14,20 gr %, berat badan = 65,75 Kg, dan lain-lain.
2. Data diskrit, merupakan variabel numerikal yang nilai tidak dapat diukur sekecil-kecilnya dan merupakan satu kesatuan atau merupakan bilangan bulat, data diskrit dapat bersifat kuantitatif atau kualitatif. Misalnya jumlah ibu hamil di desa A, nilai pembobotan pada pengukuran skala likert, dan lain-lain.
Sifat Data
1. Data kualitatif, yaitu data yang tidak bisa diukur dan dihitung serta disajikan bukan dalam bentuk angka. Misalnya : agama, jenis kelamin, suku bangsa, dan lain-lain.
2. Data kuantitatif, yaitu data yang bisa diukur dan dihitung serta disajikan dalam bentuk angka. Misalnya Tekanan darah sistolik, jumlah cakupan imunisasi, dan lain-lain.
Sumber Data :
Berdasarkan sumbernya, data dapat dikelompokkan menjadi 3, yaitu :1. Data primer, yaitu data yang dikumpulkan sendiri oleh sipeneliti pada saat
berlangsung suatu penelitian.2. Data sekunder, yaitu data yang dikumpulkan secara rutin oleh instansi tertentu,
yang kemudian digunakan oleh si peneliti.3. Data tertier, yaitu data yang sudah diproses dan dipublikasikan sebagai suatu karya/
karangan ilmiah.
1.3.2. Pengumpulan Data
Dapat dilakukan secara langsung atau tidak langsung, dan tergantung dari kebutuhan informasi yang ingin dikumpulkan, tenaga pelaksana penelitian, serta dana yang tersedia. Ada lima cara yang sering dilakukan dalam kegiatan pempulan data, yaitu :
1. Observasi, merupakan cara pengumpulan data yang dilakukan secara langsung dengan cara mengamati dengan tanpa adanya perlakukan terhadap objek penelitian. Hasil pengukuran dengan cara ini lebih banyak dalam bentuk data kualitatif.
2
BIOSTATISTIK
2. Interview atau Wawancara, yaitu pengumpulan data yang dilakukan secara langsung di lapangan antara petugas pengumpul data dengan cara mewawancarai secara langsung reponden yang diteliti. Hal ini sangat baik dilakukan untuk mendapatkan informasi (data) yang lebih lengkap dan mendalam.
3. Kuesioner atau Angket, yaitu berupa lembaran berisi pertanyaan-pertanyaan yang disiapkan sedemikian rupa, yang berfungsi sebagai alat pengumpul data panelitian. Biasanya kuesioner dapat digunakan pada saat interview atau wawancara atau dapat juga dilakukan dengan cara mengirimkannya melalui pos kepada responden yang telah terpilih, dengan harapan akan dikembalikan.
4. Registrasi dan Pencatatan, yaitu berupa pengumpulan data secara rutin terhadap setiap kegiatan atau kejadian, dengan menggunakan sistem manajemen data yang baik, seperti angka kelahiran, kematian, kesakitan dan lain-lain.
5. Hasil ujian (test) atau hasil laboratorium, yaitu berupa pengumpulan data yang dilakukan untuk mengukur tingkat pengetahuan atau keahlian seseorang atau pencatatan hasil pemeriksaan laboratorium dan lain sebagainya.
1.3.3. Pengolahan Data
Pengertian Pengolahan DataPengolahan data ialah proses penataan data, karena data hasil pengumpulan merupakan data kasar.
Guna Pengolahan DataPengolahan data digunakan agar data kasar dapat diorganisir, disajikan dan dianalisa hingga dapat ditarik kesimpulan.
Proses Pengolahan DataKegiatan dalam proses pengolahan data adalah :
1. Memeriksa data (editing)Yang dimaksud dengan proses editing ialah memeriksa data yang telah dikumpulkan baik berupa daftar pertanayaan, kartu atau buku register.Pemeriksaan ini meliputi hal-hal senagai berikut :a. Penjumlahan
Menjumlah ialah menghitung banyaknya lembaran daftar pertanyaan yang telah diisi untuk mengetahui apakah sesuai dengan jumlah yang telah ditentukan.
b. KoreksiYang termasuk dalam proses koreksi ialah proses membenarkan atau menyelesaaikan hal-hal yang salah atau kurang jelas
2. Memberi kode (coding)Untuk mempermudahkan pengolahan, sebaiknya semua variabel diberi kode terutama data klasifikasi, misalnya jenis kelamin untuk laki-laki diberi kode 1 dan wanita diberi kode 2.
3. Menyusun data (tabulating)Penyusunan data merupakan pengorganisasian data sedemikian rupa agar dengan mudah dapat dijumlah, disusun dan ditata untuk disajikan dan dianalisisProses tabulasi dapat dilakukan dengan berbagai cara antara lain dengan metode tally, menggunakan kartu dan menggunakan komputer.
Proses Pengolahan dan Analisis Data
3
Editing Data ?Coding Data ?
Cleaning Data ?
BIOSTATISTIK
Belum
Sesuai
Sudah Sesuai
1.4. VARIABEL DAN SKALA PENGUKURAN
1.4.1. Variabel
Variabel adalah karakteristik unit yang diukur dalam pengumpulan data yang nilainya bervariasi misalnya umur, tinggi badan, berat badan, tekanan darah, diagnosis, pengobatan dll
1.4.2. Skala PengukuranSkala pengukuran yang dikembangkan oleh S.S. Stevens, cukup luas digunakan
dalam setiap penelitian yang membagi tingkat ukuran ke dalam empat kategori, yaitu :1. Skala nominal, skala ini merupakan tingkat pengukuran yang paling sederhana.
Numerikal yang diberikan kepada objek tidak mempunyai makna besaran (hanya sekedar label) dan tidak bisa diurut atau dijumlah. Misalnya : Jenis kelamin (1 = Pria; 2 = Wanita), Agama (1 = Islam; 2 = Kristen; 3 = Buddha), Apakah anda suka statistika (1 = Ya; 2 = Tidak), dan lain-lain.
2. Skala ordinal, penomoran pada objek ini disusun menurut besar atau urutan (rank), tetapi nomor-nomor tersebut tidak menunjukkan jarak yang sama antara dua nomor. Misalnya : Stadium penyakit (1 = Berat; 2 = Sedang; 3 = Ringan), Tingkat pendidikan (1 = SD; 2 = SLTP; 3 = SLTA; 4 = Sarjana), dan lain-lain.
3. Skala interval, skala ini mempunyai sifat berurutan. Pada skala ini jarak atau perbedaan antara nilai pengamatan satu dan nilai pengamatan lainnya dapat diketahui dengan pasti. Besar interval dapat ditambah atau dikurangi, dimana yang dijumlahkan bukanlah kuantitas atau besaran, tetapi interval. Misalnya : Temperatur (oC atau oK), Tekanan darah, dan lain-lain. Misalnya, temperatur 36 oC jelas 12 oC lebih panas dari 24 oC, dan tidak dikatakan bahwa 36 oC 1½ kali dari 24 oC. Alasanya, penentuan skala 0 oC bukan keberadaan panas absolut, tetapi hanya merupakan batas pengukuran positif dan negatif. Dengan kata lain, pada skala interval tidak dijumpai nol absolut.
4. Skala rasio, skala ini merupakan tingkat pengukuran tertinggi. Skala rasio selain memiliki sifat skala nominal, ordinal dan interval, juga mempunyai titik nol absolut dengan makna empiris. Pada skala rasio semua operasi matematik (penambahan, penguangan, pengalian dan pembagian) dapat diterapkan. Misalnya : Temperatur yang diukur dalam skala Kelvin, besar penghasilan, berat badan, elektrolit serum, dan denyut nadi.
4
Data Kasar Edit Data Proses Analisis Data Dengan Komputerisasi
Statistik Uji ?
Hasil Analisis Sudah Sesuai dengan Tujuan penelitian
BIOSTATISTIK
MODUL 2MANFAAT DAN TEKNIK PENYAJIAN DATA
2.1. Pengertian Penyajian Data
Penyajian data merupakan salah satu kegiatan dalam pembuatan laporan hasil penelitian yang telah dilakukan agar dapat dipahami dan dianalisis sesuai dengan tujuan yang diinginkan.
Data yang disajikan harus sederhana dan jelas agar mudak dibaca. Penyajian data juga dimaksudkan agar para pengamat dapat dengan mudah memahami apa yang kita sajikan untuk selanjutnya dilakukan penilaian atau perbandingan, dan lain-lain.2.2. Jenis-Jenis Cara Penyajian Data
Data-data yang telah dikumpulkan, setelah dianalisis sedemikian rupa, perlu disusun secara sistematik agar menjadi sederhana dan mudah dimengerti oleh pengkonsumsi informasi dan juga dapat dipresentarsikan dengan baik. Ada beberapa cara penyajian data, yaitu :
1. Textular (narasi), yaitu penyajian data berupa tulisan atau narasi. Hal ini dapat dilakukan untuk data yang jumlahnya kecil serta memerlukan kesimpulan sederhana.
2. Tabulasi, yaitu penyajian data dalam bentuk table-tabel yang terdiri dari beberapa baris dan beberapa kolom, yang digunakan untuk memaparkan sekaligus beberapa variabel hasil observasi, survei, atau penelitian lainnya, sehingga mudah dibaca dan dipahami.
3. Diagram atau Grafik, yaitu penyajian data dalam bentuk diagram ataupun grafik dapat dilakukan dengan beberapa cara sesuai dengan jenis data dan kebutuhan, seperti terlihat pada table berikut :
Tabel 1.1. Cara penggunaan Jenis Diagram/Grafik.
5
BIOSTATISTIK
No. Jenis Diagram Variabel Data/Fungsi
1.2.3.4.5.6.
Bar diagram (Horizontal/vertical)Pie ChartLine diagramScatter point/ dot diagramPictogram/Diagram gambarCurtogram/Diagram peta
KategorikalKategorikalNumerikalNumerikalKategorikalKategorikal
Perbandingan frekuensi distribusi dataProporsi dataTrend data (time series study)Korelasi dataPerbandingan frekuensi distribusi dataPerbandingan frekuensi distribusi data
2.3. Jenis Tabel Penyajian DataJenis tabel penyajian data adalah :
1. Tabel distribusi frekuensi2. Tabel frekuensi3. Tabel distribusi relative4. Tabel distribusi kumulatif5. Tabel silang (tabel kontingensi = contingency table = cross tabulation)2.4. Cara Membuat Tabel
Suatu tabel yang lengkap terdiri dari (1) nomor tabel, (2) judul tabel, (3) catatan pendahuluan, (4) badan tabel, (5) catatan kaki, dan (6) sumber data.Tabel 1 Contoh tabel
Judul Tabel
Judul Kompartemen
Judul Kolom Jumlah
Sel
Judul Baris Badan Tabel
Cacatan kaki :Sumber :
2.5. Menyajikan Tabel Dalam Bentuk Tabel2.5.1. Tabel Distribusi Frekuensi Contoh Tabel distribusi frekuensi
Kelompok umur (tahun) Frekuensi Persentase (%)15 – 19 5 5,020 – 24 10 10,025 – 29 16 16,030 – 34 43 43,035 – 39 12 12,040 – 44 14 14,0Jumlah 100 100,0
6
BIOSTATISTIK
2.5.2. Tabel Silang 2 VariabelContoh : Tabel Silang
Status Gizi Diare JumlahSakit Tidak Sakit
Baik 3 9 12Sedang 18 25 43Buruk 29 16 45Jumlah 50 50 100
2.6. Penyajian Data Kualitatif Secara Grafik
1
Diagram batang (Diagram balok
= Bar diagram = Bar chart)
0
50
100
150
200
250
300
350
400
450
Pil Suntikan IUD
Alat Kontrasepsi
Jum
lah
Gambar 6. J umlah Akseptor KB Tahun 2006(Single Bar)
7
BIOSTATISTIK
1
0
50
100
150
200
250
300
350
400
450
2002 2003 2004 2005 2006
Tahun
Jum
lah
Pil
Suntikan
IUD
Gambar 7. J umlah Akseptor KB Tahun 2006(Multiple Bar)
1
50 75 100 150 20075125
175
225
300
100
150
200
250
400
0
100
200
300
400
500
600
700
800
900
1000
2002 2003 2004 2005 2006
Tahun
Jum
lah
IUD
Suntikan
Pil
Gambar 8. J umlah Akseptor KB Tahun 2006(Subdivided Bar)
8
BIOSTATISTIK
Proporsi Penderita ISPA, Diare, DHF, Malaria Sumut Bulan Agustus 2010
Histogram
Poligon
9
BIOSTATISTIK
Tingkat Pendidikan
1
Ogive
0
10
20
30
40
50
60
70
80
90
100
89.5 109.5 129.5 149.5 169.5 189.5 209.5
Tekanan Darah Sistolik (mmHg)
Fre
ku
en
si R
ela
tif
Ku
mu
lati
f (%
)
Less than
More than
Gambar 4. Distribusi Tekanan Darah Sistolik 37 Orang Perokok(Ogive)
1
Diagram garis (Line diagram)
01 02 03 04 05 06 07 08 09 0
1 0 0
1 2 3 4
K ua rta l
Jumlah
DHF
Diare
ISPA
Gambar 5. J umlah Penderita DHF, Diare, I SPA di Puskesmas X Tahun 2006
Sccater Diagram
10
BIOSTATISTIK
MODUL 3 MENGHITUNG NILAI RATA-RATA SUATU DISTRIBUSI DATA
Penghitungan data-data sampel dalam analisis statistik deskriptif biasa dilakukan dengan memperhatikan jumlah data. Jika jumlah data kecil (biasanya kurang dari 30) dapat dengan mudah langsung dihitung tanpa harus mengelompokkannya dengan tabel distribusi frekuensi (ungrouped data), sedangkan untuk jumlah data besar (biasanya lebih dari 30) untuk memudah perhitungan secara manual dapat dilakukan dengan mengelompokkannya dengan tabel distribusi frekuensi (grouped data). Selanjutnya perhitungan akan dikelompokkan berdasarkan pembagian data ini. Dalam analisis statistik deskriptif ada dua ukuran yang dapat dihitung, yaitu ; (1) ukuran terpusat (central tendency), dan (2) ukuran variasi atau sebaran (variation/dispersion)
3.1. PENGHITUNGAN PADA DATA TIDAK BERKELOMPOK.
3.1.1. Ukuran Terpusat.
Ukuran gejala terpusat menggambarkan suatu nilai (besaran) yang khas atau yang mewakili suatu himpunan data. Nilai yang khas yang demikian cendrung terletak secara terpusat dalam suatu himpunan data yang tersusun menurut besarnya. Ada beberapa ukuran terpusat yang lazim digunakan dalam statistik, antara lain :
a). Rata-rata hitung (mean) yang dinyatakan dengan adalah suatu nilai (besaran) yang menggambarkan keterwakilan dari dari sekumpulan data. Rata-rata hitung ialah jumlah semua hasil pengamatan (∑x) dibagi dengan banyaknya pengamatan (n). Jika suatu himpunan data sebanyak n bilangan, yaitu : , maka (baca : x bar = lambing rata-rata hitung) adalah :
11
BIOSTATISTIK
…………….
…………………………………………………………………………………..(3.1)
dimana : = rata-rata hitung (mean)
= jumlah seluruh titik data pengamatan
n = jumlah bilangan titik data pengamatan.
Contoh 1. 1. Data berat bayi lahir (Kg) dari ibu perokok :
3,18 2,84 2,90 3,27 3,85 3,52 3,29 2,76 3,60 3,18 3,59
Berapakah : Rata-rata hitungnya ( ) ?
Jawab : =
= = 3,27
Jika bilangan-bilangan masing-masing terjadi kali, maka rata-rata hitungnya adalah :
……………………..……….…………………………………..…………….
(3-2)
dimana : = rata-rata hitung (mean)
= jumlah seluruh titik data pengamatan
n = jumlah bilangan titik data pengamatan.
Contoh 1. 2. Data berat bayi lahir (Kg) dari ibu perokok :
3,18 2,84 2,90 3,27 3,60 3,52 3,18 2,76 3,60 3,18 3,59
Berapakah : Rata-rata hitungnya ( ) ?
Jawab : = =
= = 3,238
12
BIOSTATISTIK
b). Modus (Mode) yang dinyatakan dengan adalah suatu nilai (besaran) yang terjadi dengan frekuensi terbanyak (nilai yang paling umum).
Dengan mengambil soal pada contoh 1.1., maka : = 3,18 (karena data 3,18
muncul 2 kali ( = 1) atau yang paling banyak)
c). Letak (Posisi) Data Jika data sudah tersusun (array) dengan susunan data terkecil sampai dengan data terbesar atau sebaliknya, maka masing-masing posisi atau letak data tersebut dapat ditentukan, seperti : untuk letak data di pertengahan (Median), letak data di perempatan (Quartil), letak data di persepuluhan (Desil) dan letak data di perseratusan (Persentil).
c.1.) Median (Pertengahan), dari suatu himpunan bilangan yang disusun menurut urutan besarnya (array data) adalah nilai pertengahan atau nilai tengah hitung dari pertengahan, dinyatakan dengan adalah :
………………………..………..………………………………………….
…….(3-3)
dalam bentuk garis bilangan :
Me
Contoh 1.3. Data berat bayi lahir (Kg) dari ibu perokok (data ganjil) :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 3,52 3,59 3,60 3,85
Berapakah : Mediannya ( ) ?
Jawab : = = Data ke 6 = 3,27
Data berat bayi lahir (Kg) dari ibu perokok (data genap) :
2,76 2,842,90 3,18 3,18 3,27 3,29 3,52 3,59 3,60 3,85 4,00
Berapakah : Mediannya (Me) ?
Jawab : = Data ke 6,5 = Data ke 6 + 0,5 (Data ke 7 – Data ke
6)
= 3,27 + 0,5 (3,29 - 3,27) = 3,28
c.2.) Quartil (Perempatan) , dari suatu himpunan bilangan yang disusun menurut urutan besarnya (array data) adalah nilai perempatan atau nilai tengah hitung dari dua nilai tengah dinyatakan dengan adalah :
13
BIOSTATISTIK
…………..……………..…………………….
………………………………….(3-4)dimana : i =1,2,3.
Dalam bentuk garis bilangan :
= Contoh 1.4. Data berat bayi lahir (Kg) dari ibu perokok :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 2,52 3,59 3,60 3,85
Berapakah : , dan ?
Jawab : = = Data ke 3 = 2,90
= = 3,27
= Data ke 9 = 3,59
c.3.) Desil (Persepuluhan), dari suatu himpunan bilangan yang disusun menurut urutan besarnya (array data) adalah nilai persepuluhan atau nilai-nilai yang membagi data atas sepuluh bagian yang sama, dinyatakan dengan adalah :
…………………………………………………………………………….
…….(3-5)
dimana: i =1,2,3,….,9.
Dalam bentuk garis bilangan :
D1 D2 D3 D4 D5=Q2=Me D6 D7 D8 D9
Contoh 1.5. Data berat bayi lahir (Kg) dari ibu perokok :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 3,52 3,59 3,60 3,85
Berapakah : , dan ?
Jawab : = = Data ke 3,60
= Data ke 3 + 0,6 (Data ke 4 – Data ke 3) = 2,90 + 0,6 (3,18 - 2,90) = 3,068.
= = = 3,27
14
BIOSTATISTIK
= Data ke 9,6 = Data ke 9 + 0,6 (Data ke 10 – Data
ke 9)
= 3,59 + 0,6 (3,60 – 3,59) = 3,596
c.4.) Persentil (Perseratusan) dari suatu himpunan bilangan yang disusun menurut urutan besarnya (array data) adalah nilai perseratusan atau nilai-nilai yang membagi data atas seratus bagian yang sama, dinyatakan dengan adalah :
………………………………………………………………..…………….
…….(3-6)
dimana : I =1,2,3, …., 99.
Contoh 1.5. Data berat bayi lahir (Kg) dari ibu perokok :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 2,52 3,59 3,60 3,85
Berapakah : , dan ?
Jawab : = = Data ke 4,2
= Data ke 4 + 0,2 (Data ke 5 – Data ke 4) = 3,18 + 0,2 (3,18 – 3,18) = 3,18.
= = = = 3,27
= Data ke 8,4 = Data ke 8 + 0,4 (Data ke 9 – Data
ke 8)
= 3,52 + 0,4 (3,59 – 3,52) = 3,548
3.2. PENGHITUNGAN PADA DATA BERKELOMPOK.
Jika data sampel dalam jumlah besar (n > 30) maka data-data ini harus dikelompokk dalam upaya memudah penghitungan jika dilakukan secara manual. Proses mengelompokkan ini dapat dibantu dengan membuat tabel distribusi frekuensi.
3.2.1. Tabel Distribusi Frekuensi.
Langkah-langkah membuat tabel ditribusi frekuensi dapat dilakukan dengan :1. Mencari nilai rangenya : = Data terbesar – Data terkecil.2. Menghitung jumlah kelas dengan rumus Sturgess, yaitu : …………..…...
…….….…(3-7)
15
BIOSTATISTIK
3. Menghitung lebar kelas (Confidence Interval) : …………………………………..
…………..……(3-8)
Dengan mempedomani perhitungan di atas, selanjutnya dapat dibuat tabel disribusi frekuensi berikut :
No.
1. BB1 – BA1
2. BB2 – BA2
3. BB3 – BA3
…. ….. ….. …… ….. ….. ….. ….. …..
…. ….. ….. …… ….. ….. ….. ….. …..
…. ….. ….. …… ….. ….. ….. ….. …..
…. ….. ….. …… ….. ….. ….. ….. …..K BBK – BAK
Keterangan :
No. = Nomor kelas= Lebar kelas (Interval kelas) : = BPA – BPB ; BPA = batas paling atas;
dan BPB = batas paling bawah= Jumlah seluruh frekuensi
= Jumlah kumulatif semua frekuensi kelas pada kelas ke-i
= Nilai tengah (mid point), yaitu : = (BPA + BPB)/2= Simpangan, yaitu :
Contoh 1.7. Data berat bayi lahir (bbl) dari 40 anak.
3,18 2,84 2,90 3,27 3,85 3,52 3,23 3,90 3,25 2,502,76 3,60 3,75 3,59 3,63 2,38 2,34 2,75 3,00 2,603,99 3,79 3,60 3,73 3,25 3,60 4,08 3,00 2,75 2,503,61 3,83 3,31 4,13 3,26 3,54 3,51 3,25 3,50 2,65
Langkah-langkah membuat tabel ditribusi frekuensi
= Data terbesar – Data terkecil = : 4,13 – 2,34 = 1,79 Jumlah kelas : = 1 + 3,3 log 40 = 6,29 6
Lebar kelas (Confidence Interval) : = 0,298 0,3
Tabel 2.2. Data berat bayi lahir (bbl) dari 40 anak.
16
BIOSTATISTIK
No
1. 2,34-2,63 5 5 2,485 12,425
-4 -20 80
2. 2,64-2,93 6 11 2,785 16,710
-3 -18 54
3. 2,94-3,23 5 16 3,085 15,425
-2 -10 20
4. 3,24-3,53 8 24 3,385 27,080
-1 -8 8
5. 3,54-3,83 11 35 3,685 40,535
0 0 0
6. 3,84-4,13 5 40 3,985 19,925
1 5 5
40 132,100 -51 167
dimana : = 40 ; = 132,100 ; = - 51 ; = 167
Keterangan : Batas bawah (BB) pada kelas nomor 1 = 2,34 Batas Paling Bawah (BPB) = 2,34 – 0,005 = 2,335 Batas Atas (BA) pada kelas nomor 1 = 2,63 Batas paling Atas (BPA) = 2,63 + 0,005 = 2,635 = BPA – BPB = 2,635 – 2,335 = 0,3
= (BPA + BPB)/2 = (2,635+2,335)/2 = 2,485 (nilai tengah pada kelas nomor 1)
= 2,485 + 0,3 = 2,785 (nilai tengan pada kelas nomor 2)
= 2,785 + 0,3 = 3,085 (nilai tengan pada kelas nomor 3), demikian seterusnya
= (3,685-3,685)/0,3 = 0 (simpangan pada kelas nomor 5) = 3,685 yaitu nilai tengah pada kelas nomor 5, yaitu kelas dengan frekuen kelas yang terbesar)
= (3,385-3,685)/0,3 = -1
= (3,085-3,685)/0,3 = -2 (demikian seterusnya)
= (3,985-3,685)/0,3 = 1
3.2.2. Ukuran Terpusat.
Penghitungan ukuran terpusat untuk data berkelompok pada dasarnya sama pada penghitungan data tidak berkelompok.
a). Rata-rata hitung (mean) :
17
BIOSTATISTIK
…………………………………………………………..………….………….
……..(3-9)dimana :
= rata-rata hitung
= Jumlah hasil kali frekuensi kelas dengan nilai tengah pada kelas yang sama
= Jumlah seluruh frekuensi kelas
Dari tabel 1.2. Diketahui : = 132,100 ; = 40
Jadi : = 3,3025
atau, dengan menggunakan rata-rata sementara :
…………….………………………………….….………(3-
10)
dimana :
= rata-rata hitung
= rata-rata sementara (guessed mean) diambil dari salah satu nilai tengah ( ) dan biasanya pada kelas dengan frekuensi terbesar.
= Lebar kelas (confidence interval)
= Jumlah hasil kali frekuensi kelas dengan simpangan pada kelas yang sama
= Jumlah seluruh frekuensi kelas
Dari tabel 1.2. Diketahui : = -51 ; = 40 ; = 3,685 dan = 0,3
= 3,3025
b). Modus (Mode) :
18
BIOSTATISTIK
………………………………..…………………………………………….(3-
11)
dimana :
= Batas paling bawah pada kelas modus. Kelas modus adalah kelas dengan frekuensi terbesar.
= Frekuensi kelas modus – frekuensi kelas sebelumnya
= Frekuensi kelas modus – frekuensi kelas sesudahnya
= Lebar kelas
Catatan : BPB = BB – 0,5 ; jika BB bilangan bulat, (mis : BB = 10).BPB = BB – 0,05 ; jika BB bilangan bulat dengan satu desimal, (mis : BB =
10,1).BPB = BB – 0,005 ; jika BB bilangan bulat dengan dua desimal, (mis : BB =
10,01) dan seterusnya.
Dari tabel 1.2.
Diketahui : Kelas Modus ada pada kelas nomor 5 (karena frekuensi yang besar pada kelas nomor 5)
= 3,54 – 0,005 = 3,535
= 0,3 ; = 11 – 8 = 3 ; = 11 – 5 = 6
Jadi : = 3,635
c). Letak data :
c.1.) Median (Pertengahan) :
………………………………………….……………….…….(3-
12)
dimana :
= Batas paling bawah pada kelas median. Kelas median adalah kelas dimana data ke ( ) berada.
= jumlah keseluruhan data
= Frekuensi kumulatif sebelum kelas median atau jumlah seluruh frekuensi kelas sebelum frekuensi kelas median.
= Frekuensi pada kelas median
= Lebar kelas
Dari tabel 1.2.
Diketahui : Kelas Median ada pada kelas nomor 4 (karena data ke 20 pada kelas nomor 4)
= 3,24 – 0,005 = 3,235 ; = 0,3 ; = 5+6+5 = 16 :
= 40 ; = 8
19
BIOSTATISTIK
Jadi : = 3,385
c.2.) Quartil (Perempatan) :
………………………..……………….………….…...…….(3-
13)dimana :
= Batas Paling Bawah pada kelas Kuartil ke-i. Kelas Kuartil ke-i adalah kelas dimana data ke ( ) berada.
= jumlah keseluruhan data
= Frekuensi kumulatif sebelum kelas Kuartil ke-i atau jumlah seluruh frekuensi kelas sebelum frekuensi kelas Kuartil ke-i.
= Frekuensi pada kelas Kuartil ke-i
= Lebar kelas
= 1, 2, dan 3.
Dari tabel 1.2.
Diketahui : Kelas Quartil ke-1 ( ada pada kelas nomor 2 (karena data ke 10 pada kelas nomor 2)
= 2,64 – 0,005 = 2,635 ; = 0,3 ; = 5 : = 40 ;
= 6
Jadi : = 2,885
Kelas Quartil ke-3 ( ada pada kelas nomor 5 (karena data ke 30 pada kelas nomor 5)
= 3,54 – 0,005 = 3,535 ; = 0,3 ; = 24 : = 40 ; = 11
Jadi : = 3,698
c.3.) Desil (Persepuluhan :
20
BIOSTATISTIK
…………………………………..………………..……..…….
(3-14)
dimana :
= Batas Paling Bawah pada kelas Desil ke-i. Kelas Desil ke-i adalah kelas dimana data ke ( ) berada.
= jumlah keseluruhan data
= Frekuensi kumulatif sebelum kelas Desil ke-i atau jumlah seluruh frekuensi kelas sebelum frekuensi kelas Desil ke-i.
= Frekuensi pada kelas Desil ke-i
= Lebar kelas
= 1, 2, …….., 9.
Dari tabel 1.2.
Diketahui : Kelas Desil ke-3 ( ada pada kelas nomor 3 (karena data ke 12 pada kelas nomor 3)
= 2,94 – 0,005 = 2,935 ; = 0,3 ; = 11 : = 40
; = 5
Jadi : = 2,995
Kelas Desil ke-8 ( ada pada kelas nomor 5 (karena data ke 32 pada kelas nomor 5)
= 3,54 – 0,005 = 3,535 ; = 0,3 ; = 24 : = 40 ; = 11
Jadi : = 3,753
c.3.) Persentil (Perseratusan) :
……………………………………………….…………..…….
(3-15)
dimana :
= Batas Paling Bawah pada kelas Persentil ke-i. Kelas Persentil ke-i adalah kelas dimana data ke ( ) berada.
21
BIOSTATISTIK
= jumlah keseluruhan data
= Frekuensi kumulatif sebelum kelas Persentil ke-i atau jumlah seluruh frekuensi kelas sebelum frekuensi kelas Persentil ke-i.
= Frekuensi pada kelas Persentil ke-i
= Lebar kelas
= 1, 2, …….., 9.
Dari tabel 1.2. Diketahui : Kelas Persentil ke-40 ( ada pada kelas nomor 3 (karena data ke
16 pada kelas nomor 3)
= 2,94 – 0,005 = 2,935 ; = 0,3 ; = 11 : =
40 ; = 5
Jadi : = 3,235
Kelas Persentil ke-85 ( ada pada kelas nomor 5 (karena data ke 34 pada kelas nomor 5)
= 3,54 – 0,005 = 3,535 ; = 0,3 ; = 24 : = 40 ; = 11
Jadi : = 3,808
3.3. Nilai Penyebaran/Ukuran Variasi (Sebaran).
3.3.1. Nilai Penyebaran Dengan Data Tidak Berkelompok
Variasi atau sebaran adalah variabelitas data atau titk-titik sebaran sejauh mana data numerik cenderung untuk tersebar disekitas suatu nilai rata-ratanya. Ada beberapa ukuran variasi yang sering digunakan, antara lain :
a). Rentang atau Jangkauan (Range), adalah selisih bilangan terbesar dan terkecil dalam suatu himpunan data, dinyatakan oleh R adalah :
R = Data terbesar – Data tekecil ……………………………….……………………………………………..(3.16)
Contoh 1.6. Data berat bayi lahir (Kg) dari ibu perokok :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 3,52 3,59 3,60 3,85
R = 3,85 – 2,76 = 1,0922
BIOSTATISTIK
b). Rata-rata Simpangan (Mean Daviation) suatu himpunan n bilangan dinyatakan dengan MD didefenisikan oleh :
…………………………..………..……………………………(3-
17)
Tabel 1.1. Data bbl dari kelompok ibu perokok
No.
1. 2,76 1 0,51 0,2601 (2.76)2
2. 2,84 1 0,43 0,1849 (2.84)2
3. 2,90 1 0,37 0,1369 (2,90)2
4. 3,18 2 0,18 0,0162 2x(3.18)2
5. 3,27 1 0,00 0,00006. 3,29 1 0,02 0,00047. 3,52 1 0,25 0,06258. 3,59 1 0,32 0,10249. 3,60 1 0,33 0,1089
10. 3,85 1 0,58 0,3364
35,98 11 2,99 1,2087 118,8760
c). Simpangan baku (Standard Daviation) suatu himpunan n bilangan dan dinyatakan dengan S didefenisikan oleh :
23
BIOSTATISTIK
…………………………..………………………….………(3-
18)
perhatikan tabel 1.1., dimana : = 1,2087 dan = n = 11.
= = 0,348
atau, dengan rumus :
= ……………………………..….………..…………..(3-
19)
perhatikan tabel 1.1., dimana : = 35,98 ; = 118,876 dan = n = 11
= = 0,345
d). Varians atau Ragam (Variance) adalah kuadrat dari simpangan baku, dinyatakan dengan S2 adalah :
……………………………………………………….……….…………
(3-20)
atau, dengan rumus :
= ……….………………………………..………………..
(3-21)
24
BIOSTATISTIK
Jika nilai Simpangan baku sudah didapatkan, maka Varians dapat dihitung dengan mengkuadratkan nilai simpangan bakunya, yaitu : = = 0,119
e). Koefisien variasi adalah ukuran variabelitas yang dinyatakan dalam parsentase, dan dinyatakan dengan didefenisikan oleh :
………………..………………………………….
……………………………………………(3-22)Telah diketahui : = 3,27 dan S = 0,345.
Jadi : = 10,55%
f). Koefisien Quartil adalah ukuran variabelitas yang dinyatakan dalam parsentase, dan dinyatakan dengan didefenisikan oleh :
…………….……………………………….
…………………………………………(3-24)
Telah diketahui : = 3,59 dan = 2,90
Jadi : = 10,63%
g). Simpangan Quartil adalah ukuran variabelitas yang dinyatakan dalam parsentase, dan dinyatakan dengan didefenisikan oleh :
………………………….……………….……………………………………………….
……(3-25)Telah diketahui : = 3,59 dan = 2,90
Jadi :
h). Inter Quartil Range adalah ukuran variabelitas yang dinyatakan dalam parsentase, dan dinyatakan dengan didefenisikan oleh :
…………....……………….……………….……………………………………………….……(3-26)
Telah diketahui : = 3,59 dan = 2,90
Jadi : = 0,69
25
BIOSTATISTIK
3.3.2. Nilai Penyebaran Dengan Data k Berkelompok
Pada dasarnya penghitungan ukuran variasi pada data berkelompok hampir sama dengan penghitungan pada data tidak berkelompok.
a). Rata-rata Simpangan (Mean Daviation) :
…………………………………………..…………..……………..…
(3-27)
= 0,414 Dari tabel 1.2.
Diketahui : = 16,5600 ; = 40
Jadi : =
b). Simpangan baku (Standard Daviation) :
…………………………………………..…..……..…………(3-
28)
Dari tabel 1.2.
Diketahui : = 9,1777 ; = 40
Jadi : = 0,479
Atau dengan rumus ;
26
BIOSTATISTIK
…………………………………………….(3-
29)
Dari tabel 1.2.
Diketahui : 132,100 ; = 445,4380 dan = 40
= 0,479
atau, dengan rumus :
…………………………….……..(3-30)
Dari tabel 1.2.
Diketahui : - 51 ; = 167 dan = 40
= 0,479
d). Varians atau Ragam (Variance) :
…………………………………………………………….……(3-
31)
Dari tabel 1.2.
Diketahui : = 9,1777 dan = 40
Jadi : = 0,229
atau, dengan rumus :27
BIOSTATISTIK
………………….……..(3-32)
Dari tabel 1.2.
Diketahui : - 51 ; = 167 dan = 40
Jadi : = 0,229
28
BIOSTATISTIK
MODUL 4KONSEP DASAR POPULASI DAN SAMPEL
4.1. PENGERTIAN POPULASI DAN SAMPEL
Dalam suatu penelitian, jika kita ingin megamati atau memeriksa secara keseluruhan subjek, hal ini berarti kita mempelajri populasi. Populasi adalah totalitas semua nilai yang mungkin, hasil menghitung ataupun pengukuran kuantitatif maupun kualitatif mengenai karakteristik tertentu dari semua anggota kumpulan yang lengkap dan jelas yang ingin dipelajari sifat-sifatnya. Sangat sering kita mengalami kesulitan untuk mengamati populasi, karena dari segi jumlah subjek, dana, tenaga, dan alat yang dibutuhkan sangat besar, maka dengan teori sampling dapat dilakukan dengan mengamati sebagian dari jumlah populasinya saja.
Pada dasarnya suatu penelitian harus mampu dilaksanakan (feasible), artinya tersedianya subjek penelitian, dana, waktu, alat dan tenaga ahli yang sesuai. Apabila dalam pelaksanaanya ditemukan kendala seperti keterbatasan dana, waktu, alat dan tenaga ahli, tetapi kita harus melakukan pengamatan kritis pada seluruh sabjek penelitian, maka dapat dilakukan pada sebagian subjek yang tersedia saja, hal seperti ini disebut dengan sampling.
Sampling adalah cara pengumpulan data penelitian yang hanya mengamati sebagian (elemen sampel) dari keseluruhan subjek penelitian yang diteliti.Keuntungan-keuntungan dari penarikan sampel, antara lain :1. Dana, waktu, alat dan tenaga ahli yang diperlukan lebih sedikit dibandingkan jika
penelitian dilakukan langsung pada populasi.2. Mudah dan lebih cepat dikerjakan serta hasilnya dapat segera dievaluasi dan
dianalisa.3. Data yang dikumpulkan lebih komprehensif (dengan cakupan lebih besar) dan
representatif, serta merupakan refleksi dari karakteristik populasi yang diteliti.4. Tingkat ketelitian lebih besar, artinya pemeriksaan pada sampel akan lebih teliti dan
sangat objektif daripada pemeriksaan lengkap pada seluruh elemen populasi.Penarikan sampel bila dilakukan dengan prosedur yang sesuai dan benar, maka
suatu sampel dapat merupakan cara yang lebih efisien (cost efficient) untuk mengunpulkan data dari harus meliputi keseluruhan elemen populasi.
Penelitian survei adalah merupakan salah satu penelitan yang dalam penyelidikan kritis-nya dalam rangka memperoleh atau mencari keterangan atas suatu persoalan atau fenomena tertentu dalam suatu daerah atau wilayah tertentu dilakukan dengan mengambil sampel dari suatu populasi yang tersedia. Biasanya alat ukur (instrumen) yang digunakan dalam penelitian survei ini adalah kuesioner. Jadi, pada penelitian survei kesimpulan tentang sifat populasi yang dihasil-kan sangat tergantung pada sampel yang dipelajari, artinya sampel ynag dipelajari ini diperoleh dengan prosedur teknik sampling yang bagaimana.
Sedangkan Sensus adalah cara pengumpulan data atau penelitian yang menggunakan seluruh elemen populasi yang diteliti satu per satu (a complete enumeration) dan hasilnya merupakan data yang sebenarnya (parameter)
29
BIOSTATISTIK
4.2. Teknik penarikan sampelPeranan yang terpenting dari penarikan sampel dalam suatu penelitian survei
adalah untuk mendapatkan sampel yang betul-betul representatif dan pada gilirannya akan menghasilkan kete-rangan (informasi) yang dapat diandalkan mengenai sifat-sifat populasi yang ingin dijelaskannya.
Disamping itu tujuan mempelajari teknik sampling adalah (1) untuk membuat penarikan sampel menjadi lebih efesien, (2) untuk mengetahui apakah metoda penarikan sampel sudah benar, dan (3) untuk dapat melakukan pendugaan atau pengujian terhadap nilai parameter populasi dengan tingkat ketepatan yang tinggi.
Sesuai dengan tujuan utama melaksanakan survei adalah untuk membuat kesim-pulan tentang sifat-sifat populasi berdasarkan informasi yang terkandung dalam sample.
Untuk mendapatkan ketepatan (precision), kepekaan (sensitivity), dan banyaknya informasi (amount of information) yang terkandung dalam sampel diukur sebagai berbanding terbalik dari ragam (variance) dan nilai rata-rata (mean), dan secara matematis digambarkan sebagai berikut :
…………………………………………………………………….…………….
(4-1)
dimana : I
n
= banyaknya informasi yang terkandung dalam sample= varians populasi= banyak sample
Dari formula di atas, terlihat bahwa jika varians populasi ( ) besar, maka banyak infor-masi dalam sample berkurang (sedikit), juga apabila ukuran semakin sampel besar, maka banyak informasi dalam sampel akan bertambah. Jadi ada dua faktor yang mempengaruhi banyak atau berkurang informasi yang terkandung dalam sampel, yang pada giliranya akan mempengaruhi ketepatan dari prosedur pembuatan kesimpulan tentang populasi.
Untuk mendapatkan sampel yang benar-benar representatif bagi populasinya dengan mem-perhatikan keragaman data yang ada dalam populasinya, dapat dilakukan dengan teknik pencupli-kan sampel (sampling technique). Dengan teknik sampling ini diharapkan bisa memperoleh informasi yang optimal yang terkandung dalam sampel, sehingga survei yang dilakukan dapat bersifat lebih efesien dalam artian dengan mengeluarkan ongkos yang minimum dapat diperoleh informasi yang maksimal.
Teknik penarikan sampel dapat dikelompok dalam dua bagian, yaitu penarikan sampel acak (probabilitas sampling random) dan pencuplikan sampel tidak acak (non-probabilitas sampling random).
(1) Probability random samling, Hal prinsip pada probability sampling adalah bahwa setiap unit (elemen) dalam
populasi mempunyai kesempatan yang sama untuk terpilih (terambil) sebagai sampel.
1. Penarikan Sampel Acak Sederhana (Simple Random Sampling)
Pada setiap unit (elemen) populasi diberi nomor, kemudian sampel yang diinginkan ditarik secara acak, baik dengan menggunakan tabel random ataupun dengan undian.
2. Penarikan Sampel Acak Sistematik (Systematic Random Sampling)
30
BIOSTATISTIK
Pada setiap unit (elemen) populasi diberi nomor dan diurut, kemudian ditentukan satu nomor sebagai titik tolak penarikan sampel sampel secara acak. Nomor berikut dapat ditarik dengan kelipatan (K = N/n) yang dilakukan secara sistematis.
3. Penarikan Sampel Acak Berlapis (Stratified Random Sampling)
Populasi dibagi dalam kelompok yang homogen lebih dahulu, atau dalam strata. Elemen sampel dapat ditarik dari setiap strata.
4. Penarikan Sampel Acak Bergerombol (Cluster Random Sampling)
Populasi dibagi dulu atas kelompok berdasarkan area atau cluster. Elemen sub populasi tiap cluster tidak harus homogen. Lakukan sampling acak pada cluster lebih dulu, kemudian pada cluster yang terpilih dapat dilakukan sampling dengan cara simple random sampling atau systematic random sampling ataupun juga dapat langsung mengamati seluruh elemen dalam cluster.
5. Penarikan Sampel Acak Bertahap Ganda (Multistage Random Sampling)
Populasi dibagi dalam beberapa tahap (stage). Tahap pertama menentukan subpopulasi dimana sampel akan ditarik. Jika peneliti ingin menentukan populasi tahap berikutnya dapat dilakukan dengan menentukan sub-sub populasi sampai dimungkinkan pada populasi mana elemen sampel dapat ditarik.
(2) Non probability random sampling.
Penarikan sampel non probability prosedurnya lebih sederhana dan lebih praktis. Oleh karena penarikan sampelnya tidak acak, maka kesahihan sampel non probability tergantung pada sejauh mana penarikan sampel yang dilakukan dapat menyerupai probability sampling. Cara yang dilakukan untuk mendekati prosedure probability sampling yang dimaksdud, dilakukan dengan menentukan kriteria inklusi dan eksklusi terhadap sampel sampel yang ditetapkan berdasarkan pencapaian tujuan penelitian yang diinginkan. Apakah penarikan sampel non probability ini sudah sesuai dengan kriteria inklusi dan eksklusi.
1. Purposive Sampling
Pengambilan sampel ditentukan berdasarkan pertimbangan yang dibuat oleh peneliti sendiri, berdasarkan karakteristik atau sifat populasi yang sudah dikatahui sebelumnya.
2. Quota Sampling
Penarikan sampel dilakukan dengan cara menetapkan sejumlah eleman sampel secara kuota (jatah) sesuai dengan keiinginan peneliti.
3. Convinience Sampling
Sampel dipilih dengan semaunya saja tanpa menggunakan prosedur yang jelas.
4. Consecutive Sampling
Pemilihan sampling ditetapkan berdasarkan kriteria penelitian dalam kurun waktu terentu sampai jumlah sampel yang diinginkan terpenuhi.
5. Judgement Sampling
31
BIOSTATISTIK
Pada cara ini peneliti memilih subjek penelitian berdasarkan pertimbangan subjektifnya, dengan harapan subjek tersebut nantinya akan mampu memberikan informasi yang memadai untuk menjawab permasalahan penelitian.
6. Panel Sampling
Sampel semi permanen yang dipilih untuk keperluan suatu studi yang berkelanjutan.
4.3. Kriteria rancangan sampel yang dapat diandalkan.
Rancangan sampel yang dapat diandalkan, apabila memenuhi kriteria sebagai berikut : 1. Mempunyai kemampuan untuk mewakili (representativeness). Suatu sampel harus
menjadi wakil dari populasi induknya sehingga penalaran yang diambil dari sampel dapat digene-ralisasi terhadap populasi tersebut dengan tingkat ketepatan dan kepercayaan yang dapat diukur.
2. Efisien dan ekonomis dalam artian rancangan sampling yang disiapkan sedemikian rupa sehingga penghematan waktu dan biaya dapat dicapai tanpa mengurangi pencapaian tujuan penelitian. Dengan kata lain, sampel harus dapat memberikan informasi yang dikehendaki didalam batas kesalahan sampling yang sudah diperkirakan tetapi masih dapat ditoleransi untuk biaya yang paling murah. Sebaliknya, sampel harus dapat meberikan informasi pada suatu biaya pasti dengan kesalahan sampling (sampling error) paling kecil.
3. Terukur (measurability), artinya peneliti dapat memperkirakan sejauh mana temuan-temuan dari sampel cendrung berbeda dari yang akan ia temukan jika ia meneliti seluruh populasi induknya.
4. Ukuran (size) sampel minimal harus cukup besar untuk memperkecil ragam (variabelitas) sampel bagi pendugaan parameter yang harus dibuat dengan tingkat ketepatan (presisi) yang dapat diukur.
5. Prosedur sampling harus sederhana dan praktis sehingga mudah dilaksanakan dilapangan
4.4. Beberapa terminologi dalam sampling
1. Populasi (population), ialah kumpulan yang lengkap dari seluruh elemen yang sejenis, tetapi dapat dibedakan berdasarkan karakteristiknya. Populasi dapat dibagi menjadi dua, yaitu : a. Populasi target (target population) yang ditentukan berdasarkan karakteristik
subjek yang diteliti dan demografis. Misalnya penderita anemia ibu hamil dengan umur kehamilan kurang dari 12 minggu di kota X.
b. Populasi terjangkau (accessible population, source population) disebut juga populasi sampling adalah bagian dari populasi target dengan spesifikasi yang lebih tegas dan terfokus pada subjek yang ingin diteliti dan dibatasi oleh tempat serta waktu. Misalnya Ibu hamil dengan kasus anemia berat yang berkunjung di beberapa Puskesmas di kota X selama tahun 1990-1991.
Catatan, dalam penelitian survei yang dilakukan, populasi yang didefenisikan langsung menggambarkan populasi terjangkau.
2. Elemen (element) ialah sesuatu yang menjadi objek (boleh orang atau benda) yang padanya dapat dilaku-kan pengukuran untuk memperoleh nilai data yang diharapkan.
32
BIOSTATISTIK
3. Karakteristik (characteristics) ialah sifat-sifat atau ciri-ciri yang melekat (dimiliki) elemen.
4. Unit sampling (sampling units) ialah kumpulan elemen-elemen dari populasi tertentu yang tidak bersifat tumpang tindih.
5. Kerangka sampling (sampling frame) ialah daftar unit-unit sampling.6. Populasi (population) ialah kumpulan yang lengkap dari seluruh elemen yang
sejenis, tetapi dapat dibedakan karena karakteristiknya.7. Parameter (parametric) ialah nilai sesungguhnya dari populasi, dimana nilai ini
bisa diperoleh jika yang diamati (dipelajari) keseluruhan dari elemen populasi.7. Sampel (sample) ialah sebagian elemen dari keseluruhan elemen populasi, Jika n =
jumlah elemen sampel dan N = jumlah elemen populasi, maka n (sampel) lebih kecil dari N (populasi).
9. Statistik (statistics) ialah nilai yang diperoleh dari penghitungan pada sampel dan dapat digunakan untuk menduga (menaksir) parameter populasi.
10. Distribusi sampling (sampling distribution) ialah distribusi penarikan sampel dari nilai-nilai statistik yang didapatkan dari sampel-sampel yang dikumpulkan (baik dengan penarikan sampel dengan atau tampa pengembalian). Jika nilai statistik yang dimaksudkan adalah rata-rata (mean), maka distribusinya disebut distribusi penarikan sampel dari nilai rata-rata (sampling distribution of the mean). Demikian juga dengan ditribusi sampling lainnya, dapat dilakukan dengan nilai statistik seperti simpangan baku, varians, median, proporsi dan nilai-lain.
11. Sampling error ialah kesalahan yang terjadi karena pengukuran data sampel yang dikumpul-kan, sehingga terjadi selisih antara perkiraan statistik dengan parameter.
12. Sampling acak ialah penarikan elemen sampel dari elemen populasi yang dilakukan secara acak (random). Acak adalah memberikan kesempatan yang sama kepada seluruh elemen populasi untuk terpilih sebagai sampel.
MODUL 5PENGUJIAN HIPOTESIS
A. PENDUGAAN PARAMETER
Pendugaan atau estimasi disebut juga dengan penaksiran dan berguna untuk menaksir nilai-nilai parameter populasi atau membuat kesimpulan tentang populasi lewat sampel yang representatif untuk inferensi statistic. Nilai-nilai statistik, misalnya : mean, proporsi dan SD dan sbb
Istilah-istilah yg perlu dipahami
Simpangan baku (standard Deviation) merupakan ukuran variabelitas atau sebaran nilai yg menggambarkan variasi nilai individual sekitar rata-rata.
Kesalahan baku (Standard Error = SD), adalah kesalahan baku rata-rata yg berkaitan dgn ketepatan rata-rata yg diduga sesungguhnya.
33
BIOSTATISTIK
Galat Pendugaan adalah merupakan perbedaan absolut dari nilai statistik dan parameter, atau suatu nilai yang ditolerir untuk suatu kesalahan dalam pendugaan titik sampel terhadap ruang pupulasi.
Interval kepercayaan (Confidence Interval = CI) atau interval taksiran (Estimasi taksiran), digunakan untuk mendapatkan nilai taksiran yang relatif atas nilai yg diharapkan.
Tingkat kepercayaan (Confidence Level = CL) yang lazim dilambangkan dengan α adalah merupakan kesalahan atas penolakan hipotesis nol yang benar (error tipe I), artinya nilai α ini dalam estimasi berfungsi untuk menunjukkan besarnya probabilitas atau kesalahan tipe I yang berakibat pada tinggi rendahnya tingkat kepercayaan.
B. Uji Hipotesa
Utk membuat suatu keputusan terhadap suatu objek penelitian atau populasi berdasarkan informasi yang berasal dari data sampel, haruslah dimulai dengan suatu asumsi atau penaksiran terhadap segala kemungkinan yg akan terjadi pd suatu populasi, dimana kemungkinan ini dapat diterima atau ditolak, kegiatan ini disebut sebagai Statistical Hypothesis
Dalam uji hipotesis diperoleh kemungkinan menerima atau menolak hipotesis. Bila kita menyatakan bahwa tidak ada perbedaan bermakna secara statistik antara parameter sampel dengan populasi, hal ini disebut dengan hipotesis nol (Ho), sebaliknya bila kita menyatakan ada perbedaan bermakna secara statistik, disebut hipotesis alternatif (Ha).
5.1. PENDUGAAN DAN UJI HIPOTESA SATU PARAMETER
5.1.1. Pendugaan bagi rata-rata populasi () dengan n 30 (sampel besar) dan diketahui
Jika adalah rata-rata sampel acak berukuran n (n 30) yang diambil dari suatu populasi dengan 2 (varians atau ragam) diketahui, maka Interval Kepercayaan (1-).100 % bagi adalah :
…………………….………..………………………………………..(5-1)
dimana
:
ZC
n
=====
rata-rata sesungguhnya (populasi)rata-rata sampelNilai baku normal berdasarkan error type I () yang ditentukan Simpangan baku populasiJumlah sampel.
34
)α/,(CC ZZn
σZxμ 250
BIOSTATISTIK
ZC.(/n) adalah batas galat pendugaan bagi , artinya bila (rata-rata sampel) digunakan untuk menduga (rata-rata populasi), maka kita percaya (1-).100 % bahwa galatnya tidak akan lebih dari ZC.(/n).
Galat Pendugaan
-ZC.(/n) + ZC.(/n)
5.1.2. Uji Hipotesis rata-rata populasi ( ) dengan n 30 (sampel besar) dan diketahui
Jika adalah rata-rata sampel acak berukuran n (n 30) yang diambil dari suatu populasi dengan 2 (varians atau ragam) diketahui, maka uji hipotesis rata-rata populasi (sesungguhnya) digunakan statistik uji berikut :
……………………………………………………..…………………………….…………………(5-2)
dimana :
n
=====
rata-rata sesungguhnya (populasi)rata-rata sampelNilai baku normal yang besarnya tergantung eror type I () yang ditentukan Simpangan baku populasiJumlah sampel.
Pasangan hipotesis dan daerah kritis :
HoHa
::
= o o
Terima Ho, jika : ; sebaliknya tolak Ho.
dimana : atau : dengan membandingkan nilai probabilitas (Prob.) maksimal penolakan Ho ber-dasarkan data sampel yang diamati, dengan nilai yang ditentukan sebelumnya. Tolak Ho, jika : Prob. < (/2), sebaliknya Ho diterima.
HoHa
::
= o > o
Tolak Ho, jika : ; sebaliknya terima Ho.
dimana : atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
HoHa
::
= o < o
Tolak Ho, jika : ; sebaliknya terima Ho.
dimana : atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
35
nσ-μx
Z oH
BIOSTATISTIK
Contoh : 3.1.
Hasil pemeriksaan oleh tim kesehatan universitas menyatakan bahwa rata-rata tekanan darah sistolik seluruh mahasiswa yang masuk tahun sebelumnya adalah 127,5 mmHg. Seorang mahasiswa FKM ingin membandingkannya dengan mahasiswa yang ada saat ini. Untuk maksud tersebut ia membuat suatu survei mini dan mengambil sampel secara acak sebanyak 50 orang mahasiswa. Diasumsikan data ke 50 mahasiswa ini, data populasinya menyebar normal. Dari data sampel yang dikumpulkan dapat dihitung rata-rata tekanan darah sistoliknya ( ) 124 mmHg dan simpangan baku (S) 26,9 mmHg. Gunakan Confidence Level () 5 %.Pertanyaan :
a). Buatlah taksiran dengan interval kepercayaan 95 % bagi tekanan darah sistolik (tks) mahasiswa sesung-guhnya ?
b). Selanjutnya jelaskan galat pendugaan bagi rata-rata tekanan darah sistolik mahasiswa sesungguhnya oleh titik taksiran sebesar 124 mmHg ?
c). Ujilah, apakah rata-rata tekanan darah sistolik mahasiswa sekarang berbeda dengan tahun sebelumnya ? Gunakan = 0,05.
Jawab :
a). Untuk melakukan pendugaan bagi rata-rata populasi ( ) oleh rata-rata sampel ( ) sebesar 124 mmHg dengan ukuran sampel (n ) sebanyak 50 mahasiswa dapat dilakukan dengan rumus (1-1).
ZC = Z(0,5 - /2) = Z0,4750 = 1,96 (Tabel. II)
Jika (simpangan baku populasi) tidak diinformasikan pada soal, dapat digunakan S (simpangan baku sampel).
Jadi : = 124 7,46
atau : Interval kepercayaan 95 % bagi adalah : [116,54 ; 131,46]Kesimpulan : Kita percaya 95 % bahwa rata-rata sesungguhnya () tekanan darah sistolik mahasiswa ada dalam interval dengan batas bawah 116,54 sampai dengan batas atas 131,46 atau dalam jangkauan sekitar 14,92 mmHg.
b). Dapat dinterpretasikan bahwa jika kita ingin menaksir rata-rata sesungguhnya () dengan mengguna-kan rata-rata sampel ( ) sebesar 124 mmHg dalam interval kepercayan 95%, maka kita boleh membuat kesalahan dalam penaksiran (galat
penduggaan) tidak lebih dari ( ) atau sebesar 7,46 mmHg. Atau dapat juga
dinyatakan bahwa batas galat pendugaan (GBP) dalam pendugaan bagi sama dengan 7,46 mmHg.
c). Ho :
Ha : 127,5 mmHg.
Statistik uji yang digunakan : = -0,92 Nilai Prob. = 0,3576a)
36
BIOSTATISTIK
Titik kritis : ZC = Z(0,5-/2) = Z0,4750 = 1,96Ternyata : -1,96 <ZH (= -0,92) < 1,96 dapat dinyatakan ZH berada pada daerah penerimaan Ho. atau berdasarkan nilai probabilitas, dimana : Prob. (= 0,3578) > (= 0,025) artinya. Ho diterima.
Kesimpulan : Hasil penyelidikan yang dilakukan mahasiswa AKBID tersebut mendukung pernyataan tim kesehatan terdahulu bahwa rata-rata TKS mahasiswa sekarang sesungguhnya sama dengan mahasiswa tahun sebelumnya pada taraf uji () 5 %
5.1. 3. Pendugaan bagi rata-rata populasi () dengan n < 30 (sampel kecil) tidak diketahui
Jika adalah rata-rata sampel acak berukuran n (n < 30) yang diambil dari suatu populasi dengan 2 (varians atau ragam) tidak diketahui, maka Interval Kepercayaan (1-).100 % bagi adalah :
…………………………….…………..…………..………(5-3)
dimana :
tC
S
====
rata-rata sesungguhnya (populasi)rata-rata sampelNilai baku t-student berdasarkan error type I () yang ditentukan Simpangan baku sampel.
5.1.4. Uji Hipotesis rata-rata populasi () dengan n < 30 (sampel kecil) tidak diketahui
Jika adalah rata-rata sampel acak berukuran n (n < 30) yang diambil dari suatu populasi dengan 2 (varians atau ragam) tidak diketahui, maka uji hipotesis bagi rata-rata populasi (sesungguhnya) digunakan statistik uji berikut :
……………………..…………….……..…………..…………………………………….……(5-4)
dimana
o
tC
S
====
rata-rata sesungguhnya (populasi)rata-rata sampelNilai baku t-student yang besarnya bergantung pada yang ditentukanSimpangan baku sampel.
a) Prob. = 2{0,5 – L(ZH = -0,92)} = 2(0,5 – 0,3212) = 0,3576atau : Prob. = 1 – 2{L(ZH = -0,92)} = 1 – 2(0,3212) = 0,357
Pasangan hipotesis dan daerah kritis :
37
12 n-dkttn
Stxμ );dk/(CC
nS
- μx t o
H
BIOSTATISTIK
HoHa
::
= o o
Terima Ho, jika : ; sebaliknya tolak Ho.
dimana : dk = n - 1atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
HoHa
::
= o > o
Tolak Ho, jika : tH > tC ; sebaliknya terima Ho.
dimana : dk = n - 1atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
HoHa
::
= o < o
Tolak Ho, jika : tH < -tC ; sebaliknya terima Ho.
dimana : dk = n - 1atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Contoh : 3.2.
Dari 25 mahasiswa yang diambil secara acak, masing-masing diukur tinggi badan mereka, dan diperoleh data seperti berikut : 160,5 ; 160,0 ; 157,0 ; 154,0 ; 165,0 ; 167,0 ; 170,5 ; 172,5 ; 167,5 ; 174,5 ; 167,0 ; 168,0 ; 150,0 ; 145,0; 150,0 ; 155,0 ; 160,0 ; 162,5 ; 170,0 ; 166,0 ; 165,5 ; 170,0 ; 174,0 ; 155,5 ; 175,0.
= 4082 dan = 668169.
Dari data yang terkumpul diperoleh rata-ratanya adalah 163,28 cm, dan simpangan baku sebesar 8,317 cm. Berdasarkan data tahun sebelumnya rata-rata tinggi badan adalah 165,7 cm. a). Buatlah pendugaan bagi rata-rata tinggi badan mahasiswa yang sesungguhnya (
) pada tingkat keyakinan 99%.b). Jelaskan tentang galat pendugaan bagi pendugaan oleh pada tingkat keyakinan
99%.c). Ujilah apakah tinggi badan mahasiswa tahun sekarang lebih rendah dari tahun
sebelumnya. Gunakan = 0,01.
Jawab :
a). Untuk melakukan pendugaan bagi rata-rata populasi ( ) oleh rata-rata sampel ( ) sebesar 163,28 cm dengan ukuran sampel (n ) sebanyak 25 mahasiswa dapat dilakukan dengan rumus (7-3).
= = 2,797 (Tabel. III)
Jadi : = 163,28 4,65
atau : Interval kepercayaan 99 % bagi adalah : [158,63 ; 167,93]
38
BIOSTATISTIK
Kesimpulan : Kita percaya 99 % bahwa rata-rata sesungguhnya () tinggi badan mahasiswa ada dalam interval dengan batas 158,63 sampai dengan 167,93 atau dalam jangkauan sekitar 9,3 cm.
b). Dapat dinterpretasikan bahwa jika kita ingin menaksir rata-rata sesungguhnya () dengan menggunakan rata-rata sampel ( ) sebesar 163,28 cm dalam interval kepercayaan 99%, maka kita boleh membuat kesalahan dalam penaksiran (galat
penduggaan) tidak lebih dari ( ) atau sebesar 4,65 cm. Atau dapat juga
dinyatakan bahwa batas galat pendugaan (BGP) dalam pendugaan untuk sama dengan 4,65.
c). Ho :
Ha : = 165,7 cm
Statistik uji : Prob. = 0,165b)
Titik kritis : = = 2,492
Ternyata : (= -1,455) > (= -2,492) Ho diterima. (Prob. (= 0,165) > (= 0,01) Ho diterima).
Kesimpulan : Tidak benar bahwa tinggi badan mahasiswa sekarang lebih rendah dari tinggi badan mahasiswa tahun sebelumnya, pada taraf uji () 1 %.
5.2. PENDUGAAN DAN UJI HIPOTESIS PARAMETER POPULASI DENGAN DUA SAMPEL
5.2.1. Pendugaan beda dua rata-rata populasi : (1-2) dengan 12 dan 2
2
diketahui
Jika dan masing-masing adalah rata-rata sampel acak berukuran n1 dan n2
yang diambil dari suatu populasi dengan varians dan diketahui (n 30), maka
Interval Kepercayaan (1-).100% bagi (1-2) adalah :
…………………………………..………..(5-5)
dimana :
1-2 = selisih rata-rata sesungguhnya (populasi)- = selisih rata-rata sampel
= varians pada kelompok populasi 1 dan 2
dan = rata-rata sampel pada kelompok populasi 1 dan 2 .
39
)-αα,(CC Z Z n
σ
n
σ Zxx -μμ 250
2
22
1
21
2121
BIOSTATISTIK
5.2.2. Uji Hipotesis perbedaan dua rata-rata populasi : ( ) dengan 12 dan 2
2
diketahui
Jika dan masing-masing adalah rata-rata sampel acak berukuran n1 dan n2
yang diambil dari suatu populasi dengan varians 12 dan 2
2 diketahui (n 30), maka uji hipotesis beda rata-rata populasi (sesungguhnya) digunakan statistik uji berikut :
……..…………...……………………………………………..……….….…………..(5-6)
dimana :1-2 = beda rata-rata sesungguhnya (populasi)
- = beda rata-rata sampel
12 dan 2
2
=varians pada kelompok populasi 1 dan 2
dan = rata-rata sampel pada kelompok populasi 1 dan 2 .
d). Interpolasi :
Pasangan hipotesis dan daerah kritis :
HoHa
::
1 = 2
1 2 Terima Ho, jika : ; sebaliknya tolak Ho.
dimana : atau : Tolak Ho, jika : Prob. < , sebaliknya Ho diterima.
HoHa
::
1 2
1 > 2 Tolak Ho, jika : ; sebaliknya terima Ho.
dimana : atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
HoHa
::
1 2
1 < 2 Tolak Ho, jika : ; sebaliknya terima Ho.
dimana : atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
40
2
22
1
21
21
n
σ
n
σ
x - x Z H
BIOSTATISTIK
Contoh : 3.5.
Suatu sampel acak mahasiswi berukuran n1 = 25, yang ditarik dari suatu populasi normal dapat dicatat hasil ujian Biostatistik mereka sebagai berikut : 70 ; 80 ; 85 ; 75 ; 60 ; 65 ; 75 ; 60 ; 75 ; 80 ; 85 ; 90 ; 85 ; 70 ; 65 ; 60 ; 65 ; 60 ; 55 ; 85 ; 80 ; 70 ; 75 ; 80 ; dan 60. Dapat dihitung = 72,40 dan S1 = 10,12. Suatu sampel acak lain berukuran n2 = 36 dapat dicatat hasil ujian Biostatistik sebagai berikut : 60 ; 60 ; 65 ; 65 ; 60 ; 75 ; 75 ; 80 ; 80 ; 75 ; 70 ; 65 ; 80 ; 65 ; 75 ; 70 ; 50 ; 50 ; 55 ; 65 ; 60 ; 75 ; 75 ; 80 ; 75 ; 60 ; 60 ; 55 ; 55 ; 50 ; 60 ; 75 ; 70 ; 75 ; 85 ; dan 70. Diperoleh = 67,22 dan S2 = 9,67.
Pertanyaan :a). Buatlah penaksiran terhadap selisih rata-rata sesungguhnya ( pada tingkat
kepercayaan 99 % dan 95 %.c). Jelaskan galat pendugaan bagi penaksiran selisih rata-rata sesungguhnya dengan
menggunakan rata-rata sampel pada intervak kepercayaan 99 % dan 95 %.b). Ujilah apakah kedua kelompok mahasiswi dan mahasiswa tersebut nilai ujiannya
berbeda nyata ? Gunakan = 0,01 dan 0,05.
Jawab :
a). Untuk melakukan taksiran bagi selisih rata-rata populasi ( ) oleh selisih rata-
rata sampel ( ) dengan ukuran sampel n1 dan/atau n2 lebih dari 30 (sampel besar) dapat dilakukan dengan rumus (5-9).
dan
Jika atau (varians populasi) tidak diinformasikan pada soal, dapat digunakan
atau (varians sampel).
Pada = 0,01
atau : Interval kepercayaan 99 % bagi selisih adalah : [-1,48 ; 11,84]
41
BIOSTATISTIK
Kesimpulan : Kita percaya 99 % bahwa selisih rata-rata sesungguhnya ( ) nilai ujian mahasiswa ada dalam interval dengan batas –1,48 sampai dengan 11,84 atau dalam jangkauan sekitar 13,32.
Pada = 0,05
atau : Interval kepercayaan 95 % bagi selisih adalah : [0,11 ; 10,25]
Kesimpulan : Kita percaya 95 % bahwa selisih rata-rata sesungguhnya ( ) nilai ujian mahasiswa ada dalam interval dengan batas 0,11 sampai dengan 10,25 atau dalam jangkauan sekitar 10,14.
b). Pada = 0,01 Juga dapat dinterpretasikan bahwa jika kita ingin menaksir selisih
rata-rata sesung-guhnya ( ) dengan menggunakan selisih rata-rata sampel (
) sebesar 5,18 maka kita boleh membuat galat pendugaan tidak lebih dari (
) atau sebesar 6,66.
Pada = 0,05 Juga dapat dinterpretasikan bahwa jika kita ingin menaksir selisih
rata-rata sesungguhnya ( ) dengan menggunakan selisih rata-rata sampel (
) sebesar 5,18 maka kita boleh membuat galat pendugaan tidak lebih dari (
) atau sebesar 5,07.
c). Ho :
Ha :
Statisti uji : Prob. = 0,0456
Titik kritis : untuk = 0,01 ZC = Z0,4950 = 2,575 dan = 0,05 ZC = Z0,4750 = 1,96
Ternyata : pada = 0,01 ZH (= 2,002) < ZC (2,575) Ho diterima,dan pada = 0,05 ZH (= 2,002) > ZC (1,96) Ho ditolak. Atau berdasarkan nilai probabiltas, yaitu : Prob. (= 0,0456) > (= 0,01) Ho diterima,
dan Prob. (= 0,0456) < (= 0,05) Ho ditolak.
Kesimpulan : Hasil statistik pada taraf nyata () 1% Ho diterima dan pada taraf nyata () 5% Ho ditolak, hal ini menunjukkan tingkat signifikasi yang tidak terlalu kuat, artinya ada keraguan untuk menyatakan ada perbedaan nilai ujian kedua kelompok mahasiswa tersebut. Oleh karena masih diragukan, maka diperlukan penelitian lanjutan dengan manambah besar sampel.
5.2.3. Pendugaan beda dua rata-rata populasi : ( ) dengan 12 = 2
2
(Independent samples t-test)
42
BIOSTATISTIK
Jika dan masing-masing adalah rata-rata sampel acak berukuran kecil n1
dan n2 (n < 30), yang diambil dari dua populasi dengan varians dan tidak diketahui.
Diasumsikan kedua varians sama ( = ), maka Interval Kepercayaan (1-).100 % bagi
(1-2) adalah :
…………….………....(.5-7)dimana :1-2 = selisih rata-rata sesungguhnya (populasi)
- = selisih rata-rata sampel
dan = varians pada sampel dari kelompok populasi 1 dan 2
Sg = simpangan baku gabungan dan = Rata-rata sampel
5.2.4. Uji Hipotesis beda dua rata-rata populasi : ( ) dengan 12 = 2
2
(Independent samples t- test)
Jika dan masing-masing adalah rata-rata sampel acak berukuran kecil n1
dan n2 (n < 30), yang diambil dari dua populasi dengan varians 12 dan 2
2 tidak diketahui. Diasumsikan kedua varians sama (1
2 = 22), maka uji hipotesis beda dua rata-rata
populasi digunakan statistik uji berikut :
….……………….…..………..……….….(5-8)
Dimana :1-2
-S1
2 dan S2
2
Sg
dan
==
===
beda rata-rata sesungguhnya (populasi)
beda rata-rata sampelvarians pada sampel dari kelompok populasi 1 dan 2simpangan baku gabunganrata-rata sampel dari kelompok populasi 1 dan 2 .
Pasangan hipotesis dan daerah kritis :
HoHa
::
1 = 2
1 2 Terima Ho, jika : ; sebaliknya tolak Ho.
dimana : dk = n1 + n2 - 2atau :
Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
43
2
2
1111
21
2
21
222
211
212121
nn dk t t
nn
)S(n)S(nS
nn..S txx -μμ
):dkα
(C
ggC
2
11
11 21
222
211
21
21
nn
)S(n)S(n S
nn.S
xx t g
g
H
BIOSTATISTIK
HoHa
::
1 = 2
1 > 2 Tolak Ho, jika : ; sebaliknya terima Ho.
dimana : dk = n1 + n2 - 2atau :
Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
HoHa
::
1 = 2
1 < 2 Tolak Ho, jika : ; sebaliknya terima Ho.
dimana : dk = n1 + n2 - 2atau :
Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Contoh : 3.6.
Umur (dalam tahun) mulai gejala penderita kanker wanita dan pria yang independen dapat dicatat sebagai berikut :
Wanita 58 52 50 49 56 52 54 48 41 37 67 70
Pria 26 41 57 66 36 55 41 61 53 50 52 37 50
Sumber : data rekaan.
Pertanyaan :
a). Buatlah pendugaan bagi selisih rata-rata sesungguhnya antara rata-rata umur mulai gejala penderita kanker wanita dan pria pada interval kepercayaan 94 %
b). Jelaskan galat pendugaan bagi pendugaan selisih rata-rata tersebut pada pertanyaan a).
c). Ujilah pada taraf signifikansi 6 %, apakah umur rata-rata mulai gejala penderita kanker wanita lebih tinggi dari umur rata-rata penderita kenker pria ? Untuk kasus ini diasumsikan kedua varians sama.
Jawab :
Dari dapat diketahui : = 12 ; = 634 ; = 34468 ; = 13 ; = 625 dan
= 31567
maka ;
a). Untuk melakukan taksiran bagi selisih rata-rata populasi ( ) oleh selisih rata-rata
sampel ( ) dengan ukuran sampel n1 dan n2 kurang dari 30 (sampel kecil) dan
= dapat dilakukan dengan rumus (1-11).
= = 1.998e)
44
BIOSTATISTIK
= =
10,41
Jadi :
atau : Interval kepercayaan 94 % bagi selisih adalah : [-3,58 ; 13,08]
Kesimpulan : Kita percaya 94 % bahwa selisih rata-rata sesungguhnya ( ) umur pertama kali menderita kanker antara pria dan wanita ada dalam interval dengan batas –3,58 sampai dengan 13,08 atau dalam jangkauan sekitar 16,66.
b). Juga dapat dinterpretasikan bahwa jika kita ingin menaksir selisih rata-rata sesungguhnya ( ) dengan menggunakan selisih rata-rata sampel ( ) sebesar 4,75 maka kita boleh membuat galat pendugaan tidak lebih dari (
) atau sebesar 8,33.
c). Ho :
Ha :
Statistik uji :
e). Dalam tabel t, nilai probabilitas t-student untuk 0.03 tdak dijumpai. Untuk
menghitung nilai baku t-student senilai dengan nilai probabilitas sebesar 0.03 tersebut dapat dilakukan dengan teknik interpolasi.Perhatikan tabel t (tabel III), baris ke 23 kolom 0.05 dan kolom 0.025, selanjut dapat ditulis seperti berikut :
tC = 1,998
prob. = 0,269
Statistik tabel : = 1,635
Kriteria penolakan Ho : Tolak jika
Ternyata :
Atau berdasarkan kriteria nilai probabilitas, ternyata : Prob. (0,269) > (0,05) Ho diterima.
45
BIOSTATISTIK
Kesimpulan : Terbukti pada taraf signifikansi ( ) 6 % bahwa rata-rata umur mulai gejala penderita kanker wanita tidak lebih tinggi dari rata-rata umur penderita kanker pria.
MODUL 6MODUL 6UJI TABEL SILANG (CROSSTAB TEST) UJI TABEL SILANG (CROSSTAB TEST)
A. PENDAHULUAN Dalam analisis statististik parametrik yang prosedurnya dibuat berdasarkan sejumlah asumsi, antara lain :
(1). sampel yang dicuplik dari populasi yang berdistribusi normal, atau paling sedikit mendekati normal.
(2) pemilihan unit sampel dari populasi harus independen.(3). pengamatan unit observasi juga harus independen.(4). Jika membandingkan dua atau sejumlah sampel, maka varians (ragam)
populasinya harus homogen.(5). Variabel yang diukur dalam skala interval atau dalam skala rasio.
Jika asumsi-asumsi tersebut terpenuhi, maka penggunaan uji statistik parametrik sudah valid. Namun jika terjadi pelanggaran atas asumsi-asumsi ini, sebagai alternatifnya dapat digunakan uji statistik nonparametrik.Uji nonparametrik atau uji bebas sebaran adalah suatu metode statistik yang hanya sedikit membuat dugaan tentang populasi asal sampel. Juga uji ini tidak bertujuan menduga maupun menguji parameter populasi, tetapi cukup membandingkan karakteristik populasi secara umum.
Oleh karena banyaknya kelemahan yang melekat pada uji nonparametrik ini, terutama tidak maksimalnya dalam memanfaatkan informasi yang dikandung sampel, mengakibat uji nonparametrik ini kurang efisien dibandingkan dengan prosedur parametrik jika kedua metode ini dapat diterapkan. Dengan kata lain, jika uji parametrik dan nonparametrik dapat digunakan untuk data yang sama, kita sebaiknya menghindari uji nonparametrik, yang konotasinya “cepat dan mudah” ini dan mengerjakannya dengan teknik parametrik yang lebih efisien.Untuk memberikan gambaran yang lengkap keuntungan dan kelemahan penggunaan statistik nonparametrik, dapat dijelaskan sebagai berikut :
B. Keuntungan :
(1). Dapat digunakan pada ukuran sampel yang relatif kecil.(2). Tidak memerlukan asumsi-asumsi yang ketat.(3). Dapat digunakan pada ukuran skala nominal (kategorikal) atau ordinal
(peringkat).(4). Relatif mudah dilakukan walaupun dengan manual.(5). Mudah dipahami karena memiliki konsep lebih sederhana dibandingkan dengan
prosedur parametrik.
C. Kelemahan :
46
BIOSTATISTIK
(1). Metode nonparametrik secara statistik kurang kuat (rigorous) daripada metode parametrik, karena didasari oleh persyaratan yang sedikit, bahkan sering tanpa persyaratan sama sekali.
(2). Metode nonparametrik kurang memiliki kuasa uji (power of test), jika dengan ukuran sampel yang sama, metode parametrik dapat diterapkan.
(3). Kecenderungan penyederhanaan data dari skala rasio atau interval menjadi nominal atau ordinal merupakan pemborosan informasi yang sudah dikumpulkan.
Uji tabel silang (crosstab) merupakan uji bivariat yang dapat digunakan untuk melihat ada atau tidaknya perbedaan atau hubungan atau pengaruh dua variabel yang memiliki data distribusi (nominal atau ordinal) yang mana data-data yang dianalisis data populasinya tidak harus menyebar normal. Uji tabel silang meliputi uji Chi Square, uji Chi Square dengan Koreksi Yate, uji Eksaks Fisher dan uji Mc Nemar.
6.1. UJI CHI SQUARE (2)
Uji Chi-Square atau juga dikenal dengan uji Kai-Kuadrat yang dikembangkan oleh Pearson tahun 1900, umumnya digunakan jika data yang tersedia berupa data jumlah atau data yang siap disajikan dalam bentuk frekuensi, misalnya banyak subjek dalam klasifikasi pria dan wanita, banyak subjek dalam kategori terpapar dan tidak terpapar, atau banyaknya penderita diabetes melitus dalam kategori I, II, III dan IV menurut kaparahan penyakitnya.
Pada umumnya, uji Kai-Kuadrat (2) dapat digunakan untuk :
(1). Uji kesesuaian (test of goodness of fit), yaitu untuk memeriksa apakah ada kesesuaian (fit) suatu distribusi data sampel dengan distribusi data populasi tertentu, dimana data yang ingin diuji dalam skala pengukuran nominal atau ordinal.
(2). Uji independensi (test of independence), yaitu untuk memerika apakah dua variabel dari sebuah sampel saling bebas (independen) atau tidak bebas.
(3). Uji homogenitas (test of homogeneity), yaitu untuk memeriksa beberapa data sampel apakah berasal dari populasi-populasi yang sama (homogen) dalam hal variabel tertentu.
6.1.1. SYARAT-SYARAT PENGGUNAAN UJI KAI-KUADRAT
Dalam melakukan uji Kai-Kuadrat, ada syarat-syarat yang harus dipenuhi, antara lain ;
(1). Sampel dipilih acak dan data yang tersedia dalam bentuk jumlah atau diskrit.
(2). Semua pengamatan dilakukan independen
(3). Sel-sel dengan frekuensi harapan (expected value) kurang dari 5 jika ada dapat dibenarkan sekitar 25% dari total sel, dan pada sembarang frekuensi harapan ( ) nilainya paling sedikit 1.
(4). Khusus untuk tabel kontingensi 2x2, syarat tersebut berarti tidak ada satu selpun boleh berisi frekuensi harapan ( ) 5. Jika ada, maka disarankan untuk menggunakan uji Exact Fisher atau uji Chi Square dengan koreksi Yates.
(5). Meskipun dapat diterapkan pada sampel kecil, uji Chi Square sebaiknya pada sampel yang ukuran > 40
6.1.2. LANGKAH-LANGKAH PENGGUNAAN UJI KAI-KUADRAT (2)
47
BIOSTATISTIK
Uji Chi Square dapat digunakan untuk menetapkan signifikansi perbedaan antara dua kelompok pengamatan (variabel) saling bebas (independen) atau tidak (non-independen). Pengukuran yang dituntut disini dapat selemah skala nominal.
Hipotesis yang diuji biasanya adalah dua kelompok (bivariat), apakah berbeda dalam hal ciri khas tertentu, dengan demikian perbedaan itu berhubungan dengan frekuensi relatif masuknya anggota-anggota kelompok ke dalam beberapa kategori.
Langka-langkah penggunaan statistik uji :
Pasangan hipotesis :
Ho : Kedua variabel tidak saling tergantung (independen)Ha : Kedua variabel saling tergantung (tidak independen), atau
Ho : Tidak ada perbedaan (hubungan) yang signifikan antara variabel pertama dengan variabel kedua.
Ha : Ada perbedaan (hubungan) yang signifikan antara variabel pertama dengan variabel kedua.
Statistik Uji yang digunakan :
……..……………..…………………………….(6-1)
dimana :
= baris ke 1, ke 2, ke 3, ……….., ke b.
= kolom ke 1, ke 2, ke 3, ……….., ke k.
Tabel. 4. Tabel penolong perhitungan Chi Square :
SEL
48
b
i
k
j ij
ijijH E
EO
1 1
2
2
BIOSTATISTIK
…… …… ……. …………….
Titik Kritis : dimana
Daerah Kritis : Tolak Ho, jika , sebaliknya terima Ho.
Catatan : Pada data tabel kontingensi 2x2, uji Kai-Kuadrat sebaiknya tidak digunakan bila :
1). n 20, dianjurkan menggunakan uji Eksak Fisher.2). 20 < n < 40, jika ada 5, dianjurkan menggunakan uji Eksak Fisher.
3). n 40, jika ada 1, dianjurkan menggunakan uji Eksak Fisher. Sebaliknya jika : 1
< 5, dapat diterapkan uji Chi Square dengan koreksi Yate (Continuity corecction)
Pada tabel kontingensi 2x2 berikut :
Tabel 5 : Tabel Kontingensi 2x2
Variabel Pertama Variabel Kedua JumlahKategori 1 Kategori 2
Kategori 1 a b a+b
Kategori 2 c d c+d
Jumlah a+c b+d n
dimana : a, b, c dan c adalah data hasil pengamatann adalah jumlah seluruh pengamatan (n = a+b+c+d)
disamping dapat menggunakan rumus (4-3) juga dapat digunakan rumus berikut :
…………………………………….….(6-2)
Contoh 3 :
49
dcbadbca
bcadn
2
2
BIOSTATISTIK
Suatu studi dilakukan dengan maksud mengetahui hubungan persepsi seseorang tentang kerentanan terhadap penyakit dan pilihan jenis pelayanan kesehatan yang diinginkan. Hasil pengukuran pada responden disajikan dalan tabel berkut :
Pilihan Pelayanan Kesehatan yang dikehendaki
Persepsi Kerentanan Terhadap Penyakit
Jumlah
Serius Tidak serius
Medis 20 11 31
Tradisional 13 16 29
Jumlah 33 27 60
Ujilah, apakah data yang dikumpulkan dapat menjelaskan bahwa ada hubungan antara persepsi kerentanan terhadap penyakit dengan pilihan pelayanan kesehatan yang diinginkan. Gunakan taraf nyata ( ) 5 %.
Jawab :
Ho : tidak terdapat hubungan antara persepsi kerentanan terhadap penyakit dengan pilihan pelayanan kesehatan yang diinginkan
Ha : terdapat hubungan antara persepsi kerentanan terhadap penyakit dengan pilihan pelayanan kesehatan yang diinginkan
Tabel perhitungan ;
SEL
20 17,05 0,510
11 13,95 0,624
13 15,95 0,546
16 13,05 0,667
= 2,347
50
BIOSTATISTIK
Pemeriksaan pada nilai expected (frekuensi harapan) tidak ditemukan ada < 5, hal ini dibenarkan untuk terus menggunakan statistik uji Chi Square.
Titik Kritis : = 3,841
Daerah Kritis : Tolak Ho, jika ,
ternyata : , artinya Ho diterima.
Kesimpulan : Berdasarkan data sampel yang dikumpulkan dapat menjelaskan bahwa tidak terdapat hubungan antara persepsi kerentanan terhadap penyakit dengan pilihan pelayanan kesehatan yang diinginkan, pada taraf nyata ( ) 5 %.
Atau, dapat juga dengan menggunakan rumus (10-4) :
= 2,347
Jadi, terlihat bahwa hasil yang ditunjukkan dengan rumus (10-3) atau rumus (10-4) sama. Keuntung-an yang diperoleh dengan menggunakan rumus (10-3), kita bisa melihat besaran nilai expectednya, sehingga kita bisa menegaskan apakah uji Chi-Square dapat dilanjutkan. Sebaliknya dengan rumus (10-4) hal yang sama tidak ditemukan.
6.2. UJI EKSAK FISHER (TEST FISHER EXACT)
Uji Eksak Fisher adalah uji independensi dua set pengamatan dengan dua variabel kategorial, menggunakan pendekatan probabilitas pasti (exact probability). (Fisher, 1973).
Uji Eksak Fisher dapat digunakan bila dalam uji Kai-Kuadrat dengan format tabel kontingensi 2x2 dan derajat kebebasan (dk) satu, bila : (1) jumlah seluruh pengamatan (n) kurang dari 20, (2) terdapat sel harapan (expected) kurang dari 5 dengan jumlah pengamatan antara
20 sampai dengan 40, dan (3) jumlah pengamatan (n) lebih besar 40 dan terdapat sel harapan ada yang kurang
dari satu. Prosedur uji pasti Fisher lebih memungkinkan untuk mendapatkan hasil akurat untuk
semua format tabel 2x2, yang nilai-nilai harapannya terlalu kecil untuk dapat dianalisis dengan uji Kai-Kuadrat.
Untuk memperoleh nilai probabilitas pasti Fisher ( ) dapat diperhatikan tabel 5, di atas dengan sel teramati terdiri dari a, b, c dan d adalah sebagai berikut :
………………………..(6-3)
51
!!.!.!.!.
)!()!()!()!()0(
dcbaN
dbcadcbaaP
BIOSTATISTIK
Langkah-langkah penggunaan uji Eksaks Fisher dapat dimulai dengan membuat tabel konfigurasi yang bertitik tolak dari tabel induknya dengan jumlah pinggir baris dan kolom tetap seperti tabel teramati aslinya (tabel 8-5). Untuk tabel konfigurasi yang mundur akan berhenti jika nilai sel a pada sel utama sama dengan nol, dan untuk tabel konfigurasi yang maju akan berhenti jika nilai sel c pada tabel utama sama dengan nol.
Tabel konfigurasi yang dimaksud dapat dimulai dari tabel utama (tabel pengamatan) dengan asumsi nilai sel a = 3 dan nilai sel b juga = 3, dengan demikian tabel konfogurasi mundur dan maju dapat dibuat sebagai berikut :
0 b+a a+b
a-2 b+2 a+b
a-1 b+1 a+b
c+a d-a c+d c+2 d-2 c+d c+1 d-1 c+d
a+c b+d n a+c b+d n a+c b+d n
Tabel Induk
Misalkan a = 3 dan c = 3 a b a+b dst
c d c+d
dst a+c b+d n
a+1 b-1 a+b
a+2 b-2 a+b
a+c b-c a+b
c-1 d+1 c+d c-2 d+2 c+d 0 d+c c+d
a+c b+d n a+c b+d n a+c b+d n
Dengan mememperhatikan konfigurasi tabel di atas, perhitungan probabilitas dimulai dari tabel ke 1 dengan menyesuaikan rumus (10-7) :
52
BIOSTATISTIK
Penghitungan probabiltas tabel-tabel berikutnya cukup memakai rumus ulangan seperti berikut :
Dengan memisalkan :
: Kemungkinan kejadian A disebabkan oleh kejadian B, dan
: Kemungkinan kejadian A bukan disebabkan oleh kejadian B.
Maka kriteria keputusan statistiknya dapat mengacu kenilai Probabilitasnya (Probabilitas value) selanjutnya disingkat dengan Prob. Andaikan tabel teramati ialah tabel a dan tabel konfigurasinya adalah 0 sampai dengan k, dengan demikian dapat dibuat kriteria sebagai berikut :
a). Pada uji dua pihak (two tailed test)
Ho :
Ha : Nilai Prob. = 2 min [P(0) + P(1) + ….+ P(a), P(a) + P(a+1) + ……+ P(k)]Tolak Ho, Jika : Prob. < (yang ditentukan)
b). Pada uji pihak kanan (one tailed test)
Ho :
Ha : Nilai Prob. = P(a) + P(a+1) + ……+ P(k)Tolak Ho, Jika : Prob. < (yang ditentukan)
c). Pada uji pihak kiri (one tailed test)
Ho :
Ha : Nilai Prob. = P(0) + P(1) + ….+ P(a)
53
BIOSTATISTIK
Tolak Ho, Jika : Prob. < (yang ditentukan)
Contoh 7 :
Suatu studi dilakukan untuk melihat kesatuan pendapat tentang paket program kesehatan yang ditawarkan dalam suatu kampanye pemilihan umum berdasarkan tempat tinggal (hunian) kelompok masyarakat dengan kelas social tertentu, yaitu kelompok hunian dikompleks perumahan dan kelompok hunian bukan kompleks perumahan (tinggal terpisah-pisah). Hasil pengumpulan data pada 21 orang di kota besar, dapat dilihat pada tabel berikut :
Pola lokasi hunian kelompok masyarakat dengan kelas sosial tertentu
Kesatuan pendapat diantara anggota kelompok Jumlah
Rendah Tinggi
Tinggal dalam kompleks 4 9 13
Tinggal diluar kompleks 3 5 8
Jumlah 7 14 21
Gunakan = 0,05
Jawab :
Ho : Tidak terdapat hubungan antara kematian karena CVD dengan riwayat konsumsi garam yang tinggi
Ha : Terdapat hubungan antara kematian karena CVD dengan riwayat konsumsi garam yang tinggi.
Penyelidikan terhadap expected value : : ;
dan
54
BIOSTATISTIK
Dapat dilihat bahwa ditemukan ada sel expected yang kurang dari 5 (50%), dengan demikian disarankan untuk menggunakan uji eksak Fisher.
Kemungkinan konfigurasi tabel dengan jumlah tepi tetap seperti tabel teramati (tabel induk)
55
BIOSTATISTIK
0 13 13
1 12 13
2 11 13
3 10 13
7 1 8 6 2 8 5 3 8 4 4 8
7 14 21 7 14 21 7 14 21 7 14 21
7 6 13
6 7 13
5 8 13
4 9 13
0 8 8 1 7 8
2 6 8 3 5 8
7 14 21 7 14 21
7 14 21 7 14 21
Tabel Induk
Perhitungan nilai-nilai probabilitas uji eksaks Fisher berdasarkan tabel konfigurasiyang dimungkinkan, adalah sebagai berikut :
Untuk uji dua pihak, nilai :
Prob. = 2.min.
= 2.min. = 2.(0,557275) = 1,114550
Daerah kritis : Tolak Ho, jika nilai Prob. < (yang ditentukan)Ternyata, Prob. (1,114550) > (0,05), artinya Ho diterima.
56
BIOSTATISTIK
Kesimpulan : Pada taraf nyata ( ) 5 %, diyakini bahwa ada kesatuan pendapat masyarakat tentang paket program kesehatan yang ditawarkan melalui kampanye pemilu, baik untuk masayarakat yang tinggal dalam kompleks hunian ataupun masyarakat yang tinggal secara terpisah-pisah (diluar kompleks hunian)
57
Recommended