STATISTIKA DASAR Teori dan Praktek
Edisi Pertama
IMAM TAHYUDIN
Zahira Media Publisher
STATISTIKA DASAR Teori dan Praktek
Oleh : Imam Tahyudin
Penyunting : Qurrotul A’Yuni
Lay-out dan Desain Sampul : Fachry Diyo Asela
Cetakan Pertama, Februari 2012
Penerbit :
Zahira Media Publisher
Hak Cipta © 2012 pada Penulis
Hak Cipta dilindungi oleh undang-undang. Dilarang mengutip atau memperbanyak sebagian atau seluruh isi buku ini dalam bentuk apapun, baik secara elektronik maupun mekanis, termasuk memfotocopy, merekam atau dengan sistem penyimpanan lainnya, tanpa izin tertulis dari Penerbit.
“Mother hold their children’s hands a While,
And their hearts forever” (Fandy Tjiptono, 2004)
Buku ini didedikasikan untuk :
Mama, Mimi, Kakak dan Adiku
Laililyah Tahyudin
Amirah El-Zahira Tahyudin
“Untuk mengetahui jalan pikiran seseorang
lihatlah ucapannya dan untuk mengetahui ide dan gagasan
seseorang lihatlah karya tulisannya”
PRAKATA
Puji syukur kami panjatkan kepada Tuhan YME. Berkat
pertolongannya Alhamdulillah buku ini dapat terbit. Ide penulisan buku ini
telah mengendap cukup lama. Berawal dari pengalaman dan pengkajian
mendalam penulis selama belajar dan mengajar.
Dalam penulisan buku ini, penulis mendapatkan bantuan dan
dukungan dari sejumlah pihak. Oleh sebab itu, penulis ingin menyampaikan
terima kasih yang sebesar-besarnya kepada :
1. Istriku Lailiyah dan Putriku Amirah El-Zahira Tahyudin atas pengertian
dan dukungannya dengan cara-cara yang unik selama proses penulisan
buku ini.
2. Qurrotul A’yuni atas bantuannya mengedit penulisan buku ini.
3. Fachry Diyo Asela atas bantunya merancang sampul dan lay-out buku
ini.
4. Dr. Idha sihwaningrum, M.Sc. (UNSOED), Dr. Mashuri (UNSOED), Dr.
Nunung Nurhayati (UNSOED) dan Jajang, M.Si (UNSOED) atas wawasan
dan inspirasi selama kuliah.
5. Berlilana, S.Kom., M.Si (Ketua STMIK Amikom Purwokerto) atas
wawasan dan inspirasi selama mengabdi mengajar.
6. Teman-teman di STMIK AMIKOM Purwokerto (Pa Amang, Pa Taqwa, Pa
Giat, dll) atas dukungan moral selama penulisan buku ini.
Penulis sangat mengharapkan buku ini bisa bermanfaat bagi semua
yang menaruh minat pada Statistika Dasar. Segala masukan dan kritik
konstruktif sangat Penulis harapkan. Selamat membaca dan mengkaji buku
ini.
Purwokerto,
Februari 2012
Imam Tahyudin
DAFTAR ISI
BAB I. PENDAHULUAN ....................................................... .01
BAB II. PENYAJIAN DATA............................................................ 24
BAB III. DAFTAR DISTRIBUSI FREKUENSI ............................. 53
BAB IV. UKURAN PEMUSATAN ................................................. 78
BAB V. UKURAN PENYEBARANError! Bookmark not defined.
BAB VI. MODEL DISTRIBUSI DATAError! Bookmark not defined.
BAB VII. PROBABILITAS .............. Error! Bookmark not defined.
BAB VIII. PERMUTASI ................... Error! Bookmark not defined.
BAB IX. KOMBINASI ...................... Error! Bookmark not defined.
BAB X. POPULASI DAN SAMPELError! Bookmark not defined.
BAB XI. DISTRIBUSI PROBABILITASError! Bookmark not defined.
BAB XII. DISTRIBUSI NORMAL ... Error! Bookmark not defined.
BAB XIII. PENDUGAAN PARAMETERError! Bookmark not defined.
BAB XIV. PENGUJIAN HIPOTESISError! Bookmark not defined.
BAB XV. REGRESI.......................... Error! Bookmark not defined.
DAFTAR PUSTAKA
PENDAHULUAN
A. PERANAN STATISTIKA
Dunia penelitian atau riset yang dilaksanakan melalui
penelitian laboratorium atau penelitian lapangan di manapun
dilakukan, mendapat manfaat dengan menggunakan dan
memecahkan masalah melalui statistika. Hal ini dilakukan
para peneliti untuk mengetahui apakah hasil penelitian dengan
suatu metode yang baru lebih baik jika dibandingkan dengan
metode yang lama. Dalam pembuatan model dari suatu
penelitian, untuk menyatakan bahwa model tersebut dapat
dipakai atau tidak maka digunakan teori statistika. Bahkan
statistika cukup mampu untuk menentukan apakah faktor yang
satu dipengaruhi oleh faktor lainnya. Jika ada hubungan antara
satu faktor dengan faktor lainnya, berapa kuat hubungan
tersebut? apakah dapat faktor yang satu ditinggalkan dan
faktor lainnya dipakai untuk studi lanjut?
Statistik yang diartikan dalam bahasa Latin sebagai
“status” atau negara, sangat berperan di dalam pengelolaan
semua manajemen baik manajemen yang besar maupun yang
sekecil-kecilnya, manajemen negara pada umumnya, ekonomi,
pertanian, perindustrian, kesehatan, farmasi, sampai ke
manajemen rumah tangga pun dengan tidak disadari telah
memanfaatkan statistik dan lain sebagainya.
Peranan statatistik di dalam dunia penelitian dan riset
baik penelitian di bidang sosialmaupun sains, selalu
menggunakan ilmu statistik, mulai dari persiapan penelitian,
teknik pengambilan data, sampai ke pengolahan data agar
informasi-informasi atau gambaran – gambaran mengenai
karateristik data dapat dipahami dengan mudah oleh pihak
lainnya.
Salah satu contoh pemanfaatan statistik di dalam
pengelolaan negara, di waktu akan diadakan PEMILU oleh
pemerintah, mulai membuat sensus penduduk yang akan
digunakan sebagai data untuk mempersiapkan apa-apa yang
akan diperlukan, baik bahan, tempat, waktu sampai
keperkiraan biaya yang akan digunakan pada pelaksanaan
pemilu tersebut.
Contoh yang lain di bidang farmasi misalnya, untuk
membuat campuran obat-obatan harus terlebih dahulu membuat
tabel mengenai takaran-takaran, jenis bahan yang diperlukan.
Di kantor-kantor khususnya di bagian personalia
sering kita lihat tabel-tabel yang tergantung pada dinding
mengenai nama pegawai, jumlah pegawai, jenis kelamin,
golongan, masa kerja, alamat dan lain sebagainya, Ini juga
merupakan statistic yang dinamakan dengan statistik
kepegawaian.
Uraian singkat di atas menyatakan bahwa statistika
sangat diperlukan bukan saja dalam bidang yang terbatas
kepada dunia penelitian tetapi mencakup dunia ilmu
pengetahuan. Mengingat hal tersebut di atas maka dalam
penjelasan berikut diuraikan tentang metode statistika yang
diharapkan dapat digunakan dalam berbagai bidang dan atau
berbagai disiplin ilmu, bukan statistika teoritis, oleh sebab itu
tidak diuraikan tentang penurunan rumus, pembuktian sesuatu
sifat atau dalil-dalil.
B. STATISTIK DAN STATISTIKA
1. Statsitik
Statistik berasal dari bahasa Latin yang artinya adalah
“status” atau negara. Pada mulanya statistika berhubungan
dengan fakta dan angka yang dikumpulkan oleh pemerintah
untuk bermacam-macam tujuan. Statistik juga diturunkan dari
kata bahasa Inggris yaitu state atau pemerintah.
Pengertian yang sangat sederhana tentang statistic
adalah sebagai suatu kumpulan data yang berbentuk angka dan
tersusun rapi dalam suatu tabel, grafik, gambar, dan lain-lain.
Misalnya tabel mengenai keadaan pegawai di kantor-kantor,
grafik perkembangan jumlah penduduk dari waktu ke waktu, dan
lain sebagainya.
Sedangkan pengertian yang lebih luas mengenai statistic
adalah merupakan kumpulan dari teknik mengumpulkan,
analisis, dan interpretasi data dalam bentuk angka. Dan statistic
juga merupakan bilangan yang menunjukkan sifat-sifat
(karakteristik) data yang dikumpulkan tersebut.
2. Statsitika
Statistika dapat didefinisikan sebagai suatu ilmu
pengetahuan yang berhubungan dengan cara-cara
mengumpulkan fakta/data, pengolahan data, kemudian
menganalisis data tersebut sehingga dapat diperoleh suatu
kesimpulan/keputusan.
Statistik dapat dibagi menjadi dua macam yaitu Statistik
Deskriptif dan Statistik Induktif (inferiens). Kedua macam statistic
tersebut sebagai suatu metode yang mengandung kegiatan-
kegiatan dari suatu proses untuk lebih mudah dipahami dan
dapat digambarkan dengan bagan alir seperti pada Gambar 1.2.
Yang dimaksud dengan statistik deskriptif adalah
usaha penjelasan arti secara fisis (bentuk) atau gambaran
tentang karakteristik data agar dapat dengan mudah dipahami
oleh pihak lain. Misalnya setelah dikumpulkan data, kemudian
diolah dan dianalisis data tersebut sehingga dapat diambil
kesimpulan yang akan ditunjukkan kepada yang
membutuhkannya.
Sedangkan statistik induktif (inferens) adalah usaha
pembuatan inferensi terhadap sekumpulan data yang berasal
dari suatu sampel. Misalnya seorang dokter ingin mengambil
suatu kesimpulan tentang penyakit seseorang tentunya
disamping pemeriksaan secara komunikasi efektif juga
berdasarkan data yang diperoleh dari laboratorium dapat
memperkirakan penyakit apa yang dialami oleh orang sakit
tersebut. Jadi dari sini dapat diterangkan inferensi adalah
merupakan kerja perkiraan, peramalan kemudian pengambilan
keputusan dan sebagainya.
C. D A T A
Data dan statistik cukup banyak digunakan sebagai ilmu
pengetahuan yang diaplikasikan dalam kehidupan manusia
sehari-sehari, baik di bidang eksakta maupun sosial. Oleh sebab
itu dapat disimpulkan bahwa data dan statistik sangat erat
hubungan antara keduanya.
Data adalah sekumpulan informasi atau nilai yang
diperoleh dari pengamatan (observasi) suatu obyek, data dapat
berupa angka dan dapat pula merupakan lambang atau sifat.
Beberapa macam data antara lain; data populasi dan data
sampel, data observasi, data primer, dan data sekunder.
Selain dari pada itu data juga dapat diterangkan dengan
dua arti yaitu; arti secara kuantitatif dan arti secara kualitatif, data
kuantitatif adalah data yang berbentuk angka atau nilai,
contohnya, 6, 40, 100, 250 dan sebagainya, sedangkan data
kualitatif adalah data yang berupa kata-kata, contohnya, baik,
sedang, buruk, dan lain sebagainya.
Kedua data tersebut dapat dikonversikan antara satu
dangan lainnya, misalnya dalam bentuk kuantitatif nilainya 80,
maka nilai 80 apabila dikonversikan ke dalam bentuk
kualitatif (dalam bentuk kata-kata) adalah baik (nilai 80 = nilainya
baik).
1. Pengumpulan Data
Untuk pengumpulan data dapat dilakukan dengan dua
cara yaitu sensus dan sampling. Sensus adalah pengumpulan
data yang mencakup seluruh elemen atau seluruh anggota
populasi yang diselidiki, dimana data populasi adalah merupakan
sekumpulan informasi (elemen) atau angka yang menyeluruh
pada suatu obyek. Misalnya data yang diperoleh melalui sensus
penduduk, data yang diperoleh dari hasil penggerebekan di
suatu tempat yang tidak menyenangkan, data ini juga
dikatakan data populasi karena data tersebut adalah hasil
pemeriksaan semua objek yang ada di tempat itu. Sedangkan
sampling (data sampel) merupakan data perkiraan atau data
yang berasal dari sebahagian kecil data populasi (elemen
populasi).
Perlu diketahui bahwa di dalam suatu penelitian jarang
sekali mempergunakan data populasi melainkan data sampel.
Kenapa? karena jika mengambil data populasi akan banyak
memerlukan tenaga ahli, banyak membutuhkan biaya, dan
butuh waktu yang lebih lama dan lain-lain.
2. Macam-Macam Data
Pengambilan data banyak sekali caranya, antara lain
dapat mendatangi langsung ke obyek yang akan diteliti, ataupun
melalui kuesioner yang diisi oleh obyek penelitian ataupun
melalui bacaan-bacaan yang dikutip dari artikel- artikel yang
tersedia di perpustakaan maupun di kantor-kantor sebagai
laporan yang telah diarsipkan.
Jika data yang diperoleh atau yang akan digunakan untuk
tujuan penelitian disebut data observasi, sedangkan data yang
diperoleh dengan datang langsung ke obyek ataupun
melalui kuesioner terhadap obyek peneliti disebut data primer
dan data yang diperoleh dari bacaan-bacaan atau yang dikutip
dari laporan-laporan yang sudah ada baik di perpustakaan
maupun di kantor-kantor disebut data sekunder.
3. Data dan Variabel
Variabel/peubah: ciri yang menunjukkan keragaman
“hubungan antara kepemimpinan dan iklim organisasi dengan
kepuasan kerja”.
Skala:
Nominal :
- paling rendah dalam level pengukuran
- hanya berupa satu-satunya kategori
- Contoh : data jenis kelamin, alamat pada KTP dll.
Ordinal :
- levelnya lebih tinggi dari variabel nominal
- terdapat tingkatan data/kategori
- jarak antar kategori tidak pasti
- contoh : data tentang preferensi terhadap suatu
hal, data peringkat
Interval:
- Ada tingkatan data
- Jarak antar kategori pasti
- Tidak ada nol mutlak
- Contoh: skala pada termometer, (preferensi?)
Rasio:
- Ada tingkatan data
- Jarak antar kategori pasti
- ada nol mutlak
- Contoh: berat badan, tinggi badan, kecepatan
LATIHAN SOAL
1. Sebutkan arti dan definisi statistik!
2. Sebutkan arti statistik diskriptif dan statistik induktif!
3. Apa yang dimaksud dengan data?
4. Jelaskan perbedaan anatara data populasi dan data sampel!
5. Apa yang dimaksud dengan observasi?
6. Jelaskan perbedaan antara data primer dan data sekunder!
7. Sebutkan apa manfaat statistik di dalam suatu pengelolaan
perusahaan dan berikan contohnya!
8. Berikan alasan-alasan pemanfaatan statistik dalam bidang
penelitian!
I. PENYAJIAN DATA
A. Tabel/Daftar :
1. daftar baris kolom
2. daftar distribusi frekuensi
B. Grafik/Diagram :
1. diagram batang
2. diagram garis
3. diagram lingkaran/pastel
4. diagram dahan daun
5. diagram pencar/titik
6. diagram lambang/simbol
7. Histogram dan poligon frekuensi
8. Ogive
DIAGRAM BATANG
Cara penyusunan :
1. Buat sumbu datar dan sumbu tegak berpotongan tegak lurus
2. Bagilah sumbu datar dan tegak menjadi beberapa bagian
dengan skala yang sama. Perbandingan skala antara sumbu
tegak tidak harus sama.
Contoh : Jumlah mahasiswa P.S Manajemen pendidikan Universitas
Pakuan
0
10
20
30
40
50
60
70
I III V VII
Semester
Jum
lah M
ahasis
wa
DIAGRAM GARIS
10
15
20
25
30
35
40
45
50
55
60
1998 1999 2000 2001
Tahun masuk
Jum
lah M
ahasis
wa
DIAGRAM PASTEL/LINGKARAN
II. DAFTAR DISTRIBUSI FREKUENSI
A. Menyusun Tabel Distribusi Frekuensi
1. Tentukan Rentang
Rentang = data terbesar – data terkecil
2. Tentukan banyak kelas interval
Antara 5 – 15
aturan sturges : banyak kelas = 1 + (3.3) log n
dengan n adalah banyaknya data dan hasilnya dibulatkan.
3. Tentukan panjang kelas interval (p).
4. Buat kolom tabulasi dan tentukan batas-batas kelas interval
dengan data terkecil sebagai batas bawah.
5. Hitunglah frekuensi dari masing masing kelas interval dan
masukkan nilai-nilainya pada kolom tabulasi.
6. Buat tabel distribusi frekuensi berdasarkan hasil tabulasi data.
Contoh :
Nilai ujian statistika 60 mahasiswa STMIK AMIKOM
PURWOKERTO:
62 76 40 65 41 58 76 80 89 66
65 67 81 76 34 32 47 47 65 23
45 42 56 59 67 63 72 39 44 60
51 55 39 65 76 77 51 90 87 54
50 92 40 37 60 65 55 89 67 44
73 50 32 27 35 47 32 54 55 60
Rentang p = ----------------- Banyak kelas
Rentang : 92 – 23 = 69
Banyak kelas interval :
Banyak kelas = 1 + (3.3) log 60
= 1 + (3.3) . (1.7782)
= 6.8679 dibulatkan menjadi 7
Panjang kelas interval :
69 p = -------- 7 = 9.86 dibulatkan menjadi 10
Batas-batas kelas dan tabulasi :
NILAI UJIAN TABULASI FREKUENSI
23 - 32 5
33 - 42 9
43 - 52 10
53 - 62 12
63 - 72 11
73 - 82 8
83 - 92 5
Tabel Distribusi frekuensi Hasil Ujian Statistika menjadi :
NILAI UJIAN FREKUENSI
23 - 32 5
33 - 42 9
43 - 52 10
53 - 62 12
63 - 72 11
73 - 82 8
83 - 92 5
B. Tabel Distribusi Frekuensi Relatif
Pada tabel distribusi frekuensi relatif, frekuensi
dinyatakan dalam % sehingga diperoleh :
kelas pertama (23-32) :
5 -------- x 100% = 8.3 % 60
Kelas ke dua (33-42) :
9 -------- x 100% = 15 %, dan seterusnya, sehingga menjadi :
60
NILAI UJIAN FREKUENSI (%)
23 - 32 8.3
33 - 42 15
43 - 52 16.7
53 - 62 20
63 - 72 18.3
73 - 82 13.3
83 - 92 8.3
Jumlah 100
Jika distribusi absolut dan relatif digabungkan menjadi
NILAI UJIAN Fabs. f rel.
23 - 32 5 8.3
33 - 42 9 15
43 - 52 10 16.7
53 - 62 12 20
63 - 72 11 18.3
73 - 82 8 13.3
83 - 92 5 8.3
Jumlah 60 100
C. Tabel Distribusi Frekuensi Kumulatif
1. Tabel Distribusi Frekuensi Kumulatif Kurang dari :
NILAI UJIAN Fkum.
Kurang dari 23 0
Kurang dari 33 5
Kurang dari 43 14
Kurang dari 53 24
Kurang dari 63 36
Kurang dari 73 47
Kurang dari 83 55
Kurang dari 93 60
Jika tabel distribusi kumulatif kurang dari dibuat dalam
bentuk diagram, akan dihasilkan Ogive positif.
2. Tabel Distribusi Frekuensi Kumulatif atau lebih :
NILAI UJIAN Fkum.
23 atau lebih 60
33 atau lebih 55
43 atau lebih 46
53 atau lebih 36
63 atau lebih 24
73 atau lebih 13
83 atau lebih 5
93 atau lebih 0
Jika tabel distribusi kumulatif atau lebih dibuat dalam
bentuk diagram, akan dihasilkan Ogive negatif.
Latihan:
Hasil tes pengetahuan tentang Management of change terhadap
30 mahasiswa adalah sebagai berikut:
65 67 81 76 44 53 68
67 65 42
59 60 63 72 79 64 60
71 54 51
71 69 65 76 77 51 89
87 66 69
Tugas 1. Buat tabel distribusi frekuensi (log 30 = 1,4771)
2. Buat histogram frekuensi
3. Buat tabel distribusi frekuensi relatif
4. Buat tabel distribusi kumulatif kurang dari
5. Buat tabel distribusi kumulatif atau lebih.
6. Buat ogive positif
7.Buat ogive negatif
IV. UKURAN PEMUSATAN
A. Rata-Rata Hitung
Rata-rata hitung data tanpa pengelompokan:
n
Xi i = 1 x1 + x2 + x3 + ... + xn Ẋ = ____________ = __________________ n n
dengan Ẋ = rata-rata hitung (untuk parameter disimbolkan
dengan ) dan n = banyaknya data
Contoh :
Indeks prestasi 5 orang mahasiswa adalah sbb: 2,7; 3,2; 3; 2,4
dan 2,1
Maka rata-rata indeks prestasi ke 5 mahasiswa tersebut adalah:
2,7+ 3,2+ 3+2,4+ 2,1 Ẋ = _________________ = 2,68 5
Rata-rata hitung data yang dikelompokkan (metode kodifikasi)
fi.ci
Ẋ = Y0 + p _______ dengan Y0 disebut TANDA KELAS
fi
Contoh tabel distribusi :
Nilai fi
31 – 40 2
41 – 50 4
51 – 60 10
61 – 70 15
71 – 80 6
81 - 90 3
Langkah menghitung rata-rata yaitu: tentukan nilai tengah
(Yi) masing-masing kelas interval, tentukan tanda kelas dan nilai
kodenya (Ci) sehingga tabelnya menjadi:
Nilai fi Yi Ci Fi.Ci
31 – 40 2 35.5 -3 -6
41 – 50 4 45.5 -2 -8
51 – 60 10 55.5 -1 -10
61 – 70 15 65.5 0 0
71 – 80 6 75.5 1 6
81 - 90 3 85.5 2 6
40 -12
Rata-rata hitung: - 12
Ẋ = 65.5 + 10 _____ = 62,5 40
B. Modus (Mo)
Nilai yang sering muncul
Modus data tidak dikelompokkan :
- Urutkan data dari yang terkecil hingga terbesar (optional)
- Tentukan nilai yang paling banyak muncul
- Nilai modus mungkin lebih dari satu.
- Contoh data yang sudah berurut: 5, 5, 6, 6, 6, 7, 7, 7, 7, 8,
8, 9, 9, 11 maka modus (Mo) data tersebut adalah 7.
Modus data dikelompokkan:
b1 Mo = b + p ( ______) b1 + b2 b = batas bawah kelas modus (kelas dengan frekuensi
terbesar)
p = panjang kelas interval
b1 = frekuensi kelas modus – frekuensi kelas interval
sebelum kelas modus
b2 = frekuensi kelas modus – frekuensi kelas interval setelah
kelas modus
Contoh tabel distribusi sbb:
Nilai fi
31 – 40 2
41 – 50 4
51 – 60 10
61 – 70 15
71 – 80 6
81 - 90 3
b = 60.5; p = 10; b1= 15 – 10 = 5 dan b2 = 15 – 6 = 9 maka 5
mo = 60.5 + 10 ( _______) = 61.6 5+9
C. MEDIAN (Me)
Suatu nilai yang apabila semua data hasil pengamatan
diurutkan maka 50% data hasil pengamatan berada di atas
dan di bawah nilai tersebut.
Median data tidak dikelompokkan:
Urutkan data, tentukan titik tengahnya ( jika data ganjil maka
median tepat pada satu data, jika data genap maka median
terletak antara dua data dan untuk menentukannya jumlahkan
kedua data tersebut dan bagi dua)
Contoh:
Diketahui data sbb:
5, 5, 6, 6, 6, 6, 6, 7, 7, 8, 8, 9, 9, 11 ( n= 14)
Titik tengah terletak antara data ke7 dan data ke 8 (angka 6
dan 7) maka:
6 + 7 Me = ______ = 6.5 2
Data : 5, 5, 6, 6, 6, 7, 7, 7, 7, 8, 8, 9, 9,11, 12 ( n = 15) median
terletak pada data ke 8 sehingga Me = 7
Median data dikelompokkan:
½ n - F Me = b + p ( ____________ ) f b = batas bawah kelas median
p = panjang kelas median
n = banyaknya data
F = jumlah seluruh frekuensi sebelum kelas median
f = frekuensi kelas median
Contoh tabel distribusi ( n = 40)
Nilai fi
31 – 40 2
41 – 50 4
51 – 60 10
61 – 70 15
71 – 80 6
81 - 90 3
Karena n = 40 maka kelas median terletak antara data ke 20
dan data ke 21 atau terletak pada kelas dengan interval 61 –
70, sehingga diperoleh komponen-komponen:
b = 60.5; p = 10; n = 40; F = 16 dan f = 15
( ½.40) -16 Me = 60.5 + 10 ( ___________ ) = 63.2 15
D. Kuartil (K)
Titik yang membagi sebaran nilai-nilai yang telah diurutkan
menjadi seperempatan.
Ada tiga kuartil yaitu K1, K2 dan K3
Kuartil data yang tidak dikelompokkan:
- Urutkan data
- Tentukan letak kuartil ke i dengan Ki = data ke i/4.(n+1)
- Tentukan nilai masing-masing kuartil
- Contoh data yang telah diurutkan sbb: 5, 5, 6, 6, 6, 7, 7, 7,
7, 8, 8, 9, 9, 11
Letak kuartil:
K1 = data ke 1/4 (14+1) = data ke 3 ¼
K2 = data ke 2/4 (14+1) = data ke 7 ½
K3 = data ke 3/4 (14+1) = data ke 11 ¼
Nilai Kuartil
K1 = data ke 3 + ¼ (data ke 4 – data ke 3)
= 6 + ¼ (6 – 6) = 6
K2 = 7 + ½ (7-7) = 7
K3 = 8 + ¼ (9 – 8) = 8 ¼
Kuartil data dikelompokkan :
- Tentukan posisi K1, K2 dan K3 seperti pada data yang tidak dikelompokkan
- Tentukan nilai masing-masing kuartil dengan rumus: in ---- - F 4 Ki = b + p ( ------------------ ) f
Ki = nilai kuartil ke i
b = batas bawah kelas Ki
p = panjang kelas Ki
F = jumlah kumulatif frekuensi sebelum kelas Ki
f = frekuensi kelas Ki
Contoh :
Nilai fi
31 – 40 2
41 – 50 4
51 – 60 10
61 – 70 15
71 – 80 6
81 - 90 3
Lokasi kuartil : K1 = data ke 1/4 (40+1)
= data ke 10 ¼
K2 = data ke 2/4 (40+1)
= data ke 20 ½
K3 = data ke 3/4 (40+1)
= data ke 30 ¾
Kelas kuartil K1 = kelas dengan interval 51 – 60
K2 = kelas dengan interval 61 – 70
K3 = kelas dengan interval 61 – 70
Nilai Kuartil ke-1( K1) ( b = 50.5, p = 10, F = 6, f = 10)
1.40 ------ - 6 4 K1 = 50.5 + 10 ( ------------------ ) 10 = 54.5 Nilai Kuartil ke-2 (K2) ( b = 60.5, p = 10, F = 16, f = 15)
2.40 ------ - 16 4 K1 = 60.5 + 10 ( ------------------ ) 15 = 63.2 Nilai Kuartil ke-3( K3) ( b = 60.5, p = 10, F = 16, f = 15)
3.40 ------ - 16 4 K1 = 60.5 + 10 ( ------------------ ) 15 = 69.8
E. Desil (D)
Titik yang membagi sebaran nilai-nilai yang telah diurutkan
menjadi sepersepuluhan.
Ada sembilan kuartil yaitu D1, D2, …D9
Desil data yang tidak dikelompokkan:
- Urutkan data
- Tentukan letak desil ke i dengan
Di = data ke i/10 (n+1)
- Tentukan nilai masing-masing kuartil
- Contoh data yang telah diurutkan sbb:
5, 5, 6, 6, 6, 7, 7, 7, 7, 8, 8, 9, 9, 11
Letak desil:
D1 = data ke 1/10 (14+1) = data ke 1 ½
D2 = data ke 2/10 (14+1) = data ke 3
D3 = data ke 3/10 (14+1) = data ke 4 ½
dan seterusnya …
Nilai Desil
D1 = data ke 1 + ½ (data ke 2 – data ke 1)
= 5 + ½ (5 – 5) = 5
D2 = 6
D3 = 6 + ½ (6 – 6) = 6
Desil data dikelompokkan :
Tentukan posisi D1, D2 dan D3
Tentukan nilai masing-masing desil dengan rumus: in ---- - F 10 Di = b + p ( ------------------ ) f
Ki = nilai Desil ke i
b = batas bawah kelas Di
p = panjang kelas Di
F = jumlah kumulatif frekuensi sebelum kelas Di
f = frekuensi kelas Di
Contoh :
Nilai fi
31 – 40 2
41 – 50 4
51 – 60 10
61 – 70 15
71 – 80 6
81 - 90 3
40
Lokasi desil : D1 = data ke 1/10 (40+1)
= data ke 4 1/10
D2 = data ke 2/10 (40+1)
= data ke 8 1/5
D3 = data ke 3/10 (40+1)
= data ke 12 3/10
dimanakah letak D4, D5, D6, D7, D8 dan D9?
Kelas desil D1 = kelas dengan interval 41 – 50
D2 = kelas dengan interval 51 – 60
D3 = kelas dengan interval 51 – 60
Nilai desil ke-1 ( b = 40.5, p = 10, F = 2, f = 4)
1.40 ------ - 2 10 D1 = 40.5 + 10 ( ------------------ ) 4 = 45.5 Nilai Desil ke 2 ( b = 50.5, p = 10, F = 6, f = 10)
2.40 ------ - 6 10 D2 = 50.5 + 10 ( ------------------ ) 10 = 52.5 Nilai Desil ke-3 ( b = 50.5, p = 10, F = 6, f = 10)
3.40 ------ - 6 10 D3 = 50.5 + 10 ( ------------------ ) 10 = 56.5
F. Persentil (P)
Titik yang membagi sebaran nilai-nilai yang telah diurutkan
menjadi seperseratusan.
Ada 99 persentil yaitu P1, P2, …P99
Kuartil data dikelompokkan :
Tentukan posisi P1, P2, …P99
Tentukan nilai masing-masing kuartil dengan rumus:
in ---- - F 100 Di = b + p ( ------------------ ) f Pi = nilai Persentil ke i
b = batas bawah kelas Pi
p = panjang kelas Pi
F = jumlah kumulatif frekuensi sebelum kelas Pi
f = frekuensi kelas Pi
Contoh :
Nilai fi
31 – 40 2
41 – 50 4
51 – 60 10
61 – 70 15
71 – 80 6
81 - 90 3
40
Lokasi persentil : P10 = data ke 1/100 .10 (40+1)
= data ke 4 1/10
Kelas kuartil P10 = kelas dengan interval 41 – 50
Nilai persentil ke-10 ( b = 40.5, p = 10, F = 2, f = 4)
10.40 ------ - 2 100 P10 = 40.5 + 10 ( ------------------ ) 4 = 45.5
Latihan:
Menggunakan tabel distribusi frekuensi tentang hasil tes tentang
Management of change pada latihan sebelumnya, hitunglah:
1. Rata-rata hasil tes
2. Modus
3. Median
4. Kuartil ke 1, 2 dan 3
5. Desil ke 6
6. Persentil ke 40
V. UKURAN PENYEBARAN
A. Rentang
Rentang=data terbesar – data terkecil
B. Rentang antar kuartil (RAK)
RAK= K3 – K1
C. Simpangan Kuartil
Simpangan kuartil: ½ (K3 - K1)
D. Rata-Rata Simpanga
Jumlah semua jarak antara tiap data dengan rata-rata
dibagi banyaknya data
xi – x RS = ___________ n Contoh: 4, 5, 7, 8, 8, 10 ( n = 6 dan x = 7)
4 – 7 + 5 – 7 + ... 10 – 7 maka RS = __________________________ = 1.67 6 E. Ragam (s2 atau 2) disebut juga Kuadrat Tengah
akar kuadrat dari ragam disebut Simpangan baku
Ragam Data Tidak dikelompokkan:
JK = ( xi – x)2 .......................................... Jumlah kuadrat
(JK) s2 = ________
n-1 ............................................. Derajat bebas (DB)
Langkah-langkah:
hitung x
hitung selisih antara x1 – x, x2 –x dst.
hitung kuadrat selisih-selisih di atas
jumlahkan seluruh kuadrat-kuadrat tersebut
bagilah dengan n-1
Ragam data dikelompokkan:
n. fi.ci2 – ( fi.ci)2
s2 = p2 ( _________________)
n. (n-1)
p = panjang kelas interval
fi = frekuensi kelas ke i
ci = nilai tanda (kelas dengan fi terbesar diberi nilai tanda 0)
Struktur data:
Nilai fi ci ci2 fi.ci fi.ci2
fi= n fi.ci fi.ci2
Ragam Gabungan
Jika beberapa kelompok data masing masing mempunyai
nilai ragam, maka ragam gabungan seluruh kelompok data
tersebut adalah:
(ni-1).si2 s2 = __________
ni-k
Jika ada 3 kelompok data maka:
(n1-1).s12 + (n2-1).s2
2 + (n3-1).s32
s2 = ___________________________ (n1 + n2 + n3 ) -3
Latihan:
Menggunakan tabel distribusi frekuensi tentang hasil tes tentang
Management of change pada latihan sebelumnya, hitunglah:
1. rentang
2. rentang antar kuartil
3. simpangan kuartil
4. ragam
5. simpangan baku
VI. MODEL DISTRIBUSI DATA
A. Ukuran Kemiringan (Skewness)
Ukuran kemiringan adalah ukuran yang menyatakan
sebuah model distribusi yang mempunyai kemiringan tertentu.
Dengan mengetahui koefisien kemiringan dapat ditentukan
suatu distribusi data memiliki bentuk kurva yang tergolong positif,
simetrik atau negatif seperti gambar beriku:
1. Koefisien kemiringan pertama dari Pearson
X - Mo Koefisien kemiringan = ______ s dengan: X = rata-rata, Mo = modus dan s = Simpangan baku
2. Koefisien kemiringan kedua dari Pearson
3 (X – Me)
Koefisien kemiringan = _________
s
dengan: X = rata-rata, Me = median dan s = Simpangan baku
3. Koefisien kemiringan dengan menggunakan nilai kuartil
K3 – 2K2 + K1 Koefisien kemiringan = __________ K3 – K1
Dengan K1 = kuartil ke-1, K2 = kuartil ke-2 dan K3 = kuartil
ke-3
4. Koefisien kemiringan dengan menggunakan nilai
Persentil
P90 – 2P50 + P10
Koefisien kemiringan = _____________
P90 – P10
Dengan P90 = persentil ke-90, P50 = persentil ke-50 dan P10 =
Persentil ke 10
Kriteria:
1. Jika koefisien kemiringan kurang dari nol maka bentuk
distribusinya negatif
2. Jika koefisien kemiringan sama dengan nol maka bentuk
distribusinya simetrik
3. Jika koefisien kemiringan lebih dari nol maka bentuk
distribusinya positif
Selain dengan menghitung koefisien kemiringan, bentuk
distribusi juga dapat ditentukan dengan membandingkan nilai-nilai
modus (Mo), median (Me) dan rata-rata (X).
kriteria:
1. Distribusi simetrik jika Mo=Me=X
2. Distribusi positif jika Mo<Me<X
3. Distribusi negatif jika Mo>Me>X
B. Ukuran Keruncingan (Kurtosis)
Kurtosis adalah derajat kepuncakan dari suatu distribusi.
Suatu distribusi yang relatif tinggi dinamakan leptokurtik, jika
puncaknya datar disebut platikurtik dan jika puncaknya tidak
terlalu tinggi atau terlalu datar disebut mesokurtik.
Untuk mengetahui keruncingan kurva dapat ditentukan
dengan menghitung koefisien kurtosis:
½ (K3-K1) K = ________ P90 – P10
dengan K3= kuartil ke-3, K1= kuartil ke-1, P90 = persentil ke-90
dan P10 = persentil ke-10
Kriteria:
1. Jika koefisien kurtosis kurang dari 0,263 bentuk distribusi:
platikurtik
2. Jika koefisien kurtosis sama dengan 0,263 bentuk distribusi:
mesokurtik
3. Jika koefisien kurtosis lebih dari 0,263 bentuk distribusi:
leptokurtik
Latihan:
Menggunakan tabel distribusi frekuensi hasil tes tentang
Management of change pada latihan sebelumnya, tentukan model
distribusi berdasarkan koefisien kemiringan dan koefisien
keruncingan.
VII. PROBABILITAS
A. Arti Probabilitas
1. Probabilitas adalah suatu nilai yang digunakan untuk
mengukur tingkat terjadinya suatu kejadian yang acak.
2. Probabilitas atau peluang merupakan ukuran numeric
tentang seberapa sering peristiwa itu akan terjadi. Semakin
besar nilai probabilitas menyatakan bahwa peristiwa itu akan
sering terjadi.
3. Kejadian Acak atau random event ialah suatu kejadian yang
tak dapat ditentukan dengan pasti sebelumnya.
4. Probabilitas merupakan suatu frekuensi relatif dari suatu
sukses yang diperoleh jika suatu percobaan dilakukan
berulang-ulang sampai tak terbatas didalam situasi dan
kondisi yang sama.
Nilai Probabilitas berkisar antara 0 dan 1.
Bila kejadian A terjadi dalam m cara pada ruang sampel S yang
terjadi dalam n cara, maka probabilitas kejadian A adalah :
P (A) = n(A)/n(S) = m/n
Perumusan ini harus memenuhi ketentuan :
Probabilitas A harus merupakan bilangan non-negatif atau
bukan bernilai negatif, yaitu : P (A) 0 .
Nilai probabilitas suatu peristiwa berkisar antara :
0 P (A) 1
Jumlah probabilitas A ditambah A (bukan A) harus sama
dengan 1.
Atau : P (A) + P (A) = 1 P (A) = 1 – P (A)
Contoh :
Sebuah dadu yang seimbang memiliki enam sisi. Lima dari
keenam sisi tersebut dicat biru sedangkan satu sisi selebihnya
dicat hijau.bila dadu tersebut dilempar sebanyak satu kali,
berapa :
a. Probabilitas timbulnya sisi yang bercat biru
b. Probabilitas timbulnya sisi yang bercat hijau
Jawab : a. P (Biru) = 5/6
b. P (Hijau) = 1/6
Dalam mempelajari probabilitas, ada 3 kata kunci :
1. Eksperimen
Proses pengumpulan data dari sebuah fenomena yang
memperlihatkan variasi pada hasilnya.
2. Ruang sampel
Kumpulan dari seluruh kemungkinan hasil yang didapatkan
dari suatu eksperimen, dilambangkan dengan S.
3. Peristiwa/Event/Kejadian
Kumpulan hasil-hasil dasar yang digolongkan oleh suatu ciri
tertentu.
B. Peristiwa (event) dan Notasi Himpunan
1) Ruang sampel
Kumpulan (himpunan) dari semua hasil yang
mungkin muncul atau terjadi pada suatu percobaan.
Keseluruhan dari titik sampel dinamakan Ruang sampel
dan dilambangkan dengan S.
Contoh : S = { 1,2,3,4,5,6} ruang vektor
Kejadian yang dapat terjadi di dalam suatu eksperimen
(percobaan) dan biasanya dilakukan berulang kali
dinamakan Titik Sampel. A = { 2 }
2) Peristiwa/kejadian (event)
Kumpulan (himpunan) dari hasil yang muncul atau
terjadi pada suatu percobaan statistik.
Peristiwa A atau B dinotasikan dengan A B
Peristiwa A dan B dinotasikan dengan A B
Peristiwa A dan B merupakan peristiwa yang saling lepas,
A B = 0
Peristiwa A bagian B dinotasikan dengan A B
N
nAp )(
13/7)( CBP
C. Probabilitas Suatu Peristiwa
Probabilitas memberikan nilai kuantitatif pada peryataan
seberapa sering suatu peristiwa terjadi.
Probabilitas peristiwa A :
Beberapa sifat :
a. P(A)=1-P(A‟)
b. 0<=P(A)<=1
c. P(S)=P(A)+P(A‟)
Contoh :
Suatu kemasan berisi 6 Flash Disk A, 4 Flash Disk B dan 3 Flash
Disk C. Bila seseorang mengambil satu Flash Disk secara acak,
maka :
– Peluang terambil satu Flash DIsk A, karena 6 dari 13 disket
adalah Flash A, maka peluang peristiwa A, satu Flash A
terpilih secara acak adalah : P(A)=6/13
– Peluang terambil satu disket B (peristiwa B) atau disket
C(peristiwa C) karena terdapat 7 dari 13 disket adalah disket
B atau disket C maka :
Peristiwa yang saling lepas (Mutually Exclusive)
Bila A dan B dua kejadian sembarang pada S dan berlaku
A B =Ø, maka A dan B dikatakan dua kejadian saling lepas
atau saling terpisah. Secara matematis dua himpunan A dan B
dikatakan saling lepas atau terpisah (disjoint) jika dan hanya jika
mereka tidak memiliki unsur yang sama dan A B = 0
(himpunan kosong).
Bila A dan B saling lepas dan merupakan peristiwa
dalam sebuah ruang sampel yang terbatas , maka :
P (A B) = P (A) + P (B)
5/4)( BAP
Dimana : A B = 0 dan P (A B) = 0.
Contoh :
Bila sebuah dadu dilempar sekali , berapakah probabilitas
timbulnya mata dadu 1 atau 3 ?
Jawab : Jika A = peristiwa timbulnya mata dadu 1
B = peristiwa timbulnya mata dadu 3
P(A) = 1/6 dan P(B) = 1/6
A dan B merupakan dua peristiwa yang saling lepas.
P (A B) = P (A) + P (B) = 1/6 + 1/6 = 2/6 = 1/3
Dua peristiwa dikatakan tidak saling lepas bila kedua peristiwa
tersebut tidak usah terpisah.
Peristiwa tidak saling lepas / kejadian majemuk
Bila A dan B peristiwa sembarang pada ruang sampel S,
maka gabungan kejadian A dan B ditulis A B adalah kumpulan
semua titik sampel yang ada pada A atau B atau pada kedua-
duanya. Kejadian A B disebut kejadian majemuk, dan A B
yaitu kumpulan titik sampel yang ada pada A dan B disebut
kejadian majemuk.
P (A B) = P (A) + P (B) – P (A B)
Contoh :
Peluang seorang murid SD yang lulus mata pelajaran
matematika adalah 2/3 dari peluang ia lulus mata pelajaran
bahasa Indonesia adalah 4/9. Bila sekurang – kurangnya
satumata pelajaran diatas adalah 4/5, berapa peluang ia lulus
kedua mata pelajaran tersebut !
Jawab : P(A) = 2/3; P(B) =4/9;
P (A B) = P (A) + P (B) – P (A B)
13/452/1652/152/1352/4)()()()( BAPBPAPBAP
12,0)4,0)(3,0()().()( BPAPBAP
52/1)( BAP
= 2/3 + 4/9 – 4/5
= 14/45
Peristiwa yang saling bebas (independen)
Dua peristiwa dikatakan independen jika dan hanya jika
terjadi atau tidak terjadinya peristiwa pertama tidak
mempengaruhi peristiwa kedua.
Dua kejadian A dan B dalam ruang sampel S dikatakan
saling bebas jika kejadian A tidak mempengaruhi kejadian B dan
sebaliknya kejadian B tidak mempengaruhi kejadian A. Jika A
dan B merupakan dua kejadian saling bebas, maka berlaku
rumus :
P (A B ) = P (A) . P (B)
Contoh :
1) Kita ambil satu kartu secara acak dari satu set kartu bridge
yang lengkap. Bila A = kejadian terpilihnya kartu as dan B =
kejadian terpilihnya kartu wajik, Hitung peluang !
Jawab: P(A) = 4 /52; P(B) = 13/52; maka
2) Jika diketahui dua kejadian A dan B saling bebas dengan
P(A)= 0,3 dan P(B)= 0,4 maka berlaku:
D. Probabilitas bersyarat
Probabilitas suatu peristiwa A seringkali harus
dimodifikasikan bila ada informasi bahwa terdapat peristiwa b
yang berkaitan dengan peristiwa a tersebut telah terjadi
sebelumnya. Perubahan nilai probabilitas peristiwa A bila
diketahui bahwa peristiwa b telah terjadi disebut sebagai
0)(;)(
)()/(
BbilaP
BP
BAPBAP
)/().()( BAPBPBAP
)....|()....|()|()()....( 121213121321 kkk AAAAPAAAPAAPAPAAAAP
)()()( BPAPBAp
)().....().()....( 21321 kk APAPAPAAAAP
probabilitas bersyarat a bila diketahui b terjadi dan dinotasikan
dengan P(A|B).
Probabilitas terjadinya kejadian A dengan syarat bahwa B
sudah terjadi atau akan terjadi disebut Probabilitas bersyarat
(conditional probability).
Rumus Probabilitas bersyarat
Rumus diatas dapat ditulis kembali sebagai :
dan dinyatakan sebagai aturan perkalian, bila terdapat tiga
peristiwa A,B, dan C
maka sesuai dengan aturan perkalian didapatkan:
Apabila terdapat suatu kondisi dimana probabilitas P(A/B)
menjadi bernilai sama dengan P(A), maka dalam hal ini peristiwa
B tidak mempunyai pengaruh terhadap terjadinya peristiwa A,
sehingga :
P(B/A)=P(B)
atau
P(A/B)=P(A)
Kondisi ini dinamakan sebagai peristiwa yang saling
bebas(independent) antara A dan B,Sesuai dengan aturan
perkalian maka kondisi saling bebas tersebut :
Dengan demikian, bila terdapat peristiwa A1, A2,.....,Ak yang
saling bebas maka:
Contoh :
1) Misalkan ruang sampel menyatakan populasi media
penyimpanan data (disket dan CD) pada suatu kantor
tertentu.Media penyimpan data tersebut dikelompokan menurut
kondisinya: Diadakan audit untuk mengetahui kondidi media
penyimpanan data dikantor tsb. Dengan cara mengambil sampel
secara acak pada kotak media penyimpanan.Bila media yang
terpilih ternyata mempunyai kondisi baik, berapakah peluang
yang terpilih itu media CD ?
Jawab : Bila M=CD yang terpilih
E=Kondisi media yang terpilih baik :
2) Dalam sebuah kotak terdapat 10 gulungan film, dan diketahui
bahwa 3 diantaranya rusak. Hitung peluang bila 2 buah gulungan
filem diambil acak satu persatu secara beruutan.
Jawab: Misal A: peristiwa terambil gulungan pertama eusak
B: peristiwa terambil gulungan kedua rusak
Maka peluang kedua gulungan rusak adalah :
VII. PERMUTASI
Dalam beberapa macam cara suatu peristiwa dapat terjadi ?
Dalam berapa macam cara suatu pemilihan terhadap sebagian dari
keseluruhan obyek dapat dilakukan? Pertanyaan sedemikian itu
acapkali timbul dalam persoalan tentang cara menghitung berbagai
kemungkinan memilih sampel dari suatu populasi tertentu. Pada
asasnya, persoalan diatas sama dengan persoalan mencari jumlah
cara menyusun atau mengatur suatu himpunan obyek tertentu.
A. Permutasi
Masalah penyusunan kepanitiaan yang terdiri dari Ketua,
Sekretaris dan Bendahara dimana urutan dipertimbangkan
merupakan salah satu contoh permutasi. Jika terdapat 3 orang
(misalnya Amir, Budi dan Cindy) yang akan dipilih untuk
menduduki posisi tersebut, maka dengan menggunakan Prinsip
Perkalian kita dapat menentukan banyaknya susunan panitia
yang mungkin, yaitu:
Pertama menentukan Ketua, yang dapat dilakukan dalam 3
cara.
Begitu Ketua ditentukan, Sekretaris dapat ditentukan dalam 2
cara.
Setelah Ketua dan Sekretaris ditentukan, Bendahara dapat
ditentukan dalam 1 cara.
Sehingga banyaknya susunan panitia yang mungkin adalah
3:2:1 =6. Secara formal, permutasi dapat didevinisikan
sebagai berikut.
Definisi 1.1
Permutasi dari n unsur yang berbeda adalah
pengurutan dari n unsur tersebut.
Contoh 1.1
Tentukan permutasi dari 3 huruf yang berbeda, misalnya ABC !
Permutasi dari huruf ABC adalah ABC, ACB, BAC, BCA, CAB, CBA.
Sehingga terdapat 6 permutasi dari huruf ABC.
Teorema 1.1
Terdapat n! permutasi dari n unsur yang berbeda. Bukti. Asumsikan
bahwa permutasi dari n unsur yang berbeda merupakan aktitas yang
terdiri dari n langkah yang berurutan. Langkah pertama adalah
memilih unsur pertama yang bisa dilakukan dengan n cara. Langkah
kedua adalah memilih unsur kedua yang bisa dilakukan dengan n 1
cara karena unsur pertama sudah terpilih. Lanjutkan langkah tersebut
sampai pada langkah ke-n yang bisa dilakukan dengan 1 cara.
Berdasarkan Prinsip Perkalian, terdapat permutasi dari n unsur yang
berbeda.
Contoh 1.2
Berapa banyak permutasi dari huruf ABC ?
Terdapat 3.2.1 = 6 permutasi dari huruf ABC.
Contoh 1.3
Berapa banyak permutasi dari huruf ABCDEF jika subuntai ABC
harus selalu muncul bersama?
Karena subuntai ABC harus selalu muncul bersama, maka subuntai
ABC bisa dinyatakan sebagai satu unsur. Dengan demikian terdapat
4 unsur yang dipermutasikan, sehingga banyaknya permutasi adalah
4.3.2.1 = 24.
Denisi 1.2
Permutasi-r dari n unsur yang berbeda adalah
pengurutan dari sub-himpunan dengan r anggota dari himpunan
. Banyaknya permutasi-r dari n unsur yang berbeda
dinotasikan dengan P(n; r).
Contoh 1.4
Tentukan permutasi-3 dari 5 huruf yang berbeda, misalnya ABCDE.
Permutasi-3 dari huruf ABCDE adalah :
Sehingga banyaknya permutasi-3 dari 5 huruf ABCDE adalah 60.
Teorema 1.2
Banyaknya permutasi-r dari n unsur yang berbeda adalah
Bukti.
Asumsikan bahwa permutasi- dari unsur yang berbeda
merupakan aktitas yang terdiri dari langkah yang berurutan.
Langkah pertama adalah memilih unsur pertama yang bisa dilakukan
dengan n cara. Langkah kedua adalah memilih unsur kedua yang
bisa dilakukan dengan cara karena unsur pertama sudah
terpilih. Lanjutkan langkah tersebut sampai pada langkah ke-r yang
bisa dilakukan dengan cara. Berdasarkan Prinsip
Perkalian, diperoleh
Contoh 1.5
Gunakan Teorema 3.2 untuk menentukan permutasi-3 dari 5 huruf
yang berbeda, misalnya ABCDE.
Karena r = 3 dan n = 5 maka permutasi-3 dari 5 huruf ABCDE adalah
Jadi banyaknya permutasi-3 dari 5 huruf ABCDE adalah 60
B. Permutasi dari n obyek yang berbeda tanpa
pemulihan obyek yang terpilih
1. Permutasi dari n obyek seluruhnya
DEFINISI 5.3.1. :
Bila n menyatakan bilangan bulat positif, maka hasil penggandaan
bilangan tersebut dari 1 sampai dengan n dinamakan n faktorial
dan diberi tanda n!.
Penjelasan :
Jika n = 1, 2, . . . , maka n! = n (n-1) (n-2) . . . 2. 1
= n (n-1)! Dan (n+1)! = (n+1)n!
2. Permutasi sebanyak r dari n obyek
DEFINISI : Pengaturan atau penyusunan sebanyak r obyek yang
diambil dari suatu himpunan yang terdiri dari n obyek yang
berbeda secara matematis dinamakan permutasi secara sekaligus
sebanyak r dari n obyek yang berbeda dimana rPn. secara
simbolis, permutasi sedemikian itu dinyatakan sebagain P.
Contoh :
Jika kita gunakan perumusan nPr = n!
(n-r)!
untuk menghitung jumlah permutasi 2 huruf yang diambil dari
kata “laut” dalam contoh 5.3.1. maka akan diperoleh hasil :
nPr = 4P2 = 4! = 12
(4-2)!
3. Permutasi keliling (circular permutation)
Permutasi suatu himpunan obyek yang membuat suatu
lingkaran dinamakan Permutasi keliling. Bila suatu himpunan
obyek disusun secara teratur dalam sebuah lingkaran, permutasi
obyek yang bersangkutan sebetulnya mempersoalkan
kedudukan relatif obyek - obyek diatas bila melintasi
lingkaran dalam arti yang tertentu.
4. Permutasi sebanyak r dari n obyek dengan pemulihan
obyek yang terpilih
TEOREMA .4.1. Permutasi sebanyak r dari n obyek dengan
pemulihan obyek yang terpilih. Jumlah permutasi dari suatu
himpunan yang terdiri dari n obyek dan yang diambil sekaligus
sebanyak r dengan pemulihan obyek yang telah terpilih ialah : nPr
= n*r
dengan ketentuan r dan n merupakan bilangan bulat positif.
5. Permutasi sebanyak r dari n obyek yang tidak
seluruhnya dapat dibedakan
Secara intuitif, jumlah permutasi dari obyek yang dapat
dibedakan tentunya lebih banyak daripada jumlah permutasi
dimana terdapat beberapa kumpulan obyek yang sama. Hal
sedemikian mudah sekali dimengerti. Kumpulan {a, a, a} terdiri
dari 3 unsur yang tidak dapat dibedakan dan hanya dapat
dipermutasikan dalam satu cara saja. Jika kita bedakan unsur
himpunan diatas menjadi {a1, a2, a3} , jumlah permutasi
himpunan {a1, a2, a3} akan menjadi :
nP n = n! = 3! = 6
VIII. KOMBINASI
Kombinasi adalah susunan unsur-unsur dengan tidak
memperhatikan urutannya. Pada kombinasi AB = BA. Dari suatu
himpunan dengan n unsur dapat disusun himpunan bagiannya
dengan untuk Setiap himpunan bagian dengan k unsur dari
himpunan dengan unsur n disebut kombinasi k unsur dari n yang
dilambangkan dengan,
Contoh :
Diketahui himpunan .
Tentukan banyak himpunan bagian dari himpunan A yang memiliki 2
unsur!
Jawab :
Banyak himpunan bagian dari A yang memiliki 2 unsur adalah C (6,
2).
Cara cepat mengerjakan soal kombinasi
dengan penulisan nCk, hitung 10C4 kita langsung tulis 4 angka dari 10
mundur lalu dibagi 4!, yaitu 10.9.8.7 dibagi 4.3.2.1 jadi 10C4 =
10x9x8x7 / 4x3x2x1 berapa itu?
jika ditanya 10C6 maka sama dengan 10C4, ingat 10C6=10C4.
Contoh lainnya
20C5=20C15
3C2=3C1
100C97=100C3
melihat polanya!
Kombinasi r obyek yang dipilih dari n obyek adalah susunan r obyek
tanpa memperhatikan urutan/posisi
Misalkan: Kombinasi 3 dari 3 obyek A, B dan C adalah:
ABC = ACB = BAC = BCA = CAB = CBA ( Hanya
terdapat 1 kombinasi)
Dalil-1 Kombinasi : Kombinasi r dari n obyek adalah
Cn
r n rr
n
!
!( )!
Contoh :
Dari 40 nomor rekening akan diundi untuk memenangkan 3
hadiah yang sama. Berapa banyaknya susunan pemenang yang
mungkin terbentuk?
C3
4040!
3 40 3
40!
3 37
40 39 38 37
3 37
! ( )! ! !
!
! != 9880
Jika anda hanya mempunyai 1 rekening, maka peluang anda menjadi
salah satu pemenang adalah: P(Menang) = 9880
1
Kaidah Perkalian & Kombinasi
Dalam banyak soal, kaidah penggandaan/perkalian dan
kombinasi seringkali digunakan bersama-sama.
Contoh :
Manajer SDM mengajukan 10 calon manajer yang
berkualifikasi sama, 5 calon berasal dari Kantor Pusat, 3 calon dari
Kantor cabang dan 2 dari Program Pelatihan manajer.
(a) Berapa cara Manajer SDM dapat memilih 6 manajer baru dengan
ketentuan 3 berasal dari Kantor Pusat. 2 dari Kantor Cabang dan
1 dari Program Pelatihan manajer?
Pemilihan 3 dari 5 calon dari Kantor Pusat = C3
55
3 210
!
! !
Pemilihan 2 dari 3 calon dari Kantor Cabang = C2
33
2 13
!
! !
Pemilihan 1 dari 2 calon dari Program Pelatihan= C1
22
1 12
!
! !
n = Pemilihan Manajer = 10 3 2 = 60 cara
(b) Berapa cara memilih 6 dari 10 kandidat manajer?
N = Pemilihan 6 dari 10 kandidat manajer = 6
10 10!
6!4210C
!
(c) Berapa peluang 6 manajer baru tersebut terdiri dari 3 dari Kantor
Pusat, 2 dari Kantor Cabang dan 1 dari Program Pelatihan?
P(manajer) = n
N
60
210
Kombinasi adalah suatu pengacakan dari objek-objek dengan
tidak memperhatikan urutan.
Banyaknya kombinasi r unsur dari himpunan dengan n
unsur dinotasikan dengan rnC , atau
rn
. Perhatikan
bahwa jika nr , definisikan 0, rnC . Jika 0n dan r
bilangan bulat positif, maka rC ,0 . Hal tersebut akan
berakibat bahwa 100
0,0
C . Fakta berikutnya adalah
untuk bilangan bulat tidak negatif n berlaku 10, nC ,
nnC 1, dan 1, nnC
Untuk nr , rnCrrnP ,!,
Akibatnya, !!
!,
rnr
n
rn
rnC
Kombinasi
Berbeda dengan permutasi yang urutan menjadi
pertimbangan, pada kombinasi urutan tidak dipertimbangkan.
Misalnya pemilihan 3 orang untuk mewakili kelompak 5 orang
(misalnya Dedi, Eka, Feri, Gani dan Hari) dalam mengikuti
suatu kegiatan. Dalam masalah ini, urutan tidak
dipertimbangkan karena tidak ada bedanya antara Dedi, Eka
dan Feri dengan Eka, Dedi dan Feri. Dengan mendata semua
kemungkinan 3 orang yang akan dipilih dari 5 orang yang ada,
diperoleh:
Sehingga terdapat 10 cara untuk memilih 3 orang dari 5 orang
yang ada.
Selanjutnya kita dapat mendefinisikan kombinasi secara formal
seperti di bawah ini.
Definisi
Kombinasi-r dari n unsur yang berbeda adalah seleksi tak
terurut r anggota dari himpunan { (sub-himpunan dengan r unsur).
Banyaknya kombinasi-r dari n unsur yang berbeda dinotasikan
dengan C(n,r) atau (n,r ).
Contoh 3.6
Tentukan kombinasi-3 dari 5 huruf yang berbeda, misalnya
ABCDE. Kombinasi-3 dari huruf ABCDE adalah:
ABC ABD ABE ACD ACE
ADE BCD BCE BDE CDE
Sehingga banyaknya kombinasi-3 dari 5 huruf ABCDE adalah 10.
Teorema
Banyaknya kombinasi-r dari n unsur yang berbeda adalah
C(n, r) = !)!.(
!
rrn
n
Bukti.
Pembuktian dilakukan dengan menghitung permutasi dari n unsur
yang berbeda dengan cara berikut ini.
Langkah pertama adalah menghitung kombinasi-r dari n, yaitu
C(n; r).
Langkah kedua adalah mengurutkan r unsur tersebut, yaitu r!.
Dengan demikian, seperti yang diinginkan.
P(n,r) = C(n, r).r!
C(n,r) = !
),(
r
rnP
= !
)!/(!
r
rnn
= !)!.(
!
rrn
n
Contoh 3.7
Gunakan Teorema 3.3 untuk menentukan kombinasi-3 dari 5 huruf
yang berbeda, misalnya ABCDE.
Karena r = 3 dan n = 5 maka kombinasi-3 dari 5 huruf ABCDE adalah
C(5,3) = !3)!.35(
!5
=
!3!.2
!5=
2
4.5= 5.2 = 10
Jadi banyaknya kombinasi-3 dari 5 huruf ABCDE adalah 10.
Contoh 3.8
Berapa banyak cara sebuah panitia yang terdiri dari 4 orang bisa
dipilih dari 6 orang. Karena panitia yang terdiri dari 4 orang
merupakan susunan yang tidak terurut, maka masalah ini merupakan
kombinasi-4 dari 6 unsur yang tersedia. Sehingga dengan
mengunakan Teorema 3.3 dimana n = 6 dan r = 4 diperoleh:
C(6,4) = !4)!.46(
!6
=
!4!.2
!6=
2
5.6= 3:5 = 15
Jadi terdapat 15 cara untuk membentuk sebuah panitia yang terdiri
dari 4 orang bisa dipilih dari 6 orang.
Contoh 3.9
Berapa banyak cara sebuah panitia yang terdiri dari 2 mahasiswa
dan 3 ma-hasiswi yang bisa dipilih dari 5 mahasiswa dan 6
mahasiswi?
Pertama, memilih 2 mahasiswa dari 5 mahasiswa yang ada, yaitu:
C(5,2) =!2)!.25(
!5
=
!2!.3
!5=
2
4.5= 5.2 = 10
Kedua, memilih 3 mahasiswi dari 6 mahasiswi yang ada, yaitu:
C(6,3) =!3)!.36(
!6
=
!3!.3
!6=
2.3
4.5.6= 5.4 = 20
Sehingga terdapat 10:20 = 200 cara untuk membentuk sebuah
panitia yang terdiri dari 2 mahasiswa dan 3 mahasiswi yang bisa
dipilih dari 5 mahasiswa dan 6 mahasiswi?
Generalisasi Kombinasi
Generalisasi kombinasi merupakan perluasan dari kombinasi
yang membolehkan pengulangan suatu unsur. Misalnya kita
ingin memilih 4 kelereng dari sebuah kantong yang berisi
paling sedikitnya 4 kelereng dari masing-masing warna yaitu
merah, biru dan kuning. Kemungkinan terpilihnya 4 kelereng
tersebut adalah
Sehingga terdapat 15 kemungkinan terpilihnya 4 kelereng
tersebut.
Permasalahan di atas dapat kita nyatakan sebagai seleksi dari
4+3-1 simbol yang terdiri dari 4 simbol o sebagai kelereng dan 3 1
simbol k sebagai pemisah kelereng yang berbeda warna. Selanjutnya
kita menentukan posisi dari simbol-simbol tersebut, yaitu:
Dari seleksi diperoleh 15 kemungkinan pengaturan simbol-
simbol tersebut.Secara umum permasalahan diatas dapat disajikan
dalam teorema berikut ini.
Teorema 3.5
Jika X merupakan sebuah himpunan yang mempunyai t unsur
dimana pegulangan diperbolehkan, maka banyaknya seleksi k unsur
tak terurut dari X adalah
Bukti.
Misalkan . Asumsikan bahwa terdapat k +t
- 1 slot yang akan diisi oleh k+t - 1 simbol yang terdiri dari k simbol o
dan t - 1 simbol .Penempatan simbol-simbol pada slot tertentu
merupakan representasi dari proses seleksi. Bilangan dari simbol
o hingga simbol yang pertama merepresentasikan seleksi dari ;
bilangan dari simbol o dari simbol yang pertama hingga simbol
yang kedua merepresentasikan seleksi dari ; dan seterusnya
sampai seleksi dari .Karena terdapat C(k + t – 1, t - 1) cara untuk
menentukan posisi simbol , maka juga terdapat C(k +t - 1, t - 1)
seleksi. Hal ini juga sama dengan C(k + t – 1, k) cara untuk
menentukan posisi simbol o. Sehingga terdapat
C(k + t 1; t 1) = C(k + t 1; k)
seleksi k-unsur tak terurut dari X dimana pengulangan diperbolehkan.
Contoh 3.11
Gunakan Teorema 3.5 untuk menentukan banyaknya cara
memilih 4 kelereng dari sebuah kantong yang berisi paling sedikitnya
4 kelereng dari masing-masing warna yaitu merah, biru dan kuning.
Karena ada 3 warna kelereng dan 4 kelereng akan dipilih, maka t = 3
dan k = 4. Sehingga banyaknya cara pemilihan 4 kelereng adalah:
Contoh 3.12
Berapa banyak solusi bilangan bulat tak negatif dari persamaan
Setiap solusi dari persamaan tersebut ekuivalen dengan pemilihan 10
butir dari jenis . Sehingga banyaknya seleksi adalah
C(10 + 2 – 1, 2 - 1) = C(11, 1) = 11
LATIHAN SOAL
A. Probabilitas
1. Dua buah dadu dilempar sekaligus sebanyak sekali. Hitunglah
peluang muncul mata dadu berjumlah 10 atau 7 !
2. Sebuah kotak berisi 4 bola merah, 6 bola putih,7 bola hijau, 3
bola biru. Semua bola sama bentuk,besar dan bobotnya.
Apabila sebuah bola diambil secara random, berapa
probabilitasnya bahwa :
a. bola itu merah b. bola itu hijau
B. Permutasi
1. Suatu Organisasi akan memilih ketua, wakil ketua, sekretaris,
bendahara & humas. Jika ketua & wakil ketua dipilih dari 5
orang, sedangkan sekretaris, bendahara & humas dipilih dari
7 orang yang lain. Maka banyak cara menyusun pengurus
organisasi tersebut adalah?
C. Kombinasi
1. Ada 8 siswa baru yang belum saling mengenal satu sama
lain. Apabila mereka ingin berkenalan dengan berjabat
tangan, maka jabatan tangan yang akan terjadi sebanyak??
2. Suatu perkumpulan terdiri dari 7 orang pria & 5 orang wanita
akan mengirimkan utusan untuk mengikuti rapat yang hanya
terdiri dari 3 orang pria & 2 orang wanita. Bnyaknya susunan
utusan tersebut adalah..?
IX. POPULASI DAN SAMPEL
A. PENGERTIAN POPULASI DAN SAMPEL
1. Populasi (universe) adalah totalitas dari semua objek atau
individu yang memiliki karakteristik tertentu, jelas, dan lengkap
yang akan diteliti (bahan penelitian). Objek atau nilai disebut
unit analisis atau elemen populasi. Unit analisis dapat berupa
orang, perusahaan, hasil produksi, rumah tangga, dan tanah
pertanian.
2. Sampel adalah bagian dari populasi yang diambil melalui
cara-cara tertentu yang juga memiliki karakteristik tertentu,
jelas, dan lengkap yang dianggap bisa memiliki populasi.
Objek atau nilai yang akan diteliti dalam sampel disebut unit
sampel. Unit sampel mungkin sama dengan unit analisis,
tetapi mungkin juga tidak.
3. Parameter dan statistik adalah besaran yang berupa data
ringkasan atau angka ringkasan yang menunjukan suatu ciri
dari populasi data sampel. Parameter dan statistik merupakan
hasil hitungan nilai dari semua unit di dalam populasi dan
sampel yang bersangkutan.
B. CARA PENGUMPULAN DATA
Cara pengumpulan data ada 2, yaitu:
1. Sensus : cara pengumpulan data yang mengambil setiap
elemen populasi atau karakteristik yang ada dalam populasi.
2. Sampling : cara pengumpulan data hanya mengambil
sebagian elemen populasi atau karakteristik yang ada dalam
populasi.
Alasan dipilih sampling:
1) Objek penelitian yang homogen
2) Objek penelitian yang mudah rusak
3) Penghematan biaya dan waktu
4) Masalah penelitian
5) Ukuran populasi
6) Faktor ekonomis
Contoh: Darah
Metode sampling pada dasarnya dapat dibedakan atas dua
macam, yaitu probabilitas dan nonprobabilitas.
I. Probabilitas ( Sampling Random / Sampling Acak )
a. Sampling Acak Sederhana (Simple Random Sampling)
Bentuk sampling random yang sifatnya sederhana, tiap
sampel yang berukuran sama memiliki probabilitas sama
untuk terpilih dari populasi.
b. Sampling Acak Bertingkat (Stratified Random Sampling)
Bentuk sampling random yang populasinya atau elemen
populasinya dibagi dalam kelompok-kelompok yang disebut
strata.
c. Sampling Acak Sistematis (Systematic Random Sampling)
Bentuk sampling random yang mengambil elemen-elemen
yang akan diselidiki berdasarkan urutan tertentu dari populasi
yang akan disusun secara teratur.
d. Sampling Kelompok atau Sampling Kluster (Cluster Sampling)
Bentuk sampling random yang populasinya dibagi menjadi
beberapa kelompok (cluster) dengan menggunakan aturan-
aturan tertentu, seperti batas-batas alam dan wilayah
administrasi pemerintah
II. Nonprobabilitas ( Sampling NonRandom / Sampling Tidak
Acak )
Cara pengambilan sampel yang semua objek atau elemen
populasinya tidak memiliki kesempatan yang sama untuk dipilih
sebagai sampel. Seperti :
a. Sampling Kuota
Sampling kuota adalah bentuk sampling nonrandom yang
merincikan lebih dahulu segala sesuatu yang berhubungan
dengan pengambilan sampel.
b. Sampling Pertimbangan
Sampiling pertimbangan adalah bentuk sampling nonrandom
yang pengambilan sampelnya ditentukan oleh peneliti
berdasarkan pertimbangan dan kebijaksanaan.
c. Sampling Seadanya
Sampling seadanya adalah bentuk sampling nonrandom yang
pengambilan sampelnya dilakukan seadanya atau
berdasarkan kemudahan mendapatkan data yang diperlukan.
X. DISTRIBUSI PROBABILITAS
A. VARIABEL RANDOM
Definisi 1:
Variabel random adalah suatu fungsi yang memetakan ruang
sampel (S) ke himpunan bilangan Real (R), dan ditulis X : S R
CONTOH 1:
Pelemparan uang logam setimbang sebanyak tiga kali.
Ruang sampelnya S = {GGG, GGA, GAG, AGG, GAA, AGA,
AAG, AAA}. Dari percobaan ini dapat didefinisikan beberapa
variabel random yang mampu memetakan ruang sampelnya ke
dalam bilangan real. Salah satu variabel random yang dapat
dibuat adalah X = banyaknya sisi gambar yang muncul. Maka
nilai numerik 0, 1, 2, atau 3 dapat diberikan pada setiap titik
sampel.
Definisi 2 :
Ruang Sampel Diskrit adalah apabila ruang sampelnya
mengandung titik sampel yang berhingga atau terhitung
banyaknya.
Variabel random yang didefinisikan di atas ruang sampel diskrit
disebut variabel random diskrit.
CONTOH 2 :
- banyaknya barang yang cacat, dalam pengambilan sampel
sebesar k barang.
- banyaknya yang meninggal karena terserang suatu infeksi
pernafasan setiap tahun di Surabaya.
Definisi 3 :
Ruang Sampel Kontinu adalah apabila ruang sampelnya
mengandung titik sampel yang tak berhingga banyaknya, dan
memuat semua bilangan real dalam suatu interval.
Variabel random yang didefinisikan di atas ruang sampel kontinu
disebut variabel random kontinu.
CONTOH 3 :
- lamanya reaksi kimia tertentu
- jarak yang ditempuh sebuah mobil yang diisi dengan 5 liter
bensin.
B. DISTRIBUSI PROBABILITAS DISKRIT
Himpunan pasangan terurut (x, f(x)) merupakan suatu
fungsi probabilitas atau distribusi proabilitas dari variabel random
diskrit, jika
)()( .3
1)( .2
0)( .1
xfxXP
xf
xf
x
Rata-rata dan varians dari variabel random diskrit X
x
x
xfxXE
xxfXE
)()(])[(
)()(
222
C. DISTRIBUSI PROBABILITAS KONTINU
Fungsi f(x) adalah fungsi kepadatan (density) probabilitas
untuk variabel kontinu X, jika
b
adxxfbXaP
dxxf
xf
)()( .3
1)( .2
0)( .1
-
Rata-rata dan varians dari variabel random kontinu X
dxxfxXE
dxxxfXE
)()(])[(
)()(
222
D. BEBERAPA DISTRIBUSI PROBABILITAS DISKRIT
1. Distribusi Binomial
Ciri-ciri percobaan binomial :
a. Percobaan terdiri dari n ulangan
b. Setiap hasil ulangan dapat digolongkan sebagai sukses (S)
atau gagal (G)
c. Probabilitas sukses (p) untuk setiap ulangan adalah sama
d. Setiap ulangan harus bersifat independen.
Definisi 4 :
Suatu percobaan dengan n ulangan mempunyai
probabilitas sukses p dan gagal q = 1-p. Jika variabel random X
menyatakan banyaknya sukses dalam n ulangan yang bebas,
maka X berdistribusi Binomial dengan distribusi probabilitas :
nxqpx
n xnx ,....2,1,0 , p)n, b(x;
Nilai harapan (rata-rata) dan varians dari variabel random
yang berdistribusi Binomial
= np
2 = npq
SOAL 1 :
Uang logam setimbang dilemparkan sebanyak empat kali. Tentukan
distribusi probabilitas bagi banyaknya sisi gambar yang muncul.
SOAL 2 :
Probabilitas seseorang sembuh dari suatu penyakit darah adalah 0,4.
Jika 15 orang diketahui menderita penyakit ini, tentukan probabilitas :
a. Tepat 5 orang yang sembuh
b. Ada 3 sampai 8 orang yang sembuh
c. Sekurang-kurangnya 3 orang sembuh.
2. Distribusi Hipergeometrik
Ciri-ciri percobaan Hipergeometrik :
a. Sampel acak berukuran n diambil dari populasi berukuran
N
b. Dari populasi berukuran N benda, sebanyak k benda diberi
label “sukses”, dan N-k benda diberi label “gagal”.
Definisi 5 :
Dalam populasi N benda, k benda diantaranya diberi label
“sukses” dan N-k benda lainnya diberi label “gagal”. Jika variabel
random X menyatakan banyaknya sukses dalam sampel acak
berukuran n, maka X berdistribusi hipergeometrik dengan
distribusi probabilitas
kx
n
N
xn
kN
x
k
,....2,1,0 , k) n, N, h(x;
Nilai harapan dan varians dari variabel random yang
berdistribusi Hipergeometrik adalah
N
k
n
kn
N
nN
N
nk
1..1
2
SOAL 3 :
Sebuah panitia 5 orang akan dipilih secara acak dari 3 mahasiswa
farmasi dan 5 mahasiswa kedokteran. Tentukan distribusi probabilitas
banyaknya maha-siswa farmasi dalam panitia tersebut.
Bila n relatif kecil dibandingkan dengan N, maka distribusi
hipergeometrik dapat dihampiri dengan distribusi binomial
h (x; N, n, k) b (x; n, p)
SOAL 4 :
Sebuah perusahaan farmasi melaporkan bahwa diantara 5000
pemakai obat tertentu 4000 diantaranya menggunakan obat generik.
Jika 10 orang diantara pemakai obat tersebut dipilih secara acak,
berapa probabilitas tepat ada 3 orang yang memakai obat non
generik ?
3. Distribusi Poisson
Ciri-ciri percobaan Poisson :
a. Banyaknya hasil percobaan yang terjadi dalam suatu
selang waktu tertentu, tidak tergantung pada banyaknya
hasil percobaan yang terjadi pada selang waktu lain yang
terpisah.
b. Probabilitas terjadinya suatu hasil percobaan selama
selang waktu yang singkat, sebanding dengan panjang
selang waktu tersebut, dan tidak tergantung pada
banyaknya hasil percobaan yang terjadi di luar selang
waktu tersebut.
c. Probabilitas lebih dari satu hasil percobaan akan terjadi
dalam selang waktu yang singkat, dapat diabaikan.
Definisi 6 :
Jika variabel random X menyatakan banyaknya hasil
percobaan yang terjadi dalam selang waktu tertentu, dan
adalah rata-rata banyaknya hasil percobaan dalam selang waktu
tersebut, maka X berdistribusi Poisson dengan distribusi
probabilitas
,...2,1,0 , !
) p(x;
xx
e x
Nilai harapan dan varians dari ariable random yang
berdistribusi Poisson keduanya sama dengan .
SOAL 5 :
Rata-rata banyaknya partikel radioaktif yang melewati suatu
penghitung selama 1 milidetik dalam suatu percobaan di lab adalah
4. Berapa prob 6 partikel melewati penghitung itu dalam 1 milidetik
tertentu ?
Misalkan X b(x; n,p), bila n , p 0, maka
b(x; n,p) p(x; )
dengan = np.
SOAL 6 :
Probabilitas seseorang meninggal karena suatu infeksi pernafasan
adalah 0,002. Carilah probabilitas jika 2000 orang yang terserang
infeksi tersebut, kurang dari 5 orang akan meninggal ! Tentukan rata-
rata dan variansnya.
E. DISTRIBUSI PROBABILITAS KONTINU
1. Distribusi Normal
Definisi 7 :
Variabel random X berdistribusi normal dengan rata-rata
dan varians 2 jika mempunyai fungsi densitas
f(x) =
x-e
x
, 2
1), n(x;
2
2
1
Sifat-sifat kurva normal :
a. Modus terjadi pada x =
b. Kurva simetris terhadap x =
c. Kedua ujung kurva secara asimtotik mendekati sumbu datar x,
bila nilai x bergerak menjauhi .
d. Seluruh luas dibawah kurva dan diatas sumbu datar sama
dengan 1.
X
f(x)
x1 x2
Gambar 1 : Kurva Normal
Misalkan ingin dihitung P (x1 < X < x2) dari variabel
random X yang berdistribusi normal, maka berdasar kurva di atas
P (x1 < X < x2) = luas daerah yang diarsir.
Untuk menghitung P(x1 < X < x2) 2
1
)(
x
x
dxxf sulit diselesaikan.
Namun dapat diatasi dengan mentransformasi variabel random
normal X menjadi variabel random Z
XZ .
Distribusi variabel random Z disebut dengan Distribusi Normal
Standart, dengan fungsi densitas
z- , 2
1)( 2
2z
ezf
dengan = 0 dan 2 =1.
SOAL 7 :
Diketahui suatu distribusi normal standart, carilah luas daerah di
bawah kurva yang terletak :
a. di sebelah kiri z = -1,39
b. antara z = -2 dan z = 2
c. disebelah kanan z = 1,84.
SOAL 8 :
Diketahui suatu distribusi normal standart, carilah nilai k sehingga
a. P (Z > k) = 0,3015
b. P (k < Z < -0,18) = 0,4197
c. P (-0,93 < Z < k) = 0,7235.
SOAL 9 :
Variabel random X berdistribusi normal dengan rata-rata 50 dan
simpangan baku 10. Tentukan
a. P (x < 45)
b. P ( 47 < x < 62)
c. P (x > 64)
SOAL 10 :
Rata-rata tinggi anjing pudel jenis tertentu adalah 30 cm, dengan
simpangan baku 4,1 cm. Berapa persentase banyaknya anjing pudel
jenis tersebut yang tingginya melebihi 35 cm,
a. bila tingginya menyebar normal dan dapat diukur sampai ketelitian
berapapun ?
b. bila kali ini tingginya diukur sampai cm terdekat ?
2. Hampiran Normal Terhadap Distribusi Binomial
Jika variabel random X berdistribusi Binomial dengan mean = np
dan varians 2 = npq, maka variabel random
npq
npXZ
untuk n berdistribusi normal standart.
SOAL 11 :
Probabilitas seorang penderita sembuh dari suatu penyakit darah
yang jarang muncul sebesar 0,4. Bila diketahui ada 100 orang yang
telah terserang penyakit ini, berapa probabilitas bahwa kurang dari 30
yang sembuh ?
SOAL-SOAL LATIHAN :
1. Menurut teori Mendel tentang sifat-sifat keturunan, perkawinan
silang 2 jenis tanaman yang serupa, yang satu berbunga merah
dan lainnya berbunga putih, menghasilkan keturunan yang 25%
tanamannya berbunga merah. Andaikan seorang ahli tanaman
ingin mengawinsilangkan lima pasang berbunga merah dan
berbunga putih. Berapa probabilitas bahwa dari 5 keturunan
yang dihasilkan
a. Tidak terdapat bunga berwarna merah.
b. Paling sedikit 4 tanaman berbunga merah.
c. Paling banyak 4 tanaman berbunga merah.
2. Suatu perusahaan farmasi mengetahui bahwa secara rata-rata,
5% dari sejenis pil mempunyai campuran dibawah syarat
minimum, sehingga tidak memenuhi persyaratan. Berapa
probabilitas bahwa kurang dari 10 pil dalam sampel 200 pil tidak
memenuhi persyaratan ?
3. Panjang ikan sardine yang diterima suatu pabrik pengalengan
ikan mempunyai panjang rata-rata 4,54 inci dan simpangan baku
0,25 inci. Apabila distribusi panjang ikan sardine tersebut
mengikuti distribusi normal, berapa persentase dari ikan-ikan
tersebut yang panjangnya adalah :
a. Lebih dari 5 inci
b. Kurang dari 5 inci
c. 4,4 sampai 4,6 inci ?
4. Probabilitas seorang mahasiswa gagal dalam tes scoliosis
(membengkoknya tulang belakang) adalah 0,004. Diantara 1875
siswa yang dites scoliosis, hitunglah probabilitas terdapat :
a. kurang dari 5 mahasiswa gagal dalam tes itu
b. lebih dari 2 mahasiswa gagal dalam tes tersebut
c. 8, 9 atau 10 mahasiswa gagal dalam tes tersebut.
5. Dalam suatu dos berisi 50 botol obat dan 5 buah diantaranya
tidak memenuhi standart. Dari dos tersebut diambil 4 botol obat
secara acak, berapa probabilitas mendapat 2 botol yang tidak
memenuhi standart ?
6. Dalam suatu ujian statistika, diketahui bahwa nilai rata-ratanya
adalah 82 dengan simpangan baku sama dengan 5. Semua
mahasiswa dengan nilai dari 88 sampai 94 mendapat nilai B. Bila
nilai-nilai statistika tersebut berdistribusi normal, dan 8 siswa
mendapat nilai B, berapa banyak mahasiswa yang menempuh
ujian tersebut (bila nilai ujian dibulatkan ke bilangan bulat
terdekat) ?
7. Secara rata-rata, di Indonesia banyaknya kematian yang
disebabkan oleh penyakit tertentu adalah 3 orang perhari .
Tentukan probabilitas dalam suatu hari terjadi kematian
a. kurang dari 2 orang
b. lebih dari 5 orang
c. antara 3 sampai 7 orang.
8. Suatu organisasi ilmiah mempunyai 1000 anggota, dimana 100
orang diantaranya adalah sarjana farmasi. Jika 10 orang diambil
secara acak untuk diangkat jadi pengurus organisasi itu, maka
tentukan probabilitas lebih dari 5 orang sarjana farmasi duduk
dalam pengurus itu.
9. Tentukan mean dan varians untuk semua soal diatas yang
variabel randomnya diskrit.
10. Tinggi 1000 mahasiswa menyebar normal dengan rata-rata
174,5 cm dan simpangan baku 6,9 cm. Bila tinggi dicatat sampai
setengah cm terdekat, berapa banyak diantara mahasiswa
tersebut yang memiliki tinggi
a. Kurang dari 160,5 cm
b. Sama dengan 175 cm
c. Antara 171,5 sampai 182 cm.
XI. DISTRIBUSI NORMAL
A. Beberapa pengertian umum tentang distribusi Normal
1. Fungsi kepekatan normal umum dan standar
Distribusi normal merupakan distribusi teoritis dari
variable random yang kontinu. Pengalaman telah membuktikan
bahwa sebagian besar dari variable random yang kontinu di
pelbagai bidang aplikasi yang beraneka ragam umumnya
memiliki distribusi yang didekati dengan distribusi normal atau
dapat menggunakan sebagai model teoritisnya.
Distribusi normal yang demikian merupakan distribusi
yang simetris, berbentuk genta dan kontinu serta memiliki fungsi
frekuensi.
Fungsi f(x) di atas juga dinamakan fungsi kepekatan
normal ( normal density function).
Rumus diatas, distribusi normal tergantung pada 2
parameter yaitu rata-rata dan varians σ2
. Dengan kata lain,
distribusi normal umum merupakan sekeluarga kurva yang
berparameter dua buah dan agar kita memperoleh suatu
gambaran tentang distribusi normal yang khusus, kedua
parameter diatas harus diberi harga yang tertentu pula.
Hasilnya, fungsi kepekatan normal seringkali dinyatakan sebagai
berikut :
F(x)=
22 ))(2
1(
2
1
xe
1.1
Dengan sendirinya, suatu distribusi normal dapat
dibedakan dari distribusi normal yang lain atas dasar perbedaan
rata-ratanya atau variansinya atau kedua-duanya.
Jika sudah tertentu tanpa menentukan σ2
X , maka kita
akan memperoleh serangkaian keluarga distribusi normal yang
memiliki rata-rata yang sama dengan varians seperti pada
diagram 1.1
Sebaliknya, jika σ2
X sudah tertentu sedangkan tidak
ditentukan, kita akan peroleh serangkaian keluarga kurva normal
yang memiliki bentuk yang sama dengan lokasi yang berbeda
sepanjag sumbu X seperti dalam diagram 1.2
Diagram 1.1
25,02
12
52
n(x| ,σ 2
X ) = F(x) =
22 ))(2
1(
2
1 Xxe
1.2
Diagram 1.2
Karena distribusinya kontinu, cara menghitung
probablitasnya dilakukan dengan jalan menetukan luas di bawah
kurvanya. Sayangnya, fungsi frekuensi normal tidak memiliki
integral yang sederhana sehingga probabilitas umumnya dihitung
dengan menggunakan distribusi normal standar dimana variabel
randomnya ialah Z dengan = 0 dan µ2
= 1. Tabel bagi
variable normal standar Z =
dapat dilihat pada bab akhir
makalah ini.
Definisi dari diagram 1.1 bila Z merupakan variabel
random yang kemungkinan harga-harganya menyatakan
bilangan-bilangan riil antara - ∞ dan + ∞, maka Z dinamakan
variabel normal standar bila dan hanya bila probabilitas interval
dari a ke b menyatakan luas dari a ke b antara sumbu Z dan
kurva normalnya dan persamaanya diberikan sebagai berikut :
F(x)
0
2 2
f(z) = 2
1e
2)2
1( 1.3
Fungi yang dirumuskan dengan rumus 1.3 diatas
dinamakan fungsi kepekatan normal standar ( standar normal
density function). Grafiknya dapat dilihat pada diagram 3
Diagram 3. fungsi kepekatan normal standar
f(z) = 2
1e
2)2
1(
Pada diagram 1.3 di atas, skala f(z) dapat berubah. Agar
f(z) = 1, maka f(z) naik, mencapai titik maksimal 0,399
dan turun pula. Harus selalu diingat bahwa probabilitas pada
sembarang titik-titik ialah nol karena bagi variabel kontinu,
probabilitas selalu dinyatakan dalam interval. Dengan kata lain,
probabilitas Z yang merupakan nilai pada interval antara Z = a
hingga Z = b adalah sama dengan luas yang dibatasi oleh kurva
normalnya, sumbu Z dan garis vertical Z = a dan Z = b. hal
demikian dapat dilihat pada diagram 1.4
f(x)
-3 -2 -1 0 1 2 3
0,4
0,3
0,2
0,1
Z
diagram 1.4 Kurva normal standar
seperti yang kita ketahui, bahwa pencarian luas kurva
normal diatas dapat dilakukan dengan bantuan tabel luas normal
A(z).
Contoh 1.1: Berapakah probabilitas variabel random normal yang
standar merupakan nilai 0 dan 1 ?
Per Table luas kurva normal, maka p(0 < Z < 1) = 0,3413.
Contoh 1.2: Berapakah probabilitas variabel random normal yang
standar merupakan nilai antara -2 dan +2 ?
Per Tabel luas kurva normal, maka p(-2 < Z < +2) = 2(0,4772) =
0,9544.
Hal tersebut berarti bahwa 95,44 % dari seluruh luas kurva normal
standar terletak antara -2 dan +2.
Contoh 1.3: Berapakah probabilitas variabel random normal yang
standar merupakan nilai antara 0,1 dan 2,8 ?
Per Tabel luas kurva normal, maka p(0,1 < Z < 2,8 ) = p(0 < Z < 2,8 )
– p(0 < Z < 0,1 ) = 0,4974 – 0,0398 = 0,4576.
Luas kurvanya dapat dilihat pada diagram 5
f(x)
A(Z)
0 a Z
b
Diagram 5 Kurva normal standar, p(0,10 < Z < 2,8 ).
Contoh 1. 4 : carilah p( Z > - 0,20 )
Diagram 6 Kurva normal standar, p( Z > - 0,20 )
Dari diagram 1.6, kita ketahui bahwa
p( Z > -0,20 ) = 0,5000 + p(-0,20 < Z < 0 )
= 0,5000 + 0,0793
= 0,5793
f(z)
p(0,10 < Z < 2,8 ) = 0,4576
f(z)
p(Z>-0, 20 ) = 0,5793
Z
Z
2. Fungsi distribusi kumulatif
Secara umum, fungsi distribusi kumulatif dari distribusi
normal yang kontinu dengan dan 2
dirumuskan sebagai
berikut :
Fungsi distribusi normal kumulatif yang standar
(standardized normal cumulative distribution function)
dirumuskan sebagai berikut :
Dan grafiknya dapat dilihat pada diagram 1.7
F(x) =
222
1 ))((
2
1
xe
dx
F(z) =
22
1 )(
2
1
e dz
1.4
1.5
Diagram 1 7, Fungsi distribusi normal kumulatif yang standar
Contoh 1.4
Carilah p(0 < Z < 1 ) dalam soal contoh 1
Per Tabel distribusi normal kumulatif f(1) = 0,8413 dan f(0) = 0,5000
sehingga p(0 < Z < 1 ) = f(1) – f(0) = 0,8413 – 0,5000 = 0,3413 (
referensi diagram 10.1.7 )
Contoh 1.5
Carilah p(0,10 < Z < 2,80 ) dalam soal contoh 1.3
Per Tabel distribusi normal kumulatif, f(2,8) = 0,9974 dan f(0,10) =
0,5398 sehingga p(0,10 < Z < 2,8 ) = f(2,8) – f(0,10) = 0,9974 –
0,5398 = 0,4576
1.3 Beberapa contoh tentang penggunaan tabel luas kurva normal
dan distribusi normal kumulatif
1,00
0,80
0,60
0,40
0,20
-3 -2 -0,67 0 0,67 2 3 Z
f(z)
Pada hakekatnya, kurva normal merupakan keluarga kurva normal
yang dapat memiliki rata-rata dan varians 2
yang berbeda dan
tidak usah = 0 dan 2
= 1 seperti dengan halnya kurva normal
standar.
Bila demikian halnya, apakah tabel yang berbeda harus dibuat untuk
pencarian luas kurva normal dengan dan 2
yang berbeda ? Hal
yang sedemikian itu tidak perlu. Luas kurva normal dengan dan
2
yang berbeda tetap dapat dicari dengan jalan mengubah variabel
random X yang normal kedalam variabel random Z yang standar dan
dirumuskan sebagai berikut :
Atau
Serta kemudian mencari nilai Z-nya dengan bantuan tabel F(z) atau
A(z).
Pengubahan X ke Z sedemikian itu dapat dilihat dalam diagram 1.8
dan 1.9
Z =
Z =
1.6
Diagram 1.8 Kurva normal umum standar.
5,0
1,0
2,0
4,0
3,0
0
-3 -2 -1 0 1 2 3 3 2 2 3
X
Z
Diagram 1.9
Contoh 1.6
Bila X merupakan variabel random yang memiliki distribusi normal
dengan rata-rata = 24 dan deviasi standar = 12, berapakah
probabilitas 17,4 < X < 58,8 ?
Pengubahan variabel normal 17,4 dan 58,8 masing-masing kedalam
variabel standar memperoleh
Z1 = 12
244,17 = - 0,55 dan
Z2 = 12
248,58 = 2,90
Hasilnya, p(17,4 < X < 58,8 ) = p(-0,55 < Z < 2,90 )
= 0,2088 + 0,4981
= 0,7069
-3 -2 -1 0 1 2 3
1,0
0,8
0,6
0,4
0,2
0,0
3 2 2 3 X
Z
Jika probabilitas diatas dihitung dengan bantuan table distribusi
normal kumulatif, maka diperoleh hasil
p(17,4 ) < X < 58,8 ) = p(-0,55 < Z < 2,90)
= F(2,90) – F(-0,55)
= 0,9981 – 0,2912
= 0,7069
Contoh 1.7
Dari pengiriman sebanyak 1.000 riem kertas koran berat 60 gram
diketahui bahwa rata-rata tiap riemnya terisi dengan 450 lembar
dengan deviasi standar sebesar 10 lembar. Jika distribusi jumlah
kertas per riem tersebut dapat didekati dengan kurva normal, berapa
% dari riem kertas diatas terisi dengan 455 lembar atau lebih ?
Dalam soal diatas, = 450 dan = 10 sedangkan yang kita ingin
ketahui ialah p(X ≥ 455). Pengubah variabel normal 455 kedalam
variabel standar memperoleh
Z = 10
450455= 0,50
Karena f(0,50) = 0,6915, maka p(Z ≥ 0,50) = 1 – 0,6915 = 0,3085
atau 30,85 %. Jelas bahwa 30,85 % dari riem kertas diatas terisi
dengan 455 lembar atau lebih.
Contoh 1.8
Angka ujian statistik sebagian besar mahasiswa memiliki = 34 dan
= 4. Jika distribusi angka-angka ujian tersebut kurang kurang
lebih menyerupai distribusi normal, dibawah angka berapa kita akan
memperoleh 10 % terendah dari seluruh distribusi angka-angka
tersebut ?
Dalam hal diatas, = 34 dan = 4 sedangkan per table distribusi
normal kumulatif, nilai Z yang sesuai dengan luas kumulatif 0,10 ialah
– 1,28 sehingga
- 1,28 = 4
34
- 5,12 = X – 34
28,88 = X
Jelas sudah bahwa 10 % dari seluruh mahasiswa memperoleh nilai
ujian 28,88 atau kurang.
B. Penerapan kurva normal terhadap data empiris
Sampel yang diperoleh dari pengukuran empiris
seringkali memiliki bentuk distribusi kumulatif yang dapat didekati
secara memuaskan dengan distribusi normal. Hal tersebut dapat
dilakukan dengan jalan mempersamakan dengan X bar
dengan dengan s. Agar lebih jelas, kita akan memberikan
sebuah contoh yang berhubungan dengan persoalan di atas.
Table 2.1 menyajikan distribusi frekuensi dari sebuah sampel
yang terdiri dari 75 pengukuran berat barang X.
Tabel 1 Distribusi frekuensi sampel n = 75
Xi
titik tengah
fi frekuensi
frekuensi relatif
Fi frekuensi kumulatif
frekuensi relatif
kumulatif
1,25 0 0
1,30 1 0,013 1 0,013
1,35 5 0,067 6 0,080
1,40 6 0,080 12 0,160
1,45 13 0,173 25 0,333
1,50 8 0,107 33 0,440
1,55 17 0,227 50 0,667
1,60 14 0,187 64 0,854
1,65 7 0,093 71 0,947
1,70 1 0,013 72 0,960
1,75 3 0,040 75 1,000
1,80 0 75
Sumber : Data fiktif
= 114,55/75 = 1,527 s = 527,1 = 0,101
karena hubungan variabel standar Z dan variable X maka
dapat dinyatakan sebagai berikut :
Z = 0101,0
527,1
Maka penerapan distribusi normal kumulatifnya dapat
dilakukan dengan jalan mencari nilai-nilai X sesuai dengan nilai-
nilai Z = -3, -2, -1, 0, 1, 2, 3.
Hal tersebut dapat dilakukan sebagai berikut,
-3 = 101,0
527,1
-3(0,101) = X – 1,527
-3,03 = X – 1,527
-3,03 = X – 1,527
1,224 = X
Distribusi normal kumulatif F(x) bagi data Tabel 1 dapat diikuti
dalam Tabel 2
Z X F(x)
- 3 1,224 0,0013
- 2 1,325 0,0227
- 1 1,426 0,1587
0 1,527 0,5000
1 1,628 0,8413
2 1,729 0,9773
3 1,830 0,9987
Sumber : Data Tabel 1
Sudah tentu, nilai F(x) dapat secara langsung dicari dari
table F(x), Bila kita ingin memperoleh penerapan yang lebih
X =
k
i 1 n
f ii
merata, kita harus menghitung nilai-nilai X yang sesuai dengan
nilai-nilai Z = -3, -2,90, -2,80, -2,70,… dan seterusnya.
C. Hubungan antara distribusi Normal dan Distribusi Binomial
Bila n besar sekali, distribusi binomial dapat disesuaiakan
sedemikan rupa sehingga dapat didekati dengan distribusi
normal standar. Pada makalah ini akan di bahas betapa
penyesuaian tersebut dapat dilakukan sehingga menghasilkan
sebuah pendekatan yang sangat tepat sekali. Seperti telah kita
ketahui, variable random X atau jumlah sukses dalam n
percobaan binomial merupakan penjumlahan dari variable
random n dimana tiap peubah acak (variate) dimaksudkan bagi
setiap percobaan binomial dan tiap percobaan menghasilkan
nilai 0 atau 1.
Dalam keadaan yang biasa, jumlah dari beberapa
variable random selalu mendekati distribusi normal, sehingga
distribusi jumlah variable diatas dapat didekati dengan distribusi
normal bila n makin menjadi besar.
Batas distribusi binomial dapat di fahami secara
berangsur-angsur dengan memperhatikan tiga hal pokok sebagai
berikut :
1. Distribusi binomial merupakan sebuah distribusi yang diskrit
sedangkan distribusi normal merupakan sebuah distribusi
yang kontinu, sehingga probabilitas yang dinyatakan dengan
ordinat binomial perlu diganti dengan luas binomial karena
luas selalu dipakai untuk menyatakan probabilitas dalam
distribusi yang kontinu.
2. Skala X perlu diganti dengan skala Z agar tidak terjadi proses
“bergerak” dan “mendatar” bila n berangsur-angsur menjadi
besar.
3. Pendekatan secara normal terhadap probabilitas binomial
dapat dilakukan dengan menghitung luas yang terdapat
dibawah kurva normal.
Jumlah probabilitas atau luas yang terdapat diantara
kurva dan sumbu X adalah sama dengan 1. Hal demikian dapat
dilihat pada diagram dibawah ini :
Probabilitas variable random X merupakan nilai antara a
dan b dan dapat dinyatakan sebagai daerah bergaris dari kurva
diagram 3.1 diatas. Pada gambar diatas, p(X = a ) = 0 karena
luas a dianggap sama dengan garis f(a) yang memiliki lebar
sama dengan 0. Hal tersebut berbeda sekali dengan probabilitas
yang dinyatakan dengan ordinat distribusi yang diskrit sebab p(X
= a) dimana a = 5 tidak usah sama dengan 0.
Penerapan fungsi kontinu terhadap distribusi binomial
dapat dilakukan dengan penggunaan luas untuk menyatakan
probabilitas yang biasanya dinyatakan dengan ordinat. Tiap
ordinat dari distribusi binomial diganti dengan luas empat persegi
panjang yang berpusat pada X dan yang memiliki lebar sama
f(x)
X b a
dengan satu unit serta memiliki tinggi sama dengan ordinat
binomial yang asal, untuk lebih jelasnya dapat dilihat pada
diagram dibawah ini
Diagram 3.2. Hubungan antara probabilitas “luas” dengan “ordinat”.
Setiap perubahan pada variable random X akan
mengakibatkan proses “bergerak”. Satu cara untuk membendung
“gerakan” tersebut ialah dengan menciptakan sebuah variable
baru, yaitu Y = X – np.
Distribusi variable baru Y memiliki np = 0 dan cara
pemusatanya tidak berbeda dari distribusi normal yang standar.
Selain daripada itu, distribusi variable Y tersebut memiliki =
npq . Kita telah mengetahui bahwa distribusi normal yang
standar memiliki = 0 dan = 1, sehingga variable random Y
yang memiliki = np = 0 dan = npq
masih perlu
disesuaikan agar nya sama dengan 1.
X-1 X X÷1 X+1 X X+1
X- 21 X + 2
1 X - 21 X + 2
1
f(x-1)
f(x)
f(x+1)
Probabilitas dinyatakan dengan ordinat Probabilitas dinyatakan dengan luas
Bila npq > 0, maka Y/ npq akan menghasilkan variable
random baru Z yang memiliki = 1 seperti dalam halnya
distribusi normal yang standar.
Pembuktian :
Rumus 3.1, sebenarnya sama dengan rumus 1.6 jka np =
dan = npq .
Sebagai konsekuensi perumusan 3.1 diatas
2
= Var
npq= Var
npq
1
= npq
1Var Y =
npq
npq= 1
Sehingga
Karena 2
merupakan konstanta, dengan sendirinya 2
tidak tergantung pada n sehingga penggunaan variable Z selalu
dapat mengatasi persoaaln “gerakan” variable X itu sendiri.
Dengan demikian dapat disimpulkan bahwa random
standar Z = npq
npmemiliki = 0, dan = 1 sedangkan nilai-
nilai tersebut masing-masing akan sama dengan dan dari
distribusi normal yang standar. Bila n menjadi besar, ordinat-
ordinat sentra (tinggai ordinat-ordinat) dari luas grafik probabilitas
Z tidak akan mendatar. Karena = 0, maka proses “bergerak”
Z = npq
=
npq
np
= 2
= 1 = 1
3.1
3.2
3.3
tidak terjadi dank arena = 1, maka “perluasan” pun tidak
terjadi .
Pendekatan probabilitas binomial dengan luas yang
terdapat dibawah kurva normal dapat dilakukan dengan bantuan
Tabel normal.
Contoh 3.1
Diketahui distribusi binomial memiliki n = 8 dan p = 21 ,
sedangkan grafiknya dinyatakan seperti dalam diagram dibawah
ini:
= np = 8( 21 ) = 4
= npq = ))((8 21
21
= 2 1,41
Diagram 3.3 Grafik luas distribusi binomial dengan n = 8 dan p = 21
Bila kita ingin mencari probabilitas 3 “sukses” atau lebih (
≥ 3 ), maka kita harus mengikutsertakan sejumlah luas dari
kesemua empat persegi panjang yang terletak di sisi kanan X =
2 21
Bila kita hanya mengikutsertakan luas yang terdapat di
sisi kanan X = 3, maka kita akan meninggalkan 21 daripada p(3)
x
21 0 1 2 3 4 5 6 7 8 8
21
0
0,1
0,2
0,3
tidak terhitung. Karena hal tersebut, maka luas batas sisi kiri dari
pada X haruslah 2 21 bukan 3
Sesuai dengan 3.1, maka p(X ≥ 2 21 ) yang kita ingin cari
harus diubah kedalam persamaan yang standar sebagai berikut :
= 2
42 21
= - 1,06 Sehingga p(X ≥ 2) = p(Z > - 1,06)
Dari table luas kurva normal, kita memperoleh hasil
0,3554 + 0,5000 = 0,8554
Bila kita cari hasil
8
3x
b(3|8, 21 ) dengan table distribusi
binomial kumulatif , maka diperoleh hasil sebesar 0,855 dan hasil
tersebut ternyata sesuai benar dengan hasil yang di peroleh dai
pendekatan distribusi binomial dengan menggunakan distribusi
normal diatas.
Bagaimanakah soal pencarian ordinat ekstrimnya
(extreme ordinate)? Bila distribusi binomial memiliki n = 8 dan p =
21 , berapakah p(≥8)? Batas sisi kiri dari empat persegi panjang
yang dipusatkan pada X = 8 ialah 7 21 maka
Z = 2
47 21
= 2,47
Sesuai dengan kurva table normal, maka 0,5000 – 0,4932 =
0,0068
Bila kita hitung p(8), maka kita akan memperoleh hasil
sebagai berikut :
( 21 )
8=
256
1 0,0039
Z = npq
np
Pada dasar, luas sisi kanan p(8) akan ∞ dan luas
yang tiada seberapa besar ini dapat dianggap sebagai sebagian
daripada p(8).
Sudah jelas, bahwa beda absolute dari hasil kedua
hitungan di atas tidaklah besar. Tetapi berbeda secara % dari
kedua hasil hitungan diatas hampir mendekati 75 %.
Bagaimanakah dengan penghitungan ordinat sentralnya ?
Bila distribusi binomial memiliki n = 8 dan p = 21 , berapakah
p(4)? Batas empat persegi panjang bagi p(4) ialah X = 3 21 dan X
= 4 21 sehinga,
Z =
2
43 21
- 0,35 dan
Z =
2
44 21
+ 0,35
Sesuai dengan table luas kurva normal, maka luas Z =
0,35 ialah 0,1368 sehingga p(4) = 2(0,1368) = 0,2736
penghitungan binomialnya akan menghasilkan p(4) =
4
8( 2
1 )8=
0,2734
Sudah jelas bahwa beda hasil kedua hitungan diatas, baik
secara absolute maupun secara persentasi tidaklah besar dan
jauh lebih kecil dibandingkan dengan beda mengenai kedua
perhitungan ordinat ekstrim
Contoh 3.2
Bila 12 keping uang logam dilempar sekali, berapakah
probabilitas timbulnya 5 sisi 0 ? pada persoalan diatas, kita
memperoleh n = 12, X = 5 dan p = 21 .
Sesuai dengan perumusan binomial, kita memperoleh
b(5|12, 21 ) =
5
12x ( 2
1 )5( 2
1 )7
= 792/4096 0,1934
Bila kita ingin melakukan pendekatan terhadap distribusi
binomial diatas dengan kurva normal, maka sebenarnya kita
harus menghitung luas sementara X = 4 21 dan X = 5 2
1 .
np = 12( 21 ) = 6 dan
= ))((12 21
21 = 1,732
Sehingga
Z = 732,1
65,4 = 0,87 dan Z =
732,1
65,5 = - 0,29
Sesuai dengan table luas kurva normal maka
Z(- 0,87) = 0,3078
Table 10.3.1 Distribusi binomial dengan n = 10 dan p = 21
Z = (- 0,29) = 0,1141
Sehingga
0,3078 – 0,1141 = 0,1937
Contoh 3.3
Terapkanlah sebuah distribusi normal kumulatif bagi
distribusi binomial kumulatif bila diketahui bahwa n = 10 p = 21 .
Sesuai dengan rumus 8.2.1, kita dapat menghitung hasil X =
0,1,2,..,10 dimana n = 10 dan p = 21 . Hasil penghitungan f(x) dan
F(x) nya dapat diikuti dalam table 3.1 di bawah ini.
Pendekatan distribusi binomial dengan distribusi normal
dapat dilakukan sebagai berikut :
np = 10 x 21 = 5
= npq = 10))(( 21
21 = 1,581
X f(x) F(x)
0 0,001 0,002
1 0,10 0,022
2 0,044 0,055
3 0,117 0,273
4 0,205 0,377
5 0,246 0,623
6 0,205 0,828
7 0,117 0,945
8 0,044 0,989
9 0,010 0,999
10 0,001 1,000
Sesuai dengan rumus 3.1, kita peroleh persamaan
hubungan antara X dan Z sebagai berikut :
Z = 581,1
5
Nilai-nilai bagi Z,X dan F(x) dapat diikuti dalam table 10.3.2
Table 3.2 hasil pendekatan distribusi binomial n = 10 dan p = 21
dengan distribusi normal
Z X F(x)
-3,0 0,257 0,0013
-2,5 1,048 0,0062
-2,0 1,838 0,0227
-1,5 2,628 0,0668
-1,0 3,419 0,1587
-0,5 4,210 0,3085
0 5,000 0,5000
0,5 5,791 0,6915
1,0 6,581 0,8413
1,5 7,372 0,9332
2,0 8,162 0,9773
2,5 8,953 0,9938
3,0 9,743 0,9987
Contoh Soal :
1. Penghasilan mingguan sekelompok besar manager madya
terdistribusi secara normal dnan rata-rata hitung $1.000 dan
standar deviasi $1.00
a. Berapa Probabilitas bahwa suatu penghasilan mingguan
tertentu yang dipilih secara acak akan terletak diantara $790
dan $1.000 ?
b. Berapa probabilitas penghasilan adalah kurang dari $790 ?
Jawab
Rumus =
Diketahui :
Z =
=
100
000.1790 =
100
210= -2,10
a. Daerah kurva normal antara µ dan X untuk suatu nilai z = -
2,10 adalah 0,4821. Tanda minus didepan angka 2,10
menunjukan bahwa daerah tersebut terletak di sebelah kiri
rata-rata hitung
b. Rata-rata hitung membagi kurva normal kedalam dua bagian
yang identik. Daerah disebelah kiri rata-rata hitung adalah
0,5000, dan daerah disebelah kanan bawah rata-rata hitung
pun adalah 0,5000 karena daerah dibawah kurva antara 790
dan 1.000 adalah 0,4821, daerah dibawah 790 dapat
diperoleh dengan cara mengurangi 0,5000. Oleh 0,4281.
Jadi, 0,5000-0,4281 = 0,0179
Z =
X = 790
µ = 1.000
σ = 100
Dapat dilihat dalah sebuah diagram dibawah ini
2. Penghasilan mingguan PT. indokomputer terdistribusi secara
normal dan rata-rata hitung $1.000 dan standar deviasi $1.00,
Berapa persen penghasilan mingguan $1,245 atau lebih ?
Jawab
Rumus =
Diketahui =
Z =
=
100
1000245.1 =
100
245= 2,45
Daerah yang berhubungan dengan nilai Z = 2,45 adalah 0,4929.
Secara logika daerah untuk $1.245 dan seterusnya diperoleh
dengan mengurangi 0,5000 oleh 0,5929. Daerah ini adalah
0,0071, menunjukan bahwa hanya 0,71 persen PT Indokomputer
berpenghasilan mingguan $1.245 atau lebih
0,5000 0,5000
0,4821
-2,10
0,0179
0
Z =
X = 1.245
µ = 1.000
σ = 100
Dapat dilihat menggunakan diagram dibawah ini
3. Suatu produsen ban ingin menetapkan garansi dalam bentuk mil
jarak tempuh bagi ban baru mereka MX100. Pengujian daya
tahan menunjukan bahwa rata-rata hitung mil-nya adalah 47.900
mil dan standar deviasinya adalah 2.050 mil. Produsen ingin
menetapkan mil garansi sedemikian rupa sehingga tidak lebih
dari 5 persen ban yang harus diganti. Berapa mil garansi yang
haris di umumkan oleh produsen tersebut ?
Jawab
Rumus =
Diketahui =
µ X
0,5000 0,5000
σ=$100
0,0071
0
$1.000 0
0,4929
Z =
µ = 47.900
σ = 2.050
Sebelumnya bisa kita lihat menggunakan diagram dibawah ini
Z =
=
050.2
900.47
Ada dua nilai yang tidak diketahui, Z dan X. Untuk
menemukan nilai Z, perhatikan bahwa daerah dibawah kurva
normal sebelah kiri dari X adalah 0,0500. Dengan mengunakan
logika, bahwa daerah antara µ dan X adalah 0,4500, diperoleh
dari 0,5000-0,0500.Carilah dalam table untuk daerah yang paling
mendekati 0,4500.yaitu 0,4505 dan 0,4495. Maka diketahui
bahwa nilai Z adalah ±1,645.
Lalu kita mencari nilai X :
Z = 050.2
900.47
-1,645 = 050.2
900.47
-1,645(2.050) = X – 47.900
Ban diganti jika
ban tersebut tidak
mencapai besar
mil berikut ini
5% atau 0,0500
µ
47.900
0,4500
Skala mil X ?
0,5000
X = 44.528 mil
Jadi perkiraan garansi ban yang akan di berikan adalah
max sampai di angka 44.528 mil
SOAL – SOAL LATIHAN
1. Suatu sampel random terdiri dari 50 buku telah diplih guna di
chek dari populasi yang dianggap tidak terbatas dan terdiri dari
semua buku yang ada di Perpustakaan. Dari hasil pengecekan itu
diketahui rata-rata peminjaman per mahasiswa ialah 300 kali,.
Jika dianggap deviasi standar dari peminjaman buku di
perpustakaan 70 kali, maka buatlah interval keyakinan sebesar
95% untuk menduga rata-rata peminjaman buku permahasiswa ?
2. Penghasilan mingguan pedagang Buah terdistribusi secara
normal dnan rata-rata hitung Rp10.000 dan standar deviasi
Rp500. Berapakah nilai z untuk penghasilan X Rp15.000 ? untuk
X Rp 600 ?
3. Penghasilan mingguan sekelompok besar manager PT. Maju
mundur terdistribusi secara normal dnan rata-rata hitung $5.000
dan standar deviasi $4.00
a) Berapa Probabilitas bahwa suatu penghasilan mingguan
tertentu yang dipilih secara acak akan terletak diantara $650
dan $8.000 ?
b) Berapa probabilitas penghasilan adalah kurang dari $650 ?
4. Penghasilan mingguan PT. Singkong terdistribusi secara normal
dan rata-rata hitung $8.000 dan standar deviasi $3.00, Berapa
persen penghasilan mingguan $2,145 atau lebih ?
5. Suatu produsen Aki ingin menetapkan garansi dalam lama
pemakaian aki YUASA. Pengujian daya tahan menunjukan
bahwa rata-rata hitung pemakian adalah 576 hari dan standar
deviasinya adalah 150 hari. Produsen ingin menetapkan lama
garansi sedemikian rupa sehingga tidak lebih dari 5 persen Aki
yang harus diganti. Berapa lama garansi yang harus di umumkan
oleh produsen tersebut ?
XII. PENDUGAAN PARAMETER
A. INFERENSI STATISTIK
Inferensi statistik mencakup semua metode yang
digunakan dalam penarikan kesimpulan atau generalisasi
mengenai populasi. Inferensi statistik dapat dikelompokkan
dalam 2 bidang utama:
1. PENDUGAAN PARAMETER
Contoh :
Seorang calon dalam suatu pemilihan ingin menduga
proporsi yang sebenarnya pemilih yang akan memilihnya,
dengan cara mengambil 100 orang secara acak untuk ditanyai
pendapatnya. Proporsi pemilih yang menyukai calon tersebut
dapat digunakan sebagai dugaan bagi proporsi populasi yang
sebenarnya.
2. PENGUJIAN HIPOTESIS
Contoh :
Seorang peneliti masalah kedokteran diminta untuk
memutuskan, berdasarkan bukti-bukti hasil percobaan,
apakah suatu vaksin baru lebih baik daripada yang sekarang
beredar di pasaran.
Seorang insinyur ingin memutuskan, berdasarkan data
contoh apakah ada perbedaan ketelitian antara dua jenis alat
ukur.
Metode Pendugaan Parameter suatu populasi dapat
dibedakan menjadi dua :
1. METODE PENDUGAAN KLASIK
Pendugaan dilakukan berdasarkan sepenuhnya pada
informasi sampel yang diambil dari populasi.
2. METODE PENDUGAAN BAYES
Pendugaan dengan menggabungkan informasi yang
terkandung dalam sampel dengan informasi lain yang telah
tersedia sebelumnya yaitu pengetahuan subyektif mengenai
distribusi probabilitas parameter.
B. METODE PENDUGAAN KLASIK
Statistik yang digunakan untuk memperoleh sebuah
dugaan bagi parameter populasi disebut penduga atau fungsi
keputusan. Sedangkan adalah sebuah nilai dugaan
berdasarkan sampel acak berukuran n.
Misal: Fungsi keputusan S2 (yang merupakan fungsi dari sampel
acak yang bersangkutan) adalah suatu penduga bagi 2 ,
sedangkan nilai dugaan s2 merupakan “realisasinya”.
Sifat-sifat yang seharusnya dimiliki oleh penduga :
1. TAKBIAS
Statistik dikatakan penduga takbias bagi parameter bila
)ˆ(ˆ E .
2. EFISIEN
Diantara semua kemungkinan penduga tak bias bagi
parameter , yang ragamnya terkecil adalah penduga paling
efisien bagi .
Dugaan parameter dapat dibagi menjadi :
1. DUGAAN TITIK
Menentukan suatu bilangan tunggal berdasarkan sampel
sebagai penduga dari parameter.
2. DUGAAN SELANG
Menentukan suatu interval nilai yang dengan peluang tertentu,
(1-), diharapkan memuat parameter yang diduga.
Jika parameter populasi, dugaan selang dapat
dinyatakan dengan : (untuk 0 < < 1)
1)ˆˆ( 21P
Selang 21ˆˆ , yg dihitung dari sampel yg terpilih,
disebut selang kepercayaan / interval keyakinan / confidence
interval 100(1-)% untuk parameter tersebut. nilai pecahan 1-
disebut koefisien kepercayaan / derajat kepercayaan / tingkat
keyakinan (konfidensi).
C. PENDUGAAN MEAN
Penduga titik bagi mean populasi adalah statistik X .
Bila x adalah mean sampel acak berukuran n yang diambil dari
suatu populasi dengan ragam 2 diketahui maka selang
kepercayaan 100(1-)% bagi adalah
nzx
nzx
22
Dengan 2/z adalah nilai z yang luas daerah di sebelah
kanan di bawah kurva normal standard adalah 2/ .
CATATAN:
Jika 2 tidak diketahui, tetapi sampel berukuran besar
(n≥30), 2 dapat diganti dengan s2.
Adapun penduga selang kepercayaan 100(1-)% bagi
untuk sampel kecil (n<30); bila 2 tidak diketahui adalah
n
stx
n
stx
nn ),1(),1( 22
Dengan )2/,1( nt adalah nilai t yang luas daerah di sebelah
kanan di bawah kurva seluas 2/ .
SOAL 1 :
Rata-rata Indeks Prestasi (IP) sampel acak 36 mahasiswa tingkat
sarjana adalah 2,6. Hitunglah selang kepercayaan 95% dan 99%
untuk rata-rata IP semua mahasiswa tingkat sarjana. Anggap
simpangan baku populasinya 0,3.
SOAL 2 :
Isi 7 botol asam sulfat (liter) adalah
9,8 10,2 10,4 9,8 10 10,2 9,6
Carilah selang kepercayaan 95% untuk rata-rata isi semua botol bila
distribusinya dianggap normal.
UKURAN SAMPEL BAGI PENDUGAAN
Bila x digunakan untuk menduga , kita yakin 100(1-)%
bahwa galatnya tidak akan melebihi n
z
2
. Seringkali kita ingin
mengetahui berapa besar sebuah sampel harus diambil agar galat
dalam menduga tidak melebihi suatu nilai tertentu e. Ini berarti kita
harus menentukan n sehingga n
z
2
= e.
Jadi, bila x digunakan untuk menduga , kita yakin 100(1-
)% bahwa galatnya tidak akan melebihi suatu nilai tertentu e, bila
ukuran sampelnya diambil sebesar
2
2
e
zn
.
Bila hasilnya bernilai pecahan, harus dibulatkan ke bilangan
bulat berikutnya yang lebih besar. Jika ragam populasi tidak
diketahui, suatu sampel awal berukuran n30 dapat diambil untuk
memberikan dugaan bagi .
SOAL 3 :
Seberapa besar sampel harus diambil dalam contoh 1, bila kita ingin
percaya 95% bahwa nilai dugaan kita tidak menyimpang dari lebih
dari 0,05 ?
D. PENDUGAAN SELISIH DUA MEAN
Bila kita mempunyai dua populasi saling bebas dengan
mean 1 dan 2 dan ragam 12 dan 2
2 maka penduga titik bagi
selisih antara 1 dan 2 diberikan oleh statistik 21 XX . Bila 1x
dan 2x masing-masing adalah mean sampel acak bebas
berukuran n1 dan n2 yang diambil dari populasi dengan ragam 12
dan 22 diketahui, maka selang kepercayaan 100(1-)% bagi 1-
2 adalah
2
2
2
1
2
12121
2
2
2
1
2
121
22)()(
nnzxx
nnzxx
Dengan 2/z adalah nilai z yang luas daerah di sebelah
kanan di bawah kurva normal standard adalah 2/ .
CATATAN:
Jika 12 dan 2
2 tidak diketahui, tetapi n1 dan n2 lebih
besar dari 30, maka 12 dan 2
2 dapat diganti dengan s12 dan s2
2.
Adapun penduga selang kepercayaan100(1-)% bagi 1-
2 untuk sampel kecil; bila 12=2
2 tapi nilainya tidak diketahui
adalah
21
2121
21
21
11)(
11)(
22 nnstxx
nnstxx pp
Dengan derajat bebas untuk distribusi t = v =n1 + n2 – 2 dan
2
)1()1(
21
2
22
2
112
nn
snsnsp
.
Selang kepercayaan 100(1-)% bagi 1-2 untuk sampel
kecil; bila 122
2 tapi nilainya tidak diketahui
2
2
2
1
2
12121
2
2
2
1
2
121
22)()(
n
s
n
stxx
n
s
n
stxx
Dengan derajat bebas untuk distribusi t adalah
)]1()([)]1()([
)(
2
2
2
2
21
2
1
2
1
2
2
2
21
2
1
nnsnns
nsnsv .
Bila kita mempunyai dua populasi yang tidak saling bebas
(berpasangan), selang kepercayaan 100(1-)% bagi D=1-2
untuk pengamatan berpasangan tersebut adalah
n
std
n
std d
nDd
n ),1(),1( 22
SOAL 4 :
Suatu ujian kimia diberikan kepada 50 siswa wanita dan 75 siswa
laki-laki. Siswa perempuan mendapat nilai rata-rata 76 dengan
simpangan baku 6, sedangkan siswa laki-laki memperoleh rata-rata
82 dengan simpangan baku 8. Tentukan selang kepercayaan 96%
bagi selisih rata-rata nilainya.
SOAL 5 :
Suatu penelitian ingin menaksir selisih banyaknya bahan kimia
ortofosfor yang diukur pada dua stasiun yang berlainan di suatu
sungai. Sampel berukuran 15 dikumpulkan dari stasiun-1 dan Sampel
berukuran 12 dikumpulkan dari stasiun-2. Dari stasiun-1 diperoleh
rata-rata kadar ortofosfor 3,84 mg perliter dan simpangan baku 3,07
mg perliter, sedangkan dari stasiun-2 diperoleh rata-rata kadar
ortofosfor 1,49 mg perliter dan simpangan baku 0,80 mg perliter. Cari
selang kepercayaan 95% untuk selisih rata-rata kadar fosfor
sesungguhnya pada kedua stasiun tersebut, anggap bahwa
pengamatan berasal dari populasi normal dengan varians yang
berbeda.
SOAL 6 :
Data berikut (dalam hari), menyatakan waktu yang diperlukan
penderita sampai sembuh. Penderita dipilih secara acak untuk
mendapat salah satu dari obat yang dapat menyembuhkan infeksi
berat pada saluran kencing .
Obat 1 Obat 2 n1 = 14 n2 = 16
1x = 17 2x = 19
s12 = 1,5 s2
2 = 1,8 Buat selang kepercayaan 99% untuk selisih rata-rata waktu sembuh
untuk kedua obat tersebut, anggap populasinya berdistribusi normal
dengan varians yang sama.
SOAL 7 :
Dua puluh mahasiswa tingkat satu dibagi menjadi 10 pasang, setiap
pasang kira-kira mempunyai IQ yang sama. Salah seorang dari
setiap pasangan diambil secara acak dan dimasukkan ke dalam
kelas yang menggunakan bahan terprogramkan. Anggota pasangan
yang lain dimasukkan ke dalam kelas biasa. Pada akhir semester
kedua kelompok tersebut diberikan ujian yang sama dan hasilnya
sebagi berikut :
Pasangan Bhn Terprogram Kelas Biasa
1 76 81
2 60 52
3 85 87
4 58 70
5 91 86
6 75 77
7 82 90
8 64 63
9 79 85
10 88 83
Tentukan selang kepercayaan 98% bagi selisih rata-rata
sesungguhnya nilai ujian untuk kedua metode pengajaran tersebut.
E. PENDUGAAN PROPORSI
Penduga titik bagi proporsi p dalam suatu percobaan
binomial diberikan oleh statistik nXP /ˆ , sedangkan X
menyatakan banyaknya keberhasilan dalam n ulangan. Dengan
demikian, proporsi sampel nxp /ˆ akan digunakan sebagai
nilai dugaan titik bagi parameter p tersebut.
Bila p adalah proporsi keberhasilan dalam suatu sampel
acak berukuran n, dan pq ˆ1ˆ , maka selang Kepercayaan
100(1-)% bagi p untuk sampel besar adalah
n
qpzpp
n
qpzp
ˆˆˆ
ˆˆˆ
22
Dengan 2/z adalah nilai z yang luas daerah di sebelah
kanan di bawah kurva normal standard adalah 2/ .
SOAL 8 :
Dari suatu sampel acak 500 keluarga yang memiliki TV disebuah
kota kecil, ditemukan bahwa 340 memiliki TV berwarna. Carilah
selang kepercayan 95% bagi proporsi sesungguhnya dari keluarga
yang memiliki TV berwarna di kota tersebut.
UKURAN SAMPEL BAGI PENDUGAAN p
Bila p digunakan untuk menduga p, maka kita percaya
100(1-)% bahwa galatnya tidak lebih besar dari n
qpz
ˆˆ2
.
Seringkali kita ingin mengetahui berapa besar sebuah sampel harus
diambil agar galat dalam menduga p tidak melebihi suatu nilai
tertentu e. Ini berarti kita harus menentukan n sehingga n
qpz
ˆˆ2
= e.
Jadi, apabila p digunakan untuk menduga p, maka kita
percaya 100(1-)% bahwa galatnya tidak akan melebihi suatu
besaran tertentu e bila ukuran sampelnya diambil sebesar
2
2 ˆˆ2
e
qpz
n
Bila informasi awal tentang dugaan nilai bagi p tidak dipunyai, dapat digunakan rumus
2
2
4
2
e
z
n
.
SOAL 9 :
Dari contoh 8, berapa ukuran sampel yang diperlukan agar dugaan p
meleset kurang dari 0,02 dengan kepercayaan 95% ?
F. PENDUGAAN SELISIH DUA PROPORSI
Bila 1p dan 2p masing-masing adalah proporsi
keberhasilan dalam sampel acak yang berukuran n1 dan n2 serta
11 ˆ1ˆ pq dan 22 ˆ1ˆ pq , maka penduga titik bagi selisih
antara kedua proporsi populasi p1 – p2 adalah 21 ˆˆ pp .
Sedangkan selang kepercayaan 100 (1-)% bagi p1 - p2 untuk sampel besar adalah
2
22
1
112121
2
22
1
1121
ˆˆˆˆ)ˆˆ(
ˆˆˆˆ)ˆˆ(
22 n
qp
n
qpzpppp
n
qp
n
qpzpp
Dengan 2/z adalah nilai z yang luas daerah di sebelah
kanan di bawah kurva normal standard adalah 2/ .
SOAL 10 :
ari suatu sampel acak 500 keluarga yang memiliki TV disebuah kota
kecil, ditemukan bahwa 340 memiliki TV berwarna. Carilah selang
kepercayan 95% bagi proporsi sesungguhnya dari keluarga yang
memiliki TV berwarna di kota tersebut.
SOAL 11 :
Suatu obat baru dibuat untuk mengurangi ketegangan syaraf. Dari
sampel acak 100 orang yang menderita ketegangan syaraf
menunjukkan bahwa 70 orang merasa tertolong oleh obat tersebut.
Buat selang kepercayaan 95% bagi proporsi sesungguhnya penderita
ketegangan syaraf yang tertolong oleh obat tersebut.
SOAL 12 :
Suatu pengumpulan pendapat umum dilakukan terhadap penduduk
kota dan di pinggiran kota untuk menyelidiki kemungkinan
didirikannya suatu pabrik kimia. Ternyata 2400 di antara 5000
penduduk kota, dan 1200 di antara 2000 penduduk di pinggiran kota
menyetujui rencana tersebut. Buat selang kepercayaan 90% bagi
selisih proporsi sebenarnya yang menyetujui rencana tersebut.
G. PENDUGAAN VARIANS
Bila 2s adalah penduga titik bagi varians sampel acak
berukuran n yang diambil dari suatu populasi normal dengan
varians 2, maka selang kepercayaan 100(1-)% bagi 2 adalah
2
)1,1(
22
2
),1(
2
22
)1()1(
nn
snsn
Dengan 2
)2/,1(
n adalah nilai
2 dengan derajad bebas v =
n-1 yang luas daerah di sebelah kanannya sebesar 2/ .
SOAL 13 :
Seorang peneliti yakin bahwa alat pengukurnya mempunyai
simpangan baku = 2. Dalam suatu eksperimen dia mencatat
pengukuran 4,1; 5,2; 10,2. Buat selang kepercayaan 90% bagi .
Apakah data ini sesuai dengan asumsinya ?
H. PENDUGAAN RASIO DUA VARIANS
Bila 21
s dan 22
s masing-masing adalah varians sampel
acak bebas berukuran n1 dan n2 yang diambil dari populasi
normal dengan varians 21
dan 22
, maka penduga titik bagi
rasio 2
2
2
1 / adalah 22
21
/ ss , dan selang kepercayaan 100(1-
)% bagi 12/2
2 adalah
),(2
2
2
1
2
2
2
1
),(
2
2
2
1
122
212
1vv
vv
fs
s
fs
s
Dengan ),(2/ 21 vvf adalah nilai f untuk derajad bebas
v1 dan v2 yang luas daerah di sebelah kanannya sebesar 2/ .
SOAL 14 :
Berdasarkan contoh soal nomor 4, buat selang kepercayaan 98%
untuk 12/2
2. Apakah anggapan bahwa 122
2 dapat dibenarkan ?
SOAL – SOAL LATIHAN :
1. Sampel acak 8 batang rokok merk tertentu mempunyai kadar
nikotin rata-rata 2,6 mg dengan simpangan baku 0,9 mg. Buat
selang kepercayaan 99% untuk rata-rata kadar nikotin yg
sesungguhnya rokok merk tersebut.
2. Berdasarkan soal no 1, buat selang kepercayaan 95% untuk 2.
3. Dalam suatu makalah disebutkan bahwa kandungan unsur
penting dalam tomat segar dan kalengan ditentukan dengan
menggunakan spektrofotometer penyerapan atom. Kandungan
tembaga dalam tomat segar dibandingkan dengan kandungan
tembaga dalam tomat yang sama setelah dikalengkan dicatat,
dan hasilnya sebagai berikut :
Tomat Segar Kaleng
1 0,066 0,085
2 0,079 0,088
3 0,069 0,091
4 0,076 0,096
5 0,071 0,093
6 0,087 0,095
7 0,071 0,079
8 0,073 0,078
9 0,067 0,065
10 0,062 0,068
Cari selang kepercayaan 98% untuk selisih sesungguhnya rata-
rata kandungan tembaga dalam tomat segar dan kaleng bila
selisihnya dianggap berdistribusi normal.
4. Misalkan sampel random terdiri dari pasien yang diberi tablet
baru. Setelah 24 jam, diperoleh kenyataan bahwa dari 80 pasien
yang diberi tablet baru tersebut, 56 orang diantaranya sembuh.
Buat selang kepercayaan 95% bagi proporsi semua pasien yang
akan sembuh dengan tablet tersebut.
5. Suatu sampel acak 140 kaleng susu merk “Enak” yang masing-
masing berlabel “isi 500 gram”, diperoleh berat rata-rata 480
gram dengan simpangan baku 150 gram. Berdasarkan data
tersebut, buat selang kepercayaan 99% untuk rata-rata yang
sesungguhnya isi kaleng tersebut. Dapatkah berat menurut label
tersebut dianggap benar ?
6. Dalam suatu larutan proses kimia, dua katalisator ingin
dibandingkan pengaruhnya terhadap hasil proses reaksi. Sampel
yang terdiri dari 12 larutan disiapkan menggunakan katalisator A
dan sampel dengan 10 larutan menggunakan katalisator B.
Katalisator A menghasilkan rata-rata 85 dengan simpangan baku
4, dan katalisator B menghasilkan rata-rata 81 dengan
simpangan baku 7. Buat selang kepercayaan 90% untuk 12/2
2,
anggap populasinya berdistribusi normal.
7. Dari soal nomor 6, buat selang kepercayaan 90% untuk selisih
rata-rata kedua populasi.
8. Penelitian dilakukan terhadap penderita tukak lambung di kota
Malang dan Surabaya. Hasil penelitian menunjukkan bahwa dari
50 orang penderita di Malang didapat 20 orang menggunakan
obat „Aldin‟, sedangkan dari 75 orang penderita di Surabaya
didapat 45 orang menggunakan obat tersebut. tentukan interval
kepercayaan 90% bagi selisih proporsi sebenarnya penderita
yang mengkonsumsi obat „Aldin‟ dari Surabaya dan Malang.
XIII. PENGUJIAN HIPOTESIS
Beberapa Definisi penting dalam uji hipotesis:
(1) Uji Hipotesis
Proses pembuatan keputusan untuk mengevaluasi klaim
mengenai populasi
Hipotesis Statistik: pernyataan atau dugaan mengenai satu
atau lebih populasi.
Hipotesis :
Ho : hipotesis dugaan sementara, biasanya ditandai dengan
=, , atau bergantung apakah hipotesis satu sisi atau
dua sisi.
H1 : lawan dari Ho
Pengujian hipotesis berhubungan dengan penerimaan atau
penolakan suatu hipotesis.
Kebenaran (benar atau salahnya ) suatu hipotesis tidak akan
pernah diketahui dengan pasti, kecuali kita memeriksa
seluruh populasi. (Memeriksa seluruh populasi? Apa
mungkin?)
Lalu apa yang kita lakukan, jika kita tidak mungkin memeriksa
seluruh populasi untuk memastikan kebenaran suatu
hipotesis?
Kita dapat mengambil contoh acak, dan menggunakan
informasi (atau bukti) dari contoh itu untuk menerima atau
menolak suatu hipotesis.
Penerimaan suatu hipotesis terjadi karena TIDAK CUKUP BUKTI
untuk MENOLAK hipotesis tersebut dan BUKAN karena HIPOTESIS
ITU BENAR
dan
Penolakan suatu hipotesis terjadi karena TIDAK CUKUP BUKTI
untuk MENERIMA hipotesis tersebut dan BUKAN karena HIPOTESIS
ITU SALAH.
Landasan penerimaan dan penolakan hipotesis seperti ini,
yang menyebabkan para statistikawan atau peneliti
mengawali pekerjaan dengan terlebih dahulu membuat
hipotesis yang diharapkan ditolak, tetapi dapat membuktikan
bahwa pendapatnya dapat diterima.
Perhatikan contoh-contoh berikut :
Contoh 1.
Sebelum tahun 1993, pendaftaran mahasiswa Universtas GD
dilakukan dengan pengisian formulir secara manual. Pada tahun
1993, PSA Universitas GD memperkenalkan sistem pendaftaran
"ON-LINE".
Seorang Staf PSA ingin membuktikan pendapatnya “bahwa rata-rata
waktu pendaftaran dengan sistem ON-LINE akan lebih cepat
dibanding dengan sistem yang lama” Untuk membuktikan
pendapatnya, ia akan membuat hipotesis awal, sebagai berikut :
Hipotesis Awal : rata-rata waktu pendaftaran SISTEM "ON-LINE"
sama saja dengan SISTEM LAMA.
Staf PSA tersebut akan mengambil contoh dan berharap hipotesis
awal ini ditolak, sehingga pendapatnya dapat diterima!
Contoh 2 :
Manajemen PERUMKA mulai tahun 1992, melakukan pemeriksaan
karcis KRL lebih intensif dibanding tahun-tahun sebelumnya,
pemeriksaan karcis yang intensif berpengaruh positif terhadap
penerimaan PERUMKA. Untuk membuktikan pendapat ini, hipotesis
awal yang diajukan adalah :
Hipotesis Awal : TIDAK ADA PERBEDAAN penerimaan SESUDAH
maupun SEBELUM dilakukan perubahan sistem
pemeriksaan karcis.
Manajemen berharap hipotesis ini ditolak, sehingga membuktikan
bahwa pendapat mereka benar!
Contoh 3.
(Kerjakan sebagai latihan!!!)
Eko Nomia S.Kom., seorang system analis memperbaiki sistem
pembebanan biaya di perusahaan tempatnya bekerja. Ia
berpendapat setelah perbaikan sistem pembebanan biaya pada
produk maka rata-rata harga produk turun. Bagaimana ia menyusun
hipotesis awal penelitiannya?
Hipotesis Awal : .........?
Hipotesis Awal yang diharap akan ditolak disebut : Hipotesis Nol
(H0 )
Penolakan H0 membawa kita pada penerimaan Hipotesis
Alternatif (H1) (beberapa buku menulisnya sebagai HA )
Nilai Hipotesis Nol (H0 ) harus menyatakan dengan pasti nilai
parameter.
H0 ditulis dalam bentuk persamaan
Sedangkan Nilai Hipotesis Alternatif ( H1 ) dapat memiliki beberapa
kemungkinan.
H1 ditulis dalam bentuk pertidaksamaan (< ; > ; )
Contoh 4.(lihat Contoh 1.)
Pada sistem lama, rata-rata waktu pendaftaran adalah 50 menit Kita
akan menguji pendapat Staf PSA tersebut, maka Hipotesis awal dan
Alternatif yang dapat kita buat :
H0 : = 50 menit (sistem baru dan sistem lama tidak berbeda)
H1 : 50 menit (sistem baru tidak sama dengan sistem lama)
atau
H0 : = 50 menit (sistem baru sama dengan sistem lama)
H1 : < 50 menit ( sistem baru lebih cepat)
Contoh 5 (lihat Contoh 2.)
Penerimaan PERUMKA per tahun sebelum intensifikasi pemeriksaan
karcis dilakukan = Rp. 3 juta. Maka Hipotesis Awal dan Hipotesis
Alternatif dapat disusun sebagai berikut :
H0 : = 3 juta (sistem baru dan sistem lama tidak berbeda)
H1 : 3 juta (sistem baru tidak sama dengan sistem lama)
atau
H0 : = 3 juta (sistem baru dan sistem lama tidak berbeda)
H1 : > 3 juta (sistem baru menyebabkan penerimaan per tahun
lebih besar dibanding sistem lama)
Penolakan atau Penerimaan Hipotesis dapat membawa kita pada
2 jenis kesalahan (kesalahan= error = galat), yaitu :
Kesimpulan
Keadaan sebenarnya
Ho Benar Ho Salah
Ho Diterima 1- BENAR
Ho Ditolak 1- BENAR
1. Galat Jenis 1 Penolakan Hipotesis Nol (H0 ) yang benar
Galat Jenis 1 dinotasikan sebagai
juga disebut taraf nyata uji
Catatan : konsep dalam Pengujian Hipotesis sama dengan
konsep konsep pada Selang Kepercayaan
2. Galat Jenis 2 Penerimaan Hipotesis Nol (H0 ) yang salah
Galat Jenis 2 dinotasikan sebagai
Prinsip pengujian hipotesis yang baik adalah meminimalkan nilai
dan
Dalam perhitungan, nilai dapat dihitung sedangkan nilai hanya
bisa dihitung jika nilai hipotesis alternatif sangat spesifik.
Pada pengujian hipotesis, kita lebih sering berhubungan dengan
nilai . Dengan asumsi, nilai yang kecil juga mencerminkan nilai
yang juga kecil.
Catatan : keterangan terperinci mengenai nilai dan , dapat anda
temukan dalam bab 10, Pengantar Statistika, R. E. Walpole)
Prinsip pengujian hipotesa adalah perbandingan nilai statistik uji (z
hitung atau t hitung) dengan nilai titik kritis (Nilai z tabel atau t
Tabel)
Titik Kritis adalah nilai yang menjadi batas daerah penerimaan dan
penolakan hipotesis.
Nilai pada z atau t tergantung dari arah pengujian yang
dilakukan.
(2) Arah Pengujian Hipotesis
Pengujian Hipotesis dapat dilakukan secara :
1. Uji Satu Arah
2. Uji Dua Arah
Uji Satu Arah
Pengajuan H0 dan H1 dalam uji satu arah adalah sebagai
berikut:
H0 : ditulis dalam bentuk persamaan (menggunakan tanda =)
H1 : ditulis dalam bentuk lebih besar (>) atau lebih kecil (<)
Contoh 6.
Contoh Uji Satu Arah
a. H0 : = 50 menit b. H0 : = 3 juta
H1: < 50 menit H1 : < 3 juta
Nilai tidak dibagi dua, karena seluruh diletakkan hanya di
salah satu sisi selang misalkan :
H0 : *) 0
H1: 0
Wilayah Kritis **) : z z < atau t t db < ( ; )
*) 0 adalah suatu nilai tengah yang diajukan dalam H0
**) Penggunaan z atau t tergantung ukuran contoh
contoh besar menggunakan z; contoh kecil menggunakan t.
-z atau - t(db;) 0
luas daerah terarsir
ini =
H0 : *) 0
H1 : 0
Wilayah Kritis **) : z z > atau t t db > ) ( ,
0 z atau t (db;)
Luas daerah
terarsir ini =
daerah terarsir daerah penolakan hipotesis
daerah tak terarsir daerah penerimaan hipotesis
Uji Dua Arah
Pengajuan H0 dan H1 dalam uji dua arah adalah sebagai
berikut :
H0 : ditulis dalam bentuk persamaan (menggunakan tanda =)
H1 : ditulis dengan menggunakan tanda
Contoh 7.
Contoh Uji Dua Arah
a. H0 : = 50 menit b. H0 : = 3 juta
H1 : 50 menit H1 : 3 juta
Nilai dibagi dua, karena diletakkan di kedua sisi selang
misalkan :
H0 : *) 0
H1 : 0
Wilayah Kritis **) : z z < 2
dan z z > 2
atau
t tdb
)
( , 2
dan t tdb
)
( ; 2
*) 0 adalah suatu nilai tengah yang diajukan dalam H0
**) Penggunaan z atau t tergantung ukuran contoh
contoh besar menggunakan z; contoh kecil menggunakan t.
-z /2 atau 0 z /2 atau
-t(db;/2) t(db;/2)
luas daerah terarsir luas daerah
terarsir ini = /2 = 0.5% ini = /2 = 0.5%
daerah terarsir daerah penolakan hipotesis
daerah tak terarsir daerah penerimaan hipotesis
(3) Pengerjaan Uji Hipotesis
7 Langkah Pengerjaan Uji Hipotesis
1. Tentukan H0 dan H1
2* Tentukan statistik uji [ z atau t]
3* Tentukan arah pengujian [1 atau 2]
4* Taraf Nyata Pengujian [ atau /2]
5. Tentukan nilai titik kritis atau daerah penerimaan-penolakan H0
6. Cari nilai Statistik Hitung
7. Tentukan Kesimpulan [terima atau tolak H0 ]
*) Urutan pengerjaan langkah ke-2, 3 dan 4 dapat saling
dipertukarkan!
Beberapa Nilai z yang penting
z z5% 0 05 . =1.645 z z2 5% 0 025. . =1.96
z z1% 0 01 . = 2.33 z z0 5% 0 005. . = 2.575
A. Uji Rata-rata
a. Uji Mean Satu Populasi
Ho : o ATAU Ho : = o Sisi kiri
H1 : < o H1 : < o
Ho : o ATAU Ho : = o Sisi Kanan
H1 : > o H1 : > o
Ho : = o Dua sisi
H1 : o
o adalah suatu nilai tertentu yaitu nilai dugaan /
anggapan/claim sebelum dilakukan percoban
Contoh 1.
Sampel random catatan 100 kematian di AS selama tahun lalu
menunjukkan rata-rata mereka berusia 71.8 tahun. Andaikan
simpangan bakunya 8.9 tahun, apakah ini menunjukkan bahwa
rata-rata usia dewasa ini lebih dari 70 tahun? Gunakan taraf
signifikansi, = 0.05.
1. Ho : = 70
H1 : >70
2. Tolak Ho jika Z > |Z| atau Z > |Z0,05|, yaitu jika Z > 1,645
3. Karena n=100 , =71.8, s=8.9 , maka
02,2
109.8
708.71
z
Keputusan Tolak Ho Rata-rata usia dewasa ini lebih dari 70
tahun.
b. Uji Mean Dua Populasi
Bentuk umum
Ho : 1-2 o ATAU Ho : 1-2 =o
H1 : 1- 2 < o H1 : 1- 2 < o
Ho : 1-2 o ATAU Ho : 1-2 =o
H1 : 1- 2 > o H1 : 1- 2 >o
Ho : 1-2 = o
H1 : 1- 2 1 o
Selisih mean pop. 1 dengan pop.2 adalah o
c. Uji Mean Dua Populasi Jika 0=0
Ho : 1 2 ATAU Ho : 1 = 2 Sisi kiri
H1 : 1 < 2 H1 : 1 < 2
Ho : 1 2 ATAU Ho : 1 = 2 Sisi Kanan
H1 : 1 > 2 H1 : 1 > 2
Ho : 1 = 2 Dua Sisi
H1 : 1 2
1 dan 2 adalah nilai mean dari populasi 1 dan 2.
Contoh 2.
Suatu percobaan dilakukan untuk membandingkan keausan, karena
gosokan, dua bahan yang dilapisi. Dua belas potong bahan diuji
dengan memasukan tiap potong bahan 1 ke dalam mesin pengukur
aus. Sepuluh potong bahan 2 diuji dengan cara yang sama. Dalam
tiap hal, diamati dalamnya keausan,dari bahan 1 diperoleh rata-rata
kausan sebanyak 85 satuan dengan simpang baku 4 sedangkan
sampel bahan 2 memberikan rata-rata keausan sebanyak 81 dengan
simpangan baku 5. Dengan menggunakan =5%, dapatkah
disimpulkan bahwa keausan bahan 1 melampaui keausan bahan 2
sebanyak lebih dari 2 satuan ? Anggaplah kedua populasi hampir
normal dengan variansi yang sama.
Misalkan 1 dan 2 masing-masing menyatakan rata-rata populasi
keausan bahan 1 dan 2
(1) Ho : 1-2 = 2
H1 : 1-2 >2
(2) = 0.05, Daerah kritis t ( ,v =t (0,.05,,20) =1,725,
Karena thitung < t (0,.05,,20) =1.725, maka keputusannya menerima Ho,
Jadi selisih keausan bahan 1 dan bahan 2 tidak lebih dari 2 satuan.
04,1
101
121478,4
24
21
11
2)(
478,4,2,10,12
,5,4,81,85
21
021
2121
nns
xxt
snn
ssxx
p
hitung
p
Contoh 3
Dalam makalah “influence of Physical Restraint and Restraint-
Facilitating Drugs on Blood Measurements of White-Tailed Deer and
Other Selected Mammals’ Virginia Politechnic Institut And State
University (1976), J.A Wesson memeriksa pengaruh obat
succinylcholine terhadap kadar peredaran androgen dalam darah.
Sampel darah dari rusa liar yang hidup bebas diambil melalui
uratnadi leher segera setalah suntikan succinylcholine pada otot
menggunakan panah dan senapan penangkap. Rusa kemudian
diambil lagi darahnya kira-kira 30 menit setelah suntikan dan
kemudian dilepaskan. Kadar androgen pada waktu ditangkap
diukurdan30 menit kemudian diukur dalam monogram per ml untuk
15 rusa. Dari kelima belas rusa tersebut diperoleh rata-rata selisih
androgen saat disuntikan dan 30 menit kemudian setelah disuntikan
= 9.848, dan sd =18.474. Anggaplah bahwa populasi androgen
berdistribusi normal, uji pada taraf 5% apakah konsentrasi androgen
berubah setelah 30 menit !
Jawab:
Misalkan 1 dan 2 masing-masing rata-rata konsentrasi androgen
pada waktu suntikan dan 30 menit setelah suntikan .
(1) Ho : 1=2 atau Ho : D=1-2 = 0
H1 : 12 atau H1 : D=1-2 0
(2) = 0.05, v=n1+n2-2= 12+10-2=20
Daerah kritis t < -2.145 atau t > 2.145
Karena |thitung| < t/2 maka terima Ho
1. Uji Hipotesis Beda Proporsi
• Dalam bidang kesehatan masyarakat kita sering berhadapan
dengan hasil berupa proporsi
• Mis -penderita TBC di Indonesia 4%
-persentase kesembuhan dengan obat anti diabetes
adalah 70%.
• Makanya uji hipotesis proporsi populasi penting utk dipelajari.
• Langkah uji hipotesis beda proporsi sama dengan uji hipotesis
beda rata-rata
• Dimana p adalah proporsi sampel
• S = standar deviasi s= √pq dan q = (1-p)
• Proporsi gabungan p = n1p1 + n2p2 n1 + n2
06,2
15
474,18
848,9
474,18
848,9
hitung
D
t
s
D
2. Uji hipotesis Satu Proporsi
Contoh
• Dari hasil penelitian yg sudah dilakukan dinyatakan bahwa
40% murid SD di suatu daerah menderita kecacingan.
• Pernyataan tersebut akan diuji dengan derajat kemaknaan
5%. Untuk itu diambil sampel sebanyak 250 murid SD dan
dilakukan pemeriksaan tinja dan diperoleh 39% diantaranya
terinfeksi cacing.
Diketahui :
pH0 = 0,4
n = 250
_ _ _ p (kecacingan)= 39% q (tidak cacingan) = 1 – p = 61%
α = 0,05
zα = 1,96
6. Kesimpulan :
Statistik hitung z = -0,333 > -1,96
[ p - p0 ]
√ pq/nz =
[ 39% - 40% ] -0,01 -0,33
(40% x 60%)/250 0,03 = =
(berada di daerah penerimaan H0).
H0 diterima proporsi murid SD penderita kecacingan 40%.
3. Uji hipotesis Selisih Dua Proporsi
Contoh
Seorang ahli farmakologi mengadaan percobaan dua macam
obat anti hipertensi.
Obat pertama diberikan pada 100 ekor tikus dan ternyata 60 ekor
menunjukkan perubahan tekanan darah. Obat kedua diberikan
pada 150 ekor tikus dan ternyata 85 ekor berubah tekanan
darahnya. Pengujian dilakukan dengan derajat kemaknaan 5%.
Diketahui :
H0 : p1 = p2
Ha : p1 ≠ p2
n1 = 100 n2 = 150
p1 = 60/100 p2 = 85/150
q1 = 40/100 q2 = 65/150
p = (n1p1 + n2p2)/n1+n2 = [(100x60/100)+(150x85/150)]/100+150)
= 60+85/250 = 145/250 = 0,58 q = 0,42
Latihan :
• Seorang ahli kesehatan lingkungan menguji coba efektivitas
metoda pemberantasan vektor kecoak di rumah tangga.
• Metoda pertama dilakukan di 90 rumah dan ternyata 45
rumah dinyatakan bebas kecoak. Metoda kedua dilakukan
pada 120 rumah dan hasilnya 85 rumah bebas kecoak.
Pengujian dilakukan dengan derajat kemaknaan 5%.
Diketahui :
n1 = 90 n2 = 120
p1 = 45/90 p2 = 85/120
q1 = 45/90 q2 = 35/120
p = (n1p1 + n2p2)/n1+n2 = [(90x45/90)+(120x85/120)]/90+120)
= (45+85)/210 = 130/210 = 0,62 q = 0,38
LATIHAN
Dua orang perawat A dan B masing2 telah bekerja selama 10 dan 7
tahun. Kepala Puskesmas beranggapan persentase melakukan
kesalahan perawat A lebih kecil daripada B.
Utk menguji hipotesis tersebut diambil ampel sebanyak 50 pasien
yang dirawat oleh perawat A dan 60 pasien oleh perawat B.
Dari sampel tersebut perawat A membuat 10% kesalahan perawatan
dan perawat B 12%.
Ujilah hipotesis Kepala Puskesmas tersebut dengan derajat
kemaknaan 5%.
4. Uji Hipotesis Variansi
Dalam pengujian hipotesis untuk varians langkah-langkah yang
dilakukan sama seperti pengujian hipotesis untuk rata-rata dan
proporsi.
(n-1)S2 X2
(n-1) =
2
Mengikuti fungsi chi-kuadrat dengan derajat kebebasan (n-1)
LATIHAN
1. Seorang pemilik perusahaan makanan ternak ingin mengetahui
apakah sejenis makanan baru dapat mengurangi variasi berat
ternak. Pemilik perusahaan tersebut beranggapan, setelah
ternak diberi makanan tersebut selama 3 bulan, akan tercapai
variasi berat, yang dinyatakan dalam varians sebesar 1600 pon,
dengan alternatif lebih kecil dari itu. Untuk mengujinya, sebanyak
30 ekor ternak yang beratnya hampir sama dipilih sebagai
sampel acak, kemudian diberi makanan baru tersebut selama 3
bulan. Setelah 3 bulan, dilakukan penimbangan. Ternyata
diperoleh varians berat badan sebesar 1000 pon. Dengan
menggunakan tingkat keyakinan 2,5% ujilah pendapat tersebut.
2. Suatu pabrik baterai mobil menjamin bahwa baterainya akan
tahan rata-rata 3 tahun dengan simpangan baku 1 tahun. Untuk
meyakinkan pendapatnya diambil sampel yang terdiri atas 5
baterai dan daya tahannya adalah 1,9 ; 2,4 ; 3,0 ; 3,5 ; 4,2 tahun.
a. Buatlah interval kepercayaan 95% untuk 2 ?
b. Apakah simpangan baku = 1 tersebut masih dapat diterima?
XIV. REGRESI
A. Regresi Linear Sederhana
Regresi sederhana didasarkan pada hubungan fungsional
ataupun kausal satu variable independent dengan satu variable
dependen.
Y= a + b X
Dimana:
Y : Subjek dalam variable
a : Harga Y bila X = 0 (haraga konstan
b : Angka arah atau regresi yang menunjukkan angka
peningkatan ataupun penurunan variable dependen yang
didasarkan pada variable independent bila b(+) maka naik
dan bila ( - ) maka terjadi penurunan.
X : Subjek pada variabel independent yang mempunyai nilai
tertentu.
Selain itu a dan b dicari dengan rumus :
22
2
)(
)()(()()((
ii
iiiii
n
Ya
22)(
))((
2 II
iIII
n
XYXnb
CONTOH :
Conter Krakter pelanggan
Hp yang dijual
X2 Y
2 X II
Natasya 70 155 4900 24025 10850
Candra 40 90 1600 8100 3600
2 110 (X I ) 245 (Y i ) 6500
(X2)
32125
(Y2)
14450
(X ii )
2)110()6500.(2
14450.1106500.245
a
= 1210013000
15895001592500
=900
3000
= 3.3333
2)110()6500.(2
245.11014450.2
b
= 1210013000
2695028900
=900
1950
= 2.1667
Persamaan Regresinya:
Y = a + bX
= 3.333 + 2.166
B. KOLERASI
Kolerasi dapat dihitung dengan rumus :
2222)()()((
))((
iiii
iiii
nn
nr
Contoh :
Hubungan antara penjual dengan Hp yang terjual:
n = 2 X i = 110 Y i =245 X2= 6500 Y 321252
X II = 14450
4225.900
2695028900 r
r = 3802500
1950
= 1.00
Artinya antara pelanggan dan barang yang terjual hubungannya
sempurna.
C. CHI KUADRAT
Chi kuadrat satu sample adalah tehnik statistic yang
digunakan untuk menguji hipotesis deskriftif bila dalam populasiu
terdiri dari dua atau lebih klas, data berbentuk nominal
sampelnya besar. Yang dimaksud hipotesis deskriptif disini bisa
merupakan estimasi/ dugaan terhadap ada tidaknya perbedaan
frekuensi antara kategori satu dan kategori lain dalam sebuah
sample tentang sesuatu hal.
Rumus Chi Kuadrat :
Dimana:
chi2 kuadrat
f o = frekuensi yang diobservasi
f h = frekuensi yang diharapkan
Koefisien Kontingesi digunakan untuk menghitung antar
variable bila datanya berbentuk nominal. Tehnik ini mempunyai
kaitan erat dengan Chi Kuadrat yang digunakan untuk menguji
X
k
i n
h
f
ff
1
2
02 )(
Hipotesis Komparatif k Sample Indefenden.oleh karena itulah
rumus yang digunakanmengandung nilai Chi Kuadrat.
Rumus :
Contoh:
Olah raga Jenis profesi Jumlah
Guru Dokter
Tennis Meja 15 9 24
Golf 10 23 33
25 32 57
Ke 2 yang menyenangi Tennis Meja
57
915 =
27
24 = 0.4211
Ke 2 yang menyenangi Golf
57
2310 =
57
33 = 0.5789
a. f h 1 yang menyenangi Tennis Meja:
f h Guru = 0.4211 x 25 = 10.5275
f h Dokter = 0.4211 x 32 = 13.4752 24
b. f h yang menyenangi Golf
f h Guru = 0.5789 x 25 = 14.4725
f h Dokter = 0.5789 x 32 = 18.5248 33
Olah
Raga
Guru Dokter
2
2
NC
f 0 f h f 0 hf Jumlah
Tennis
Meja
15 10.5275 9 13.4752 24
Golf 10 14.4725 23 18.5248 33
25 32 57
2 =5275.10
)5275.1015( 2+
4752.13
)4752.139( 2+
4725.14
)4725.1410( 2+
5248.18
)5248.1823( 2
= 1.9001 + 1.4862 + 1.3822 + 93.0811
= 97.8496
H 0 = Tidak ada pengaruh antara profesi dan jenis olah raga
H i = Ada pengarauh antara jumlah profesi dan jenis olah raga
X2= Table
Dik = (n-1) x (n-1)
= (2-1) x (2-1)
= 1
Table < Hitung artinya H 0 ditolak dan H i diterima jadi ada
hubungan.
C = 2
2
Xn
X
=
4896.9757
8496.97
= 0.64
D. Regresi Linear Berganda
1. Hubungan liniear lebih dari dua variabel
Regresi artinya peramalan penaksiran atau pendugaan
pertama kali diperkenalkan pada tahun 1877 oleh Sir Francis
Galtoon (1822-1911). Analisis regresi digunakan untuk
menentukan bentuk dari hubungan antar variabel. Tujuan utama
dalam penggunaan analisis itu adalah untuk meramalkan atau
memperkirakan nilai dari suatu variabel dalam hubungannya
dengan variabel yang lain. Disamping hubungan linear dua
variabel, hubungan linear dari dua variabel bisa juga terjadi
misalnya; hubungan antara hasil penjualan dengan harga dan
daya beli.
Hubungan linear lebih dari dua variabel bila dinyatakan
dalam bentuk persamaan matematis adalah :
Y = a + b1x1 + b2x2 +……………bkxk +
Keterangan :
x, x1, x2……..xk = variabel-variabel
a, b1, b2……..bk = bilangan konstan (konstanta) koefisien
variabel
2. Persamaan regresi linear berganda
Regresi linear berganda adalah regresi dimana variabel
terikatnya (Y) dihubungkan atau dijelaskan lebih dari satu
variabel, mungkin dua, tiga dan seterusnya variabel bebas (x, x1,
x2……..xn ) namun masih menunjukkan diagram hubungan yang
linear.
Penambahan variabel bebas ini diharapkan dapat lebih
menjelaskan karakteristik hubungan yang ada walaupun masih
saja ada variabel yang terabaikan. Bentuk umum dari persamaan
linear berganda dapat ditulis sebagai berikut:
a. Bentuk stokastik
y = a + b1x1 + b2x2 + b3x3 ……………bkxk + c
b. Bentuk non stokastik
y = a + b1x1 + b2x2 + b3x3……………bkxk
Keterangan
y : Variabel terikat (nilai duga y)
a, b1, b2 b3……..bk : koefisien regresi
x1, x2 x3……..xk : variabel bebas
e : kesalahan pengganggu
E. Pendugaan dan Pengujian Koefisien Regresi
1. Kesalahan baku regresi dan koefisien regresi berganda
Kesalahan baku atau selisih taksir standar regresi adalah
nilai menyatakan seberapa jauh menyimpangnya nilai regresi
tersebut terhadap nilai sebenarnya. Nilai ini digunakan untuk
mengukur tingkat ketepatan suatu pendugaan dalam menduga
nilai. Jika nilai ini sama dengan nol maka penduga tersebut
memiliki tingkat ketepatan 100%.
Kesalahan baku atau selisih taksir standar regresi
berganda dirumuskan
Se = 2
1 1 2 2y b x y b x y
n m
Keterangan
Se : Kesalahan baku regresi berganda
n : Jumlah pasangan observasi
m : jumlah konstant dalam persamaan regresi berganda.
Untuk koefisien b1 dan b2 kesalahan bakunya dirumuskan
Sb1 =
2 2 2
1 1 1
Se
x nx 1 r y
Sb2 =
2 2 2
2 2 1
Se
x nx 1 r y
2. Pendugaan interval koefisien regresi berganda (parameter B1
dan B2)
Parameter B1 dan B2 sering juga disebut sebagai
koefisien regresi parsial. Pendugaan parameter B1 dan B2
menggunakan distribusi t dengan derajat bebas db = n – m
secara umum pendugaan parameter B1 dan B2 adalah :
b1 – ta/2n-m Sbi Bi bi + ta/2n-m Sbi ; i = 2,3
3. Pengujian hipotesis koefisien regresi berganda (parameter B1
dan B2)
Pengujian hipotesis bagi koefisien regresi berganda atau
regresi parsial parameter B1 dan B2 dapat dibedakan menjadi 2
bentuk, yaitu pengujian hipotesis serentak dan pengujian
hipotesis individual.
Pengujian hipotesis individual yaitu merupakan pengujian
hipotesis koefisien regresi berganda dengan hanya satu B (B1
dan B2) yang mempunyai pengaruh Y. pengujian hipotesis
serentak merupakan pengujian hipotesis koefisien regresi
berganda dengan B1 dan B2 serentak atau bersama-sama
mempengaruhi Y.
F. Peramalan dengan Regresi Linear Berganda
Peramalan terhadap nilai Y dengan menggunakan regresi
linear berganda, dapat dilakukan apabila persamaan garis
regresinya sudah diestimasi dan nilai variabel bebas x1, x2 sudah
diketahui.
Suatu persamaan garis regresi linear berganda dapat
dipakai dalam peramalan dengan terlebih dahulu melakukan
pengujian hipotesis terhadap koefisien-koefisien regresi
parsialnya. Tujuan ialah mengetahui variabel-variabel bebas yang
digunakan itu memiliki pengaruh yang nyata atau tidak terhadap
y tersebut. Variabel bebas x1 dan x2 disebut memiliki pengaruh
yang nyata apabila dalam pengujian hipotesis koefisien
parsialnya H0 : B1 = B2 = 0 ditolak atau H1 : B1 B2 0 diterima,
khususnya pada taraf nyata 1%
Kelebihan peramalan y dengan menggunakan regresi
linear berganda adalah dapat diketahui besarnya pengaruh
secara kuantitatif setiap variabel bebas (x1 atau x2) apabila
pengaruh variabelnya dianggap konstan. Misalnya sebuah
persamaan regresi berganda
y = a + b1x1 + b2x2
Keterangan :
y : Nilai statistik mahasiswa
x1 : Nilai inteligensi mahasiswa
x2 : Frekuensi membolos mahasiswa
b1 : Pengaruh x1 terhadap y jika x2 konstan
b2 : Pengaruh x2 terhadap y jika x1 konstan
jika a = 17,547; b1 = 0,642; b2 = - 0,284 maka persamaan regresi
linear bergandanya menjadi
y = 17,547 + 0,624 (75) – 0,284 (4)
Dengan persamaan regresi linear berganda tersebut, nilai y (nilai
statistik maha siswa) dapat diramalkan dengan mengetahui nilai
x1 (nilai inteligensi mahasiswa) dan x2 (frekuensi membolos
mahasiswa) misalkan, nilai x1 = 75 dan x2 = 24 maka ramalan nilai
y adalah
y = 17,547 + 0,624 (75) – 0,284 (4)
= 63.211
Penulisan persamaan garis regresi linear berganda biasanya
disertai dengan kesalahan baku masing-masing variabel bebas
dan koefisien determinasi berganda r2, sebagai ukuran tepat atau
tidaknya garis tersebut sehingga pendekatan.
G. Korelasi Linear Berganda
Korelasi linear berganda merupakan alat ukur mengenai
hubungan yang terjadi antara variabel yang terikat. (variabel Y)
dan dua atau lebih variabel bebas (x1, x2……xk). Analisis
korelasinya menggunakan tiga koefisien korelasi yaitu koefisien
determinasi berganda, koefisien korelasi berganda, dan koefisien
korelasi parsial.
1. Korelasi linear berganda dengan dua variabel bebas
a. Koefisien penentu berganda atau koefisien determinasi
berganda. Koefisien determinasi berganda, disimbolkan
KPB y.12 atau R2 merupakan ukuran kesusaian garis
regresi linear berganda terhadap suatu data. Rumus
KPBy.12 = 1 1 2 2
2
b x y b x y
y
b. Koefisien korelasi berganda.
Koefisien korelasi berganda disimbolkan ry12 merupakan
ukuran keeratan hubungan antara variabel terikat dan
semua variabel bebas. Secara bersama-sama. Rumus :
Ry.12 = 1 1 2 2
2
b x y b x y
y
c. Koefisien korelasi parsial
Koefisien korelasi parsial merupakan koefisien korelasi
antara dua variabel. Jika variabel lainnya konstan, pada
hubungan yang melibatkan lebih dari dua variabel.
Ada 3 koefisien korelasi parsial untuk hubungan yang
melibatkan 3 variabel yaitu sebagai berikut :
1) Koefisien korelasi parsial antara y dan x1, apabila x2
konstan dirumuskan
ry.12 =
y1 y2 12
2 2
y1 I2
r r .r
I r I r
2) Koefisien korelasi parsial antara y dan x2, apabila x1
konstan dirumuskan
ry.12 =
y2 y1 I2
2 2
y1 y2
r r .r
I r I r
3) Koefisien korelasi parsial antara x1 dan x2 apabila y
konstan dirumuskan
R12y =
12 y1 I2
2 2
y1 y2
r r .r
I r I r
2. Korelasi linear berganda dengan 3 variabel bebas
a. Koefisien penentu berganda
KPB = 1 1 2 2 3 3
2
b x y b x y b x y
y
2
2 2y
y yn
b. Koefisien korelasi berganda
ry123 = 1 1 2 2 3 3
2
b x y b x y b x y
y