Upload
selvin-hadi
View
138
Download
2
Embed Size (px)
Citation preview
Statistik I
Pendahuluan & Distribusi Frekuensi
Buku Teks
• Lind, Marchal and Wathen, 2005, Statistical Techniques in Business & Economics, 12th Ed., McGraw Hill, Irwin.
Pendahuluan
1. Pengertian dan manfaat statistik
2. Jenis metode statistik
3. Jenis variabel
4. Skala Pengukuran
Pengertian statistika/ilmu statistik
Definisi:Ilmu yang berhubungan dengan:
• mengumpulkan, • mengelola/ mengorganisasi,• menganalisis,• menyajikan, dan• interpretasi data
dalam rangka membantu agar pembuatan keputusan menjadi lebih efektif
Manfaat statistik
• Informasi numerik dipakai dalam keseharian kita
• Teknik statistik sering digunakan sebagai dasar untuk pengambilan keputusan yang mempengaruhi kehidupan kita
• Apapun jenis pekerjaan Anda, akan selalu ada tahap pengambilan keputusan yang didasarkan pada data
Jenis metode statistik
• Statistik deskriptif: Metode untuk mengumpulkan, mengorganisasikan, menyajikan dan melakukan analisis data secara informatif.
• Statistik inferen/induktif: Metode yang digunakan untuk menggambarkan suatu populasi, berdasarkan informasi dari sampel.
Statistik inferenPopulasi (N):
Merupakan keseluruhan individu atau objek atau kesatuan ukuran lainnya.
• Misal: jumlah seluruh pemegang hak suara di Surabaya.
Sampel (n):Porsi atau bagian dari populasi
• Misal: 2,000 pemegang hak suara di Surabaya yang diwawancara.
Populasi vs Sampel
Mengapa sampel?• Pertimbangan waktu• Pertimbangan biaya• Secara fisik tidak memungkinkan untuk
mendata seluruh populasi• Hasil sampel telah memadai
• Dibahas lebih lanjut di Bab 8
Jenis Variabel
Data
Kualitatif atau atr ibut(Misal: Jenis kelamin)
Kuantitat if or numerik
Diskrit(Misal: Jumlah anak)
Continuous(Misal: Jam tidur dalam semalam)
Variabel Kualitatif
• Memiliki karakteristik yang non numerik.• Misalnya: Jenis kelamin, agama, merek sepeda
motor, selera, dll.
Kadang variabel kualitatif dikonversi menjadi angka untuk memudahkan penghitungan statistik. Sebagai contoh, jawaban “Suka” in diberi kode 1, “Tidak Suka” diberi kode 0. Tapi pengkodean tidak mengubah sifat variabel.
Variabel Kuantitatif• Informasi dilaporkan secara numerik• Misalnya: tinggi badan, berat badan, jumlah anak, dll.
1. Kuantitatif diskrit: data yang diperoleh dengan cara menghitung. Data berupa bilangan bulat yang terpisah-pisah satu dg yang lain.Misal: – jumlah mahasiswa dalam satu kelas: 1, 2, 3, 10,.. dst,– jumlah mobil di surabaya
2. Kuantitatif continuous: data yang diperoleh dengan cara mengukur. Data berada dalam satu rentang tertentu.Misal: tinggi badan, jarak antara rumah dengan kampus, dll.
Skala pengukuran data
1. Nominal, 2. Ordinal, 3. Interval, dan
4. Rasio .
Skala Nominal
Merupakan tingkat pengukuran yg paling sederhana untuk klasifikasi data
Data diklasifikasikan berdasarkan kategori dan tidak ada urutan atau tak menunjukan rendah ke tinggi atau sebaliknya
• Misalnya variabel jenis kelamin : pria dan wanita warna, partai, lokasi, dsb
Skala Ordinal
Meliputi data yang diatur secara berurutan, akan tetapi perbedaan antara nilai data tidak dapat ditentukan atau tidak berarti
• misalnya variable sikap : 3 = “setuju”, 2 = “ragu-ragu/
tidak berpendapat”, dan 1= “tidak setuju”
Skala Interval
• Serupa dengan Ordinal Level, dengan tambahan bahwa perbedaan antar nilai data menjadi berarti dan dapat ditentukan. Secara natural tidak ada nilai nol.
• merupakan tingkat pengukuran urutan dari rendah ke tinggi
• misalnya variable nilai ujian : A = 86-99, B = 76-85, C = 66-75, D = 56-65
Skala Rasio
• Serupa dengan Ordinal Level, bedanya di sini nilai nol menjadi berarti
Juga merupakan tingkat pengukuran urutan dari rendah ke tinggi
Memberikan informasi tentang nilai sebenarnya responden/ objek yang diukur
• Misalnya variable jarak dari rumah ke kampus
Distribusi Frekuensi
1. Pengertian Distribusi Frekuensi
2. Penyusunan Distribusi Frekuensi
3. Distribusi Frekuensi relatif dan kumulatif
4. Stem & Leaf displays
5. Penyajian grafik distribusi frekuensi
Distribusi frekuensi
• Pengelompokan data ke dalam kategori eksklusif yang menunjukkan jumlah observasi di masing-masing kategori/kelas.
Kapan menyusun Distribusi Frekuensi?
Chap 2-19
1. Pertanyaan yang hendak dijawab.2. Mengumpulkan data (data mentah/ raw).3. Mengorganisir data.
Distribusi Frekuensi4. Menyajikan data.5. Menarik kesimpulan.
Empat langkah penyusunan distribusi frekuensi
Chap 2-20
1. Menentukan jumlah kelas/kelompok.2. Menentukan interval atau rentang kelas/kelompok.3. Menetapkan batas masing-masing kelas.4. Menghitung dan menjumlah data dalam masing-
masing kelas.
Interval Kelas & Titik Tengah Kelas
Chap 2-21
Class Mid-point (Titik Tengah Kelas): pertengahan antara batas bawah dua kelas yang berurutan. Dihitung dengan: menjumlahkan batas bawah dari dua kelas yang berurutan & hasilnya di bagi 2.
Class interval (Interval Kelas): Interval kelas dihitung dengan cara mengurangi batas bawah kelas dengan batas bawah kelas berikutnya.
Contoh:Jumlah f i lm yang diputar
f requency f
1 up t o 3 1 3 up t o 5 2 5 up t o 7 3 7 up t o 9 1
9 up t o 11 3 Total 10
• Titik tengah kelas ke-1: (1+3)/2= 2• Titik tengah kelas ke-2: (3+5)/2= 4
• Interval kelas: 3-1 = 2
Contoh 1
• Dr. Tillman adalah seorang dosen. Dia sedang membuat laporan jam belajar per minggu para mahasiswanya. Dia memilih sampel sebanyak 30 mahasiswa dan memperoleh data jam belajar dalam minggu lalu dari masing-masing mahasiswa. Datanya sebagai berikut.
Chap 2-23
15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.
Susun data tersebut agar menjadi distribusi frekuensi.
Langkah 1: Menentukan jumlah kelas/kelompok.
Chap 2-24
Tujuan langkah ini adalah untuk membuat pengelompokan yang “memadai” untuk menggambarkan distribusi data yang ada.
“Memadai” dapat memakai –“2 to the k rule” / “Aturan 2 pangkat k”
Pilih angka terkecil (k) untuk jumlah kelas sehingga 2k lebih besar daripada jumlah observasi (n).
2 to the k rule
• Jumlah sampel (n) = 80• 21=2; 22=4; 23=8; 24=16; 25=32;
26=64; 27=128; …• Aturan ini menunjukkan
agar pengelompokan dibagi menjadi 7 kelas.
• Jumlah sampel (n) = 1000• 21=2; 22=4; 23=8; 24=16;
25=32; 26=64; 27=128; 28=256; 29=512; 210=1024 …
• Pengelompokan dibagi menjadi 10 kelas.
Pilih angka terkecil (k) untuk jumlah kelas sehingga 2k > jumlah observasi (n).
2 to the k rule – memakai log
Pilih angka terkecil (k) untuk jumlah kelas sehingga 2k > jumlah observasi (n).
Kita ingin mencari angka k terkecil agar 2k > n. Angka k terkecil agar k log 2 > log n Angka k terkecil agar k > (log n) / (log 2)
Contoh: Jika n=10000
(log 10000) / (log 2) = 13.28.
Sehingga pengelompokan sebaiknya menjadi 14 kelas.
Langkah 1: Menentukan jumlah kelas/kelompok.
Chap 2-27
Contoh 1 (continued): 2 to the k rule Jumlah sampel (n) = 30 21=2; 22=4; 23=8; 24=16; 25=32; 26=64; 27=128; … Pengelompokan menjadi 5 kelas. Cara lain, hitung (Log 30/log 2) = 4.91, hasilnya
sama: 5 kelas.
Langkah 2: Menentukan interval atau lebar kelas/ kelompok
Chap 2-28
Pada umumnya interval kelas harus sama untuk semua kelas.
Masing-masing kelas harus mencakup nilai terendah sampai tertinggi pada setiap kelas.
Semua kelas harus mutually exclusive dan exhaustive.
Interval kelas ≥ (Nilai terbesar – Nilai terkecil) / Jumlah kelas.
k
LHi
−≥
Mutually exclusive & exhaustive
Dalam pembahasan skala pengukuran, perlu dipahami dua
hal berikut:
• Exhaustive: pengukuran harus mencakup semua
individu atau objek yang ada.
• Mutually exlusive: pengukuran tidak boleh tumpang
tindih. Satu individu atau objek hanya termasuk dalam
satu kategori.
Langkah 2: Menentukan interval atau lebar kelas/ kelompok
k
LHi
−≥
Chap 2-30
Contoh 1 (continued): Nilai terbesar = 33.8 jam Nilai terkecil = 10.3 jam k=5. Sehingga, interval kelas ≥ (33.8-10.3)/5 = 4.7 Interval kelas ≥ 4.7 5
Interval kelas ≥ (Nilai terbesar – Nilai terkecil) / Jumlah kelas.
Langkah 3: Menetapkan batas masing-masing kelas
Chap 2-31
Batas kelas harus ditetapkan agar masing-masing kelas mutually exclusive dan exhaustive.
Biasanya angka batas dibulatkan agar mudah.
Tentukan lebih dulu kelebihan data:
Batas bawah kelas pertama:
Batas atas kelas terakhir:
( ) ( )
2
k i H L× − −
( ) ( )
2
k i H LL
× − − −
( ) ( )
2
k i H LH
× − − +
Langkah 3: Menetapkan batas masing-masing kelas
Chap 2-32
Tentukan lebih dulu kelebihan data:
Batas bawah kelas pertama:
9.55 dibulatkan: 10
Batas atas kelas terakhir:
34.55 dibulatkan: 35
( ) ( ) (5 5) (33.8 10.3)0.75
2 2
k i H L× − − × − −= =
( ) ( )10.3 0.75 9.55
2
k i H LL
× − − − = − =
( ) ( )33.8 0.75 34.55
2
k i H LH
× − − + = + =
Langkah 3: Menetapkan batas masing-masing kelas
Jam belaj ar Frekuensi, f
10 sampai dg 15
15 sampai dg 20
20 sampai dg 25
25 sampai dg 30
30 sampai dg 35
Chap 2-34
Contoh 1 (continue):Kita telah menentukan: K=5; Interval = 5. Batas bawah kelas
pertama = 10 and Batas atas kelas terakhir
= 35.
“10 sampai dg15” berarti interval dari 10 sampai15 yang mencakup 10, tapi tidak 15.
Langkah 4: Menghitung dan menjumlah data dalam masing-masing kelas.
Chap 2-35
10 smpai dg 15Jam belajar
15 smpai dg 2020 smpai dg 2525 smpai dg 3030 smpai dg 35
15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.
7
12
731
Contoh 1 (continued)
Jam belaj ar Frequency, f
10 up t o 15 7
15 up t o 20 12
20 up t o 25 7
25 up t o 30 3
30 up t o 35 1
Chap 2-36
Distribusi Frekuensi Relatif
• Distribusi Frekuensi Relatif menunjukkan persentase observasi dari masing-masing kelas.
Jam belajar f Frekuensi Relatif
10 up to 15 7 7/30= .233 15 up to 20 12 12/30= .400 20 up to 25 7 7/30= .233 25 up to 30 3 3/30= .100 30 up to 35 1 1/30= .033
TOTAL 30 30/30= 1
Chap 2-37
Distribusi Frekuensi Kumulatif
• Distribusi Frekuensi Kumulatif menentukan berapa banyak atau berapa proporsi nilai-nilai data yang berada di bawah atau di atas nilai tertentu.
Jam belajar f Frekuensi Kumulat if
10 up to 15 7 7 15 up to 20 12 7+ 12= 19 20 up to 25 7 19+ 7= 26 25 up to 30 3 26+ 3= 29 30 up to 35 1 19+ 1= 30
TOTAL 30
Chap 2-38
Stem-and-leaf Displays
• Stem-and-leaf display: Sebuah teknik statistik untuk menampilkan satu set data. Setiap nilai numerik dibagi menjadi dua bagian: digit terdepan menjadi batang dan digit berikutnya menjadi daun.
• Note: – Kelebihan stem-and-leaf display dibanding distribusi
frekuensi adalah kita tidak kehilangan identitas dari masing-masing observasi..
– Kekurangannya, tidak praktis untuk data dalam jumlah besar.
Chap 2-39
Contoh 2
• Budi mendapatkan nilai sebagai berikut dari kuis akuntansi dalam semester ini:
86, 79, 92, 84, 69, 88, 91,
83, 96, 78, 82, 85.
• Susun grafik a stem-and-leaf.
Chap 2-40
Contoh 2 (continued)
Chap 2-41
86, 79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85.
Stem Leaf
6
7
8
9
6
9
2
4
9
8
1
3
6
8
2 5
Penyajian grafik distribusi frekuensi
• Tiga bentuk grafik yang umum dipakai:– histogram, – poligon frekuensi, dan– Distribusi frekuensi kumulatif.
• Histogram adalah grafik di mana kelas/kelompok ditandai pada sumbu horizontal dan frekuensi kelas/kelompok pada sumbu vertikal. – Frekuensi kelas digambarkan oleh tingginya balok dan
balok dari masing-masing kelompok diletakkan berdekat satu dengan yang lain.
Chap 2-42
Penyajian grafik distribusi frekuensi
• Poligon frekuensi terdiri dari segmen garis yang menghubungkan titik-titik yang dibentuk oleh titik tengah kelas dan frekuensi kelas.
• Distribusi frekuensi kumulatif digunakan untuk menentukan berapa banyak atau berapa proporsi nilai-nilai data yang berada di bawah atau di atas nilai tertentu.
Chap 2-43
Histogram Jam Belajar
02468
101214
12,5 17,5 22,5 27,5 32,5
Jumlah Jam belaj ar
Frek
uens
i
Chap 2-44
Contoh 1 (continued):Histogram adalah grafik di mana kelas/kelompok ditandai pada sumbu horizontal dan frekuensi kelas/kelompok pada sumbu vertikal
Polygon Frekuensi Jam belajar
02468
101214
0 10 20 30 40
Hours spent studying
Freq
uenc
y
Chap 2-45
Contoh 1 (continued):Poligon frekuensi terdiri dari segmen garis yang menghubungkan titik-titik yang dibentuk oleh titik tengah kelas dan frekuensi kelas.
Distribusi frekuensi kumulatif Jam belajar
05
101520253035
0 10 20 30 40Hours Spent St udying
Freq
uenc
y
Chap 2-46
Contoh 1 (continued):Distribusi frekuensi kumulatif digunakan untuk menentukan berapa banyak atau berapa proporsi nilai-nilai data yang berada di bawah atau di atas nilai tertentu.
Diagram batang
• Diagram batang dapat digunakan untuk menggambarkan semua skala pengukuran (nominal, ordinal, interval, atau rasio).
Chap 2-47
Chap 2-48
Contoh 3
Buatlah sebuah bar chart untuk jumlah pengangguran per 100.000 penduduk pada tahun 2001 untuk kota berikut ini
Cit y Number of unemployed per 100,000 populat ion
At lant a, GA 7300
Bost on, MA 5400
Chicago, I L 6700
Los Angeles, CA 8900
New York, NY 8200
Washingt on, D.C. 8900
Bar Chart for the Unemployment Data
7300
5400
6700
89008200
8900
0
1000
2000
3000
40005000
6000
7000
8000
9000
10000
At lanta
Boston
Chicago
Los
Angles
New Y
orkD.C
.
Cit ies
# u
ne
mp
loy
ed
/1
00
,00
0 .
Chap 2-49
Example 3 (continued):
Pie Chart
• Pie chart berguna untuk menampilkan distribusi frekuensi relatif. Sebuah lingkaran dibagi secara proporsional berdasarkan frekuensi relatif dan masing-masing bagian dari lingkaran dialokasikan untuk kelompok yang berbeda.
Chap 2-50
Contoh 4
Chap 2-51
Merek sepatu # Pelar i
Nike 92
Adidas 49
Reebok 37
Asics 13
Lainnya 9
Suatu sampel 200 pelari diminta untuk menunjukkan merek sepatu lari favorit mereka.Gambarkan pie chart berdasarkan informasi berikut.
Contoh 4 (continued)
Chap 2-52
Merek Sepat u # Jumlah Pelar i
Persent ase (Frekuensi Relat if )
Deraj at dlm l ingkaran
Nike 92 46% = 100* 92/ 200 165.6
Adidas 49 24.5% = 100* 49/ 200 88.2
Reebok 37 18.5% = 100* 37/ 200 66.6
Asics 13 6.5% = 100* 13/ 200 23.4
Lainnya 9 4.5% = 100* 9/ 200 16.2
Hitung persentase dan besar derajat untuk tiap kelompok dari total derajat lingkaran 360o.
Derajat bagian dalam lingkaran = Persentase x 360
Pie Chart untuk sepatu pelari
Adidas24%
Reebok19%
Asics7%
Lainnya5%
Nike45%
NikeAdidasReebokAsicsLainnya
Chap 2-53
Contoh 4 (continued):