Upload
others
View
22
Download
0
Embed Size (px)
Citation preview
Metode Statistika STK211/ 3(2-3)
Pertemuan III
Statistika Deskripsi dan Eksplorasi (2)
Septian Rahardiantoro - STK IPB 1
Septian Rahardiantoro - STK IPB 2
Misalkan diketahui data sebagai berikut
No Jenis Kelamin Tinggi Berat Agama
1 1 167 57 Islam
2 1 172 50 Islam
3 0 161 56 Kristen
4 0 157 44 Hindu
5 1 165 43 Islam
6 0 167 52 Islam
7 1 162 55 Budha
8 0 151 49 Katholik
9 0 158 43 Kristen
10 1 162 43 Islam
11 1 176 49 Islam
12 1 167 55 Islam
13 0 163 58 Kristen
14 0 158 48 Islam
15 1 164 46 Katholik
16 0 161 42 Islam
17 1 159 44 Kristen
18 1 163 48 Islam
19 1 165 40 Islam
20 0 169 40 Islam
21 1 173 42 Islam
Data 1
Peubah JK N Mean Sd Min Med Max
Tinggi P 9 160.6 5.43 151 161 169
L 12 166.3 5.07 159 165 176
Berat P 9 48. 0 6.34 40 48 58
L 12 47. 7 5.66 40 47 57
Dapat disajikan dalam tabel berikut
Lalu bagaimana menghitung ringkasan statistik tersebut?
Statistika Deskripsi dan Eksplorasi
Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami.
Teknik Penyajian
Tabel
Grafik
Peringkasan Data
Ukuran Pemusatan
Ukuran Penyebaran
Septian Rahardiantoro - STK IPB 3
Peringkasan Data
• Ukuran Pemusatan Suatu gambaran / informasi yang memberikan penjelasan bahwa data memiliki satu / lebih titik dimana dia memusat / terkumpul
• Jenis ukuran pemusatan 1. Modus
2. Median
3. Kuartil
4. Mean (Rataan, Rata-rata)
Septian Rahardiantoro - STK IPB 4
Modus
Nilai data yang paling sering terjadi (frekuensi paling tinggi)
Septian Rahardiantoro - STK IPB 5
• Dalam satu gugus data dapat mengandung lebih dari satu modus • Dapat digunakan untuk semua jenis data, tapi paling banyak digunakan
untuk data kategorik atau data diskret dengan hanya sedikit nilai yang mungkin muncul
Modus
Median
Nilai data yang membagi dua sama banyak kumpulan yang diurutkan
Septian Rahardiantoro - STK IPB 6
• Nama lain : percentil ke-50, kuartil 2 (Q2) • Digunakan untuk menggambarkan lokasi dari data numerik • Kekar terhadap adanya pencilan
Langkah menghitung median 1. Urutkan data dari kecil ke besar 2. Nilai median
• Jika banyak data ganjil, maka Median=X(n+1)/2
• Jika banyak data genap, maka Median=(X(n)/2+ X[(n)/2]+1)/2 (rata-rata dua pengamatan yang berada sebelum dan setelah posisi median)
Septian Rahardiantoro - STK IPB 7
Ilustrasi
Data II: 2 8 3 4 1 8
Data terurut: 1 2 3 4 8 8
Median=(3+4)/2 = 3.5
Data III: 2 3 4 1 8
Data terurut: 1 2 3 4 8
Median= 3
Data IV: 2 3 4 1 100
Data terurut: 1 2 3 4 100
Median= 3
Kuartil
Nilai-nilai yang menyekat gugus data menjadi 4 kelompok data yang masing-masing terdiri dari 25% muatan
Septian Rahardiantoro - STK IPB 8
• Terdiri dari Q1, Q2, Q3 • Q1(dibaca kuartil 1) merupakan nilai yang membagi data 25% data di kiri
dan 75% data di kanan • Q2 (dibaca kuartil 2) merupakan median, membagi data menjadi 50% • Q3 (dibaca kuartil 3) merupakan nilai yang membagi data 75% data di kiri
dan 25% data di sebelah kanan
Q2 Q1 Q3
Septian Rahardiantoro - STK IPB 9
Langkah Teknis memperoleh Kuartil (Quartile)
Metode Belah dua • Urutkan data dari kecil ke besar • Cari posisi kuartil nQ2=(n+1)/2 nQ1=(nQ2
*+1)/2= nQ3, nQ2 * posisi kuartil dua terpangkas (pecahan dibuang) • Nilai kuartil 2 ditentukan sama
seperti mencari nilai median. Kuartil 1 dan 3 prinsipnya sama seperti median tapi kuartil 1 dihitung dari kiri, sedangkan kuartil 3 dihitung dari kanan.
Data II: 2 8 3 4 1 8
Data terurut: 1 2 3 4 8 8
Posisi Q2 = nQ2 = (6+1) / 2 =3.5 Posisi Q1 = Posisi Q3 = (3+1)/2 = 2
1 2 3 4 8 8
Q2
Q1 Q3
Septian Rahardiantoro - STK IPB 10
Langkah Teknis memperoleh Kuartil (Quartile)
Metode Interpolasi • Urutkan data dari kecil ke besar • Cari posisi kuartil ke-i
nQi= i(n+1)/4 = a,b Qi = Xa + 0,b (Xa+1- Xa)
Data II: 2 8 3 4 1 8
Data terurut: 1 2 3 4 8 8
Posisi Q2 = nQ2 = (6+1) / 2 =3.5 Posisi Q1 = ¼(6+1) = 1.75 Posisi Q3 = ¾(6+1) = 5.25
1 2 3 4 8 8
Median
Q1= 1 + 0.75(2-1) = 1.75 Q3=8+ 0.25(8-8)=8
Septian Rahardiantoro - STK IPB 11
Statistik 5 Serangkai
Q2
Q1 Q3
Q0 Q4
Berdasarkan metode Interpolasi
Q0 = nilai minimum data Q1 = nilai maksimum data
3
1.5 6
1 8
3.5
1.75 6
1 8
Data I Data II
Mean (Rata-rata)
Merupakan pusat massa (centroid)
Septian Rahardiantoro - STK IPB 12
• Digunakan untuk tipe data numerik • Tidak bisa digunakan untuk tipe data kategorik dan diskret • Sangat resisten terhadap pencilan
Rata-rata populasi
𝜇 = 𝑥𝑖𝑁𝑖=1
𝑁
Rata-rata contoh
𝑥 = 𝑥𝑖𝑛𝑖=1
𝑛
parameter statistik
Data III (merupakan data contoh): 2 8 3 4 1
6.35
14382
x Jangan dibulatkan!!!!
Septian Rahardiantoro - STK IPB 13
Perhatikan
Data III: 2 3 4 1 8
Data terurut: 1 2 3 4 8
Median= 3
Data IV: 2 3 4 1 100
Data terurut: 1 2 3 4 100
Median= 3
6.35
84321
x
225
1004321
x
Rata-rata tidak kekar terhadap pencilan
Septian Rahardiantoro - STK IPB 14
Kaitan antar bentuk sebaran dengan ukuran pemusatan
Mean = Median = Modus
Simetri
Miring ke kanan Miring ke kiri
Modus < Median < Mean Mean < Median < Modus
• Ukuran Penyebaran Gambaran seberapa besar data menyebar dalam kumpulannya
• Jenis ukuran penyebaran – Wilayah (range)
– Jangkauan Antar Kuartil (interquartile range)
– Ragam (variance)
– Simpangan Baku (standard deviation)
Septian Rahardiantoro - STK IPB 15
Peringkasan Data
Wilayah (range)
Selisih pengamatan terbesar dengan pengamatan terkecil
Septian Rahardiantoro - STK IPB 16
𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
• Hanya memperhitungkan nilai terkecil dan terbesar, sedangkan sebaran nilai antara dua nilai tersebut tidak diperhitungkan
• Resisten terhadap nilai yang ekstrim
Data III terurut: 1 2 3 4 8
Data IV terurut: 1 2 3 4 100
R = 8-1 = 7
R = 100-1 = 99
Jangkauan Antar Kuartil
Selisih antara kuartil 3 dengan kuartil 1
Septian Rahardiantoro - STK IPB 17
(interquartile range)
𝐽𝐴𝐾 = 𝑄3 − 𝑄1
• Memperhitungkan sebaran antara nilai minimum dan nilai maksimum • Kekar terhadap adanya nilai-nilai yang ekstrim (pencilan)
Statistik 5 serangkai dari data III
(metode belah dua)
3
2 4
1 8
Statistik 5 serangkai dari data IV
(metode belah dua)
3
2 4
1 100
JAK = 4-2 = 2 JAK = 4-2 = 2
Ragam (variance)
Jumlah kuadrat selisih antara pengamatan dengan pusatnya (rata-rata)
Septian Rahardiantoro - STK IPB 18
Data III
Data (X-) (X-)2
1 -2.6 6.76
2 -1.6 2.56
3 -0.6 0.36
4 0.4 0.16
8 4.4 19.36
Rataan 3.6 0 5.84
Deviasi : selisih dari data terhadap rataannya
Ragam : jumlah kuadrat dari deviasi disekitar rataannya
Septian Rahardiantoro - STK IPB 19
Ragam populasi
𝜎2 = 𝑥𝑖 − 𝜇 2𝑁𝑖=1
𝑁
Ragam contoh
𝑠2 = 𝑥𝑖 − 𝑥 2𝑛𝑖=1
𝑛 − 1
parameter statistik
Derajat bebas = db
Untuk menghitung ragam contoh maka perlu dihitung rataan contoh, maka data terakhir tergantung dari data-data sebelumnya. Hanya 1 yang tidak bebas, sedangkan n-1 data lainnya bebas variasinya
84.5
5
2.291
2
2
N
xN
i
i
Data III
3.7
4
2.29
1
1
2
2
n
xx
s
n
i
i
Simpangan Baku
Akar kuadrat dari ragam
Septian Rahardiantoro - STK IPB 20
(standard deviation)
Ragam merupakan ukuran jarak kuadrat, sehingga untuk mendapatkan jarak yang sebenarnya adalah dengan mengakarkan ragam simpangan baku
Ragam populasi
𝜎2 = 𝑥𝑖 − 𝜇 2𝑁𝑖=1
𝑁
Ragam contoh
𝑠2 = 𝑥𝑖 − 𝑥 2𝑛𝑖=1
𝑛 − 1
parameter statistik
Simpangan baku populasi Simpangan baku contoh
𝜎 = 𝜎2 = 𝑥𝑖 − 𝜇 2𝑁𝑖=1
𝑁 𝑠 = 𝑠2 =
𝑥𝑖 − 𝑥 2𝑛𝑖=1
𝑛 − 1
Penyajian data: Boxplot
• Boxplot / Diagram kotak garis, untuk – Melihat ukuran penyebaran dan ukuran pemusatan data
– Melihat adanya data pencilan
– Sebagai alat pembandingan sebaran dua kelompok data atau lebih
Septian Rahardiantoro - STK IPB 21
Ilustrasi
Septian Rahardiantoro - STK IPB 22
Langkah pembuatan boxplot
• Hitung Statistik lima serangkai • Hitung Pagar Dalam Atas (PAD) : Q3 +1.5(Q3-Q1) • Hitung Pagar Dalam Bawah (PBD): Q1-1.5(Q3-Q1) • Identifikasi data. Jika data < PBD atau data > PAD maka data dikatakan
outlier • Gambar kotak dengan batas Q1 dan Q3 • Jika tidak ada pencilan : Tarik garis dari Q1 sampai data terkecil dan • tarik garis dari Q3 sampai data terbesar • Jika ada pencilan : Tarik garis Q1 dan atau Q3 sampai data sebelum
pencilan • Pencilan digambarkan dengan asterik
Septian Rahardiantoro - STK IPB 23
Contoh 1
Q2 = 48
Q1 = 43 Q3 = 55
Min = 40 Max = 59
Misalkan diketahui statistik 5 serangkai dari data sbb:
• PDA = 55 + 1.5 (55 – 43) = 73 • PDB = 43 – 1.5 (55 - 43) = 25 • Tidak ada pencilan
data 1
6055504540
Boxplot of data 1
Sebaran data tidak simetrik, karena nilai median lebih dekat ke Q1 miring ke kanan
Tidak ada pencilan
Septian Rahardiantoro - STK IPB 24
Contoh 2 Stem-and-leaf of data 1 N = 23
Leaf Unit = 1.0
9 4 002233344
(5) 4 68899
9 5 02
7 5 556788
1 6
1 6
1 7
1 7
1 8 0
PDA = 55 + 1.5 (55 – 43) = 73
PDB = 43 – 1.5 (55 - 43) = 25
Pencilan : 80
Q2 = 48
Q1 = 43 Q3 = 55
Min = 40 Max = 80
data 1
8070605040
Boxplot of data 1
Sebaran data tidak simetrik, karena nilai median lebih dekat ke Q1 miring ke kanan
Terdpat nilai pencilan (80)
Septian Rahardiantoro - STK IPB 25
No. Kota/Kab Pert. Pend. No. Kota/Kab Pert. Pend.1 Pandenglang 2.15 1 Cilacap 1.28
2 Lebak 2.48 2 Banyumas 1.78
3 Bogor 4.52 3 Prubalingga 1.42
4 Sukabumi 2.51 4 Banjarnegara 1.49
5 Cianjur 2.33 5 Kebumen 1.09
6 Bandung 3.31 6 Purworejo 0.62
7 Garut 2.35 7 Wonosobo 1.64
8 Tasikmalaya 2.15 8 Magelang 1.31
9 Ciamis 1.21 9 Boyolali 1.08
10 Kuningan 1.97 10 Klaten 1.19
11 Cirebon 2.73 11 Sukoharjo 2.10
12 Majalengka 2.01 12 Wonogiri 0.51
13 Sumedang 1.41 13 Karanganyar 2.07
14 Indramayu 2.53 14 Sragen 1.85
15 Subang 1.89 15 Grobogan 1.52
16 Purwakarta 2.32 16 Blora 1.27
17 Karawang 2.31 17 Rembang 2.08
18 Bekasi 3.57 18 Pati 1.62
19 Tangerang 4.04 19 Kudus 2.03
20 Serang 2.85 20 Jepara 1.87
21 Kota Bogor 2.60 21 Demak 1.38
22 Kota Sukabumi 1.48 22 Semarang 0.46
23 Kota Bandung 2.20 23 Temanggung 1.83
24 Kota Cirebon 2.51 24 Kendal 0.83
25 Batang 1.70
Rata-Rata: 26 Pekalongan 1.80
Jabar 2.48 27 Pemalang 1.79
Jateng 1.68 28 Tegal 2.67
Minimum : 29 Brebes 2.09
Jabar 1.00 30 Kota Magelang 1.25
Jateng 1.00 31 Kota Surakarta 1.39
Maksimum: 32 Kota Slatiga 2.30
Jabar 23.00 33 Kota Semarang 5.21
Jateng 34.00 34 Kota Pekalongan 1.95
35 Kota Tegal 2.44
Jawa Barat Jawa Tengah
Contoh 3
Septian Rahardiantoro - STK IPB 26
prop
pert
umbu
han
pend
d
Jawa TengahJawa Barat
5
4
3
2
1
0
Kota Semarang
Tangerang
Bogor
Boxplot of pertumbuhan pendd vs prop
Pertumbuhan penduduk di Jawa Barat relatif lebih tinggi
dibandingkan dengan pertumbuhan penduduk di Jawa Tengah.
Secara umum, tingkat keragaman pertumbuhan penduduk antar
kabupaten, di Jawa Tengah sedikit lebih besar dibanding dengan
Jawa Barat. Kab Bogor dan Tangerang merupakan daerah yang
tingkat pertumbuhan pendudukya cukup tinggi. Di Jawa Tengah
Kota Semarang yang pertumbuhan penduduknya paling tinggi.
Thank you, see you next week
Septian Rahardiantoro - STK IPB 27