Upload
adhitya-akbar
View
255
Download
0
Embed Size (px)
Citation preview
LAPORANPRAKTIKUM ANALISIS DATA
EKSPLORATIF
Dosen Pengampu :Sri Haryatmi, M.Sc.,Dr.,Prof.
Asisten Dosen :1. Wahyu Kartika(12523)2. Susi Utami (12769)
Oleh :
Adhitya Akbar10/297716/PA/13065
LABORATORIUM KOMPUTASIMATEMATIKA DAN STATISTIKA
JURUSAN MATEMATIKAFAKULTAS MATEMATIKA DAN ILMU
PENGETAHUAN ALAMUNIVERSITAS GADJAH MADA
2011
BAB I
PERMASALAHAN
1. Bangunlah data dalam variable “data” yang berdistribusi binomial dengan banyak data n=50 dan banyak percobaan 500, serta peluang sukses 0.20, lakukan sebanyak 2 kali (‘data1’ dan ‘data2’). Lalu :
a. Buatlah daftar tally dan steam and leaf (menggunakan 1 digit pertama sebagai batang, 2 digit pertama sebagai batang, dan 3 digit pertama sebagai batang) dengan panjang kelas terserah, interpretasikan hasilnya secara lengkap!
b. Carilah rata-rata, max, minimum, dan standar deviasi dari masing-masing data tersebut.
c. Carilah rata-rata, max, minimum, dan standar deviasi dari kedua data tersebut! Lalu bandingkan!
d. Buatlah boxplot untuk kedua data tersebut, dan lakukan standardisasi menggunakan mean dan median. Lalu buat boxplot baru hasil standardisasi tersebut. Bandingkan dengan boxplot sebelum standardisasi.
e. Diketahui data seperti berikut :
Data 1
601.4 597.6 598.8 598.8 601 601 598 601.2 597.8 601.4601.6 601.6 601.4 599.4 601.4 601.4 598 601 598.2 599
598 599.4 598.4 597.2 601.4 601 598.8 600.8 598.2 601.4601.4 601.2 601.6 600.8 598.8 601.2 601 601.2 598.2 601.8599.4 598.4 598.8 600.6 598.8 601.4 600.8 601.6 599.2 601.6
600 599.2 601.2 599.6 598.8 601.8 598.8 601.4 599.2 601.2600.2 598.8 599.6 599.4 598.2 601.6 599.4 601.4 600.6 601.2601.2 601.4 601.2 598 601.8 601 601 600 601.2 601.2598.4 599 598.2 600.8 601 600.2 598.8 599 598.4 601.2
599 601 598.8 597.8 601.4 599 599.6 600.4 602.2 601
Data 2
44.2 42.4 43.1 49.1 45 50.744.3 42.2 43.2 48.9 44.8 50.744.4 41.8 42.8 49.4 44.9 50.943.4 40.1 43 50 45.2 50.542.8 42 42.8 50 45.2 51.244.3 42.4 42.5 49.6 45 50.744.4 43.1 42.6 49.9 45.5 50.344.8 42.4 42.3 49.6 46.2 49.244.4 48.3 42.9 44.7 46.8 48.143.1 42.6 43.6 44.5 47.5 48.3
Buatlah boxplot untuk kedua data tersebut, lalu jika belum simetri , lakukanlah transformasi sampai didapatkan boxplot yang simetri.
BAB II
PEMBAHASAN
Output: Data random binomial dengan n=50, number of trials=500, dan probability of success=0.2
DATA1 DATA290 107102 9892 106104 10295 92102 103105 89102 100101 91102 10388 8993 9693 9989 10486 97111 101104 111110 95108 11092 9595 10394 107104 96104 95102 97115 9978 103101 99106 9894 9393 78109 10090 9296 107102 102
94 101101 9698 98106 10695 10887 98106 107104 101104 101101 91106 9396 101113 11593 107100 100
a) Output: Daftar Tally ‘DATA1’ (simple)
Tally for Discrete Variables: DATA1
DATA1 Count 78 1 86 1 87 1 88 1 89 1 90 2 92 2 93 4 94 3 95 3 96 2 98 1 100 1 101 4 102 6 104 6 105 1 106 4 108 1 109 1 110 1 111 1 113 1 115 1 N= 50
Interpretasi: Jumlah data(N)=50, Count menampilkan hitungan atau frekuensi setiap
kelas, untuk daftar Tally diatas tidak mempunyai interval/panjang kelas, sehingga
datanya individual dan dapat dilihat nilai keseluruhan dari data, data diurutkan dari data
terkecil ke data terbesar(ascending).
Daftar Tally di atas menunjukkan data yang bernilai 78 berjumlah 1, 86 berjumlah 1, 87
berjumlah 1, 88 berjumlah 1, 89 berjumlah 1, 90 berjumlah 2, 92 berjumlah 2, dst.
Daftar Tally diatas merupakan daftar Tally yang sederhana dan dapat dikerjakan secara manual. Untuk daftar Tally yang lebih kompleks dapat dilihat di bawah ini.
Output: Daftar Tally ‘DATA1’ (complicated)
Tally for Discrete Variables: DATA1
DATA1 Count CumCnt Percent CumPct 78 1 1 2.00 2.00 86 1 2 2.00 4.00 87 1 3 2.00 6.00 88 1 4 2.00 8.00 89 1 5 2.00 10.00 90 2 7 4.00 14.00 92 2 9 4.00 18.00 93 4 13 8.00 26.00 94 3 16 6.00 32.00 95 3 19 6.00 38.00 96 2 21 4.00 42.00 98 1 22 2.00 44.00 100 1 23 2.00 46.00 101 4 27 8.00 54.00 102 6 33 12.00 66.00 104 6 39 12.00 78.00 105 1 40 2.00 80.00 106 4 44 8.00 88.00 108 1 45 2.00 90.00 109 1 46 2.00 92.00 110 1 47 2.00 94.00 111 1 48 2.00 96.00 113 1 49 2.00 98.00 115 1 50 2.00 100.00 N= 50
Untuk daftar Tally diatas terlihat CumCnt (cumulative counts) yaitu menampilkan
frekuensi kumulatif setiap kelas, Percent menampilkan frekuensi relatif setiap kelas, dan
CumPct (cumulative percents) menampilkan frekuensi relatif kumulatif setiap kelas.
Output: Daftar Tally ‘DATA2’(simple)
Tally for Discrete Variables: DATA2
DATA2 Count 78 1 89 2 91 2 92 2 93 2 95 3 96 3 97 2 98 4
99 3 100 3 101 5 102 2 103 4 104 1 106 2 107 5 108 1 110 1 111 1 115 1 N= 50
Interpretasi: Jumlah data(N)=50, Count menampilkan hitungan atau frekuensi setiap
kelas, untuk daftar Tally diatas tidak mempunyai interval/panjang kelas, sehingga
datanya individual dan dapat dilihat nilai keseluruhan dari data, data diurutkan dari data
terkecil ke data terbesar(ascending).
Daftar Tally diatas menunjukkan data yang bernilai 78 berjumlah 1, 89 berjumlah 2, 91
berjumlah 2, 92 berjumlah 2, 93 berjumlah 2, 95 berjumlah 3, 96 berjumlah 3, dst.
Output: Daftar Tally ‘DATA2’ (complicated)
Tally for Discrete Variables: DATA2
DATA2 Count CumCnt Percent CumPct 78 1 1 2.00 2.00 89 2 3 4.00 6.00 91 2 5 4.00 10.00 92 2 7 4.00 14.00 93 2 9 4.00 18.00 95 3 12 6.00 24.00 96 3 15 6.00 30.00 97 2 17 4.00 34.00 98 4 21 8.00 42.00 99 3 24 6.00 48.00 100 3 27 6.00 54.00 101 5 32 10.00 64.00 102 2 34 4.00 68.00 103 4 38 8.00 76.00 104 1 39 2.00 78.00 106 2 41 4.00 82.00 107 5 46 10.00 92.00 108 1 47 2.00 94.00 110 1 48 2.00 96.00 111 1 49 2.00 98.00 115 1 50 2.00 100.00 N= 50
Untuk daftar Tally diatas terlihat CumCnt (cumulative counts) yaitu menampilkan
frekuensi kumulatif setiap kelas, Percent menampilkan frekuensi relatif setiap kelas, dan
CumPct (cumulative percents) menampilkan frekuensi relatif kumulatif setiap kelas.
Kelebihan daftar Tally:
Dapat melihat bentuk distribusi data
Dapat menghitung frekuensi dengan cepat
Melihat ada/tidaknya data ekstrim
Output: Stem and Leaf ‘DATA1’ dengan increment=100
Stem-and-Leaf Display: DATA1
Stem-and-leaf of DATA1 N = 50Leaf Unit = 10
22 0 7888899999999999999999(28) 1 0000000000000000000000001111
Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=100→leaf unit(unit
daun)=10. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat
dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke bawah. Tanda
kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut.
Output: Stem and Leaf ‘DATA1’ dengan increment=10
Stem-and-Leaf Display: DATA1
Stem-and-leaf of DATA1 N = 50Leaf Unit = 1.0
1 7 8 5 8 6789 22 9 00223333444555668(24) 10 011112222224444445666689 4 11 0135
Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=10→leaf unit(unit
daun)=1. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(puluhan) dan kolom ketiga adalah daun(satuan). Terlihat(dapat
dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke bawah. Tanda
kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut.
Output: Stem and Leaf ‘DATA1’ dengan increment=1
Stem-and-Leaf Display: DATA1
Stem-and-leaf of DATA1 N = 50Leaf Unit = 0.10
1 78 0 1 79 1 80 1 81 1 82 1 83 1 84 1 85 2 86 0 3 87 0 4 88 0 5 89 0 7 90 00 7 91 9 92 00 13 93 0000 16 94 000 19 95 000 21 96 00 21 97 22 98 0 22 99 23 100 0(4) 101 0000 23 102 000000 17 103 17 104 000000 11 105 0 10 106 0000 6 107 6 108 0 5 109 0 4 110 0 3 111 0 2 112 2 113 0 1 1141 115 0
Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=1→leaf unit(unit
daun)=0.1. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(karena panjang kelasnya hanya 1, maka data dijabarkan seluruhnya
secara ascending) dan kolom ketiga adalah daun(satuan), karena pada batang telah
dijabarkan keseluruhan nilai dari data, maka otomatis daunnya pun bernilai 0.
Terlihat(dapat dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke
bawah. Tanda kurung (….) menunjukkan median(nilai tengah) data berada pada kelas
tersebut.
Output: Stem and Leaf ‘DATA2’ dengan increment=100
Stem-and-Leaf Display: DATA2
Stem-and-leaf of DATA2 N = 50Leaf Unit = 10
LO 7
24 0 88999999999999999999999(25) 1 0000000000000000000000011
HI 11
Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=100→leaf unit(unit
daun)=10. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat
dibuktikan dengan boxplot) bahwa distribusi angkatan di atas mendekati normal. Tanda
kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut. Terlihat
adanya data ekstrim bawah(LO) dan data ekstrim atas(HI). Data ekstrim bawah berada
pada batang 0 dan daun 7(LO 7) atau data (0,7)→bernilai 78. Data ekstrim atas berada
pada batang 1 dan daun 1(HI 11) atau data (1,1)→bernilai 115.
Output: Stem and Leaf ‘DATA2’ dengan increment=10
Stem-and-Leaf Display: DATA2
Stem-and-leaf of DATA2 N = 50Leaf Unit = 1.0
LO 78
3 8 99 24 9 112233555666778888999(23) 10 00011111223333466777778 3 11 01
HI 115
Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=10→leaf unit(unit
daun)=1. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat
dibuktikan dengan boxplot) bahwa distribusi angkatan di atas mendekati normal. Tanda
kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut. Terlihat
adanya data ekstrim bawah(LO) dan data ekstrim atas(HI). Data ekstrim bawah berada
pada batang 0 dan daun 7(LO 7) atau data (0,7)→bernilai 78. Data ekstrim atas berada
pada batang 1 dan daun 1(HI 11) atau data (1,1)→bernilai 115.
Output: Stem and Leaf ‘DATA2’ dengan increment=1
Stem-and-Leaf Display: DATA2
Stem-and-leaf of DATA2 N = 50Leaf Unit = 0.10
LO 780
3 89 00 3 90 5 91 00 7 92 00 9 93 00 9 94 12 95 000 15 96 000 17 97 00 21 98 0000 24 99 000(3) 100 000 23 101 00000 18 102 00 16 103 0000 12 104 0 11 105 11 106 00 9 107 00000 4 108 0 3 109 3 110 0 2 111 0
HI 1150
Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=100→leaf unit(unit
daun)=10. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat
dibuktikan dengan boxplot) bahwa distribusi angkatan di atas mendekati normal. Tanda
kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut. Terlihat
adanya data ekstrim bawah(LO) dan data ekstrim atas(HI). Data ekstrim bawah berada
pada batang 0 dan daun 7(LO 7) atau data (0,7)→bernilai 78. Data ekstrim atas berada
pada batang 1 dan daun 1(HI 11) atau data (1,1)→bernilai 115.
b)
Output: Mean, StDev, Minimum, Maximum ‘DATA1’
Descriptive Statistics: DATA1
TotalVariable Count Mean StDev Minimum MaximumDATA1 50 99.12 7.65 78.00 115.00
Output: Mean, StDev, Minimum, Maximum ‘DATA2’
Descriptive Statistics: DATA2
TotalVariable Count Mean StDev Minimum MaximumDATA2 50 99.600 6.636 78.000 115.000
c)
Output: Mean, StDev, Minimum, Maximum dari kedua data(data gabungan)
Descriptive Statistics: DATA1+2
TotalVariable Count Mean StDev Minimum MaximumDATA1+2 100 99.360 7.132 78.000 115.000
Output: Perbandingan Mean, StDev, Minimum, Maximum dari DATA1, DATA2, dan DATA1+2(data gabungan)
Descriptive Statistics: DATA1, DATA2, DATA1+2
TotalVariable Count Mean StDev Minimum MaximumDATA1 50 99.12 7.65 78.00 115.00DATA2 50 99.600 6.636 78.000 115.000DATA1+2 100 99.360 7.132 78.000 115.000
Perbandingan mean antara DATA1, DATA2, dan data gabungan
o Selisih antara mean DATA1 dengan DATA2 adalah 0.48
o Selisih antara mean DATA1 dengan data gabungan adalah 0.24
o Selisih antara mean DATA2 dengan data gabungan adalah 0.24
Selisih mean antara DATA1 dan DATA2 dengan data gabungan adalah
sama 0.24, tetapi bukan berarti mean DATA1 dan DATA2 adalah sama,
mean DATA1 0.24 dibawah mean data gabungan, sedangkan mean
DATA2 0.24 diatas mean data gabungan.
Perbandingan standar deviasi antara DATA1, DATA2, dan data gabungan
o Selisih antara st.dev DATA1 dengan DATA2 adalah 1.014
o Selisih antara st.dev DATA1 dengan data gabungan adalah 0.518
o Selisih antara st.dev DATA2 dengan data gabungan adalah 0.496
Nilai minimum dan maksimum DATA1 dan DATA2 sama, maka otomatis nilai
minimum dan maksimum data gabungan pun sama.
d)Output: Boxplot data gabungan DATA1 dan DATA2
Interpretasi:
Boxplot menunjukkan bentuk distribusi data(normal/menjurai ke atas/menjurai ke bawah)
Boxplot diatas sedikit menjurai ke bawah.
Dari boxplot, kita dapat memperkirakan nilai dari Q1, median, Q3, nilai maksimum dan
minimum. Garis tengah dalam kotak menunjukkan median(bernilai 100.5). Garis
horizontal atasnya menunjukkan Q3(bernilai 104). Garis horizontal bawahnya
menunjukkan Q1(bernilai 94.25). Ujung atas garis vertikal menunjukkan nilai
maksimum(bernilai 115), dan ujung bawah garis vertikal menunjukkan nilai
minimum(bernilai 78←ditunjukkan oleh outlier).
Output: Boxplot hasil standarisasi mean
Interpretasi:
Standarisasi mean yaitu mengurangi setiap data dengan mean lalu dibagi dengan
standar deviasi(s). Standarisasi mean ini menghasilkan pusat data menjadi
0.159853(dapat dilihat pada pusat data di atas).
Output: Boxplot hasil standarisasi median
Standarisasi median yaitu mengurangi setiap data dengan median lalu
membaginya dengan range(jangkauan). Standarisasi median ini menghasilkan
pusat data menjadi 0(dapat dilihat pada pusat data di atas). Jadi dapat disimpulkan
bahwa standarisasi median lebih baik, karena tujuan dari standarisasi adalah
membuat pusat data menjadi 0.
Output: Boxplot sebelum dan sesudah standarisasi
e)
Boxplot di atas(hasil dari gabungan data1 dan data2) sama sekali belum
simetri(sangat menjurai ke bawah), untuk itu, perlu dilakukan transformasi
sampai data berdistribusi normal(pusat data berada di tengah-tengah). Berikut ini
adalah boxplot hasil transformasi yang sudah cukup simetris.