Analisis Data Eksploratif

LAPORANPRAKTIKUM ANALISIS DATA

EKSPLORATIF

Dosen Pengampu :Sri Haryatmi, M.Sc.,Dr.,Prof.

Asisten Dosen :1. Wahyu Kartika(12523)2. Susi Utami (12769)

Oleh :

Adhitya Akbar10/297716/PA/13065

LABORATORIUM KOMPUTASIMATEMATIKA DAN STATISTIKA

JURUSAN MATEMATIKAFAKULTAS MATEMATIKA DAN ILMU

PENGETAHUAN ALAMUNIVERSITAS GADJAH MADA

2011

BAB I

PERMASALAHAN

1. Bangunlah data dalam variable “data” yang berdistribusi binomial dengan banyak data n=50 dan banyak percobaan 500, serta peluang sukses 0.20, lakukan sebanyak 2 kali (‘data1’ dan ‘data2’). Lalu :

a. Buatlah daftar tally dan steam and leaf (menggunakan 1 digit pertama sebagai batang, 2 digit pertama sebagai batang, dan 3 digit pertama sebagai batang) dengan panjang kelas terserah, interpretasikan hasilnya secara lengkap!

b. Carilah rata-rata, max, minimum, dan standar deviasi dari masing-masing data tersebut.

c. Carilah rata-rata, max, minimum, dan standar deviasi dari kedua data tersebut! Lalu bandingkan!

d. Buatlah boxplot untuk kedua data tersebut, dan lakukan standardisasi menggunakan mean dan median. Lalu buat boxplot baru hasil standardisasi tersebut. Bandingkan dengan boxplot sebelum standardisasi.

e. Diketahui data seperti berikut :

Data 1

601.4 597.6 598.8 598.8 601 601 598 601.2 597.8 601.4601.6 601.6 601.4 599.4 601.4 601.4 598 601 598.2 599

598 599.4 598.4 597.2 601.4 601 598.8 600.8 598.2 601.4601.4 601.2 601.6 600.8 598.8 601.2 601 601.2 598.2 601.8599.4 598.4 598.8 600.6 598.8 601.4 600.8 601.6 599.2 601.6

600 599.2 601.2 599.6 598.8 601.8 598.8 601.4 599.2 601.2600.2 598.8 599.6 599.4 598.2 601.6 599.4 601.4 600.6 601.2601.2 601.4 601.2 598 601.8 601 601 600 601.2 601.2598.4 599 598.2 600.8 601 600.2 598.8 599 598.4 601.2

599 601 598.8 597.8 601.4 599 599.6 600.4 602.2 601

Data 2

44.2 42.4 43.1 49.1 45 50.744.3 42.2 43.2 48.9 44.8 50.744.4 41.8 42.8 49.4 44.9 50.943.4 40.1 43 50 45.2 50.542.8 42 42.8 50 45.2 51.244.3 42.4 42.5 49.6 45 50.744.4 43.1 42.6 49.9 45.5 50.344.8 42.4 42.3 49.6 46.2 49.244.4 48.3 42.9 44.7 46.8 48.143.1 42.6 43.6 44.5 47.5 48.3

Buatlah boxplot untuk kedua data tersebut, lalu jika belum simetri , lakukanlah transformasi sampai didapatkan boxplot yang simetri.

BAB II

PEMBAHASAN

Output: Data random binomial dengan n=50, number of trials=500, dan probability of success=0.2

DATA1 DATA290 107102 9892 106104 10295 92102 103105 89102 100101 91102 10388 8993 9693 9989 10486 97111 101104 111110 95108 11092 9595 10394 107104 96104 95102 97115 9978 103101 99106 9894 9393 78109 10090 9296 107102 102

94 101101 9698 98106 10695 10887 98106 107104 101104 101101 91106 9396 101113 11593 107100 100

a) Output: Daftar Tally ‘DATA1’ (simple)

Tally for Discrete Variables: DATA1

DATA1 Count 78 1 86 1 87 1 88 1 89 1 90 2 92 2 93 4 94 3 95 3 96 2 98 1 100 1 101 4 102 6 104 6 105 1 106 4 108 1 109 1 110 1 111 1 113 1 115 1 N= 50

Interpretasi: Jumlah data(N)=50, Count menampilkan hitungan atau frekuensi setiap

kelas, untuk daftar Tally diatas tidak mempunyai interval/panjang kelas, sehingga

datanya individual dan dapat dilihat nilai keseluruhan dari data, data diurutkan dari data

terkecil ke data terbesar(ascending).

Daftar Tally di atas menunjukkan data yang bernilai 78 berjumlah 1, 86 berjumlah 1, 87

berjumlah 1, 88 berjumlah 1, 89 berjumlah 1, 90 berjumlah 2, 92 berjumlah 2, dst.

Daftar Tally diatas merupakan daftar Tally yang sederhana dan dapat dikerjakan secara manual. Untuk daftar Tally yang lebih kompleks dapat dilihat di bawah ini.

Output: Daftar Tally ‘DATA1’ (complicated)


DATA1 Count CumCnt Percent CumPct 78 1 1 2.00 2.00 86 1 2 2.00 4.00 87 1 3 2.00 6.00 88 1 4 2.00 8.00 89 1 5 2.00 10.00 90 2 7 4.00 14.00 92 2 9 4.00 18.00 93 4 13 8.00 26.00 94 3 16 6.00 32.00 95 3 19 6.00 38.00 96 2 21 4.00 42.00 98 1 22 2.00 44.00 100 1 23 2.00 46.00 101 4 27 8.00 54.00 102 6 33 12.00 66.00 104 6 39 12.00 78.00 105 1 40 2.00 80.00 106 4 44 8.00 88.00 108 1 45 2.00 90.00 109 1 46 2.00 92.00 110 1 47 2.00 94.00 111 1 48 2.00 96.00 113 1 49 2.00 98.00 115 1 50 2.00 100.00 N= 50

Untuk daftar Tally diatas terlihat CumCnt (cumulative counts) yaitu menampilkan

frekuensi kumulatif setiap kelas, Percent menampilkan frekuensi relatif setiap kelas, dan

CumPct (cumulative percents) menampilkan frekuensi relatif kumulatif setiap kelas.

Output: Daftar Tally ‘DATA2’(simple)


DATA2 Count 78 1 89 2 91 2 92 2 93 2 95 3 96 3 97 2 98 4

99 3 100 3 101 5 102 2 103 4 104 1 106 2 107 5 108 1 110 1 111 1 115 1 N= 50

Interpretasi: Jumlah data(N)=50, Count menampilkan hitungan atau frekuensi setiap

kelas, untuk daftar Tally diatas tidak mempunyai interval/panjang kelas, sehingga

datanya individual dan dapat dilihat nilai keseluruhan dari data, data diurutkan dari data

terkecil ke data terbesar(ascending).

Daftar Tally diatas menunjukkan data yang bernilai 78 berjumlah 1, 89 berjumlah 2, 91

berjumlah 2, 92 berjumlah 2, 93 berjumlah 2, 95 berjumlah 3, 96 berjumlah 3, dst.

Output: Daftar Tally ‘DATA2’ (complicated)


DATA2 Count CumCnt Percent CumPct 78 1 1 2.00 2.00 89 2 3 4.00 6.00 91 2 5 4.00 10.00 92 2 7 4.00 14.00 93 2 9 4.00 18.00 95 3 12 6.00 24.00 96 3 15 6.00 30.00 97 2 17 4.00 34.00 98 4 21 8.00 42.00 99 3 24 6.00 48.00 100 3 27 6.00 54.00 101 5 32 10.00 64.00 102 2 34 4.00 68.00 103 4 38 8.00 76.00 104 1 39 2.00 78.00 106 2 41 4.00 82.00 107 5 46 10.00 92.00 108 1 47 2.00 94.00 110 1 48 2.00 96.00 111 1 49 2.00 98.00 115 1 50 2.00 100.00 N= 50

Untuk daftar Tally diatas terlihat CumCnt (cumulative counts) yaitu menampilkan

frekuensi kumulatif setiap kelas, Percent menampilkan frekuensi relatif setiap kelas, dan

CumPct (cumulative percents) menampilkan frekuensi relatif kumulatif setiap kelas.

Kelebihan daftar Tally:

Dapat melihat bentuk distribusi data

Dapat menghitung frekuensi dengan cepat

Melihat ada/tidaknya data ekstrim

Output: Stem and Leaf ‘DATA1’ dengan increment=100

Stem-and-Leaf Display: DATA1

Stem-and-leaf of DATA1 N = 50Leaf Unit = 10

22 0 7888899999999999999999(28) 1 0000000000000000000000001111

Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=100→leaf unit(unit

daun)=10. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom

kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat

dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke bawah. Tanda

kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut.



Stem-and-leaf of DATA1 N = 50Leaf Unit = 1.0

1 7 8 5 8 6789 22 9 00223333444555668(24) 10 011112222224444445666689 4 11 0135



kedua adalah batang(puluhan) dan kolom ketiga adalah daun(satuan). Terlihat(dapat

dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke bawah. Tanda

kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut.




1 78 0 1 79 1 80 1 81 1 82 1 83 1 84 1 85 2 86 0 3 87 0 4 88 0 5 89 0 7 90 00 7 91 9 92 00 13 93 0000 16 94 000 19 95 000 21 96 00 21 97 22 98 0 22 99 23 100 0(4) 101 0000 23 102 000000 17 103 17 104 000000 11 105 0 10 106 0000 6 107 6 108 0 5 109 0 4 110 0 3 111 0 2 112 2 113 0 1 1141 115 0


daun)=0.1. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom

kedua adalah batang(karena panjang kelasnya hanya 1, maka data dijabarkan seluruhnya

secara ascending) dan kolom ketiga adalah daun(satuan), karena pada batang telah

dijabarkan keseluruhan nilai dari data, maka otomatis daunnya pun bernilai 0.

Terlihat(dapat dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke

bawah. Tanda kurung (….) menunjukkan median(nilai tengah) data berada pada kelas

tersebut.



Stem-and-leaf of DATA2 N = 50Leaf Unit = 10

LO 7

24 0 88999999999999999999999(25) 1 0000000000000000000000011

HI 11




dibuktikan dengan boxplot) bahwa distribusi angkatan di atas mendekati normal. Tanda

kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut. Terlihat

adanya data ekstrim bawah(LO) dan data ekstrim atas(HI). Data ekstrim bawah berada

pada batang 0 dan daun 7(LO 7) atau data (0,7)→bernilai 78. Data ekstrim atas berada

pada batang 1 dan daun 1(HI 11) atau data (1,1)→bernilai 115.




LO 78

3 8 99 24 9 112233555666778888999(23) 10 00011111223333466777778 3 11 01

HI 115












LO 780

3 89 00 3 90 5 91 00 7 92 00 9 93 00 9 94 12 95 000 15 96 000 17 97 00 21 98 0000 24 99 000(3) 100 000 23 101 00000 18 102 00 16 103 0000 12 104 0 11 105 11 106 00 9 107 00000 4 108 0 3 109 3 110 0 2 111 0

HI 1150









b)

Output: Mean, StDev, Minimum, Maximum ‘DATA1’

Descriptive Statistics: DATA1

TotalVariable Count Mean StDev Minimum MaximumDATA1 50 99.12 7.65 78.00 115.00

Output: Mean, StDev, Minimum, Maximum ‘DATA2’

Descriptive Statistics: DATA2

TotalVariable Count Mean StDev Minimum MaximumDATA2 50 99.600 6.636 78.000 115.000

c)

Output: Mean, StDev, Minimum, Maximum dari kedua data(data gabungan)

Descriptive Statistics: DATA1+2

TotalVariable Count Mean StDev Minimum MaximumDATA1+2 100 99.360 7.132 78.000 115.000

Output: Perbandingan Mean, StDev, Minimum, Maximum dari DATA1, DATA2, dan DATA1+2(data gabungan)

Descriptive Statistics: DATA1, DATA2, DATA1+2

TotalVariable Count Mean StDev Minimum MaximumDATA1 50 99.12 7.65 78.00 115.00DATA2 50 99.600 6.636 78.000 115.000DATA1+2 100 99.360 7.132 78.000 115.000

Perbandingan mean antara DATA1, DATA2, dan data gabungan

o Selisih antara mean DATA1 dengan DATA2 adalah 0.48

o Selisih antara mean DATA1 dengan data gabungan adalah 0.24

o Selisih antara mean DATA2 dengan data gabungan adalah 0.24

Selisih mean antara DATA1 dan DATA2 dengan data gabungan adalah

sama 0.24, tetapi bukan berarti mean DATA1 dan DATA2 adalah sama,

mean DATA1 0.24 dibawah mean data gabungan, sedangkan mean

DATA2 0.24 diatas mean data gabungan.

Perbandingan standar deviasi antara DATA1, DATA2, dan data gabungan

o Selisih antara st.dev DATA1 dengan DATA2 adalah 1.014

o Selisih antara st.dev DATA1 dengan data gabungan adalah 0.518

o Selisih antara st.dev DATA2 dengan data gabungan adalah 0.496

Nilai minimum dan maksimum DATA1 dan DATA2 sama, maka otomatis nilai

minimum dan maksimum data gabungan pun sama.

d)Output: Boxplot data gabungan DATA1 dan DATA2

Interpretasi:

Boxplot menunjukkan bentuk distribusi data(normal/menjurai ke atas/menjurai ke bawah)

Boxplot diatas sedikit menjurai ke bawah.

Dari boxplot, kita dapat memperkirakan nilai dari Q1, median, Q3, nilai maksimum dan

minimum. Garis tengah dalam kotak menunjukkan median(bernilai 100.5). Garis

horizontal atasnya menunjukkan Q3(bernilai 104). Garis horizontal bawahnya

menunjukkan Q1(bernilai 94.25). Ujung atas garis vertikal menunjukkan nilai

maksimum(bernilai 115), dan ujung bawah garis vertikal menunjukkan nilai

minimum(bernilai 78←ditunjukkan oleh outlier).

Output: Boxplot hasil standarisasi mean

Interpretasi:

Standarisasi mean yaitu mengurangi setiap data dengan mean lalu dibagi dengan

standar deviasi(s). Standarisasi mean ini menghasilkan pusat data menjadi

0.159853(dapat dilihat pada pusat data di atas).

Output: Boxplot hasil standarisasi median

Standarisasi median yaitu mengurangi setiap data dengan median lalu

membaginya dengan range(jangkauan). Standarisasi median ini menghasilkan

pusat data menjadi 0(dapat dilihat pada pusat data di atas). Jadi dapat disimpulkan

bahwa standarisasi median lebih baik, karena tujuan dari standarisasi adalah

membuat pusat data menjadi 0.

Output: Boxplot sebelum dan sesudah standarisasi

e)

Boxplot di atas(hasil dari gabungan data1 dan data2) sama sekali belum

simetri(sangat menjurai ke bawah), untuk itu, perlu dilakukan transformasi

sampai data berdistribusi normal(pusat data berada di tengah-tengah). Berikut ini

adalah boxplot hasil transformasi yang sudah cukup simetris.

Data & Analytics

Analisis Data Eksploratif