Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
PRAKTIKUM STATISTIK INDUSTRI
MODUL VI (ANALISIS CLUSTER)
SESI / MEJA
LABORATORIUM STATISTIK DAN MANAJEMEN INDUSTRI
PROGRAM STUDI TEKNIK INDUSTRI
FAKULTAS TEKNIK
UNIVERSITAS PEMBANGUNAN NASIONAL “VETERAN”
JAWA TIMUR
TNR 10
Space 1.0
Bold,Italic All
LAPORAN RESMI
MODUL VI
ANALISIS CLUSTER
I. Pendahuluan
A. Latar Belakang
(3 Paragraf)
B. Rumusan Masalah
Adapun rumusan masalah pada modul 6 ini adalah:
“Bagaimana mengelompokkan objek-objek berdasarkan karakteristik
diantara objek-objek tertentu?”
C. Tujuan Praktikum
Adapun tujuan praktikum dari modul 6 adalah:
1.
D. Manfaat praktikum
Adapun manfaat yang didapat dari modul 6 adalah:
1.
E. Batasan masalah
Batasan masalah yang digunakan pada modul 6 adalah:
1. Data yang dianalisis adalah variabel yang ditanyakan pada responden.
2. Dalam menyelesaikan data tersebut dengan program IBM SPSS 20.
F. Asumsi-asumsi
Asumsi-asumsi yang digunakan pada modul 6 adalah:
1. Semua data yang ada merupakan data yang siap untuk diolah analisa
cluster.
2. Sampel yang diambil dapat mewakili populasi yang ada.
TNR 11, Bold Space 1.0
TNR 14, Bold
Space 1.5
TNR 12, Bold
Space 1.5
Margin 3433
Justify
Space 1.5
Before After 0
Bhs Asing Italic
For table:
TNR 11
Space 1,0
Before After 0
Autofit window
Minimal 3
Minimal 3
PRAKTIKUM STATISTIK INDUSTRI
MODUL VI (ANALISIS CLUSTER)
SESI / MEJA
TNR 10
Space 1.0
Bold,Italic All
II. Tinjauan Pustaka
A. Analisis Cluster
B. K-Means Cluster
C. Hierarchical Cluster
D. IBM SPSS 20
III. Pengumpulan Data
A. Identifikasi Variabel
Identifikasi variabel untuk laporan resmi modul 6 adalah:
1. Variabel Terikat
Variabel terikat adalah variabel yang perubahannya dipengaruhi variabel
lain, dalam hal ini variabel terikatnya adalah nilai skala likert/nilai kuisinoner.
2. Variabel Bebas
Variabel bebas adalah variabel yang mempengaruhi variabel terikat adapun
variabel bebas yang berpengaruh dalam hal ini adalah responden.
B. Soal Laporan Resmi
Sebuah kursus bahasa Mandarin yang bernama “Learn by Doing”
melakukan riset untuk mengetahui apa saja motivasi yang mendorong siswa untuk
mengikuti kursus bahasa Mandarin. Untuk itu, kepada setiap siswa diberikan
daftar kuisioner yang memuat pertanyaan tentang pendapat siswa terhadap
variabel-variabel yang mempengaruhi mereka mengikuti kursus bahasa Mandarin.
• Beberapa variabel yang digunakan:
2. Suka mempelajari Bahasa (Suka)
3. Perintah Orang Tua (Orang Tua)
4. Tertarik dengan bahasa Mandarin (Tertarik)
5. Untuk memperoleh sertifikat (Sertifikat)
6. Bahasa Mandarin populer di dunia (Populer)
7. Ingin lancar berbicara bahasa Mandarin (Lancar)
8. Untuk mendapat beasiswa (Beasiswa)
9. Untuk mempermudah mendapat pekerjaan (Kerja)
10. Ingin berlibur di Tiongkok (Liburan)
11. Agar lebih percaya diri (Percaya Diri)
Skala:
1 = Sangat tidak setuju
2 = Tidak Setuju
3 = Biasa
4 = Setuju
5 = Sangat Setuju
Minimal 10 halaman
PRAKTIKUM STATISTIK INDUSTRI
MODUL VI (ANALISIS CLUSTER)
SESI / MEJA
TNR 10
Space 1.0
Bold,Italic All
C. Tabel Pengumpulan Data
Tabel 3.1 Rekapan Pengumpulan Data
No
Nam
a
Su
ka
Ora
ng
Tu
a
Ter
tari
k
Ser
tifi
kat
Po
pu
ler
Lan
car
Bea
sisw
a
Ker
ja
Lib
ura
n
Per
cay
a D
iri
Gen
der
Usi
a
1 Bagus 2 3 2 2 2 2 3 3 3 2 L 18
2 Indra 3 1 3 2 2 3 2 2 3 2 L 19
3 Wahyu 2 1 2 2 1 2 1 1 1 1 L 17
4 Hindun 3 5 3 3 2 2 2 1 2 2 P 18
5 Zainab R 2 2 1 1 1 1 1 1 1 1 P 16
6 Sobari 2 2 4 4 3 3 2 2 3 3 L 16
7 Yahya 3 4 3 1 3 1 3 3 1 1 L 17
8 Mad 4 4 4 3 3 2 2 2 2 2 L 18
9 Wandi 3 3 3 2 3 3 1 4 2 2 L 18
10 Fadilah 4 1 3 4 4 3 1 1 1 1 P 19
11 Della O 2 5 2 1 2 2 1 1 2 1 P 20
12 Bayu 3 5 4 2 4 2 2 2 1 2 L 18
13 Icha 2 3 3 4 2 2 1 1 1 1 P 16
14 Chikita 4 4 3 4 5 4 3 4 3 3 P 17
15 Tris 4 2 4 4 3 5 3 4 5 3 P 18
16 Alpat 3 3 4 4 3 5 3 4 4 3 L 17
17 Sandy 2 4 4 2 3 2 1 1 1 1 L 18
18 Rafi 4 4 3 3 3 5 3 4 5 3 L 17
19 Gama 3 5 4 4 3 5 3 5 5 3 L 17
20 Tri Tutuko 5 3 5 4 3 5 3 4 5 3 P 20
21 Gigih 5 4 4 4 3 5 3 3 4 3 L 20
22 Safira 3 2 3 3 3 4 3 4 4 3 P 19
23 Yulianto 4 5 4 5 3 5 4 4 5 3 L 18
24 Sutrisno 4 2 4 4 3 4 3 4 3 3 L 18
25 Sri 5 4 4 4 4 4 3 3 3 3 P 17
26 Rio 4 4 4 4 4 4 3 4 4 3 L 16
27 Ginanjar 4 2 4 3 3 5 3 4 5 3 L 17
28 Emil 4 5 5 3 4 5 3 4 5 3 L 18
29 Ika T 5 4 4 4 3 5 3 4 5 3 P 19
30 Wawan 4 2 4 4 3 5 3 4 5 3 L 19
PRAKTIKUM STATISTIK INDUSTRI
MODUL VI (ANALISIS CLUSTER)
SESI / MEJA
TNR 10
Space 1.0
Bold,Italic All
IV. Pengolahan Data
A. Print Out dan Analisis Output
1. Non-Hirarki Cluster (K-Means Cluster)
Gambar 4.x Initial Cluster Centers
Analisis:
Tabel diatas merupakan tampilan pertama proses clustering data sebelum
dilakukan iterasi.
Pada cluster 1, variabel suka, tertarik dan lancar bernilai 5. Pada variabel
sertifikat dan kerja bernilai 4. Sedangkan pada variabel orang tua, popular,
beasiswa, dan percaya diri bernilai 3.
Pada cluster 2, (Idem)
Gambar 4.x Iteration History
PRAKTIKUM STATISTIK INDUSTRI
MODUL VI (ANALISIS CLUSTER)
SESI / MEJA
TNR 10
Space 1.0
Bold,Italic All
Tabel diatas menunjukkan bahwa proses clustering yang dilakukan melalui
3 tahapan iterasi untuk mendapatkan nilai yang optimum. Serta jarak minimum
antar pusat cluster yang terjadi sebesar 8,185.
Gambar 4.x Final Cluster Centers
Analisis:
Tabel diatas merupakan tampilan akhir proses clustering data setelah
dilakukan 3 tahapan iterasi.
Pada cluster 1 variabel lancar bernilai 5. Pada variabel suka, tertarik,
sertifikat, kerja, dan liburan bernilai 4. Sedangkan pada variabel orang tua,
popular, beasiswa dan percaya diri bernilai 3.
Pada cluster 2, (idem).
Gambar 4.x ANOVA
PRAKTIKUM STATISTIK INDUSTRI
MODUL VI (ANALISIS CLUSTER)
SESI / MEJA
TNR 10
Space 1.0
Bold,Italic All
Analisis:
Pada tabel ANOVA diatas variabel yang paling menunjukkan adanya
perbedaan adalah variabel lancar. Hal ini ditunjukkan dengan nilai F = 147,922
dan sig = 0,000. Sedangkan variabel yang paling menunjukkan adanya persamaan
adalah variabel orang tua dengan nilai F = 0,573 dan sig = 0,455. Sehingga,
semakin besar nilai F, maka semakin besar pula perbedaan variabel pada cluster
yang terbentuk.
Gambar 4.x Number of Case in Each Cluster
Analisis:
Tabel diatas menunjukkan bahwa cluster 1 beranggotakan 16 responden,
cluster 2 beranggotakan 14 responden. Maka didapat semua responden bertotal
(N) 30 orang dengan 0 data yang hilang (Missing).
2. Hirarki Cluster (Hierarchical Cluster)
Gambar 4.x Case Processing Sumarry
Analisis:
Dengan jumlah data (N) 30 yang valid adalah 100.0%. Tidak ada data
yang keluar atau missing karena nilai yang ditunjukkan N pada kolom missing
adalah 0 dengan presentase 0%. Maka total jumlah data atau case (N) adalah 30
dengan total presentase 100.0%
PRAKTIKUM STATISTIK INDUSTRI
MODUL VI (ANALISIS CLUSTER)
SESI / MEJA
TNR 10
Space 1.0
Bold,Italic All
Gambar 4.x Nilai Proximity Matrix
Analisis:
Responden dengan jarak Euclidean terkecil adalah Ginanjar (27)-Wawan
(30) dengan nilai koefisien 1,000. Semakin kecil nilai koefisien maka semakin
mempunyai selera yang sama atau kesamaan dalam pemilihan. Maka Ginanjar
(27)-Wawan (30) memiliki persepsi yang sama dalam pengisian kuisioner
mengenai motivasi mengikuti kursus bahasa Mandarin.
PRAKTIKUM STATISTIK INDUSTRI
MODUL VI (ANALISIS CLUSTER)
SESI / MEJA
TNR 10
Space 1.0
Bold,Italic All
Gambar 4.x Agglomeration Schedule
Analisis:
Tabel diatas merupakan hasil proses clustering dengan metode Between
group linkage dan jarak antar variabel diukur (measure) dengan Euclidean, maka
dilakukan pengelompokan yang dilakukan secara bertingkat.
Pada stage 1, membentuk cluster yang beranggotakan Tris (15) dan Wawan
(30) dengan jarak 0,000. Selanjutnya dilanjutkan ke stage 2 (Next Stage).
Pada stage 2, terdapat Tris (15) dan Ginanjar (27) dengan jarak 1.000.
Selanjutnya dilanjutkan ke stage 6 (Next Stage). Pada stage 6, terdapat Tris
(15) dan Alpat (16) dengan jarak 3.333. Selanjutnya dilanjutkan ke stage 11
(Next Stage). Pada stage 11, terdapat Tris (15) dan Safira (22) dengan jarak
Mulai stage 1
dilanjutkan ke stage 2
(perhatikan next stage)
dan seterusnya sampai
berhenti.
Jika stage mengarah
pada angka / stage yang
sudah dilewati, maka
dilihat stage yang
belum dianalisis dan
dilanjutkan sampai
seluruh stage terlewati.
PRAKTIKUM STATISTIK INDUSTRI
MODUL VI (ANALISIS CLUSTER)
SESI / MEJA
TNR 10
Space 1.0
Bold,Italic All
4.750. Selanjutnya dilanjutkan ke stage 20 (Next Stage). Pada stage 20,
terdapat Chikita (14) dan Tris (15) dengan jarak 9.533. Selanjutnya
dilanjutkan ke stage 29 (Next Stage). Pada stage 29, terdapat Bagus (1) dan
Chikita (14) dengan jarak 39.955. Dengan demikian, cluster beranggotakan
x orang yaitu Safira(22), Tris(15), Bagus(1), Chikita(14), Alpat(16),
Ginanjar(27) dan Wawan(30).
Pada stage 5, membentuk cluster yang beranggotakan (dilanjutkan
sendiri).
Pada stage x, (idem)
Gambar 4.x Cluster Membership
Analisis:
Untuk cluster membership dengan 4 cluster yang termasuk dalam cluster 1
adalah Bagus, Hindun, Yahya, Mad, Wandi, Della O, Bayu, Icha dan Sandi. Yang
PRAKTIKUM STATISTIK INDUSTRI
MODUL VI (ANALISIS CLUSTER)
SESI / MEJA
TNR 10
Space 1.0
Bold,Italic All
termasuk cluster 2 adalah Indra, Sobari dan Fadilah. Yang termasuk cluster 3
adalah Wahyu dan Zainab. Sedangkan yang termasuk cluster 4 adalah Chikita,
Tris, Alpat, Rafi, Gama, Tri Tutuko, Gigih, Safira, Yulianto, Sutrisno, Sri, Rio,
Ginanjar, Emil, Ika T dan Wawan.
Gambar 4.x Dendogram
Analisis:
Dari dendogram dapat terlihat responden terbagi atas dua cluster besar
yaitu cluster 1 beranggotakan Tris sampai dengan Emil dan cluster 2
beranggotakan Wahyu sampai dengan Fadilah. Dan seterusnya terbagi menjadi
PRAKTIKUM STATISTIK INDUSTRI
MODUL VI (ANALISIS CLUSTER)
SESI / MEJA
TNR 10
Space 1.0
Bold,Italic All
cluster yang lebih kecil berdasarkan kemiripan persepsi responden dalam
pengisian kuisioner mengenai motivasi mengikuti kursus bahasa Mandarin.
V. Kesimpulan dan Saran
A. Kesimpulan
Adapun kesimpulan yang diperoleh dari modul 6 adalah:
Non-Hirarki Cluster (K-Means Cluster)
Proses clustering yang dilakukan melalui 3 tahapan iterasi untuk
mendapatkan nilai yang optimum. Serta jarak minimum antar pusat cluster yang
terjadi sebesar 8,185.
Pada cluster 1 variabel lancar bernilai 5. Pada variabel suka, tertarik,
sertifikat, kerja, dan liburan bernilai 4. Sedangkan pada variabel orang tua,
popular, beasiswa dan percaya diri bernilai 3.
Pada cluster 2, (idem)
Dan didapat semua responden bertotal (N) 30 orang dengan 0 data yang
hilang (Missing). Dengan variabel yang paling menunjukkan adanya perbedaan
adalah variabel lancar. Hal ini ditunjukkan dengan nilai F = 147,922 dan sig =
0,000. Sedangkan variabel yang paling menunjukkan adanya persamaan adalah
variabel orang tua dengan nilai F = 0,573 dan sig = 0,455. Sehingga, semakin
besar nilai F, maka semakin besar pula perbedaan variabel pada cluster yang
terbentuk.
Hirarki Cluster (Hierarchical Cluster)
Pada Hirarki Cluster (Hierarchichal Cluster) diperoleh hasil bahwa
dengan jumlah data atau case (N) 30 data atau case yang valid adalah 100,0%.
Tidak ada data atau case yang keluar atau missing atau tidak valid karena nilai
yang ditunjukan jumlah data atau case (N) 0 dengan persentase 0. Maka total
jumlah data atau case (N) adalah 30 dengan total persentase 100%.
Responden dengan jarak Euclidean terkecil adalah Ginanjar (27)-Wawan
(30) dengan nilai koefisien 1,000. Semakin kecil nilai koefisien maka semakin
mempunyai selera yang sama atau kesamaan dalam pemilihan. Maka Ginanjar
(27)-Wawan (30) memiliki persepsi yang sama dalam pengisian kuisioner
mengenai motivasi mengikuti kursus bahasa Mandarin.
Jangan lupa diisi
PRAKTIKUM STATISTIK INDUSTRI
MODUL VI (ANALISIS CLUSTER)
SESI / MEJA
TNR 10
Space 1.0
Bold,Italic All
B. Saran
Adapun saran untuk modul 6 ini antara lain:
1.
DAFTAR PUSTAKA
Anonim. 2020. ”Uji Validitas”. https://www.mencoba coba/. Diakses pada 35 April 2123
pukul 24.01 WIB.
Husein, Kamal. 2021. “Ini Contoh Cari Sendiri”. Surabaya: Lab Statistik Industri
Minimal 3
3 Buku, 3 Web Browsing Tahun 2015