22
Oleh: Bambang Widjanarko Otok CLUSTER ANALYSIS CLUSTER ANALYSIS

Analisis Klaster

Embed Size (px)

DESCRIPTION

kep

Citation preview

Page 1: Analisis Klaster

Oleh: Bambang Widjanarko Otok

CLUSTER ANALYSIS CLUSTER ANALYSIS

Page 2: Analisis Klaster

Klasifikasi Metode Statistika

METODE STATISTIKA

HUBUNGAN PENGARUH

KORELASI REGRESI

TABEL KONTINGENSI

LOG-LINIER

REGRESI LOGISTIK

REGRESI PROBIT

REGRESI TOBIT

PERBEDAAN

Uji ZUji t

ANOVA

MANOVA

AnalisisTime Series

KLASIFIKASI

Analisis Cluster

Analisis Diskriminan

Page 3: Analisis Klaster

SKEMA Masalah Klasifikasi (Pengelompokkan)

KLASIFIKASI(PENGELOMPOKKAN)

KELOMPOKBELUM DIKETAHUI

KELOMPOKSUDAH DIKETAHUI

ANALISIS KELOMPOK(CLUSTER ANALYSIS)

ANALISIS DISKRIMINAN(DISCRIMINANT ANALYSIS)

REGRESI POHON(CART)

K-NN

REGRESI LOGISTIK,REGRESI ORDINAL

REGRESI POHON(CART)

NEURAL NETWORKNEURAL NETWORK

Multivariate Adaptive Regression Splines(MARS)

Mulivariate Adaptive Regression Splines(MARS)

Page 4: Analisis Klaster

Analisis kelompok digunakan untuk mengelompokkan obyek-obyek pengamatan menjadi beberapa kelompok berdasarkan pengukuran variabel-variabel yang di amati, sehingga obyek dalam kelompok yang sama mirip dan antar kelompok tidak mirip

Analisis kelompok adalah suatu teknik yang digunakan untuk mengkombinasikan pengamatan ke dalam kelompok (cluster) dengan masing-masing kelompok (cluster) adalah homogen berkenaan dengan karakteristik tertentu. Ini menunjukkan bahwa pengamatan pada setiap kelompok adalah serupa untuk satu sama lain

Masing-Masing kelompok harus berbeda dari kelompok lainnya berkenaan dengan karakteristik yang sama; yang berarti pengamatan satu kelompok harus berbeda dari pengamatan lain kelompok

Pengertian Analisis Kelompok

Page 5: Analisis Klaster

Eksplorasi Data untuk mendapatkan gambaran tentang informasi yang ada dalam himpunan data tersebut

bahkan sampai pada pembangkitan hipotesis untuk melihat struktur populasinya

Reduksi Data untuk mewakili seluruh anggota kelompok tersebut dengan suatu informasi ringkasan dari

kelompok tersebut

Pelapisan atau pemisahan obyek-obyek Hasil pengelompokkan dari analisis kelompok dapat digunakan sebagai pelapisan atau

stratifikasi dalam penarikan sampel

Manfaat Pengelompokan

Page 6: Analisis Klaster

ANALISIS KELOMPOK(CLUSTER ANALYSIS)

HIERARKHI TAK HIERARKHI

Pautan Tunggal (Single Linkage/Nearest Neighbor) K-RATAAN

Pautan Lengkap (Complete Linkage/Farthest Neighbor)

Pautan Rataan(Average-Linkage Between Method)

Sentroid (Centroid Clustering)

Median Clustering

Ward’s Method

Klasifikasi METODE Analisis Kelompok

Page 7: Analisis Klaster

Tabel 1. Ukuran Ketakmiripan untuk data Interval

Page 8: Analisis Klaster

dk(i,j) = min (dki,dkj)Pautan Tunggal (Single Linkage/Nearest Neighbor)Pautan Lengkap (Complete Linkage/Farthest Neighbor)

dk(i,j) = maks (dki,dkj)

Pautan Rataan (Average Linkage/BAVERAGE) kj

ji

jki

ji

ijik d

nn

nd

nn

nd

),(

Sentroid (Centroid Clustering) ij2

ji

jikj

ji

jki

ji

ijik d

nn

nnd

nn

nd

nn

nd

)(

.),(

Median Clustering

Ward’s MethodMin ESS

TEKNIK PENGELOMPOKKAN

Page 9: Analisis Klaster

Misalkan ada himpunan obyek dan untuk tiap obyek diamati 2 peubah/variabel. Ingin diketahui apakah himpunan obyek tersebut mengelompok menjadi kelompok-kelompok di mana obyek dalam kelompok yang sama mirip dan antar kelompok tidak mirip satu dengan lainnya. Data tersaji sebagai berikut:

Observasi

Variabel

X1 X2

O1 5 5

O2 6 6

O3 15 14

O4 16 15

O5 25 20

O6 30 19

CONTOH 1:

Gunakan ukuran ketakmiripan Jarak Euclid Kuadrat dan beberapa teknik pengelompokkan

Page 10: Analisis Klaster

ObservasiVariabel

X1 X2

O1 5 5

O2 6 6

O3 15 14

O4 16 15

O5 25 20

O6 30 19

JARAK

Page 11: Analisis Klaster

PROXIMITY MATRIX

ObservasiObservasi

O1 O2 O3 O4 O5 O6

O1 0 2 181 221 625 821

O2 0 145 181 557 745

O3 0 2 136 250

O4 0 106 212

O5 0 26

O6 0

Page 12: Analisis Klaster

TEKNIK PENGELOMPOKKAN SENTROID

Observasi

Observasi

O1 O2 O3 O4 O5 O6

O1 0 2181

221

625

821

O2 0145

181

557

745

O3 0 2136

250

O4 0106

212

O5 0 26

O6 0

Kelompok

Pengelompokan

Variabel

X1 X2

1 O1,O2 5.5 5.5

2 O3 15 14

3 O4 16 15

4 O5 25 20

5 O6 30 19

Langkah 1:

Page 13: Analisis Klaster

Langkah 2:

Observasi

Observasi

O1,O2 O3 O4 O5 O6

O1, O2 0162.

00

200.50

590.50

782.50

O3 0 2135.

96

250.00

O4 0106.

00

212.00

O5 026.0

0

O6 0

Kelompok

Pengelompokan

Variabel

X1 X2

1 O1,O2 5.5 5.5

2 O3,O415.

514.

5

3 O5 25 20

4 O6 30 19

Page 14: Analisis Klaster

Observasi

Observasi

O1,O

2

O3,O

4

O5 O6

O1,O2 0181.

00

590.50

782.50

O3,O4 0120.

50

230.50

O5 026.0

0

O6 0

Kelompok

Pengelompokan

Variabel

X1 X2

1 O1,O2 5.5 5.5

2 O3,O415.

514.

5

3 O5,O627.

519.

5

Langkah 3:

Page 15: Analisis Klaster

Observasi

Observasi

O1,O

2

O3,O

4

O5,O

6

O1,O2 0181.

00

680.00

O3,O4 0169.

00

O5,O6 0

Kelompok

Pengelompokan

Variabel

X1 X2

1 O1,O2 5.5 5.5

2 (O3,O4),(O5,O6)21.

517

ObservasiObservasi

O1,O2 O3,O4,O5,O6

O1,O2 0 388.25

O3,O4,O5,O

6

0

Langkah 4:

Page 16: Analisis Klaster

Dendogram TEKNIK PENGELOMPOKKAN SENTROID

Page 17: Analisis Klaster
Page 18: Analisis Klaster

STUDI KASUS: Pengelompokan Wilayah Berdasarkan PDRB

Ambil 3 Kelompok

Page 19: Analisis Klaster
Page 20: Analisis Klaster

Deskripsi 3 Kelompok

Page 21: Analisis Klaster

DAFTAR PUSTAKAAitchison, J. and Aitken, C.G.G., 1976, Multivariate Binary Discriminantion by the Kernel Method, Biometrics, Vol 63, 413-420.Banks, D., Olszewski, R.T. and Maxion R.A 1999. Comparing Methods for Multivariate Nonparametric Regression. School of Computer Science, Carnegie Mellon University, Pittsburgh, PA, 15213.Breiman, L., Friedman, J., Olshen, R.A. and Stone, C. 1984. Classification and Regression Tress, Wadsworth, Belmont, CA.Caccuolus, T. 1973, Discriminant Analysis and Applications, Academic Press, New York.Chatfield, C., and Collins, A.J., 1980, Introduction to Multivariate Analysis, Chapman and Hall, New York.Dillon, W.R. 1978, On the Performance of Some Multinomial Classification Rules, Journal of American Statistical Association, 73, pp.305-313Dillon, W.R. and M. Goldstein, 1978, Multivariate Analysis Methods and Application, John Wiley & Sons, New York.Dudoit, S., Fridlyand, J. and Speed, T.P. 2002. Comparison of Discriminantion Methods for the Classifications of Tumors Using Gene Expression Data. Journal of the American Statistical Association, 97(457): 77 – 87.Habbema, J.D.F, 1976, Multivariate Discriminantion Method for Top Quark Analysis, Techonometrics, 39, 91-99.Hair, J. F. JR., Anderson, R.E., Tatham, R.L. and Black, W.C. 1998. Multivariate Data Analysis, Fifth Edition, Prentice-Hall, International, Inc.Holmstrom, L. and Sain, S.R. 1997. Multivariate Discriminant Methods for Top Quark Analysis, Technometrics, 39, 1, 91-99.Huberty, C.J. 1994. Applied Discriminant Analysis. A Wiley-Interscience Publication. John Wiley & Sons, Inc.Johnson RA and Wichern DW. 1992. Applied Multivariate Statistical Analysis, Prentice Hall, Englewood Chiffs, New Jersey.Manly, B.F.J. 1986. Multivariate Statistical Methods. A Primer Chapman & Hall. London.Michie, D., Spiegelhalter, D.J. and Taylor C.C. 1994. Machine Learning, Neural and Statistical Classification. Portier, K.M, 2001, Multivariate Statistical Methods, STA4702/5701.Sharma, S. 1996 . Applied Multivariate Techniques, John Wiley & Sons, Inc.

Page 22: Analisis Klaster

TERIMA KASIH