13
1 HIERARCHICAL CLUSTERING VIA MINIMAX LINKAGE PADA PENGELOMPOKKAN KECAMATAN DI PULAU MADURA BERDASARKAN INDIKATOR PEMERATAAN PENDIDIKAN Padmi Ganifandari 1 , Dwiatmono Agus W. 2 1 Mahasiswa Jurusan Statistika FMIPA-ITS, 2 Dosen Jurusan Statistika FMIPA-ITS, Abstrak Pulau Madura secara geografis sangat strategis berada di antara Laut Jawa dan Selat Madura yang menyimpan banyak potensi. Madura terdiri dari empat kabupaten, yaitu Bangkalan, Sampang, Pamekasan dan Sumenep. Pendidikan sangat berpengaruh terhadap kemajuan suatu daerah dan pemerataan pendidikan sangat diperlukan karena dapat meningkatkan kesejahteraan masyarakat secara merata. Hal ini mendorong penelitian- penelitian mengenai pemerataan pendidikan semakin dikembangkan, salah satunya dalam hal pengelompokkan kecamatan berdasarkan indikator pemerataan pendidikan. Pengelompokkan kecamatan penting dilakukan dalam rangka membantu pihak terkait membuat perencanaan dan kebijakan yang sesuai, Pada penelitian ini digunakan metode single, complete, average, dan minimax linkage, kemudian dilakukan perbandingan antara keempat metode tersebut. Hasil analisis data indikator pemerataan pendidikan di kecamatan-kecamatan pulau Madura menunjukkan bahwa metode minimax linkage merupakan metode pengelompokkan terbaik dengan jumlah kelompok optimum sebanyak 3. Kata kunci : minimax linkage, pemerataan pendidikan, Madura 1. Pendahuluan Jembatan Suramadu adalah jembatan yang melintasi Selat Madura, menghubungkan Pulau Jawa (di Surabaya) dan Pulau Madura (di Bangkalan, tepatnya timur Kamal). Menurut Keputusan Presiden Nomor 79 Tahun 2003 tentang tujuan dibangunnya jembatan Suramadu adalah untuk lebih meningkatkan pembangunan di Pulau Madura, sebagai upaya dalam memacu perluasan kawasan industri, perumahan, dan sektor lainnya, serta mendorong pertumbuhan ekonomi masyarakat dengan menghubungkan Pulau Jawa dan Madura. Tujuan tersebut dapat tercapai jika terdapat sumber daya manusia (SDM) yang kreatif dan memiliki tingkat pendidikan yang optimal. Tingkat pendidikan warga Madura selama kurun waktu sampai sekarang ini, merupakan salah satu indikator penting akan ketersediaan sumber daya manusia (SDM) lokal yang handal. Oleh karena itu, pemerataan pendidikan sangat diperlukan karena dapat meningkatkan kesejahteraan masyarakat secara merata. Hal ini mendorong penelitian-penelitian mengenai pemerataan pendidikan semakin dikembangkan, salah satunya dalam hal pengelompokkan kecamatan berdasarkan indikator pemerataan pendidikan. Pengelompokkan kecamatan penting dilakukan dalam rangka membantu pihak terkait membuat perencanaan dan kebijakan yang sesuai, khususnya untuk kecamatan di pulau Madura. Upaya pengelompokkan ini diharapkan mampu menggabungkan kecamatan yang memiliki kesamaan pada beberapa indikator pemerataan pendidikan. Metode pengelompokkan yang biasa digunakan pada hierarchical clustering yaitu single linkage, complete linkage, average linkage, dan sebagainya. Namun pada tahun 2011, Jacob Bien dan Robert Tibshirani memperkenalkan metode hierarchical clustering via minimax linkage. Minimax linkage memiliki beberapa kelebihan, salah satunya yaitu robust terhadap gangguan berupa outlier. Untuk mendapatkan hasil pengelompokkan yang baik, penelitian ini melakukannya pada beberapa metode hierarchical clustering, kemudian dipilih hasil yang terbaik. Dengan adanya penelitian ini diharapkan mampu menunjukkan kelompok-kelompok kecamatan dan permasalahan- permasalahannya yang perlu mendapatkan perhatian dalam upaya pemerataan pendidikan dan diharapkan dapat membantu pemerintah dalam mengambil suatu kebijakan tentang pendidikan. Tujuan pada penelitian ini antara lain, mendapatkan karakteristik kecamatan dengan analisis statistika deskriptif, membandingkan hasil pengelompokkan kecamatan dengan metode hierarchical clustering dengan single linkage, complete linkage, average linkage, dan minimax linkage dan mendapatkan

HIERARCHICAL CLUSTERING VIA MINIMAX LINKAGE PADA ... · 1 HIERARCHICAL CLUSTERING VIA MINIMAX LINKAGE PADA PENGELOMPOKKAN KECAMATAN DI PULAU MADURA BERDASARKAN INDIKATOR PEMERATAAN

  • Upload
    tranbao

  • View
    252

  • Download
    0

Embed Size (px)

Citation preview

1

HIERARCHICAL CLUSTERING VIA MINIMAX LINKAGE PADA PENGELOMPOKKAN KECAMATAN DI PULAU MADURA

BERDASARKAN INDIKATOR PEMERATAAN PENDIDIKAN

Padmi Ganifandari1, Dwiatmono Agus W.21Mahasiswa Jurusan Statistika FMIPA-ITS, 2Dosen Jurusan Statistika FMIPA-ITS,

Abstrak

Pulau Madura secara geografis sangat strategis berada di antara Laut Jawa dan Selat Madura yang menyimpan banyak potensi. Madura terdiri dari empat kabupaten, yaitu Bangkalan, Sampang, Pamekasan dan Sumenep. Pendidikan sangat berpengaruh terhadap kemajuan suatu daerah dan pemerataan pendidikan sangat diperlukan karena dapat meningkatkan kesejahteraan masyarakat secara merata. Hal ini mendorong penelitian-penelitian mengenai pemerataan pendidikan semakin dikembangkan, salah satunya dalam hal pengelompokkan kecamatan berdasarkan indikator pemerataan pendidikan. Pengelompokkan kecamatan penting dilakukan dalam rangka membantu pihak terkait membuat perencanaan dan kebijakan yang sesuai, Pada penelitian ini digunakan metode single, complete, average, dan minimax linkage, kemudian dilakukan perbandingan antara keempat metode tersebut. Hasil analisis data indikator pemerataan pendidikan di kecamatan-kecamatan pulau Madura menunjukkan bahwa metode minimax linkage merupakan metode pengelompokkan terbaik dengan jumlah kelompok optimum sebanyak 3.Kata kunci : minimax linkage, pemerataan pendidikan, Madura

1. PendahuluanJembatan Suramadu adalah jembatan yang melintasi Selat Madura, menghubungkan Pulau

Jawa (di Surabaya) dan Pulau Madura (di Bangkalan, tepatnya timur Kamal). Menurut Keputusan Presiden Nomor 79 Tahun 2003 tentang tujuan dibangunnya jembatan Suramadu adalah untuk lebih meningkatkan pembangunan di Pulau Madura, sebagai upaya dalam memacu perluasan kawasan industri, perumahan, dan sektor lainnya, serta mendorong pertumbuhan ekonomi masyarakat dengan menghubungkan Pulau Jawa dan Madura. Tujuan tersebut dapat tercapai jika terdapat sumber daya manusia (SDM) yang kreatif dan memiliki tingkat pendidikan yang optimal. Tingkat pendidikan warga Madura selama kurun waktu sampai sekarang ini, merupakan salah satu indikator penting akan ketersediaan sumber daya manusia (SDM) lokal yang handal. Oleh karena itu, pemerataan pendidikan sangat diperlukan karena dapat meningkatkan kesejahteraan masyarakat secara merata. Hal ini mendorong penelitian-penelitian mengenai pemerataan pendidikan semakin dikembangkan, salah satunya dalam hal pengelompokkan kecamatan berdasarkan indikator pemerataan pendidikan. Pengelompokkan kecamatan penting dilakukan dalam rangka membantu pihak terkait membuat perencanaan dan kebijakan yang sesuai, khususnya untuk kecamatan di pulau Madura. Upaya pengelompokkan ini diharapkan mampu menggabungkan kecamatan yang memiliki kesamaan pada beberapa indikator pemerataan pendidikan.

Metode pengelompokkan yang biasa digunakan pada hierarchical clustering yaitu single linkage, complete linkage, average linkage, dan sebagainya. Namun pada tahun 2011, Jacob Bien dan Robert Tibshirani memperkenalkan metode hierarchical clustering via minimax linkage. Minimax linkage memiliki beberapa kelebihan, salah satunya yaitu robust terhadap gangguan berupa outlier.Untuk mendapatkan hasil pengelompokkan yang baik, penelitian ini melakukannya pada beberapa metode hierarchical clustering, kemudian dipilih hasil yang terbaik. Dengan adanya penelitian ini diharapkan mampu menunjukkan kelompok-kelompok kecamatan dan permasalahan-permasalahannya yang perlu mendapatkan perhatian dalam upaya pemerataan pendidikan dan diharapkan dapat membantu pemerintah dalam mengambil suatu kebijakan tentang pendidikan. Tujuan pada penelitian ini antara lain, mendapatkan karakteristik kecamatan dengan analisis statistika deskriptif, membandingkan hasil pengelompokkan kecamatan dengan metode hierarchical clusteringdengan single linkage, complete linkage, average linkage, dan minimax linkage dan mendapatkan

2

kecamatan yang berkelompok dan menganalisis kaerakteristik kecamatan berdasarkan hasil pengelompokkan terbaik, dan mengelompokkan kecamatan di tiap kabupaten dengan metode minimax linkage.

2. Tinjauan PustakaUntuk menyelesaikan permasalahan dalam penelitian ini, perlu adanya pendalaman teori yang

akan diuraikan sebagai berikut.

2.1 Analisis FaktorUji asumsi yang digunakan sebelum melakukan analisis faktor yaitu pengujian kecukupan data

dan uji korelasi antar variabel. Secara statistik pengujian kecukupan data atau sampel dapat diidentifikasi melalui nilai Kaiser-Meyer-Olkin (KMO) dan Measure of Sampling Adequency (MSA). Hipotesis dari KMO adalah sebagai berikut :H0 : Jumlah data cukup untuk difaktorkan H1 : Jumlah data tidak cukup untuk difaktorkanStatistik uji :

KMO =

p

1i

p

1i

p

1j

2ij

p

1j

2ij

p

1i

p

1j

2ij

ar

r

MSA =

p

jij

p

jij

p

jij

ar

r

1

2

1

2

1

2

(1)

Dimana :i = 1, 2, 3, ..., p dan j = 1, 2, ..., p serta i ≠ j rij = Koefisien korelasi antara variabel i dan jaij = Koefisien korelasi parsial antara variabel i dan j

Jika nilai KMO dan MSA > 0,5 maka data cukup untuk difaktorkan. Secara umum data yang dapat digunakan untuk analisis faktor yaitu sampel data pengamatan yang digunakan harus melebihi jumlah variabel (Hair, Black, Babin, dan Anderson, 2010).

Pengujian korelasi antar variabel dilakukan dengan uji Bartlet, hipotesis yang digunakan sebagai berikut (Morrison, 2005).

H0 : Matriks korelasi merupakan matriks identitasH1 : Matriks korelasi bukan matriks identitas

Statistik uji : Rp

nhitung ln6

52)1(2

(2)

Daerah Penolakan : 2

)1(2

1, pp

Keputusan : Tolak hipotesis H0 jika 2

)1(2

1,

2

pphitung

Dimana, n = Jumlah observasi p = Jumlah variabel| | = Determinan dari matriks korelasi

Analisis faktor pada prinsipnya digunakan untuk mereduksi data, yaitu proses untuk meringkas sejumlah variabel menjadi sedikit dan menamakannya sebagai faktor. Apabila terdapat vektor acak x’= (x1, x2, ..., xp) mempunyai matrik korelasi R dan memiliki nilai mean μ maka model analisis faktor adalah :

1121211111 mm FFFX (3)

pmpmpppp FFFX 2211

Dimana : Fj = Common factor ke-j Lij = Loading factor ke-j dari variabel ke-i ε j = specific factor ke-i

3

i = 1, 2, . . . , p dan j = 1, 2, . . . , m Nilai eigenvalue yang dijadikan acuan untuk menentukan banyaknya faktor yang terbentuk

adalah nilai eigenvalue yang lebih besar dari satu. Rotasi faktor memiliki tujuan untuk menyederhanakan struktur dengan mentransformasi faktor untuk mendapatkan faktor baru yang lebih mudah untuk diinterpretasikan.

Metode rotasi ada dua macam yaitu rotasi orthogonal, dan rotasi oblique. Rotasi orthogonalada 3 macam yaitu varimax, quartimax dan equamax. (Dillon dan Goldstein, 1981 diacu dalam Purwaningsih, 2004). Prosedur dari metode varimax dengan meminimalkan jumlah variabel yang mempunyai loading tinggi pada suatu faktor (Norusis, 1986 diacu dalam Purwaningsih, 2004).

2.2 Analisis ClusterAnalisis cluster atau biasa disebut analisis kelompok digunakan untuk mengelompokkan objek

pengamatan berdasarkan karakteristik-karakteristik yang dimiliki. Pengelompokkan dilakukan dengan memaksimalkan kehomogenan objek pengamatan dalam satu cluster sekaligus memaksimalkan keheterogenan antar cluster. Analisis kelompok terdiri atas prosedur hirarki dan non-hirarki.

Prosedur cluster hirarki terdiri atas dua metode yaitu agglomerative dan divisive. Adapun beberapa algoritma metode agglomerative yang digunakan untuk membentuk kelompok (cluster) adalah single linkage, complete linkage, dan average linkage (Johnson dan Winchern, 2007).

Untuk menghitung jarak antar kelompok digunakan suatu fungsi yang disebut jarak (distance). Salah satu distance adalah dengan menggunakan fiungsi jarak Euclidean dimana formulanya sebagai berikut (Johnson dan Winchern, 2007) :

p

kjkikij xxd

1

2(4)

a. Single LinkageMetode pautan tunggal (single linkage) prosedurnya berdasarkan jarak minimum, dengan

rumus sebagai berikut (Johnson dan Winchern, 2007) :),min(),( jkikkji ddd (5)

dimana : - dik = jarak antara kelompok i dan k - djk = jarak antara kelompok j dan k

b. Complete LinkageComplete linkage adalah proses clustering yang didasarkan pada jarak terjauh antar

obyeknya ( maksimum distance). ),max(),( jkikkji ddd (6)

c. Average LinkageAverage linkage adalah proses clustering yang didasarkan pada jarak rata-rata antar

obyeknya (average distance). ),(),( jkikkji ddaveraged (7)

d. Minimax LinkageBien dan Thibshirani (2011), minimax linkage merupakan metode hierarchical clustering yang

dikembangkan dari metode single, complete, dan average linkage serta centroid linkage. Minimax linkage adalah pengelompokkan berdasarkan nilai minimum dari jarak yang maksimum. Definisi minimax linkage antar dua cluster G dan H yaitu : )',(maxmin),(

'xxdHGd

HGxHGx (8)

Sifat-sifat minimax linkage yaitu :1. Dendrogram dari minimax linkage tidak memiliki inversions.2. Minimax linkage menghasilkan k-group yang terstruktur dengan baik.

Sebuah linkage dapat menghasilkan k-group yang terstruktur dengan baik jika pada clusterC1,…,Ck jarak antar semua anggota cluster lebih kecil daripada jarak antar cluster (homogenitasdalam cluster lebih besar daripada heterogenitas antar cluster). Hierarchical clustering akan terbentuk setelah proses penggabungan sebanyak n – k.

3. Adanya jarak antar anggota cluster yang sama tidak mempengaruhi bentuk cluster dan memiliki sifat transformasi monoton. Transformasi monoton akan memelihara jarak antar anggota cluster,

4

paling tidak mendekati jarak awalnya.Single dan complete linkage juga memiliki kedua sifat tersebut, sedangkan average linkage

tidak memilikinya. Kedua sifat ini menunjukkan bahwa minimax linkage robust terhadap gangguan, misalnya gangguan berupa outlier. Fisher dan Van Ness (1971) menyatakan bahwa aspek pengukuran jarak pada cluster lebih penting daripada kepadatan (jumlah) point dalam cluster.

4. Minimax linkage memenuhi sifat reducibility. Gordon (1987), clustering yang menggunakan linkage juga membutuhkan sifat reducibility,

dimana untuk setiap cluster G1, G2, H,d(G1G2, H) ≥ min{ d(G1, H), d(G2, H)} (9)

Reducibility menunjukkan bahwa cluster baru yang terbentuk yaitu G1G2 memiliki jarak sejauh mungkin dengan H, daripada jarak antara G1 atau G2 terhadap H. Misalkan, jika J dan Hmemilki jarak yang dekat sebelum penggabungan G1 dan G2 maka J dan H akan tetap tetap dekat setelah G1 dan G2 digabung (Murtagh, 1983).

Algoritma : Mulai dengan C0 = {{x1},…,{xn}} dan d({xi},{xj}) = d(xi,xj) untuk semua i ≠ j Untuk l =1,…,n – 1 :

1.Temukan sebuah pasangan (G1, G2) yang memiliki jarak terdekat (RNN / reciprocal nearest –neighbor)

2.Hitung d(G1G2, H) untuk semua HCl

3. Ulangi langkah (1), dengan G1 dan G2 awal telah berkelompok Dimana l adalah jumlah pengamatan.

Pemilihan metode cluster yang terbaik dapat dilakukan dengan analisa cluster. Analisa clusterbisa diperoleh dari kepadatan cluster yang terbentuk (cluster density). Kepadatan suatu cluster bisa ditentukan dengan variance within cluster (Vw2) dan variance between cluster (Vb2) (Man, Lim, Jian, Yue, 2009 diacu dalam Martiana, Rosyid, Agusetia, 2010). Varian tiap tahap pembentukan cluster bisa dihitung dengan rumus :

n

ici

c

yyn

Vc1

22

1

1

(10)Dimana :Vc

2 = varian pada cluster cc = 1…k, dimana k = jumlah clusternc = jumlah data pada cluster cyi = data ke-i pada suatu clusteryc = rata-rata dari data pada suatu cluster

Selanjutnya dari nilai varian diatas, kita bisa menghitung nilai variance within cluster (Vw2) dan nilai variance between cluster (Vb2) dengan rumus :

c

iii Vn

cNVw

1

22 11

c

iii yyn

cVb

1

22

1

1

(11)Dimana :N = jumlah semua datani = jumlah data cluster iVi

2 = varian pada cluster i

y = rata-rata dari iySalah satu metode yang digunakan untuk menentukan cluster yang ideal adalah batasan

variance, yaitu dengan menghitung kepadatan cluster berupa variance within cluster (Vw2) dan variance between cluster (Vb2). Cluster yang ideal mempunyai Vw2 minimum yang mempresentasikan internal homogeneity dan maksimum Vb2 yang menyatakan external homogeneity.

2

2

Vb

VwV

(12)

5

Penentuan jumlah cluster optimum dapat ditentukan dengan pola pergerakan varian. Identikasi pola pergerakan varian merupakan metode untuk memperoleh cluster yang mencapai global optimum (Arai, Barakbah, 2007). Posisi yang mungkin untuk menemukan global optimum pada pergerakan varian, dikelompokkan menjadi 2 yaitu hill-climbing dan valley-tracing (Noor dan Hariadi, 2009).Pada valley-tracing didefinisikan bahwa kemungkinan mencapai global optimum terletak pada tahap ke-i, jika memenuhi persamaan berikut :

iiii vvvv 11 (13)Dimana Vi = varian pada cluster ke-i hasil perbandingan Vw2 dengan Vb2, i = 1..k, dan k tahap terakhir pembentukan cluster. Selanjutnya, baik dengan pendekatan metode valley-tracing maupun hill-climbing dilakukan identifikasi perbedaan nilai tinggi (∂) pada tiap tahap, yang didefinisikan dengan :

iii xvvv 211 (14)Nilai ∂ digunakan untuk menghindari local optima, dimana persamaan ini diperoleh dari

maksimum ∂ yang dipenuhi pada persamaan 14. Untuk mengetahui keakuratan dari suatu metode pembentukan cluster pada hierarchical method, baik menggunakan valley-tracing maupun hill-climbing, digunakan persamaan berikut.

max___

max

keterdekatnilai

(15)Dimana :Nilai terdekat ke max (∂) adalah nilai kandidat max (∂) sebelumnya.Nilai φ yang lebih besar dari 2, menunjukkan cluster yang terbentuk merupakan cluster yang well-separated / terpisah dengan baik. Jika nilai φ bertanda negatif berarti global optimum yang ditentukan telah benar dan cluster yang terbentuk terpisah dengan baik (Arai, Barakbah, 2007).

2.3 Definisi Operasional Indikator Pemerataan PendidikanPuspowati (2009), menurut UU no 20 tahun 2003, pendidikan adalah suatu usaha sadar untuk

menyiapkan peserta didik melalui kegiatan bimbingan, pengajaran dan atau latihan bagi peranannya di masa yang akan datang. Definisi operasional enam variable tersebut dapat dijelaskan sebagai berikut :1. APK (Angka Partisipasi Kasar)

Hasil perhitungan APK digunakan untuk mengetahui banyaknya anak yang bersekolah di suatu jenjang pendidikan tertentu pada wilayah tertentu.

APK = jumlah murid jenjang tertentujumlah penduduk usia sekolah (16)2. APM (Angka Partisipasi Murni)

Indikator APM digunakan untuk mengetahui banyaknya anak usia sekolah yang bersekolah pada suatu jenjang pendidikan yang sesuai. Kelompok umur untuk usia SD 7-12 tahun, SMP 13-15 tahun, SMA 16-18 tahun. Besarnya APM di suatu daerah dapat dihitung dengan rumus berikut :

APM = jumlah murid usia jenjang tertentujumlah penduduk usia sekolah (17)3. Rasio Murid-Guru

Indikator rasio murid dengan guru digunakan untuk menggambarkan beban kerja guru dalam mengajar. Indikator ini juga dapat digunakan untuk melihat mutu pengajaran di kelas karena semakin tinggi nilai rasio ini berarti semakin berkurang tingkat pengawasan atau perhatian guru terhadap murid sehingga mutu pengajaran cenderung semakin rendah.

Rasio Murid_Guru = jumlah muridjumlah guru (18)4. Rasio Murid-Kelas

Indikator rasio murid dengan kelas digunakan untuk menggambarkan kepadatan kelas pada suatu jenjang pendidikan.

Rasio Murid_Kelas = jumlah muridjumlah ruang kelas (19)

6

5. Rasio Murid-SekolahIndikator rasio murid dengan sekolah digunakan untuk menggam-barkan rata-rata daya

tampung per sekolah.

Rasio Murid_Sekolah = jumlah muridjumlah sekolah (20)6. Angka Shift

Angka yang diperoleh memberikan gambaran tentang waktu penyelenggaraan proses belajar mengajar.

Angka Shift = jumlah rombongan belajarjumlah ruang kelas (21)Apabila angka shift > 1, maka waktu penyeleng-garaan proses belajar mengajar tidak

dilakukan pada waktu yang bersamaan (lebih dari satu kali).

2.4 Penelitian SebelumnyaTerdapat beberapa penelitian yang telah dilakukan yang berkaitan dengan pengelompokkan

kecamatan berdasarkan indikator pemerataan pendidikan, di antaranya adalah penelitian Puspowati (2009) yang meneliti pengelompokkan kecamatan di kabupaten Malang berdasarkan indikator pemerataan pendidikan. Dalam peneitiannya, Puspowati menggunakan data kecamatan di kabupaten Malang dan menggunakan metode self organizing maps (SOM). Pada penelitian saat ini akan digunakan data kecamatan di pulau Madura dan menggunakan metode hierarchical clustering via minimax linkage. Penelitian tentang metode hierarchical clustering via minimax linkage telah dilakukan oleh Jacob dan Tibshirani (2011). Minimax linkage memiliki beberapa kelebihan, antara lain dendrogram dari minimax linkage tidak mempunyai susunan yang terbalik dan robust terhadap beberapa gangguan pada dataset. Dengan demikian, pengelompokkan kecamatan di pulau Madura dengan metode hierarchical clustering via minimax linkage dapat menghasilkan kelompok-kelompok kecamatan yang memiliki homogenitas tinggi.

3. Metodologi PenelitianData yang digunakan dalam penelitian ini adalah data sekunder mnegenai indikator

pemerataan pendidikan 2010/2011 yang didapat dari Dinas Pendidikan Jawa Timur. Variabel penelitian yang digunakan yaitu APK (Angka Partisipasi Kasar), APM (Angka Partisipasi Murni), rasio murid dengan guru, rasio murid dengan kelas, rasio murid dengan sekolah, dan angka shift untuk jenjang SD, SMP, dan SMA. Variabel-variabel tersebut dihitung untuk masing-masing kecamatan di pulau Madura. Kabupaten Bangkalan memiliki 18 kecamatan, Sampang memilki 14 kecamatan, Pamekasan memiliki 13 kecamatan, dan Sumenep memiliki 27 kecamatan. Jadi, terdapat 72 kecamatan di pulau Madura.

Setelah data terkumpul dan variabel penelitian ditentukan maka langkah-langkah dalam menganalisis data adalah sebagai berikut.1. Melakukan analisis statistika deskriptif yaitu rata-rata, varians, nilai minimum, nilai maksimum,

dan boxplot dari masing-masing variabel.2. Membandingkan hasil pengelompokkan kecamatan di pulau Madura berdasarkan indikator

pemerataan pendidikan dengan metode hierarchical clustering dengan single linkage, complete linkage, average linkage, dan minimax linkage dan mendapatkan kecamatan di pulau Madura yang berkelompok berdasarkan hasil pengelompokkan terbaik dengan langkah- langkah sebagai berikut.a. Mereduksi dimensi data dengan menggunakan analisis faktor. Analisis faktor juga berguna

untuk menghilangkan korelasi jika antar variabel pada data terdapat korelasi. Sebelum melakukan analisis faktor, terlebih dahulu melakukan uji KMO dan MSA serta uji Bartlettpada data.

b. Melakukan pengelompokkan kecamatan-kecamatan di pulau Madura berdasarkan indikator pemerataan pendidikan dengan menggunakan metode hierarchical clustering dengan single linkage, complete linkage, average linkage, dan minimax linkage.

c. Membandingkan hasil pengelompokkan dengan semua metode menggunakan nilai variance within cluster dan variance between cluster.

d. Menentukan jumlah cluter optimum pada metode terbaik dengan valley-tracing.

7

3. Melakukan analisis terhadap karakteristik kecamatan hasil pengelompokkan terbaik dalam upaya pemerataan pendidikan di Pulau Madura.

4. Melakukan pengelompokkan kecamatan-kecamatan di tiap kabupaten pulau Madura dengan metode minimax linkage.

4. Analisis dan PembahasanHasil analisis statistika deskriptif kecamatan-kecamatan di pulau Madura pada Tabel 1

menunjukkan bahwa nilai rata-rata tertinggi merupakan rata-rata dari variabel rasio murid dan sekolah tingkat SMA dengan nilai varians yang sangat tinggi pula yaitu 51313,60, nilai minimumnya adalah 0 dan nilai maksimumnya adalah 1263. Nilai minimum menunjukkan bahwa terdapat kecamatan di pulau Madura yang belum memiliki sekolah tingkat SMA dan nilai maksimum menunjukkan bahwa terdapat kecamatan yang memiliki jumlah murid sebanyak 1263 pada satu sekolah tingkat SMA.

Nilai minimum yang bernilai nol menunjukkan terdapat kecamatan di pulau Madura yang belum memiliki sekolah tingkat SMA dan semua kecamatan-kecamatan di pulau Madura telah memiliki sekolah tingkat SD dan SMP karena nilai minimum tidak menunjukkan angka nol.

Tabel 1 Nilai Rata-Rata, Varians, Minimum (Min), dan Maksimum (Maks) Variabel-Variabel Indikator Pemerataan Pendidikan

VariabelRata-Rata

Varians Min Maks VariabelRata-Rata

Varians Min Maks

APK SD 76,46 505,99 33,32 123,59 Murid/Kelas SMP 30,62 256,71 6,16 75,52

APM SD 66,29 393,69 27,78 109,39 Murid/Sekolah SMP 174,1 17090 42 720

Murid/Guru SD 17,99 171,37 5,8 88,7 Angka shift SMP 1,25 0,24 0,46 3,5

Murid/Kelas SD 24,9 65,69 11,09 54,07 APK SMA 22,41 947,86 0 186,39

Murid/Sekolah SD 146,41 2419,12 67,21 291,13 APM SMA 14,43 467,9 0 145,69

Angka shift SD 1,15 0,14 0,8 3,6 Murid/Guru SMA 7,93 41,29 0 24,29

APK SMP 37,67 665,34 6,74 156,68 Murid/Kelas SMA 35,7 4216,31 0 532

APM SMP 25,59 419,08 2,76 121,63 Murid/Sekolah SMA 208,8 51313,6 0 1263

Murid/Guru SMP 8,33 11,6 3,07 16,09 Angka shift SMA 0,93 1,77 0 11

Keragaman data terutama adanya outlier pada setiap variabel indikator pemerataan pendidikan dapat diketahui melalui boxplot. Agar keragaman dapat dilihat secara serentak, maka keragaman masing-masing variabel perlu disajikan secara bersama dalam satu diagram yaitu pada Gambar 4.1.

Angk

a shift

SMA

Murid/

Seko

lahSM

A

Murid/Kela

s SMA

Murid/

Guru

SMA

APM

SMA

APKSM

A

Angk

ash

iftSM

P

Murid/

Seko

lahSM

P

Murid/

Kelas

SMP

Murid/

Guru

SMP

APM

SMP

APKSM

P

Angk

a shift

SD

Murid/

Seko

lahSD

Murid/

Kelas

SD

Murid/

Guru

SD

APM

SD

APKSD

8

6

4

2

0

-2

Da

ta

Gambar 1 Boxplot Variabel-Variabel Indikator Pemerataan Pendidikan di Kecamatan-Kecamatan Pulau Madura

Outlier yang paling banyak terdapat pada variabel APM dan angka shift tingkat SMP. Pada variabel APK tingkat SMP, APK, dan APM tingkat SMA serta beberapa variabel lainnya juga terdapat

8

pengamatan yang outlier, akan tetapi jumlahnya tidak sebanyak pada variabel APM dan angka shift tingkat SMP.

4.1 Analisis Faktor pada Variabel-Variabel Indikator Pemerataan Pendidikan Uji kecukupan data secara keseluruhan yang digunakan adalah Kaiser-Meyer-Olkin (KMO).

Hipotesis dari KMO adalah sebagai berikut :H0 : Jumlah data indikator pemerataan pendidikan cukup untuk difaktorkan H1 : Jumlah data indikator pemerataan pendidikan tidak cukup untuk difaktorkan

Pengujian kecukupan data keseluruhan dapat dilakukan dengan menggunakan persamaan 1sehingga diperoleh nilai KMO sebesar 0,670, jadi dapat disimpulkan bahwa asumsi kecukupan data indikator pemerataan pendidikan keseluruhan telah terpenuhi dan data indikator pemerataan pendidikan pada kecamatan-kecamatan di pulau Madura cukup untuk difaktorkan.

Pengujian kecukupan data pada masing-masing variabel indikator pemerataan pendidikandapat dilakukan dengan menggunakan persamaan 1. Hasil perhitungan nilai MSA (Tabel 2) yang telah dilakukan menghasilkan nilai MSA yang lebih besar dari 0,5 untuk semua variabel indikator pemerataan pendidikan, maka hasil uji MSA terpenuhi oleh masing-masing variabel.

Tabel 2 Uji Kecukupan Data pada Masing-Masing Variabel Indikator Pemerataan Pendidikan

No Variabel MSA No Variabel MSA

1 APK SD 0,656 10 Murid/Kelas SMP 0,682

2 APM SD 0,67 11 Murid/Sekolah SMP 0,756

3 Murid/Guru SD 0,781 12 Angka shift SMP 0,469

4 Murid/Kelas SD 0,75 13 APK SMA 0,586

5 Murid/Sekolah SD 0,731 14 APM SMA 0,589

6 Angka shift SD 0,653 15 Murid/Guru SMA 0,725

7 APK SMP 0,64 16 Murid/Kelas SMA 0,598

8 APM SMP 0,609 17 Murid/Sekolah SMA 0,694

9 Murid/Guru SMP 0,839 18 Angka shift SMA 0,522

Uji korelasi yang digunakan adalah uji Bartlett dengan hipotesis :H0 : Matriks korelasi data indikator pemerataan pendidikan merupakan matriks identitasH1 : Matriks korelasi data indikator pemerataan pendidikan bukan matriks identitas

Uji korelasi data indikator pemerataan pendidikan yang telah dilakukan menghasilkan nilai P-value sebesar 0,000. Maka dapat dikatakan bahwa antar variabel pada data indikator pemerataan pendidikan di kecamatan-kecamatan pulau Madura saling berkorelasi.

Cara untuk menentukan jumlah faktor yang tepat untuk mewakili variabilitas data indikator pemerataan pendidikan yaitu dengan mengidentifikasi nilai eigenvalue pada gambar scree plot. Gambar scree plot yang dihasilkan dapat dilihat pada Gambar 2.

18161412108642

6

5

4

3

2

1

0

Factor Number

Eige

nva

lue

1

0 .0 0 2 9 8

0 .0 0 9 9 4

0 .0 3 2 4 3

0 .0 4 6 3 9

0 .0 5 7 9 5

0 .0 8 9 9 9

0 .1 3 0 0 2

0 .2 0 9 5 0

0 .2 6 5 0 6

0 .4 0 4 6 20 .6 3 1 3 4

0 .8 3 2 5 40 .8 9 8 6 3

1 .0 6 5 4 11 .2 6 6 4 9

2 .2 6 1 0 3

3 .9 6 6 7 2

5 .8 2 8 9 5

Gambar 2 Scree Plot Variabel-Variabel Indikator Pemerataan Pendidikan di Kecamatan-Kecamatan Pulau Madura

9

Pada Gambar 2 dapat diketahui bahwa jumlah faktor yang tepat untuk mewakili variabel indikator pemerataan pendidikan di kecamatan-kecamatan pulau Madura yaitu sebanyak lima faktor. Penggunaan lima faktor akan mewakili 79,9 % variabilitas data.

Pembagian variabel-variabel ke dalam kelompok faktor tertentu dilakukan dengan memilih nilai loading faktor terbesar antara loading faktor 1, 2, 3, 4, dan 5. Loading faktor yang digunakan adalah loading faktor yang telah dirotasi varimax. Nilai loading faktor yang telah dirotasi varimax dan yang telah diurutkan berdasarkan nilai loading faktor terbesar dapat dilihat pada Tabel 3.

Tabel 3 Nilai Loading Faktor dengan Rotasi Varimax

Variabel Faktor 1 Faktor 2 Faktor 3 Faktor 4 Faktor 5

APK SD 0,928 -0,077 -0,078 -0,023 -0,077

APM SD 0,926 0,001 -0,011 -0,101 -0,052

Murid/Guru SD 0,882 0,069 0,171 0,054 0,167

Murid/Kelas SD 0,881 0,08 0,216 0,032 0,146

Murid/Sekolah SD 0,81 -0,184 -0,291 0,095 -0,013

Angka shift SD 0,005 0,916 0,191 0,032 0,002

APK SMP -0,015 0,916 0,214 0,01 0,002

APM SMP -0,028 0,691 0,246 -0,3 -0,038

Murid/Guru SMP -0,077 0,573 0,234 -0,571 -0,244

Murid/Kelas SMP 0,018 0,417 0,794 -0,056 -0,118

Murid/Sekolah SMP -0,003 0,415 0,791 -0,066 -0,086

Angka shift SMP -0,174 0,345 0,737 -0,191 -0,273

APK SMA -0,059 0,426 0,72 -0,071 0,038

APM SMA -0,184 0,173 -0,492 0,082 -0,057

Murid/Guru SMA 0,001 0,048 0,118 -0,946 -0,167

Murid/Kelas SMA 0,014 0,064 0,082 -0,944 -0,092

Murid/Sekolah SMA 0,011 -0,029 -0,067 -0,13 -0,898

Angka shift SMA -0,149 0,138 0,399 -0,244 -0,773Keterangan : angka yang dicetak tebal merupakan nilai tertinggi dari masing-masing loading faktor

Penentuan variabel akan dikelompokkan pada faktor 1, 2, 3, 4 atau 5 berdasarkan nilai mutlak loading faktor terbesar dari masing-masing variabel. Faktor 1 dapat disebut sebagai faktor murid SD, sedangkan faktor 2 dapat diberi nama faktor murid SMP. Faktor 3 disebut faktor fasilitas SMP dan faktor 4 disebut faktor murid SMA, serta faktor 5 disebut faktor fasilitas SMA.

4.2 Analisis Cluster pada Kecamatan-Kecamatan di Pulau MaduraHasil dendrogram pada pengelompokkan kecamatan-kecamatan di pulau Madura menjadi satu

kelompok dengan metode single linkage, complete linkage, average linkage, dan minimax linkageyaitu sebagai berikut.

(a) (b)

10

(c) (d)

Gambar 3 Dendrogram Single Linkage (a), Complete Linkage (b), Average Linkage (c), Minimax Linkage (d) Kecamatan-Kecamatan Pulau Madura

Pada Gambar 3 dapat dilihat bahwa kecamatan yang bergabung terakhir adalah kecamatan Camplong (22) kabupaten Sampang. Minimax linkage adalah pengelompokkan berdasarkan nilai minimum dari jarak yang maksimum. Dendrogram dari metode minimax linkage memiliki susunan yang lebih teratur jika dibandingkan dengan dendrogram dari metode single, complete, dan average linkage.

Cluster yang ideal mempunyai Vw2 minimum yang mempresentasikan internal homogeneitydan maksimum Vb2 yang menyatakan external homogeneity. Perbandingan nilai Vw2 yang minimum dan nilai Vb2 yang maksimum menghasilkan suatu nilai variance yang minimum. Pemilihan metode cluster terbaik dilakukan dengan menentukan peringkat pada setiap jumlah cluster yang terbentuk pada keempat metode berdasarkan nilai variance yang terkecil. Jumlah peringkat pada metode single, complete, average, dan minimax linkage dapat dilihat pada Tabel 4.

Tabel 4 Jumlah Peringkat Atas dan Bawah pada Metode Single, Complete, Average, dan Minimax Linkage

PeringkatMetode Pengelompokkan

Single Complete Average Minimax

Atas 36,62% 60,56% 74,65% 77,46% a

Bawah 63,38% 39,44% 25,35% 22,54% Keterangan : a merupakan jumlah peringkat atas terbanyak

Metode minimax linkage merupakan metode terbaik daripada metode single, complete, dan average linkage karena memiliki jumlah peringkat atas terbanyak yaitu sebanyak 77,46% dan jumlah peringkat bawah sebanyak 22,54%. Setelah itu, dilakukan penentuan jumlah cluster optimum dengan pergerakan variance pola valley-tracing. Nilai variance yang digunakan merupakan hasil perbandingan variance within cluster (Vw2) dan variance between cluster (Vb2). Perbedaan nilai tinggi (∂) pada tiap jumlah cluster dengan metode minimax linkage ditampilkan pada Gambar 4.

11

80706050403020100

0.050

0.025

0.000

-0.025

-0.050

-0.075

-0.100

jumlah cluster

be

da

tin

gg

i

3

0.037

Gambar 4 Perbedaan Nilai Tinggi pada Tiap Jumlah Cluster dengan Metode Minimax Linkage

Perbedaan nilai tinggi yang maksimum yaitu ketika jumlah cluster sebanyak 3 dengan perbedaan nilai tinggi sebesar 0,037. Hal ini berarti bahwa jumlah cluster yang optimum pada pengelompokkan kecamatan-kecamatan berdasarkan indikator pemerataan pendidikan dengan metode minimax linkage yaitu sebanyak 3 cluster. Keakuratan dari suatu metode pembentukan cluster pada hierarchical method menggunakan valley-tracing dapat diketahui dengan menggunakan persamaan 15, didapatkan nilai φ yaitu -0,378. Nilai φ yang bertanda negatif berarti global optimum yang ditentukan telah benar dan clusteryang terbentuk terpisah dengan baik.

4.3 Analisis Karakteristik Tiap Kelompok Kecamatan-Kecamatan di Pulau MaduraHasil pengelompokkan dengan metode minimax linkage menghasilkan jumlah kelompok yang

optimum yaitu sebanyak 3 kelompok .Tiap kelompok memiliki karakteristik yang berbeda-beda. Kelompok 1 terdiri dari kecamatan Camplong kabupaten Sampang. Kecamatan Camplong memiliki nilai angka shift > 1. Hal ini berarti bahwa waktu penyelenggaraan proses belajar mengajar tidak dilakukan pada waktu yang bersamaan (lebih dari satu kali). Kebijakan yang sesuai untuk kecamatan Camplong yaitu penambahan ruang kelas untuk pendidikan tingkat SMA. Kelompok 2 terdiri dari kecamatan Kota Sumenep kabupaten Sumenep. Kota Sumenep merupakan kecamatan yang memiliki nilai-nilai tinggi untuk tiap variabel indikator pemerataan pendidikan sehingga dapat dijadikan contoh.Kelompok 3 terdiri dari kecamatan-kecamatan di pulau Madura selain kecamatan Camplong dan Kota Sumenep. Secara umum, kelompok 3 memiliki karakteristik yaitu variabel-variabel indikator pemerataan pendidikan tingkat SMA memiliki nilai varians yang cukup tinggi sehingga fasilitas untuk jenjang pendidikan SMA perlu ditingkatkan dalam upaya pemerataan pendidikan tingkat kecamatan.

4.4 Pengelompokkan Kecamatan-Kecamatan Tiap Kabupaten di Pulau MaduraPengelompokkan kecamatan-kecamatan tiap kabupaten di pulau Madura menggunakan

metode minimax linkage. Penentuan jumlah kelompok yang optimum pada masing-masing kebupaten menggunakan valley-tracing. Perbedaan nilai tinggi (∂) pada tiap jumlah cluster dengan metode minimax linkage ditampilkan pada Gambar 5.

1412108642

0.10

0.05

0.00

-0.05

-0.10

-0.15

jumlah cluster

be

da

tin

gg

i

4

0.1009

(a) (b)

181614121086420

0.10

0.05

0.00

-0.05

-0.10

-0.15

-0.20

-0.25

jumlah cluster

bed

ati

nggi

3

0.1098

12

2520151050

0.02

0.01

0.00

-0.01

-0.02

-0.03

-0.04

-0.05

-0.06

jumlah cluster

be

da

tin

gg

i

4

0.0172

(c) (d)Gambar 5 Perbedaan Nilai Tinggi pada Tiap Jumlah Cluster pada Pengelompokkan di Bangkalan (a), Sampang (b), Pamekasan (c), dan Sumenep (d)

Pada Gambar 5 dapat dilihat bahwa jumlah cluster yang optimum pada kabupaten Bangkalan yaitu sebanyak 3 kelompok dengan nilai keakuratan yaitu sebesar -0,4482, pada kabupaten Sampangsebanyak 4 kelompok dengan nilai keakuratan -1,3212, pada kabupaten Pamekasan sebanyak 3 kelompok dengan nilai keakuratan -0,5116, dan pada kabupaten Sumenep sebanyak 4 kelompok dengan nilai keakuratan 8,887. Hal ini berarti bahwa cluster yang terbentuk pada tiap kabupaten di pulau Madura telah terpisah dengan baik.

5. KesimpulanHasil analisis dan pembahasan yang telah dilakukan pada penelitian ini memperoleh

kesimpulan yaitu varians tertinggi terdapat pada variabel rasio murid dengan sekolah tingkat SMA dan SMP yang berarti bahwa terdapat kesenjangan yang cukup tinggi antar kecamatan dan metode minimax linkage merupakan metode pengelompokkan terbaik dengan jumlah kelompok optimum sebanyak 3 dan hasil pengelompokkan kecamatan di pulau Madura sebagai berikut.

Kelompok 1 : kecamatan Camplong kabupaten Sampang.Kelompok 2 : kecamatan Kota Sumenep kabupaten Sumenep.Kelompok 3 : kecamatan-kecamatan di pulau Madura selain kecamatan Camplong dan Kota

Sumenep.Karakteristik kecamatan-kecamatan di pulau Madura berdasarkan kelompok yaitu : kelompok

1 memiliki nilai angka shift untuk pendidikan jenjang SMA yang cukup tinggi sehingga perlu adanya penambahan ruang kelas untuk pendidikan tingkat SMA, kelompok 2 memiliki nilai-nilai tinggi untuk tiap variabel indikator pemerataan pendidikan sehingga dapat dijadikan contoh oleh kecamatan lain, dan kelompok 3 memiliki nilai varians yang cukup tinggi untuk variabel-variabel indikator pemerataan pendidikan tingkat SMA sehingga fasilitas untuk jenjang pendidikan SMA perlu ditingkatkan. Hasil pengelompokkan kecamatan di kabupaten Bangkalan dengan metode minimax linkage dan valley-tracing menghasilkan jumlah kelompok yang optimum sebanyak 3 kelompok, kabupaten Sampang sebanyak 4 kelompok, kabupaten Pamekasan sebanyak 3 kelompok, dan kabupaten Sumenep sebanyak 4 kelompok.

6. SaranAgar mendapatkan karakteristik pendidkan yang lebih lengkap, disarankan untuk melakukan

survei langsung mengenai kualitas pendidikan untuk tiap kecamatan. Penggunaan berbagai cara untuk membandingkan metode pengelompokkan perlu dilakukan agar hasil yang didapat lebih optimal.

7. Daftar PustakaArai, K., Barakbah, A.R. 2007. Cluster Construction Method Based on Global Optimum Cluster

Determination with The Newly Defined Moving Variance. Reports of the Faculty of Science and Engineering, Saga University. 36(1) : 9-15

Bien, J. dan Tibshirani, R. 2011. Hierarchical Clustering With Prototype via Minimax Linkage. Journal of the American Statistical Association

12108642

0.050

0.025

0.000

-0.025

-0.050

-0.075

-0.100

jumlah cluster

be

da

tin

gg

i

3

0.0482

13

Dillon, W., Goldstein, M. 1981. Multivariate Analysis Methods and Application. Canada : John Wiley and Sons, Inc

Fisher, L., Van Ness, J. 1971. Admissible Clustering Procedures. Biometrica 58(1) : 91-104Gordon, A.D. 1987. A Review of Hierarchical Classification. Journal of Royal Statistical Society, Ser.

A 150(2) : 119-137Hair, J. F., Black, W.C., Babin, B.J., Anderson, R.E. 2010. Multivariate Data Analysis. New Jersey :

Upper saddle riverJohnson, R.A., Winchern, D.W. 2007. Applied Multivariate Statistical Analysis. USA : Pearson

Education InternationalMan L, Chew Lim T, Jian S, Yue L. 2009. Supervised and Traditional Term Weighting Methods for

Automatic Text Categorization. Pattern Analysis and Machine Intelligence, IEEE Transactions on. 31(4) : 721-735

Martiana, E., Rosyid, N., Agusetia, U. 2010. Mesin Pencari Dokumen dengan Pengklasteran secara Otomatis. TELKOMNIKA 8(1) : 41-48

Morrison, D.F. 2005. Multivariate Statistical Methods Fourth Edition. USA : Thomson Learning, IncMurtagh, F. 1983. A Survey of Recent advances in Hierarchical Clustering Algorithms. The Computer

Journal 26 : 354-359Noor, M. H., Hariadi, M. 2009. Image Cluster Berdasarkan Warna untuk Identifikasi Kematangan

Buah Tomat dengan Metode Valley Tracing. Seminar Nasional Informatika 2009Norusis, M.J. 1986. Advanced Statistics SPSS/PC+ for the IBM PC/XT/AT. Michigan Avenue

Chicago IllinoisPurwaningsih, A. 2004. Penentuan Rotasi yang Sesuai dalam Analisis Faktor dengan Analisis

Procrustes. Pusat Pengembangan Teknologi Informasi dan Komputasi, BATANPuspowati, T. 2009. Algoritma Self Organizing Maps (SOM) untuk Pengelompokkan Kecamatan di

Kabupaten Malang berdasarkan Indikator Pemerataan Pendidikan [tesis]. Surabaya : Jurusan Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh Nopember