14

Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

  • Upload
    ledung

  • View
    235

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan
Page 2: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

Statistik Multivariat

dengan SPSS

Page 3: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

Sanksi Pelanggaran Pasal 113 Undang-Undang Nomor 28 Tahun 2014 tentang Hak Cipta

1. Setiap Orang yang dengan tanpa hak melakukan pelanggaran hak ekonomi sebagaimana dimaksud dalam Pasal 9 ayat (1) huruf i untuk Penggunaan Secara Komersial dipidana dengan pidana penjara paling lama 1 (satu) tahun dan/atau pidana denda paling banyak Rp100.000.000 (seratus juta rupiah).

2. Setiap Orang yang dengan tanpa hak dan/atau tanpa izin Pencipta atau pemegang Hak Cipta melakukan pelanggaran hak ekonomi Pencipta sebagaimana dimaksud dalam Pasal 9 ayat (1) huruf c, huruf d, huruf f, dan/atau huruf h untuk Penggunaan Secara Komersial dipidana dengan pidana penjara paling lama 3 (tiga) tahun dan/atau pidana denda paling banyak Rp500.000.000,00 (lima ratus juta rupiah).

3. Setiap Orang yang dengan tanpa hak dan/atau tanpa izin Pencipta atau pemegang Hak Cipta melakukan pelanggaran hak ekonomi Pencipta sebagaimana dimaksud dalam Pasal 9 ayat (1) huruf a, huruf b, huruf e, dan/atau huruf g untuk Penggunaan Secara Komersial dipidana dengan pidana penjara paling lama 4 (empat) tahun dan/atau pidana denda paling banyak Rp1.000.000.000,00 (satu miliar rupiah).

4. Setiap Orang yang memenuhi unsur sebagaimana dimaksud pada ayat (3) yang dilakukan dalam bentuk pembajakan, dipidana dengan pidana penjara paling lama 10 (sepuluh) tahun dan/atau pidana denda paling banyak Rp4.000.000.000,00 (empat miliar rupiah).

Page 4: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

Statistik Multivariat

dengan SPSS

Singgih Santoso

PENERBIT PT ELEX MEDIA KOMPUTINDO

Page 5: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

Statistik Multivariat dengan SPSS

Singgih Santoso 2017, PT Elex Media Komputindo, Jakarta Hak cipta dilindungi undang-undang Diterbitkan pertama kali oleh Penerbit PT Elex Media Komputindo Kelompok Gramedia, Anggota IKAPI, Jakarta 2017

[email protected]

ID: 717050557

ISBN: 978-602-04-1205-4

Dilarang keras menerjemahkan, memfotokopi, atau memperbanyak sebagian atau seluruh isi buku ini tanpa izin tertulis dari penerbit.

Dicetak oleh Percetakan PT Gramedia, Jakarta

Isi di luar tanggung jawab percetakan

Page 6: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

vii

Daftar Isi

Kata Pengantar ........................................................................................ v

Daftar Isi ................................................................................................ vii

Bab 1 Pendahuluan ............................................................................. 1

1.1. Peran Teknologi Informasi ................................................. 3

1.2. Penggunaan Metode Statistik Univariat, Bivariat, dan Multivariat ................................................................. 4

1.3. Software Statistik yang Digunakan ...................................... 6

1.4. Pengertian Analisis Multivariat ............................................ 7

1.5. Jenis Data dalam Analisis Multivariat .................................. 8

1.6. Klasifikasi Metode Statistik Multivariat ............................... 11

1.7. Isi File pada Buku Statistik Multivariat ............................... 13

Bab 2 Uji dan Seleksi Data ................................................................ 15

2.1. Jenis dan Cara Pengujian Data ........................................ 16

2.2. Missing Data Analysis ..................................................... 16

2.3. Perlakuan terhadap Missing Data .................................... 28

2.4. Uji Data Outlier .............................................................. 31

2.5. Uji Normalitas Data ........................................................ 42

2.6. Uji Homoskedastisitas Data ............................................. 46

Page 7: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

viii

2.7. Uji Linieritas Data ........................................................... 50

2.8. Seleksi Data (Select Case) ............................................... 54

Bab 3 Analisis Faktor ......................................................................... 58

3.1. Hal-Hal tentang Analisis Faktor ........................................ 59

3.1.1. Tujuan Analisis Faktor ................................................... 59

3.1.2. Jumlah Sampel (Sample Size) yang Ideal untuk Analisis Faktor ......................................................................... 59

3.1.3. Asumsi pada Analisis Faktor ........................................... 60

3.2. Proses Dasar Analisis Faktor ............................................ 60

3.2.1. Metode Principal Component Analysis ............................ 61

3.2.2. Rotasi Faktor ................................................................. 62

3.3. Tahap Pertama Analisis Faktor: Menilai Variabel yang Layak ..................................................................... 63

3.4. Tahap Kedua Analisis Faktor: Proses Factoring dan Rotasi ...................................................................... 78

3.5. Tahap Ketiga Analisis Faktor: Validasi Faktor .................... 95

3.6. Tahap Keempat Analisis Faktor: Membuat Factor Scores .. 104

Bab 4 Analisis Cluster ...................................................................... 109

4.1. Hal-Hal Pokok tentang Analisis Cluster ........................... 111

4.2. Analisis Cluster: K-Means Cluster ................................... 116

4.3. Hierarchical Cluster ...................................................... 130

4.4. Crosstab dan Grafik untuk Output Cluster ...................... 142

Bab 5 Analisis Diskriminan ............................................................... 151

5.1. Hal-hal Pokok tentang Analisis Diskriminan .................... 154

5.2. Analisis Diskriminan Dua Faktor ..................................... 157

5.2.1. Uji Variabel ................................................................ 157

Page 8: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

ix

5.2.2. Melakukan Analisis Diskriminan ................................... 164

5.3. Analisis Diskriminan Tiga Faktor ..................................... 181

5.4. Logistic Regression ........................................................ 200

Bab 6 MANOVA ............................................................................. 210

6.1. Hal-Hal Pokok tentang MANOVA ................................. 211

6.2. General Linear Model (GLM) ......................................... 214

6.3. MANOVA (Factorial Design) .......................................... 223

6.4. MANOVA (GLM Multivariat) .......................................... 232

6.5. Custom Model .............................................................. 243

Bab 7 Korelasi Kanonik ................................................................... 250

7.1. Hal-Hal Pokok tentang Korelasi Kanonik ......................... 251

7.2. Contoh Aplikasi Korelasi Kanonik ................................... 253

Bab 8 Conjoint Analysis ................................................................... 269

8.1. Hal-Hal Pokok tentang Conjoint Analysis ........................ 269

8.2. Kasus Conjoint Analysis (1) ............................................ 271

8.3. Kasus Conjoint Analysis (2) ............................................ 289

Bab 9 Multidimensional Scaling (MDS) dan Correspondence Analysis (CA) ......................................................................... 301

9.1. Multidimensional Scaling (MDS) ..................................... 303

9.2. Categorical Analysis (CA) .............................................. 313

9.3. Categorical Analysis (CA) Cara 2 .................................. .325

Daftar Pustaka ..................................................................................... 330

Seri buku SPSS dan AMOS .................................................................... 331

Tentang Penulis .................................................................................... 333

Page 9: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

1

Pendahuluan

Saat ini analisis multivariat mulai banyak diaplikasikan dalam berbagai bidang ilmu, melengkapi analisis statistik univariat dan statistik bivariat dalam analisis data. Seiring dengan kemajuan di bidang teknologi informasi, statistik multivariat dipastikan akan menggantikan peran pengolahan dan analisis data dari analisis univariat dan bivariat, walaupun tidak akan dapat menggantikannya secara total. Namun demikian, sesungguhnya tidak mudah untuk mengartikan secara tepat apa itu statistik multivariat; untuk itu, sebuah ilustrasi sederhana berikut diberikan agar pengertian secara umum dapat diperoleh terlebih dahulu.

Misalkan, ada sebuah restoran yang laris dan selalu dipenuhi pengunjung, apalagi pada hari Sabtu-Minggu dan hari libur nasional; sejak buka di siang hari, restoran tersebut tidak pernah sepi pengunjung, baik mereka yang datang secara individu, bersama teman, maupun keluarga. Pada jam sibuk, para pengunjung bahkan rela antre untuk mendapatkan menu mereka. Pertanyaan yang muncul biasanya adalah: apa yang menjadi daya tarik untuk para pengunjung? Mengapa mereka selalu menyempatkan diri ke tempat tersebut jika waktunya memungkinkan? Mengapa restoran atau warung makan lain yang menjual menu masakan yang sama dan ada di sekitar restoran tersebut tidak selaris restoran ini? Pertanyaan-pertanyaan tersebut cukup kompleks, dan tidak mudah untuk menjawab dengan satu dua kalimat.

Jika akan dilakukan riset untuk menjawab sebagian dari pertanyaan-pertanyaan di atas, masalah riset dapat diringkas menjadi: faktor-faktor apakah yang membuat restoran tersebut laris? Jika masalah riset tersebut diurai lebih rinci, dapat menjadi: variabel-variabel apakah yang membuat restoran tersebut dipenuhi pengunjung?

Sejumlah (variabel) penyebab dapat dikemukakan, seperti pelayanan yang memuaskan, letak yang strategis, adanya diskon pada menu-menu tertentu, suasana restoran yang menyenangkan, harga yang sesuai dengan kualitas, rasa masakan yang enak, dan sejumlah faktor lainnya. Sedangkan (variabel) ‘akibat’ yang terjadi adalah jumlah pengunjung yang banyak atau loyalitas pelanggan yang tinggi.

Page 10: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

2

Secara ringkas, dapat dikatakan ada banyak variabel yang terlibat di dalam kasus ini; pertanyaan selanjutnya adalah bagaimana hubungan yang ada di antara variabel-variabel yang cukup banyak tersebut? Apakah harga yang murah menjadi variabel utama yang berpengaruh pada jumlah pengunjung? Apakah rasa masakan yang membuat pengunjung demikian banyak? Adakah hubungan antara lokasi strategis dan jumlah pengunjung? Demikian seterusnya, ada berbagai kombinasi hubungan yang jika dikembangkan lagi akan menjadi kompleks.

Jika menggunakan statistik univariat –yang hanya menggunakan satu variabel– maka alat-alat statistik univariat yang selama ini dikenal, seperti uji t atau ANOVA, jelas tidak memadai untuk menjelaskan hubungan antarvariabel seperti pada kasus di atas. Sebagai contoh, uji t hanya mampu menjelaskan apakah pengunjung di hari Senin berbeda dengan di hari Selasa; uji F (ANOVA) pun hanya mampu menguji perbedaan loyalitas pelanggan antara pelanggan dari keluarga, pelanggan individu, dan pelanggan yang datang bersama teman. Kedua alat tersebut mempunyai keterbatasan untuk dapat mengupas sebab-akibat lebih jauh lagi.

Demikian pula dengan alat-alat statistik bivariat; metode seperti korelasi atau regresi sederhana hanya mampu menjelaskan hubungan dua variabel. Contoh analisis korelasi dan regresi adalah: apakah ada hubungan antara loyalitas pelanggan dan jumlah pengunjung restoran? Apakah ada hubungan antara letak restoran dan jumlah pelanggan? Apakah harga berpengaruh pada naik-turunnya jumlah pengunjung? Serta contoh-contoh lain yang hanya melibatkan dua variabel dari kasus di atas.

Alat-alat statistik univariat dan bivariat tersebut tentu berguna untuk menjelaskan hubungan antarvariabel atau antargrup dalam satu variabel. Namun, semuanya hanya menjelaskan sebagian hubungan yang sifatnya parsial; tidak mungkin alat-alat tersebut dapat menjelaskan hubungan yang kompleks secara komprehensif. Padahal –dalam kenyataannya– perilaku seseorang justru bersifat simultan; loyalitas seorang pelanggan lebih masuk akal bila dipengaruhi oleh harga murah, rasa masakan yang enak, lokasi yang strategis, dan sejumlah faktor lain yang dipikirkan oleh pelanggan tersebut

Masakan enak Suasana nyaman Harga murah Menu lengkap .............. dan seterusnya

Pengunjung banyak

Page 11: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

3

secara bersamaan. Jarang seorang pelanggan akan loyal hanya karena lokasinya yang strategis; ia akan mempertimbangkan juga faktor lain yang menurutnya relevan dalam pengambilan keputusan belinya.

Dengan demikian, harusnya ada metode statistik yang dapat mempertimbang-kan sekian banyak faktor untuk menjelaskan hubungan yang terjadi dalam sebuah fenomena sosial atau alam yang kompleks. Metode itu dinamakan statistik multivariat. Kata ‘multi’ menunjukkan kemampuan metode tersebut, sekaligus ciri dari metode itu untuk mengolah sekian variabel secara bersama-sama untuk menjawab persoalan statistik tertentu.

Selain dalam ilmu sosial seperti contoh di atas, statistik multivariat banyak digunakan dalam bidang ilmu lain yang mengharuskan sejumlah variabel dianalisis secara simultan. Pada bidang pertanian, pertumbuhan tanaman tidak dapat dikatakan disebabkan satu faktor saja, misalkan jumlah pupuk yang diberikan. Selain pupuk, banyak variabel lain yang berpengaruh, seperti asupan air, sinar matahari, faktor cuaca, kesuburan tanah, ketrampilan bertani seseorang, dan keterampilan teknis lainnya. Pada bidang kesehatan, banyak faktor yang secara bersama-sama berdampak pada kesehatan tubuh manusia, seperti asupan lemak, asupan karbohidrat, asupan vitamin dan mineral, tingkat stres seseorang, jam tidur setiap hari, dan faktor-faktor lainnya.

1.1. Peran Teknologi Informasi Jika memang banyak fenomena atau masalah penelitian melibatkan banyak variabel yang seharusnya dianalisis secara simultan, lalu mengapa dalam praktik banyak pengolahan data hanya melibatkan satu dua variabel saja? Pada masa lalu, saat teknologi informasi belum berkembang, penggunaan metode statistik yang ‘sederhana’ seperti uji t atau uji F mungkin saja terjadi. Hal ini karena statistik multivariat membutuhkan banyak perhitungan matematis yang tidak memungkinkan dilakukan secara manual. Misal, metode regresi sederhana dan regresi berganda; regresi sederhana, yang hanya melibatkan satu variabel dependen dan satu variabel independen, sering digunakan dalam praktik karena proses pencarian koefisien regresi cukup sederhana. Dengan menambah satu variabel independen, disebut dengan regresi berganda, proses penghitungan menjadi kompleks. Jika variabel independen menjadi tiga atau lebih, kemampuan penghitungan manual menjadi hampir tidak mungkin dilakukan. Demikian pula dengan banyak metode multivariat lain, seperti analisis faktor dan analisis diskriminan, yang tingkat kompleksitasnya dapat melebihi metode regresi berganda.

Page 12: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

4

Namun, perkembangan teknologi informasi di tahun 1990-an, khususnya di bidang software statistik, memungkinkan proses penghitungan metode multivariat dilakukan dengan cepat dan tepat. Software seperti SPSS, Eviews, atau Minitab dapat memproses data multivariat dalam jumlah puluhan bahkan ratusan dengan hasil yang memuaskan. Bahkan, pengembangan software SPSS sudah merambah pada kegiatan data mining dan neural network, yang merupakan ‘kelanjutan’ dari multivariat, dengan tingkat kompleksitas yang lebih tinggi.

Dalam praktik, hampir semua metode multivariat, kecuali regresi berganda dengan melibatkan hanya dua variabel independen, tidak mungkin diselesaikan lewat perhitungan manual. Semuanya mengandalkan teknologi informasi, dalam hal ini adalah software statistik, untuk pengolahan datanya; apa yang dahulu tidak dapat dibayangkan oleh para ahli statistik karena keterbatasan manusia, menjadi mungkin dan mudah di era informasi sekarang ini. Karena metode multivariat melibatkan banyak variabel, maka per-hitungannya menjadi jauh lebih kompleks dibandingkan analisis yang hanya menggunakan satu atau dua variabel. Dalam hal ini, walaupun ada berbagai teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan tanpa bantuan komputer.

1.2. Penggunaan Metode Statistik Univariat, Bivariat, dan Multivariat

Namun demikian, hal ini tidak berarti semua pengolahan data statistik harus dilakukan dengan metode statistik multivariat. Memang banyak fenomena yang seharusnya dilihat secara ‘total’ dengan melibatkan banyak variabel, namun hal ini tidak berarti metode univariat atau bivariat sudah tidak diperlukan lagi! Banyak tujuan pengolahan data yang sifatnya sederhana dan tidak perlu melibatkan banyak variabel; satu dua variabel sudah cukup untuk menyelesaikan masalah tersebut.

Metode univariat untuk parametrik adalah uji t, uji z, dan anova; untuk nonparametrik adalah uji runs, uji binomial, uji Kolmogorov-Smirnov, dan lainnya. Sedangkan metode bivariat untuk parametrik adalah uji korelasi dan regresi sederhana, dan untuk nonparametrik adalah uji korelasi Spearman, uji korelasi Kendall, dan lainnya.

Secara sederhana, hal ini dapat dianalogikan dengan upaya membasmi nyamuk; secara ‘teoritis,’ ada berbagai cara untuk itu, seperti menggunakan obat nyamuk, alat semacam ‘raket’ listrik, pemukul nyamuk, tangan kosong, bahkan ‘bom’ sekalipun! Obat nyamuk pun bervariasi, seperti obat nyamuk bakar, semprot, atau oles tangan (pencegahan). Mana yang paling tepat

Page 13: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

5

digunakan? Sebenarnya tidak ada yang paling tepat, namun dicari alat yang paling efektif dalam kondisi tertentu. Jika hanya ada satu dua nyamuk yang berseliweran di sekitar muka kita, tangan kosong pun mungkin sudah cukup; namun jika jumlah nyamuk cukup banyak di dalam sebuah ruangan, ‘raket’ listrik dapat dipertimbangkan. Namun, jika jumlah nyamuk sudah banyak dan menganggu, obat nyamuk adalah yang paling efektif. Tentu saja sebuah ‘bom’ untuk ratusan nyamuk pun jelas tindakan berlebihan!

Demikian pula dengan kegiatan pengolahan data. Jika tujuan pengolahan data bersifat sederhana dan praktis, statistik univariat seperti uji t atau anova sudah sangat memadai. Dalam praktik, justru kedua uji ini sangat efektif. Seorang manajer penjualan yang ingin mengetahui perbedaan penjualan produk merek X di empat kabupaten yang berbeda cukup menggunakan anova; manajer tersebut sudah dapat mengambil kesimpulan apakah rata-rata penjualan di empat kabupaten tersebut berbeda secara signifikan ataukah tidak. Karena tujuannya hanya mengetahui ada tidak perbedaan penjualan, data yang dibutuhkan hanyalah penjualan pada periode tertentu; ia tidak memerlukan data kepuasan konsumen, data biaya promosi, data sewa outlet, atau bahkan data pertumbuhan penduduk di empat kabupaten tersebut.

Namun, jika kemudian manajer tersebut menemukan adanya perbedaan penjualan, lalu memutuskan untuk menganalisis lebih dalam lagi, ia dapat menambah dengan data selain data penjualan. Misalkan, manajer penjualan tersebut sekarang ingin mengetahui apakah kepuasan konsumen, biaya promosi yang besar, dan pertumbuhan penduduk yang cukup pesat di sebuah daerah memengaruhi penjualan; untuk itu, ia membutuhkan banyak variabel, dan metode anova sudah tidak mungkin menangani tujuan pengolahan data semacam itu. Ia dapat beralih ke metode statistik multivariat yang lebih kompleks, seperti metode regresi berganda.

Contoh lain: ingin diketahui apakah jumlah pupuk memengaruhi tinggi tanaman dan seberapa jauh pengaruh tersebut. Untuk masalah seperti ini,

Data penjualan merek X di empat kabupaten

Penjualan beda/tidak?

ANOVA

Data penjualan Data kepuasan konsumen ....dan lain-lain

Penjualan merek X

Regresi ganda

Page 14: Statistik Multivariat dengan SPSS - s3.amazonaws.com · teori, seperti teori faktor, teori diskriminan, dan sebagainya, dalam praktik teori-teori tersebut akan sangat sulit diaplikasikan

333

Tentang Penulis

Singgih Santoso adalah lulusan program Magister Manajemen Universitas Indonesia dan program Doktor bidang Manajemen Universitas Gadjah Mada, yang sekarang bekerja sebagai dosen, trainer, dan konsultan manajemen.

Email: [email protected]

Catatan:

Untuk melakukan pemesanan buku, hubungi

Layanan Langsung PT Elex Media Komputindo:

Gramedia Direct

Jl. Palmerah Barat No. 29-37, Jakarta 10270

Telemarketing/CS: 021-53650110/1 ext: 3901/3902/3292/3427