Fakultas Ekonomi UNPAD Pengantar Statistika Ekonomi dan … · Fakultas Ekonomi UNPAD Pengantar Statistika Ekonomi dan Bisnis #65 ... Asumsi dasar analisis diskriminan, yaitu : 1

Fakultas Ekonomi UNPAD Pengantar Statistika Ekonomi dan Bisnis

#65

B A B I V

A N A L I S I S D I S K R IM I N A N

( D I S C R IM I N A N T A N A L Y S I S )

5 . 1 K o n s e p d a n P e n g e r t i a n D a s a r

Analisis Diskriminan adalah suatu metode statistika

untuk mengklasifikasikan sejumlah obyek ke dalam beberapa

kelompok berdasarkan kumpulan variabel bebas (Dillon dan

Goldstein, 1984). Dalam upaya mengetahui keterkaitan antar

variabel, kadang kita dihadapkan pada suatu masalah dimana

variabel yang dilibatkan adalah variabel yang bersifat

kualitataif, atau katagori. Bila variabel katagori tersebut adalah

salah satu dari variabel bebas, maka analisis regresi multiple

masih dapat digunakan, namun bagaimana kalau variabel

katagori merupakan variabel terikat?. Contoh, bangkrut dan

tidak bangkrutnya perusahaan dikaitkan dengan rasio-rasio

keuangan. Bangkrut tidak bangkrutnya perusahaan merupakan

variabel terikat.

Dalam upaya mengetahui atau melakukan analisis

keterkaitan antara bangkrut tidak bangkrutnya perusahaan

dengan rasio- rasio keuangan di mana rasio rasio keuangan

merupakan variabel bebas, maka diperlukan analisis yang

disebut analisis diskriminan dan analisis regresi logistic. Jadi

analisis ini digunakan bila variabel terikat adalah variabel

katagori (nonmetric/ nominal), sedangkan variabel bebas

An a l i s i s

D is k r im in a n

Metode statistika

untuk

mengklasifikasikan

sejumlah obyek ke

dalam beberapa

kelompok

berdasarkan

kumpulan variabel

bebas.

Digunakan bila

variabel terikat

adalah variabel

katagori

(nonmetric/

nominal),

sedangkan variabel

bebas adalah

metric (interval

atau rasio).


#66

adalah metric (interval atau rasio). Dalam banyak kasus

penelitian variabel terikat terdiri atas dua katagori (klasifikasi

/grup) misalnya pria dan wanita, rendah dan tinggi, tempat A

dan Bukan A, dan seterusnya.

Misalnya masyarakat dikelompokkan ke dalam dua

kelompok, yaitu mereka yang mengunakan produk telkom (PT)

dan yang tidak menggunakan(Non-PT). Kepada orang orang

yang menggunakan dan yang tidak menggunakan produk

diukur karakeristik/ variabelnya, yaitu, X1= pendapatan, X2=

tingkat pendidikan , X3= usia. Dengan analisis diskriminan,

akan dapat ditentukan variabel mana yang dapat menerangkan

perbedaan ke dua kelompok ini, selain bisa juga memprediksi

termasuk kelompok mana seseorang dengan karakteristik X1,

X2 dan X3 tertentu.

5 . 2 T u j u a n

Tujuan utama dari analisis diskriminan adalah

mengklasifikasikan suatu individu atau objek ke dalam satu

dari beberapa kelompok yang telah diketahui sebelumnya

dengan cara menemukan suatu pembatas yang mampu

memaksimalkan rasio perbedaan (variability) antar kelompok

dan di dalam kelompok itu sendiri. Dalam analisis diskriminan,

sebelum melakukan pengklasifikasian peneliti harus

mengetahui terlebih dahulu objek-objek mana yang masuk ke

dalam kelompok 1, kelompok 2 dan seterusnya bergantung

pada banyaknya kelompok. Dapat dikatakan bahwa kita ingin

T u ju a n Um um

Mengklasifikasikan

suatu individu atau

objek ke dalam

satu dari beberapa

kelompok yang

telah diketahui

sebelumnya

dengan cara

menemukan suatu

pembatas yang

mampu

memaksimalkan

rasio perbedaan

(variability) antar

kelompok dan di

dalam kelompok

itu sendiri.


#67

mengetahui apakah ada perbedaan yang jelas antar grup pada

variabel dependen

Tujuan lain analisis diskriminan, yaitu :

1. Menentukan apakah ada perbedaan yang signifikan

ntara rata-rata skore dari dua atau leboh kelompok.

2. Menentukan prosedur-prosedur untuk menelompokkan

individu-individu atau objek-objek ke dalam kelompok-

kelompok berdasarkan skore-skore variabel.

3. Menentukan variabel predictor mana yang mempunyai

discriminating power atau daya beda yang besar untuk

membedakan dua atau lebih kelompok.

5 . 3 M o d e l A n a l i s i s D i s k r im i n a n

Analisis diskriminan adalah teknik statistik multivariat

jika variabel tak bebas (respons) merupakan nominal, atau

kategori, atau nonmetrik dan variabel bebas (prediktor)

merupakan metrik, atau paling sedikit skala pengukurannya

interval, atau bersifat kontinu. Pada contoh diatas, variabel

respons adalah P T dan N o n - P T . Jika variabel tersebut dimisalkan

Y, maka variabel itu merupakan variabel nominal, dapat ditulis

sebagai berikut :

Analisis diskriminan melibatkan kombinasi linier dari

dua atau lebih variabel predictor yang membedakan antara

Li =

1, setiap individu ke-i yang PT

0, setiap individu ke-i yang Non-PT

T u ju a n I

Menentukan

apakah ada

perbedaan yang

signifikan ntara

rata-rata skore dari

dua atau leboh

kelompok.

T u ju a n I I

Menentukan

prosedur-prosedur

untuk

menelompokkan

individu-individu

atau objek-objek

ke dalam

kelompok-

kelompok

berdasarkan skore-

skore variabel.

T u ju a n I I I

Menentukan

variabel predictor

mana yang

mempunyai

discriminating

power atau daya

beda yang besar

untuk

membedakan dua

atau lebioh

kelompok


#68

kelompok. Secara teknis hal tersebut yaitu dengan cara

memaksimumkan varians di antara kelompok (Between) relative

terhadap varians di dalam kelompok (Within); hubungan ini

dinyatakan sebagai rasio di antara-kelompok terhadap di

dalam-kelompok. Kombinasi linier untuk analisis diskriminan

dalam bentuk persamaan linier, yaitu :

1 1 2 2 3 3 ... p pL w X w X w X w X

Dalam hal ini, L = skore diskriminan, w = bobot (Weight) dan, X

= variabel prediktor.

Analisis diskriminan adalah teknik statistik untuk

menguji hipotesis bahwa vektor rata-rata dari dua atau lebih

kelompok adalah sama. Sehingga analisis diskriminan, juga

bisa melalui Manova. Selain itu, penyelesaian analisis

diskriminan bisa melalui analsis regresi multipel.

Pengujian fungsi diskriminan bisa melalui jarak antara

the group centroid, yang dihitung dengan membandingkan

distribusi skore diskriminan dua atau lebih kelompok. Yang

dimaksud dengan centroid adalah rata-rata skor diskriminan

untuk setiap kelompok. Jika distribusi tersebut menunjukkan

overlapnya makin kecil, maka fungsi diskriminan memiliki

discriminating power yang lebih baik. Demikian juga berlaku

sebaliknya.

Asumsi dasar analisis diskriminan, yaitu :

1. Variabel prediktor berdistribusi normal multivariat

A sum s i D a s a r I

Variabel prediktor

berdistribusi

normal multivariat

A sum s i D a s a r I I

Matriks varians-

kovarians untuk

setiap kelompok

adalah sama

A sum s i D a s a r I I I

Di antara variabel

prediktor tidak ada

multikolinearitas


#69

2. Matriks varians-kovarians untuk setiap kelompok adalah

sama

3. Di antara variabel prediktor tidak ada multikolinearitas

5 . 4 T a h a p a n A n a l i s i s

Proses dasar dari analisis diskriminan adalah pertama

kita membagi objek-objek ke dalam dua atau lebih kelompok,

setiap kelompok diamati dan diukur berbagai karakteristik

yang diperlukan, selanjutnya kita dapat mengetahui dari

pengamatan ciri-ciri atau karakteristik setiap kelompok.

Sehingga apabila ada objek baru dengan karakteristik yang

dipunyainya, obyek tersebut dapat diidentifikasi termasuk

kelompok yang mana.

Model dari analisis diskriminan adalah

pp XXXy .....2211

untuk :

y : Variabel dependen (berupa data kategori)

: Koefisien bobot fungsi diskriminan

X : Variabel Independen (berupa data interval atau rasio)

Analisis diskriminan yang optimum adalah analisis

diskriminan yang menghasilkan peluang kesalahan klasifikasi

yang sekecil-kecilnya. Untuk hasil yang optimal diasumsikan

bahwa (1) p buah variabel prediktor berdistribusi normal

multivariat dan (2) memiliki matriks varians dan kovarians yang

sama dalam setiap G grupnya.


#70

Secara Umum menurut penjabaran matematis cara

F i s h e r , prosedur perhitungan Analisis Diskriminan dimulai

dengan :

1. Membentuk sampel acak sebesar 1n dari 1k (kelompok 1)

dan sampel sebesar 2n dari 2k (kelompok 2).

.

.

.....

.....

...

...

1131211

21321221121

11311211111

1

1

1

1

pnppp

n

n

XXXX

XXXX

XXXX

X

.

.

.....

.....

...

...

2232221

21322222121

11312212112

2

2

21

2

pnppp

n

n

XXXX

XXXX

XXXX

X

2. Dari data sampel itu dihitung vektor rata-rata sampel

pada tiap kelompok.

121111 ,....., pXXXX

121212 ,....., pXXXX

3. Menghitung matriks varians kovarians untuk masing-

masing kelompok dan matriks varians kovarians sampel

gabungannya adalah S dengan rumus :

Untuk masing-masing kelompok

2,1

12,1

2,1 ))((1

1n

i

kjkjij XXXXn

S


#71

Untuk matriks varian-kovarian gabungan

)2(

)1()1(

21

2211

nn

SnSnS

4. Menurut aturan fisher Kemudian dicari adalah taksiran

komposit linear dari 1x , pxx ,.....,2 adalah :

xby ' atau

pp XXXy .....2211

dimana b adalah taksiran , yang diperoleh dari

hubungan-hubungan yang menyangkut diatas,

dengan penggantian, yaitu diganti dengan

penaksirnya yaitu ix sedang y diganti dengan

penaksirnya S .

Maka diperoleh )( 211 xxSb

dimana 1S adalah

invers dari matriks varians-kovarian sampel gabungan.

5. Setelah didapat fungsi diskriminannya langkah

selanjutnya kita lakukan pengujian

6. Klasifikasi pengelompokkan menggunakan bayess,

aturan titik tengah, aturan fisher.

5 . 5 P e n g u j i a n S i g n i f i k a n s i P e r b e d a a n

Salah satu tujuan dari analisis diskriminan adalah ingin

mengetahui apakah ada perbedaan yang jelas antar grup pada

variabel dependen.


#72

Untuk hal tersebut dilakukan pengujian Signifikansi untuk

mencari daya pembeda antara kelompok kelompok yang

terlibat.

Jika fungsi diskriminan untuk dua kelompok 1K dan 2K

adalah xby ' maka selisih antara rata-rata nilai diskriminan

adalah :

)(''' 212121 xxbxbxbYY

)()'( 211

21 xxSxx

besaran ruas kanan itu disebut jarak Mahalanobis antara 1x dan

2x , dinyatakan dengan tanda :

),( 212 xxD atau

2D

Ukuran statistik diatas dapat digunakan untuk menyelidiki

apakah antara dua vektor rata-rata ada perbedaan yang

signifikan, sebagai berikut :

H i p o t e s i s

21: Ho (tidak terdapat perbedaan)

211 : H (ada Perbedaan antara dua kelompok)

S t a t i s t i k u j i

2

21

21

21

)21

)2(

)1

(

(D

pnn

pnn

nn

nnF

derajat bebas ( )1; 21 pnnp , dimana 2D adalah jarak

Mahalanobis antara vektor rata-rata sampel, yaitu


#73

)()'( 211

212 xxSxxD

Kriteria uji bahwa F hitung lebih besar dari F tabel maka tolak

Ho . Kesimpulan bahwa tolak Ho perbedaan rata-rata kedua

kelompok berdasarkan fungsi diskriminan sangat signifikan.

Dalam hal ini,

'2 1

1 2 1 2D X X S X X

Kriteria uji, tolah H0 jika Z > f pada taraf tertentu.

Analisis diskriminan dua kelompok pendekatan

pemecahannya dapat melalui analisis regresi multipel. Variabel

respons fungsi diskriminan dalam analisis regresi multipel [

C r am e r (1967), K e n d a l l (1961), F i s h e r (1938) ], yaitu:

1i

nL

n jika Xi dari kelompok 1

=2n

n jika Xi dari kelompok 2

Analisis varians atau anova dapat dilihat pada Tabel 5.1

T a b e l 5 . 1

A n o v a A n a l i s i s D i s k r im i n a n


#74

m e l a l u i A n a l i s i s R e g r e s i M u l t i p e l

S um b e r

v a r i a s i

J um l a h k u a d r a t D e r a j a t

b e b a s

Regresi

Kekeliruan

'1 21 2

n nb X X

n

'1 21 21

n nb X X

n

k

n - k - 1

Total 1 2n n

n

n - 1

Jika hasil pengujian signifikansi, ada petunjuk kuat bahwa ada

perbedaan kelompok. Hubungan antara D2

dengan koefisien

determinasi R2

diberikan sebagai

22

2

1 2

( 2)

1

R n nD

R n n

5 . 6 P e n g u j i a n v a r i a b e l p r e d i k t o r

Setelah semua variabel-variabel prediktor dapat

membedakan populasi 1 dan 2 melalui pengujian hipotesis

pada bagian sebelumnya, selanjutnya timbul pertanyaan seperti

: Variabel-variabel mana saja yang ‘benar-benar’ dapat

membedakan populasi 1 dan 2. Untuk menjawab pertanyaan

tersebut, salah satunya dapat melalui pengujian secara


#75

statistik. Metode yang dibahas diantaranya adalah melalui

Discriminant Loadings dan analisis diskriminan stepwise.

5 . 6 . 1 D i s c r im i n a n t L o a d i n g s

Discriminant Loadings adalah korelasi antara variabel

prediktor dengan fungsi diskriminan. Metode ini biasanya

sering digunakan untuk analisis diskriminan multipel.

Perumusannya dapat digunakan sebagai berikut :

( loading )j = R b*

j

Dengan, R adalah matriks korelasi, b*

j = C b j ; dan C adalah akar

pangkat dua dari elemen diagonal utama pada matriks S.

Metode ini biasanya dilakukan melalui peragaan grafik.

5 . 6 . 2 A n a l i s i s D i s k r im i n a n S t e p w i s e

Analisis diskriminan stepwise pada prinsipnya hampir

sama seperti dalam analisis regresi multipel. Dalam prinsip

analisis stepwise dimulai dari model yang paling sederhana

sampai kompleks. Kriteria variabel-variabel mana yang masuk

dalam model yaitu didasarkan pada kepada nilai maksimum D2

( Jarak Mahalanobis ) atau nilai Lamda Wilks yang terkecil, atau

nilai maksimum dari F ( F - t o e n t e r , F - t o r e m o v e ) . Dengan

demikian akan didapat variabel-variabel prediktor mana yang

secara simultan mempunyai Discriminating Power yang berarti.

5 . 7 C O N T O H A P L I K A S I S P S S D A N I N T E R P R E T A S I

D is c r im in a n t

L o a d i n g s

Korelasi antara

variabel prediktor

dengan fungsi

diskriminan..


#76

Sebuah Perusahaan yang bergerak dalam penjualan Air

Mineral mengumpulkan data sekelompok konsumen Air

Mineral dengan variabel berikut :

Tipe Konsumen dari banyaknya air mineral yang

diminum, dengan kode :

Kode 0 = SEDIKIT (konsumen yang termasuk tipe sedikit

minum air mineral)

Kode 2 = BANYAK (konsumen yang termasuk tipe banyak

minum air mineral)

Usia Konsumen (tahun)

Berat Badan Konsumen (kilogram)

Pendapatan Konsumen (ribuan Rupiah/bulan)

Jam Kerja Konsumen dalam sehari (jam)

Kegiatan Olahraga Konsumen dalam sehari (jam)

T a b e l 5 . 2

D a t a K o n s u m e n A i r M i n e r a l

N am a

M in um

U s i a

B e r a t

T i n g g i

I n c o m e

J am K e r j a

O l a h r a g a

RUSDI sedikit 40.00 65.00 154.00 680.00 5.33 3.0

NINA sedikit 30.00 70.00 157.00 700.00 5.30 3.6

LANNY sedikit 25.00 60.00 158.00 580.00 5.27 3.5

CITRA sedikit 26.00 75.00 160.00 600.00 5.33 3.0

DINA sedikit 40.00 50.00 159.00 700.00 5.50 3.5

SISKA banyak 28.00 62.00 158.00 440.00 5.00 2.2

LUSI sedikit 29.00 50.00 160.00 580.00 5.07 2.9

LENNY sedikit 40.00 52.00 165.00 800.00 5.13 4.0

RUDI banyak 35.00 68.00 150.00 700.00 5.17 3.5

ROBY sedikit 36.00 70.00 152.00 720.00 5.23 3.6

BAMBANG sedikit 39.00 50.00 154.00 780.00 5.33 3.9

YUNUS sedikit 30.00 62.00 155.00 600.00 5.30 3.0

LESTARI sedikit 34.00 60.00 157.00 680.00 5.27 2.9

ERNI banyak 35.00 51.00 160.00 700.00 5.33 4.0

ESTI banyak 29.00 62.00 165.00 580.00 5.50 3.5


#77

HANY banyak 30.00 51.00 162.00 600.00 5.00 3.6

HESTY sedikit 35.00 80.00 157.00 700.00 5.33 3.9

SUSAN banyak 22.00 52.00 154.00 440.00 5.30 3.0

LILIS sedikit 40.00 72.00 155.00 800.00 5.27 3.4

LITA banyak 41.00 45.00 164.00 820.00 5.33 3.5

LINA sedikit 32.00 42.00 160.00 640.00 5.50 2.9

RANI sedikit 29.00 54.00 157.00 580.00 5.30 3.0

BOBY banyak 21.00 35.00 150.00 420.00 5.27 3.5

ANDRE banyak 25.00 50.00 154.00 500.00 5.07 2.5

HENGKY sedikit 30.00 60.00 158.00 600.00 5.20 3.0

HANA sedikit 45.00 40.00 159.00 900.00 5.13 4.5

ELI banyak 35.00 45.00 158.00 700.00 5.17 3.5

RENATA sedikit 35.00 42.00 152.00 700.00 5.23 3.5

DEWI banyak 30.00 51.00 156.00 600.00 5.30 3.0

JOHAN sedikit 24.00 75.00 154.00 480.00 5.13 2.4

GUNAWAN banyak 28.00 42.00 155.00 560.00 5.17 2.8

LINA banyak 27.00 51.00 157.00 540.00 5.23 2.7

VINA banyak 20.00 55.00 159.00 400.00 5.30 2.0

RINA sedikit 26.00 70.00 160.00 520.00 5.33 2.6

SUGENG sedikit 29.00 40.00 162.00 580.00 5.40 2.9

HANDOKO banyak 20.00 42.00 156.00 400.00 5.20 2.0

HERMAN banyak 35.00 51.00 153.00 700.00 5.10 3.5

SOBARI sedikit 31.00 70.00 162.00 620.00 5.40 3.1

RULLY banyak 34.00 55.00 164.00 680.00 5.47 3.4

BINSAR sedikit 28.00 52.00 160.00 560.00 5.33 2.8

FANNY banyak 29.00 51.00 165.00 580.00 5.50 2.9

FENNY banyak 21.00 40.00 162.00 420.00 5.40 2.1

YULITA sedikit 22.00 70.00 179.00 440.00 5.23 2.2

YULIA banyak 22.00 65.00 159.00 440.00 5.30 2.2

RICHARD sedikit 25.00 47.00 154.00 500.00 5.13 2.1

ROSSY banyak 30.00 40.00 158.00 600.00 5.27 2.2

LEONY sedikit 45.00 49.00 159.00 900.00 5.30 2.2

AGNES sedikit 35.00 59.00 156.00 700.00 5.20 2.5

DEDDY banyak 39.00 70.00 175.00 780.00 5.13 3.0

DODIK banyak 34.00 45.00 155.00 680.00 5.17 4.5

DIMAS banyak 24.00 58.00 160.00 480.00 5.33 2.4

KIKY sedikit 31.00 75.00 175.00 620.00 5.40 3.1

CONNY sedikit 32.00 70.00 156.00 640.00 5.20 3.2

MARY sedikit 35.00 59.00 160.00 700.00 5.33 3.5

SUSY banyak 38.00 70.00 174.00 760.00 5.40 3.8

USMAN banyak 20.00 46.00 163.00 400.00 5.43 2.0

SALIM banyak 25.00 55.00 168.00 500.00 5.13 2.5

JAMES banyak 29.00 49.00 153.00 580.00 5.10 2.9

JONI banyak 28.00 62.00 179.00 700.00 5.40 3.5

JONO sedikit 27.00 41.00 148.00 780.00 5.20 3.9

KRISTANTO sedikit 26.00 47.00 160.00 680.00 5.33 3.4

KARIM banyak 22.00 47.00 164.00 480.00 5.40 2.4

MELANI sedikit 20.00 49.00 157.00 760.00 5.43 3.8

RUSMIN banyak 24.00 48.00 178.00 400.00 5.13 2.0


#78

SULASTRI sedikit 25.00 59.00 160.00 500.00 5.10 2.5

LILIANA banyak 32.00 48.00 162.00 420.00 5.30 2.1

PRIHARDI banyak 34.00 46.00 168.00 740.00 5.07 3.7

SUHARDI sedikit 32.00 45.00 159.00 700.00 5.10 3.5

SUSANA banyak 21.00 58.00 158.00 600.00 5.30 3.0

TITIK sedikit 37.00 47.00 159.00 720.00 5.07 3.6

TATIK banyak 35.00 46.00 175.00 700.00 5.30 3.5

NANIK sedikit 30.00 52.00 150.00 600.00 5.27 3.6

NINIK sedikit 36.00 44.00 162.00 720.00 5.30 3.5

NUNING banyak 39.00 55.00 162.00 780.00 5.20 2.5

GALA banyak 30.00 50.00 165.00 600.00 5.50 2.1

Berdasarkan data di atas, akan dilakukan analisis

Diskriminan untuk mengetahui :

Apakah ada perbedaan yang signifikan antara mereka

yang minum Air Mineral Dalam Kemasan (AMDK) dengan

mereka yang sedikit meminumnya?

Jika ada perbedaan yang signifikan, variable apa saja

yang membuat perilaku konsumen Air Mineral mereka

berbeda?

Membuat model diskriminan dua factor (karena hanya

ada mereka yang SEDIKIT dengan yang BANYAK) untuk

kasus tersebut.

Menguji ketepatan model (fungsi) diskriminan

Untuk menganalisis data di atas melalui program SPSS

maka diperlihatkan langkah-langkah sebagai berikut :

Dari SPSS Data Editor, setelah semua variabel masuk, tekan

A n a l y z e C l a s s i f y D i s c r im i n a n t , seperti berikut :


#79

Sehingga tampak tampilan seperti berikut :

Kemudian masukan variabel Minum ke kotak dialog G r o u p i n g

V a r i a b l e , dan sisanya ke kotak dialog I n d e p e n d e n t s ..

Perhatikan tampilan di bawah ini :


#80

Tekan D e f i n e R a n g e untuk memasukan nilai kategori pada

dependen variabel. Sehingga muncul tampilan berikut di bawah

ini. Untuk nilai m i n im um masukan 0 dan m a x im um = 1 .Lalu

C o n t i n u e .

Tekan S t a t i s t i c s untuk memilih output yang akan

ditampilkan, kemudian checklist beberapa pilihan seperti

tampilan di bawah ini :


#81

Perhatikan bagian tengah kotak dialog utama. Klik mouse pada

pilihan Use stepwise method, maka secara otomatis icon M E T H O D

akan terbuka (aktif), kemudian isi beberpa pilihan sebagai

berikut :

Kotak diaolog C L A S S I F Y adlah pelengkap dari pembuatan model

diskriminan, terutama cara penyajian model diskriminan, serta

kelayakan model tersebut. Isi sesuai dengan tampilan berikut

ini :


#82

Lalu C o n t i n u e dan tekan O K sehingga muncul Output dan sbb:

Discriminant

Analysis Case Processing Summary

75 100.0

0 .0

0 .0

0 .0

0 .0

75 100.0

Unweighted Cases

Valid

Missing or out-of-range

group codes

At least one missing

discriminating variable

Both missing or

out-of-range group codes

and at least one missing

discriminating variable

Total

Excluded

Total

N Percent

Menunjukan ada

tidaknya data

yang hilang.


#83

Tabel G R O U P S T A T I S T IC S pada dasarnya berisi data

desktriptif yang utama yakni rata-rata dan standar deviasi dari

kedua grup konsumen. Misalnya pada tabel di atas kita dapat

melihat bahwa konsumen yang termasuk tipe ‘sedikit’ (0) yang

meminum air mineral mempunyai rata-rata berat badan 57,21

kilogram. Sedangkan mereka yang termasuk tipe ‘banyak’

51,81 kilogram, dan seterusnya untuk deskripsi variabel

lainnya.

Group Statistics

31.8684 6.12558 38 38.000

57.2105 11.76609 38 38.000

158.4474 5.66496 38 38.000

659.4737 106.79476 38 38.000

5.2684 .11100 38 38.000

3.1974 .55385 38 38.000

28.9459 6.15515 37 37.000

51.8108 8.48475 37 37.000

161.5676 7.44439 37 37.000

578.9189 129.52442 37 37.000

5.2614 .13945 37 37.000

2.9054 .67780 37 37.000

30.4267 6.27344 75 75.000

54.5467 10.56549 75 75.000

159.9867 6.74335 75 75.000

619.7333 124.53127 75 75.000

5.2649 .12503 75 75.000

3.0533 .63124 75 75.000

Usia

Berat

Tinggi

Income

JamKerja

Olahraga

Usia

Berat

Tinggi

Income

JamKerja

Olahraga

Usia

Berat

Tinggi

Income

JamKerja

Olahraga

Minum.00

1.00

Total

Mean Std. Deviation Unweighted Weighted

Valid N (listwise)

Menunjukan

deskriptif

data


#84

Berdasarkan output di atas, diperoleh hasil analisis

dengan menggunakan uji F sebagai berikut :

Variabel USIA, BERAT, TINGGI, INCOME, dan OLAHRAGA

mempunyai angka signifikansi dibawah 0,05 maka

terdapat perbedaan antar group. Artinya, usia, berat,

tinggi, income dan olahraga mempengaruhi banyak

sedikitnya mereka yang mengkonsumsi air mineral.

Variabel JAM KERJA mempunyai angka Sig. 0,783 > 0,05.

Artinya, jumlah Jam Kerja seseorang tidak

mempengaruhi banyak sedikitnya konsumsi air mineral.

Dari enam variable di atas, terdapat lima variable yang

berbeda secara signifikan untuk dua grup diskriminan, yaitu

USIA, BERAT, TINGGI, INCOME dan OLAHRAGA. Dengan

demikian, sedikit atau banyaknya konsumsi seseorang akan air

mineral dipengaruhi oleh usia responden, berat dan tinggi

badan responden, tingkat penghasilan dan kegiatan olahraga

responden yang bersangkutan.

Tests of Equality of Group Means

.945 4.247 1 73 .043

.934 5.173 1 73 .026

.946 4.186 1 73 .044

.894 8.656 1 73 .004

.999 .059 1 73 .808

.946 4.183 1 73 .044

Usia

Berat

Tinggi

Income

JamKerja

Olahraga

Wilks'

Lambda F df1 df2 Sig.

Pengujian

perbedaan

antargrup


#85

Namun, pada beberapa analisis diskriminan, sebuah

variable yang tidak lolos uji tidak otomatis dikeluarkan. Seperti

pada variable JAM KERJA, walaupun tidak lolos uji, namun

seharusnya tetap disertakanpada analisis diskriminan

selanjutnya. Karena, sesuai prinsip pada analisis multivariate,

bahwa variable-variabel dianggap sebagai suatu kesatuan, dan

bukan terpisah-pisah.

Jika analisis ANOVA dan angka Wilk’s Lambda menguji

rata-rata dari setiap variable, maka Box’s M menguji varians dari

setiap variable. Asumsi pada analisis diskriminan :

Varians variable bebas untuk tiap grup seharusnya sama.

Jika demikan, seharusnya varians dari responden yang

Sedikit mengkonsumsi air mineral sama dengan varians dari

responden yang Banyak mengkonsumsi air mineral.

Varians di antara variabel-variabel bebas seharusnya juga

sama. Jika demikian, seharusnya dari USIA sama dengan

varians dari BERAT, OLAHRAGA dan sebagainya.

Dari kedua asumsi di atas, seharusnya group covariance

matrices adalah relative sama, yang diuji dengan alat Box’s M

dengan ketentuan :

Test Results

28.145

1.222

21

19569.371

.220

Box's M

Approx.

df1

df2

Sig.

F

Tests null hypothesis of equal population covariance matrices.


#86

HIPOTESIS :

H0 : group covariance matrices adalah relative sama

H1 : group covariance matrices adalah berbeda secara nyata

Kriteria uji :

Tolak H0 jika Sig. < 0,05. Terima dalam hal lainnya.

Dari table output terlihat bahwa angka Sig. (0,220) > 0,05

yang berarti group covariance matrices adalah sama. Artinya,

data di atas sudah memenuhi asumsi analisis diskriminan.

Stepwise Statistics

Tabel di atas menyajikan variabel mana saja dari lima

variabel yang bisa dimasukan (entered) dalam persamaan

diskriminan. Proses yang dilakukan adalah stepwise (bertahap),

dimulau oleh variabel yang memiliki angka F statistik terbesar.

Pada tahap pertama angka F hitung variabel INCOME

adalah yang terbesar, mencapai 8.656. Sehingga pada tahap

pertama ini variabel INCOME terpilih. Selanjutnya pada tahap

Variables Entered/Removeda,b,c,d

Income .462.00 and 1.

008.656 1 73.000 .004

Berat .776.00 and 1.

007.170 2 72.000 .001

Tinggi 1.208.00 and 1.

007.343 3 71.000 .000

Step

1

2

3

Entered Statistic

Between

Groups Statistic df1 df2 Sig.

Exact F

Min. D Squared

At each step, the variable that maximizes the Mahalanobis distance between the two closest

groups is entered.

Maximum number of steps is 12.a.

Maximum significance of F to enter is .05.b.

Minimum significance of F to remove is .10.c.

F level, tolerance, or VIN insufficient for further computation.d.


#87

dua dan tiga diikuti oleh variabel BERAT dan TINGGI badan.

Ketiga variabel ini memiliki angka signifikan lebih kecil dari

0.05. Dengan demikian, dari lima variabel yang dimasukan

hanya ada tiga variabel yang signifikan. Dengan kata lain,

variabel INCOME, BERAT, dan TINGGI secara signifikan

mempengaruhi perilaku konsumen dalam mengkonsumsi

sedikit atau banyaknya air mineral.

Tabel diatas sebenarnya hanyalah perincian (detail) dari

proses stepwise pada tabel sebelumnya. Pada step 1, variabel

INCOME adalah variabel pertama yang masuk ke dalam model

diskriminan. Hal ini disebabkan variabel tersebut mempunyai

angka SIG. OF F TO REMOVE yang paling sedikit, yakni 0,004

(jauh di bawah 0,05). Kemudian pada step 2, dimasukkan

variabel kedua, yakni BERAT. Variabel tersebut memenuhi

syarat, karena mempunyai angka SIG. OF F TO REMOVE di

bawah 0,005, yakni 0,0026. pada step 3 atau terakhir,

dimasukkan variabel ketiga, yakni TINGGI. Variabel tersebut

juga memenuhi syarat, dengan angka SIG. OF F TO REMOVE di

Variables in the Analysis

1.000 .004

.997 .004 .276.00 and 1.

00

.997 .026 .462.00 and 1.

00

.993 .004 .647.00 and 1.

00

.944 .008 .721.00 and 1.

00

.943 .012 .776.00 and 1.

00

Income

Income

Berat

Income

Berat

Tinggi

Step

1

2

3

Tolerance

Sig. of F to

Remove

Min. D

Squared

Between

Groups


#88

bawah 0,05, yakni 0,012. perhatikan perubahan angka pada

variabel BERAT seiring dengan masuknya variabel ketiga, yakni

variabel TINGGI.

Pada step 0 (keadaan awal), kelima variabel secara

lengkap ditayangkan dengan SIG. OF F TO REMOVE sebagai

faktor penguji. Terlihat angka SIG. OF F TO REMOVE yang

Variables Not in the Analysis

1.000 1.000 .043 .227.00 and 1.

00

1.000 1.000 .026 .276.00 and 1.

00

1.000 1.000 .044 .223.00 and 1.

00

1.000 1.000 .004 .462.00 and 1.

00

1.000 1.000 .808 .003.00 and 1.

00

1.000 1.000 .044 .223.00 and 1.

00

.318 .318 .542 .484.00 and 1.

00

.997 .997 .026 .776.00 and 1.

00

.997 .997 .042 .721.00 and 1.

00

1.000 1.000 .811 .465.00 and 1.

00

.538 .538 .953 .462.00 and 1.

00

.317 .316 .458 .812.00 and 1.

00

.943 .943 .012 1.208.00 and 1.

00

.996 .994 .926 .776.00 and 1.

00

.537 .537 .876 .777.00 and 1.

00

.316 .316 .524 1.238.00 and 1.

00

.956 .905 .556 1.234.00 and 1.

00

.523 .523 .798 1.213.00 and 1.

00

Usia

Berat

Tinggi

Income

JamKerja

Olahraga

Usia

Berat

Tinggi

JamKerja

Olahraga

Usia

Tinggi

JamKerja

Olahraga

Usia

JamKerja

Olahraga

Step0

1

2

3

Tolerance

Min.

Tolerance

Sig. of F

to Enter

Min. D

Squared

Between

Groups


#89

terkecil adalah pada variabel INCOME (0,004). Maka variabel

INCOME dikeluarkan dari step 0 tersebut, yang berarti variabel

tersebut bukan termasuk variabel yang tidak dianalisis.

Pada step 1, sekarang terlihat ada empat variabel, dan

proses pengujian terus berjalan, dengan pedoman angka SIG.

OF F TO REMOVE harus di bawah 0,05 dan jika mungkin diambil

angka yang terkecil. Terlihat variabel BERAT sekarang

mempunyai angka SIG. OF F TO REMOVE terkecil (0,026),

sehingga variabel tersebut dikeluarkan.

Pada step 2, sekarang terlihat ada tiga angka variabel,

dan terlihat variabel TINGGI pada step ini mempunyai angka

SIG. OF F TO REMOVE terkecil (0,012), sehingga variabel

tersebut dikeluarkan.

Pada step 3, sekarang terlihat hanya ada dua variabel,

dan terlihat kedua variabel tersebut mempunyai angka SIG. OF

F TO REMOVE di atas 0,05 (yakni 0,524 untuk USIA dan 0,798

untuk OLAHRAGA). Oleh karena sudah tidak ada variabel yang

memenuhi syarat, maka proses pengeluaran variabel berhenti,

dan kedua variabel sisa tersebut tidak dikeluarkan, yang berarti

keduanya termasuk pada VARIABLE NOT IN THE ANALYSIS, atau

variabel yang tidak dianalisi lebih lanjut.

Wilks' Lambda

1 .894 1 1 73 8.656 1 73.000 .004

2 .834 2 1 73 7.170 2 72.000 .001

3 .763 3 1 73 7.343 3 71.000 .000

Step

1

2

3

Number of

Variables Lambda df1 df2 df3 Statistic df1 df2 Sig.

Exact F


#90

Wilk`s Lambda pada prinsipnya adalah varians total

dalam dicriminant scores yang tidak bisa dijelaskan oleh

perbedaan di antara grup-grup yang ada. Perhatikan tabel di

atas yang terdiri atas tiga tahap (step), yang terkait dengan tiga

variabel yang secara berurutan dimasukkan pada tahapan

analisis sebelumnya.

Pada step 1, jumlah variabel yang dimasukkan ada satu

(INCOME), dengan angka wilk`s Lambda adalah 0.894. hal ini

berarti 89.4% varians tidak dapat dijelaskan oleh perbedaan

antar grup-grup. Kemudian pada step 2, dengan tambahan

variabel BERAT (lihat kolom NUMBER OF VARIABLES yang

sekarang adalah 2), angka wilk`s Lambda turun menjadi 0,834.

dan pada step 3, angka itu turun lagi menjadi 0,763. Penurunan

angka wilk`s Lambda tentu baik bagi model diskriminan,

karena varians yang tidak bisa dijelaskan juga semakin kecil

(dari 89,4% menjadi 76,3%).

Dari kolom F dan signifikansinya, terlihat bik pada

pemasukan variabel 1,2 dan kemudian 3, semuanya adalah

signifikan secara statistik. Hal ini berarti ketiga variabel

tersebut (INCOME, BERAT, dan TINGGI) memang berbeda untuk

kedua tipe konsumen.

Summary of Canonical Discriminant Functions


#91

Canonical Correlation mengukur keeratan hubungan antara

discriminant scores dengan grup (dalam hal ini, karena ada dua

tipe konsumen, maka ada dua grup). Angka 0,487

menunjukkan keeratan yang cukup tiggi, dengan ukuran skala

asosiasi antara 0 sampai 1.

Tabel diatas menyatakan angka akhir wilk`s Lambda, yang

sebenarnya sama saja dengan angka terakhir dari step 3

pembuatan model diskriminan (lihat tabel terdahulu). Angka

Chi-Square sebesar 19,321 dengan tingkat signifikansi yang

cukup tinggi menunjukkan perbedaan yang jelas antara dua

grup konsumen (mereka yang BANYAK minum dengan yang

SEDIKIT minum).

Eigenvalues

.310a 100.0 100.0 .487

Function1

Eigenvalue % of Variance Cumulative %

Canonical

Correlation

First 1 canonical discriminant functions were used in the

analysis.

a.

Wilks' Lambda

.763 19.321 3 .000

Test of Function(s)

1

Wilks'

Lambda Chi-square df Sig.


#92

Tabel STRUCTURE MATRIX menjelaskan korelasi antara variabel

independen dengan fungsi diskriminan yang terbentuk.

Terlihat variabel USIA, BERAT dan seterusnya. Hanya disini

variabel USIA dan OLAHRAGA tidak dimasukkan dalam model

diskriminan (perhatikan tanda a di dekat variabel tersebut).

Perhatikan tanda korelasi yang sama dengan tanda koefisien

pada model Discriminant Scores.

Tabel diatas mempunyai fungsi yang hampir mirip dengan

persamaan regresi berganda, yang dalam analisis diskriminan

disebut sebagai FUNGSI DISKRIMINAN :

z Scores = 7,884 + 0,064 BERAT -0,093 TINGGI +0,006 INCOME.

Structure Matrix

.618

.521

.478

.475

-.430

-.091

Income

Usia a

Berat

Olahraga a

Tinggi

JamKerja a

1

Function

Pooled within-groups correlations between discriminating

variables and standardized canonical discriminant functions

Variables ordered by absolute size of correlation within function.

This variable not used in the analysis.a.

Canonical Discriminant Function Coefficients

.064

-.093

.006

7.884

Berat

Tinggi

Income

(Constant)

1

Function

Unstandardized coefficients


#93

Kegunaan fungsi ini untuk mengetahui sebuah case (dalam

kasus ini adalah seorang konsumen) masuk pada grup yang

satu, ataukah tergolong pada grup yang lainnya.

Selain fungsi di atas, dengan dipilihnya FISHER FUNCTION

COEFFICIENT pada proses analisis, maka akan terbentuk pula

fungsi diskriminan Fisher (lihat pembahasan selanjutnya).

Oleh karena ada dua tipe konsumen, maka disebut Two-Group

Discriminant, dimana grup yang satu mempunyai Centroid

(Group Means) negatif, dan grup satunya lagi mempunyai

Centroid (Group Means) positif. Angka pada tabel menunjukkan

besaran Z yang memisahkan kedua grup tersebut.

Gambar :

Functions at Group Centroids

.542

-.557

Minum.00

1.00

1

Function

Unstandardized canonical discriminant

functions evaluated at group means


#94

Terlihat distribusi anggota grup dengan kode 0 (SEDIKIT) dan

kode 1 (BANYAK), di mana dari 75 responden, 37 orang ada

3210-1-2

8

6

4

2

0

Mean = 0.54Std. Dev. = 0.968N = 38

Minum = 0

Canonical Discriminant Function 1

3210-1-2-3-4

14

12

10

8

6

4

2

0

Mean = -0.56Std. Dev. = 1.032N = 37

Minum = 1

Canonical Discriminant Function 1


#95

pada grup BANYAK dan 38 orang ada pada grup SEDIKIT

(komposisi anggota lihat penjelasan selanjutnya).

Tampilan gambar di atas akan digunakan untuk menentukan

apakah seorang responden akan tergolong pada grup SEDIKIT

atau BANYAK (lihat penjelasan bagian CASEWISE RESULT).

Classification Statistics

Tabel di atas memperlihatkan komposisi ke 75 responden yang

dengan moel diskriminan menghasilkan 37 responden ada di

grup BANYAK, sedang sisanya ada di grup SEDIKIT.

Sama seperti tampilan Unstandardized (Canonical) sebelumnya.

Fungsi diskriminan dari Fisher pada prinsipnya membuat

semacam persamaan regresi, dengan pembagian berdasar pada

kode grup :

Mereka yang minum air mineral dalam kategori SEDIKIT :

Prior Probabilities for Groups

.500 38 38.000

.500 37 37.000

1.000 75 75.000

Minum

.00

1.00

Total

Prior Unweighted Weighted

Cases Used in Analysis

Classification Function Coefficients

.035 -.035

3.587 3.690

.036 .030

-297.882 -306.557

Berat

Tinggi

Income

(Constant)

.00 1.00

Minum

Fisher's linear discriminant functions


#96

SCORE = -297,882 + 0,03506 BERAT +3,587 TINGGI +0,03007

INCOME

Mereka yang minum air mineral dalam kategori BANYAK:

SCORE = -306,557 -0,03481 BERAT +3,690 TINGGI +0,03007

INCOME

Selisih di antara grup SEDIKIT dengan BANYAK adalah :

(-297,882+0,03506 BERAT+3,587 TINGGI+0,03641 INCOME)

– (-306,557-0,03481BERAT+3,690 TINGGI+0,03007 INCOME)

Documents

Fakultas Ekonomi UNPAD Pengantar Statistika Ekonomi dan … · Fakultas Ekonomi UNPAD Pengantar Statistika Ekonomi dan Bisnis #65 ... Asumsi dasar analisis diskriminan, yaitu : 1