Upload
latifa-dini-archam
View
158
Download
6
Embed Size (px)
Citation preview
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
BAB IPENDAHULUAN
1.1 Latar Belakang
Statistika adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan
data, pengolahan atau penganalisaannya dan penarikan kesimpulan berdasarkan
kumpulan data dan penganalisaan yang dilakukan.
Dalam suatu penelitian, terkadang diperlukan analisis mengenai hubungan antara
beberapa variabel sebagai variabel yang ingin diteliti. Yang dimaksud dengan variabel
penelitian adalah segala sesuatu yang ingin diteliti dan memiliki variasi nilai, sehingga
dapat dilakukan analisis lebih lanjut.
Analisis yang dilakukan untuk meneliti variabel-variabel penelitian dapat dilakukan
dengan bantuan statistik. Salah satu cara untuk menganalisis variabel penelitian adalah
dengan menggunakan teknik analisis regresi dan analisis korelasi. Korelasi merupakan
istilah yang digunakan untuk mengukur kekuatan hubungan antar variable. Analisis
korelasi adalah cara untuk mengetahuai ada atau tidak adanya hubungan antarvariabel
misalnya hubungan antar duan variable.Apabila terdapat hubungan antar variable maka
perubahan-perubahan yang terjadi pada salah satu variable akan mengakibatkan
terjadinya perubahan antar variable lainnya. Berbeda halnya dengan analisis regresi
merupakan suatu alat ukur yang juga digunakan untuk mengetahuai ada atau tidak adanya
hubungan antarvariabel yang berarti ramalan atau taksiran. Namun, analisa regresi lebih
akurat dalam melakukan analisa korelasinya, karena pada analisis ini kesulitan dalam
menunjukkan slop (tingkat perubahan suatu variable terhadap variable lainnya dapat
ditentukan), jadi dengan analisis regresi peramalan atau perkiraan nilai variable terikat
pada niali variable bebas lebih akurat pula.
Praktikum ini bertujuan agar praktikan dalam hal ini mahasiswa program studi
Teknik Industri angkatan 2009 dapat memahami analisis korelai dan regresi. Dengan
adanya praktikum statistik industri ini diharapkan mahasiswa Teknik Industri dapat
mengetahui dan memahami tentang statistik dan prakteknya secara langsung
menggunakan software SPSS 17.
1.2 Batasan
Batasan-batasan yang disunakan selama praktikum ini, yaitu :
1. Data yang digunakan adalah data primer
2. Jumlah data yang diambil sebanyak 35 sampel.
1
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
1.3 Asumsi
Asumsi- asumsi yang digunakan selama praktikum ini antara lain:
1. Kenormalan
2. Linier
3. Homogen
4. Independen/kebebasan antar pengamatan.
1.4 Tujuan Praktikum
Tujuan dari pelaksanaan praktikum ini antara lain :
1. Untuk mengetahui dan memahami fungsi analisis korelasi dan regresi.
2. Untuk mengetahui cara pengujian analisis korelasi dan regresi serta dapat menarik
kesimpulan dari hasil pengujian tersebut.
3. Untuk mengetahui korelasi antar variabel bebas(independen) dan variabel
bebas(dependen)
4. Untuk memahami aplikasi dari penggunaan analisi regresi, baik regresi linier
sederhana maupun berganda.
1.5 Manfaat Praktikum
Manfaat yang diperoleh dari pelaksanaan praktikum ini antara lain :
1. Agar praktikan dapat mengetahui dan memahami fungsi analisis korelasi dan regresi
2. Agar praktikan dapat mengetahui cara pengujian analisis korelasi dan regresi serta
dapat menarik kesimpulan dari hasil pengujian tersebut
3. Agar praktikan dapat mengetahui korelasi antar variabel bebas(independen) dan
variabel bebas (dependen)
4. Agar praktiakan dapat memahami aplikasi dari penggunaan analisis fegresi, baik
regresi linier sederhana maupun berganda.
2
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
BAB IITINJAUAN PUSTAKA
2.1 Korelasi2.1.1 Pengertian Korelasi
Korelasi merupakan istilah yang digunakan untuk mengukur kekuatan hubungan
antar variable. Analisis korelasi adalah cara untuk mengetahuai ada atau tidak adanya
hubungan antarvariabel misalnya hubungan antar duan variable.Apabila terdapat
hubungan antar variable maka perubahan-perubahan yang terjadi pada salah satu
variable akan mengakibatkan terjadinya perubahan antar variable lainnya. Maka denagn
dilakukan analisis korelasi ini dapat diketahui hubungan antar variable tersebut, yaitu
merupakan suatu hubungan kebetulan atau memang hubungan yang sebenarnya.
2.1.2 Teori Korelasi
Korelasi merupakan teknik analisis yang termasuk dalam salah satu teknik
pengukuran asosiasi/hubungan (measures of association). Pengukuran asosiasi
merupakan istilah umum yang mengacu pada sekelompok teknik dalam statistik bivariat
yang digunakan untuk mengukur kekuatan hubungan antara dua variabel. Diantara sekian
banyak teknik-teknik pengukuran asosiasi, terdapat dua teknik korelasi yang sangat
populer sampai sekarang, yaitu Korelasi Pearson Product Moment dan Korelasi Rank
Spearman. Selain kedua teknik tersebut, terdapat pula teknik-teknik korelasi lain, seperti
Kendal, Chi-Square, Phi Coefficient, Goodman-Kruskal, Somer, dan Wilson.
Pengukuran asosiasi mengenakan nilai numerik untuk mengetahui tingkatan asosiasi
atau kekuatan hubungan antara variabel. Dua variabel dikatakan berasosiasi jika perilaku
variabel yang satu mempengaruhi variabel yang lain. Jika tidak terjadi pengaruh, maka
kedua variabel tersebut disebut independen.
Dalam korelasi sebenarnya tidak dikenal istilah variabel bebas dan variabel
tergantung. Biasanya dalam penghitungan digunakan simbol X untuk variabel pertama
dan Y untuk variabel kedua. Dalam contoh hubungan antara variabel remunerasi dengan
kepuasan kerja, maka variabel remunerasi merupakan variabel X dan kepuasan kerja
merupakan variabel Y.
2.1.2.1 Korelasi dan Linearitas
Terdapat hubungan erat antara pengertian korelasi dan linieritas. Korelasi Pearson,
misalnya, menunjukkan adanya kekuatan hubungan linier dalam dua variabel. Sekalipun
demikian jika asumsi normalitas salah maka nilai korelasi tidak akan memadai untuk
membuktikan adanya hubungan linieritas. Linieritas artinya asumsi adanya hubungan
3
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
dalam bentuk garis lurus antara variabel. Linearitas antara dua variabel dapat dinilai
melalui observasi scatterplots bivariat. Jika kedua variabel berdistribusi normal dan
behubungan secara linier, maka scatterplot berbentuk oval; jika tidak berdistribusi
normal scatterplot tidak berbentuk oval.
Dalam praktinya kadang data yang digunakan akan menghasilkan korelasi tinggi
tetapi hubungan tidak linier; atau sebaliknya korelasi rendah tetapi hubungan linier.
Dengan demikian agar linieritas hubungan dipenuhi, maka data yang digunakan harus
mempunyai distribusi normal. Dengan kata lain, koefesien korelasi hanya merupakan
statistik ringkasan sehingga tidak dapat digunakan sebagai sarana untuk memeriksa data
secara individual.
2.1.2.2 Korelasi dan Kausalitas
Ada perbedaan mendasar antara korelasi dan kausalitas. Jika kedua variabel
dikatakan berkorelasi, maka kita tergoda untuk mengatakan bahwa variabel yang satu
mempengaruhi variabel yang lain atau dengan kata lain terdapat hubungan kausalitas.
Kenyataannya belum tentu. Hubungan kausalitas terjadi jika variabel X mempengaruhi Y.
Jika kedua variabel diperlakukan secara simetris (nilai pengukuran tetap sama seandainya
peranan variabel-variabel tersebut ditukar) maka meski kedua variabel berkorelasi tidak
dapat dikatakan mempunyai hubungan kausalitas. Dengan demikian, jika terdapat dua
variabel yang berkorelasi, tidak harus terdapat hubungan kausalitas.
Terdapat dictum yang mengatakan “correlation does not imply causation”. Artinya
korelasi tidak dapat digunakan secara valid untuk melihat adanya hubungan kausalitas
dalam variabel-variabel. Dalam korelasi aspek-aspek yang melandasi terdapatnya
hubungan antar variabel mungkin tidak diketahui atau tidak langsung. Oleh karena itu
dengan menetapkan korelasi dalam hubungannya dengan variabel-variabel yang diteliti
tidak akan memberikan persyaratan yang memadai untuk menetapkan hubungan
kausalitas kedalam variabel-variabel tersebut. Sekalipun demikian bukan berarti bahwa
korelasi tidak dapat digunakan sebagai indikasi adanya hubungan kausalitas antar
variabel. Korelasi dapat digunakan sebagai salah satu bukti adanya kemungkinan
terdapatnya hubungan kausalitas tetapi tidak dapat memberikan indikasi hubungan
kausalitas seperti apa jika memang itu terjadi dalam variabel-variabel yang diteliti,
misalnya model recursive, dimana X mempengaruhi Y atau non-recursive, misalnya X
mempengaruhi Y dan Y mempengaruhi X.
Dengan untuk mengidentifikasi hubungan kausalitas tidak dapat begitu saja dilihat
dengan kaca mata korelasi tetapi sebaiknya menggunakan model-model yang lebih tepat,
misalnya regresi, analisis jalur atau structural equation model.
4
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
2.1.3 Asumsi Korelasi
Asumsi dasar korelasi diantaranya seperti tertera di bawah ini:
1. Kedua variabel bersifat independen satu dengan lainnya
Independen artinya tidak memiliki korelasi. Salah satuusaha untuk mencapai sifat
independen ini adalah dengan melakukan pengacakan terhadap observasi. Jadi,
pengamatan yang satu denagn yang lainnya tidak saling mempengaruhi. Memeriksa
kebebasan antar pengamatan ini dapat dilakukan dengan uji independensi, jadi
masing-masing variabel berdiri sendiri dan tidak tergantung satu dengan lainnya.
Tidak ada istilah variabel bebas dan variabel tergantung.
2. Data untuk kedua variabel berdistribusi normal.
Data yang mempunyai distribusi normal artinya data yang distribusinya simetris
sempurna. Jika digunakan bahasa umum disebut berbentuk kurva bel. Menurut
Johnston (2004) ciri-ciri data yang mempunyai distribusi normal ialah sebagai
berikut:
a. Kurva frekuensi normal menunjukkan frekuensi tertinggi berada di tengah-
tengah, yaitu berada pada rata-rata (mean) nilai distribusi dengan kurva sejajar
dan tepat sama pada bagian sisi kiri dan kanannya. Kesimpulannya, nilai yang
paling sering muncul dalam distribusi normal ialah rata-rata (average), dengan
setengahnya berada dibawah rata-rata dan setengahnya yang lain berada di atas
rata-rata.
b. Kurva normal, sering juga disebut sebagai kurva bel, berbentuk simetris
sempurna.
c. Karena dua bagian sisi dari tengah-tengah benar-benar simetris, maka frekuensi
nilai-nilai diatas rata-rata (mean) akan benar-benar cocok dengan frekuensi nilai-
nilai di bawah rata-rata.
d. Frekuensi total semua nilai dalam populasi akan berada dalam area dibawah
kurva. Perlu diketahui bahwa area total dibawah kurva mewakili kemungkinan
munculnya karakteristik tersebut.
e. Kurva normal dapat mempunyai bentuk yang berbeda-beda. Yang menentukan
bentuk-bentuk tersebut adalah nilai rata-rata dan simpangan baku (standard
deviation) populasi.
2.1.4 Macam-macam Korelasi
Korelasi dibagi menjadi dua jenis, yaitu :
1. Korelasi Sederhana
Korelasi sederhana adalah korelasi yang digunakan untuk mengetahui keeratan
hubungan antara dua variabel dan untuk mengetahui arah hubungan yang terjadi.
5
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Koefisien korelasi sederhana menunjukkan seberapa besar hubungan yang terjadi
antara dua variabel.
Jenis-jenis korelasi sederhana terdiri dari 3 jenis, yaitu :
a. Korelasi Pearson
Korelasi ini digunakan jika sampel datanya lebih dari 30 data (sampel besar),
jenis datanya adalah interval dan rasio, dan data berdistribusi normal yang
disimbolkan dengan “r” (Hasan, 2002:234).
Koefisien korelasi Pearson dapat ditentukan dengan dua metode, yaitu :
b. Korelasi Rank Spearman
Korelasi Rank Spearman digunakan jika sampel datanya kurang dari 30 data
(sampel kecil), jenis datanya adalah ordinal, dan data tidak berdistribusi normal.
Koefisien korelasi Rank Spearman dinotasikan rs. Dalam aplikasinya, setiap data
xi dan yi ditetapkan peringkat relatifnya terhadap data x dan y lainnya dari data
terkecil sampai terbesar. Peringkat terkecil diberi nilai 1 dan jika terdapat data
yang sama maka masing-masing nilai diberi peringkat rata-rata dari posisi yang
seharusnya. Korelasi Rank Spearman dapat dihitung dengan rumus:
r s=1−6∑ d1
2
n(n2−1) (2-1)
Sumber : Iqbal Hasan, 2003
dimana :
rs = Korelasi Rank Spearman
n = Banyaknya pasangan rank
d = Selisih dalang ranking
c. Korelasi Rank Kendall
Koefisien korelasi rank Kendall merupakan pengembangan dari koefisien
korelasi rank Spearman. Disimbolkan dengan “ ” (baca Tau). Koefisen korelasiτ
inid igunakann padsa pasangan variable pasangan atau data X dan Y dalam hal
ketidaksesuaian rank, yaitu untuk mengukur ketidakteraturan. Koefisien
korelasi rank Kendall dirumuskan dengan ;
τ= S
( 12 )N (N−1)
= C−D
( 12 )N (N−1)
(2-2)
Sumber : Iqbal Hasan, 2003
dimana :
S = Statistik untuk jumlah konkordansi dan diskordansi
6
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
C = I- konkordansi
D = I- diskordansi
1- = Banyaknya pasangan
N = Jumlah pasangan X dan Y
2. Korelasi Parsial
Korelasi parsial adalah korelasi yang digunakan untuk mengetahui hubungan antara
dua variabel di mana variabel lainnya dianggap berpengaruh dikendalikan atau
dibuat tetap (sebagai variabel kontrol).
2.1.5 Koefisien Korelasi2.1.5.1 Pengertian Koefisien Korelasi
Ukuran yang digunakan untuk mengukur derajat hubungan (korelasi) linear disebut
koefisien korelasi (correlation coefficient) yang dinyatakan dengan notasi ”r” yang sering
dikenal dengan nama koefisien korelasi Pearson atau Product Moment Coefficient of
Correlation.
2.1.5.2 Jenis-jenis Koefisien Korelsi
Berikut ini adalah macam-macam dari korelasi korelasi, adalah :
1. Koefisien korelasi pearson
Digunakan untuk mengukur keeratan hubungan antara dua variabel yang datanya
berbentuk data interval atau rasio. Disimbolkan denagn r dan dirumuskan :
r=n∑ XY−∑ X ∑Y
√¿¿¿ (2-3)
Sumber : Iqbal Hasan, 2008
Nilai dari koefisien korelasi (r) terletak antar -1 dan +1 (-1 ≤ r ≤ +1).
a. Jika r = +1, terjadi korelasi positif sempurna antara variabel X dan Y
b. Jika r = -1, terjadi korelasi negatif sempurna antara variabel X dan Y
c. Jika r = 0 , tidak terjadi korelasi antara variabel X dan Y
d. Jika 0 < r < +1, terjadi korelasi positif antara variabel X dan Y
e. Jika -1 < r < 0 , terjadi korelasi negatif antara variabel X dan Y
2. Koefisien korelasi Spearman
Koefisien korelasi ini digunakan untuk mengukur keeratan hubungan antara dua
variabel yang datanya berbentuk data ordinal (data bertingkat). Disimbolkan dengan
r s dan dirumuskan :
r s=1−6∑
d
2
n3−n (2-4)
Sumber : Iqbal Hasan, 2008
Keterangan :
7
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
d = Selisih ranking X dan Y
n = Banyaknya pasangan data
3. Koefisien korelasi Kontingensi
Koefisien korelasi ini digunakan untuk mengukur keeratan hubungan antara dua
variabel yang datanya berbentuk data nominal (data kualitatif). Disimbolkan denagn
C dan dirumuskan :
C =√ x2
x2+n
(2-5)
Sumber : Iqbal Hasan, 2008
Keteranagn :
x2 = Kai Kuadrat
n = Jumlah semua frekuensi
4. Koefisien korelasi Penentu dan Determinasi
Apabila koefisien korelasi dikuadratkan, akan menjadi koefisien penentu (KP) atau
koefisien determinasi, Yang artinya penyebab perubahan pada variabel Y yang datang
dari variabel X, sebesar kuadrat koefisien korelasinya. Koefisien penentu ini
menjelaskan besarnya pengaruh nilai suatu variabel (variabel X) terhadap naik/
turunnya (variasi) nilai variabel lainnya (variabel Y). Dirumuskan :
KP = R = (KK¿2 x 100 % (2-6)
Sumber : Iqbal Hasan, 2008
Keterangan :
KK = Koefisien korelasi
Nilai koefisien penentu ini terletak antara 0 dan +1 (0 ≤ KP ≤ +1 ). Jika koefisien
korelasinya adalah koefisien korelasi pearson (r), maka koefisien penentunya adalah :
KP = R = r2 x 100 % (2-7)
Sumber : Iqbal Hasan, 2008
Dalam bentuk rumus , Koefisien Penentu (KP) dituliskan :
KP = (n ) (∑ XY )−(∑ X )(∑ Y )¿¿
(2-8)
Sumber : Iqbal Hasan, 2008
2.1.5.3 Interpretasi Koefisien Korelasi
8
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Ada tiga penafsiran hasil analisis korelasi, meliputi: pertama, melihat kekuatan
hubungan dua variabel; kedua, melihat signifikansi hubungan; dan ketiga, melihat arah
hubungan.
Untuk melakukan interpretasi kekuatan hubungan antara dua variabel dilakukan
dengan melihat angka koefesien korelasi hasil perhitungan dengan menggunakan kriteria
sbb:
1. Jika angka koefesien korelasi menunjukkan 0, maka kedua variabel tidak mempunyai
hubungan
2. Jika angka koefesien korelasi mendekati 1, maka kedua variabel mempunyai
hubungan semakin kuat
3. Jika angka koefesien korelasi mendekati 0, maka kedua variabel mempunyai
hubungan semakin lemah
4. Jika angka koefesien korelasi sama dengan 1, maka kedua variabel mempunyai
hubungan linier sempurna positif.
5. Jika angka koefesien korelasi sama dengan -1, maka kedua variabel mempunyai
hubungan linier sempurna negatif.
Interpretasi berikutnya melihat signifikansi hubungan dua variabel dengan
didasarkan pada angka signifikansi yang dihasilkan dari. Interpretasi ini akan
membuktikan apakah hubungan kedua variabel tersebut signifikan atau tidak. Berikut
adalah kriteria kekuatan hubungan korelasi berdasarkan koefisisen korelasi, yaitu :
Tabel 2.1 Koefisien Korelasi
Koefisien Korelasi Hubungan korelasi
0 Tidak ada korelasi antara dua variabel
0 < r ≤ 0.25 Korelasi sanagat lemah
0.25 < r ≤ 0.5 Korelasi cukup
0.5 < r ≤ 0.75 Korelasi Kuat
0.75 < r < 1 Korelasi sanagt kuat
1 Korelasi SempurnaSumber : www.ilmustatistik.com
Interpretasi ketiga melihat arah korelasi. Dalam korelasi ada dua arah korelasi, yaitu
searah dan tidak searah. Pada SPSS hal ini ditandai dengan pesan two tailed. Arah korelasi
dilihat dari angka koefesien korelasi. Jika koefesien korelasi positif, maka hubungan kedua
variabel searah. Searah artinya jika variabel X nilainya tinggi, maka variabel Y juga tinggi.
Jika koefesien korelasi negatif, maka hubungan kedua variabel tidak searah. Tidak searah
artinya jika variabel X nilainya tinggi, maka variabel Y akan rendah. Arah hubungan antara
dua variabel (Idirection of correlation) dapat dibedakan menjadi :
9
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
1. Direct Correlation (positive correlation)
Korelasi sama dengan +1, artinya kedua variabel mempunyai hubungan linier
sempurna (membentuk garis lurus) positif. Korelasi sempurna seperti ini mempunyai
makna jika nilai X naik, maka Y juga naik seperti pada gambar berikut :
Gambar 2.1 Direct CorrelationSumber : www.ilmustatistik.com
2. Inverse Correlation (Negative correlation)
Korelasi sama dengan -1, artinya kedua variabel mempunyai hubungan linier
sempurna (membentuk garis lurus) negatif. Korelasi sempurna seperti ini mempunyai
makna jika nilai X naik, maka Y turun (dan sebaliknya) seperti pada gambar berikut :
Gambar 2.2 Inverse CorrelationSumber : www.ilmustatistik.com
3. Korelasi Nihil (Tidak berkorelasi)
Korelasi sama denagn 0 mempunyai arti tidak ada hubungan antara kedua variabel.
Gambarnya sebagai berikut :
Gambar 2.3 Korelasi NihilSumber : www.ilmustatistik.com
2.2 Regresi2.2.1 Pengertian Regresi
Analisis regresi merupakan suatu alat ukur yang juga digunakan untuk mengetahuai
ada atau tidak adanya hubungan antarvariabel yang berarti ramalan atau taksiran. Namun,
analisa regresi lebih akurat dalam melakukan analisa korelasinya, karena pada analisis ini
kesulitan dalam menunjukkan slop (tingkat perubahan suatu variable terhadap variable
lainnya dapat ditentukan), jadi dengan analisis regresi peramalan atau perkiraan nilai
variable terikat pada niali variable bebas lebih akurat pula.
10
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Analisis regresi berguna untuk mengetahui pengaruh antara variable bebas (yang
juga dikenal dengan prediktor) yang disimbolkan dengan X dan variable terikat (yang juga
dikenal dengan kriterium) yang disimbolkan dengan Y.
2.2.2 Asumsi Klasik Regresi
Formula atau rumus regresi diturunkan dari suatu asumsi data tertentu. Dengan
demikian tidak semua data dapat diterapkan regresi. Jika data tidak memenuhi asumsi
regresi, maka penerapan regesi akan menghasilkan estimasi yang bias. Jika data
memenuhi asumsi regresi maka estimasi (β ) diperoleh akan bersifat BLUE yang
merupakn singkatan dari: Best, Linear, Unbiased, Estimator.
1. Best
Artinya yang terbaik, dalam arti garis regresi merupakan estimasi atau ramalan yang
baik dari suatu sebaran data. Garis regresi merupakan cara memahami pola
hubungan antara dua seri data atau lebih. Garis regresi adalah best jika garis itu
menghasilkan error yang terkecil. Error itu sendiri adalah perbedaan antara nilai
observasi dan nilai yang diramalkan oleh garis regresi. Jika best disertai sifat unbiased
maka estimator regresi disebut efisien.
2. Linear
Estimator β disebut linear jika estimator itu merupakan fungsi linear dari sampel.
Lihat rumus rata-rata dibawah ini:
X̄=1n∑ X=1
n (x1+x2+ .. .. . .. .. .. . .+ xn) (2-9)
Sumber : www.ineddeni.wordpress.com Rata0rata di atas merupakan estimator yang linear, karena merupakan fungsi linear
dari nilai-nilai X. Nilai2 OLS juga merupakan klas estimator yang linear.
3. Unbiased
Suatu estimator dikatakan unbiased jika nilai harapan dari estimator β sama dengan
nilai yang benar dari β. Rata-rata β = . β Bias = Rata-rata β – β
4. Estimated
Estimator adalah suatu nilai taksiran yang terdapat pada persamaan regresi linear.
Estimasi dari model regresi sederhana bertujuan untuk mendapatkan nilai intersep
dan slope dari garis regresi linear.
2.2.3 Asumsi Regresi
Dalam penggunaan regresi, terdapat beberapa asumsi dasar yang dapat menghasilkan
estimator linier tidak bias yang terbaik dari model regresi yang diperoleh dari metode
11
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
kuadrat terkecil biasa. Dengan terpenuhinya asumsi tersebut, maka hasil yang diperoleh
leih akurat dan mendekati atau sama denagn kenyataan.
Asumsi-asumsi dasar itu adalah sebagai berikut :
1. Linier
Nilai harapan pengamatan-pengamatan variabel dependen dari suatu variabel
independen tertentu denagn variabel independen yang lainnya dan membentuk suatu
garis lurus. Dalam hal ini fungsi linearnya berada dalam parameter variabel
independen. Apabila sifat linier tidak dipenuhi maka model tersebut sebenarnya salah
jumlah.
2. Homogenitas dalam variansi
Tingkat variansi atau keseragaman nilai variabel dependen denag variabel
independen yang lainnya cenderung sama. Uji homogenitas variansi biasanya
dilakukan denagn uji lavene. Apabila tingkat keseragaman tidak homogeny, maka
penduga model yidak stabil dan variansi penduganya akan mempunyai nilai yang
benar.
3. Kenormalan
Sebaran variabel respon untuk variabel penjelas tertentu mengikuti distribusi
normal. Sifat kenormalan ini dapat diuji denagn uji kebaikan suai.
4. Independen/ Kebebasan antar pengamatan
Pengamatan yang satu dengan yang lainnya tidak saling mempengaruhi. Memeriksa
kebebasan antar pengamatan ini dapat dilakukan denagn uji independensi.
2.2.4 Metode Model Regresi
Ada 5 pilihan yang digunakan pada menu method untuk menentukan model yang
akan digunakan:
1. Enter
Metode analisis regresi untuk menganalisa secara biasa, yaitu semua variabel
independent dianalisa baik prediktor yang berpengaruh ataupun tidak berpengaruh
terhadap kriterium, jadi cukup memasukkan kriterium atau memilih semua variabel
independen dalam persamaan regresi.
2. Remove
untuk mencari prediktor yang dominan dan bila yang tidak berpengaruh dihapus.
3. Backward
menganalisa semua prediktor kemudian dilanjutkan dengan menganalisa prediktor
yang berpengaruh.
12
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
4. Forward
Untuk memasukkan satu persatu variabel independen dalam persamaan regresi.
5. Stepwise
Metode ini memilih dan mengeluarkan variabel inependen dalam persamaan
berdasarkan nilai signifikansi yang ada pada options.
2.2.5 Macam-macam Regresi Linier
Macam-macam regres linier antara lain adalah :
2.2.5.1 Regresi Linier
1. Regresi Linear Sederhana
Regresi linear sederhana adalah regresi yang hanya terdiri dari satu variabel
dependen dan satu variabel independen. Regresi linear sederhana digunakan untuk
mengetahui hubungan nilai satu variabel bebas dan satu variabel terikat melalui
persamaan regresi. Bentuk dari persamaaan regresi linear sederhana adalah
(Murwani, 2007 : 12-14).
Y = a+ bX (2-10)
Sumber : Iqbal Hasan, 2003
X = a+ bY (2-11)
Sumber : Iqbal Hasan, 2003
di mana:
a = konstanta (atau intersep) populasi
b = koefisien regresi populasi
Y = variabel terikat
X = variabel bebas
2. Regresi Linier Berganda
Regresi linear berganda adalah regresi dimana variabel terikatnya (Y) dihubungkan
atau dijelaskan lebih dari satu variabel bebas (X1, X2,...., Xn) namun masih
menunjukkan diagram hubungan yang linear. Regresi linear berganda digunakan
untuk mengetahui hubungan nilai beberapa variabel bebas dan satu variabel terikat
melalui persamaan regresi.
Bentuk dari persamaaan regresi linear berganda adalah:
a. Bentuk Stokastik
Y = a + b1X1......+ bkXk + e (2-12)
Sumber : Iqbal Hasan, 2003
di mana:
a = konstanta (atau intersep) populasi
b = koefisien regresi populasi
13
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Y = variabel terikat
X = variabel bebas
k = jumlah variabel bebas
e = Kesalahan pengganggu (disturbance term) , artinya nilai-nilai dari variabel
lain yang tidak dimasukkan dalam persamaan.
b. Bentuk NonStokastik (Deterministik)
Y = a + b1X1......+ bkXk (2-13)
Sumber : Iqbal Hasan, 2003
di mana:
a = konstanta (atau intersep) populasi
b = koefisien regresi populasi
Y = variabel terikat
X = variabel bebas
k = jumlah variabel bebas
2.2.5.2 Regrsi Non Linier
Regresi on linier adalah regresi yang vraiabel-variabelnya ada yang berpangkat.
Bentuk regresi nonlinier adalah berupa lengkungan. Bentuk-bentuk regresi nonlinier
adalah regresi kuadratis atau parabola dan regresi eksponensial
1. Kuadratis atau regresi parabola
Regresi kuadratis adalah regresi denagn variable X ada yang berpangkat dua. Bentuk
regresi kuadratis adalah
Y = a + bX + cX2 (2-14)
Sumber : Iqbal Hasan, 2003
Keteranagn :
Y = Variabel terikat
X = Variabel Bebas
a ,b,c = Konstanta
Nilai a,b,c dapat dicari denagn menggunakan rumus normal (persamaan tiga
variabel), sebagai berikut.
∑Y =n .a+b .∑ X+c ∑ X2
∑ XY =a .∑ X+b .∑ X2+c∑ X3
∑ X 2Y=a .∑ X2+b .∑ X3+c ∑ X4 (2-15)
Sumber : Iqbal Hasan, 2003
Dalam diagram pancar digambarkan :
14
Y
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Gambar 2.4 Diagram Pancar Regresi KuadratisSumber : Iqbal Hasan, 2003
2. Eksponensial atau Logaritma
Regresi Eksponensial adalah regresi dengan variable X berpangkat konstanta b atau
konstanta b berpangkat X . Bentuk umum regresi eksponensial adalah :
Y = abx (2-16)
Sumber : Iqbal Hasan, 2003
Keterangan :
Y = Variabel terikat
X = Variabel Bebas
a, b = Konstanta atau penduga
Untuk menentukan nilai a dan b, bentuk persamaan di atas harus di transformasikan
menjadi bentuk persamaan linier denagn menggunakan logaritma , menjadi :
Log Y = log a + b log X (2-17)
Sumber : Iqbal Hasan, 2003
Misalkan : log Y = Y 1
: log a = a1
: log X = X1
Didapatkan :
b ¿n .∑ X1Y1−¿∑ X 1.∑Y 1
n. X12−¿¿
¿
a = Y 1 – b . X1 (2-18)
Sumber : Iqbal Hasan, 2003
Dalam diagram pancar digambarkan :
Gambar 3.5 Diagram Pancar Regresi EksponensialSumber : Iqbal Hasan, 2003
15
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
2.3 Analisis Regresi Linear Sederhana 2.3.1 Persamaan Garis Regresi Linier Sederhana
Analisa regresi juga digunakan untuk menentukan bentuk (dari) hubunagn
antarvariabel. Tujuan utamanya adalah untuk meramalkan atau memperkirakan nilai dari
suatu variable dalam hubungannya dengan varibael yang lain yang diketahui dari
persamaan garis regresinya. Persamaan garis regresi linier sederhana sampel sebagai
penduga persamaan garis regresi linier sederhana populasi dapat dinyatakan dalam
bentuk :
Ŷ = a + bX. (2-19)
Sumber : Iqbal Hasan, 2003
di mana:
Ŷ = Variabel Teriakt
X = variabel bebas
a = konstanta (atau intersep) sampel
b = koefisien regresi sampel
Untuk mencari a dan b dapat menggunakan rumus :
b=¿¿ (2-20)
Sumber : Iqbal Hasan, 2003
a = – b . Ẋ Ẋ (2-21)
Sumber : Iqbal Hasan, 2003
2.3.2 Kesalahan Baku Regresi dan Koefisisen Regresi Sederhana
Kesalahan baku atau selisish taksir standart merupakan indeks yang digunakan
untuk mengukur tingkat ketepatan regresi (pendugaan) dan koefisien regresi atau
mengukur variasi titik-titik observasi disekitas garis regresi. Denagan kesalahan baku,
batasan seberapa jauih melesetnya perkiraan kita dalam meramal data dapat diketahui.
Apabila semau titik observasi berada tepat pada garis regresi maka kesalahan baku akan
bernilai nol. Hal ini berarti perkiraan yang kita lakukan terhadap data sesuai dengan data
yang sebenarnay.
Berikut ini rumus-rumus yang secara langsung digunakan untuk menghitung
kesalahan baku regrsi dan koefisien regresi.
1. Untuk Regresi, Kesalahan bakunya :
Se=√∑ Y 2−a .∑Y−b .∑ XYn−2
(2-22)
Sumber : Iqbal Hasan, 2003
16
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Untuk koefisien regresi a, Kesalahan bakunya :
Sa=√ ∑ X2−Se
n .∑ X2−¿¿¿¿ (2-23)
Sumber : Iqbal Hasan, 2003
Untuk koefisien regresi b, Kesalahan bakunya :
Sb=√ Se
∑ X 2−(∑ X )
2
n
(2-24)
Sumber : Iqbal Hasan, 2003
Keterangan :
Se = kesalahan baku regresi
Sa = koefisien regresi a (penduga a)
Sb = koefisien regresi b (penduga b)
X, Y = variabel
a,b = konstanta
n = jumlah sampel
2.3.2 Pengujian Statistik Koefisien Regresi
Pengujian Statistik koefisien regresi dapat dilakukan denagn uji t, dengan langkah-
langkah pengujian sebagai berikut :
1. Menentukan formulasi hipotesis
2. Menentukan taraf nyata ( ) dan nilai t tableα
3. Menentukan criteria pengujian
4. Menentukan nilai uji statistic
Rumus Uji Statistik
t 0=r √n−2
√1−r 2 (2-25)
Sumber : Iqbal Hasan, 2003
Keterangan:
t0 = nilai t hitung
r = koefisien korelasi
r2 = koefisien determinasi
Rumus uji statistik untuk tiap parameter, misalnya parameter A dan B adalah sebagai
berikut:
17
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
t a=a−A0
Sa
(2-26)
Sumber : Iqbal Hasan, 2003
t b=b−B0
Sb
(2-27)
Sumber : Iqbal Hasan, 2003
Keterangan:
ta ; tb = nilai t hitung
a ; b = konstanta regresi
Sa ; Sb = kesalahan baku penduga a dan b
Z0=Z r−μ Z r
σ Zr
(2-28)
Sumber : Iqbal Hasan, 2003
Keterangan:
Z0 = nilai Z hitung
5. Membuat kesimpulan
2.4 Analisa Regresi Linier Berganda2.4.1 Persamaan Garis Regresi Linier Berganda
Jika sebuah variable terikat dihubungkan dengan 3 varibael bebas maka persamaan
regresi linier bergandanya dituliskan dengan :
Y = a + b1 X1 + b2 X2 + b3 X3 (2-29)
Sumber : Iqbal Hasan, 2003
Keterangan :
Y = Variabel Terikat (nilai duga Y)
X1 , X2 , X3 = Variabel Bebas
a , b1, b2, b3 = koefisien regresi Linier berganda
a = Nilai Y, apabila X1=X2=¿ X3=0
b1 = Besarnya kenaikan / penurunan Y dalam satuan , jika X1 naik / turun satu satuan
dan X2 dan X3 konstan
b2 = Besarnya kenaikan / penurunan Y dalam satuan , jika X2 naik / turun satu satuan
dan X1 dan X3 konstan
18
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
b3 = Besarnya kenaikan / penurunan Y dalam satuan , jika X3 naik / turun satu satuan
dan X1 dan X2 konstan
+ / - = Tanda yang menunjukkan arah hubungan antara Y dan X1 atau X2 Nilai – niali a
, b1, b2, b3 dapat ditentuakn denagn menggunakan persamaaan normal berikut :
∑Y =n .a+b1 .∑ X1+b2 .∑ X2+b3 .∑ X3
∑ X 1Y=a .∑ X1+b1 .∑ X12+b2.∑ X 1 X2+b3 .∑ X 1 X3
∑ X 2Y=a .∑ X2+b1 .∑ X1 X2+b2 .∑ X22++b3 .∑ X2 X 3
∑ X 3Y=a .∑ X3++b1 .∑ X1 X3+b2 .∑ X2 X3+b3 .∑ X32 (2-30)
Sumber : Iqbal Hasan, 2003
2.4.2 Kesalahan baku Regresi dan Koefisien Regresi Berganda
Kesalahn baku atau selisih taksir standar regresi adalah nilai yang menyatakan
seberapa jauh menyimpangnya nilai regresi tersebut terhadap nilai sebenarnya (nilai
observasi). Nilai ini digunakan untuk mengukur tingkat ketepatan suatu penduga dalam
menduga suatu nilai . jika nilai ini sama dengan 0 (nol) maka, maka penduga tersebut
memiliki tingkat ketepatan 100% .Kesalahan baku atu selisih taksir standar regresi
berganda ,dirumuskan:
Se=√∑ y2−b1∑ x1 y+b2∑ x2 y
n−m (2-31)
Sumber : Iqbal Hasan, 2003
Keterangan :
Se= kesalahan baku regresi berganda
n= jumlah pasangan observasi
m= jumlah konstanta dalam persamaan regresi berganda
Untuk koefisien reresi berganda b1 dan b2, kesalahan bakunya dirumuskan:
Sb1=
Se
√ (∑ X12−n X1
2 )(1−r y 12)
(2-32)
Sumber : Iqbal Hasan, 2003
Sb2=
Se
√ (∑ X22−n X2
2 )(1−r y 12)
(2-33)
Sumber : Iqbal Hasan, 2003
Keterangan:
Se = kesalahan baku regresi
Sb1 = koefisien regresi b1 (penduga b1)
Sb2 = koefisien regresi b2 (penduga b2)
19
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
X, Y = variabel
a, b = konstanta
n = jumlah pasangan observasi
m = jumlah konstanta dalam persamaan regresi berganda
Ry1 = koefisien korelasi antara X1 dan X2
2.4.3 Pengujian Statistik Koefisien Regresi Berganda
Pengujian Statistik koefisien regresi berganda dengan hanya satu parameter,
misalnya B (B1 dan B2 ) yang mempengaruhi Y. Langkah-langkah pengujian sebagai
berikut :
1. Menentukan formulasi hipotesis
2. Menentukan taraf nyata ( ) dan nilai t tableα
3. Menentukan criteria pengujian
4. Menentukan nilai uji statistic
Rumus Uji Statistik
Nilai f :
F=
r2
21−r2
n−3
(2-34)
Sumber : Iqbal Hasan, 2003
Keterangan:
F = nilai F hitung
r2 = koefisien determinasi
Nilai t:
t b1=b1
Sb1
(2-35)
Sumber : Iqbal Hasan, 2003
t b2=b2
Sb2
(2-36)
Sumber : Iqbal Hasan, 2003
Keterangan:
tb1 ; tb2 = nilai t hitung untuk parameter b1 dan b2
Sb1 ; Sb2 = koefisien regresi b1 dan b2
5. Membuat kesimpulan
2.5 Uji model regresi
Pemeriksaan asumsi residual erat kaitannya dengan kelayakan model regresi.Suatu
model regresi dengan parameter signifikan dan memenuhi kriteria terbaik tetapi
20
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
melanggar asumsi residual tidak disarankan untuk dipakai untuk menggambarkan pola
hubungan antara variabel prediktor dan variabel respon. Asumsi residual dalam analisis
regresi meliputi residual identik, independen dan distribusi Normal (µ,σ2).
Uji model regresi sebaiknya dilakukan dengan dua macam, yaitu :
1. Uji Serentak
Uji serentak merupakan uji terhadap nilai-nilai koefisien regresi (b) secara bersama-
sama dengan hipotesa
H0 : β1 = β2 = ... = βp = 0
H1 : Minimal ada 1 yang tidak sama dengan nol.β
Statistik uji yang dipakai untuk melakukan uji serentak ini adalah statistik uji F.
2. Uji Individu
Jika hasil pada uji serentak menunjukkan bahwa H0 ditolak, maka perlu dilakukan uji
individu dengan hipotesa :
H0 : βi = 0
H1 : βi ≠ 0
Untuk pengujian ini digunakan statistik uji t.
2.6 Kriteria Statistik regresi
1. Uji t
Uji t pada dasarnya menunjukkan seberapa jauh pengaruh satu variabel bebas secara
individual dalam menerangkan variasi variabel terikat. Tujuan dari uji t adalah untuk
menguji koefisien regresi secara individual.
a. Hipotesa Nol = H0
H0 adalah satu pernyataan mengenai nilai parameter populasi. H0 merupakan
hipotesis statistik yang akan diuji hipotesis nihil.
b. Hipotesa alternatif = H1
H1 adalah satu pernyataan yang diterima jika data sampel memberikan cukup
bukti bahwa hipotesa nol adalah salah.
Langkah-langkah/ urutan menguji hipotesa dengan distribusi t
1) Merumuskan hipotesa
H0 : βi = 0, artinya variabel bebas bukan merupakan penjelas yang signifikan
terhadap variabel terikat
H1 : βi ≠ 0, artinya variabel bebas merupakan penjelas yang signifikan
terhadap variabel terikat.
2) Menentukan taraf nyata/ level of significance = α
21
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Taraf nyata / derajat keyakinan yang digunakan sebesar = 1%, 5%, 10%,α
dengan:
df = n – k (2-37)
Sumber : Yusuf, 2002
dimana:
df = degree of freedom/ derajat kebebasan
n = Jumlah sampel
k = banyaknya koefisien regresi + konstanta
3) Menentukan daerah keputusan, yaitu daerah dimana hipotesa nol diterima
atau tidak.
Untuk mengetahui kebenaran hipotesis digunakan kriteria sebagai berikut.
H0 diterima apabila –t( / 2; n – k) α ≤ thitung ≤ t( / 2; n – k)α , artinya tidak ada pengaruh
antara variabel bebas terhadap variabel terikat.
H0 ditolak apabila thitung > t( / 2; n– k)α atau –thitung < -t( / 2; n – k)α , artinya ada
pengaruh antara variabel bebas terhadap variabel terikat.
Gambar 2.4 Kurva daerah keputusan distribusi t
Sumber: Yusuf, 2002
4) Menentukan uji statistik (Rule of the test)
5) Mengambil keputusan
Keputusan bisa menolak H0 atau menolak H0 menerima H1. Nilai ttabel yang
diperoleh dibandingkan nilai thitung, bila thitung lebih besar dari ttabel, maka H0
ditolak, sehingga dapat disimpulkan bahwa variabel independen
berpengaruh pada variabel dependen.
Apabila thitung lebih kecil dari ttabel, maka H0 diterima sehingga dapat
disimpulkan bahwa variabel independen tidak berpengaruh terhadap
variabel dependen.
2. Uji F
Tabel F dilakukan untuk mengetahui pengaruh variabel bebas secara bersama-sama
terhadap variabel terikat. Langkah-langkah/ urutan menguji hipotesa dengan
distribusi F
a. Merumuskan hipotesa
22
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
H0 : β1 = β2 = β3 = β4 = 0, berarti secara bersama-sama tidak ada pengaruh
variabel bebas terhadap variabel terikat.
H1 : β1 ≠ β2 ≠ β3 ≠ β4 ≠ 0, berarti secara bersama-sama ada pengaruh variabel
bebas terhadap variabel terikat.
b. Menentukan taraf nyata/ level of significance = α
Taraf nyata / derajad keyakinan yang digunakan sebesar = 1%, 5%, 10%.α
Derajat bebas (df) dalam distribusi F ada dua, yaitu :
df numerator = dfn = df1 = k – 1
df denumerator = dfd = df2 = n – k
Dimana:
df = degree of freedom/ derajat kebebasan
n = Jumlah sampel
k = banyaknya koefisien regresi
c. Menentukan daerah keputusan, yaitu daerah dimana hipotesa nol diterima atau
tidak.
H0 diterima apabila Fhitung ≤ Ftabel, artinya semua variabel bebas secara bersama-
sama bukan merupakan variabel penjelas yang signifikan terhadap variabel
terikat.
H0 ditolak apabila Fhitung > Ftabel, artinya semua variabel bebas secara bersama-
sama merupakan penjelas yang signifikan terhadap variabel terikat.
d. Menentukan uji statistik nilai F
Bentuk distribusi F selalu bernilai positif
Gambar 2.5 Kurva daerah keputusan uji F
Sumber: Yusuf, 2002
e. Mengambil keputusan
Keputusan bisa menolak H0 atau menolak H0 menerima H1.
Nilai Ftabel yang diperoleh dibanding dengan nilai Fhitung apabila Fhitung lebih besar
dari Ftabel, maka ditolak sehingga dapat disimpulkan bahwa ada pengaruh yang
signifikan antara variabel independen dengan variabel dependen.
3. R2
R Square (R2) merupakan proporsi variabilitas dalam suatu data yang dihitung
didasarkan pada model statistik. Definisi berikutnya menyebutkan bahwa r2
23
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
merupakan rasio variabilitas nilai-nilai yang dibuat model dengan variabilitas nilai
data asli. Secara umum r2 digunakan sebagai informasi mengenai kecocokan suatu
model. Dalam regresi r2 ini dijadikan sebagai pengukuran seberapa baik garis regresi
mendekati nilai data asli yang dibuat model. Nilai R2 terletak antara 0 – 1, dan
kecocokan model dikatakan lebih baik kalau R2 semakin mendekati 1. (uraian lebih
lanjut mengenai R2 lihat pembahasan di bawah). Jika r2 sama dengan 1, maka angka
tersebut menunjukkan garis regresi cocok dengan data secara sempurna. Apabila
nilai R2 dikalikan 100%, maka hal ini menunjukkan persentase keragaman
(informasi) di dalam variabel Y yang dapat diberikan oleh model regresi yang
didapatkan. Semakin besar nilai R2 semakin baik model regresi yang diperoleh.
Adjusted R Square. Suatu sifat penting R2 adalah nilainya merupakan fungsi yang
tidak pernah menurun dari banyaknya variabel bebas yang ada dalam model. Oleh
karenanya, untuk membandingkan dua R2 dari dua model, orang harus
memperhitungkan banyaknya variabel bebas yang ada dalam model. Ini dapat
dilakukan dengan menggunakan “adjusted R square”. Istilah penyesuaian berarti nilai
R2 sudah disesuaikan dengan banyaknya variabel (derajat bebas) dalam model.
Seringkali juga disarankan, jika variabel bebas lebih dari dua, sebaiknya
menggunakan adjusted R square.
2.7 Penyimpangan asumsi Regresi2.7.1 Autokorelasi
Uji Autokorelasi bertujuan menguji apakah dalam suatu model regresi linear ada
korelasi antara kesalahan pengganggu pada periode t dengan kesalahan pada periode t-1
(sebelumnya). Jika terjadi korelasi maka dinamakan ada problem autokorelasi. Model
regresi yang baik adalah regresi yang bebas dari autokorelasi Uji autokorelasi dilakukan
dengan menggunakan uji Durbin-Watson (D-W), dengan tingkat kepercayaan 5%. Apabila
D-W terletak antara -2 sampai +2 maka tidak ada autokorelasi (Santoso. 2002 : 219)
Pada dasarnya autokorelasi dapat didefinisikan sebagai korelasi di antara nilai-nilai
pengamatan yang terurut dalam waktu (time series data) atau nilai-nilai pengamatan yang
terurut dalam ruang (cross-sectional data)
Terjadinya autokorelasi diantara nilai-nilai dari variable gangguan e dapat
diakibatkan karena beberapa hal berikut, yaitu :
1. Adanya variable-variabel penjelas yang dihilangkan dari model.
2. Adanya kesalahan spesifik bentuk matematik dari model. Jika kita merumuskan atau
menetapkan bentuk matematik yang berbeda dari bentuk hubungan yang
sesungguhnya, maka niali-nilai gangguan ε akan menunjukkan autokorelasi
24
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
3. Adanya fenomena cobweb, dimana nilai variable yang sekarang bereaksi atau
ditentukan oleh variable sebelumnya.
4. Di dalam analisis regesi yang melibatkan data deret waktu, jika model regresi
mengikutsertakan tidak hanya nilai-nilai sekarang, tetapi juga nilai-nilai pada waktu
yang lalu sebagai variable penjelas, maka variable itu disebut sebagi model distribusi
“lags”.
5. Adanya manipulasi data, maksudnya “manipulasi” tidak berkaitan dengan hal-hal
negative seperti emmalsukan data, tetapi yang dimaksudkan disini adalah suatu
teknik mengubah data yang berkonotasi positif, dimana teknik mengubah data atau
memperkirakan data itu dapat dibenarkan tetapi sering menimbulkan masalah yang
berkaitan dengan gangguan.
Statistik Durban Watson digunakan untuk mendeteksi autokorelasi. Adapun beberapa
asumsi yang melandasi uji Durban Watson, antara lain adalah :
1. Uji Durban Watson diterapkan untuk model regresi yang mencakup parameter β0,
dengan kata lain dipergunakan untuk untuk model regresi yang mengandung
intersep.
2. Variabel-variabel penjelas x adalah nonstokastik, atau bersifat tetap dalam penarikan
contoh yang berulang (repeated sampling).
3. Bentuk gangguan et dibangkitkan melalui pola regresi diri order pertama dengan
mengambil bentuk : et = e eρ t-1 + μt
4. Model regresi tidak mencakup nilai-nilai lag dari variable tak bebas sebagai suatu
variable penjelas.
5. Tidak ada parameter yang hilang dalam data, denagn demikian uji Durban Watson
dapat digunakan untuk model regresi yang dibangun berdasarkan data yang lengkap,
terutama untuk data deret waktu.
Statistik dari Darbin Watson memiliki rumus sebagai berikut :
d=∑t−2
n
(e t−et−1)
∑t−1
n
❑ (2-38)
Sumber :www. repository.usu.ac.id
Dimana :
et : Residual variable t
et-1 : Residual satu variable t sebelumnya
Setelah mendapatkan nilai d dari perhitungan rumus tersebut, nilai d dibandingkan
dengan nilai-nilai kritis dari dL dan dU dari table statistic Durban Watson.
25
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Nilai kritis dari dL dan dU dapat diperoleh dari table statistic Durban Watson yang
tergantung pada banyaknya observasi n dan besarnya variable penjelasnya.
Berikut adalah mekanisme yang mendasari tes Durban Watson :
a. Jika hipotesis Ho tidak ada korelasi positif, maka :
d < dL : Ho ditolak
d < dU : Ho diterima
dL ≤ d ≤ dU : pengujian tidak meyakinkan
b. Jika hipotesis Ho tidak ada autokorelasi negative, maka :
d > 4- dL : Ho ditolak
d > 4- dU : Ho diterima
4-dU ≤ d ≤ 4- dL : pengujian tidak meyakinkan
c. Jika hipotesis Ho adalah dua ujung, yaitu tidak ada serial korelasi baik positif
maupun negatif, maka :
d < dL : Ho ditolak
d > 4- dL : Ho ditolak
dU < d < 4- d U: Ho diterima
dL ≤ d ≤ dU : pengujian tidak meyakinkan
4-dU ≤ d ≤ 4- dL : pengujian tidak meyakinkan
Tabel 2.2 klasifikasi nilai d
Nilai d Keterangan
<1,10 Ada Autokorelasi
1,10 – 1,54 Daerah keragu-raguan
1,55 – 2,46 Tidak ada Autokorelasi
2,46 – 2,90 Daerah keragu-raguan
>2,90 Ada Autokorelasi Sumber : Iqbal Hasan, 2003
2.7.2 Multikolinearitas
Uji multikolinearitas bertujuan untuk menguji apakah dalam model regresi
ditemukan adanya korelasi antar variabel bebas (independen). Dalam model regresi yang
baik seharusnya tidak terjadi korelasi di antara variabel bebas. Uji Multikolinearitas
dilakukan dengan melihat nilai tolerance dan variance inflation factor (VIF) dari hasil
analisis dengan menggunakan SPSS..
Multikolinearitas dapat terjadi karena:
1. Terdapat kecenderungan variabel ekonomi bergerak secara bersama-sama sepanjang
waktu Pertumbuhan kecenderungan factor-faktor dalam deret waktu
dapat sebagai penyebab terjadinya multikolinearitas.
2. Penggunaan Lag Sehingga terdapat model distribusi lag
26
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Misal : Ct = f (Yt , Yt-1 , …. Y1 ) Mungkin terdapat korelasi yang kuat
antara Yt dan Yt-1
a. Konsekuensi Adanya Multikolinearitas yang Tidak Sempurna
Varians Inflation Factor (VIF) mengukur dampak collinearity antara variabel
dalam model regresi. Varians Inflation Factor (VIF) adalah 1/Tolerance, selalu
lebih besar dari atau sama dengan 1.
Untuk menguji ada tidaknya multikolinearitas, kita dapat menggunakan nilai
Toleransi atau VIF (Variance Inflation Factor). VIF tidak lain adalah mengukur
keeratan hubungan antar variabel bebas, atau X.
Nilai Toleransi atau VIF (Variance Inflation Factor) dapat dihitung dengan rumus
sebagai berikut :
VIF = 1
1−r122 (2-9)
Sumber : www. resources.unpad.ac.id
Tolerance = 1
VIF=(r12
2 ) (2-10)
Sumber : www. resources.unpad.ac.id
Jika nilai Toleransi kurang dari 0,1 atau nilai VIF melebihi 10 maka hal tersebut
menunjukkan bahwa multikolinearitas adalah masalah yang pasti terjadi antar
variable bebas.
b. Penanggulangan Multikolinearitas
Dalam hal ini dapat menggunakan prosedur Principal Component Analysis
(PCA) untuk mengatasi multikolinearitas. Prosedur PCA pada dasarnya
bertujuan untuk menyederhanakan variabel yang diamati dengan cara
menyusutkan (mereduksi) dimensinya. Hal ini dilakukan dengan cara
menghilangkan korelasi diantara variabel bebas melalui transformasi variabel
bebas asal ke variabel baru yang tidak berkorelasi sama sekali.
2.7.3 Heteroskedastisitas
Uji heteroskedastisitas bertujuan untuk menguji apakah dalam model regresi terjadi
ketidaksamaan varians dan residual satu pengamatan ke pengamatan yang lain. jika
varians dari residual satu pengamatan ke pengamatan yang lain tetap, maka disebut
homoskedastisitas dan jika berbeda disebut heteroskedastisitas. Model regresi yang baik
adalah yang homoskedastisitas atau tidak terjadi heteroskedastisitas.
Heteroskedastisitas terjadi apabila varians dari setiap kesalahan pengganggu tidak
bersifat konstan. Dampak yang akan ditimbulkan adalah asumsi yang terjadi masih tetap
tidak berbias, tetapi tidak lagi efisien.
27
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Menurut Manurung (2005) menjelaskan bahwa ada dua cara untuk mendeteksi
keberadaan heteroskedastisitas, yaitu metode informal dan metode formal. Metode
informal biasanyadilakukan dengan melihat grafik plot dari nilai prediksi variabel
independen (ZPRED) dengan residualnya (SRESID). Variabel dinyatakan tidak terjadi
heteroskedastisitas jika tidak terdapat pola yang jelas dan titik-titik menyebar di atas dan
di bawah angka nol pada sumbu Y. Metode formal untuk mendeksi keberadaan
heteroskedastisitas antara lain dengan Park Test, Glejser Test, Spearman’s Rank
Correlation Test, Golfeld-Quandt Test, Breusch-Pagan-Godfrey Test, White’s General
Heteroscedasticity Test, dan Koenker-Basset Test.
Uji Heteroskedastisitas dengan metode di bawah ini:
1. Uji Park
Dilakukan dengan membuat model regresi yang melibatkan nilai logaritma residu
kuadrat (log e2) sebagai variable terikat terhadap semua variable bebas. Jika semua
variable bebas nyata (signifikan) secara statistic maka dalam regresi terdapat
heteroskedastisitas.
a. Regresikan nilai absolut residual (ei) pada x ln(ei^2) = b0 + b1.ln(Xi) + Vi
b. Bila b1 signifikan beda dengan 0 (uji t) maka persamaan memiliki masalah
hetrosekdastistas
c. Pada multivariate, cobakan tiap tiap variabel independen (Xi) atau variabel
dependen (Yi)
2. Uji Glejser:
Dilakukan dengan membuat model regresi yang melibatkan nilai mutlak residu (
¿ log e2∨¿) sebagai variable terikat terhadap semua variable bebas. Jika semua
variable bebas nyata (signifikan) secara statistic maka dalam regresi terdapat
heteroskedastisitas.
a. Regresikan nilai absolut ei pada x
|ei| = b0 + b1.Xi + Vi atau
|ei| = b0 + b1.sq(Xi^2) + Vi atau
|ei| = b0 + b1.(1/Xi) + Vi atau
Dll
b. Apabila t pada b1 signifikan artinya ada heteroskedastistas
c. Pada multivariate, cobakan tiap tiap variabel independen (Xi) atau variabel
dependen (Yi)
3. Uji Goldfeld-Quandt
a. Urutkan data X berdasarkan nilainya
28
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
b. Bagi data menjadi 2, satu bagian memiliki nilai yang tinggi, bagian lainnya
memiiki nilai yang rendah, sisihkan data pada nilai tengah
c. Jalankan regresi untuk masing-masing data
d. Hitung F test, F=[ESSlarge X/df]/[ESSsmall X/df]
e. Apabila nilai F unite, maka homoskedastistas.
BAB IIIMETODOLOGI PRAKTIKUM
3.1 Diagram Alir Praktikum
29
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
3.2 Prosedur Praktikum
Prosedur praktikum yang harus dilakukan, yaitu:
1. mengidentifikasi masalah dari suatu objek penelitian yang telah dilakukan;
2. melakukan studi kepustakaan;
3. menentukan variabel dependen dan variabel independen;
30
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
4. melakukan pengambilan data sebanyak 25 data;
5. melakukan pengolahan data;
6. melakukan analisa regresi dan korelasi.
BAB IVHASIL DAN PEMBAHASAN
4.1 Pengumpulan Data
31
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Dalam modul 3 ini, dilakukan pembahasan mengenai analisis korelasi dan regresi.
Ada dua jenis regresi yang dibahas dalam modul ini, yaitu regresi linear sederhana dan
regresi linear berganda.
4.1.1 Data Regresi Linear Sederhana
Untuk lebih memahami aplikasi dari regresi linear sederhana, dilakukan pengambilan
sampel sebanyak 25 data regresi linear sederhana, yaitu data mengenai pengaruh antara
kebutuhan pulsa dengan umur. Data yang diambil merupakan data primer, yaitu data yang
diambil langsung oleh peneliti. Data-data tersebut disajikan dalam bentuk tabel seperti
yang tertera di bawah ini:
Tabel 4.1 Data regresi linear sederhanaNo Umur(x) Kebutuhan Pulsa (y)
1 18 202 18 203 19 354 19 355 20 356 18 207 18 258 20 359 19 35
10 20 3511 21 4012 20 3013 20 3014 21 3015 21 3516 23 5017 23 5018 24 5019 23 5020 23 7021 25 5022 27 5023 20 3524 21 3025 20 35
Sumber: Microsoft Excel 2007
4.1.2 Data Regresi Linear Berganda
Untuk lebih memahami aplikasi dari regresi linear berganda, dilakukan pengambilan
sampel sebanyak 25 data regresi linear berganda, yaitu data mengenai pengaruh antara
lama mempunyai SKS dan jumlah organisasi dengan IPK. Data yang diambil merupakan
32
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
data primer, yaitu data yang diambil langsung oleh peneliti. Data-data tersebut disajikan
dalam bentuk tabel seperti yang tertera di bawah ini:
Tabel 4.2 Data regresi linear bergandaNo sks(X₁) Jmlh org(X₂) IPK(Y)
1 22 1 3,152 24 2 3,303 24 2 3,304 24 2 3,335 24 1 3,406 24 1 3,407 24 1 3,458 24 1 3,459 18 2 2,50
10 24 2 3,3511 21 0 3,1012 21 0 3,2013 21 1 3,1014 22 0 3,2015 19 0 2,8016 16 0 2,4017 19 0 2,9718 21 4 2,8019 24 1 3,3020 24 0 3,4021 21 0 3,3022 22 1 3,0023 24 0 3,7024 18 1 2,4625 18 0 2,98
Sumber: Microsoft Excel 2007
4.2 Analisis Data
Selanjutnya adalah dilakukan analisis data. Data yang sudah terkumpul dianalisis
agar dihasilkan sebuah informasi dan kesimpulan.
4.2.1 Pengujian Regresi Linier Sederhana
Pengujian data pertama adalah pengujian data regresi linear sederhana. pengujian
data itu sendiri menggunakan bantuan software SPSS 17.0.
4.2.1.1 Pengolahan SPSS
Dalam pengolahan data, dilakukan beberapa pengolahan data, yaitu sebagai berikut:
4.2.1.1.1 Pengujian Kenormalan Data
Data yang normal adalah data yang nilai mean, median, dan modusnya hampir sama
dan membetuk suatu kurva normal. Pengujian kenormalan data ini dapat dilakukan
dengan menggunakan bantuan software SPSS 17.0. Langkah – langkah yang dilakukan
adalah sebagai berikut:
33
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
1. Masukkan data yang akan diuji ke dalam Data View.
2. Klik Analyze >> Nonparametric Test >> 1 Sample K S
3. Lalu masukkan variabel umur dan kebutuhan pulsa/bulan ke dalam Test Variable
List
.
GambarSumber
4. Klik Options >> beri tanda centang pada Descriptive >> Continue
5. Pada Test Distribution, beri tanda centang Normal >> OK. Maka akan muncul
output sebagai berikut:
Tabel 4.3 Output Uji Kenormalan Data pada SPSSOne-Sample Kolmogorov-Smirnov Test
umurkebutuhan_pulsa
_per_bulan
N 25 25
Normal Parametersa,,b Mean 20.84 37.20
Std. Deviation 2.340 11.822
Most Extreme Differences Absolute .200 .254
Positive .200 .254
Negative -.112 -.141
Kolmogorov-Smirnov Z 1.001 1.269
Asymp. Sig. (2-tailed) .269 .080
a. Test distribution is Normal.
b. Calculated from data.Sumber: Print Screen Output SPSS
Dari hasil output diatas dapat dilihat pada hasil Asymp. Sig. (2-tailed). Jika nilai pada
hasil Asymp. Sig. (2-tailed) lebih dari 0,05, maka data berdistribusi normal. Pada output
diatas, hasil Asymp. Sig. (2-tailed) untuk variabel umur adalah sebesar 0,269 dan hasil
Asymp. Sig. (2-tailed) untuk variabel kebutuhan pulsa/bulan adalah sebesar 0,08. Maka
dapat disimpulkan bahwa data yang diuji tersebut berdistribusi normal.
34
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
4.2.1.1.2 Pengujian Homogenitas Varians
Data dikatakan homogen jika variansinya sama. Pengujian homogenitas data ini dapat
dilakukan dengan menggunakan bantuan software SPSS 17.0. Berikut adalah langkah-
langkah untuk menguji homogenitas varians.
1. Masukkan data yang akan diuji ke dalam Data View.
2. Klik Analyze >> Regression >> Linear
3. Lalu masukkan variabel umur ke dalam Independent dan variabel kebutuhan
pulsa/bulan ke dalam Dependent
Gambar
Sumber
4. Klik Plots >> masukkan ZPRED ke X dan ZRESID ke Y >> Continue >> OK
5. Lalu akan muncul output sebagai berikut:
Gambar:
35
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Sumber:
Scatterplot hasil pengujian homogenitas varian diatas menunjukkan bahwa data yang
sedang diuji tersebut homogen. Hal ini dapat dilihat dari sebaran data pada scatterplotnya.
Jika data menyebar dan tidak membentuk pola tertentu, maka data dikatakan homogen.
Maka data yang sedang diuji tersebut merupakan data yang homogen karena datanya
tersebar dan tidak membentuk pola.
4.2.1.1.3 Pengujian Linieritas Data
Linieritas adalah keadaan dimana hubungan antara variabel dependen dengan
variabel independen bersifat linier (garis lurus) dalam range variabel independen
tertentu. Pengujian linieritas data ini dapat dilakukan dengan menggunakan bantuan
software SPSS 17.0. Berikut adalah langkah-langkah untuk menguji linieritas data.
1. Masukkan data yang akan diuji ke dalam Data View.
2. Klik Analyze >> Regression >> Linear
3. Lalu masukkan variabel umur ke dalam Independent dan variabel kebuthan
pulsa/bulan ke dalam Dependent
Gambar:
Sumber:
4. Klik Plots >> masukkan ZPRED ke X dan ZRESID ke Y >> Continue >> OK
5. Lalu akan muncul output
36
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Gambar
Sumber
Untuk mengetahui apakah data yang sedang diuji linear atau tidak, dapat dilihat
berdasarkan output seperti yang tertera diatas. Data dikatakan linear jika persebaran
datanya mendekati garis linear. Dapat dilihat dari output data diatas bahwa persebaran
datanya mendekati garis linear. Maka dapat dikatakan bahwa data yang diuji diatas
merupakan data yang linear.
4.2.1.1.4 Pengujian Regresi Linear Sederhana
Regresi linier sederhana hanya terdiri atas satu variabel independen (bebas) dan satu
variabel dependen (terikat). Dalam pengujian regresi linear sederhana ini, akan diuji
pengaruh antara umur dengan kebutuhan pulsa/bulan. Dalam kasus ini, umur merupakan
variabel independen (bebas) sedangkan kebutuhan pulsa/bulan merupakan variabel
dependen (terikat).
Pengujian regresi linear sederhana dilakukan dengan dua cara yaitu dengan
menggunakan software SPSS dan dengan perhitungan manual dengan menggunakan
Microsoft Excel.
4.2.1.2.1 Langkah-langkah SPSS
37
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Pengujian regresi linear sederhana dapat dilakukan dengan menggunakan bantuan
software SPSS 17.0. Berikut adalah langkah-langkah untuk menguji persamaan regresi
menggunakan software SPSS 17.0:
1. Masukkan data yang akan diuji ke dalam Data View.
2. Klik Analyze >> Regression >> Linear
3. Lalu masukkan variabel umur ke dalam Independent dan variabel kebutuhan
pulsa/bulan ke dalam Dependent
4. Klik Statistics >> centang Estimates dan Descriptive >> Continue
5. Klik Plots >> masukkan ZPRED ke X dan ZRESID ke Y >> Continue >> OK
6. Lalu akan muncul output seperti berikut:
Tabel
Correlations
kebutuhan_pulsa_per_bulan umur
Pearson Correlation kebutuhan_pulsa_per_bulan 1.000 .812
umur .812 1.000
Sig. (1-tailed) kebutuhan_pulsa_per_bulan . .000
umur .000 .
N kebutuhan_pulsa_per_bulan 25 25
umur 25 25
Sumber:
Korelasi
Bagian ini untuk mengetahui ada dan tidaknya hubungan antara variabel jumlah halaman
dan harga buku. Jika ada, berapa besarnya hubungan kedua variabel tersebut.
1. Besar hubungan antara harga dan jumlah halaman buku ialah 0,947. Artinya
hubungan kedua variabel tersebut kuat. Korelasi positif menunjukkan bahwa
hubungan antara harga dan jumlah halaman searah. Artinya, jika jumlah halaman
besar, maka harga akan meningkat.
2. Hubungan antara jumlah halaman dan harga buku signifikan jika dilihat dari angka
signifikansi (sig) sebesar 0,000 yang lebih kecil dari 0,05. Jika angka signifikansi <
0,05 artinya ada hubungan yang signifikan antara kedua variabel tersebut.
Tabel
38
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Variables Entered/Removedb
Model
Variables
Entered
Variables
Removed Method
1 umura . Enter
a. All requested variables entered.
b. Dependent Variable: kebutuhan_pulsa_per_bulan
Variabel yang Dimasukkan
Bagian ini menunjukkan metode dalam memasukkan variabel. Pada bagian ini terlihat
bahwa metode yang dipakai saat memasukkan variabel dengan menggunakan metode
Enter.
Coefficientsa
Model
Unstandardized CoefficientsStandardized Coefficients
t Sig.
Collinearity Statistics
B Std. Error Beta Tolerance VIF
1 (Constant)-48.280 12.901 -3.742 .001
umur4.102 .615 .812 6.666 .000 1.000
1.000
a. Dependent Variable: kebutuhan_pulsa_per_bulan
Koefisien RegresiBagian ini menggambarkan persamaan regresi untuk mengetahui angka konstan dan uji
hipotesis signifikansi koefisien regresi:
Persamaan regresinya adalah:
Y = a + bX
Dimana:
Y = kebutuhan pulsa/bulan
X = umur
Oleh karena itu, persamaannya menjadi:
Y = -48,280 + 4,102x
4.2.1.2.2 Pengolahan Manual
Untuk menyelesaikan persamaan regresi linear sederhana, dapat dilakukan dengan
langkah-langkah berikut ini:
Rekapan data
39
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Gambar
Sumber
1. Menentukan persamaan garis regresi linear sederhana.
b=n∑
i=1
n
X iY i−(∑i=1
n
X i)(∑i=1
n
Y i)n∑
i=1
n
x i2−(∑
i=1
n
x i)2
b=(25× 19920 )−(521×930 )
(25×10989 )−(521)2
b=134703284
=4,101705238
a=Y−b X
a=37,2−( 4,101705238×20,84 )
a=−48,2795
Jadi persamaan garis regresi linear sederahananya adalah:
Y=−48,2795+4,101705 x
2. Pendugaan dan pengujian koefisien regresi
a. Kesalahan baku regresi dan koefisien regresi sederhana
1) Kesalahan baku untuk regresi:
Se=√∑ Y 2−a∑Y −b∑ XYn−2
Se=√ 37950−(−48,2795×930 )−(4,101705238×19920)25−2
Se=√ 1144,00121823
Se=7,0526
2) Kesalahan baku untuk koefisien regresi a (penduga a):
40
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Sa=√ ∑ X2−Se
n∑ X 2−(∑ X )2=12,901
3) Kesalahan baku untuk koefisien regresi b (penduga b):
Sb=√ Se
n∑ X 2−(∑ X )
2
n
Sb=√ 7,052601179
10989−5212
25
Sb=√ 4790,04148856,8646101
=0,615343696
b. Pengujian Hipotesis Koefisien Regresi (Parameter A dan B)
1) Menentukan formulasi hipotesis
Untuk parameter A:
H0 : A = A0
H1: A ≠ A0
Untuk parameter B:
H0 : B = B0
H1 : B ≠ B0, X mempengaruhi Y
2) Menentukan taraf nyata () dan nilai t tabel
(db) = (n-2) = (25-2) = 23 = 2,069
3) Menentukan kriteria pengujian
H0 diterima apabila -2,060 ≤ t0 ≤ 2,069
H0 ditolak apabila t0 < -2,060 atau t0 > 2,069
4) Menentukan nilai uji statistik
Untuk parameter A:
t 0=a−A0
Sa
t 0=−48,2795−0
12,901=−3,74231
Untuk parameter B:
t 0=b−A0
Sb
t 0=4,101705238−0
0,615343696=6,66571
41
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
5) Membuat kesimpulan
Untuk parameter A:
H0 terima karena to ≤ 2,060
Untuk paramater B:
H0 ditolak karena t0 > 2,060, berarti X mempengaruhi Y
4.2.1.3 Pengujian Penyimpangan Asumsi Regresi
Pengujian penyimpangan asumsi regresi untuk regresi linier sederhana adalah
pengujian autokorelasi. Autokorelasi berarti ada pengaruh dari variabel dalam modelnya
melalui selang waktu atau tidak terjadi korelasi antara galat randomnya. Pengujian
autokorelasi dilakukan sebagai berikut:
4.2.1.3.1 Langkah-langkah SPSS
Autokorelasi dapat diuji dengan menggunakan SPSS. Berikut adalah langkah-langkah
menguji autokorelasi dengan menggunakan SPSS:
1. Masukkan data yang akan diuji ke dalam Data View.
2. Klik Analyze >> Regression >> Linear
3. Lalu masukkan variabel Jumlah Halaman ke dalam Independent dan variabel Harga
Buku ke dalam Dependent
4. Klik Statistics >> centang Estimates dan Descriptive >> Continue
5. Klik Plots >> masukkan ZPRED ke X dan ZRESID ke Y >> Continue >> OK
6. Lalu akan muncul output seperti berikut:
Tabel
Model Summaryb
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate Durbin-Watson
1 .812a .659 .644 7.053 1.817
a. Predictors: (Constant), umur
b. Dependent Variable: kebutuhan_pulsa_per_bulan
Sumber:
Untuk melihat ada tidaknya autokorelasi pada data yang diuji, dapat dilihat hasilnya pada
tabel Model Summary pada kolom Durbin-Watson. Data dianggap tidak terdapat
autokorelasi jika nilai Durbin-Watsonnya terletak diantara 1,55 – 2,46. Dalam tabel diatas,
42
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
nilai Durbin-Watsonnya sebesar 1,817. Jadi dapat disimpulkan bahwa data yang sedang
diuji tersebut tidak autokorelasi.
4.2.1.3.2 Pengolahan Manual
Autokorelasi dapat dihitung dengan rumus manual menggunakan bantuan Microsoft
Excel. Langkah-langkah perhitungannya adalah sebagai berikut:
1. Menentukan formulasi hipotesis
H0 = tidak ada autokorelasi dalam model regresinya
H1 = ada autokorelasi dalam model regresinya
2. Menentukan nilai dan nilai d tabel
= 0,05 ; n = 25 ; k = 1
dU = 1,45
dL = 1,29
3. Menentukan kriteria pengujian
H0 diterima apabila d > 1,45 (dU)
H0 diterima apabila d < 1,29 (dL)
4. Menentukan nilai uji statistik
Menggunakan uji durbin watson, adapun rumusnya adalah sebagai berikut :
d=∑t−2
n
(e t−et−1)
∑t−1
n
e t2
sehingga, d=2017,356141144
=1,76342132
5. Membuat kesimpulan
H0 diterima karena d = 1,763 > 1,45 (dU). Jadi tidak ada autokorelasi dalam
model regresinya.
4.2.2 Regresi Linier Berganda
Pengolahan data kedua adalah pengolahan data regresi linear berganda. Pengolahan
data itu sendiri dibagi menjadi dua, yaitu pengolahan data menggunakan SPSS dan
pengolahan data manual menggunakan Microsoft Excel.
4.2.2.1 Pengujian Asumsi Regresi
43
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Data regresi linear memiliki asumsi-asumsi yang harus dipenuhi dan diuji terlebih
dahulu, antara lain kenormalan data, homogenitas varians, dan linieritas data.
4.2.2.1.1 Pengujian Kenormalan Data
Data yang normal adalah data yang nilai mean, median, dan modusnya hampir sama
dan membetuk suatu kurva normal. Pengujian kenormalan data ini dapat dilakukan
dengan menggunakan bantuan software SPSS 17.0
4.2.2.1.1.1 Langkah-langkah SPSS
Pengujian kenormalan data merupakan langkah yang harus dilakukan karena salah
satu asumsi yang harus dipenuhi dalam regresi adalah data yang diambil haruslah
berdistribusi normal. Berikut adalah langkah-langkah untuk menguji kenormalan data
menggunakan SPSS:
1. Masukkan data yang akan diuji ke dalam Data View.
2. Klik Analyze >> Nonparametric Test >> 1 Sample K S
3. Lalu masukkan variabel SKS, jumlah organisasi, dan IPK ke dalam Test Variable List
4. Klik Options >> beri tanda centang pada Descriptive >> Continue
5. Pada Test Distribution, beri tanda centang Normal >> OK. Maka akan muncul output
.
4.2.2.1.1.2 Output SPSS
Output yang dihasilkan adalah sebagai berikut:
Tabel
One-Sample Kolmogorov-Smirnov Test
IPK SKS Jumlah_Org
N 25 25 25
Normal Parametersa,,b Mean 3,1336 21.72 .92
Std. Deviation ,33076 2.492 .997
Most Extreme Differences Absolute .173 .260 .228
Positive .129 .180 .228
Negative -.173 -.260 -.178
Kolmogorov-Smirnov Z .863 1.299 1.140
Asymp. Sig. (2-tailed) .446 .068 .149
a. Test distribution is Normal.
b. Calculated from data.
Sumber:
44
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Dari hasil output diatas dapat dilihat pada hasil Asymp. Sig. (2-tailed). Jika nilai
pada hasil Asymp. Sig. (2-tailed) lebih dari 0,05, maka data berdistribusi normal.
Pada output diatas, hasil Asymp. Sig. (2-tailed) untuk IPK adalah sebesar 0,446,
untuk variabel SKS adalah sebesar 0,68 dan untuk variabel jumlah oragnisasi
sebesar 0,149. Maka dapat disimpulkan bahwa data yang diuji tersebut
berdistribusi normal.
4.2.2.1.2 Pengujian Homogenitas Varians
Pengujian data dikatakan homogen jika variansinya sama. Pengujian homogenitas
data ini dapat dilakukan dengan menggunakan bantuan software SPSS 17.0
4.2.2.1.2.1 Langkah-langkah SPSS
Pengujian homogenitas varian data merupakan uji asumsi kedua. Untuk mendapatkan
persamaan regresi yang benar, harus dipenuhi dahulu asumsi-asumsi, salah satunya
adalah data harus homogen. Berikut adalah langkah-langkah untuk menguji kenormalan
data menggunakan SPSS:
1. Masukkan data yang akan diuji ke dalam Data View.
2. Klik Analyze >> Regression >> Linear
3. Lalu masukkan variabel SKS dan jumlah organisasi ke dalam Independent dan
variabel IPK ke dalam Dependent.
4. Klik Plots >> masukkan ZPRED ke X dan ZRESID ke Y >> Continue >> OK
45
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
5. Lalu akan muncul output
4.2.2.1.2.2 Output SPSS
Setelah diuji, akan muncul output seperti berikut ini:
Gambar
Sumber:
Scatterplot hasil pengujian homogenitas varian diatas menunjukkan bahwa data yang
sedang diuji tersebut homogen. Hal ini dapat dilihat dari sebaran data pada scatterplotnya.
Jika data menyebar dan tidak membentuk pola tertentu, maka data dikatakan homogen.
Maka data yang sedang kita uji tersebut merupakan data yang homogen karena datanya
tersebar dan tidak membentuk pola.
4.2.2.1.3 Pengujian Linieritas
Linieritas adalah keadaan dimana hubungan antara variabel dependen dengan
variabel independen bersifat linier (garis lurus) dalam range variabel independen
tertentu. Pengujian linieritas data ini dapat dilakukan dengan menggunakan bantuan
software SPSS.
4.2.2.1.3.1 Langkah-langkah SPSS
Pengujian linearitas data merupakan uji asumsi yang selanjutnya. Karena disini akan
menguji persamaan regresi linear, maka data yang diuji harus memenuhi asumsi
46
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
linearitas. Berikut adalah langkah-langkah untuk menguji kenormalan data menggunakan
SPSS:
1. Masukkan data yang akan diuji ke dalam Data View.
2. Klik Analyze >> Regression >> Linear
3. Lalu masukkan variabel bebas yaitu SKS dan jumlah organisasi ke dalam Indendent
sedangkan IPK ke dalam Dependent(s)
4. Klik Statistics >> centang Estimates dan Descriptive >> Continue
5. Klik Plots >> masukkan ZPRED ke X dan ZRESID ke Y >> Continue >> OK
6. Lalu akan muncul output.
4.2.2.1.3.2 Output SPSS
Setelah diuji maka akan muncul output seperti berikut ini:
Gambar
Sumber:
Untuk mengetahui apakah data yang sedang diuji linear atau tidak, dapat dilihat
berdasarkan output seperti yang tertera diatas. Data dikatakan linear jika persebaran
datanya mendekati garis linear. Dapat dilihat dari output data diatas bahwa persebaran
datanya mendekati garis linear. Maka dapat dikatakan bahwa data yang diuji diatas
merupakan data yang linear.
4.2.2.2 Pengujian Regresi Linier Berganda
47
MODUL IIIANALISIS DATA DAN STATISTIK DESKRIPTIF
LABORATORIUM STATISTIK DAN REKAYASA KUALITAS
Regresi linier berganda terdiri atas dua variabel independen (bebas) dan satu
variabel dependen (terikat). Dalam pengujian regresi linear sederhana ini, akan diuji
pengaruh antara SKS dan jumlah organisasi terhadap IPK. Dalam kasus ini, SKS dan jumlah
organisasi merupakan variabel independen (bebas) sedangkan IPK merupakan variabel
dependen (terikat).
Pengujian regresi linear berganda dilakukan dengan dua cara yaitu dengan
menggunakan software SPSS dan dengan perhitungan manual dengan menggunakan
Microsoft Excel.
4.2.2.2.1 Langkah-langkah SPSS
Pengujian regresi linear sederhana dapat dilakukan dengan menggunakan software
SPSS. Berikut adalah langkah-langkah untuk menguji persamaan regresi menggunakan
SPSS:
1. Masukkan data yang akan diuji ke dalam Data View.
2. Klik Analyze >> Regression >> Linear
3. Lalu masukkan variabel bebas yaitu lama penggunaan SKS dan jumlah organisasi ke
dalam Independent sedangkan IPK ke dalam Dependent(s)
4. Klik Statistics >> centang Estimates dan Descriptive >> centang Durbin Watson >>
Continue
5. Klik Plots >> masukkan ZPRED ke X dan ZRESID ke Y >> Continue >> OK
6. Lalu akan muncul output seperti berikut:
48