25
1. REGRESI A. Pengertian Regresi Menurut Irianto (2004:156-157), regresi merupakan alat analisis statistik yang dapat membantu peneliti untuk melakukan prediksi atas variabel terikat dengan mengetahui kondisi variabel bebas. Beberapa pola regresi sederhana diantaranya : 1. Linear dengan persamaan : = a + bX 2. Parabola dengan persamaan : = a + bX + cX 2 3. Hiperbola dengan persamaan : = 1/ (a + bX) 4. Fungsi pangkat tiga dengan persamaan : = a + bX + cX 2 + dX 3 5. Dan lain-lain B. Regresi Linear Sederhana Model linear sederhana ditujukan untuk mempermudah konsep regresi, karena model inilah yang paling sederhana dibanding dengan model-model lainnya. Tanpa mempelajari model linear sederhana kemungkinan terlalu sukar mendalami dan memahami model-model lainnya. Untuk mempermudah pemahaman regresi perlu kita kembali pola penyebaran skor (titik-titik penyebaran skor) yaitu titik-titik perpotongan antara nilai X dan Y. (Irianto, 2004:157-158) Jika antara titik satu dengan titik yang lainnya dihubungkan dengan satu garis, maka akan diperoleh garis yang tidak lurus. Tetapi, jika diambil satu garis yang mewakili rata-rata dari seluruh titik-titik tersebut maka akan diperoleh garis lurus. Garis lurus itulah yang merupakan garis regresi linear. Melalui garis persamaan lurus itulah kita dapat melakukan prediksi rata-rata

Korelasi Dan Regresi

Embed Size (px)

DESCRIPTION

statistika

Citation preview

1. REGRESIA. Pengertian Regresi

Menurut Irianto (2004:156-157), regresi merupakan alat analisis statistik yang dapat membantu peneliti untuk melakukan prediksi atas variabel terikat dengan mengetahui kondisi variabel bebas. Beberapa pola regresi sederhana diantaranya :

1. Linear dengan persamaan : = a + bX2. Parabola dengan persamaan : = a + bX + cX23. Hiperbola dengan persamaan : = 1/ (a + bX)4. Fungsi pangkat tiga dengan persamaan : = a + bX + cX2 + dX35. Dan lain-lain

B. Regresi Linear Sederhana

Model linear sederhana ditujukan untuk mempermudah konsep regresi, karena model inilah yang paling sederhana dibanding dengan model-model lainnya. Tanpa mempelajari model linear sederhana kemungkinan terlalu sukar mendalami dan memahami model-model lainnya. Untuk mempermudah pemahaman regresi perlu kita kembali pola penyebaran skor (titik-titik penyebaran skor) yaitu titik-titik perpotongan antara nilai X dan Y. (Irianto, 2004:157-158)Jika antara titik satu dengan titik yang lainnya dihubungkan dengan satu garis, maka akan diperoleh garis yang tidak lurus. Tetapi, jika diambil satu garis yang mewakili rata-rata dari seluruh titik-titik tersebut maka akan diperoleh garis lurus. Garis lurus itulah yang merupakan garis regresi linear. Melalui garis persamaan lurus itulah kita dapat melakukan prediksi rata-rata nilai variabel terikat. Jadi, dengan mengetahui nilai variabel bebas kita dapat mengetahui rata-rata nilai variabel terikatnya. Apabila kita ingin menerapkan hasil prediksi tersebut pada populasi yang lain, maka populasi tersebut harus mempunyai kriteria yang sama dengan populasi yang diambil sampelnya. Nilai prediksi belum tentu sama dengan nilai aslinya. Hal ini disebabkan oleh karena yang diprediksi adalah nilai rata-ratanya. Dengan demikian, nilai prediksi dapat dikatakan baik apabila nilai prediksi tidak jauh menyimpang (kalau mungkin sama) dari nilai aslinya. Ini berarti bahwa rata-rata simpangan nilai asli dengan nilai rata-ratanya tidak terlalu besar (kalau mungkin nol). (Irianto, 2004:157-158)Rumus persamaan regresi linear = a + bX bukan merupakan persamaan yang tepat, artinya persamaan tersebut merupakan pendekatan dari persamaan = a + bX. Persamaan yang sebenarnya terlalu sukar untuk dihitung, sehingga hasil perhitungan a dan b yang merupakan pendekatan dan perlu diuji kecocokannya. Jika ternyata a berfungsi sebagai pengganti dan berfungsi sebagai pengganti maka persamaan diatas dapat digunakan sebagai pengganti persamaan sebenarnya, yang fungsinya untuk melakukan prediksi. (Irianto, 2004:158)Menurut Irianto (2004:158-159), nilai a maupun nilai b dapat dihitung melalui rumus yang sederhana. Untuk memperoleh nilai a dapat digunakan rumus :

Sedangkan untuk memperoleh nilai b dapat digunakan rumus :

Setelah nilai a dan b dapat dihitung, langkah selanjutnya adalah menguji apakah nilai a dan b memang dapat mewakili nilai dan . Untuk pengujian disini kita perlu melihat beberapa variasi yang mungkin muncul, dan melihat apakah variasi-variasi tersebut terlalu besar atau tidak. Beberapa variasi yang perlu dilihat adalah :

1. Variasi kekeliruan taksiran ( standard error estimate) yang dapat dihitung dengan rumus :

Atau dapat dihitung dengan rumus yang lebih sederhana yaitu :

Untuk menghitung variansi X dan Y

Keterangan

SS : merupakan sum of squarres (jumlah kuadrat) yaitu jumlah kuadrat simpangan masing-masing nilai dengan rata-ratanya.

2. Variasi koefisien regresi terdiri dari dua macam yaitu:

a. Koefisien regresi a dihitung dengan rumus

b. Koefisien regresi a dihitung dengan rumus

3. Variasi ramalan Y untuk setiap X:

a. Rata-rata ramalan dihitung dengan rumus :

b. Ramalan individu dihitung dengan rumus

Contoh :

X 90 10010095105110105105115120

Y 707580808585859095100

Sumber : data fiktif

Langkah pertama : membuat tabel penyebaran nilai sebagai berikut:

XYX2Y2XY

120100144001000012000

1159513225902510925

110851210072259350

105901102581009450

105851102572258925

105851102572258925

100801000064008000

100751000056257500

9580902564007600

9070810049006300

10458451099257212588975

Sedangkan selisih setiap nilai X dengan rata-ratanya :

XX - (X - )2

120104,515,5240,25s

115104,510,5110,25

110104,55,530,25

105104,50,50,25

105104,50,50,25

105104,50,50,25

100104,5-4,520,25

100104,5-4,520,25

95104,5-9,590,25

90104,5-14,5210,25

0722,5

Selisih nilai Y dengan rata-ratanya

YY - (Y - )2

10084,515,5240,25

9584,510,5110,25

8584,55,530,25

9084,50,50,25

8584,50,50,25

8584,50,50,25

8084,5-4,520,25

7584,5-4,520,25

8084,5-9,590,25

7084,5-14,5210,25

0722,5

Berdasarkan kedua tabel diatas dapat dihitung a, b, serta variasi sebagai berikut :

= -12,76816609

= - 12,77

= 0,9307958478

= 0,93

= = = 80,2777778

= 80,28

= = = 80,2777778

= 80,28

= () ( )= () ( )= = = = 0,016887967 = 0,0017

= + = 12,20 (1/10 + 10920,25/722,5)

= 19,6597301

= 19,66

Variasi ramalan individu Y untuk X yang diketahui (untuk X=100) adalah :

= = 12,20 {1/10 + (100-104,5)2 : 722,5}

= 1,561937716 = 1,56

Variasi ramalan individu Y untuk X yang diketahui (untuk X=100) adalah :

= = 12,20 {1 + 1/10 + (100-104,5)2 : 722,5}

= 13,76193772 = 13,76

C. Pengujian Signifikasi Koefisien Regresi

Menurut Irianto (2004:164), Langkah pertama adalah penyusunan hipotesis matematis yang bentuknya sebagai berikut:

H0: = 0

H1: 0

Dalam pengujian ini membutuhkan standard error dari koefisien regresi yang dapat dihitung melalui perhitungan variance/variasi yang dapat dihitung dengan rumus :

Langkah kedua adalah mencari simpangan baku standard error koefisien regresi. Untuk soal diatas, standard error koefisien regresinya adalah :

= = = = 0,01670238623

= = 0,1292377121 = 0,13

Langkah ketiga adalah menghitung nilai t koefisien regresi b nilai t koefisien regresi b untuk soal diatas adalah :

t = (b )/= (0,93 0) / 0,13

= 7,153846154 = 7,15

Jika menggunakan alpha 0,05 maka tabel dengan dk = 8 adalah 2,306. Dengan demikian maka ditolak hipotesis nol, artinya koefisien regresi adalah signifikan sehingga ada hubungan linear yang signifikan antara X dan Y, dan b= 0,93 bukan semata-mata disebabkan oleh factor random (kebetulan) saja.

Langkah keempat adalah melakukan perhitungan tentang interval kepercayaan atas ramalan yang dilakukan, artinya apabila meramal nilai Y dengan dasar nilai X, maka nilai Y itu akan terletak diantara dua garis yang terletak diatas dan dibawah garis persamaan regresi linear.

Garis A merupakan garis persamaan regresi

Garis B dan C merupakan batas confidence interval

Jarak antara garis B dan c dapat dihitung dengan rumus:

Untuk contoh diatas:

1. Persamaan regresi linear (garis B) adalah Y = -12,77 + 0,93X

2. Confidence interval (jarak BC) untuk nilai X = 100 dan alpha 0,05 adalah :

Y = = 80,23 6,845985685

Jadi confidence interval untuk contoh diatas adalah diantara 87,07598569 dan 73,38401432.

Menurut Irianto (2004:167-168), langkah-langkah dalam perhitungan regresi linear sederhana adalah :

1. Menghitung nilai a dan b untuk menentukan persamaan regresi linear sederhana.

2. Menguji signifikan koefisien regresi.

3. Menghitung variasi untuk selanjutnya digunakan untuk menentukan standar error penafsiran.

4. Menentukan confidence interval dari penafsiran.

5. Menghitung koefisien korelasi, untuk menghitung koefisien determinasi.

6. Menguji signifikansi daripada koefisien korelasi.

7. Melakukan interpretasi.

D. Uji Linear Regresi Sederhana

Menurut Irianto (2004:172), Pengujian linearitas berkaitan dengan sum of squares sisa, dimana sum of squares sisa dipisah menjadi dua bagian yaitu sum of squares ketidaksamaan, dan sum of squares error. Dalam membahas ketidaksamaan perlu melihat (mengelompokkan) Y berdasarkan nilai X, artinya kita cari simpangan nilai Y dalam setiap kelompok X. Sehingga banyaknya derajat kebebasannya adalah k (banyaknya kelompok X) dikurang dengan 2. Sedangkan sum of squares error merupakan selisih sum of squares sisa dengan sum of squares ketidaksamaan, dengan derajat kebebasan n-k.

Langkah awal adalah menyusun penyebaran nilai-nilai data Y berdasarkan nilai X.

XY

120100

11595

11085

10590

10585

10585

10080

10075

9580

9070

Berdasarkan tabel diatas dapat dihitung sum of squares error (SSerror) dengan rumus :

Keterangan :

x = merupakan jumlah simpangan setiap Y yang didasarkan pada pengelompokan (kesamaan nilai ) X

nk = merupakan jumlah n setiap kelompok

Untuk contoh soal diatas squares ketidaksamaannya sebagai berikut:

= (1002 1002/1) + (952 952/1) + (852 852/1) + (902 + 852 + 852 (90 + 85 + 85)2/3) + (802 + 752 (80 + 75)2/2) + (802 802/1) + (702 702/1)

= -

=

=

Untuk linearilitas akan menggunakan f tes, sedangkan hipotesisnya sebagai berikut:

H0 : persamaan regresi linear

H1 : persamaan regresi tidak linear

Sedangkan f hitung dicari dengan rumus :

F = Untuk soal diatas f hitung adalah:

F = 13,5816 : 9,7223

= 1,396809725 = 1,40

Jika mengambil alpha 0,05 maka f 0,05 (5,3) = 9,01 (lihat tabel f)

Oleh karena f hitung lebih kecil daripada f tabel maka diterima hipotesis nol yang menyatakan bahwa persamaan regresi yang diperoleh yaitu Y = -12,77 + 0,93X merupakan persamaan regresi linear. Dengan demikian tidak perlu mencari model persamaan lain, sebaliknya apabila ternyata persamaan regresi yang diperoleh tidak linear maka harus mencari persamaan model lain.

Jika digabungkan hasil analisis variance tentang signifikansi koefisien regresi dan linearitas persamaan regresi, maka tabel anovanya sebagai berikut :

Sumber variansidkSSMSF

Total1072125

Regresi a

Regresi b/a

sisa1

1

871402,5

625,425

97,07571402,5

625,425

12,13437551,54

Ketidaksamaan

error5

367,908

29,16713,5816

9,72231,40

Catatan : Uji linearitas mempunyai criteria penerimaan hipotesis nol terbalik dengan kriteria yang lainnya.

2. KORELASIKorelasi merupakan suatu hubungan antara satu variable dengan variable lainnya. Hubungan tersebut dapat menunjukkan hubungan sebab akibat (korelasional), maupun tidak (kausal). (Irianto,2004: 134).

Koefisien korelasi merupakan indeks atau bilangan yang digunakan untuk mengukur keeratan (kuat, lemah, atau tidak) hubungan antarvariabel. (Hasan,2002:233). Koefisien korelasi memiliki nilai antara -1 dan +1.

a. Jika nilai KK bernilai positif, maka variable-variabel berkorelasi positif.

b. Jika nilai KK bernilai negatif, maka variable-variabel berkorelasi negatif.

c. Jika KK bernilai 0 (nol) variable-variabel tidak menunjukkan korelasi.

d. Jika KK bernilai +1 atau -1, maka variabel menunjukkan korelasi positif sempurna atau negative sempurna.Untuk menentukan keeratan hubungan / korelasi antarvariabel tersebut, berikut ini diberikan nilai-nilai dari KK sebagai patokan:

a. KK=0, tidak ada korelasi

b. 0