27
www.company.com Korelasi Bivariat dan Regresi Linier Sederhana

Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Embed Size (px)

Citation preview

Page 1: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

www.company.com

Korelasi Bivariat danRegresi Linier Sederhana

Page 2: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Pendahuluan• Dalam suatu observasi, kita sering kali mencatat dua atau

lebih variabel dalam suatu individu, misalkan: dari 1 orangdicatat data tinggi dan berat badannya. Tinggi dan beratbadan merupakan variabel.

www.company.com

• Data yang memiliki dua variabel disebut databivariat, data yang memiliki lebih dari dua variabel disebutdata multivariat.

Page 3: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

• Tujuan kita mengumpulkan data bivariat yaituuntuk menjawab:– Apakah kedua variabel tersebut terkait?

– Relasi seperti apa yang diindikasikan oleh data?

www.company.com

– Relasi seperti apa yang diindikasikan oleh data?

– Dapatkah kita mengukur kekuatan relasi antaravariabel tersebut?

– Dapatkah kita memprediksi nilai satu variabelmenggunakan variabel yang lain?

Page 4: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Rangkuman dari data bivariat kategorik

• Data kategorik/data kualitatif: data yang biasanya bukan dalambentuk angka.

• Data bivariat kategorik: data kualitatif yang memiliki 2 variabel.

www.company.com

• Setelah melakukan pencatatan pada data kategorik, hal yangkemudian dilakukan adalah merangkum data tersebut.

• Rangkuman data kategorik biasanya disebut data tertabulasiatau data terklasifikasi silang. Dalam statistik disebut juga tabelkontingensi.

Page 5: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Contoh:

GenderAktifitas Media Sosial

JumlahTweeting No Tweeting

Laki-laki 120 75 195

Perempuan 155 90 245

www.company.com

Perempuan 155 90 245

275 165 440

Page 6: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Diagram Scatter untuk data bivariate kuantitatif

• Data kuantitatif: data dalam bentuk numerik/angka.

• Data bivariate kuantitatif: data kuantitatif yang memiliki 2variabel.

www.company.com

variabel.

• Misalkan: kita memiliki 2 variabel, namakan variabel x dany. Kedua variabel tersebut kita pasangkan menjadi (x,y).Jika data tercatat sebanyak n kali, maka kita memiliki npasangan (x,y):

(x1,y1), (x2,y2), …, (xn,yn)

Page 7: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

• Sebanyak n pasangan (x,y) digambarkan sebagai titik didalam diagram.

• Diagram tersebut dinamakan diagram scatter atau plot

www.company.com

• Diagram tersebut dinamakan diagram scatter atau plotscatter.

• Dengan melihat diagram scatter, relasi antara keduavariabel dapat dinilai secara visual. Singkatnya, kita dapatmengobservasi apakah titik-titik dalam plot berkumpulmembentuk garis atau kurva atau tidak berpola.

Page 8: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Contoh:• Variabel x: skor GPA (Grade Point Average)

• Variabel y: skor GMAT (Graduate Mangement AptituteTest)

www.company.com

Page 9: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

• Solusi:

Dari diagram plot terlihat titik-titik membentuk pola daribarat daya ke timur laut mengindikasikan relasi yangpositif antara x dan y. Demikian sehingga, seseorang

www.company.com

positif antara x dan y. Demikian sehingga, seseorangyang memiliki GPA yang tinggi, juga memiliki skor GMATyang tinggi.

Page 10: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Koefisien Korelasi• Koefisien korelasi (dinotasikan dengan r) adalah ukuran

kekuatan dari relasi linier antara variabel x dan y.

• Sifat dari koefisien korelasi:

www.company.com

• Sifat dari koefisien korelasi:

– Nilai r berada diantara -1 dan 1:

– Nilai r dekat dengan 0, menunjukkan relasi yang lemah.

– Nilai r dekat dengan 1 atau -1, menunjukkan relasi yangkuat.

– Besarnya r mengindikasikan kekuatan relasilinier, dimana tandanya menunjukkan arah. Secaraspesifik sebagai berikut:

1 r 1

Page 11: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

• r>0 jika pola nilai (x,y) terkumpul dari kiri bawah ke kananatas.

• r<0 jika pola nilai (x,y) terkumpul dari kiri atas ke kananbawah.

www.company.com

bawah.

• r=1 jika semua nilai (x,y) terbentang membentuk garislurus dengan kemiringan positif (relasi positif liniersempurna)

• r=-1 jika semua nilai (x,y) terbentang membentuk garislurus dengan kemiringan negatif (relasi negatif liniersempurna)

Page 12: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Contoh:

www.company.com

Page 13: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Dimana

Menghitung koefisien korelasi• Rumus menghitung r:

xy

xx yy

Sr

S S

xy

2

xx

2

S x x y y

S x x

S y y

www.company.com

• Korelasi pada populasi dinotasikan: ρ

• Estimasi korelasi dinotasikan: r, disebut koefisien korelasiproduct-moment Pearson atau hanya koefisien korelasi.

xx yy

2 22 2

n xy x y

n x x n y y

2

yyS y y

Page 14: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Contoh: Koefisien KorelasiNo y x xy y^2 x^2

1 45 10 450 2025 100

2 67 9 603 4489 81

3 89 6 534 7921 36

4 23 17 391 529 289

5 69 7 483 4761 49

y: Nilai UTS mata kuliah StatistikaKomunikasix: banyaknya update sosmed dalam 1hari

www.company.com

5 69 7 483 4761 49

6 90 5 450 8100 25

7 77 4 308 5929 16

8 81 6 486 6561 36

9 82 4 328 6724 16

10 67 6 402 4489 36

11 56 12 672 3136 144

12 49 15 735 2401 225

13 69 10 690 4761 100

14 72 8 576 5184 64

15 91 3 273 8281 9

1027 122 7381 75291 1226

0

5

10

15

20

0 20 40 60 80 100

Ban

yakn

ya

Up

date

So

sm

ed

Nilai UTS Statistika Komunikasi

Diagram Scatter Nilai UTS StatistikaKomunikasi dengan Banyaknya

Update Sosmed

Page 15: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

• Nilai koefisien korelasi product-momentPearsonnya:

n xy x yr

www.company.com

2 22 2

2 2

rn x x n y y

15 7381 1027 122

15 75291 1027 15 1226 122

0.90125

Page 16: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Latihan

• Browsing data dengan 2 variabel atau buatlahdata fiksi dengan 2 variabel. (Banyakdata, minimal n=10)

www.company.com

• Gambarkan diagram scatternya.

• Hitung koefisien korelasinya.

Page 17: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Regresi Linier Sederhana

• Setelah kita menemukan pola linier (garis) dalamdiagram scatter, dan korelasi diantara duavariabel cukup kuat, kita dapat menentukansuatu persamaan yang memungkinkan kita

www.company.com

suatu persamaan yang memungkinkan kitauntuk memprediksi nilai satu variabelmenggunakan variabel yang lain.

• Persamaan ini disebut dengan regresi liniersederhana.

Page 18: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Menentukan variabelManakah yang menjadi X dan manakah yang menjadi Y?

• Ketika kita menentukan koefisien korelasi, pilihan untukmenentukan yang manakah variabel X dan yang manakahvariabel Y,tidak menjadi masalah. Akan tetapi lain halnya

www.company.com

variabel Y,tidak menjadi masalah. Akan tetapi lain halnyaketika kita ingin membuat prediksi.

• Dalam statistik:– Variabel X disebut variabel bebas /independen atau variabel

penjelas.

– Variabel Y disebut variabel terikat /dependen atau variabelrespon

Page 19: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

• Sebelum kita menentukan garis regresi, baiknyamelakukan pengecekan terhadap kondisi berikut:– Diagram scatter-nya memiliki pola linier.

– Koefisien korelasinya cukup kuat (diatas kurang lebih

www.company.com

– Koefisien korelasinya cukup kuat (diatas kurang lebih0.60)

Page 20: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Persamaan regresi linier

• Persamaan regresi linier sederhana:

• Estimasi koefisien beta dalam regresi linier yaitu:

0 1y x

www.company.com

0 1y b b x

Page 21: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Contoh:

www.company.com

Page 22: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Residual

• Residual adalah error yang dari pendugaan olehpersamaan regresi.

ˆe y y

www.company.com

dimana

e: error

y: nilai yang sebenarnya

y(topi): nilai dugaan dari persamaan regresi.

i i iˆe y y

Page 23: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Nilai estimasi koefisien persamaan regresi

• Persamaan regresi:

0 1y b b x

www.company.com

• Estimasi koefisien b0 dan b1 persamaan regresiyaitu:

1 22

0 1

n xy x yb

n x x

b y b x

Page 24: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Contoh:• y: Nilai UTS mata kuliah Statistika

Komunikasi

• x: banyaknya update sosmed dalam 1hari

• Nilai koefisien:

No y x xy y^2 x^2

1 45 10 450 2025 100

2 67 9 603 4489 81

3 89 6 534 7921 36

4 23 17 391 529 289

5 69 7 483 4761 49

6 90 5 450 8100 25

7 77 4 308 5929 16

www.company.com

• Nilai koefisien:7 77 4 308 5929 16

8 81 6 486 6561 36

9 82 4 328 6724 16

10 67 6 402 4489 36

11 56 12 672 3136 144

12 49 15 735 2401 225

13 69 10 690 4761 100

14 72 8 576 5184 64

15 91 3 273 8281 9

1027 122 7381 75291 1226

bar 68.46667 8.133333

1 22

2

0

n xy x yb

n x x

15 7381 1027 122

15 1226 122

4.1583

b 68.4667 ( 4.1823) 8.1333

102.2875

Page 25: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

• Persamaan regresinya:

y 102.2875 4.1583x

No y x y(topi)

1 45 10 60.7045

2 67 9 64.8628

3 89 6 77.3377

4 23 17 31.5964

5 69 7 73.1794

www.company.com

5 69 7 73.1794

6 90 5 81.496

7 77 4 85.6543

8 81 6 77.3377

9 82 4 85.6543

10 67 6 77.3377

11 56 12 52.3879

12 49 15 39.913

13 69 10 60.7045

14 72 8 69.0211

15 91 3 89.8126

1027 122

y 102.2875 4.1583 (12)

52.3879

Page 26: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Mean Squared Error• Ukuran baik atau buruknya

suatu persamaanregresi, salah satunya dapatdilihat dari nilai rata-rata galatkuadratnya, yang disebut MSE

No y x y(topi) error e^2

1 45 10 60.7045 -15.7045 246.6313

2 67 9 64.8628 2.1372 4.567624

3 89 6 77.3377 11.6623 136.0092

4 23 17 31.5964 -8.5964 73.89809

5 69 7 73.1794 -4.1794 17.46738

www.company.com

kuadratnya, yang disebut MSE(Mean Squared Error).

• Semakin kecil nilai MSE-nya, maka persamaan regresitersebut baik.

5 69 7 73.1794 -4.1794 17.46738

6 90 5 81.496 8.504 72.31802

7 77 4 85.6543 -8.6543 74.89691

8 81 6 77.3377 3.6623 13.41244

9 82 4 85.6543 -3.6543 13.35391

10 67 6 77.3377 -10.3377 106.868

11 56 12 52.3879 3.6121 13.04727

12 49 15 39.913 9.087 82.57357

13 69 10 60.7045 8.2955 68.81532

14 72 8 69.0211 2.9789 8.873845

15 91 3 89.8126 1.1874 1.409919

1027 122 MSE 62.27619

21MSE e

n

Page 27: Course 6 Korelasi Bivariat dan regresi sederhana fileKoefisien Korelasi • Koefisien korelasi (dinotasikan dengan r) adalah ukuran kekuatan dari relasi linier antara variabel x dan

Latihan

• Menggunakan data pada latihan sebelumnya(menghitung koefisien korelasi), tentukanpersamaan regresi dari data tersebut.

www.company.com

• Hitunglah error dan MSE-nya