Upload
hermen-freitas
View
313
Download
9
Embed Size (px)
Citation preview
y i
n
ANALISIS REGRESI
A. Prinsip Statistik
Sebagai contoh data pengukuran debit rata-rata tahunan sungai Serang di
Stasiun Bendungan, Kab. Kulon Progo selama 15 tahun :
Tabel 1. Debit Sungai
Tahunyi (debit)
yi - ȳ (yi – ȳ)2
(m3/d)
1971 8,52 1,486 2,208
1972 3,33 -3,704 13,720
1973 7,85 0,816 0,666
1974 7,65 0,616 0,379
1975 10,91 3,876 15,023
1976 4,17 -2,864 8,202
1977 3,40 -3,634 13,206
1978 8,00 0,966 0,933
1979 13,4 6,366 40,526
1980 5,40 -1,634 2,670
1981 8,87 1,836 3,371
1982 4,73 -2,304 5,308
1983 7,40 0,366 0,134
1984 6,88 -0,154 0,024
1985 5,00 -2,034 4,137
∑yi = 105,51 ∑ (yi – ȳ)2 = 110,507
Nilai rata-rata :
ȳ
y i
n
105.51
15
D2
n 1
110.5
15 1 2.809
i = 1 sampai n
ȳ
Deviasi Standar :
Untuk mengukur penyebaran data terhadap nilai rata-rata.
σ = ; D = ∑ (yi – ȳ)2
Makin besar penyebaran data maka σ makin besar.
Varians :
Merupakan kuardrat dari deviasi standar.
σ2 = ∑ (yi – y)2 = 110,507 = 7,893
n-1 15 – 1
B. Metode Kuadrat Terkecil
Gambar 1. Kurva mewakili titik-titik data
Teknik tersebut dilakukan dengan prosedur berikut :
1. Gambar titik-titik data pada sistem koordinat x-y. akan terlihat ‘trend’
kumpulan data, kemudian dapat ditentukan bentuk kurva lurus/lengkung.
7.034
0
0
0
2. Pilih suatu fungsi g(x) yang mewakili f(x) :
g(x) = a0 + a1x + a2x2 + …… + arxr
a0, a1, a2, ……., ar : parameter
3. Tentukan parameter a0, a1, a2, ……., ar sedemikian rupa sehingga g (xi ; a0, a1,
…., ar) melalui sedekat mungkin titik-titik data.
4. Koordinat titik-titik data : M (xi, yi) ; i=1, 2, …., n
Fungsi yang dipilih : g (xi ; a0, a1, …., ar)
Selisih ordinat :
Ei = MiGi = yi – g (xi ; a0, a1, …., ar)
= yi – (a0 + a1xi + a2xi2 + …… + arxi
r)
5. Pilih fungsi g(x) yang mempunyai kesalahan Ei terkecil. Dalam metode ini
jumlah kuadrat dari kesalahan adalah terkecil.
D2 ∑ Ei2 ∑ (yi – g(xi))2
6. Dicari parameter a0, a1, a2, ……., ar sedemikian sehingga D2 minimum. D2
minimum jika turunan pertama terhadap a0, a1, a2, ……., ar adalah nol :
∂D2
∂a0
∂D2
∂a1
.
.
∂D2
∂ar
7. Dari persamaan tahap 6 akan diperoleh nilai-nilai parameter a0, a1, a2, …….,
ar. Dengan demikian persamaan kurva terbaik yang mewakili titik-titik data
telah diperoleh.
x
n
152
10 15.2
y
n
186
10 18.6
C. Metode Kuadrat Terkecil Untuk Kurva Linier
Bentuk paling sederhana dari regresi kuadrat terkecil adalah apabila kurva yang
mewakili titik-titik data merupakan garis lurus, sehingga persamaannya :
g(x) = a + bx
Dalam hal ini, a0 = a dan a1 = b.
Contoh :
Tentukan persamaan garis yang mewakili data berikut
x 4 6 8 10 14 16 20 22 24 28
y 30 28 22 28 14 22 16 8 20 8
Penyelesaian :
Tabel 2. Hitungan regresi linier
No xi yi xi yi Xi2
1 4 30 120 16
2 6 18 108 36
3 8 22 176 64
4 10 28 280 100
5 14 14 196 196
6 16 22 352 256
7 20 16 320 400
8 22 8 176 484
9 24 20 480 576
10 28 8 224 784
∑ 152 186 2432 2912
Nilai rata-rata x dan y :
xF
ȳ
nx iyi x i y i
nx i2
x i 2
10 2432 152 186
10 2912 1522
3952
6016
Persamaan garis yang mewakili titik-titik data adalah :
Y = a + bx
Dengan :
b
a = ȳ - b xF = 18.6 + 0.6569 x 15.2 = 28.5849
Jadi persamaan garis adalah :
y = 28,5849 – 0,6569 x
Penggambaran titik-titik data pada sistem koordinat x-y diberikan dalam
Gambar 2, yang dapat diwakili oleh garis lurus.
Gambar 2. Sebaran titik-titik data pada sistem koordinat
D. Linierisasi Kurva Tidak Linier
Sering dijumpai bahwa sebaran titik-titik pada sistem koordinat mempunyai
kecenderungan ‘trend’ yang berupa kurva lengkung, sehingga persamaan pada
0.6569
poin C tidak dapat digunakan. Agar persamaan regresi linier dapat digunakan
untuk mempresentasikan kurva lengkung, maka perlu dilakukan transformasi
koordinat sedemikian sehingga sebaran titik data bisa dipresentasikan dalam
kurva linier.
Gambar 3. Titik data didekati dengan garis lurus dan lengkung
Contoh :
Tentukan persamaan kurva lengkung yang mewakili data berikut :
x 1 2 3 4 5
y 0,5 1,7 3,4 5,7 8,4
1. Transformasi log
Misalkan persamaan kurva yang dicari :
y = axb
transformasi dengan fungsi log :
log y = log axb
log y = log a + b log x
Dilakukan transformasi berikut :
p = log y B = b
A = log a q = log x
Sehingga persamaan di atas dapat ditulis dalam bentuk :
logx i
n
2.0971
5 0.4158
logy i
n
2.1411
5 0.42822
nq ipi q i p i
nq i2
q i 2
5 1.4240( ) 2.0791( ) 2.1411( )
5 1.1692( ) 2.07912
1.7572
p = A + B q
Tabel 3. Hitungan regresi linier dengan transformasi log
No xi yi qi = log xi pi = log yi qipi qi2
1
2
3
4
5
1
2
3
4
5
0,5
1,7
3,4
5,7
8,4
0
0.3010
0.4771
0,6020
0,6990
-0,3010
0,2304
0,5315
0,7559
0,9243
0
0,0693
0,2536
0,4550
0,6461
0
0,0906
0,2276
0,3624
0,4886
∑ 15 19,7 2,0791 2,1411 1,4240 1,1692
Dari tabel didapat parameter berikut :
qF
pF
Koefisien B :
B
Koefisien A :
A = p – B q = 0,42822 – 1,7572 x 0,4158 = -0,3024
Persamaan transformasi :
p = -0,3024 + 1,7572 q
Karena : A = log a -0,3024 = log a
a = 0,4984
B = b b = 1,7572
Persamaan yang dicari : y = 0,4984 x1,7572
q i
n
15
5 3
p i
n
4.93
5 0.986
nq ipi q i p i
nq i2
q i 2
5 21.6425( ) 15 4.93( )
5 55( ) 152
34.2625
50 0.68525
2. Transformasi ln
Misalkan persamaan kurva : y = aebx
Transformasi dengan fungsi ln :
ln y = ln aebx
= ln a + ln aebx
ln y = ln a + b x
Dilakukan transformasi berikut :
p = ln y A = ln a
q = x B = b
Sehingga persamaan di atas dapat ditulis dalam bentuk :
p =A + B q
Tabel 4. Hitungan regresi linier dengan transformasi ln
No xi = qi yi qi2 = xi
2 pi = ln yi qipi
1
2
3
4
5
1
2
3
4
5
0,5
1,7
3,4
5,7
8,4
1
4
9
16
25
-0,6931
0,5306
1,2238
1,7405
2,1282
-0,6931
1,0612
3,6714
6,962
10,641
∑ 15 19,7 55 4,93 21,6425
Dari tabel 4 didapat beberapa parameter berikut :
qF
pF
Koefisien B :
B
Dt2
D2
Dt2
Dt2
D2
Dt2
40.132 0.00238
40.132 0.99997
Koefisien A :
A = p – B q = 0,986 – 0,68525 x 3,0 = -1, 06975
Persamaan transformasi : p = -1, 06975 + 0,68525 q
A = ln a -1, 06975 = ln a a = 0,3431
B = b b = 0,68525
Persamaan yang dicari : y = 0,3431 e0,68525 x
Untuk memilih salah satu dari kedua hasil yang terbaik, dihitung nilai koefisien korelasi :
r
Dt = ∑ (yi – ȳ)2
D = ∑ (yi – a0 - a1 x)2
Tabel 5. Hitungan koefisien korelasi
No xi yi
Transformasi log Transformasi ln
g(xi) D2 Dt2 g(xi) D2 Dt
2
1
2
3
4
5
1
2
3
4
5
0,5
1,7
3,4
5,7
8,4
0,4984
1,6848
3,4354
5,6953
8,4296
0,000003
0,000231
0,00125
0,000022
0,000876
11,8336
5,0176
0,2916
3,0976
19,8916
0,8635
1,3563
2,6912
5,3401
10,5963
0,03367
0,11813
0,50240
0,12953
4,82373
11,8336
5,0176
0,2916
3,0976
19,8916
∑ 0,00238 40, 132 ∑ 5,00746 40, 132
Nilai r untuk transformasi log :
r
Dt2
D2
Dt2
40.132 5.60746
40.132 0.92751
n
x i
x i2
x i
x i2
x i3
x i2
x i3
x i4
a0
a1
a2
y i
x iyi
x i2
yi
Nilai r untuk transformasi ln :
r
Koefisien korelasi r transformasi log lebih besar dari pada transformasi ln,
sehingga transformasi log lebih baik.
E. Regresi Polinomial
Persamaan polynomial order r :
y = a0 + a1x + a2x2 + …… + arxr
Jumlah kuadrat kesalahan :
D2 = ∑ (yi – (a0 + a1 xi + a2xi2 + …… + arxir))2
Contoh :
Cari persamaan kurva polynomial order dua dari data :
xi 0 1 2 3 4 5
yi 2,1 7,7 13,6 27,2 40,9 61,1
Persamaan polynomial order 2 :
g(x) = a0 + a1x + a2x2
Ei = yi + g(x)
Ei2 = ∑ (yi - a0 - a1x - a2x2)2
D2 = ∑ Ei2
Dideferensial D2 terhadap tiap koefisien polynomial kemudian disamadengankan nol menghasilkan bentuk :
Tabel 6. Hitungan regresi polinomial order dua
No xi yi xi2 xi
3 xi4 xiyi Xi
2yi
1
2
3
4
5
6
0
1
2
3
4
5
2,1
7,7
13,6
27,2
40,9
61,1
0
1
4
9
16
25
0
1
8
27
64
125
0
1
16
81
256
625
0
7,7
27,2
81,6
163,6
305,5
0
7,7
54,4
244,8
654,4
1527,5
152,6 55 225 979 585,6 2488,8
Diperoleh sistem persamaan :
6a0 + 15a1 + 55a2 = 152,6
15a0 + 55a1 + 225a2 = 585,6
55a0 + 225a1 + 979a2 = 2488,8
Penyelesaian persamaan :
a2 = 1,860714
a1 = 2,359286
a0 = 2,478571
Persamaan kurva :
y = 2,478571 + 2,359286 x + 1,860714 x2
F. Regresi Linier Dengan Banyak Variabel
Untuk y sebagai fungsi linier terhadap x1 dan x2 :
y = a0 + a1x1 + a2x2
Jumlah kuadrat kesalahan :
D2 = ∑ (yi – (a0 + a1 x1,i + a2x2,i))2
2 y( i a0 a1 x1 i a2 x2 i 0
0
0
2 x 1 i yi a0 a1 x1 i a2 x2 i
2 x 2 i yi a0 a1 x1 i a2 x2 i
n
x 1 i
x 2 i
x 1 i
x 1 i 2
x 1 i x2 i
x 2 i
x 1 i x2 i
x 2 i 2
a0
a1
a2
y i
x 1 i yi
x 2 i yi
Variable yang diamati merupakan fungsi dari 2 variabel. Kuadrat kesalahan :
∂D2
∂a0
∂D2
∂a1
∂D2
∂a2
Persamaan tersebut dapat ditulis dalam bentuk berikut :
n a0 + ∑ x1,i a1 + ∑ x2,i a2 = ∑ yi
∑ x1,i a0 + ∑ x1,i2 a1 + ∑ x1,i x2,i a2 = ∑ x1,i yi
∑ x2,i a0 + ∑ x1,i x2,i a1 + ∑ x2,i2 a2 = ∑ x2,i yi
Dalam notasi matriks :
Contoh :
Buat persamaan kurva yang mewakili data berikut :
x1 0 2 2,5 1 4 7
x2 0 1 2 3 6 2
y 5 10 9 0 3 27
Tabel 7. Hitungan regresi linier dengan banyak variable
No y x1 x2 x12 x2
2 x1x2 x1y x2y
1
2
3
5
10
9
0
2
2,5
0
1
2
0
4
6,25
0
1
4
0
2
5
0
20
22,5
0
10
18