Upload
others
View
20
Download
0
Embed Size (px)
Citation preview
PENDEKATAN REGRESIPENDEKATAN REGRESI SEMIPARAMETRIK UNTUK PROSES PENGOLAHAN LIMBAHPROSES PENGOLAHAN LIMBAH PABRIK GULA ASEMBAGUS SITUBONDOSITUBONDONiarfie Radythia1306100045
Dosen Pembimbingose e b b gIr. Mutiah Salamah Chamid, M.KesJerry Dwi TP, S.Si, M.Si
Latar Belakang
Masalah yang sering muncul dalam regresi adalah• Masalah yang sering muncul dalam regresi adalahtidak semua variabel penjelas dapat didekati denganpendekatan parametrik
• Diperlukan suatu pendekatan yang tidak terikatdengan asumsi bentuk kurva regresi tertentu danmemberikan fleksibilitas yang besar pendekatanmemberikan fleksibilitas yang besar, pendekatansemacam ini dinamakan regresi nonparametrik.
• Dengan menggabungkan kedua pendekatan ini akandi dapatkan suatu model regresi semiparametrik.
P l dil k k d l h b d• Perlunya dilakukan pendugaan pola hubungan padaproses pembentukan limbah pabrik gula AsembagusSitubondo
• Dalam penelitian Rudianto (1997) terdapat lima variabel prediktor serta variabel respon adalah beratlimbah/blotong Dengan menggunakan metode Alllimbah/blotong. Dengan menggunakan metode All Possible Regression didapatkan bahwa model regresi Y dengan X2 dan X3 memiliki nilai R2 yang kecil yaitu sebesar 50.9
Permasalahan
Bagaimana mendapatkan model semiparametrik g p ppada proses pembentukan limbah pabrik gula Asembagus Situbondo
TujuanTujuanUntuk mendapatkan model semiparametrik pada p p pproses pembentukan limbah pabrik gula Asembagus Situbondo
ManfaatMemberikan pemodelan alternatif pada prosespembentukan limbah pabrik gula Asembagus Situbondo
it d t d i i t ikyaitu dengan metode regresi semiparametrik
Batasan PermasalahanBatasan PermasalahanData yang digunakan adalah data dari penelitian Rudianto( )(1997), dengan menggunakan satu variabel respon yaituvariabel berat limbah dan dua variabel prediktor yaituvariabel berat flokulan dan variabel berat sulfur.
Metode yang digunakan adalah regresi semiparametrikdengan basis polinomial truncateddengan basis polinomial truncated.
Tinjauan Pustaka
→ Regresi Parametrik→ Regresi ParametrikRegresi parametrik merupakan metode yang digunakan untuk mengetahui pola hubungandigunakan untuk mengetahui pola hubunganantara variabel respon dan prediktor yang diketahui bentuk kurva regresinya. Secarag yumum bentuk regresi parametrik linear digambarkan sebagai berikut (Eubank, 1988):
γ ε= +y X
→ Regresi Nonparametrik→ Regresi NonparametrikRegresi nonparametrik adalah metode yang digunakan untuk mengetahui pola hubungandigunakan untuk mengetahui pola hubunganantara variabel respon dan variabel prediktoryang tidak diketahui bentuk fungsinya. Secaray g g yumum bentuk regresi nonparametrikdigambarkan sebagai berikut:
( )f i( )i i iy f t ε , i 1, 2, , n= + = …
→ Regresi Semiparametrik→ Regresi SemiparametrikModel semiparametrik dikembangkan olehGreen Jennison dan Scheult (1985); EngelGreen, Jennison dan Scheult (1985); Engel, Granger, Rice, Weiss (1986); Heckman (1986); Eubank (1988); Wahba (1990); Chen dan Shiau( ) ( )(1994); Shi dan Li (1994); He dan Shi (1996); Ruppert, Wand, dan Caroll (2003). Model inidi k b idirumuskan sebagai:
( )' , 1, 2,...,i i i iy x f t i nγ ε= + + =
→ Spline dalam Regresi Nonparametrik→ Spline dalam Regresi NonparametrikSecara umum, fungsi spline berorde k-1 adalahsebarang fungsi yang dapat disajikan dalamsebarang fungsi yang dapat disajikan dalambentuk:
( )k 1 h
i k 1S t t δ (t ξ )−
−+∑ ∑( ) i k 1i j j
i 1 j 1
S t α t δ (t ξ )+= =
= + −∑ ∑
Limbah Pabrik Gula• Limbah padat yang dihasilkan dalam proses pembuatan
gula di pabrik gula Asembagus Situbondo secara ringkasg p g g gdijelaskan bahwa terdapat enam stasiun dalam tahappembuatan gula
• Stasiun tersebut bila diurutkan dari awal proses adalahdimulai dari stasiun penggilingan, stasiun pemurnian, p gg g , p ,stasiun penguapan, stasiun masakan, stasiun putarandan terakhir stasiun finishing
• Akan tetapi, limbah padat sudah dapat dikeluarkan padatahap pemurnian, sehingga kotoran-kotoran dari bahantahap pemurnian, sehingga kotoran kotoran dari bahandasar tebu tidak mengganggu proses selanjutnyasampai diperoleh hasil akhir berupa gula
Metode Penelitian
→ Identifikasi VariabelData yang digunakan pada penelitian sebelumnyaData yang digunakan pada penelitian sebelumnyaadalah terdiri dari satu variabel respon , yaitu beratlimbah /blotong (Y), dan lima variabel prediktor yaituberat kapur tohor (X1), berat sulfur (X2), berat flokulan(X3), berat tebu (X4) dan berat fosfat (X5).
Variabel berat sulfur dan berat flokulan akan di dekatidengan metode regresi semiparametrik, maka variabel
d i b l dikt di k d lrespon dan variabel prediktor yang digunakan dalampenelitian ini:
Y = berat limbah/blotongX1 = berat flokulan (kg)X2 = berat sulfur (kg)
→ Metode AnalisisLangkah-langkah dalam menganalisis data adalahLangkah langkah dalam menganalisis data adalahsebagai berikut :
• Deskripsi data untuk melihat pola perilaku hubungan dari data.
• Pemilihan parameter penghalus optimal dengan metodeGCVGCV.
• Memodelkan data limbah pabrik gula AsembagusSitubondo dengan pendekatan regresi semiparametrik.
• Pemilihan model spline optimal yang dilakukan dengant d G li d C V lid ti (GCV)metode Generalized Cross Validation (GCV).
• Melakukan analisis diagnostik residual.• Melakukan pengujian signifikansi koefisien regresi• Melakukan pengujian signifikansi koefisien regresi
secara simultan dan individu.
Analisis dan Pembahasan
Pl t Y(b t li b h) d X (b t fl k l )
Deskripsi Data
Plot Y(berat limbah) dan X1(berat flokulan)
800
700
Y
600
500
400
X29876543
Plot Y(berat limbah) dan X1(berat flokulan)80
080
0
pon
070
0
pon
070
0
resp
500
600
resp
500
600
3 4 5 6 7 8 9
400
3 4 5 6 7 8 9
400
paramparam
Plot Y(berat limbah) dan X2(berat sulfur)
800
700
Y
600
500
X1700600500400300200
400
X1
Plot Y(berat limbah) dan X2(berat sulfur)
800
700
Y
600
500
700600500400300200
400
Sulfur
Nilai GCV dengan dua titik knots
Orde titik knots GCV3 4 4,8 5809 489
g
3 , 5809,4893 4 4,9 5809,4893 4 5,0 5809,4893 4 5 1 5813 1853 4 5,1 5813,1853 4 5,2 5822,2333 4 5,3 5834,733
4 5 43 4 5,4 5849,5763 4 5,5 5865,9593 4 5,6 5883,1593 4 5,7 5900,3893 4 5,8 5916,6984 4 4,8 5527,9474 5527,947
4 4 4,9 5527,937*4 4 5 5527,9454 4 5 1 5528 2224 4 5,1 5528,2224 4 5,2 5529,6754 4 5,3 5532,6834 4 5,4 5537,3834 4 5,5 5543,9064 4 5,6 5552 4734 5552,4734 4 5,7 5563,4344 4 5,8 5577,314 4 5 9 5594 8464 4 5,9 5594,8464 4 6,0 5617,109
*GCV Minimum
Model semiparametrik dengan dua titik knots :
30 1 1 1 1 1
2 32 3 4 ( 4)Y X X X Xγ γ γγ γ += + + + + − +0 1 1 1 1 12 3 4
53
1 6 2
( 4)
( 4,9)
Y X X X X
X X
γ γ γ
γ
γ γ
γ ε+
+
+ + + + +
− + +
291213 64 3633 2 1949 03
Dengan program S-Plus diperoleh estimasi model sebagai berikut:
21 1
3 31 1
91213,64 73633,27 19497,03
1703,562 2092,643( 4)
Y X X
X X +
= − + − +
− − +3
1 2406,2007( 4,9) 0,5659328X X+− +
2 63,99%R =
• Sulfur dan berat limbah pabrik gulamempunyai hubungan linier. p y g
• Sedangkan hubungan antara berat limbahSedangkan hubungan antara berat limbahpabrik gula dan berat flokulan berupapiecewise polynomials.
piecewise polynomials• Untuk :1X 4<Untuk :
U t k
1X 4<2 3
1 1 191213,64 73633,27X 19497,03X 1703,562X− + − +
• Untuk :14 X 4,9≤ <2 3
1 1 191213,64 73633,27X 19497,03X 1703,562X− + − + −
• Untuk :1X 4 , 9≥( )312092,643 X 4
+−
Untuk :1X 4 , 9≥
( ) ( )
2 31 1 1
3 3
91213,64 73633,27X 19497,03X 1703,562X
2092 643 X 4 406 2007 X 4 9
− + − + −
( ) ( )1 12092,643 X 4 406,2007 X 4,9+ +
−+−
Model Pembanding
• Dipilih titik knots 4 dan 5,8 pada orde ketiga (splinekuadratik) dengan nilai GCV sebesar 5916,698) g ,
• Nilai GCV yang besar mengindikasikan model semiparametrik yang kurang sesuai untuk
j l k d t b t li b h lmenjelaskan data berat limbah gula• Model regresi semiparametrik dengan titik-titik knots
ini menghasilkan nilai koefisien determinasi yang e g as a a oe s e de e as ya grelatif kecil yaitu 55,91%
Nilai P-value lebih dari 0,10 yaitu > 0,150Diagnostik Residual
99
Probability Plot of residualNormal
95
90
80
Mean
>0.150
-0.0001273StDev 57.98N 30KS 0.079P-Value
Perc
ent 70
60504030
2020
10
5
1
residual150100500-50-100-150
Scatterplot of residual vs fits
100
Scatterplot of residual vs fits
sidu
al
50
0
res
-50
-100
fits850800750700650600550500
-150
fits
Uji Signifikansi Koefisien Regresi
H0 : γ0 = γ1 = γ2 = γ3 = γ4 = γ5 = γ6= 0H1 : paling sedikit ada satu γ i ≠ 0
SK db JK KT Fhit Ftabel
Regresi 6 173292 28882 6,814861 2,047227
Galat 23 97476,08 4238,09Galat 23 97476,08 4238,09
Total 29 270768,8
H 0 H ≠ 0• H0 : γ0 = 0 , H1 : γ0 ≠ 0• H0 : γ 1 = 0 , H1 : γ 1 ≠ 0
H 0 H ≠ 0• H0 : γ2 = 0 , H1 : γ2 ≠ 0• H0 : γ3 = 0 , H1 : γ3 ≠ 0• H0 : γ4 = 0 , H1 : γ4 ≠ 0• H0 : γ5 = 0 , H1 : γ5 ≠ 0• H0 : γ6 = 0 , H1 : γ6 ≠ 0
Koefisien Estimasi StDev t-hitung
γ0 -91213,64 42188,6 -2,16205
γ 1 73633 27 34152 12 2 156038γ 1 73633,27 34152,12 2,156038
γ2 -19497,03 9089,539 -2,145
γ 1703 562 797 1022 2 137194γ3 1703,562 797,1022 2,137194
γ4 -2092,64 991,9244 -2,10968
406 2007 204 9328 1 982116γ5 406,2007 204,9328 1,982116
γ6 0,565933 0,15173 3,729873
Nilai tabel t : 1,713872
Kesimpulan dan SaranKesimpulan
Berat limbah pabrik gula Asembagus Situbondodapat dimodelkan dengan model semiparametriksebagai berikut :
291213 64 3633 2 1949 03 21 1
3 31 1
91213,64 73633,27 19497,03
1703,562 2092,643( 4)
Y X X
X X +
= − + − +
− − +3
1 2406,2007( 4,9) 0,5659328X X+− +
Model semiparametrik yang didapatkan memiliki nilaikoefisien determinasi yang lebih baik yaitu 63 99%koefisien determinasi yang lebih baik yaitu 63,99% dibandingkan dengan nilai koefisien determinasipada model parametrik pada penelitian Rudianto(1997) it 50 9%(1997) yaitu 50,9%
Saran
Pada penelitian ini hanya meneliti dua variabelprediktor yang dibuang pada model parametrik yaituprediktor yang dibuang pada model parametrik yaituvariabel berat sulfur dan variabel berat flokulan, maka untuk penelitian selanjutnya diharapkanmemodelkan semua variabel prediktor yang mempengaruhi berat limbah pabrik gula denganmenggunakan model semiparametrikmenggunakan model semiparametrik
Daftar Pustaka
Chen, H. dan Shiau, J.J.H.(1994). Data Driven Efficient Estimators for a Partially Linear Model The Annals of Statistics 22 211-237Partially Linear Model. The Annals of Statistics, 22, 211-237
Craven an Wahba, G.(1979). Smoothing Noisy Data With SplineFunction: Estimating The Correct Degree of Smoothing by The Method of Generalized Cross Validation, Numer. Math, 31, 377-403.,
Engle, R.L., Granger, C., Rice, J., dan Weiss, A.(1986). SemiparametricEstimates of Relation Between Weather and Electricity Sales, Journal of The American Statistical Association, 81, 310-320.
Eubank, R. (1988). Spline Smoothing and Nonparametric Regression. Marcel dekker, New York.
Green, P., Jennison, C., Scheult, A.(1985). Analysis of field Experiments by Least Squared Smoothing Journal of The RoyalExperiments by Least Squared Smoothing, Journal of The Royal Statistics Society, Ser. B, 47, 299-314.
He, X. dan Shi, P.(1996). Bivariate Tensor Product B-Spline in Partly Linear Models, Journal of Multivariate Analysis, 58, 162-181., y , ,
Heckman N (1986) Spline Smoothing in a Partly Linear ModelsHeckman, N.(1986). Spline Smoothing in a Partly Linear Models, Journal of Royal Statistics Society, Ser. B, 48, 244-248.
Kohn, R.(1991). The Performance of Cross Validation and Maximum Likelihood Estimators of Spline Smoothing Parameters. Journal of p gAmerican Statistics Association, 86, 1042-1050.
Li, K.C.(1986). Asymtotic Optimality of C1 and Generalized Cross Validation in Ridge Regression With Application to SplineS thi A St ti t 14 1101 1112Smoothing, Ann.Statist., 14, 1101-1112.
Rudianto, N. (1997). Implementasi Gibbs Sampler dan Bayesian Inference dalam Pemilihan Model Terbaik Limbah Pabrik GulaAsembagus Situbondo Tugas Akhir ITS SurabayaAsembagus Situbondo, Tugas Akhir, ITS, Surabaya.
Rupert, D, Wand, M.P, and Caroll, R.J. (2003). SemiparametricRegression, New York: Cambridge University.
Shao J (1993) Linear Model Selection by Cross Validation Journal ofShao, J.(1993). Linear Model Selection by Cross Validation. Journal of The American Statistical Assosiation, 88, 486-494.
Shi, P., dan Li, G. (1994). On The Rate Convergence of :Minimum L1-Norm” Estimates in a partly Linear Model, Communication in p yStatistics, Theory and Methoda, 23, 175-196.
Venter, J.H., dan Snyman, J.L.J.(1995). A note on the Generalized Cross Validation Criterior in Linear Model Selection, Biometrica, 82 215 21982, 215-219.
Wahba, G.(1985). A Comparison of GCV and GML for Choosing the Smoothing Parameter in the Generalized Spline Smoothing Problem Journal The Annals of Statistics 13 1378-1402Problem, Journal The Annals of Statistics, 13, 1378 1402.
Wahba, G. (1990). Spline Models for Observation Data, SIAM, Pensylvania.