15
วารสารรามคาแหง สาขาวิทยาศาสตร์และเทคโนโลยี ปีที่ 30 ฉบับที่ 2 67 ข้อตกลงการถดถอยและกระบวนการวิเคราะห์การถดถอย (Regression assumption and Regression process) มนตรี พิริยะกุล 1 บทคัดย่อ การวิเคราะห์การถดถอยคือวิทยาสถิติที่ใช้ศึกษาความเชื่อมโยงระหว่างตัวแปรตามซึ ่งเป็น เป้าหมายของการศึกษากับตัวแปรอิสระซึ ่งเป็นปัจจัยสาเหตุที่สามารถควบคุมหรืออธิบายความผัน แปรของตัวแปรตามโดยมุ่งประโยชน์ 2 ประการคือเพื่อการพยากรณ์และ/หรือศึกษาความสัมพันธ์ เชิงสาเหตุ การศึกษาด้วยวิธีวิทยานี ้จาเป็นต ้องกาหนดข้อตกลงหลายประการเพื่อควบคุมความ เคลื่อนไหวของตัวแปรส ่วนเหลือรวมทั ้งควบคุมความเกี่ยวข้องกันระหว่างตัวแปรอิสระ ด้วยเหตุนี การศึกษาตามวิธีวิทยานี ้จึงจาเป็นต ้องตรวจสอบความเป็นจริงของข้อตกลงว่าข้อมูลเชิงประจักษ์ สอดคล้องกับข้อตกลงหรือไม่ หากตรวจพบว่าไม่สอดคล้องเราจาเป็นจะต้องแก้ไขให้สอดคล้องมิ เช่นนั ้นผลการวิจัยจะผิดพลาดและนาสู่การนาไปใช้กาหนดนโยบายที่ผิดพลาดด้วย Abstract Regression analysis is a powerful statistical methodology aims at linking between explained variables and their target variable in order to predict it or to explain its causes of variation. There are several assumptions for fulfilling this kind of analysis and needed for detections and also corrections if empirical analysis revealed that data and assumptions were not congruent, else the finding would miss leading the implications followed. คาสาคัญ: สมการถดถอย ข้อตกลงการถดถอย ภาวะความเป็ นสมการเชิงเส้น ภาวะร่วมเส้นตรงพหุ autocorrelation heteroscedasticity Key word: Regression analysis, regression assumption, linearity, multicollinearity, autocorrelation, heteroscedasticity 1 ภาควิชาสถิติ คณะวิทยาศาสตร์ มหาวิทยาลัยรามคาแหง

(Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2

67

ขอตกลงการถดถอยและกระบวนการวเคราะหการถดถอย (Regression assumption and Regression process)

มนตร พรยะกล 1

บทคดยอ การวเคราะหการถดถอยคอวทยาสถตทใชศกษาความเชอมโยงระหวางตวแปรตามซงเปนเปาหมายของการศกษากบตวแปรอสระซงเปนปจจยสาเหตทสามารถควบคมหรออธบายความผนแปรของตวแปรตามโดยมงประโยชน 2 ประการคอเพอการพยากรณและ/หรอศกษาความสมพนธเชงสาเหต การศกษาดวยวธวทยานจ าเปนตองก าหนดขอตกลงหลายประการเพอควบคมความเคลอนไหวของตวแปรสวนเหลอรวมทงควบคมความเกยวของกนระหวางตวแปรอสระ ดวยเหตนการศกษาตามวธวทยานจงจ าเปนตองตรวจสอบความเปนจรงของขอตกลงวาขอมลเชงประจกษสอดคลองกบขอตกลงหรอไม หากตรวจพบวาไมสอดคลองเราจ าเปนจะตองแกไขใหสอดคลองมเชนนนผลการวจยจะผดพลาดและน าสการน าไปใชก าหนดนโยบายทผดพลาดดวย

Abstract Regression analysis is a powerful statistical methodology aims at linking between explained

variables and their target variable in order to predict it or to explain its causes of variation. There are several assumptions for fulfilling this kind of analysis and needed for detections and also corrections if empirical analysis revealed that data and assumptions were not congruent, else the finding would miss leading the implications followed. ค าส าคญ: สมการถดถอย ขอตกลงการถดถอย ภาวะความเปนสมการเชงเสน ภาวะรวมเสนตรงพห autocorrelation heteroscedasticity Key word: Regression analysis, regression assumption, linearity, multicollinearity, autocorrelation, heteroscedasticity

1 ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยรามค าแหง

Page 2: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2 68

ความน า การวเคราะหการถดถอยคอกระบวนการทางสถตเพอวเคราะหความสมพนธระหวางตวแปร โดยมเปาหมาย 2 ประการคอเพอพยากรณคาของตวแปรตามและเพอศกษาปจจยสาเหตของตวแปรตาม ผลการศกษาน าไปสการใชประโยชนทตางกนคอ ในกรณศกษาเพอการพยากรณเราจะน าผลการพยากรณไปใชก าหนดคาของตวแปรตามเมอตวแปรอสระมคาอนตามก าหนด หรอเพอก าหนดคาอนาคตของตวแปรเมอตวแปรอสระมคาอนทคาดวาจะเปนไปไดในภายหนา เชน การพยากรณยอดขายซงจะถกน าไปใชสนบสนนการตดสนใจดานการผลต ดานการขาย ดานการสงเสรมการขาย คาพยากรณจ านวนนกทองเทยวน าสการบรหารการทองเทยวและบรหารทรพยากรการทองเทยว ในกรณศกษาตามแนวทางความสมพนธเชงสาเหตน าไปสการก าหนดนโยบายลงไปทตวแปรอสระเพอควบคมใหคาตวแปรตามเปนไปตามความตองการ

สมการถดถอยและขอตกลงการถดถอย เนองจากในการวเคราะหการถดถอยนนมตวแปรอสระทใชควบคมหรออธบายตวแปรตามไดมากมายหลายตว ท งท เปนไปตามทฤษฎและวรรณกรรมและทเปนไปตามเหตผลและสถานการณเชงประจกษ ในจ านวนนจะมตวแปรจ านวนมากทเราไมรจกหรอรจกแตไมมขอมล หรอหาขอมลไมได หรอไมอาจหา proxy ทเหมาะสมมาใชแทน หรอตวแปรมความเปนนามธรรม หรอเปนขอมลอนกรมเวลาแตบนทกไวดวยนยามเวลาตางกน หรอไมบนทกขอมลอยางตอเนอง ตวแปรเหลานแมไมปรากฏในสมการถดถอยแตกยงคงแอบสงอทธพลตอตวแปรตาม นอกนยงมความคลาดเคลอนจากการวดอกดวย ดวยเหตนเราจงรวมตวแปรดงกลาวทนอกเหนอจากทก าหนดไวในสมการรวมทงความคลาดเคลอนจากการวดไวในทเดยวกน เรยกวา residual หรอ disturbance term ใชสญลกษณ หรอ u ตวแปร u จงมสวนประกอบทหลากหลายมากมายยากแกการควบคมใหอยนงๆ ทงไมทราบทศทางหรอปรมาณทจะพงมในแตละวาระในขอมลอนกรมเวลา (time series) หรอในแตละหนวยวเคราะหในขอมลภาคตดขวาง (cross section) ก าหนดให Y = ตวแปรตาม (dependent variable หรอ target variable หรอ endogenous variable) ก าหนดให Xj ; j =1 ,2 ,…, k คอตวแปรอสระทท าหนาทอธบายหรอคาดคะเนความผนแปรของตวแปรตาม (เรยกวา explained variable หรอ predictor หรอ independent variable หรอ exogenous variable)

Page 3: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2

69

ก าหนดให βj ; j =1,2 ,…, k คอน าหนกของ Xj ทมตอ Y คอ เรยกวา partial regression

weight หรอ partial regression coefficient ก าหนดให u คอสวนเหลอหรอตวกอกวน

ดงนนสมการถดถอยเชงเสนคอสมการความสมพนธเชงสาเหตระหวาง Xj’s กบ Y ดงนคอ + โดยท หมายถงอตราการเปลยนแปลงคาของตวแปร Y

เมอตวแปร Xj’s เปลยนคาไป 1 หนวย

กระบวนการวเคราะหการถดถอย เนองจากการพฒนาตวประมาณคาในสมการถดถอยด าเนนการตามขอตกลงการถดถอย

ทงนการตกลงกมใชท าไดตามใจ แตเปนไปตามเหตผลดงไดกลาวมาแลว ดงนนผลการวเคราะหการถดถอยในขนปฏบตจงตองสอดคลองกบขอตกลงมเชนนนผลการศกษาจะคลาดเคลอนและน าสการสรปผลผดพลาด (miss-leading) ซงหากน าผลการศกษาไปใชในระดบนโยบายหรอในระดบปฏบตการกอาจกอใหเกดความเสยหายได กระบวนการวเคราะหการถดถอยด าเนนการดงภาพ ในภาพจะแสดงขนการวเคราะหทเรมจาการประมาณคาสมการถดถอยและทดสอบสมมตฐานซงเปนพนฐานหรอกาวแรกของการวเคราะหดวยวธวทยาสถตน หามหยดทกาวน ใหด าเนนการตอเนองจนจบเพอตรวจสอบและแกปญหาขอตกลงการถดถอยถาตรวจพบทกขอตกลง ในภาพจะแสดงรายละเอยดเบองตน ขอความตอจากนไปจะเปนรายละเอยดเรยงตามขอตกลง ทกอยางทจะอานพบตอไปอาจไมไดแสดงไวในภาพ

Page 4: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2 70

1. Linearity

ขอตกลงนคอตกลงวา E(YX’s) = หรอสมการถดถอยคอสมการทเปนทางเดนจดของคาเฉลยของตวแปรตาม (Y) ณ คาเฉพาะของตวแปรอสระ X’s หากขอตกลงไมเปนจรงคาพยากรณของ Y (ทจรงคอคาพยากรณของ E(YX) จะคลาดเคลอน

วธตรวจสอบขอตกลงความเปนสมการเชงเสน สามารถกระท าไดดงน 1) วธ RESET (Ramsey Regression Equation Specification Error Test) วธ นมงตรวจสอบวา

หากเพมเทอมตอไปนคอ ลงในสมการ

Page 5: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2 71

จะชวยอธบาย Y ไดดขนหรอไม ถาชวยใหดขนกแสดงวาสมการเดมมปญหา Miss-specification

วธด าเนนการเปนดงน

(1) วเคราะหสมการถดถอย แลวบนทกคา และ

เรยกวา ม df = n-(k+1)

(2) วเคราะหสมการถดถอย +u แลวบนทกคา เรยกวา ม df = n-(k+h+1) (3) สมมตฐานทตองการทดสอบคอ สถตทดสอบคอ

Fc =

ถาพบวา p-value ≤ .05 แสดงวามปญหา nonlinearity 2) กราฟความสมพนธระหวาง standardized residual กบ standardized predicted value ถา

พบวากราฟ (scatter plot) มแนวเปนเสนตรงขนานแกนนอนแสดงวาไมมปญหา nonlinearity ถาม

รปแบบ เชน เสนโคงหรอเสนแนวโนมแลดงวามปญหา nonlinearity

3) การใชกฎตายตว (rule of thumb) วธนใหดจากสวนเบยงเบนมาตรฐานของตวแปรตามกบของสวนเหลอ (e) ถาพบวา SD ของ e มคามากกวา SD ของ Y แสดงวามปญหา nonlinearity

4) ความเปลยนแปลงคณภาพของตวแบบ วธใหเพมตวแปรอสระทยกก าลงสงเขาไปในตวแบบคอเพม ลงในตวแบบแลววเคราะหสมการถดถอย ถาพบวาการเพมตวแปรดงกลาวลงในตวแบบมผลให R2 สงขนอยางเดนชดแสดงวาขอตกลง linearity ไมเปนจรง 2. ภาวะรวมเสนตรงพห (Multicollinearity)

ปญหาภาวะรวมเสนตรงพหเกดจากสถานการณทตวแปรอสระมความเกยวของกนมากเกนไป ผลทตามมาคอท าใหเราไมอาจแยกไดวาตวแปรอสระตวใดกนแนทมอทธพลตอตวแปรตาม และเนองจากตวแปรอสระมความเกยวของกนมากจงมผลให Det ( ซงมผลใหสมาชก

ของเมทรกซ มคาสง ผลกคอ tj = ตวแปรอสระจงไมมนยส าคญ

กนเปนสวนมากทง ๆ ทความจรงไมเปนเชนนน

Page 6: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2 72

วธตรวจสอบภาวะรวมเสนตรงพห ท าไดหลายวธดงน 1) พจารณาจากนยส าคญของตวแปรอสระ วธนพจารณางาย ๆ คอถามปญหาภาวะรวม

เสนตรงพหตวแปรอสระจ านวนมากหรอเกอบทงหมดจะไมมนยส าคญทงนเพราะคา t มแนวโนมทจะมคาสง เรองนหามปลอยใหผานไปเฉย ๆ เพราะขดแยงกบทฤษฎและวรรณกรรมของเรองนน

2) พจารณาจากเครองหมายของสมประสทธการถดถอย ถาพบวามเครองหมายผดจากทฤษฎหรอวรรณกรรมแสดงวาอาจเกดปญหาภาวะรวมเสนตรงพห เชน พบวาคาสมประสทธของความ เครยดในงานซงเปนตวแปรอสระมเครองหมายบวก ตวแปรตามคอความพงพอใจในงาน จะเหนวาไมนาจะเปนเชนนนเพราะควรจะมเครองหมายลบซงหมายความวายงพนกงานมความเครยดในงานสงมากเพยงใดความพงพอใจในงานกจะนอยลงมากเพยงนน

3) พจารณาจากความออนไหวของคาสมประสทธการถดถอย ถาเพมตวแปรอสระขนหรอลดตวแปรอสระลงกลบมผลใหสมประสทธการถดถอยเปลยนแปลงไปมากแสดงวาอาจมปญหาภาวะรวมเสนตรงพห

4) พจารณาจากความสอดคลองระหวาง กบ ผลการทดสอบท ง 2 ตองสอดคลองกน คอถา overall F-test คอ Ho: สรปวาตวแปรอสระทกตวมอทธพลตอตวแปรตาม หากผลจากการทดสอบสมมตฐานแบบ partial t-test คอ สรปวาทกตวแปรหรอเกอบทกตวแปรไมมอทธพลตอตวแปรตามกแสดงวาอาจมปญหาภาวะรวมเสนตรงพห

5) ถา det แสดงวาอาจมปญหาภาวะรวมเสนตรงพห 6) ในสมการ Xj = f(X1, X2, …, Xj-1, Xj+1,…, Xk) +u ; j = 1, 2, …, k นนถา มคาสงมากก

แสดงวา Xj ถกสรางขนมาจากตวแปรอสระตวอน โดยทวไปเรายอมให มคาไมเกน 0.90 แตกอาจผอนปรนไดถงไมเกน 0.95

7) จากขอ 6) เราสามารถพฒนาตวตรวจสอบเพมขนมาไดอก 2 ตวคอ

(1) Tolerancej = 1- ซงพบวาหาก มคาเทากบ 0.90 จะมผลให Tolerancej มคาเทากบ 0.10 ถา มคาเทากบ 0.95 จะมผลให Tolerancej มคาเทากบ 0.05 แปลวาถา Tolerancej มคานอยกวา 0.05 แสดงวาอาจมปญหาภาวะรวมเสนตรงพห

Page 7: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2

73

(2) VIFj = ซงพบวาหาก มคาเทากบ 0.90 จะมผลให VIFj มคาเทากบ 10 ถา

มคาเทากบ 0.95 จะมผลให VIFj มคาเทากบ 20 (VIF หมายถง Variance Inflation factor) แปลวาถา VIFj มคามากกวา 20 แสดงวาอาจมปญหาภาวะรวมเสนตรงพห

8) Eigen value and condition index โดยปกต Eigen value ควรมคาสง แตถามคาต ากไมควรมคาใกล 0 เนองจาก … = diag. [1, 2,…, k+1] ดงนนถา j 0 ; some j จะมผลให det เรยกวา near singularity มผลใหสมาชกของ มคาสงและ tj มคาใกล 0

จากคา Eigen เราสามารถตรวจสอบภาวะรวมเสนตรงพหไดจาก condition index ตอไปนคอ

(condition index)j = ; j=1, 2, …, k+1 โดยทถา (condition index)j > 0.30 แสดงวามปญหา

ภาวะรวมเสนตรงพหทตวแปรอสระ Xj โดยทวไปเราจะพจารณารวมกบ variance proportion (VP) คอถา (condition index)j > 0.30 และ VPj > 0.90 แสดงวามปญหาภาวะรวมเสนตรงพหทตวแปรอสระ Xj

9) พจารณาจากคาสหสมพนธเชงเสนระหวางตวแปรอสระคอถา rij > 0.80-0.85 แสดงวา

อาจมปญหาภาวะรวมเสนตรงพหทตวแปรอสระคนน โดยท rij =

วธแกปญหาภาวะรวมสนตรงพห สามารถกระท าไดดงน 1) ระมดระวงเรองการใชตวแปรหน (dummy variable) คออยาก าหนดใหใชตวแปรหนทกตว

ในขณะทในตวแบบมเทอมคงทอยดวย 2) เพมขอมล ถาสามารถกระท าได 3) แปลงคาตวแปรอสระเปนคาทปรบลบดวยคาเฉลย เรยกวา mean-centered variable หรอ

demean หรอแปลงเปนคามาตรฐาน (standardized variable) คอแปลง เปน หรอแปลง

เปน ; j= 1, 2,…, k

4) วเคราะหสมการถดถอยดวย Ridge Regression (RR) วธ RR เปนวธวเคราะหการถดถอยดวยการท าให det (XtX) มคาสงขนโดยการปรบคาของเมทรกซ = diag.[1, 2, …, k+1] ใหเปน = diag. [1+c , 2,+c, …, k+1 +c] คาคงท c เปนคาทผานการวนเวยนค านวณจนกระทงมผลให s2 มคาต าทสด

Page 8: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2 74

5) Principal Component Regression (PCR) วธนใชวธสรางตวแปรใหมทเกดจาก linear combination ของตวแปรอสระบางสวน และสรางตวแปรใหมเพมขนอกจากตวแปรอสระทเหลอและสรางเพมขนเรอย ๆ ตราบเทาทตวแปรใหมเปนอสระกบตวแปรทไดสรางไวกอนหนาน

6) Partial Least Square Regression (PLSR) วธนคลายวธ PCR แตกตางกนทวธพฒนา ทงวธ PCR และวธ PLSR จะสรางตวแปรใหมขนมาจากกลมตวแปรอสระเดมเรยกตวแปรใหมวาตวแปรแฝง (latent variable) ปญหาทเกดกคอปญหาการแปลผลเพราะตวแปรแฝงประกอบขนจากกลมตวแปรอสระท าใหไมอาจกลาวไดวาตวแปรตามไดรบผลกระทบจากตวแปรอะไร

7) ใชวธ Differencing หรอ Percentage change วธนใชไดกบขอมลอนกรมเวลาและมกเกดปญหา autocorrelation ตามมาดวยเสมอ

วธ differencing ใหด าเนนการดงนคอวเคราะหสมการถดถอย

วธ Percentage change ใหด าเนนการดงนคอวเคราะหสมการถดถอย

8) ทงตวแปรอสระทตรวจพบวากอใหเกดปญหาภาวะรวมเสนตรงพห วธนโดยปกตจะไม

คอยนยมใชเพราะตวแปรทถกตดทงอาจเปนตวแปรส าคญ ทจรงแลวตวแปรอสระทกตวมความ ส าคญดวยกนทงหมดเพราะมาตามวรรณกรรมเพยงแตตวใดมอทธพลมากกถอวาส าคญมาก การทตวแปรบางตวไมมนยส าคญกเพราะขอมลเชงประจกษยงไมสนบสนนทฤษฎหรอวรรณกรรมดงกลาว การตดสนใจทงตวแปรไปเองจงไมควรปฏบต 5. Stability of variance (homoscedasticity)

ขอตกลงนคอตกลงวา V(u) (ซงกคอ V(Y) นนเอง) ตองคงทเสมอไมวาเวลาจะเปลยนไปอยางไรหรอไมวาตวอสระจะมคาเพมขนหรอลดลงอยางไร

เราสามารถพสจนไดวา E( = (n-k-1) σ2 หรอ คอ s2 = คอคาประมาณ

ของ σ2 กรณนเปนสถานการณท σ2 คงท ซงหาก σ2 คงทเรายอมหาคาประมาณของ σ2 ได ในทางกลบกนหาก σ2 ไมคงทแตกลบแปรคาไปตามเวลาหรอแปรไปตามคาตวแปรอสระเปน

Page 9: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2

75

เชนในสมการ HB =a + b INC + u โดยท HB = household budget INC = household income พบวา u แปรคาไปตาม INC ท งนเพราะยงมตวแปรอกมากทอยภายนอกตวแบบ เชน จ านวนสมาชกครอบครว จ านวนผมเงนได จ านวนเดก อาชพ จ านวนรถ ลกษณะการครอบครองทอยอาศย ภมภาค และอน ๆ รวมกนอยในตวแปร u และสมพนธกบรายไดครอบครว ความผนแปรของ u จงแปรไปตามตวแปรเหลานไมคงทตามขอตกลง เรยกวา heteroscedasticity ผลกระทบจากเหตการณนคอ s2 มคาเอนเอยงคอต ากวาความเปนจรง ท าให t มคาสงกวาความเปนจรงและสงผลใหปฏเสธสมมตฐานหลกทง ๆ ทไมควรปฏเสธ (คอรบตวแปรอสระเอาไวทงทอาจไมมประโยชน) การตรวจสอบปญหา heteroscedasticity อาจกระท าไดหลายวธดงน

1) Levene’s test ใชทดสอบสมมตฐาน Ho: โดยท คอความผนแปรของ Y ในกลมตวอยางยอยท i ทเกดจากการแบงกลมคาสงเกตเปน p กลม และ

W = ˜ Fα, p-1, n-p โดยท = , =

และ Zij = และในททเปน เราสามารถใชเปน median และ trimmed mean ไดถาขอมลแจกแจงแบบ chi-square และแบบ Cauchy ตามล าดบ ทจรงคา F ดงกลาวกคอคา F จากตาราง one-way ANOVA 2) Goldfeld-Quandt test วธทดสอบนมขนตอนดงน (1) วเคราะหสมการถดถอย Y = β0+ +u แลวบนทกคา predict ( ) (2) เรยงล าดบคาสงเกตตามคาของ (ถอวา คอตวแทนของตวแปรอสระทงหมดเพราะ

= และใหตด central observation ทงไปประมาณ 25 % ท าใหแยกคาสงเกตเปน 2 กลมคอกลมทสอดคลองกบ คามากกบกลมทสอดคลองกบ คานอย (3) วเคราะหสมการถดถอย Y = β0+ +u กบคาสงเกตทง 2 ชด ไดคา MSE1 (คอ ) และ MSE2 (คอ )

(4) ค านวณหาคา Fc = ถาพบวา Fc > Ftab ใหสรปวามปญหา heteroscedasticity

3) Glejser test วธนมขอดคอใชรปแบบ heteroscedasticity เปนตวถวงน าหนกของ WLS ไดดวย ขนด าเนนการมดงน (1) วเคราะหสมการถดถอย Y = β0+ +u แลวบนทกคา residual (e) (2) วเคราะหสมการถดถอย e = mo + m1 ; c= -1,- โดยท Xj คอตวแปรทมผลใหความผนแปรไมคงท (เรยกวา inflator)

Page 10: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2 76

(3) ถา m1 มนยส าคญคอ m1 ≠ 0 แสดงวามปญหา heteroscedasticity ตามรปแบบนนเชนถาพบวา m1 ในสมการ e = mo + m1 มนยส าคญกใหสรปวามปญหา heteroscedasticity ตามรปแบบนคอ e = mo + m1 และใหใชรปแบบนใน WLS 4) Park test มขนตอนดงน (1) วเคราะหสมการถดถอย Y = β0+ +u แลวบนทกคา residual (e) (2) วเคราะหสมการถดถอย ln ) = a + b ln (Xj) โดยท Xj คอตวแปรทมผลใหความผนแปรไมคงท (inflator) (3) ทดสอบสมมตฐาน Ho: b = 0 vs H1: b ≠ 0 ถา b มนยส าคญกแสดงวามปญหา hetero-scedasticity 5) White test มขนตอนดงน (1) วเคราะหสมการถดถอย Y = β0+ +u แลวบนทกคา residual (e) สมมตวา k = 2 (2) วเคราะหสมการถดถอย

แลวค านวณหาคาสถต สมมตฐานหลกคอ Ho:

(3) ถา > ใหสรปวามปญหา heteroscedasticity วธนจะประสบขอยงยากบางถามตวแปรอสระมากรวมทงมตวแปรหน (dummy variable) กรณมตวแปรหน เชน Di= 0, 1 กไมตองก าหนดใหม รวมเปนตวแปรอสระเพราะมคาเทากนหากม ดวย จะเปนสาเหตใหเกดปญหาภาวะรวมเสนตรงพห 6) Breusch-Pagan-Godfrey test วธนเหมาะส าหรบตวอยางขนาดใหญ มขนตอนดงน (1) วเคราะหสมการถดถอย Y = β0+ +u แลวบนทกคา residual (e) (2) วเคราะหสมการถดถอย

โดยท X1, X2, X3,…, Xm คอตวแปรอสระทอาจเปนสาเหตของปญหา heteroscedasticity

Page 11: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2

77

(3) ค านวณหาคา ถาพบวา > แสดงวามปญหา heteroscedasticity 7) Ramsey test มขนตอนดงน (1) วเคราะหสมการถดถอย Y = β0+ +u แลวบนทกคา residual (e) (2) วเคราะหสมการถดถอย

(3) ค านวณหาคาสถต และปฏเสธสมมตฐานหลกคอ Ho: ถาพบวา > 8) Keonker test วธนเหมอน Ramsey test เพยงแตใชตวแปรอสระอนนอกตวแบบ คอใช Z1, Z2, Z3, …, Zm มาเปนเครองมอชวยทดสอบ ขนตอนมดงน (1) วเคราะหสมการถดถอย Y = β0+ +u แลวบนทกคา residual (e) (2) วเคราะหสมการถดถอย

(3) ค านวณหาคาสถต และปฏเสธสมมตฐานหลกคอ Ho: ถาพบวา > 9) Autoregressive Condition Heteroscedastic (ARCH) วธนตรวจสอบทงปญหา heteroscedasticity และ autocorrelation ในขณะเดยวกน มขนตอนดงน (1) วเคราะหสมการถดถอย Y = β0+ +u แลวบนทกคา residual (e) (2) วเคราะหสมการถดถอย

แลวค านวณหาคาสถต ถา > ใหปฏเสธสมมตฐานหลกคอ Ho: สรปวามปญหา heteroscedasticity และ autocorrelation วธแกปญหา Heteroscedasticity การแกปญหา Heteroscedasticity อาจกระท าไดหลายวธตอไปน 1) วธแปลงขอมล วธทนยมใชคอวธ log-log model วธปฏบตคอแปลงขอมลทงตวแปรอสระและตวแปรตามคอ แปลง Y เปน ln Y และแปลง Xj เปน ln(Xj); j = 1, 2, …, k แลววเคราะหสมการถดถอย lnY = β0+ +u

Page 12: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2 78

2) วธ WLS วธนจะกระท าไดตอเมอไดทราบรปแบบของ heteroscedsticity เสยกอนซงวธตรวจสอบแบบ Glejser test จะชวยใหสามารถระบรปแบบได สมมตตรวจพบวารปแบบของ heteroscedasticity คอ e = 3 + 2 ดงนน weight matrix คอ Diag.[ และคาประมาณของ β คอ = (XtW-1X)-1XtW-1Y 3) วธ Box-Cox Transformation วธนจะแปลง Y เปน โดยท

=

รปแบบการแปลงนยอเปนรปแบบตาง ๆไดหลายแบบดงน

(1) ถา =

(2) ถา =

(3) ถา =

วธท (1) และ (2) เหมาะส าหรบกรณขอมลตดลบ กรณท (3) เหมาะส าหรบกรณมคาเปน 0 4) วธถวงน าหนก วธนจะใช Xj หรอ ทเปน inflator หรอใชตวแปรภายนอกคอ Z ทเปน inflator เปนตวถวงน าหนกแลววเคราะหสมการถดถอยตามปกต เชนจากสมการถดถอย Y = β0+ +u ถาพบวา inflator คอ X2 และ Z เราอาจแกปญหา heteroscedasticity โดยการวเคราะหการถดถอย

(1) = + +u หรอ

(2) = + +u หรอ

(3) = + +u

ปญหา Autocorrelation Autocorrelation คอสถานการณ ท error term ไม เปนอสระตอกนในระหวางเวลาคอ

E(uiuj) ≠ 0 โดยเราจะตรวจสอบกบขอมลทเปนอนกรมเวลาเทานน และในการตรวจสอบปญหา autocorrelation เรานยมตรวจสอบตามรปแบบของ autoregressive process of order 1: AR(1) คอ ut= 1ut-1+vt หรอ autoregressive process of order 2: AR(2) คอ ut = 1ut-1+2ut-2+vt เทานน

Page 13: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2

79

ผลกระทบจากปญหา autocorrelation คอ V( ) ≠ 2(XtX)-1 และ s2 อาจมคาต ากวาความเปนจรงหรอสงกวาความเปนจรงกไดขนอยกบวาเปนสหสมพนธเชงบวกหรอวาเชงลบ ผลกระทบทง 2 ประการนกอใหเกดความเสยหายมากเพราะท าใหเราไมอาจเชอถอในผลทดสอบสมมตฐาน กลาวคอจาก Ho:βj= 0 vs H1: βj ≠ 0 ตวทดสอบคอ

; j =1, 2, …, k

ปญหา autocorrelation ท าใหโครงสรางสตร t เสยไปเพราะสตร V( ) ≠ 2(XtX)-1คอมรปแบบอน ทงนเพราะ s2 มรปแบบอน s2 อาจมคาสงกวาทควรจะเปนมผลให t มคาต าซงอาจต ามากจนถงระดบท าใหยอมรบ Ho:βj= 0 คอปฏเสธตวแปรทงๆ ทเปนตวแปรส าคญ หรอ s2 อาจต ากวาความเปนจรงซงมผลให tj สง อาจสงมากจนถงท าใหปฏเสธสมมตฐานหลก คอยอมรบเอาตวแปรอสระไวทงๆ ทอาจเปนตวแปรทไมมความส าคญ สรปวากระบวนการพจารณานยส าคญของตวแปรผดพลาดรวนไปทงหมด เรองผดปกตนนกวจยจะไมรตวเลยเพราะกใชสตรตามปกตคอ s2 = แตทจรงแลวเมอเกดปญหา autocorrelation สตรของ s2 จะเปนรปอน วธตรวจสอบ autocorrelation วธตรวจสอบ autocorrelation กระท าไดหลายวธดงน 1) Durbin-Watson test (DW) วธ DW ใชทดสอบเฉพาะกรณทเปน AR(1) คอ ut= 1ut-1+vt วธด าเนนการมดงน (1) วเคราะหสมการถดถอย Y = β0+ +u แลวบนทกคา residual (e)

(2) ค านวณหาคาสถต DW = ทงน DW สามารถลดรปเปน DW = 2 - 2

ไดและเมอแทนคา ดวยคาทก าหนดจะปรากฏกฎงาย ๆ ดงนพบวา DW (เมอแทนท ดวย 0 จะท าให DW = 2) แสดงวาไมมปญหา autocorrelation แตถา DW (เมอแทนท ดวย 1จะท าให DW = 0) แสดงวาม perfect positive autocorrelation ถา DW 4 (เมอแทนท ดวย -1จะท าให DW = 4) แสดงวามปญหา perfect negative autocorrelation ถา DW มคาอนใหเปดตารางเพอหาคาวกฤต หรออาจวเคราะหดงตอไปนคอ (3) วเคราะหสมการถดถอย et = et-1 + vt แลวทดสอบ Ho: = 0 vs H1: ≠ 0 ถาปฏเสธ Ho กแสดงวามปญหา autocorrelation ใน AR(1)

Page 14: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2 80

2) Breusch-Godfrey test (BG) วธน ใชตรวจสอบ autocorrelationในกรณ AR (p) โดยถอวาเปนกรณทวไปท ut อาจมความ สมพนธกนเองในหลายชวงเวลา ในกรณเชนวาน DW จะไมอาจรองรบได วธ BG ด าเนนการดงน

(1) วเคราะหสมการถดถอย Y = β0+ +u แลวบนทกคา residual (e)

(2) วเคราะหสมการถดถอย

แลวค านวณหาคา = nR2 ถาพบวา ใหปฏเสธ Ho: = 0 แสดงวามปญหา autocorrelation ใน AR (p) หรอทดสอบสมมตฐานจากวธการในขอ (3) คอ

(3) วเคราะหสมการถดถอย

แลวทดสอบสมมตฐาน Ho: = 0 ดวยตาราง ANOVA วธแกปญหา autocorrelation

การแกปญหา autocorrelation ใหแกตามรปแบบทตรวจพบกลาวคอ (1) ถาใช DW ซงเปนเพยงการตรวจสอบในรปแบบ AR(1) ใหแปลงขอมลดงนคอแปลง

เปน และแปลง ; j = 1, 2, …, k แลวว เคราะหสมการถดถอย

( โดยท ; j= 1, 2…, p ไดมาจากการวเคราะหการถดถอย (2) ถาพบวาเปน AR(2) คอ ใหแปลงคาตวแปร เปน

และแปลง ; j = 1, 2, …, k แลววเคราะหสมการถดถอย

( โดยท และ ไดมาจากการวเคราะหการถดถอย

Page 15: (Regression assumption and Regression process) · 2017-08-04 · การวิเคราะห์การถดถอยคือวิทยาสถิติ ... สรุปว่าตัวแปรอิสระทุกตัวมีอิทธิพลต่อตวัแปรตาม

วารสารรามค าแหง สาขาวทยาศาสตรและเทคโนโลย ปท 30 ฉบบท 2

81

เอกสารอางอง

มนตร พรยะกล. เทคนคการวเคราะหสมการถดถอย. กรงเทพมหานคร :มหาวทยาลย

รามค าแหง, 2544.

CHAPTER 3 MISSPECIFICATION TESTS คนเมอ 15 มกราคม 2557จาก

http://www.tnet.teagasc.ie/fapri/downloads/rochemanual/mrochech3.pdf.

Choiv, Syngjoo (2008), Environmental Econometrics, คนเมอ 10 มกราคม 2557 จาก

http://www.homepages.ucl.ac.uk/~uctpsc0/Teaching/GR03/SLRM.pdf.

Garson, D. G. (2012), Testing Statistical Assumption, North Carolina State University.

Heteroscedasticity, คนเมอ 14 มกราคม 2557 จาก http://www.acc.ncku.edu.tw/chinese/

faculty/mingyuan/myweb11/EnClass/Slides/Chapter5-20060928.ppt.

Hoffmann, John P.(2010) Linear Regression Analysis: Applications and Assumptions,

Second Edition, Electronic Production: Adobe Acrobat Professional.

Schwarz, Carl James (2013), Sampling, Regression, Experimental Design and

Analysis for Environmental Scientists, Biologists, and Resource Managers, Department of

Statistics and Actuarial Science, Simon Fraser University.

.