Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
บทท 7 การวเคราะหการถดถอยส าหรบตวแปรอสระเชงคณภาพ
ตวแปรอสระทใชในการวเคราะหการถดถอยสวนใหญเปนตวแปรเชงปรมาณหรอตวแปร
ทสามารถแสดงคาในรปของตวเลขทท าการเปรยบเทยบคาได เชน อณหภม ระยะทาง คะแนนสอบ รายได เปนตน บางครงนกวจยตองการใชตวแปรเชงคณภาพในการพยากรณตวแปรเชงปรมาณเชน การพยากรณคะแนนสอบของนกศกษาแตละเพศ หรอการพยากรณรายไดโดยการใชระดบการศกษา (ประถมศกษา, มธยมศกษา, ปรญญาตร, ปรญญาโท และปรญญาเอก) เปนตน การวเคราะหขอมลโดยใชตวแปรเชงคณภาพเหลานไมสามารถวเคราะหโดยใชรปแบบทผานมาได
7.1 ตวแปรอสระเชงคณภาพ 1 ตวทมสองกลมยอย การวเคราะหขอมลเชงคณภาพจ าเปนตองมการสรางตวแปรหน (dummy variable) ขนเพอ
ชวยในการสรางสมการถดถอยโดยการแปลงขอมลเหลานใหเปนตวเลขเสยกอนโดยตวเลขแตละคาแสดงระดบหรอกลมทแตกตางกนของตวแปรเชงคณภาพนนๆเชน ให X2 แทนตวแปรเพศโดย เพศชายมคาเปน 0 และหญงมคาเปน 1 เปนตน การเลอกตวเลขใหกบแตละกลมนนจะก าหนดอยางไรกไดแตเพอความงายและสะดวกในการตความจงใช 0 กบ 1 ในกรณนสมการถดถอยเชงเสนอยางงายสามารถเขยนไดดงน
Y = 0 + 1X1 + 2X2 + (7.1) หากพจารณาเพศชาย (X2 = 0) แลวสมการคอ
Y = 0 + 1X1 + 2(0) +
= 0 + 1X1 +
ดงนนความสมพนธระหวาง Y กบ X1 จะเปนเสนตรงทมความชนเทากบ 1 และจดตดแกนเทากบ
0 และในกรณเพศหญง (X2 = 1) แลวสมการคอ
Y = 0 + 1X1 + 2(1) +
Y = (0 + 2) + 1X1 +
156
ดงนนความสมพนธระหวาง Y กบ X1 จะเปนเสนตรงทมความชนเทากบ 1 และจดตดแกนเทากบ
0 + 2 จะเหนไดวาจดตดแกนของทงสองเพศนนแตกตางกนเทากบ 2 ดงภาพท 7.1 โดย 2 เปนคาความแตกตางระหวางคาของ Y ทมผลมาจากเพศทแตกตางกน
ภาพท 7.1 เสนถดถอยส าหรบเพศทงสอง
หากใชจ านวนตวแปรหนเทากบจ านวนระดบหรอกลมของตวแปรเชงคณภาพแลวคอลมนในเมตรกซ X'X จะไมเปนอสระเชงเสนตอกน (linearly independent) และสงผลใหไมสามารถหาเมตรกซผกผนของ X'X ได ผลทตามมาคอคาประมาณของพารามเตอรทไดจะมมากกวา 1 ชด ดงนนจงจ าเปนตองใชจ านวนตวแปรหนนอยกวาจ านวนระดบหรอกลมอย 1 เพอใหคาประมาณของพารามเตอรมชดเดยว การสรางสมการถดถอยจะสรางโดยวธเดยวกนกบการสรางสมการถดถอยโดยไมมตวแปรหน
ตวอยางท 7.1 อาจารยผสอนวชาคณตศาสตรตองการศกษาความสมพนธระหวางคะแนนสอบวชาคณตศาสตร (Y) กบเกรดสะสม (X) และเพศโดยมขอมลดงน
เกรด เพศ คะแนนสอบ
2.25 0 30.5 3.25 0 66.5 2.70 0 46.0 2.78 0 50.5
2
0
Y 0 + 1X ส าหรบเพศชาย
Y 0 + 2) + 1X ส าหรบเพศหญง
0 + 2
157
เกรด เพศ คะแนนสอบ
3.00 0 57.0 2.50 0 38.5 2.75 0 47.5 3.15 0 64.0 2.30 1 51.0 3.50 1 89.5 2.05 1 42.0 2.35 1 54.0 2.95 1 74.0 3.35 1 83.5 2.40 1 53.0 2.25 1 47.5
วธท า เนองจากเพศเปนตวแปรเชงคณภาพทแบงไดเปน 2 กลมคอ เพศชายและหญงดงนนในการวเคราะหจงก าหนดคาตวแปรเพศเปน 0 แทนเพศชายและ 1 แทนเพศหญง เมอตรวจสอบความสมพนธระหวางตวแปรอสระและตวแปรตามโดยใชแผนภาพกระจายระหวางเกรดสะสม (GPA) กบคะแนนสอบ (score) แยกตามเพศ (gender) พบวาเมอนกเรยนทมเกรดสะสมต าจะมคะแนนสอบต าและนกเรยนทมเกรดสะสมสงจะมคะแนนสอบสงดวยเชนกนและยงพบอกวาเพศหญงมคะแนนสอบทสงกวาเพศชายดงภาพขางลาง
male
female
3.43.23.02.82.62.42.22.0
90
80
70
60
50
40
30
GPA
score
158
จากขอมลสามารถสรางตวแบบอยในรปของ
Y = 0 + 1X1 + 2 X 2 + และสามารถจดขอมลอยในรปเมตรกซดงน
125.21
140.21
135.31
195.21
135.21
105.21
150.31
130.21
015.31
075.21
050.21
000.31
078.21
070.21
025.31
025.21
X
5.47
0.53
5.83
0.74
0.54
0.42
5.89
0.51
0.64
5.47
5.38
0.57
5.50
0.46
5.66
5.30
Y
การสรางสมการถดถอยโดยใชเมตรกซใชวธเดยวกบทผานมาคอ
2
1
0
b
b
b
= X(X'X)-1 X' Y =
44.19
72.37
46.55
การสรางสมการถดถอยโดยใชโปรแกรม MINITAB สามารถท าไดโดยใชค าสง
“Regression” เชนเดยวกบการวเคราะหทผานมาและระบตวแปรอสระทงสองคอ GPA และ gender ในชอง “Predictors:” และระบตวแปรตามคอ Score ในชอง “Response:” ดงภาพขางลาง
159
จากตารางวเคราะหความแปรปรวนทไดจากโปรแกรม MINITAB พบวาคาสถต F มคา
เทากบ 1746.23 และมคา p-value เทากบ 0.000 แสดงวาสมการถดถอยทสรางขนสามารถใชในการพยากรณคะแนนสอบไดและมคาสมประสทธการตดสนใจ (R-Sq) เทากบ 99.6% แสดงวาสมการถดถอยทไดสามารถพยากรณไดเปนอยางดและเมอพจารณาความส าคญของตวแปรอสระแตละตวตอตวแปรตามพบวาเกรดสะสม (GPA) มคาสถต t เทากบ 54.67 คา p-value เทากบ 0.000 และเพศ (gender) มคาสถต t เทากบ 35.86 คา p-value เทากบ 0.000 โดยคา p-value ของตวแปรทงสองมคานอยกวา 0.05 ดงนนทงเกรดสะสมและเพศมความสมพนธตอคะแนนสอบทระดบนยส าคญ 0.05
The regression equation is
score = - 55.5 + 37.7 GPA + 19.4 gender
Predictor Coef SE Coef T P
Constant -55.465 1.965 -28.22 0.000
GPA 37.7222 0.6900 54.67 0.000
gender 19.4359 0.5421 35.86 0.000
S = 1.047 R-Sq = 99.6% R-Sq(adj) = 99.6%
Analysis of Variance
Source DF SS MS F P
Regression 2 3828.7 1914.3 1746.23 0.000
Residual Error 13 14.3 1.1
Total 15 3842.9
Source DF Seq SS
GPA 1 2419.3
gender 1 1409.4
160
เมอพจารณาแผนภาพกระจายระหวางคาพยากรณกบสวนเหลอแยกตามเพศพบวาเพศหญงมการกระจายตวของคาสวนเหลอมากกวาเพศชายซงสอดคลองกบแผนภาพกระจายระหวางเกรดกบคาสวนเหลอ
male
female
90807060504030
1
0
-1
FIT
RE
SI
male
female
90807060504030
1
0
-1
FIT
RE
SI
จากแผนภาพ normal probability plot พบวาสวนเหลอมการแจกแจงแบบปกตท p-value =
0.163
161
P-Value: 0.163
A-Squared: 0.514
Anderson-Darling Normality Test
N: 16
StDev: 0.974731
Average: -0.0000000
10-1
.999
.99
.95
.80
.50
.20
.05
.01
.001
Pro
babili
ty
RESI
Normal Probability Plot
จากการวเคราะหโดยใชโปรแกรม MINITAB ไดสมการถดถอยคอ genderGPAY 4.197.375.55ˆ โดยสามารถเขยนสมการถดถอยส าหรบเพศชายคอ
)0(4.197.375.55ˆ GPAY GPA7.375.55 และสมการถดถอยส าหรบเพศหญงคอ )1(4.197.375.55ˆ GPAY
GPA7.371.36 จากสมการถดถอยพบวานกเรยนทมเกรดสะสมเทากนแลวเพศหญงจะไดคะแนนสงกวาเพศชายอย 19.4 คะแนน ทงนเมอพจารณาแผนภาพกระจายระหวางเกรดสะสมกบคะแนนสอบของทงสองเพศพบวากราฟของเพศทงสองมความชนทไมแตกตางกน หากทงสองกลมมความชนทแตกตางกนแลวแสดงวาตวแปรอสระเชงคณภาพตวนนกบ ตวแปรอสระเชงปรมาณอกตวมปฏสมพนธตอกน (interaction) เชน ในการทดสอบอายการใชงานของแบตเตอร 2 ชนดทอณหภมตางกน หากแผนภาพกระจายของอณหภมกบอายของแบตเตอรของทงสองชนดมความชนทไมเทากนดงภาพขางลางแลวแสดงวาอณหภมกบชนดของแบตเตอรมปฏสมพนธตอกนโดยทอณหภมต าๆนนแบตเตอรชนดท 1 จะมอายการใชงานทนานกวาชนดท 2 แตทอณหภมสงๆ นนแบตเตอรชนดท 2 จะมอายการใชงานทนานกวาชนดท 1 เปนตน
162
type 1
type 2
706050403020
85
80
75
70
65
60
55
50
45
40
temp
time
ในกรณทตวแปรทงสองมปฏสมพนธกนนนการสรางสมการถดถอยจ าเปนตองเพมพจน
ของปฏสมพนธระหวางตวแปรท งสองและตองทดสอบพารามเตอรของพจน ทเพมขนน โดยสามารถเขยนสมการถดถอยไดดงน
Y = 0 + 1 X 1 + 2 X 2 + 3 X 1 X 2 + (7.2)
โดย 3 เปนพารามเตอรส าหรบปฏสมพนธระหวางตวแปรอสระท งสอง เมอพจารณาสมการถดถอยแยกตามกลมของตวแปรเชงคณภาพจะไดวาสมการถดถอยของกลมท 1 คอ
Y = 0 + 1 X 1 + 2(0) + 3 X 1(0) +
= 0 + 1 X 1 + (7.3)
นนคอสมการมจดตดแกน Y ท 0 และมความชนคอ 1 ส าหรบกลมท 2 มสมการถดถอยคอ
Y = 0 + 1 X 1 + 2(1) + 3 X 1(1) +
= (0 + 2) + (1 + 3) X 1 + (7.4)
นนคอสมการมจดตดแกน Y ท 0 + 2 และมความชนคอ 1 + 3 เนองจากความชนและจดตดแกนของทงสองสมการไมเทากนจงท าใหกราฟของทงสองกลมแตกตางกน การทดสอบเรมจากการทดสอบวาสมการถดถอยทงสองเหมอนกนหรอไมโดยการตงสมมตฐานดงน
H0 : 2 = 3 = 0
H1 : 2 ≠ 0 และ/หรอ 3 ≠ 0
ทดสอบโดยใชสถต F ดงน
163
MSE
SSRF
2/),|,( 1032 (7.5)
โดยคา MSE ไดจากสมการเตมรปและท าการเปรยบเทยบกบ F จากตารางทองศาเสรเทากบ 2 และ n – 4 หากไมสามารถปฏเสธสมมตฐานหลกแสดงวาสามารถใชสมการถดถอยเพยงสมการเดยวในการอธบายความสมพนธระหวางตวแปรอสระเชงปรมาณกบตวแปรตามได การทดสอบวา
เสนกราฟของทงสองกลมมความชนเทากนหรอไมท าไดโดยการทดสอบวา 3 เทากบ 0 หรอไมโดยสามารถเขยนสมมตฐานไดดงน
H0 : 3 = 0
H1 : 3 ≠ 0
ทดสอบโดยใชสถต F ดงน
MSE
SSRF
1/),,|( 2103 (7.6)
โดยคา MSE ไดจากสมการเตมรปและท าการเปรยบเทยบกบ F จากตารางทองศาเสรเทากบ 1 และ n – 4 หากไมสามารถปฏเสธสมมตฐานหลกแสดงวาสมการถดถอยของทงสองกลมมความชนเทากนหรอตวแปรอสระเชงคณภาพไมมปฏสมพนธกบตวแปรอสระเชงปรมาณ ตวอยางท 7.2 ในการวเคราะหหาความสมพนธระหวางอณหภมใชงานของแบตเตอร 2 ชนดกบอายการใชงานมขอมลดงตารางขางลาง จงสรางสมการถดถอยทเหมาะสมกบขอมล
อณหภม (temp) ชนด (type) เวลาทใช (time) 28 0 80 25 0 80 61 0 58 24 0 83 32 0 76 43 0 69 38 0 71 30 0 76 41 0 70
164
อณหภม (temp) ชนด (type) เวลาทใช (time) 72 0 55 35 0 75 48 1 60 65 1 45 33 1 75 34 1 73 39 1 68 31 1 76 34 1 73 72 1 40 25 1 84 30 1 75 28 1 81
วธท า จากขอมลขางตนน ามาวาดแผนภาพกระจายระหวางอณหภมกบอายการใชแยกตามประเภทพบวาเสนกราฟของแบตเตอรทงสองประเภทมความชนทแตกตางกน
type 1
type 2
20 30 40 50 60 70
40
45
50
55
60
65
70
75
80
85
temp
tim
e
จากการวเคราะหสมการถดถอยโดยใหประเภทของแบตเตอรเปนตวแปรหนโดยใชโปรแกรม MINITAB พบวาสมการถดถอยสามารถพยากรณอายการใชงานของแบตเตอรดวยคา F
165
เทากบ 154.27 และ p-value เทากบ 0.000 นอกจากนเมอพจารณาตวแปรอณหภมและประเภทของแบตเตอรนนพบวาตวแปรทงสองมความส าคญตออายการใชงานดวย p-value เทากบ 0.000 และ 0.020 ตามล าดบและคาสมประสทธการตดสนใจ (R-Sq) เทากบ 94.2% แสดงวาสมการถดถอยทไดนมความถกตองในการพยากรณอยในระดบทสงดงภาพขางลาง
The regression equation is
time = 101 - 0.751 temp - 3.23 type
Predictor Coef SE Coef T P
Constant 101.396 1.917 52.90 0.000
temp -0.75142 0.04346 -17.29 0.000
type -3.226 1.266 -2.55 0.020
S = 2.969 R-Sq = 94.2% R-Sq(adj) = 93.6%
Analysis of Variance
Source DF SS MS F P
Regression 2 2719.1 1359.6 154.27 0.000
Residual Error 19 167.4 8.8
Total 21 2886.6
Source DF Seq SS
temp 1 2662.0
type 1 57.2
เมอพจารณาแผนภาพกระจายระหวางตวแปรอณหภมกบคาสวนเหลอแยกตามประเภทของแบตเตอรแลวพบวาทอณหภมต าๆ แบตเตอรประเภทท 1 จะมความคลาดเคลอนในการพยากรณต าแตความคลาดเคลอนในการพยากรณเพมขนเมออณหภมเพมขนในทางกลบกนทอณหภมต าๆ แบตเตอรประเภทท 2 จะมความคลาดเคลอนในการพยากรณสงและลดลงเมออณหภมสงขน จากรปแบบทเกดขนในแผนภาพนอาจมาจากการละตวแปรบางตวแปรทจ าเปนในสมการถดถอย นอกจากนเมอพจารณาแผนภาพกระจายของอณหภมกบอายการใชงานแยกตามประเภทของแบตเตอรนนจะเหนตวแปรทงสองมปฏสมพนธกนจงควรเพมพจนของปฏสมพนธระหวางตวแปรทงสอง การเพมพจนดงกลาวสามารถท าไดโดยการคณตวแปรทงสองเขาดวยกน ดงตารางขางลางจากนนสรางสมการถดถอยโดยใชตวแปรอสระทง 3 ตวคอ temp type และ temp*type
166
type 1
type 2
706050403020
5
0
-5
temp
RE
SID
UA
L
temp type temp*type time 28 0 0 80 25 0 0 80 61 0 0 58 24 0 0 83 32 0 0 76 43 0 0 69 38 0 0 71 30 0 0 76 41 0 0 70 72 0 0 55 35 0 0 75 48 1 48 60 65 1 65 45 33 1 33 75 34 1 34 73 39 1 39 68 31 1 31 76 34 1 34 73 72 1 72 40 25 1 25 84 30 1 30 75 28 1 28 81
167
การสรางสมการถดถอยโดยใชโปรแกรม MINITAB ท าโดยการเพมตวแปรปฏสมพนธ “temp*type” ในชอง “Predictors:” ดงภาพขางลาง
เมอพจารณาผลลพธทไดจากการโปรแกรม MINITAB ในรปขางลางพบวาพจนของ
ปฏสมพนธระหวางตวแปรอสระทงสองหรอ temp*type มความส าคญตออายการใชงานดวย p-value เทากบ 0.000 และคาสมประสทธการตดสนใจ (R-Sq(adj)) เทากบ 98.5% เพมขนจากเดมนนคอสมการถดถอยมความถกตองในการพยากรณมากขนแตอยางไรกตามสมการถดถอยทไมไดพจารณาปฏสมพนธเขาในการพจารณานนใหคาสมประสทธการตดสนใจทสงมากอยแลว
The regression equation is
time = 94.7 - 0.581 temp + 9.96 type - 0.334 temp*type
Predictor Coef SE Coef T P
Constant 94.736 1.251 75.73 0.000
temp -0.58063 0.03009 -19.30 0.000
type 9.957 1.770 5.63 0.000
temp*type -0.33421 0.04209 -7.94 0.000
S = 1.437 R-Sq = 98.7% R-Sq(adj) = 98.5%
Analysis of Variance
Source DF SS MS F P
Regression 3 2849.40 949.80 459.74 0.000
Residual Error 18 37.19 2.07
Total 21 2886.59
Source DF Seq SS
temp 1 2661.96
type 1 57.18
temp*type 1 130.26
168
เมอทดสอบความส าคญของปฏสมพนธโดยใชสถต F โดยใชสมการท (7.6) หรอ
MSE
SSRF
1/),,|( 2103
โดย
SSR(3|0,1,2) = 130.26 ดงนน
MSE
SSRF
1/),,|( 2103 =
07.2
1/26.130 = 62.93
เนองจากคาสถต F > F0.05, 1, 18 = 4.41 ดงนนสามารถสรปวาปฏสมพนธระหวางตวแปร ท งสองมความส าคญกบสมการถดถอยซงสอดคลองกบคา t ทไดจากโปรแกรม MINITAB นอกจากนเมอพจารณาแผนภาพกระจายระหวางตวแปรอณหภมกบคาสวนเหลอแยกตามประเภทของแบตเตอรพบวาแผนภาพมการกระจายตวทดขนจากเดมหรอแผนภาพไมมรปแบบทชดเจนเหมอนกบทไดจากตวแบบแรก
type 1
type 2
85807570656055504540
2
1
0
-1
-2
time
RE
SID
UA
L
ดงนนสมการถดถอยทไดคอ
time = 94.70 - 0.581 temp + 9.96 type - 0.334 temp*type และสมการส าหรบแบตเตอรทงสองประเภทคอ ประเภทท 1: time = 94.70 - 0.581 temp ประเภทท 2: time = 104.66 - 0.915 temp จากสมการทงสองพบวาสมการทงสองมความชนและจดตดแกน Y ทแตกตางกนซงสอดคลองกบแผนภาพกระจาย
169
7.2 ตวแปรอสระเชงคณภาพ 1 ตวทมมากกวาสองกลมยอย ในกรณทตวแปรอสระเชงคณภาพนนมจ านวนกลมมากกวา 2 กลมนกวจยตองสราง
ตวแปรหนจ านวนเทากบระดบหรอกลมของตวแปรน นลบออก 1 เชน หากระดบการศกษา แบงออกเปน 5 ระดบ (ประถมศกษา, มธยมศกษา, ปรญญาตร, ปรญญาโท และปรญญาเอก) แลว ตวแปรหนส าหรบระดบการศกษาจะม 4 ตวแปรดงน
X2 X3 X4 X 5 0 0 0 0 หากผนนจบระดบประถมศกษา 1 0 0 0 หากผนนจบระดบมธยมศกษา 0 1 0 0 หากผนนจบระดบปรญญาตร
0 0 1 0 หากผนนจบระดบปรญญาโท 0 0 0 1 หากผนนจบระดบปรญญาเอก
และมสมการถดถอยเชงเสนคอ
Y = 0 + 1 X1 + 2 X2 + 3 X3 + 4 X4 + 5 X5 + (7.7)
หากผนนจบการศกษาระดบประถมศกษาแลวสมการ (7.1) จะกลายเปน
Y = 0 + 1 X1 +
หากผนนจบการศกษาระดบมธยมศกษาแลวสมการถดถอยคอ
Y = (0 + 2) + 1 X1 +
หากผนนจบการศกษาระดบปรญญาตรแลวสมการถดถอยคอ
Y = (0 + 3) + 1 X1 +
หากผนนจบการศกษาระดบปรญญาโทแลวสมการถดถอยคอ
Y = (0 + 4) + 1 X1 +
หากผนนจบการศกษาระดบปรญญาเอกแลวสมการถดถอยคอ
Y = (0 + 5) + 1 X1 +
จากสมการขางตนพบวา 2 3 4 และ 5 ท าใหจดตดแกน Y มคาเปลยนแปลงไปหรออาจ
กลาวไดวา 2 3 4 และ 5 ใชวดผลกระทบของการศกษาระดบมธยมศกษา ปรญญาตร ปรญญาโทและปรญญาเอกเทยบกบคนทมการศกษาระดบประถมศกษาตามล าดบ หากสมประสทธใดมคา
170
เปนบวกแสดงวาระดบการศกษานนใหคาตวแปรตามทสงกวาระดบการศกษาระดบประถมศกษา
เชน หาก 2 มคาเปนบวกแสดงวาผจบมธยมศกษามคาของตวแปรตามสงกวาผจบประถมศกษา เปนตน ในทางกลบกนหากสมประสทธใดมคาเปนลบแสดงวาระดบการศกษานนใหคาตวแปร
ตามทต าวากวาระดบการศกษาระดบประถมศกษาเชน หาก 3 มคาเปนลบแสดงวาผจบปรญญาตรมคาของตวแปรตามต ากวาผจบประถมศกษา เปนตน การวเคราะหขอมลประเภทนจะไมแตกตางจากการวเคราะหขอมลเชงคณภาพทมสองกลมในหวขอทแลวและขอมลในแตละกลมอาจมปฏสมพนธระหวางกนซงสามารถตรวจสอบไดโดยวธเดยวกบหวขอทแลว
ตวอยางท 7.3 การศกษาความสมพนธระหวางจ านวนครวเรอน (หมนครวเรอน) ในแตละจงหวดของ 3 ภาคกบยอดขายของหางสรรพสนคา (ลานบาท) โดยใชสมการถดถอยดงน
จ ำนวนครวเรอน (number) ภำค (region) ยอดขำย (volume) 61 เหนอ 160 11 เหนอ 110 35 เหนอ 130 20 เหนอ 120 55 เหนอ 160
120 กลาง 240 80 กลาง 200
130 กลาง 270 110 กลาง 230 20 กลาง 130
120 ใต 200 103 ใต 180 140 ใต 230 15 ใต 80
105 ใต 180 วธท า เมอพจารณาแผนภาพกระจายระหวางจ านวนครวเรอนกบยอดขายแยกตามภาคแลวพบวาภาคกลางแตละภาคมจ านวนยอดขายทแตกตางกนในขณะทจ านวนครวเรอนไมแตกตางกนโดยภาค
171
กลาง (central) มจ านวนยอดขายมากกวาภาคอนทจ านวนครวเรอนเทากน นอกจากนยงพบอกวาเสนกราฟทงสามขนานกนหรอมความชนทไมแตกตางกนแสดงวาจ านวนครวเรอนไมมปฏสมพนธกบภาคจงไมจ าเปนตองเพมพจนปฏสมพนธ
central
north
south
150100500
280
180
80
number
volu
me
เนองจากภาค (region) เปนตวแปรอสระเชงคณภาพทม 3 กลมดงนนในการวเคราะหขอมล
จงจ าเปนตองสรางตวแปรหน 2 ตวดงน region1 region2 0 0 หากหางสรรพสนคาอยในภาคเหนอ 1 0 หากหางสรรพสนคาอยในภาคกลาง 0 1 หากหางสรรพสนคาอยในภาคใต
ดงนนตารางขอมลสามารถเขยนใหมไดดงน
number region1 region2 volume 61 0 0 160 11 0 0 110 35 0 0 130 20 0 0 120 55 0 0 160
120 1 0 240 80 1 0 200
172
number region1 region2 volume 130 1 0 270 110 1 0 230 20 1 0 130
120 0 1 200 103 0 1 180 140 0 1 230 15 0 1 80
105 0 1 180 จากการวเคราะหสมการถดถอยโดยใชโปรแกรม MINITAB พบวาสมการถดถอยสามารถพยากรณยอดขาย (volume) ดวยคา F เทากบ 465.24 และ p-value เทากบ 0.000 นอกจากนพบวา ตวแปรอสระทกตวมความส าคญตอการพยากรณยอดขายดวย p-value เทากบ 0.000, 0.008 และ 0.000 ตามล าดบและคาสมประสทธการตดสนใจ (R-Sq) เทากบ 99.2% แสดงวาสมการถดถอยทไดนมความถกตองในการพยากรณอยในระดบทสงดงภาพขางลาง
The regression equation is
volume = 93.5 + 1.17 number + 13.1 region1 - 32.3 region2
Predictor Coef SE Coef T P
Constant 93.496 2.818 33.18 0.000
number 1.16770 0.03940 29.64 0.000
region1 13.076 4.070 3.21 0.008
region2 -32.295 4.170 -7.74 0.000
S = 5.423 R-Sq = 99.2% R-Sq(adj) = 99.0%
Analysis of Variance
Source DF SS MS F P
Regression 3 41050 13683 465.24 0.000
Residual Error 11 324 29
Total 14 41373
Source DF Seq SS
number 1 35783
region1 1 3503
region2 1 1764
173
สมการถดถอยทไดสามารถเขยนไดดงน
volume = 93.5 + 1.17 number + 13.1 region1 - 32.3 region2
คาสมประสทธของตวแปร number เทากบ 1.17 หมายความวาเมอพจารณาภาคใดภาคหนงเพยงภาคเดยว ถาจ านวนครวเรอนเพมขนหนงหมนครวเรอนจะท าใหยอดขายเพมขน 1.17 ลานบาท คาสมประสทธของตวแปร region1 เทากบ 13.1 หมายความวาเมอจ านวนครวเรอนเทากนแลวภาคกลางมยอดขายมากกวาภาคเหนออย 13.1 ลานบาท คาสมประสทธของตวแปร region2 เทากบ -32.1 หมายความวาเมอจ านวนครวเรอนเทากนแลวภาคใตมยอดขายนอยกวาภาคเหนออย 32.1 ลานบาท
นอกจากนสามารถแยกสมการถดถอยส าหรบแตละภาคไดดงนคอ ภาคเหนอ: volume = 93.5 + 1.17 number ภาคกลาง: volume = 106.6 + 1.17 number ภาคใต: volume = 61.2 + 1.17 number
7.3 ตวแปรอสระเชงคณภาพสองตว หากขอมลมตวแปรอสระเชงคณภาพสองตวแลวการวเคราะหขอมล ชดนนตองสราง ตวแปรหน 2 ชด จากนนจงท าการวเคราะหเชนเดยวกบการวเคราะหในหวขอทผานมา นอกจากนหากตวแปรมปฏสมพนธระหวางกนแลวการสรางสมการถดถอยของปฏสมพนธน นใหท าเชนเดยวกบกรณขอมลทมตวแปรเชงคณภาพเพยงตวเดยวกลาวคอสรางตวแปรใหมโดยน าตวแปรทงสองมาคณกนแลวเพมเขาไปในสมการถดถอย
ตวอยางท 7.4 การวเคราะหหาความสมพนธระหวางการใชฉนวนกนความเยนภายในบานกบปรมาณแกสธรรมชาตทใชในแตละวนทระดบอณหภมทแตกตางกน 3 ระดบโดยมขอมลดงน
ฉนวน (Insulate) ชวงอณหภม (Temp) ปรมาณ (Amount) กอนใช ต า 7.2 กอนใช ต า 6.9 กอนใช ต า 6.4 กอนใช ต า 6.0 กอนใช ต า 5.8 กอนใช ต า 5.8
174
ฉนวน (Insulate) ชวงอณหภม (Temp) ปรมาณ (Amount) กอนใช กลาง 5.6 กอนใช กลาง 4.7 กอนใช กลาง 5.8 กอนใช กลาง 5.2 กอนใช กลาง 4.9 กอนใช กลาง 4.9 กอนใช สง 4.3 กอนใช สง 4.4 กอนใช สง 4.5 กอนใช สง 4.6 กอนใช สง 3.7 กอนใช สง 3.9 หลงใช ต า 4.8 หลงใช ต า 4.6 หลงใช ต า 4.7 หลงใช ต า 4.0 หลงใช ต า 4.2 หลงใช ต า 4.2 หลงใช กลาง 3.2 หลงใช กลาง 3.9 หลงใช กลาง 3.5 หลงใช กลาง 3.7 หลงใช กลาง 3.5 หลงใช กลาง 3.5 หลงใช สง 4.2 หลงใช สง 4.0 หลงใช สง 3.9 หลงใช สง 3.5 หลงใช สง 4.0 หลงใช สง 3.6
175
วธท า เมอพจารณาแผนภาพกระจายระหวางการใชฉนวนกบปรมาณแกสทใชทระดบอณหภม ทง 3 พบวากอนการใชฉนวนมการใชแกสทมากกวาหลงการใชฉนวนแตพบวาเสนกราฟทงสองไมไดขนานกนดงนนแสดงวาการใชฉนวนกบระดบอณหภมมปฏสมพนธกนดงนนจงตองเพมพจนปฏสมพนธเขาไปในการสรางสมการถดถอย
Before
After
HighMediumLow
7
6
5
4
3
Temp
Am
oun
t
ขอมลชดนมตวแปรอสระเชงคณภาพ 2 ชดคอ การใชฉนวนกบระดบอณหภม ดงน น การวเคราะหขอมลจงจ าเปนตองสรางตวแปรหน 3 ตวคอ Insulate Temp1 และ Temp2 ดงน
0 ส าหรบกอนการใชฉนวน Insulate =
1 ส าหรบหลงการใชฉนวน Temp1 Temp2 0 0 ส าหรบอณหภมระดบต า 1 0 ส าหรบอณหภมระดบกลาง 0 1 ส าหรบอณหภมระดบสง
นอกจากนยงตองเพมตวแปรส าหรบปฏสมพนธระหวางตวแปรหน Insulate Temp1 และ Temp2 ดงนคอ Temp1*Insulate และ Temp2*Insulate ดงนนตารางขอมลสามารถเขยนใหมไดดงน
176
Insulate Temp1 Temp2 Temp1*Insulate Temp2*Insulate Amount 0 0 0 0 0 7.2 0 0 0 0 0 6.9 0 0 0 0 0 6.4 0 0 0 0 0 6.0 0 0 0 0 0 5.8 0 0 0 0 0 5.8 0 1 0 0 0 5.6 0 1 0 0 0 4.7 0 1 0 0 0 5.8 0 1 0 0 0 5.2 0 1 0 0 0 4.9 0 1 0 0 0 4.9 0 0 1 0 0 4.3 0 0 1 0 0 4.4 0 0 1 0 0 4.5 0 0 1 0 0 4.6 0 0 1 0 0 3.7 0 0 1 0 0 3.9 1 0 0 0 0 4.8 1 0 0 0 0 4.6 1 0 0 0 0 4.7 1 0 0 0 0 4.0 1 0 0 0 0 4.2 1 0 0 0 0 4.2 1 1 0 1 0 3.2 1 1 0 1 0 3.9 1 1 0 1 0 3.5 1 1 0 1 0 3.7 1 1 0 1 0 3.5
177
Insulate Temp1 Temp2 Temp1*Insulate Temp2*Insulate Amount 1 1 0 1 0 3.5 1 0 1 1 0 4.2 1 0 1 1 0 4.0 1 0 1 1 0 3.9 1 0 1 1 0 3.5 1 0 1 1 0 4.0 1 0 1 1 0 3.6
จากการวเคราะหสมการถดถอยโดยใชโปรแกรม MINITAB พบวาสมการถดถอยสามารถพยากรณปรมาณการใชแกสดวยคา F เทากบ 41.75 และ p-value เทากบ 0.000 นอกจากนพบวา ตวแปรอสระทกตวยกเวนพจนปฏสมพนธระหวาง Temp1*Insulate มความส าคญตอการพยากรณการใชแกสดวย p-value เทากบ 0.000, 0.000, 0.000 และ 0.000 ตามล าดบแตในขณะทพจนปฏสมพนธระหวาง Temp1*Insulate ไมมความส าคญตอการพยากรณปรมาณการใชแกสเนองจากคา p-value เทากบ 0.350 และคาสมประสทธการตดสนใจ (R-Sq) เทากบ 87.4% แสดงวาสมการถดถอยทไดนมความถกตองในการพยากรณอยในระดบทสงดงภาพขางลาง
The regression equation is
Amount = 6.35 - 1.17 temp1 - 1.93 insulate - 2.12 temp2
+ 0.30 temp1*insulate + 1.57 temp2*insulate
Predictor Coef SE Coef T P
Constant 6.3500 0.1580 40.19 0.000
temp1 -1.1667 0.2234 -5.22 0.000
insulate -1.9333 0.2234 -8.65 0.000
temp2 -2.1167 0.2234 -9.47 0.000
temp1*insulate 0.3000 0.3160 0.95 0.350
temp2*insulate 1.5667 0.3160 4.96 0.000
S = 0.3870 R-Sq = 87.4% R-Sq(adj) = 85.3%
Analysis of Variance
Source DF SS MS F P
Regression 5 31.2667 6.2533 41.75 0.000
Residual Error 30 4.4933 0.1498
Total 35 35.7600
Source DF Seq SS
temp1 1 0.9800
insulate 1 15.4711
temp2 1 10.6667
temp1*insulate 1 0.4672
temp2*insulate 1 3.6817
178
สมการถดถอยทไดสามารถเขยนไดดงน Amount = 6.35 - 1.17 temp1 - 1.93 insulate - 2.12 temp2 + 0.30 temp1*insulate + 1.57 temp2*insulate
สรป การวเคราะหขอมลทมตวแปรอสระเปนตวแปรเชงคณภาพเชน เพศ เชอชาตหรอศาสนา
เปนตนนนจะมการวเคราะหทแตกตางจากการวเคราะหทผานมาโดยตองสรางตวแปรหนใหมจ านวนนอยกวาจ านวนกลมของตวแปรเชงคณภาพอยหนงตว ตวแปรหนแตละตวจะแทนกลมของตวแปรเชงคณภาพเทยบกบกลมทไมไดถกสรางเปนตวแปรหน การสรางสมการถดถอยจะสรางโดยวธเดยวกนกบการสรางสมการถดถอยโดยไมมตวแปรหน
ค าถามทายบท 7.1 จงอธบายวาท าไมจงตองสรางตวแปรหนใหกบตวแปรอสระเชงคณภาพและหากไมสราง
ตวแปรหนแลวจะมผลตอการวเคราะหขอมลอยางไร 7.2 จงอธบายวาท าไมจงไมควรสรางตวแปรหนทมจ านวนเทากบจ านวนกลมของตวแปรอสระ
เชงคณภาพนน 7.3 การวาดแผนภาพกระจายระหวางตวแปรตามกบตวแปรอสระเชงปรมาณโดยแยกตามตวแปร
อสระเชงคณภาพชวยบอกถงความส าคญของตวแปรอสระเชงคณภาพตอตวแปรตามไดอยางไร 7.4 เกษตรกรสงเกตวาสภาพอากาศทแตกตางกนเชนรอนและเยนอาจท าใหเปดทเลยงโตชาลง
เกษตรกรจงท าการทดลองแบงเปดออกเปน 2 กลมโดยกลมแรกเลยงในทโลงแจงจ านวน 20 ตวและกลมท 2 เลยงในทรมจ านวน 30 ตวแลวชงน าหนกของเปด จงระบตวแปรอสระและตวแปรตาม หากตองสรางสมการถดถอยทานจะสรางตวแปรหนอยางไรและตความ อยางไร
7.5 ในการศกษาความสมพนธระหวางอายและเพศทมตอความดนโลหตมขอมลดงน
อาย (X1) 63 65 45 53 60 42 58 62 47 56 48 55 เพศ (X2) ชาย หญง ชาย ชาย หญง หญง ชาย ชาย หญง ชาย หญง หญง ความดน(Y) 161 208 130 148 200 145 152 140 135 141 158 173
จงวาดแผนภาพกระจายระหวางอายกบความดนโลหตแยกตามเพศ พรอมทงอธบายแผนภาพ ทได
179
7.6 จากขอ 7.5 จงสรางสมการถดถอยระหวางอายกบความดนโลหต พรอมทงวเคราะหสวนเหลอวาสมการถดถอยทไดเหมาะสมหรอไม
7.7 จากขอ 7.5 จงสรางสมการถดถอยระหวางอายกบความดนโลหตโดยใชเพศเปนตวแปรหน อธบายสมการถดถอยของแตละเพศ พรอมท งวเคราะหสวนเหลอวาสมการถดถอยทไดเหมาะสมหรอไม
7.8 จากขอ 5.10 หากน าผลไมม 3 กลนคอ สม, มะนาวและองน จงเขยนสมการเชงเสนทรวมตวแปรกลนเขาในสมการ
7.9 จากขอ 7.8 หากกลนสมคอขอมล 5 คาแรก กลนมะนาว 5 คาตอมาและกลนองน 4 คาทเหลอ จงวาดแผนภาพกระจายระหวาง pH กบความพงพอใจแยกตามกลน พรอมทงอธบายแผนภาพทได
7.10 จากขอ 7.9 จงสรางสมการถดถอยและพจารณาวากลนมผลตอความพงพอใจหรอไมทระดบนยส าคญ 0.05
7.11 หากตองการศกษาผลของความดนและชนดของแผนกรองทมตออตราการกรองโดยมขอมลดงน
ความดน (X1) 2 2 2 4 4 4 6 6 6 8 ชนดของแผนกรอง (X2) 1 2 3 1 2 3 1 2 3 1 อตราการกรอง (Y) 26 35 35 52 66 87 52 93 91 60
ความดน 8 8 10 10 ชนดของแผนกรอง 2 3 1 2 อตราการกรอง 101 138 65 115
จงวาดแผนภาพกระจายระหวางความดนกบอตราการกรองแยกตามชนดของแผนกรอง แผนกรองทง 3 ชนดมความชนทเหมอนกนหรอไม
7.12 จากขอ 7.11 จงสรางตวแปรหนของชนดของแผนกรองพรอมทงสรางสมการถดถอย คา ทไดจะอธบายไดอยางไร ตวแปรใดบางทมผลตออตราการกรอง
7.13 จากขอ 7.11 จงเพมพจนปฏสมพนธระหวางความดนและชนดของแผนกรองแลวอธบายผลลพธทได
7.14 นกวจยตองการศกษาความสมพนธระหวางระยะทางทขบ (พนกโลเมตร) และยหอของรถยนตทมตอคาใชจายในการบ ารงรกษา (พนบาท)โดยมขอมลดงน
180
ยหอ (X1) ระยะทาง (X2) คาใชจาย (Y) ฮอนดา 112 45.6 ฮอนดา 173 82.8 ฮอนดา 111 50.0 ฮอนดา 110 48.9 ฮอนดา 67 38.7 โตโยตา 124 53.1 โตโยตา 153 65.0 โตโยตา 113 47.5 โตโยตา 82 47.4 โตโยตา 123 53.3 นสสน 77 39.6 นสสน 143 61.8 นสสน 88 47.4 นสสน 136 63.9 นสสน 71 45.7 ฟอรด 87 46.0 ฟอรด 65 43.3 ฟอรด 131 62.1 ฟอรด 99 46.0 ฟอรด 137 55.3
จงวาดแผนภาพกระจายระหวางระยะทางทขบกบคาใชจายแยกตามยหอของรถยนต จงอธบายแผนภาพทได
7.15 จากขอ 7.14 จงสรางตวแปรหนของยหอของรถยนตพรอมทงสรางสมการถดถอย ระยะทาง ทขบและยหอของรถยนตมผลตอคาใชจายในการบ ารงรกษาหรอไมทระดบนยส าคญ 0.10
7.16 จากสมการถดถอยทไดในขอ 7.15 จงวเคราะหสวนเหลอวาตวแบบทไดเหมาะสมหรอไม