34
บทที่ 12 การวิเคราะห์สหสัมพันธ์และการถดถอย 88520159 PROBABILITY AND STATISTICS FOR COMPUTING 1/34

บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

บทที่ 12 การวิเคราะห์สหสัมพันธ์และการถดถอย

88520159

PROBABIL ITY AND STATIST ICS FOR COMPUTING

1/34

Page 2: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

การวิเคราะห์สหสัมพันธ์และการถดถอย

• การวิเคราะห์ความสัมพันธ์เชิงเหตุผลระหว่างตัวแปร 2 ตัว ที่เป็นตัวแปรเชิงปริมาณ

• โดยมีตัวแปรหนึ่งเป็นเหตุ เรียกว่า ตัวแปรต้น หรือ ตัวแปรอิสระ (Independent variable; X)

• อีกตัวแปรหนึ่งเป็นตัวแปรผล เรียกว่า ตัวแปรตาม (Dependent variable; Y)

• สมมติฐานที่ตั้งขึ้นคือเพื่อศึกษาหาความสัมพันธ์หรือศึกษาอิทธิพลระหว่างปัจจัยต่างๆ กับผลที่เกิดขึ้น

2/34

Page 3: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

การวิเคราะห์สหสัมพันธ์และการถดถอย

ตัวอย่าง

• ผู้วิจัยต้องการศึกษาอิทธิพลปริมาณและอุณหภูมิของอากาศ ว่ามีรูปแบบความสัมพันธ์อย่างไร ทิศทางใด และมีขนาดมาน้อยเพียงใด

• ตลอดจนสามารถท านายว่าปริมาณของตัวแปรตาม (Y) มีปริมาณเท่าใด ถ้าทราบค่าของปริมาณของตัวแปรอิสระ (X) โดยพยายามให้ค่าที่ประมาณหรือค่าที่พยากรณ์ได้มีความคาดเคลื่อนน้อย หรือมีค่าใกล้เคียงกับความเป็นจริงมากที่สุด

• โดยใช้เทคนิค Correlation และ Regression

3/34

Page 4: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ตัวแปรอิสระ และ ตัวแปรตาม

1. เกรดเฉลี่ยมีผลต่อรายได้หรือไม่◦ ตัวแปรอิสระ (X) คือ◦ ตัวแปรตาม (Y) คือ

2. คะแนนสอบกลางภาคมีผลต่อคะแนนสอบปลายภาคหรือไม่◦ ตัวแปรอิสระ (X) คือ◦ ตัวแปรตาม (Y) คือ

3. ยอดขายสินค้าขึ้นอยู่กับโฆษณาหรือไม่◦ ตัวแปรอิสระ (X) คือ◦ ตัวแปรตาม (Y) คือ

4/34

Page 5: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

แผนภาพการกระจาย

• เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ (X) และตัวแปรตาม (Y) ว่ามีลักษณะแบบใด

• ในการวิเคราะห์ Regression และ Correlation จ าเป็นต้องดูลักษณะสัมพันธ์ทั้ง X และ Y ว่ามีความสัมพันธ์ในเชิงเส้นตรงหรือไม่

• โดยน าค่า X และ Y มาท าการ Scatter Plot

5/34

Page 6: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

แผนภาพการกระจาย

ลักษณะของ Scatter Plot มีดังนี้

6/34

Page 7: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

สัมประสิทธิ์สหสัมพันธ์

• ค่าสัมประสิทธิ์สหสัมพันธ์อย่างง่าย (Simple CorrelationCoefficient) เป็นค่าที่วัดความสัมพันธ์ของ X กับ Y ว่ามีขนาดและทิศทางของความสัมพันธ์อย่างไร

ก าหนดให้ 𝜌 คือ สัมประสิทธิ์สหสัมพันธ์อย่างง่ายของประชากร

เมื่อ −1 ≤ 𝜌 ≤ 1

• เนื่องจากในการวิเคราะห์สหสัมพันธ์ ไม่ได้เก็บข้อมูลจากประชากร แต่เป็นการเก็บข้อมูลจากตัวอย่าง

•ดังนั้นค่าสัมประสิทธิ์ที่ได้ จึงเป็นค่าสัมประสิทธิ์สหสัมพันธ์อย่างง่ายของตัวอย่าง โดยใช้สัญลักษณ์ว่า 𝑟

7/34

Page 8: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

สัมประสิทธิ์สหสัมพันธ์

ค่าสัมประสิทธิ์สหสัมพันธ์อย่างง่ายของตัวอย่าง (𝑟) ค านวณได้ดังนี้

𝑟 =σ𝒊=𝟏𝒏 𝒙𝒊𝒚𝒊−𝒏𝒙𝒚

σ𝒊=𝟏𝒏 𝒙𝒊

𝟐−𝒏ഥ𝒙𝟐 σ𝒊=𝟏𝒏 𝒚𝒊

𝟐−𝒏ഥ𝒚𝟐

ความหมายของค่า 𝑟

1. ค่า 𝑟 เป็น + แสดงว่า X กับ Y มีความสัมพันธ์ในทิศทางเดียวกัน

2. ค่า 𝑟 เป็น - แสดงว่า X กับ Y มีความสัมพันธ์ในทิศทางตรงกันข้าม

3. ค่า 𝑟 เป็น 0 แสดงว่า X กับ Y ไม่มีความสัมพันธ์กันเลย

4. ค่า |𝑟| มีค่าเข้าใกล้ 1 แสดงว่า X กับ Y มีความสัมพันธ์กันมาก

5. ค่า |𝑟| มีค่าเข้าใกล้ 0 แสดงว่า X กับ Y มีความสัมพันธ์กันน้อย

8/34

Page 9: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

สมมติฐานของการทดสอบ

𝐻0: 𝜌 = 0 (X กับ Y ไม่มคีวามสัมพันธ์กัน)

𝐻1: 𝜌 ≠ 0 (X กับ Y มีความสัมพันธ์กัน)

สถิติทดสอบ

𝑡 =𝑟 𝑛 − 1

1 − 𝑟2, 𝑑𝑓 = 𝑛 − 2

เขตวิกฤตและการสรุป

จะปฏิเสธ 𝐻0 เม่ือค่า 𝑡 มากกว่าหรือเท่ากับ 𝑡𝛼,𝑛−2 หรือ 𝑡 น้อยกว่าหรือเท่ากับ −𝑡𝛼,𝑛−2หรือใช้เกณฑ์ของ p-value นั่นคือ จะปฏิเสธ 𝐻0 เมื่อ p-value มีค่าน้อยกว่าระดับนัยส าคัญ

สัมประสิทธิ์สหสัมพันธ์

9/34

Page 10: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ค าสั่งโปรแกรม R วิเคราะห์ความสัมพันธ์

• ฟังก์ชันส าหรับหาค่า 𝑟 เพื่อหาขนาดและทิศทางของความสัมพันธ์

cor(x, y)

• ฟังก์ชันหาค่า p-value เพื่อทดสอบสมมติฐาน

cor.test(x, y)

เมื่อ x และ y คือ ข้อมูลแบบ vector ของตัวแปรอิสระและตัวแปรตาม

10/34

Page 11: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ตัวอย่างที่ 1 วิเคราะห์ความสัมพันธ์

แผนกวิจัยตลาดของบริษัทวีสิน จ ากัด ต้องการศึกษาความสัมพันธ์ระหว่างค่าใช้จ่ายในการโฆษณาและยอดขาย โดยที่ข้อมูลเกี่ยวกับค่าใช้จ่ายและยอดขายในรอบ 8 ปีที่ผ่านมา มีดังนี้

ปีที่ ค่าโฆษณา (แสนบาท) ยอดขาย (แสนบาท)

1 5 40

2 7 50

3 10 60

4 12 65

5 15 70

6 20 80

7 25 92

8 30 10011/34

Page 12: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ตัวอย่างที่ 1 วิเคราะห์ความสัมพันธ์

> advertise=c(5,7,10,12,15,20,25,30)> sales=c(40,50,60,65,70,80,92,100)> plot(advertise,sales)

สรุป จากกราฟพบว่า ค่าโฆษณาและยอดขายมีความสัมพันธ์ทิศทางเดียวกัน

1.1 แสดงภาพภาพการกระจายระหว่างค่าโฆษณาและยอดขาย

12/34

Page 13: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ตัวอย่างที่ 1 วิเคราะห์ความสัมพันธ์1.2 ทดสอบว่าค่าโฆษณาและยอดขายมีความสัมพันธก์ันหรือไม่ ที่ระดับนัยส าคัญ 0.05

> advertise=c(5,7,10,12,15,20,25,30)> sales=c(40,50,60,65,70,80,92,100)> cor.test(advertise,sales)

Pearson's product-moment correlationdata: advertise and slaest = 16.574, df = 6, p-value = 3.077e-06alternative hypothesis: true correlation is not equal to 095 percent confidence interval:0.9395266 0.9981301sample estimates:

cor0.9892546

13/34

Page 14: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ทดสอบสมมติฐาน

1. ตั้งสมมติฐาน𝐻0: 𝜌 = 0 (X กับ Y ไม่มีความสัมพันธ์กัน)𝐻1: 𝜌 ≠ 0 (X กับ Y มีความสัมพันธ์กัน)

2. ก าหนดระดับนัยส าคัญ = 0.05

3. หาค่า p-value = 3.077e-06 ซึ่งน้อยกว่าระดับนัยส าคัญ

4. สรุป ปฏิเสธ 𝐻0 แสดงว่า ทีร่ะดับนัยส าคัญ 0.05ค่าโฆษณาและยอดขายมีความสัมพันธ์กัน

ตัวอย่างที่ 1 วิเคราะห์ความสัมพันธ์

14/34

Page 15: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ตัวอย่างที่ 1 วิเคราะห์ความสัมพันธ์

> advertise=c(5,7,10,12,15,20,25,30)> sales=c(40,50,60,65,70,80,92,100)> cor(advertise,sales)[1] 0.9892546

สรุป ค่า 𝑟 = 0.9892546 แสดงว่า ค่าโฆษณาและยอดขายมีความสัมพันธ์กันขนาด 0.9892546 ซึ่งมีค่าสูงมาก และมีความสัมพันธ์ไปในทิศทางเดียวกัน

1.3 ค านวณหาค่าสัมประสิทธิ์สหสัมพันธ์ (𝑟) หรือ หาขนาดความสัมพันธ์ของค่าโฆษณาและยอดขาย

15/34

Page 16: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

การวิเคราะห์การถดถอย (Regression Analysis)

• การวิเคราะห์การถดถอยเป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรตาม (Y) และ ตัวแปรอิสระ (X) ที่อยู่ในรูปแบบสมการเชิงคณิตศาสตร์

• โดยที่ รูปแบบการถดถอยแบบง่ายเชิงเส้นตรงที่แทนความสัมพันธ์ของ X และ Y คือ

𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝜖𝑖 , 𝑖 = 1, 2, …, n

เมื่อ 𝑌𝑖 เป็นค่าสังเกตที่ 𝑖 ของตัวแปรตาม

𝑋𝑖 เป็นค่าสังเกตที่ 𝑖 ของตัวแปรอิสระ

𝛽0 เป็นจุดที่เส้นถดถอยตัดแกน Y หรือค่าของ Y เมื่อ X=0

𝛽1 เป็นค่าความสันของเส้นตรง ซึ่งเป็นค่าที่แสดงถึงอัตราการเปลี่ยนแปลงของ Y เมื่อ X เปลี่ยนไป 1 หน่วย

𝜖𝑖 เป็นความคาดเคลื่อนที่เกิดขึ้นโดยสุ่ม

16/34

Page 17: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

การวิเคราะห์การถดถอยกราฟแสดงความสัมพันธ์ระหว่าง X และ Y และสมการประมาณค่า

17/34

Page 18: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

การวิเคราะห์การถดถอย

ข้อตกลงเบื้องต้นของรูปแบบในการวิเคราะห์การถดถอย มีดังนี้

1. ความคาดเคลื่อน (𝜖𝑖) มีการแจกแจงที่เป็นอิสระแบบปกติมีค่าเฉลี่ยเท่ากับ 0 และมีความแปรปรวนเท่ากับ 𝜎2

2. 𝑋𝑖 เป็นตัวแปรอิสระที่ก าหนดค่าได้ และวัดโดยไม่มีความคลาดเคลื่อน

3. จากข้อสมมติพบว่าที่แต่ละค่าของ X จะมีประชากรของ Y ที่มีการแจกแจงปกติ มีค่าเฉลี่ย 𝛽0 + 𝛽1𝑋 และมีค่าความปรปรวนเท่ากับ 𝜎2

4. X และ Y มีความสัมพันธ์แบบเส้นตรง

18/34

Page 19: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

การวิเคราะห์การถดถอย

จากข้อตกลกตงที่ 1 จะสามารถหาค่าเฉลี่ยของ Y เมื่อก าหนดทุกค่าของ X ได้ดังนี้

𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝜖𝑖𝐸(𝑌𝑖) = 𝐸(𝛽0 + 𝛽1𝑋𝑖 + 𝜖𝑖)

= 𝐸(𝛽0) + 𝐸(𝛽1𝑋𝑖) + 𝐸(𝜖𝑖)

= 𝛽0 + 𝛽1𝑋𝑖

สมการถดถอยตัวอย่าง𝑌𝑖 = 𝑏0 + 𝑏1𝑋𝑖

𝑌𝑖 เป็นค่าประมาณของ 𝐸(𝑌𝑖)

𝑏0 เป็นค่าประมาณของ 𝛽0

𝑏1 เป็นค่าประมาณของ 𝛽1

19/34

Page 20: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

การวิเคราะห์การถดถอยการหาค่า 𝑏0 และ 𝑏1 จะใช้วิธีก าลังสองนอ้ยที่สดุ (Least Square Method) ซึ่งเป็นวิธีการหา 𝑏0 และ 𝑏1 ที่ท าให้ผลบวกก าลังสองของความคลาดเคลื่อน (Sum of Square Error, SEE) ซึ่ง 𝑆𝐸𝐸 = σ𝜖2 มีค่าต่ าที่สุด

จาก 𝜖𝑖 = 𝑌𝑖 − 𝑌𝑖 คือความคลาดเคลื่อนจากการประมาณค่าที่ 𝑖 จะได้

𝑆𝐸𝐸 = σ𝜖𝑖2 = σ(𝑌𝑖 − 𝑌𝑖)

2= σ(𝑌𝑖 − 𝑏0 − 𝑏1𝑋𝑖)2

โดยการหาอนุพนัธ์บางสว่นของ SEE เทียบกับ 𝑏0 และ 𝑏1 แล้วก าหนให้เท่ากับศูนย์ แล้วแก้วสมการหาค่าของ 𝑏0 และ 𝑏1 ได้ค่าดังนี้

𝑏1 =𝑛σ𝑋𝑖𝑌𝑖 − σ𝑋𝑖 σ𝑌

𝑖

𝑛σ𝑋𝑖2 − (σ𝑋𝑖)2

𝑏0 = ത𝑌 − 𝑏1 ത𝑋

20/34

Page 21: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

การวิเคราะห์การถดถอย

ความหมายของค่าสัมประสิทธิ์การถดถอย (𝑏0 และ 𝑏1)

• 𝑏0 เป็นค่าที่บอกให้ทราบว่า ถ้าค่า X เป็น 0 แล้วค่า Y จะมีค่าเป็น 𝑏0 โดยเฉลี่ย เครื่องหมายของ 𝑏0 เป็นได้ทั้งบวกและลบ ถ้าเป็นลบแสดงว่าเส้นถดถอยตัดแกน Y ต่ ากว่าจุดก าเนิด (Origin) แต่ถ้าเครื่องหมายเป็นบวก ก็แสดงว่า เส้นถดถอยตัดแกน Y เหนือจุดก าเนิด

• 𝑏1 เป็นอัตราการเพ่ิมหรือลดลงของ Y เมื่อ X มีค่าเพิ่มขึ้น 1 หน่วย เมื่อ 𝑏1 มีค่าเป็นลบจะบอกให้ทราบว่าตัวแปร X กับ Y มีความสัมพันธ์กันในทางตรงกันข้าม นั่นคือเมื่อ X มีค่าเพิ่มขึ้น Y จะมีค่าลดลง แต่ถ้า 𝑏1 มีค่าเป็นบวก X กับ Y จะมีความสัมพันธ์ไปในทางเดียวกันคือ เม่ือ X มีค่าเพิ่มขึ้น Y ก็จะเพิ่มด้วย

21/34

Page 22: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ค าสั่งโปรแกรม R สร้างสมการถดถอย

• ฟังก์ชันส าหรับหาค่าสัมประสิทธิ์การถดถอย (𝑏0 และ 𝑏1)

lm(y ~ x)

เมื่อ y และ x คือ ข้อมูลแบบ vector ของตัวแปรตามและตัวแปรอิสระ

** ฟังก์ชัน lm จะใช้คู่กับ ฟังก์ชัน anova และ summary

22/34

Page 23: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ตัวอย่างที่ 2 สร้างสมการถดถอย

จากตัวอย่างที่ 1 จะเห็นว่ามูลค่าโฆษณาและยอดขายมีความสัมพันธ์ในทิศทางเดียวกัน และมีแนวโน้มเป็นเส้นตรง ซึ่งสามารถสร้างสมการแทนความสัมพันธ์ของค่าโฆษณาและยอดขายได้ดังนี้

> advertise=c(5,7,10,12,15,20,25,30)> sales=c(40,50,60,65,70,80,92,100)> model=lm(sales~advertise)> modelCall:lm(formula = sales ~ advertise)Coefficients:(Intercept) advertise

34.239 2.283

ตัวแปรตาม ตัวแปรอิสระ

𝑏0 𝑏1

23/34

Page 24: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ตัวอย่างที่ 2 สร้างสมการถดถอย

• จากการสร้างสมการถดถอยด้วยฟังก์ชัน lm จะได้ค่าว่า

ค่า 𝑏0 = 34.239 และ ค่า 𝑏1 = 2.283

ซึ่งมีค่าเป็นบวก แสดงว่าตัวแปรทั้งสองมีความสัมพันธ์ไปในทิศทางเดียวกัน และสามารถเขียนสมการถดถอยได้ คือ

𝑠𝑎𝑙𝑒𝑠 = 34.239 + 2.283advertise

• จากสมการถดถอย จะได้ความหมายของสัมประสิทธิ์การถดถอยดังนี้

𝑏0 หมายถึง เมื่อค่าใช้จ่ายในการโฆษณาเป็น 0 บาท จะมียอดขาย 3,423,900 บาท โดยเฉลี่ย

𝑏1 หมายถึง เมื่อค่าใช้จ่ายในการโฆษณาเพ่ิมขึ้น 1 แสนบาท จะมียอดขายเพ่ิมขึ้น 228,300 บาท โดยเฉลี่ย

24/34

Page 25: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

การทดสอบสมมติฐานเกี่ยวกับสมการถดถอย

เป็นการทดสอบว่าตัวแปรอิสระ (X) มีอิทธิพลต่อตัวแปรตาม (Y) หรือไม่ หรือกล่าวอีกนัยหนึ่งก็คือท าการทดสอบว่าตัวแปร X มีผลต่อตัวแปร Y หรือไม่ มีขั้นตอนการทดสอบสมมติฐานดังนี้

1. ตั้งสมมติฐานการทดสอบ𝐻0: 𝛽 = 0 (ตัวแปรอิสระไม่มีอิทธิพลต่อตัวแปรตาม)𝐻1: 𝛽 ≠ 0 (ตัวแปรอิสระมีอิทธิพลต่อตัวแปรตาม)

2. ก าหนดระดับนัยส าคัญ

3. ค านวณค่า p-value โดยใช้ตัวทดสอบ F

4. สรุป

25/34

Page 26: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ค าสั่งโปรแกรม R ทดสอบสมมติฐานเกี่ยวกับสมการถดถอย

• ฟังก์ชันส าหรับหาสมการถดถอย

• และฟังก์ชันทดสอบสมมติฐานเกี่ยวกับสมการถดถอย

เมื่อ y และ x คือ ข้อมูลแบบ vector ของตัวแปรตามและตัวแปรอิสระ

model = lm(y ~ x)anova(model)

26/34

Page 27: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ตัวอย่างที่ 3 ทดสอบสมมติฐานเกี่ยวกับสมการถดถอย

จากตัวอย่างที่ 1 จงทดสอบสมติฐานเกี่ยวกับสมการถดถอย ที่ระดับนัยส าคัญ 0.05

> advertise=c(5,7,10,12,15,20,25,30)> sales=c(40,50,60,65,70,80,92,100)> model=lm(sales~advertise)> anova(model)Analysis of Variance TableResponse: sales

Df Sum Sq Mean Sq F value Pr(>F) advertise 1 2845.72 2845.72 274.7 3.077e-06 ***Residuals 6 62.16 10.36 ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

p-value

27/34

Page 28: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ตัวอย่างที่ 3 ทดสอบสมมติฐานเกี่ยวกับสมการถดถอย

1. ตั้งสมมติฐานการทดสอบ𝐻0: 𝛽 = 0 (ตัวแปรอิสระไม่มีอิทธิพลต่อตัวแปรตาม)𝐻1: 𝛽 ≠ 0 (ตัวแปรอิสระมอีิทธิพลต่อตัวแปรตาม)

2. ก าหนดระดับนัยส าคัญ = 0.05

3. ค านวณค่า p-value = 3.077e-06 ซึ่งมีค่าน้อยกว่าระดับนัยส าคัญ

4. สรุป ปฎิเสธ 𝐻0 ท่ีระดับนัยส าคัญ 0.05 ตัวแปรอิสระมีอิทธิพลต่อตัวแปรตามนั้นคือ ค่าโฆษณามีผลต่อยอดขาย

28/34

Page 29: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

การพยากรณ์

• เมื่อเราสร้างสมการถดถอยที่ตัวแปรอิสระมีความสัมพันธ์กับตัวแปรตามได้แล้ว อีกหนึ่งวัตถุประสงค์ของการสร้างสมการถดถอยคือเพื่อใช้ในการพยากรณ์ค่าของตัวแปรที่ไม่ทราบ (Y) โดยก าหนดค่าของตัวแปรอิสระ X

• ซึ่งสามารถพยากรณ์ได้โดยแทนค่าของตัวแปรอิสระ X ลงในสมการถดถอยแล้วค านวณหาค่า Y

29/34

Page 30: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ตัวอย่างที่ 4 การพยากรณ์

จากตัวอย่างที่ 1 จงพยากรณ์ค่ายอดขายเมื่อก าหนดให้ค่าโฆษณามีค่าเป็น 230,000 บาท

จากการก าหนดค่าโฆษณา 230,000 บาท น่ันคือให้ advertise=2.3 จึงแทนค่าลงในสมการ ดังนี้

𝑠𝑎𝑙𝑒𝑠 = 34.239 + 2.283advertise

= 34.239 + 2.283 ∗ 2.3

= 39.4899

สรุป เมื่อก าหนดให้ค่าโฆษณา 230,000 บาท แล้วยอดขายจะมีค่าเป็น 3,948,900 บาท

30/34

Page 31: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

สัมประสิทธิ์การตัดสินใจ

• สัมประสิทธ์การตัดสินใจ (coefficient of determination: 𝑅2) เป็นค่าที่ใช้วัดว่าตัวแปรอิสระนั่นมีอิทธิพลต่อความผันแปรของค่าของตัวแปรตาม Y มากน้อยเพียงใด หรืออีกนัยหนึ่งเป็นค่าที่บอกว่าสมการถดถอยที่ได้นั้นเป็นสมการที่เหมาะสมหรือไม่

• ค่า 𝑅2 มีค่าอยู่ในช่วง 0 ถึง 1 • ถ้า 𝑅2 มีค่าเข้าใกล้ 1 หมายถึงตัวแปรอิสระมีอิทธิพลต่อความผันแปรของตัว

แปรตามมาก • ถ้า 𝑅2 มีค่าเข้าใกล้ 0 แสดงว่ามีอิทธิพลต่อความผันแปรของตัวแปรตามน้อย

31/34

Page 32: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ค าสั่งโปรแกรม R สัมประสิทธิ์การตัดสินใจ

• ฟังก์ชันส าหรับหาสมการถดถอย

• และฟังก์ชันหาสัมประสิทธิ์การตัดสินใจ

เมื่อ y และ x คือ ข้อมูลแบบ vector ของตัวแปรตามและตัวแปรอิสระ

model = lm(y ~ x)summary(model)

32/34

Page 33: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ตัวอย่างที่ 5 สัมประสิทธิ์การตัดสินใจ

จากตัวอย่างที่ 1 จงหาหาสัมประสิทธิ์การตัดสินใจ (𝑅2)> advertise=c(5,7,10,12,15,20,25,30)> sales=c(40,50,60,65,70,80,92,100)> model=lm(sales~advertise)> summary(model)Call:lm(formula = sales ~ advertise)Residuals:

Min 1Q Median 3Q Max -5.6538 -0.8468 0.3942 1.8702 3.3654 Coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 34.2390 2.4194 14.15 7.78e-06 ***advertise 2.2830 0.1377 16.57 3.08e-06 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.219 on 6 degrees of freedom

Multiple R-squared: 0.9786,Adjusted R-squared: 0.9751

F-statistic: 274.7 on 1 and 6 DF, p-value: 3.077e-06

𝑅2

33/34

Page 34: บทที่12janya/88520159/... · 2018-11-20 · แผนภาพการกระจาย •เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปรอิสระ

ตัวอย่างที่ 5 สัมประสิทธิ์การตัดสินใจ

สรุป จะได้ว่าสัมประสิทธิ์การตัดสินใจ เท่ากับ 0.9786 หมายถึงค่าโฆษณามีอิทธิพลต่อความผันแปรของยอดขาย 97.86% ซึ่งมีค่าสูงมาก

34/34