31
บทที16 สถิติในการวิจัย 16.1 บทนํา 16.2 ขอมูล 16.3 การประมาณคาพารามิเตอร 16.4 การทดสอบสมมติฐาน 16.5 นัยสําคัญทางสถิติ และนัยสําคัญทาง คลินิก 16.6 การทดสอบไคสแควร 16.7 การวิเคราะหความแปรปรวน 16.8 สหสัมพันธและความถดถอย สมรัตน เลิศมหาฤทธิ16.1 บทนํา ปจจุบันนีสถิติถูกนํามาใชอยางแพรหลายในงานตางๆ หลายสาขา เชน ธุรกิจ สังคมศาสตร ระบาดวิทยา การแพทย และสาธารณสุข ฯลฯ ในทางการแพทยนั้น สถิติถูกนํามาใชในงานโรงพยาบาล, การตรวจสอบ, การจัดสรรทรัพยากร และดานอื่นๆ การทําวิจัยจําเปนตองใชสถิติมาชวยตั้งแตเริ่มตน ไดแก การ คํานวณขนาดตัวอยางที่เหมาะสม กระบวนการสุกระบวนการจัดสรร หลังจากเก็บขอมูลได สถิติเปนเครื่องมือสําคัญที่ใชในการวิเคราะห จนกระทั่งสุดทายคือการรายงานผลและการตีพิมพก็มีการแสดงผลทางสถิติ เพื่อแสดงถึงความนาเชื่อถือของผลการวิจัย และการนําไปใช ดังนั้น ถาการ ใชสถิติไมถูกตอง ก็จะทําใหผลที่นําเสนอนั้นไมถูกตอง เมื่อผูอานนําไปใชก็ จะผิดพลาดได 16.2 ขอมูล (Data) ขอมูลแบงอยางกวางๆ ไดเปน 2 กลุคือ ขอมูลเชิงลักษณะ (Categorical data) หรือขอมูลเชิงคุณภาพ (Qualitative data) และขอมูล เชิงจํานวน (Numerical data) หรือขอมูลเชิงปริมาณ (Quantitative data) ขอมูลเชิงลักษณะ (Categorical data) จําแนกตอไปไดเปน ชนิด สองคุณลักษณะ และ ชนิดมากกวาสองคุณลักษณะ ขอมูลชนิดสองคุณลักษณะ เชน เพศชาย หรือหญิง, เปนโรคหรือไม เปนโรค ขอมูลชนิดนี้อาจมีชื่อเรียกไดหลายอยาง ไดแก Binary data, Dichotomous data, yes/no data, Attribute data และ 0-1 data (ในที่มี การใชตัวเลข 0 และ 1 ใชแทนคาลักษณะของขอมูล) ขอมูลชนิดมากกวาสองคุณลักษณะ มีสองแบบ ถาตางกันเพียง ลักษณะที่เห็นเรียกวา Nominal data เชน หมูเลือด A, B, AB, O แตถา ลักษณะที่เห็นนั้นสามารถบอกความแตกตางเปนลําดับเรียกวา Ordinal data เชน ระดับความเจ็บปวด นอย, ปานกลาง, มาก ขอมูลแบบหลังนี้อาจ ลดคุณลักษณะลงใหเหลือเพียง 2 กลุมลักษณะก็ได เชน ความเจ็บปวดจาก เดิมวัด 3 ระดับสามารถวัดเพียง 2 ระดับคือ ปวด/ไมปวด การทําเชนนี้อาจมี ความจําเปนในการวิเคราะหและการนําเสนอในบางกรณี แตมีผลใหสูญเสีย รายละเอียดของขอมูลนั้นได

สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

บทที่ 16

สถิติในการวิจัย

16.1 บทนํา

16.2 ขอมูล

16.3 การประมาณคาพารามิเตอร

16.4 การทดสอบสมมติฐาน

16.5 นัยสําคัญทางสถิติ และนัยสําคัญทาง

คลินิก

16.6 การทดสอบไคสแควร

16.7 การวิเคราะหความแปรปรวน

16.8 สหสัมพันธและความถดถอย

สมรัตน เลิศมหาฤทธิ์

16.1 บทนํา ปจจุบันนี้ สถิติถูกนํามาใชอยางแพรหลายในงานตางๆ หลายสาขา

เชน ธุรกิจ สังคมศาสตร ระบาดวิทยา การแพทย และสาธารณสุข ฯลฯ

ในทางการแพทยนั้น สถิติถูกนํามาใชในงานโรงพยาบาล, การตรวจสอบ,

การจัดสรรทรัพยากร และดานอื่นๆ

การทําวิจัยจําเปนตองใชสถิติมาชวยตั้งแตเริ่มตน ไดแก การ

คํานวณขนาดตัวอยางที่เหมาะสม กระบวนการสุม กระบวนการจัดสรร

หลังจากเก็บขอมูลได สถิติ เปนเครื่องมือสําคัญที่ ใชในการวิ เคราะห

จนกระทั่งสุดทายคือการรายงานผลและการตีพิมพก็มีการแสดงผลทางสถิติ

เพื่อแสดงถึงความนาเชื่อถือของผลการวิจัย และการนําไปใช ดังนั้น ถาการ

ใชสถิติไมถูกตอง ก็จะทําใหผลที่นําเสนอนั้นไมถูกตอง เมื่อผูอานนําไปใชก็

จะผิดพลาดได

16.2 ขอมูล (Data) ขอมูลแบงอยางกวางๆ ไดเปน 2 กลุม คือ ขอมูลเชิงลักษณะ

(Categorical data) หรือขอมูลเชิงคุณภาพ (Qualitative data) และขอมูล

เชิงจํานวน (Numerical data) หรือขอมูลเชิงปริมาณ (Quantitative data)

ขอมูลเชิงลักษณะ (Categorical data) จําแนกตอไปไดเปน ชนิด

สองคุณลักษณะ และ ชนิดมากกวาสองคุณลักษณะ

ขอมูลชนิดสองคุณลักษณะ เชน เพศชาย หรือหญิง, เปนโรคหรือไม

เปนโรค ขอมูลชนิดนี้อาจมีชื่อเรียกไดหลายอยาง ไดแก Binary data,

Dichotomous data, yes/no data, Attribute data และ 0-1 data (ในที่มี

การใชตัวเลข 0 และ 1 ใชแทนคาลักษณะของขอมูล)

ขอมูลชนิดมากกวาสองคุณลักษณะ มีสองแบบ ถาตางกันเพียง

ลักษณะที่เห็นเรียกวา Nominal data เชน หมูเลือด A, B, AB, O แตถา

ลักษณะที่เห็นนั้นสามารถบอกความแตกตางเปนลําดับเรียกวา Ordinal

data เชน ระดับความเจ็บปวด นอย, ปานกลาง, มาก ขอมูลแบบหลังนี้อาจ

ลดคุณลักษณะลงใหเหลือเพียง 2 กลุมลักษณะก็ได เชน ความเจ็บปวดจาก

เดิมวัด 3 ระดับสามารถวัดเพียง 2 ระดับคือ ปวด/ไมปวด การทําเชนนี้อาจมี

ความจําเปนในการวิเคราะหและการนําเสนอในบางกรณี แตมีผลใหสูญเสีย

รายละเอียดของขอมูลนั้นได

Page 2: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

225

สถิติในการวิจัย

ขอมูลเชิงจํานวน (Numerical data) จําแนก

ออกไดเปน ขอมูลไมตอเนื่อง (Discrete data) และ

ขอมูลตอเนื่อง (Continuous data)

ขอมูลไมตอเนื่อง เปนขอมูลใชนับและคาที่ไดจะ

ไมมีความตอเนื่อง เชน จํานวนคนไขที่ตรวจที่แผนกผูปวย

นอก, จาํนวนครั้งการเตนของหัวใจ

ขอมูลตอเนื่อง เปนขอมูลที่ไดจากการวัดคาไม

สามารถแยกไดเด็ดขาด แมจะแสดงจํานวนเต็ม เชน

น้ําหนัก, สวนสูง, ความดันโลหิต ขอมูลชนิดตอเนื่องนี้มี

กําลังในการวิเคราะหทางสถิติมากกวาชนิดอื่น ๆ

การวัดในระดับตางๆ และชนิดของขอมูลมี

ความสําคัญในการวิเคราะห แสดงไดตามแผนผังตอไปนี้

16.2.1 การพรรณนาขอมูล(Describing data) ส่ิงที่ควรตองมีในการพรรณนา คือ แนวโนมเขาสู

สวนกลาง และความผันแปรของขอมูล ซึ่งมีวิธีในการ

คํานวณหลายวิธี ดังนี้ i. วิธีบอกแนวโนมเขาสูสวนกลาง (measures of central tendency) วิธีที่นิยมใชและรูจักกัน คือ

ก. คาเฉล่ีย (Mean) หรือคาเฉลี่ยเลขคณิต

(arithmatic mean) ซึ่งไดจากการรวมทุกๆ คาของขอมูล

แลวหารดวยจํานวนตัวอยาง วิธีนี้มีขอดีคือ คาทุกคาไดถูก

นํามาใช และคาเฉลี่ยสามารถนําไปใชในการทดสอบ

สมมติฐานตอ ไปได แตค า เฉลี่ ยก็ มี ข อ ไมดี คื อ ถูก

กระทบกระเทือนไดงาย จากขอมูลบางอันที่มีคาสูงหรือต่ํา

เกินไป ทําใหคาเฉลี่ยสูงหรือต่ํากวาความเปนจริงได

ข. มัธยฐาน (Median) เปนคาที่อยูในตําแหนง

ตรงกลางของขอมูลเมื่อนําขอมูลทั้งหมดมาเรียงกัน

ตามลําดับคาจากมากไปนอย ขอดีของวิธีนี้คือ ถามีการ

บันทึกผิดพลาดไปบางคา มัธยฐานอาจไมถูกกระทบ หรือ

กรณีที่ขอมูลมีคาสูงหรือต่ําเกินไปจะไมทําใหคามัธยฐาน

เปล่ียนแปลง จึงมีความเหมาะสมกับขอมูลที่มีความ

แตกตางของคามากๆ ปจจุบันงานวิจัยตางๆ มีการใช

มัธยฐานแพรหลาย บางครั้ง นําเสนอคูกับคาเฉลี่ย

ค. ฐานนิยม (Mode) เปนการบอกคาที่มีความถี่

มากที่สุดหรือพบไดบอยที่สุด กรณีที่มีคาเกิดขึ้นบอยพอๆ

กัน 2 คา จะเรียกวา bimodal ฐานนิยมเหมาะกับขอมูล

ชนิดจําแนกกลุม ตัวอยางที่ 16.1 จากขอมูลระยะเวลา (วัน) ที่อยูใน

โรงพยาบาลของคนไข จํานวน 12 ราย มีดังนี้

3, 3, 4, 5, 7, 7, 7, 9, 10, 11, 12, 18

จงบอกจํานวนวันโดยเฉลี่ยที่คนไขอยูโรงพยาบาล

การคํานวณ

คาเฉลี่ย = 3+3+.................+18) / 12 = 8

คามัธยฐาน = 7 7

2

+ = 7

คาฐานนิยม = 7 = 7

วิเคราะห เนื่องจากขอมูลมีคาแตกตางกันมาก วิธีบอก

แนวโนมเขาสูสวนกลางที่เหมาะสมจึงควรใช มัธยฐาน

ตอบ จํานวนวันที่คนไข อยูโรงพยาบาล คือ 7 วันโดยเฉลี่ย ii. วิธีบอกความผันแปร (measures of variability) มีวิธี

ตางๆ ที่ใชไดแก

ก. พิสัย (Range) หมายถึง คาสูงสุด ถึงคา

ต่ําสุด เปนวิธีบอกความผันแปรที่คราว คือไมมีการ

กล่ันกรองคาตางๆในขอมูลนั้น ไมนิยมใชมากนัก

ข. เปอรเซนไทล (Percentile) หมายถึงคาของ

ขอมูลที่จํานวนต่ํากวาคานั้นวามีกี่เปอรเซ็นต เชน P20 ของ

น้ําหนักตัวของนักเรียนชั้นประถมแหงหนึ่งเทากับ 28 กก.

หมายความวามีจํานวนนักเรียน 20% ที่มีน้ําหนักต่ํากวา

28 กก. การบอกเปนเปอรเซ็นตไตล คือการแบงจํานวนของ

ขอมูลทั้งหมดเปน 100 สวน ถาแบงจํานวนทั้งหมดของ

TIK
Stamp
Page 3: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

226

สถิติในการวิจัย

ขอมูลเปน 10 สวน จะเรียกวา เดไซล (Decile) และถา

แบงเปน 4 สวน จะเรียกวา ควอไทล (Quartile) วิธีที่นิยม

ในการบอกความผันแปรของขอมูลซึ่งใชคูกับมัธยฐาน คือ

Inter-quartile range หรือคือ คาระหวาง P25 และ P75 หรือ

Q3-Q1

ค . ค าความแปรปรวน (Variance) และ คาเบ่ียงเบนมาตรฐาน (Standard deviation, SD) คาแปรปรวน (Variance) คือผลรวมของความตางของ

ขอมูลแตละอันจากคาเฉลี่ย ดังสูตร

Variance = 2

i(X X )

n 1

−−

โดย Xi = คาที่สังเกต, X = คาเฉลี่ย,

n = จํานวนคาสังเกต

คาเบี่ยงเบนมาตรฐาน (SD) คือรากที่สองของคาความ

แปรปรวน ( Variance )

SD = ∑ −

2i(X X )

n 1

โดย Xi = คาที่สังเกต, X = คาเฉลี่ย,

n = จํานวนคาสังเกต

คา SD นิยมใชมากกวา

เหตุผลที่ไมนิยมใชคาแปรปรวน เนื่องจากหนวย

เปนกําลังสอง จึงตองถอดรากที่สอง (ซึ่งคือ SD) เพื่อให

หนวยเหมือนกับขอมูล จึงจะนําไปใชในการวิเคราะหตอไป

ได

16.2.2 การนําเสนอขอมูล (Data presentation)

ก. ในรูปของจํานวน (numerical presentation) ไมควรนําเสนอขอมูลในรูปของคาเฉลี่ยเพียง

อยางเดียว แตควรมีคาที่บอกความผันแปรควบคูไปดวย

โดยทั่วไปจะแสดงคา SD ในวงเล็บ ไมแนะนําการเขียนใน

รูปแบบ mean + SD เชน คาเฉลี่ยความดันโลหิตเปน

102.3 (SD 11.9) มม.ปรอท ไมแนะนําใหเขียนวา 102.3

+ 11.9 มม.ปรอท สําหรับตัวเลขหลังจุดทศนิยม แนะนํา

เสนอคาเฉลี่ยที่ มีคาทศนิยมมากกวาขอมูลดิบอยู 1

ตําแหนง สวนคา SD ใหมีคาทศนิยมมากกวาคาเฉลี่ยอยู 1

ตําแหนง ข. ตาราง (tables) การนําเสนอในรูปตารางใหแสดงกลุมที่ตองการ

จําแนกอยูในแนวตั้ง (column) ตัวแปรตางๆ ใหแสดงใน

แนวนอน (row) ถาจํานวนคาสังเกตไมมากไมจําเปนตอง

คํานวณรอยละ ควรใหเสนอเปนจํานวนที่แทจริง เนื่องจาก

การนําเสนอในรูปรอยละ อาจทําใหเขาใจผิดวาจํานวน

ตัวอยางมีมาก

ลักษณะของตารางที่ดี ไดแก

- ควรบอกผูอานถึงเรื่องนั้นๆ ใหชัดเจน

- คาทั้งหมด หรือจํานวนคาสังเกต (n) ทั้งหมด

ควรระบุไวในตาราง

- ถามีการแสดงรอยละ ควรบอกใหชัดเจนถึงที่มา

ของคารอยละ เชน รอยละตามแถว (row percentage)

หรือรอยละตามคอลัมน (column percentage) เพื่อให

ผูอานไดแปลผลถูกตอง

- ควรระบุหนวยการวัดใหชัดเจน อาจระบุไวที่หัว

ตาราง

- ตารางควรเสนอผลอยางชัดเจน และควร

หลีกเลี่ยงตารางที่ซับซอนเกินไป เพราะจะทําใหการแปล

ผลผิดพลาดและเกิดความสับสน

ในกรณีที่ขอมูลเปนชนิดจํานวนและตองมีการจัด

กลุม หรือการแบงชั้นเพื่อการนําเสนอในรูปตารางเปน

จํานวนนับแยกตามชั้น มีขอแนะนํา ดังนี้

- จํานวนชั้นที่จัดแบง ควรจะอยูระหวาง 10-20

ชั้น ถามีจํานวนชั้นนอยเกินไป จะทําใหชวงของชั้นกวาง

มากอาจขาดรายละเอียดของขอมูล แตถามีจํานวนชั้นมาก

ไปก็อาจไมพบขอมูลในบางชั้น

- ขีดแบงของแตละชั้นตองสอดคลองกับคาของ

ขอมูลดิบ

- ชวงกวางของชั้น ถาเทาๆ กันจะสะดวกในการ

คํานวณขั้นตอไป

- ชวงกวางแตละชั้น จะตองแยกจากกันแทจริง

- ควรหลีกเลี่ยงการจัดชั้นที่เปนชวงเปด

Page 4: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

227

สถิติในการวิจัย

- ในกรณีจัดชั้นไวกอนแลว ถาไมสามารถหา

ขอมูลดิบไดก็อาจใชจุดกลางชั้น (mid point) แทน ค. กราฟ (graphs) ปจจุบันมีโปรแกรมสําเร็จรูปตางๆ สําหรับการ

นําเสนอขอมูลเปนรูปกราฟหรือแผนภูมิ ซึ่งทําไดสวยงาม

แตผูวิจัยควรทราบถึงชนิดของกราฟหรือแผนภูมิที่เลือกใช

โดยดูจากลักษณะของขอมูล กลาวคือ

สําหรับขอมูลเชิงปริมาณ:ฮิสโตแกรม, Frequency

polygon, Box-plot

สําหรับขอมูลเชิงคุณภาพ: แผนภูมิแทง, แผนภูมิ

วงกลม, แผนภูมิรูปภาพ

สําหรับแสดงความสัมพันธระหวางตัวแปร 2 ตัว:

Scatter diagrams

16.2.3 การเตรียมการกอนการวิเคราะหขอมูล (preparing to analyze data) การตรวจสอบขอมูลมีความสําคัญมาก ควรทํา

กอนที่จะมีการวิเคราะหเสมอ แนวทางในการตรวจสอบมี

ดังนี้ ก. ตรวจสอบชวงของขอมูล (range check)

เปนการตรวจดูความเปนไปไดของคาที่บันทึก กรณีของ

ขอมูลบอกลักษณะ เชน หมู เ ลือด ถามีการบันทึกที่

นอกเหนือจาก A, B, O และ AB แสดงวาเปนขอมูลที่

บันทึกผิดพลาด กรณีขอมูลบอกปริมาณ ใหดูคาต่ําสุดและ

คาสูงสุดวามีโอกาสเปนไปไดหรือไม เชน อายุของมารดา

เมื่อมีบุตรคนแรก ชวงอายุที่เปนไปไดคือ 14 ถึง 45 ป ถามี

คาต่ําเกินไปหรือสูงเกินไปจากชวงนี้ ซึ่งเรียกวา Outliers

ตองตรวจสอบดูวาการเก็บขอมูลมีความผิดพลาดหรือไม

การตรวจสอบนี้ ยังมีประโยชน เพื่อพิจารณาแยก

คาบางคาที่ตางจากกลุมมากๆ ออกมากอนการวิเคราะห

เชน ในกรณีของผลตรวจทางหองปฏิบัติการ เพราะถา

นําเขารวมในการวิเคราะหอาจทําใหคาเฉลี่ยที่ไดเปล่ียนไป

มาก การตรวจสอบทําใหผูวิจัยไดทราบลักษณะของขอมูล

และตัดสินใจวาควรจะนําคาของขอมูลที่เปน Outlier เขา

มาสูการวิเคราะหหรือไม หรืออาจทําการวิเคราะหทั้งแบบ

ที่ใชและไมใช Outlier ของขอมูลนั้นแลวดูผลเปรียบเทียบ

กัน

ข . ตรวจสอบทา งตร รกวิ ทย า (logical check) เปนการตรวจดูวาตัวแปรที่เกี่ยวของกันนั้นมีความ

สมเหตุสมผลหรือไม เชน การคํานวณจํานวนครั้งของการ

ตั้งครรภซึ่งจะมีคําตอบเฉพาะผูหญิง ดังนั้นขอมูลนี้ใน

กลุมเพศชายไมควรมี การเตรียมกอนการวิ เคราะห

สามารถใหรหัสกลุมที่ไมเขาขายเพื่อแยกออกจากการ

วิเคราะห จะไดทําการวิเคราะหเฉพาะรหัสกลุมที่มีความ

เปนไปไดเทานั้น

ค. การตรวจสอบวันเวลา (dates) ในการ

วิเคราะหบางอยาง เชน การวิเคราะหการมีชีวิตรอด

(Survival analysis) ขอมูลที่บันทึกเกี่ยวกับเวลาทั้งหมดมี

ความสําคัญมาก ถามีการลงตัวเลขผิด ผลที่ไดจากการ

คํานวณก็ผิดพลาด ดังนั้น จึงควรตรวจทานตัวเลขที่

เกี่ยวของกับเวลาอีกครั้ง ใหแนใจวาบันทึกไดตรง บางครั้ง

อาจตรวจสอบคราวๆ เชน ดูเวลาที่เริ่มเปนโรคและเวลาที่

เสียชีวิตของคนไขแตละคน มีลําดับของเวลาถูกตอง

หรือไม เปนตน

ง. ขอมูลที่สูญหาย (missing data) ในการ

ตรวจขอมูลกอนการวิเคราะหนั้น มักพบวามีบางตัวแปรที่

ไมสามารถเก็บขอมูลไดครบ ซึ่งอาจเปนไปไดวาผูตอบ

แบบสอบถามไมอยากเปดเผยขอมูลในสวนนี้ หรือ

ผูสัมภาษณไมสามารถสํารวจขอมูลสวนนี้ไดครบ เมื่อมี

ขอมูลขาด ผูวิจัยอาจตัดสินใจแยกขอมูลชุดที่ไมครบออก

ตางหากจากการวิเคราะห หรืออาจแกไขโดยการประมาณ

คาสําหรับขอมูลที่ขาดหายไป โดยวิธีใชคาเฉลี่ยของขอมูล

ที่มีอยูแทนลงไป การแกไขโดยใสคาเฉลี่ยมีความจําเปนใน

การวิ เคราะหบางอย าง เชน การวิ เคราะห เชิ งพหุ

(Multivariate analysis) ตัวอยางของขอมูลที่มักขาดไป

เชน รายได อายุ เปนตน ซึ่งมักประมาณคาโดยใสคาเฉลี่ย

กรณีของขอมูลที่ขาดเปนวันเดือนป ใหใสคา โดยใชวัน

กึ่งกลางของเดือน คือวันที่ 15 และเดือนกึ่งกลางของป คือ

เดือนที่ 6 หรือ 7 16.2.4 การวิเคราะหขอมูล (Data analysis)

ชนิดของสถิตินิยมแบงเปนสถิติเชิงพรรณนา

(descriptive statistics) และสถิติเชิงอนุมาน (inferential

statistics)

Page 5: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

228

สถิติในการวิจัย

สถิติ เชิงพรรณนาใชสําหรับการวิจัยรูปแบบ

เชิงสํารวจและพรรณนา ซึ่งไมมีการทดสอบสมมติฐาน

สถิติเชิงอนุมานใชสําหรับการวิจัยรูปแบบเชิง

วิเคราะหและเชิงทดลอง ที่ตองมีการทดสอบสมมุตติฐาน

เพื่อตอบคําถามวิจัย

การอนุมาน คือ การอ างสรุปผลที่ ได จาก

การศึกษาตัวอยาง เปนลักษณะของประชากรเปาหมาย

ถาตัวอยางที่สุมมานั้นไมเปนตัวแทนที่ดีของประชากร

ยอมจะนําไปสูการสรุปที่ ผิดพลาด ถึงแมวาจะใชวิธี

วิเคราะหอยางถูกตองก็ตาม นอกจากนี้ ความนาเชื่อถือ

ของผลการอนุมานยังขึ้นอยูกับปจจัย 2 อยาง คือ จํานวน

ตัวอยาง และ ธรรมชาติความผันแปรมากหรือนอย ใน

ประชากรที่ศึกษา

ถาการศึกษาใชจํานวนตัวอยางมาก การอนุมาน

จะมีความนาเชื่อถือมากขึ้น ขณะเดียวกัน ถาคุณลักษณะ

ในประชากรศึกษามีความผันแปรนอย การอนุมานจะมี

ความนาเชื่อถือมากขึ้น

การวิเคราะหสําหรับสถิติเชิงพรรณนาและสถิติ

เชิงอนุมานใชกระบวนการวิเคราะหอันเดียวกัน เพียงแต

สถิติเชิงพรรณนาไมตองมีการพิสูจนสมมติฐานหรือการดู

ความแตกตางกันอยางมีนัยสําคัญทางสถิติเหมือนในสถิติ

เชิงอนุมาน โดยทั่วไปกระบวนการในการวิเคราะหมีสาม

ขั้นตอน ดังนี้ 1. ขั้ นตอนการจั ดการข อมู ล เ พ่ื อกา รวิเคราะห (Data management) เปนขั้นตอนที่ทํากอนจะ

เริ่ มวิ เคราะห โดยมีการลงรหัสและใสค าขอ มูลใน

คอมพิวเตอร ในขั้นตอนนี้ควรมีนักสถิติดูแลใกลชิดรวมกับ

ผูที่จัดการขอมูล ซึ่งประกอบดวย คนลงรหัส, คนปอน

ขอมูลเขาคอมพิวเตอรและโปรแกรมเมอร ทั้งนี้เพื่อการ

เตรียมขอมูลใหพรอมสําหรับการวิเคราะหดวยโปรแกรม

สําเร็จรูปทางสถิติ ตอไป 2. ขั้นตอนการวิเคราะหเชิงสํารวจขอมูล (Exploratory data analysis) ขั้นตอนนี้จะเริ่มวิเคราะห

โดยตรวจดูผลเบื้องตนที่ เปนไปได โดยอาจทําการหา

คาความถี่, รอยละ, คาเฉลี่ย เปนตน ถาคาใดมีคาสูงหรือ

ต่ําจนผิดปกติจากกลุม หรือที่เรียกวา Outlier จะได

พิจารณาวาควรนําเขาไปวิเคราะหหรือไม นอกจากนี้ จะได

ตรวจสอบการแจกแจงของขอมูลวาเปนไปตามเงื่อนไข

สมมติ (Assumption) หรือไม เชน มีการแจกแจงแบบปกติ

หรือไม ถาไมเปนไปตามเงื่อนไขสมมติ อาจตองมีการ

แปลงขอมูลเชน ใช logarism เปล่ียนลักษณะของการ แจก

แจงใหเปนแบบปกติกอน จึงทําการวิเคราะหตอไป 3. ขั้นตอนการวิเคราะหทางสถิติ (Statistical analysis) ขั้นตอนนี้เปนการวิเคราะหผลโดยใชโปรแกรมที่

เหมาะสม โดยทั่วไป โปรแกรมสําหรับขอมูลเชิงลักษณะ

และขอมูลเชิงจํานวนจะแตกตางกัน และโปรแกรมสําหรับ

วิเคราะหการแจกแจงขอมูลแบบปกติ (bell shape) และ

การแจกแจงขอมูลที่ มีการเบของกราฟ (skew) จะไม

เหมือนกัน ดังนั้น นักวิจัยจึงควรรูกอนวา ขอมูลเปนชนิดใด

และการแจกแจงขอมูลเปนแบบปกติหรือไม

โปรแกรมการวิเคราะหอาจแยกตามการใชงานได

เปน 3 กลุมใหญ ดังนี้

ก. การประมาณคาพารามิเตอร (Parameter

estimation)

ข. การทดสอบสมมติฐาน (Hypothesis testing)

- การทดสอบสําหรับขอมูลชนิดปริมาณ

- การทดสอบสําหรับขอมูลชนิดกลุม

- การทดสอบโดยการวิเคราะหความแปรปรวน

ค. การดูความสัมพันธของตัวแปรและการทํานายคาตัวแปร (Correlation and Regression)

16.3 การประมาณคาพารามิเตอร (Parameter estimation)

ค าพารามิ เ ตอร (Parameter) คื อค าที่ บอก

ลักษณะของประชากร สวนคาสถิติ (Statistics) คือคาที่

บอกลักษณะของตัวอยางการใชสัญลักษณจะตางกัน ดังนี้

คาที่วัด Parameter Statistics

คาเฉลี่ย μ X คาความแปรปรวน σ2 S2

คาเบี่ยงเบน

มาตรฐาน σ S

คาสัดสวน P p

Page 6: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

229

สถิติในการวิจัย

ลักษณะ การวัด

ประชากรกลุมเดียว

ประชากรสองกลุม

คาเฉลี่ย ประมาณค า เฉลี่ ย

ของความดันโลหิต

ในประชากรเขตเมือง

ประมาณผลตางของ

ค า เ ฉลี่ ย ความดั น

โลหิตระหวางคนใน

เขตเมืองและชนบท

คาสัดสวน

หรือ

รอยละ

ประมาณคาสัดสวน

ของความเครียดใน

ประชากรเขตเมือง

ประมาณผลตางของ

สัดสวนความเครียด

ระหว างคนในเขต

เมืองและชนบท

การประมาณคาพารามิเตอร คือ การใชสถิติใน

การคาดคะเนผลที่เปนของประชากร (คาเฉลี่ยและคา

ความแปรปรวน) จากการศึกษาในตัวอยางที่สุมออกมา

เนื่องจากผลการศึกษาที่นักวิจัยไดจากการเก็บขอมูลจะ

เปนลักษณะของตัวอยาง (ยังไมใชลักษณะของประชากร)

ซึ่งแทจริงแลว เกิดขึ้นจากเราสุมมาหนึ่งแบบ คาเฉลี่ยของ

ตัวอยาง (Sample mean, X ) ที่คํานวณได มาจาก

การศึกษาครั้งเดียวที่ใชจํานวน n ชิ้น สุมออกมาจาก

ประชากรที่มีจํานวน N ชิ้น ดังนั้น หากมีการสุมใหมโดยใช

จํานวน n ชิ้นอีกครั้งเพื่อทําการคํานวณคาเฉลี่ยของ

ตัวอยางครั้งใหม ก็จะไดคาเฉลี่ยอีกคาหนึ่ง ( 2X ) ซึ่งมักไม

เทากันพอดีกับคาเฉล่ียคาแรก ( 1X ) ถาเราทําการสุมมาก

ครั้งขึ้นอีก ในที่สุด เราจะไดคาเฉลี่ยของตัวอยาง มีคา

ตางๆ คือ 1X , 2X , 3X ....................... nX ถานําคาเฉลี่ย

ของตัวอยางทั้งหลายเหลานี้มาดูการแจกแจง จะพบวา

เปนรูปแบบการแจกแจงปกติ (Normal distribution) และ

มีคุณสมบัติดังนี้ คือ

ก. คาเฉล่ียของ Sample means (μ X ) มีคา

เทากับคาเฉลี่ยของประชากร (μ)

ข. คาเบี่ยงเบนมาตรฐาน ของ Sample means

( Xσ ) มีคาเทากับ / nσ

คาเบี่ยงเบนของ Sample means หรือคือชวงที่

เปนไปไดของคา μ เรียกวา Standard error ของ mean

อันเปนที่มาของชื่อ Standard Error (SE) นั่นเอง

คา SE จึงแตกตางจาก SD กลาวคือ SD เปน

การบอกความผันแปรของขอมูลจากตัวอยางวาการ

กระจายเปนอยางไร ขณะที่ SE จะบอกถึงความผันแปร

ของคาสถิติตางๆ (เชน Sample means) ซึ่งคา SE มีความ

เกี่ยวของกับ SD และ n โดยสูตรดังนี้

SE = SD / n

การประมาณคาพารามิเตอรนิยมการประมาณ

แบบเปนชวง (Interval estimation) โดยประเมินวาจะมี

โอกาสเทาใดที่คาพารามิเตอรจะตกอยูในชวงนั้น การ

รายงานผลจะบอกคา 1 คา รวมกับชวงของคาตามรอยละ

ของความเชื่อม่ัน (Confidence Intervals หรือ CI) เชน

ความดันโลหิตโดยเฉลี่ยในประชากรเทากับ 135 (130.5,

139.5) มม.ปรอท หมายความวาถาสุมตัวอยาง 100 ครั้ง

จะมี 95 ครั้งที่คาเฉลี่ยจะมีคาเทากับ 130.5 ถึง 139.5 มม.

ปรอท

คา Parameter = คา Statistics + k × SE

โดยที่ k คือคาสัมประสิทธิ์ความเชื่ อ ม่ัน (Reliability

coefficient) ซึ่งไดแกคา t หรือ Z

การคํานวณชวงของความเชื่อม่ัน (Calculating confidence

Intervals) 16.3.1 การประมาณคาพารามิเตอรจาก

คาเฉล่ียของตัวอยาง (Mean estimation) i ตัวอยางชุดเดียว (One sample)

คาเฉลี่ยของประชากร (μ) = Xn

σ±Ζ

X = คาเฉลี่ยของตัวอยาง

σ = คา SD ในประชากร

n = จํานวนตัวอยาง

Z = คาปกติมาตรฐานซึ่งขึ้นกับการกําหนด

ชวงความเชื่อม่ัน

โดยที่ 90 % CI, Z = + 1.64

95 % CI, Z = + 1.96

99 % CI, Z = + 2.58

แตในทางปฏิบัติแลวคา σ มักจะไมทราบ ดังนั้น

จะใช SD ในตัวอยางแทน และใชคา t แทนคา Z ซึ่งคา t ก็

ไดจากการเปดตารางแจกแจงคา t โดยกําหนดให degree

Page 7: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

230

สถิติในการวิจัย

of freedom (df) เปน n-1 ดังนั้นการประมาณคา μ จะ

เปนดังนี้

μ = S

X tn

±

ถาขนาดของตัวอยางมีจํานวนมากพอ (อาจ

กลาวไดวามากกวา 30) การแจกแจงคา t ก็จะเขาใกล

คา Z ก็อาจใชคา Z แทนได ตัวอยางที่ 16.2 จากการสุมตัวอยางประชากรปกติ 100

คน พบวาคาเฉลี่ยของอัตราการเตนของหัวใจเทากับ 85

ครั้ง/นาที และ SD เทากับ 10.2 ครั้ง/นาที จงประมาณ

คาเฉลี่ยของอัตราการเตนของหัวใจประชากรทั่วไปที่

95 % CI

การคํานวณ

X = 85, SD = 10.2, n = 100

ที่ 95 % CI, Z = 1.96

ดังนั้น μ = ±(10.2)

85 1.96100

= 85 + 2.0

= 83.0, 87.0

ตอบ

คาเฉลี่ยของอัตราการเตนของหัวใจในประชากรอยู

ในชวง 83 ถึง 87 ครั้ง /นาที

จากตัวอยางขางตน จะเห็นวาชวงของการประมาณ

จะขึ้นอยูกับ

1. ขนาดตัวอยาง (n) ถามีคามากชวงการประมาณ

จะแคบลงและมีความแมนยํามากขึ้น

2. คาความผันแปรในที่นี้คือคา (SD)(2) ถามีคามาก

จะทําใหชวงการประมาณกวางขึ้นความแมนยํา

ก็นอยลง

ii ตัวอยางสองชุด (Two samples) เปนการ

ประมาณคาผลตางของคาเฉลี่ยจากตัวอยาง 2 ชุด

ซึ่งแบงเปน 2 กรณี คือ iia ตัวอยางที่เปนอิสระกัน (Independent

samples) หมายถึงตัวอยาง 2 ชุดนี้มาจากประชากร 2

กลุมที่ไมเกี่ยวของกัน เชน การดูผลของการรักษาดวยยา ก

และ ยา ข

กําหนดให 1X , 2X = คาเฉลี่ยของตัวอยางชุดที่ 1 และ 2

S1, S2 = SD ของตัวอยางชุดที่ 1 และ 2

n1, n2 = ขนาดตัวอยางชุดที่ 1 และ 2

μ1, μ2 = คาเฉลี่ยของประชากรชุดที่ 1 และ 2

ในทางทางปฏิบัตินั้นไมอาจทราบคาของความ

แปรปรวนของประชากร 2( )σ ในแตละกลุมจึงอาจมีการ

ทดสอบวา 2σ ของทั้ง 2 กลุมเทากันหรือไม โดยใช F-test

แตในที่นี้จะกําหนดให 2σ เทากันทั้ง 2 กลุม ( 21σ = 2

2σ )

ดังนั้นคา SE ของผลตางเฉลี่ยสามารถคํานวณไดจาก

2pS (Pooled variance) =

2 21 1 2 2

1 2

(n 1)S (n 1)S

n n 2

− + −+ −

SE ของ 1X - 2X = 1 2

1 1Sp

n n+

ดังนั้น CI ของ μ1 - μ2 = ( 1X - 2X ) + ( t หรือ Z) SE

คา t จากตารางเปดที่ df = n1 + n2 - 2 แตถาตัวอยางมี

ขนาดใหญพอ (กลุมละ 30 ขึ้นไป) ก็ใชคา Z ได ตัวอยางที่ 16.3 จากการวัดระดับ serum amylase ใน

ประชากร 2 กลุม ไดคาเฉลี่ยและ SD ดังตาราง (มีหนวย

ตอ 100 ml) Subjects n X S

Hospitalised 22 120 40

Healthy 15 96 35

คํานวณ

คา SE ของ 1X - 2X = 1 1Sp

15 22+

2pS =

2 2(22 1)(40) (15 1)(35)

22 15 2

− + −+ −

= 1450

Sp = 38.08

Page 8: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

231

สถิติในการวิจัย

แทนคาใน SE ของ 1X - 2X จะได = 12.75

คา t ที่ 95 % CI, df = 35 มีคา 2.03

ดังนั้น 95% CI ของ μ1-μ2 = (120-96) + 2.03(12.75)

= -1.88 ถึง 49.88

ตอบ

สามารถสรุปไดวาที่ความเชื่อม่ัน 95 % ความแตกตางของ

ระดับ Serum amylase ในคน 2 กลุมอยูระหวาง -1.88

ถึง 49.88 ซึ่งชวงนี้ครอบคลุม 0 ดวย จึงชี้ใหเห็นวาไมมี

ความแตกตางกันระหวางคาเฉลี่ยของระดับ Serum

amylase ในคน 2 กลุมนี้ จะเห็นวาคาประมาณนี้จะให

ผลสรุปเหมือนกับการทดสอบสมมติฐานแบบสองทาง

(Two-tailed test) ซึ่งจะกลาวในเรื่องการทดสอบ

สมมติฐานตอไป

iib ตั ว อ ย า ง ที่ มี ค ว า ม เ กี่ ย ว ข อ ง กั น

(Dependent samples) ในกรณีที่ตัวอยาง 2 ชุด มีความ

เกี่ยวของกัน ไดแก การวัดกอนและหลังการทดลอง ,

การศึกษาแบบ matched pair, การศึกษาแบบ Cross-

over design ความแตกตางของขอมูลที่วัดไดนี้จะเปน

ความแตกตางในแตละคาสังเกต ดังนั้น การวิเคราะหจะนํา

ผลตางที่เปล่ียนแปลงในแตละคาสังเกตมาทําการคํานวณ

เชน การดูผลการเปลี่ยนแปลงน้ําหนักตัวในผูหญิงกอน

และหลังการรับประทานยาคุมกําเนิดเปนเวลา 3 เดือน

หรือในกรณีที่ขอมูลวัดจากคนละกลุมกันแตทั้ง 2

กลุมมีการจัดใหเหมือนกันเปนคูๆ (Matched pairs) ตาม

ปจจัยที่คิดวาจะมีสวนเกี่ยวของก็จะถือวาขอมูลทั้ ง

2 ชุดเกี่ยวของกัน แมแตการศึกษาในฝาแฝด, สวนของ

อวัยวะที่มี 2 สวน เชน ตาซาย/ขวา, ไตซาย/ขวา เปนตน

CI ของคาผลตาง ( d ) = Sd

d t.n

±

โดยที่ d = คาเฉลี่ยของผลตางในแตละคู

Sd = คา SD ของผลตาง

n = จํานวนคูของขอมูล

t = คา t ที่ระดับความเชื่อม่ัน ดวย df = n-1

ขอสมมติ (Assumption) ในที่นี้ คือ การแจกแจงของ

ผลตางในแตละคูจะตองแจกแจงเปนแบบปกติ

ตัวอยางที่ 16.4 จากการศึกษาผลของยาคุมกําเนิดใน

ผูหญิง 9 คน โดยชั่งน้ําหนักกอนและหลังใหยา 3 เดือน

ไดผลดังตาราง จงประมาณวาที่ 95% CI คาความ

แตกตางของน้ําหนักตัวโดยเฉลี่ยเปนเทาไร

น้ําหนัก คนที่ กอน หลัง ผลตาง (di)

1 120 123 + 3

2 141 143 + 2

3

4

5

6

7

8

9

130

150

135

140

120

140

130

140

145

140

143

118

141

132

+10

- 5

+ 5

+ 3

- 2

+ 1

+ 2

คํานวณ

คาเฉลี่ยของผลตาง ( d ) = id

n

∑ =

19

9 = 2.11

Sd = 2

i(d d)

n 1

∑ −−

=

4.197

คา SE ของ d = 4.197

9 = 1.40

คา t ที่ df = 9 - 1 = 8 มีคา 2.31

ดังนั้น 95 % CI ของคาเฉลี่ยของผลตาง

= 2.11 ± (2.31 × 1.40)

= - 1.12 ถึง 5.34

ตอบ

สรุปไดวามีความเชื่อม่ัน 95% ที่คาเฉลี่ยน้ําหนัก

ตัวที่ เป ล่ียนแปลงในผูหญิงหลังจากรับประทานยา

คุมกําเนิด 3 เดือน มีคาตั้งแต น้ําหนักลดลง 1.12 ปอนด

จนถึงน้ําหนักเพิ่มขึ้น 5.34 ปอนด นอกจากนี้ชวงที่ไดยัง

คลุม 0 ดังนั้นน้ําหนักตัวกอนและหลังรับประทานยาไมมี

ความแตกตางกัน

Page 9: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

232

สถิติในการวิจัย

16.3.2 การประมาณคาพารามิเตอรจากคาสัดสวนของตัวอยาง (Proportion estimation) ในกรณีที่

ตัววัดเปนแบบ Binary หรือ Dichotomous คาที่จะใช

สรุปผลจะเปนรูปแบบสัดสวนหรือรอยละ i ตัวอยางชุดเดียว ให p เปนคาสัดสวนของตัวอยาง = จํานวนตัวอยางที่สนใจ

จํานวนตัวอยางทั้งหมด

เชน สัดสวนของนักศึกษาที่สูบบุหรี่

= จํานวนนักศึกษาที่สูบบุหรี่

จํานวนนักศึกษาทั้งหมด

SE ของ p = p(1 P)

n

เนื่องจากการวัดผลเปนเพียงเหตุการณ 2 อยาง คือ ใช/

ไมใช ดังนั้นการแจกแจงเปนแบบทวินาม (Binomial

distribution) แตเมื่อ n มีจํานวนมากจนคา np และ n (1-

p) มากกวา 5 ก็สามารถประมาณใหเปนการแจกแจงแบบ

ปกติได โดยการประมาณคาจะเปนดังนี้

P = p ± Z p(1 P)

n

ตัวอยางที่ 16.5 จงประมาณคาที่ 95% CI ของสัดสวน

การสูบบุหรี่ในนักศึกษาชาย ซึ่งสุมตัวอยางมา 50 คน

พบวาสูบบุหรี่ 15 คน

คํานวณ

p = 15

50 = 0.30

np = 15 > 5 และ n(1-p) = 35 จึงใชการ

แจกแจงแบบปกติได ดังนั้นที่ 95 % CI ของ P = 0.30 ±

1.96 (.3)(1 .3)

50

− = 0.17, 0.43

ตอบ

สรุปวา มีความเชื่อม่ันได 95% ที่สัดสวนการสูบบุหรี่ใน

นักศึกษาชายมีคาอยูระหวาง 0.17 และ 0.43 หรือ 17%

ถึง 43%

ii ตัวอยางสองชุด ในที่นี้จะกลาวถึงเฉพาะ

ตัวอยาง 2 ชุด ที่ไมเกี่ยวของกัน (Independent samples)

การประมาณคาผลตางของสัดสวนในตัวอยาง 2 ชุด

โดยใชสูตร

P1 - P2 = (p1 - p2) ± Z 1 1 2 2

1 2

p (1 p ) p (1 p )

n n

− −+

โดยทดสอบคา np และ n(1-p) ในแตละชุดมากกวา 5 ตัวอยางที่ 16.6 ในการศึกษาเปรียบเทียบผลของการ

รักษาอาการปวดหลังเรื้อรังดวยการใหยาและการผาตัด

พบวาในคนไขที่ไดรับการผาตัด100 ราย หายจากการปวด

หลัง 80 ราย ขณะที่คนไขไดรับยา 100 ราย เชนกัน

หายเพียง 50 ราย จงประมาณวาที่ 90% CI ผลตางของ

สัดสวนที่หายจากการปวดหลังในคนไขที่ไดรับการรักษา

โดยการผาตัดและรับประทานยาเปนเทาไร

คํานวณ

นั่นคือประมาณคา P1 - P2 ที่ 90 % CI นั่นเอง

p1 = 0.8, p2 = 0.5

n1 = 100, n2 = 100

ทดสอบคา np และ n(1-p) ในแตละกลุมมากกวา 5

ดังนั้น 90 % CI ของ P1 - P2

= (0.8 - 0.5) ± 1.64 0.8 0.2 0.5 0.5

100 100

× ×+

= 0.3 ± 0.11

= 0.19, 0.41

ตอบ

สรุปวาที่ระดับความเชื่อม่ัน 90% สัดสวนที่จะ

หายจากการปวดหลังดวยวิธีการผาตัดสูงกวาการ

รับประทานยาอยูระหวาง 0.19 และ 0.41 หรือ 19% ถึง

41% และความแตกตางนี้มีนัยสําคัญทางสถิติดวยเพราะ

ไมคลุม 0 อยูในชวงนั้น

จะเห็นวาการประมาณคา parameter ทําให

ทราบถึงลักษณะของประชากรโดยใชผลจากตัวอยาง ใน

ปจจุบันวารสารทางการแพทยจะกําหนดใหการเสนอ

ผลงานตองรายงานคาประมาณที่ชวงความเชื่อม่ันไวดวย

โดยนิยมใชที่ 95% CI

Page 10: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

233

สถิติในการวิจัย

16.4 การทดสอบสมมติฐาน (Hypothesis testing) การทดสอบสมมติฐานในการวิจัยนั้น หมายถึง

การทดสอบเพื่อตอบคําถามของการวิจัยวาเปนไปตามที่ตั้ง

ไวหรือไม โดยคําถามการวิจัยจะนําไปสูการตั้งสมมติฐาน

การวิจัย และมีการทดสอบสมมติฐานทางสถิติตอไป ดัง

ตัวอยางคําถามในการวิจัย: คาเฉลี่ยของความดันโลหิตใน

ผู สู งอายุ เขตเมืองตางกับคนในเขตชนบทหรือไม?

สมมติฐานการวิจัย ซึ่งจะนําไปสูการทดสอบทางสถิติจะ

เปนดังนี้

“คาเฉลี่ยของความดันโลหิตในผูสูงอายุเขตเมือง

และเขตชนบท ไมแตกตางกัน” ดังนั้นจะนําไปสูการ

ทดสอบทางสถิติตอไป เพื่อพิสูจนสมมติฐานขางตนวาเปน

จริงหรือไม การทดสอบสมมติฐานนี้อาจเรียกอีกชื่อหนึ่งวา

การทดสอบนัยสําคัญ (Significance test) ก็ได ขั้นตอนในการทดสอบสมมติฐาน (Step taken in

hypothesis testing)

ขั้นตอนแรก: การตั้งสมมติฐาน สมมติฐาน

ทางสถิติแบงออกเปน 2 ชนิด คือ

ก. สมมติฐานวาง (Null hypothesis) ใชตัว

ยอวา Ho หมายถึงสมมติฐานที่ตั้งขึ้นโดยใหไมมีความ

แตกตางระหวางสิ่งที่ตองการเปรียบเทียบ ดังตัวอยาง

Ho : คาเฉลี่ยความดันโลหิตในผูสูงอายุเขตเมืองไมตาง

กับเขตชนบท

โดยเขียนในรูปของเครื่องหมายทางสถิติคือ

μ1 = μ 2 หรือ μ1 – μ2 = 0

จะเห็นวาการตั้งสมมติฐานทางสถิติจะใชตัว

พารามิเตอร ทั้งนี้เพราะวาผลการทดสอบจะนําไปสรุปเปน

ของประชากร ข. สมมติฐานแยง(Alternative hypothesis) ใชตัวยอวา Ha หมายถึง สมมติฐานที่ตั้งขึ้นตรงกันขามกับ

Ho ทั้งนี้เพื่อคนหาคําตอบใหไดวามีความแตกตางจริง

หรือไม ขอมูลที่มีอยูเพียงพอหรือไมที่จะสนับสนุน

สมมติฐานแยง ดังตัวอยาง

Ha : คาเฉลี่ยความดันโลหิตในผูสูงอายุ เขตเมืองตางกับ

เขตชนบท

μ1 ≠ μ2 หรือ μ1 – μ2 ≠ 0

การตั้งในลักษณะนี้ จะเห็นวาระบุเพียงแตวาแตกตางกัน

แตไมทราบวาคนกลุมไหนจะมีคาเฉลี่ยความดันโลหิตสูง

กวา การตั้งแบบนี้เรียกวา ตั้งแบบสองหาง คือ Two-

tailed test แตถาตั้งแบบเจาะจงอยางใดอยางหนึ่งคือ Ha

: คาเฉลี่ยความดันโลหิตในผูสูงอายุเขตเมืองสูงกวาเขต

ชนบท

μ1 >μ2 หรือ μ1 – μ2 > 0

การตั้งแบบเจาะจงลงไป เรียกวา ตั้งแบบหางเดียว คือ

One-tailed test ซึ่งจะทําใหไดคําตอบที่เฉพาะลงไป แต

การตั้งแบบนี้จะทําไดยากเพราะกอนที่จะวิเคราะหขอมูล

นั้น ตองตั้งสมมติฐานกอนจึงยากที่จะกําหนดลงไปใน

ทิศทางใดทิศทางหนึ่ง การตั้งแบบสองหางจึงนิยมมากกวา

แบบหางเดียว แตถามีหลักฐานเพียงพอที่จะสงสัยวากลุม

หนึ่งดีกวาอีกกลุมหนึ่งก็ควรตั้งแบบหางเดียว

ขั้ นตอนที่ สอง :การตั้ ง ร ะดั บนั ย สํ าคัญ (Significance level) ในการสรุปผลการทดสอบนั้นจะสรุป

ตามขอมูลที่ไดมา ดังนั้นจะตองมีความผิดพลาดเกิดขึ้นได

แตถาความผิดพลาดนั้นไมเกินจากที่กําหนดไวก็ถือวาผลที่

ไดเปนความแตกตางที่เกิดขึ้นจริง ไมใชเปนการบังเอิญ

ความผิดพลาดแบงออกเปน 2 ชนิด คือ

ก. Type I error เปนความผิดพลาดที่เกิดขึ้น

เมื่อปฏิเสธ(Reject) Ho เมื่อ Ho นั้นถูกตอง ดังเชน Ho ที่ตั้ง

ไววาคาเฉลี่ยความดันโลหิตของคน 2 กลุมไมตางกันนั้นถา

ถูกตองแลวแตเราปฏิเสธ คือไมยอมรับ เชนนั้น ความ

ผิดพลาดก็เกิดขึ้น ดังนั้น Type I error ก็คือระดับนัยสําคัญ

ซึ่งใชสัญลักษณ α (Alpha)

ข. Type II error เปนความคลาดเคลื่อนที่

เกิดขึ้นเนื่องจากไมปฏิเสธ Ho ทั้งๆที่ Ho นั้นผิดหมายความ

วาจริงๆแลวความดันโลหิตเฉล่ียในคน 2 กลุมนั้นตางกัน

(Ha ถูกตองนั่นเอง) แตสรุปผลวาไมตางกัน (ยอมรับ Ho)

ความผิดพลาดชนิดนี้ใชสัญลักษณ β ( ฺBeta) ดังสรุปใน

ตารางขางลางนี้

Page 11: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

234

สถิติในการวิจัย

ความดันโลหิตเฉล่ียของ 2 กุลม

การตัดสิน ไมตางกัน (Ho true)

ตางกัน (Ho false, Ha true)

ปฏิเสธ Ho Type I error Power

(Reject Ho) (α) (1–β)

ไมปฏิเสธ Ho ถูกตอง Type II error

(Do not

reject Ho) (1–α) (β)

โอกาสที่ตัดสินวาปฏิเสธ Ho เมื่อ Ho ผิดนั้นจะ

เทากับ 1–β ซึ่งเรียกวา อํานาจของการทดสอบทาง

สถิติ (Power of the statistical test) การตั้งระดับนัย

สําคัญโดยทั่วไปจะนิยมใชคา α ที่ 0.05 หมายความวาจะ

ยอมใหสรุปผิดไดไมเกิน 5 ครั้ง ใน 100 ครั้ง หรือยอมใหผิด

ไดเพียง 1 ใน 20 นั้นเอง แตถาตองการใหมีนัยสําคัญสูง

กวานี้ก็ให α นอยลงมาได เชน α=0.01 หรือตั้งคา α ไว

มากกวานี้คือ α=0.10 ซึ่งในทางสังคมศาสตรนิยมตั้งคา

ตรงคานี้เพราะการวิจัยไมไดเกี่ยวของกับส่ิงมีชีวิต

การตัดสินวาจะปฏิเสธ Ho หรือไมนั้น จะดูจาก

คา p-value ซึ่งหมายถึง โอกาสที่จะเกิดผิดพลาดในการที่

จะปฏิเสธ Ho ในขณะที่ Ho ถูกตอง ตัวอยางเชน ในความ

เปนจริงแลวความดันโลหิตเฉลี่ยของทั้ง 2 กลุมไมตางกัน

(Ho ถูกตอง) แตไปสรุปวาตางกัน ดังนั้นถาคา p นอยกวา

α ที่ตั้งไว ก็แสดงวามีขอมูลเพียงพอที่จะปฏิเสธ Ho และ

ยอมรับ Ha วาคาเฉลี่ยทั้ง 2 กลุมตางกันอยางมีนัยสําคัญ

ทางสถิติ แตถาคา p มากกวา α ก็จะไมสามารถปฏิเสธ

Ho แสดงวาคาเฉลี่ยทั้ง 2 กลุม ไมตางกัน (รายละเอียดจะ

กลาวในขั้นตอนที่ 4 และ 5)

ขั้นตอนที่สาม: การเลือกวิธีการทางสถิติ

(Statistical test) การเลือกใชวิธีการทดสอบนั้นจะคํานึงถึง

ตัววัดเปนหลักโดยคาที่วัดจะขึ้นอยูกับลักษณะของขอมูลที่

เก็บมานอกจากนี้ยังตองคํานึงถึงขอสมมติ (Assumption)

ที่กําหนดดังจะกลาวตอไปนี้

ก. ขอมูล (Data) ถาขอมูลที่เก็บมาเปน

เชิ งคุณภาพการวัดจะออกมาในรูปของคา สัดสวน

(Proportion) แตถาเก็บเปนเชิงปริมาณการวัดจะออกมา

ในรูปของคาเฉลี่ย (Mean) โดยทั้งนี้ขึ้นอยูกับสมมติฐาน ที่

กําหนดไวนั่นเอง

ข. ขอตกลงเบ้ืองตน (Assumption) การ

วิเคราะหเพื่ออนุมานทางสถิตินั้น จะมีความถูกตองเมื่อ

ข อ มู ลนั้ น เป น ไปตามข อตกลง เบื้ อ งต นที่ กํ า หนด

ขอกําหนดที่ควรพิจารณาไดแก

- ขอมูลนั้นมีการแจกแจงแบบปกติ (Normal

distribution)

- ตั ว อ ย า ง ที่ ไ ด เ ป น ตั ว อ ย า ง ที่ สุ ม ม า

(Random samples)

- ทราบคาความแปรปรวนของประชากร

หรือไม (Population variance) ซึ่งในทาง

ปฏิบัติ เรามักจะไมทราบและจะใชของ

ตัวอยาง คือ S2 (Sample variance) แทน

วิธีการทดสอบคาเฉลี่ย และคาสัดสวน สําหรับ

ตัวอยาง ชุดเดียว และ สองชุด ไดแก Z-test และ t-test

(การเลือกใชวิธีการตางๆ และเงื่อนไขจะกลาวในการ

ทดสอบ) โดยมีสูตรของการคํานวณคาสถิติที่ทดสอบ

โดยทั่วไปคือ Test statistic = Observed value – Hypothesised value

Standard error Test statistic หมายถึง คา Z และ คา t

Observed value หมายถึง คาสถิติของตัวอยาง เชน X , p

Hypothesised value หมายถึงคาที่กําหนดไวใน Ho เชน

μo สําหรับกลุมเดียวถาเปน 2 กลุม

มักจะเปน 0 เชน μ1 – μ2 = 0

Standard error หมายถึง คา SE ของ mean หรือ

proportion ดังไดกลาวแลวในเรื่อง

การประมาณคา

ขั้นตอนที่ส่ี : คํานวณคาสถิติ และ p-value

เมื่อเลือกใชวิธีใดๆ แลวอาจคํานวณโดยใชเครื่องคิดเลข

โดยแทนคาลงไปในสูตร แตถางานวิจัยใหญๆที่มีขอมูล

จํานวนมากตองใชโปรแกรมทางสถิติชวยในการวิเคราะห

เชน SPSS, SAS, STATA etc โดยเครื่องจะคํานวณคา

Page 12: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

235

สถิติในการวิจัย

p-value ให แตส่ิงที่ควรคํานึงถึงคือการเลือกวิธีทดสอบ

เพราะถาเลือกวิธีการผิดผลการวิเคราะหที่ไดก็ผิด

ขั้นตอนที่หา : การสรุปผล เมื่อไดคา p แลวทํา

การเปรียบเทียบกับ α ที่กําหนดไววาจะปฏิเสธ Ho

หรือไมปฏิเสธ Ho (จะไมสรุปวายอมรับเพียงแตสรุปวาไมมี

หลักฐานเพียงพอที่จะปฏิเสธ Ho) กอนที่จะกลาวถึงการ

ดําเนินการทดสอบสมมติฐานเพื่อทดสอบคาเฉลี่ย และ

สัดสวนในตัวอยางชุดเดียวและสองชุด จะสรุปการเลือกใช

วิธีการ สูตรตางๆ และเงื่อนไขไวในตารางดังนี้ 16.4.1 การทดสอบคาเฉล่ีย

i ตัวอยาง ชุดเดียว เพื่ อดู ว าค า เฉลี่ ยของ

ตัวอยางที่สุมมานั้นมีความแตกตางไปจากคาเฉลี่ยของ

ประชากรหรือไม

ให X = คาเฉลี่ยของตัวอยาง

n = จํานวนตัวอยาง

μo = คาเฉลี่ยของประชากร

สมมติฐาน Ho : μ = μ0

Ha : μ ≠ μ0 สําหรับ Two-tailed test

μ<μ0หรือ μ>μ0 สําหรับ One-tailed test ตัวอยางที่ 16.7 ผูวิจัยไดเก็บรวบรวมขอมูล จากตัวอยาง

15 ราย ซึ่งเปนคนที่มีสุขภาพดีคาเฉลี่ยของ Serum

amylase และ SD เปน 96 และ 35 units/100 ml

ตามลําดับ จงทดสอบวาคาเฉลี่ยที่ไดนี้ตางไปจากคาเฉลี่ย

ของประชากร ซึ่งเทากับ 120 units/100 ml หรือไม

วิธีทํา

สมมติฐาน Ho : คาเฉลี่ยของ serum amylase ใน

ประชากรที่ สุ มตั วอย า งมานั้ น

เทากับ 120 units/100ml. หรือ μ

= 120

Ha : คาเฉลี่ยของ Serum amylase ใน

ประชากรที่ สุมตัวอยางมานั้นไม

เทากับ 120 units/100 ml. หรือ μ

≠ 120 (two-tailed test)

ระดับนัยสําคัญ α ตั้งไว 0.05 หรือ 5%

จากตารางใชสูตรสําหรับการทดสอบคาเฉลี่ยของ

ตัวอยางชุดเดียว

t = oX

S / n

−μ

= 96 120

35 / 15

− = - 2.66

เปดตารางคา t ที่ df = 14 ไดแก t = 2.14 คา

p-value ไดแก พื้นที่ที่อยูมากกวาคา t = 2.66 และนอย

กวาคา t = -2.66 ดังรูป ซึ่งจากรูปคา p-value ทั้ง 2 ขาง

ร วมกั นแล วน อยกว า 0.05 ถ า คํ านวณค า p ด ว ย

คอมพิวเตอรจะไดคา p เทากับ 0.0186

นั่นคือ ปฏิเสธ H0 สรุปวาคาเฉล่ียของ serum

amylase ตางจากของประชากรที่เทากับ 120 units/100

ml อยางมีนัยสําคัญทางสถิติ (p = 0.0186 หรือ p <

0.05) หรือจะกลาวอีกอยางหนึ่งวาถาคา μ = 120 (Ho

ถูกตอง) แลวโอกาสที่จะปฏิเสธ Ho ขณะที่ Ho ถูกตองมีได

ไมเกิน 0.05 จากขอมูลที่ไดพบวาโอกาสที่จะปฏิเสธ Ho มี

เพียง 0.0186 ซึ่งไมเกินไปจาก α ที่ตั้งไวจึงสรุปวาคา

เฉล่ียที่ไดตางไปจากของประชากรจริง

TIK
Stamp
Page 13: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

236

สถิติในการวิจัย

สรุปการเลือกใชชนิดของการทดสอบและเงื่อนไข Population Parameter Sample Statistic Assumptions Test Statistic 1. Mean

1.1 Single mean

μ

X

1. ประชากรแจกแจงแบบปกติ 2. ตัวอยางเชิงสุม

0Xt

S / n

−μ=

โดยที่ μ0 คือคาเฉลี่ยใน Ho คา t ที่ df = n - 1

1.2 Difference in two means

μ1 - μ2

1 2X X− 1. ประชากร 2 กลุม แจกแจงแบบปกติ 2. ความแปรปรวนของ ประชากร 2 กลุมเทากัน

2 21 2( )σ = σ

3. ตัวอยาง 2 ชุด เปนอิสระกัน (Independent samples)

1 2

1 2

X Xt

1 1Sp

n n

−=

+

Pooled variance 2p(S )

2 21 1 2 2

1 2

(n 1)S (n 1)S

n n 2

− + −=

+ −

S1, S2 = SD. ของตัวอยาง df = n1 + n2 - 2

1.3 Mean of difference in each observation

D

d 1. ตัวอยาง 2 ชุด เกี่ยวของกัน (Dependent samples) 2. ผลตาง ในแตละคาสังเกต

(di) แจกแจงแบบปกติ

dt

Sd / n=

d = คาเฉลี่ยของผลตาง SD = SD ของผลตาง n = จํานวนคู df = n – 1

2. Proportion 2.1 Single proportion Po

p 1. คาสังเกตมาจากการสุม 2. n มีจํานวนมากพอที่ทําให nPo และ n(1-Po) มากกวา 5

o

o o

p pZ

P (1 P )

n

−=

P = สัดสวนในตัวอยาง PO = สัดสวนใน Ho

2.2 Difference in two proportion (P1 - P2) for independent samples

P1 , P2 n1 P1 , n1 (1 – P1) และ n2 P2 , n2 (1 – P2) มากกวา 5

1 2

1 1 2 2

1 2

p pZ

p (1 p ) p (1 p )

n n

−=

− −+

p1 = สัดสวนในตัวอยางชุด 1 P2 = สัดสวนในตัวอยางชุด 2

2.3 Difference in two proportions (P1 - P2) for dependent samples (Mc Nemar’s Test)

b c

n

b c5

2

+>

b cZ

b c

−=

+

b,c = จํานวนคูที่ไมสอดคลองกัน

(ใหผลทํานองเดียวกับ Chi-square test ชนิด 2×2)

Page 14: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

237

สถิติในการวิจัย

iia ตัวอยาง 2 ชุด เปนอิสระกัน เปนการ

ทดสอบวาคาเฉลี่ยของตัวอยาง 2 ชุดนั้น มาจากประชากร

ที่มีคาเฉล่ียตางกันหรือไม สวนใหญจะไมทราบคาความ

แปรปรวนของประชากร 2( )σ ดังนั้นจึงใชคาสถิติ t

ทดสอบและกําหนดใหความแปรปรวนของประชากร

เท า กั น 2 21 2( )σ = σ หรื อ ถ า จ ะทดสอบว า ค า ค ว าม

แปรปรวนเทากันหรือไมเทากันก็ใช F-test แตยังไม

กลาวถึงในตอนนี้ จึงตั้งขอสมมติใหเทากันกอน และใชสูตร

ดังในตาราง ตัวอยางที่ 16.8 จากคา Serum amylase ของคนปกติ

และคนไขในโรงพยาบาลเปรียบเทียบความแตกตางของ

คาเฉลี่ยวามาจากประชากรที่มีคาเฉลี่ยเทากันหรือไม

โดยมขีอมูลดังนี้ ตัวอยาง n X SD

คนปกติ 15 96 35

คนไข 22 120 40

วิธีทํา

สมมติฐาน Ho : คาเฉลี่ย Serum amylase ในประชากร

ทั้ง 2 กลุม ไมตางกัน

μ1 = μ2

Ha : คาเฉลี่ย Serum amylase ในประชากรทั้ง 2

กลุมตางกัน

μ1 ≠ μ2

กําหนดให ระดับนัยสําคัญ (α) = 0.05

การคํานวณ คา t คํานวณไดจากสูตรดังตารางโดย

กําหนดให

1X , 2X = 96 และ 120

S1, S2 = 35 และ 40

n1, n2 = 15 และ 22

ในที่นี้จะแสดงผลการวิเคราะหดวยโปรแกรมสําเร็จรูป

STATA ซึ่งผลที่ไดเขาใจงาย แตถาคํานวณโดยใชสูตรก็

ไดผลเชนเดียวกัน

ตัวอยางผลการวิเคราะหดวยโปรแกรม STATA

คําส่ัง ttesti 15 96 35 22 120 40

Two-sample t test with equal variances --------------------------------------------------------------------------------------------=====------------------------- ------------+---------------------------------------------------------------------------------------------------------------- x | 15 96 9.036961 35 76.61765 115.3824

y | 22 120 8.528029 40 102.265 137.735 ------------+---------------------------------------------------------------------------------------------------------------- Combined | 37 110.2703 6.477456 39.40082 97.13338 123.4072

------------+---------------------------------------------------------------------------------------------------------------- diff | -24 12.75052 -49.88493 1.884932

------------------------------------------------------------------------------------------------------------------------------ diff = mean(x) – mean(y) t = -1.8823

Ho : diff = 0 degrees of freedom = 35

Ha: diff<0 Ha: diff !=0 Ha: diff>0

Pr(T<t) = 0.0341 Pr(|T|>|t|) = 0.0681 Pr(T>t) = 0.9659

Page 15: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

238

สถิติในการวิจัย

จากผลการวิเคราะห คา p-value ไดจากผล

หมายเลข การทดสอบเปนแบบสองหางที่แสดงวา Ha:

diff !≠ 0 (ไมเทากับ 0), Pr > | t | = 0.0681 หมายความ

วาคาของพื้นที่ที่มากกวาคา t (1.88) และพื้นที่ที่นอยกวา

คา t (- 1.88) มีคาเทากับ 0.0681 ซึ่งมากกวา 0.05 จึงไม

สามารถปฏิเสธ Ho สรุปวาคาเฉลี่ยของ Serum amylase

ของประชากร 2 กลุมนี้ไมมีความแตกตางกัน (p=0.0681)

และที่ 95% CI ของผลตางอยูระหวาง -49.88 ถึง 1.88

คลุม 0 ดวยในผลหมายเลข

iib ตัวอยาง 2 ชุดมีความเกี่ยวของกัน เปน

การทดสอบความแตกตางระหวางคาที่ไดจากขอมูล 2 ชุด

ซึ่งอาจจะเปนคาที่วัดจากคนคนเดียวกันแตดูผลกอนและ

หลัง (Before/After) หรือดูผลของยาตางชนิดกันโดยจัดให

ตัวอยาง 2 ชุด มีความคลายกันมากที่สุดคือเปน Matched

pairs หรือการศึกษาในรูปตางๆ ที่เกี่ยวของกัน สวนใหญ

จะเปนการวิจัยเชิงทดลอง ตัวอยางที่ 16.9 จากการศึกษาผลของโปรแกรม diet-

exercise เพื่อดูวาระดับโคเลสเตอรอลนั้นลดลงหรือไม

โดยศึกษาในคนทั้งหมด 12 ราย วัดระดับโคเลสเตอรอล

กอนเขาโปรแกรมและหลังโปรแกรมวัดอีกครั้งหนึ่ง ถามี

การควบคุมตัวแปรอื่นๆ ที่จะสงผลตอการเปลี่ยนแปลง

ระดับโคเลสเตอรอล แลวจงทดสอบวาโปรแกรมนี้ชวยลด

ระดับโคเลสเตอรอลจริงหรือไม

วิธีทํา

สมมติฐาน Ho : คาเฉลี่ยของระดับโคเลสเตอรอลกอน

และหลังเขาโปรแกรมไมตางกัน

D = 0

Ha : โปรแกรมนี้ชวยใหระดับโคเลสเตอรอลลดลง

D > 0 ( D = Before – After)

ผลการวิเคราะห ดวยโปรแกรม SPSS

แสดงขอมูลจํานวน 12 ราย โดยวัดกอน (before) และ

หลัง (after) การทดลอง before after ผลตาง (กอน–หลัง) 1. 201 200 +1

2. 231 236 –5

3. 221 216 +5

4. 260 233 +27

5. 228 224 +4

6. 237 216 +21

7. 326 296 +30

8. 235 195 +40

9. 240 207 +33

10. 267 247 +20

11. 284 210 +74

12. 201 209 –8

ผลการวิเคราะหดวยโปรแกรม SPSS โดยใชคําส่ังจากเมนู Compare Means, Paired-Sample T Test ไดผลดังนี้

Paired Samples Test Paired Difference

t df Sig.

(2-tailed) Mean Std.

Deviation Std.Error

Mean

95% Confidence Interval of the Difference

Lower Upper

Pair 1 before-after 20.167 23.131 6.677 5.470 34.864 3.020 11 .012

Page 16: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

239

สถิติในการวิจัย

จากผลการวิเคราะหขอมูลดวยโปรแกรม SPSS

ไดผลดังขางบนนี้ที่หมายเลข คือคาเฉลี่ยของผลตาง

= 20.167 ที่หมายเลข คือชวงของผลตางที่ 95% CI

อยูระหวาง 5.47 ถึง 34.86 ซึ่งไมคลุม 0 ดังนั้นคาเฉลี่ย

ของโคเลสเตอรอลจึงตางกันจริง เมื่อดูผลการทดสอบ

สมมติฐาน หมายเลข ที่ Sig. คือ p=.012 ซึ่งนอยกวา

.05 จึงปฏิเสธ Ho สรุปวาโปรแกรมนี้ชวยใหระดับ

โคเลสเตอรอลกอนและหลังตางกันอยางมีนัยสําคัญทาง

สถิติ (p < 0.05) แตการศึกษานี้ทดสอบแบบหางเดียว คา

p จึงเทากับ 0.012/2 คือ .006 สรุปวาระดับโคเลสเตอรอล

ลดลงจริง

16.4.2 การทดสอบความแตกตางของสัดสวน i ตัวอยางชุดเดียว เปนการทดสอบคาสัดสวน

ในตัวอยางวาตางไปจากประชากรที่กําหนดไวหรือไม

ตัวอยางที่ 16.10 จากการสํารวจผูที่ขับรถยนต จํานวน

300 ราย พบวาใชเข็มขัดนิรภัยสม่ําเสมอ 123 คน จาก

ขอมูลที่สํารวจนี้พอจะสรุปไดหรือไมวาสัดสวน ในการใช

เข็มขัดนิรภัยของผูขับรถยนตนั้นไมเทากับ 0.50

วิธีทาํ

สมมติฐาน

Ho : สัดสวนในการใชเข็มขัดนิรภัยของประชากร

ที่ขับรถยนตเทากับ 0.50

P = 0.50

Ha : สัดสวนในการใชเข็มขัดนิรภัยของประชากร

ที่ขับรถยนต ไมเทากับ 0.5

P ≠ 0.50

ตรวจสอบคา nP = 300 × 0.50 = 150 มากกวา 5

จึงใชสูตร Z = p P

P(1 P)

n

−−

p = 123

300 = 0.41

แทนคา Z = 0.41 0.5

0.5 0.5

300

−× = - 3.12

กําหนดใหระดับนัยสําคัญที่ α=0.05 คา Z = 1.96

จะเห็นวาคา |Z| ที่คํานวณไดมากกวาคา Z ที่

กําหนดดังนั้น p < 0.05

สรุปวา จากขอมูลนี้การใชเข็มขัดนิรภัยของประชากรที่สุม

ตัวอยางมาไมเทากับ 50% ( p < 0.05)

iia ตัวอยาง 2 ชุดเปนอิสระกัน เปนการ

ทดสอบความแตกตางของสัดสวนในตัวอยาง 2 ชุด วามา

จากประชากรที่มีสัดสวนตางกันหรือไม ตัวอยางที่ 16.11 ในการศึกษาเพื่อเปรียบเทียบผลของยา

ใหมที่รักษาโรค Migraineกับ ยามาตรฐานที่ใชอยูกอนโดย

ศึกษาในผูปวยกลุมละ 100 รายที่ใชยาแตละชนิด พบวา

กลุมที่ใชยาเดิมมีอาการดีขึ้น 78 ราย ผูที่ใชยาใหมอาการ

ดีขึ้น 90 ราย จากขอมูลนี้พอจะสรุปไดหรือไมวา ยาใหม

ใหผลดีกวายามาตรฐาน

วิธีทํา

สมมติฐาน Ho : ยาใหมใหผลไมตางไปจากยาเดิม

P1 = P2 หรือ P1 − P2 = 0

Ha : ยาใหมใหผลดีกวายาเดิม

P1 > P2 หรือ P1 − P2 > 0

ดังนั้น Ho จะเปน P1 − P2 < 0

p1 = 90

100 = 0.9

p2 = 78

100 = 0.78

แทนคาสูตร Z = 0.9 0.78

0.9 0.1 0.78 0.22100 100

−× ×

+

= 2.35

เมื่อเทียบกับคา Z ที่ระดับนัยสําคัญ 0.05 แลว

คา Z จากการคํานวณได 2.35 มากกวา Z = 1.96 จึงตก

อยูในเขตปฏิเสธ Ho สรุปวา ยาใหมชวยใหอาการดีขึ้น

มากกวายาเดิมอยางมีนัยสําคัญทางสถิติ (p < 0.05)

ศึกษาผลการวิเคราะหโดยใชโปรแกรม STATA

Page 17: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

240

สถิติในการวิจัย

คําส่ัง prtesti 100 90 100 78, count

Two-sample test of proportion x : Number of obs = 100 y : Number of obs = 100 --------------------------------------------------------------------------------------------------------------------- Variable | Mean Std. Err. z P>|z| [95% Conf. Interval] ----------+--------------------------------------------------------------------------------------------------------- x | .9 .03 .8412011 .9587989 y | .78 .0414246 .6988092 .8611908 ----------+--------------------------------------------------------------------------------------------------------- diff | .12 .0511468 .019754 .220246 | under Ho: .0518456 2.31 0.021 --------------------------------------------------------------------------------------------------------------------- diff = prop(x) – popo (y) z = 2.3146 Ho: diff = 0 Ha: diff < 0 Ha: diff ! = 0 Ha: diff > 0 Pr (Z<z) = 0.9897 Pr(|Z|<|z|) = 0.0203 Pr(Z>z) = 0.0103

จากผลการวิเคราะห คาชวงความเชื่อม่ัน 95%

CI ของผลตางสัดสวนที่มีอาการดีขึ้น ระหวางยา 2 ตัว

เทากับ 0.0197 ถึง 0.2202 ในผลหมายเลข หรือ

เทากับ 1.97% ถึง 22.0% ไมคลุม 0 จึงสรุปวา

ผลการรักษาตางกันอยางมีนัยสําคัญทางสถิติ แตผลการ

ทดสอบสมมติฐานเปนแบบหางเดียวจึงดูที่หมายเลข

คือ Ha:diff>0 คา p=0.0103 จึงสรุปวายาใหมใหผลดีกวา

ยามาตรฐานอยางมีนัยสําคัญทางสถิติ (p<.05)

iib ตัวอยาง 2 ชุด เกี่ยวของกัน ขอมูลบางชุด

ที่มาจากหนวยศึกษาเดียวกัน เมื่อเก็บขอมูลไดขอมูลทั้ง

2 ชุด ที่มีความเกี่ยวของกัน ถาหนวยศึกษาคนละหนวยกัน

แตไดจับคูใหเหมือนกันแลว ผลที่วัดออกมาก็ยัง เกี่ยวของ

กัน หลักการตางๆ ทํานองเดียวกับการทดสอบความ

แตกตางคาเฉลี่ย สําหรับตัวอยาง 2 ชุด ที่เกี่ยวของกัน

เพียงแตการวัดจะออกมาในรูปของ binary outcome เชน

รอด / ตาย, หาย / ไมหาย ดังนั้นจึงวัดออกมาในรูปของ

สัดสวน

ตัวอยางที่ 16.12 ผลการตรวจเชื้อ TB จากเสมหะ 50

specimens โดยแตละ culture จะถูกแบงเปน 2 media

ตางกันคือ A, B เพื่ อ เป รียบเทียบดูว า media ทั้ ง 2

สามารถตรวจพบเชื้อตางกันหรือไม ขอมูลจากการทดสอบ

ดังขางลาง

Medium Type A B No. of Sputum

1 + + 20

2 + - 12

3 - + 2

4 - - 16

จากขอมูลจะนํามาแจกแจงลงในตาราง 2 × 2 ไดดังนี้ Medium B + - รวม

+ 20 12 32

Medium A

a b c d

- 2 16 18 รวม 22 28 50

Page 18: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

241

สถิติในการวิจัย

Ho: ผลการตรวจจาก Medium A และ B ไมตางกัน

Ha: ผลการตรวจจาก ทั้ง 2 Media ตางกัน

กําหนดใหระดับนัยสําคัญ = 0.05

จากสูตร z = b c

b c

−+

b, c = จํานวนคูที่ใหผลไมสอดคลอง

กันในที่นี้ คือ 12 และ 2

ตรวจสอบ b c

2+

= 12 2

2+

= 7 มากกวา 5 ตรงตามขอสมมติ

ดังนั้น Z = 12 212 2−+

= 2.67

คา Z จากการคํานวณมากกวา 1.96 จึงปฏิเสธ Ho

สรุป มีความแตกตางกันในผลการตรวจระหวาง media

ทั้งสองอยางมีนัยสําคัญทางสถิติ (p < 0.05)

หมายเหตุ : การทดสอบนี้ใหผลเชนเดียวกับ Mc Nemar’s

test ซ่ึงจะกลาวในหัวขอ 16.6 การทดสอบไคสแควร

16.5 นัยสําคัญทางสถิติและนัยสําคัญทางคลินิก (Statistical significance and Clinical significance)

Gardner และ Altman (1986) ไดเสนอแนะวา

การรายงานผลการทดสอบสมมติฐานเพียงเฉพาะวามี

หรือไมมีนัยสําคัญทางสถิตินั้นยังไมเพียงพอ ผูวิจัยควร

ร า ย ง า นค า p-value ด ว ย สํ า ห รั บ ก า ร ป ร ะ ม าณ

คาพารามิเตอรใหมีคาชวงความเชื่อม่ัน (CI) ควบคูไปดวย

เสมอ ทั้งนี้เพื่อใหผูอานสามารถพิจารณาไดวาขอมูลที่

เสนอนั้นมีความนาเชื่อถือเพียงใด

โดยทั่วไปการทดสอบสมมติฐานแบบ 2 หาง

( two tailed hypothesis testing) แ ล ะ ก า ร ป ร ะ ม าณ

คาพารามิเตอรที่ 95% CI มีความสอดคลองกันดังตัวอยาง

ที่ 16.3 ซ่ึงทดสอบผลตางของคาเฉลี่ย ถาคํานวณคา

ผลตางที่ 95% CI จะพบวา 95% CI ของ μ1–μ2 = –1.88

ถึง 49.88 ชวงของผลตางเฉลี่ยคลุม 0 แสดงวามีโอกาสที่

คาเฉลี่ยของทั้ง 2 กลุม ไมตางกัน ซ่ึงผลการทดสอบที่

Ha : μ1 –μ2 ≠ 0 ไดคา p = 0.0681 ซ่ึงมากกวา 0.05

จึงสรุปวาคาเฉลี่ยของทั้ง 2 กลุมไมตางกัน

อยางไรก็ตามเปนที่นาสังเกตวาในการทดสอบ

สมมติฐานนั้น ผูวิจัยพยายามที่จะใหพบคา p นอยๆ เพื่อ

จะไดมีโอกาสปฏิเสธ Ho (เม่ือ Ho ถูกตอง) ซ่ึงทําไดโดยให

ขนาดของตัวอยาง (n) มากๆ เพราะถาตัวอยางมีขนาด

ใหญมากจะสงผลให SE เล็กลง ในการคํานวณคาสถิติ (t,

Z) จึงทําใหการทดสอบมีโอกาสที่จะปฏิเสธ Ho มากขึ้น

แมวาความแตกตางนั้นจะนอย แตถาจํานวนตัวอยางมาก

ก็มีโอกาสปฏิเสธ Ho ได ดวยเหตุนี้การบอกนัยสําคัญทาง

สถิติควรตองพิจารณารวมไปกับนัยสําคัญทางคลินิกเสมอ

ความสําคัญทางคลินิก มี คุณคาที่ จะนําไปใชตอไป

ดังตัวอยางตอไปนี้

ตัวอยางที่ 16.13 จากการทดลองทํา Clinical trial เพื่อดู

ผลของยาลดความดันโลหิต 2 ชนิดในคนไข 2 กลุม

กรณีที่ 1

กรณีที่ 2

จํานวนคนไขกลุมละ 500 10 คาเฉลี่ยความดันโลหิตที่ลดลง (มม.ปรอท)

กลุมที่ 1 30 17 กลุมที่ 2 32 30 p-value 0.04 0.06 สรุปความแตกตางอยางมีนัยสําคัญ ทางสถิติ มี ไมมี ทางคลินิก ไมมี มี

กรณีที่ 1 สรุปวา ยา 2 ชนิด ใหผลตางกันอยางมีนัยสําคัญ

ทางสถิติ (p<.05) แตในทางคลินิกแลวไมมีความ

แตกตางกันเลย เพราะสามารถลดไดตางกันเพียง

2 mm. เทานั้น แตเนื่องจากคนไขมากถึงกลุมละ

500 ราย จึงทําใหมีนัยสําคัญทางสถิติ

กรณีที่ 2 สรุปว ายา 2 ชนิด ใหผลไมต า งกั นอย า งมี

นัยสําคัญทางสถิติ (p>.05) แตเม่ือพิจารณาทาง

คลินิกจะเห็นวา ยา 2 ชนิด ลดไดตางกันถึง 13

มม.ปรอท จึงถือวามีความสําคัญมาก ดังนั้นการ

สรุปผลนั้นควรพิจารณาผลทางคลินิกไปดวย ซ่ึง

ผูวิจัยจะเปนผูตัดสินใจไดวาในเรื่องนั้นๆ ควรมี

ขอบเขตเพียงใดที่จะตัดสิน

Page 19: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

242

สถิติในการวิจัย

16.6 การทดสอบไคสแควร (Chi-Square test) การทดสอบไคสแควรเปนการทดสอบทางสถิติ

สําหรับขอมูลที่เปนเชิงจําแนกลักษณะคือเปนชนิดกลุม

(Categorical data) ซ่ึงไดมาจากการนับจํานวนความถี่

สวนสเกลในการวัดอาจวัดในรูปของ nominal scale หรือ

ordinal scale การทดสอบนี้มักจะใชกับขอมูลทางระบาด

วิทยา, ทางสังคมศาสตร ฯลฯ การแจกแจงของไคสแควร

(X2) จะมาจากการแจกแจงแบบปกติ โดยที่คา X2 ก็คือ Z2

นั่นเอง แตโคงของการแจกแจงไมเปนรูประฆังคว่ําแบบโคง

ปกติ ถาคาของชั้นแหงความเปนอิสระ (Degree of

freedom หรือ df) มากขึ้น การแจกแจงจะมีลักษณะแบบ

ปกติ

ในที่นี้จะกลาวถึงการนําการทดสอบไคสแควรไป

ใชในรูปแบบตางๆ กัน 3 รูปแบบคือ

ก. Test for Goodness of Fit

ข. Test for Homogeneity

ค. Test for Association

ก. Test for Goodness of Fit เปนการทดสอบ

เพื่อดูวาคาสังเกต (Observation) ที่ไดมาในแตละกลุมนั้น

มีการแจกแจงไปตามที่คาดไวหรือไม เชน จํานวนคนไขใน

แตละวันของสัปดาหหนึ่ง, จํานวนผลผลิตที่ไดในแตละ

ลักษณะที่เปนไปได (ตามหลักพันธุศาสตร) ฯลฯ การ

ทดสอบนี้ใชหลักการวาคาสังเกตนั้นตางไป จากคา

คาดหวังตามทฤษฎีหรือไม

ให Oi = คาสังเกตในแตละกลุม (Observed

value)

Ei = คาคาดหวังตามทฤษฎีในแตละกลุม

(Expected value)

สูตร X2 = 2

i i

i

(O E )E−∑

การกําหนดขอบเขตของคา X2 จะขึ้นอยูกับระดับนัยสําคัญ

(α) และคาของ df เพื่อนําไปเปดตาราง

df = จํานวนกลุม - 1

การตั้งสมมติฐาน

Ho : การแจกแจงในแตละกลุมไมตางไปจากทฤษฎี

Ha : การแจกแจงในแตละกลุมตางไปจากทฤษฎี

ดังตัวอยางการกําหนดขอบเขต

ดังนั้นถาคา X2 จากการคํานวณไดมากกวา

3.84 ที่ df = 1 แสดงวาคา p-value นอยกวา 0.05 ปฏิเสธ

Ho สรุปวาการแจกแจงของคาสังเกตในแตละกลุมตางไป

จากทฤษฎี การเปดตารางคา X2 จะทําใหทราบคา

p-value โดยประมาณวามากหรือนอยกวาคา α โดยดู

จากรูป แตถาใชโปรแกรมทางสถิติวิเคราะหจะทราบคา p

ที่แทจริงและใชเปรียบเทียบกับคา α ไดเลย ตัวอยางที่ 16.14 จากตารางขางลางนี้แสดงจํานวนผูปวย

ดวยไขหวัดใหญที่โรงพยาบาลรายงานในแตละวันภายใน

1 สัปดาห จงทดสอบสมมติฐานวาจํานวนผูปวยดวยโรคนี้

มีการเกิดเทาๆ กันทุกวันโดยแจกแจงแบบ Uniform

distribution ในสัปดาห

วัน จํานวนผูปวย (Oi)

จันทร

อังคาร

พุธ

พฤหัส

ศุกร

เสาร

อาทิตย

38

31

40

39

40

44

48

รวม 280

วิธีทํา

สมมติฐาน

Ho : จํานวนผูปวยในแตละวันเกิดขึ้นเทาๆ กัน

Ha : จํานวนผูปวยในแตละวันเกิดขึ้นไมเทากัน

นั่นคือ จํานวนผูปวยที่คาดวาจะเกิด (Ei) ในแตละวัน

= 1 2807×

= 40 ราย

TIK
Stamp
Page 20: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

243

สถิติในการวิจัย

แทนคาสูตร X2 = 2 2(38 40) (48 40)

40 40− −+−−−+

= 4 81 0 1 0 16 6440

+ + + + + +

= 16640

= 4.15

df = 7–1 = 6

เปดตารางคา X2 ที่ α = 0.05 และ df = 6 ไดคา

X2 = 12.59

จากการคํานวณ ไดคา X2 = 4.15 ซ่ึงนอยกวาจาก

ตาราง นั่นคือ p > 0.05

สรุปวาไมสามารถปฏิเสธ Ho ดังนั้นจํานวนผูปวย

ไขหวัดใหญในแตละวันเกิดขึ้นเทาๆ กันตลอดสัปดาห จาก

ตัวอยางขางตนจะเห็นวาเปนการแจกแจงความถี่ของ

ตัวแปรเดียว ดังนั้นส่ิงที่สนใจคือการแจกแจงการเกิด

เหตุการณในแตละระดับของตัวแปรนั้นถามีตัวแปรอื่นมา

เกี่ยวของอีกก็จะมีการทดสอบวาตัวแปรทั้งสองเก่ียวของ

กันหรือไม

ข. Test for Homogeneity เปนการทดสอบเพื่อ

ดูวาการแจกแจงในแตละกลุมของตัวแปรนั้นมีความ

แตกตางกันหรือไมโดยสามารถนําการแบงชั้นตางๆ ในแต

ละตัวแปรมาสรางเปนตารางการณจร (Contingency

table) แลวแจงนับคาสังเกตที่สอดคลองกับระดับของ

ตัวแปรนั้น

ตัวแปรที่ 2 ตัวแปรที่ 1

1 2 3 -------------- c รวม

1

2

3

|

|

|

r

O11

O21

O31

|

|

|

Or1

O12

O22

O32

|

|

|

Or2

O13 ------------- O1c

O23 ------------- O2c

O33 ------------- O3c

| |

| |

| |

Or3 ------------- Orc

R1

R2

R3

|

|

|

Rr

รวม C1 C2 C3 ------------- Cc n

ถาให ตัวแปรที่ 1 แบงเปน c กลุม ( c คอลัมน )

ตัวแปรที่ 2 แบงเปน r กลุม (r แถว )

ขนาดของตารางจะเปน r x c

df = (r - 1) ( c - 1 )

คา Oij = คาสังเกตที่แจงนับไดในแตละเซลลนั้น

คือความถี่นั่นเอง

n = ขนาดของตัวอยาง

Ri,Ci = จํานวนความถี่ทั้งหมดในแตละแถว

และแตละคอลัมน

Eij = คาคาดหวังที่จะเกิดในแตละเซลลโดย

คํานวณไดจาก RiCj/n

สูตรที่ใชคํานวณทั่วไป

X2 = 2

ij ij

ij

(O E )E−

ตัวอยางที่ 16.15 ผูวิจัยไดศึกษาถึงความรุนแรงของโรค

หนึ่งในแตละกลุมเลือด โดยไดขอมูลจากคนไขจํานวน

1500 คน จําแนกตามตารางดังนี้

ชนิดของกลุมเลือด ความรุนแรงของโรค A B AB O รวม

ไมรุนแรง

เล็กนอย

มาก

543

44

28

211

22

9

90

8

7

476

31

31

1320

105

75

รวม 615 242 105 539 1500

ที่ระดับนัยสําคัญ 0.05 จงทดสอบสมมติฐานวากลุมเลือด

ทั้ง 4 กลุม มีระดับความรุนแรงของโรคตางกันหรือไม

วิธีทํา

สมมติฐาน Ho : กลุมเลือดแตละกลุมมีระดับความ

รุนแรงของโรคไมตางกัน

Ha : กลุมเลือดแตละกลุมมีระดับความ

รุนแรงของโรคตางกัน

คํานวณคาคาดหวัง E ของแตละเซลล

11

1320 615E 541.21500

×= =

คา Eij ในเซลลอื่น ๆก็คํานวณทํานอง

เดียวกันจํานวนเซลลทั้งหมด = 3 × 4 = 12

Page 21: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

244

สถิติในการวิจัย

สูตรที่ใชคือ X2 = 2(O E)

E−∑

ดังนั้น X2 = 2 2(543 5412) (31 26.9)541.2 26.9− −

+ − −− +

= 5.12

df = ( 3–1 )( 4–1 ) = 6

จากตารางคา X2 ที่ α = 0.05 เทากับ 12.59

ดังนั้นไมสามารถปฏิเสธ Ho ได

สรุปกลุมเลือดแตละกลุมมีระดับความรุนแรงของโรค

ไมตางกันอยางมีนัยสําคัญทางสถิติ (p >0.05 ) ขอควรระวังในการทดสอบไคสแควร ควรคํานึงถึง

ขนาดของคาคาดหวัง โดยมีขอกําหนดดังนี้

1) คาคาดหวังไมควรจะต่ํากวา 1 เพราะจะทําให

คา X2 มีคามากขึ้นและโอกาสที่จะปฏิเสธ Hoก็มีมากขึ้น

2) คาคาดหวังไมควรต่ํากวา 5 แตถาต่ํากวา 5 ก็

ไมควรใหเกิน 20% ของจํานวนเซลล เชน ตารางขนาด 3

× 2 ซ่ึงมี 6 ชองตาราง คาคาดหวังต่ํากวา 5 ควรมีไดเพียง

1 ชองตาราง การแกไขทําไดโดยจัดกลุมของระดับในตัว

แปรใหนอยลงโดยผูวิจัยเปนผูกําหนดวาควรจะรวมกลุมใด

ในกรณีตารางขนาด 2 × 2 ถามีคาคาดหวังคาใดคาหนึ่ง

ตํ่ากวา 5 ก็เสนอใหใช Fisher’s exact probability test

3) ถาขนาดตัวอย างมี จํานวนนอย การใช

ไคสแควรทดสอบควรมีการปรับคา X2 ซ่ึงเรียกวา Yates’

Correction โดยใชคา 1/2 ไปลบจากผลตางของ |O–E|

แตถาจํานวนตัวอยางมีมาก คา X2 ที่ปรับและไม ปรับก็มี

คาใกลเคียงกัน

Corrected X2 = 2( O E 1/ 2)

E− −∑

ค . Test for Association เ ป น ก า ร ท ดส อบ

ความสัมพันธของตัวแปรบอกลักษณะ ซ่ึงสวนมากในทาง

การแพทยมักจะใชทดสอบดูความสัมพันธระหวางปจจัย

นั้นๆ กับการเกิดโรค โดยขนาดของตารางมักจะเปนขนาด

2 × 2 หรืออาจจะมากกวา 2 × 2 ก็ได

ในกรณีที่เปนตาราง 2×2 การทดสอบแบบ

ไคสแควรจะใหผลเชนเดียวกับการทดสอบความแตกตาง

ของสัดสวน แตไมสามารถประมาณชวงของความแตกตาง

(P1–P2) ได เชนเดียวกับการทดสอบความแตกตางของ

สัดสวนดังนั้นการทดสอบไคสแควรจะบอกไดแตเพียงวา

ตัวแปรทั้ง 2 มีความสัมพันธกันหรือไมตามสมมติฐานแต

ไมสามารถบอกถึงระดับของความสัมพันธ (Strength of

association) ได

ตัวอยางแสดงความสัมพันธระหวางการเกิดโรค

และการไดรับปจจัย

ปจจัย เปนโรค ไมเปนโรค รวม

ไดรับ

ไมไดรับ

a

c

b

d

e

f

รวม g h n

สูตร X2 สําหรับขนาด 2 x 2 โดยวิธีลัดคือ

X2 =

2(ad bc) ne f g h−⋅ ⋅ ⋅

โดยการปรับดวยวิธี Continuity Correction

X2 = 2( ad bc n / 2) n

e f g h− −⋅ ⋅ ⋅

ผลลัพธที่ไดโดยวิธีลัดจะใหคาใกลเคียงหรือ

เทากับสูตรทั่วไปขางตน

การตั้งสมมติฐานทางสถิติ

Ho : ปจจัยนั้นไมมีความสัมพันธกับการเกิดโรค

Ha : ปจจัยนั้นมีความสัมพันธกับการเกิดโรค

การปรับคา X2 นั้น ถาตัวอยางมีขนาดใหญพอคา X2 ชนิด

ปรับและไมปรับก็มีคาใกลเคียงกันแตถาขนาดตัวอยางมี

จํานวนนอยคา X2 ชนิดปรับจะมีคานอยลงทําใหโอกาสที่

จะปฏิเสธ Ho ก็ยากขึ้น ดังนั้นถาขนาดตัวอยางมีจํานวน

นอยควรใชคา X2 ที่ปรับแลวในการสรุปผล ซ่ึงโดยทั่วไปถา

นอยกวา 40 ก็จะใชคาที่ปรับ

ตัวอยางที่ 16.16 ในการศึกษาเชิงวิเคราะหชนิดยอนหลัง

โดยมีกลุมศึกษา (Case) และกลุมควบคุม (Control) และ

สอบถามปจจัยที่ไดรับในอดีตพบวาผูปวยดวยมะเร็งปอด

และคนปกติประวั ติการสูบบุหร่ี ดังตารางขางลางนี้

จงทดสอบวาการสูบบุหร่ีมีความสัมพันธกับการเกิดมะเร็ง

ปอดหรือไม

Page 22: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

245

สถิติในการวิจัย

การสูบบุหรี่ Case Control รวม

สูบ

ไมสูบ

100

25

60

215

160

240

รวม 125 275 400

วิธีทํา

Ho : การสูบบุหร่ีไมมีความสัมพันธกับการเกิดมะเร็งปอด

Ha : การสูบบุหร่ีมีความสัมพันธกับการเกิดมะเร็งปอด

X2 = 2(100 215 60 25) 400

160 240 125 275

× − × ×× × ×

= 121.2

คา X2 ที่ df = 1, α = 0.05 จากตาราง X2 = 3.84

ดังนั้นปฏิเสธ Ho

สรุป การสูบบุหร่ีมีความสัมพันธกับการเกิดมะเร็งปอด

(p<0.05 )

จะเห็นวาแมวาคา X2 จะมีคามากหรือนอยก็ตาม

เราเพียงแตสรุปไดวาการสูบบุหร่ีมีความสัมพันธกับการ

เกิดมะเร็งปอด แตเราไมสามารถบอกไดวาผูที่สูบบุหร่ีจะมี

โอกาสเสี่ยงเปนกี่เทาของการเปนมะเร็งปอด ดังนั้นจะตอง

คํานวณหาคาการเสี่ยงในรูปของ Relative Risk หรือ

Odds Ratio ตามความเหมาะสมตอไป

16.6.1 Fisher’s exact test ใชทดสอบในกรณีที่

คาคาดหวังนอยกวา 5 ในตารางขนาด 2 x 2 สวนจํานวน

ตัวอยางจะมีขนาดเทาใดก็ไดการทดสอบวิธีนี้จะใหคา

ความนาจะเปนคือคา p-value นั่นเองแลวเปรียบเทียบ กับ

ระดับ นัยสําคัญ (α) เพื่อสรุปผลการคํานวณคา p

คอนขางจะยุงยาก แตมีโปรแกรมสําเร็จรูปทางสถิติหลาย

โปรแกรมคํานวณไวให เชน STATA, SPSS

คา p ที่ไดจากการคํานวณ =e!f!g!h!

n!a!b!c!d!

โดยคา p ที่ไดจากตารางจะมีการคํานวณในหลายกรณี

เม่ือคาต่ําสุดของเซลลนั้นลดลงไปจนเทากับ 0 แตคา

ผลรวมในแถวและคอลัมนคงเดิมแลว p จะเทากับผลรวม

คา p ในแตละกรณี ดังตัวอยางตอไปนี้

ตัวอยางที่ 16.17 ไดทําการศึกษาในเด็กที่พูดไมชัดและ

เด็กปกติจํานวน 16 คน เพื่อดูวามีความผิดปกติทาง

สายตาหรือไม ไดผลดังตารางขางลางนี้ จงทดสอบวาเด็ก

ทั้ง 2 กลุม มีความผิดปกติทางสายตาตางกันหรือไม

สายตา พูดไมชัด ปกติ รวม

ผิดปกติ 1 5 6

ปกติ 8 2 10

รวม 9 7 16

วิธีทํา

Ho:อัตราความผิดปกติทางสายตาในเด็กทั้ง 2 กลุมไมตางกัน

Ha :อัตราความผิดปกติทางสายตาในเด็กทั้ง 2 กลุมตางกัน

คํานวณคา P จากตารางเดิมและคา P จากตารางที่ลด

เซลลตํ่าสุดคือ 1 ลง มาเปน 0 โดยที่คาผลรวมในแถว และ

คอลัมนยังคงเดิม

1

6!10!9!7!P 0.0236016!1!5!8!2!= =

0

6!10!9!7!P 0.0008716!0!6!9!1!= =

5 6

8 2 9 1

คา P = P1 + P0 = 0.02360 + 0.00087 = 0.02447

คา p<0.05 ดังนั้นปฏิเสธHo สรุปวาเด็กทั้ง 2 กลุมมีอัตรา

ความผิดปกติดานสายตาตางกันอยางมีนัยสําคัญทางสถิติ

(p<.05) 16.6.2 Mc Nemar’s test เปนการทดสอบดู

ความสัมพันธหรือความแตกตางในตัวอยาง 2 ชุดที่

เกี่ยวของกัน โดยผลการวัดที่สนใจจะออกมาเปน Binary

data ตัวอยางที่เกี่ยวของกันในลักษณะเปนคูนั้นมีช่ือเรียก

อีกอยางหนึ่งวา Marginal Chi-square มีหลักการวา

จะตองมีความคลายกันภายในคู (Homogeneity within

pairs) และมีความแตกตางกันระหวางคู (Heterogeneity

between pairs) โดยแบงเปนกรณีตางๆ ดังนี้

Page 23: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

246

สถิติในการวิจัย

1. Self pairing การจับคูในตัวเองเชนการวัดผล

กอนและหลังหรือการวัดในตําแหนงซาย-ขวา

2. Natural pairing การจับคูที่ธรรมชาติกําหนด

เชน การศึกษาในฝาแฝด (Twin )

3. Artificial pairing การจับคูใหโดยผูวิจัยเลือก

ตามลักษณะที่ เหมือนกันดวยปจจัยที่ คิดวาจะมีสวน

เกี่ยวของ โดยการทํา Matching

ตัวอยางการทดลองดูผลกอนและหลังในตัวอยางขนาด n

โดยผลจะวัดเปน 2 อยาง คือ + และ - เม่ือจัดลงในตาราง

2 x 2 จะไดดังนี้ หลัง + -

+ a b

กอน

- c d

จะเห็นวา จํานวนความถี่ในแตละเซลลแจกแจงผลไดดังนี้

กอน หลัง จํานวนคู

+ + A

+ - B

- + C

- - d

คาที่สนใจ คือ คา b, c ซ่ึงเปนจํานวนคูที่ใหผลไมสอดคลอง

กัน

สูตร X2 = 2(b c)

b c−+

Continuity correction X2 =

2( b c 1)b c− −+

สมมติฐาน Ho : ผลการวัดกอนและหลังไมตางกัน

Ha : ผลการวัดกอนและหลังตางกัน ตัวอยางที่ 16.18 ในการเปรียบเทียบเพื่อดูผลการรักษา

ดวยยา A และยา B ในผูปวยโรคหนึ่งซึ่งแบงเปน 2 กลุม

และจับคู (Matching) ใหมีลักษณะเหมือนกันในเรื่องของ

อายุ, เพศ และปจจัยอื่นๆ ที่คิดวาเกี่ยวของจํานวนคน

ทั้งหมดที่ศึกษากลุมละ 18 ราย การวัดผลดูจากอาการวาดี

ขึ้นหรือคงเดิมไดผลดังตาราง

จงทดสอบสมมติฐานวายา A และยา B ใหผลตางกัน

หรือไม

ยา A

ดีขึ้น คงเดิม รวม

ดีขึ้น

ยา B

คงเดิม

1 9

3 5

10

8

รวม 4 14 18

วิธีทํา

จากตารางจะเห็นวาขอมูลทั้ง 2 กลุม เกี่ยวของ

กันจึงจัดเปน 18 คู คูที่ใหผลไมสอดคลองกันคือ มี 9 คู ที่

ผลจากยา A คงเดิมผลจากยา B ดีขึ้น และ 3 คูที่ผลจาก

ยา A ดีขึ้นผลจากยา B คงเดิม

สมมติฐาน Ho : ยา A และยา B ใหผลไมตางกัน

Ha: ยา A และยา B ใหผลตางกัน

corrected X2 = 2( 9 3 1)

9 3− −+

= 2.08

จากตาราง คา X2 ที่ df = 1, α = 0.05 เทากับ 3.84

คา X2 จากการคํานวณนอยกวาจากตาราง

ดังนั้นไมสามารถปฏิเสธ Ho นั่นคือ ยา A และยา

B ใหผลในการรักษาไมตางกัน

การทดสอบแบบไคสแควร ยังมีวิธีอื่นๆ อีก

แลวแตกรณี เชน Chi-square for trend ใชเม่ือระดับของ

ตัวแปรเปนลําดับมาตรา (Ordinal scale) และ Mantel-

Haenzsel Chi-square ใชวิเคราะหเพื่อปรับตัวแปรกวน

(Confounding factor) เพื่อขจัดอคติชนิด Confounding

bias

Page 24: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

247

สถิติในการวิจัย

16.7 การวิเคราะหความแปรปรวน (Analysis of Variances)

การวิเคราะหความแปรปรวน (Analysis of

Variance) นิยมเรียกโดยใชคํายอวา ANOVA เปนวิธีการ

วิเคราะหเพื่อดูวาความผันแปรในแตละกลุมขอมูลมีความ

แตกตางในดานคาเฉลี่ยและความแปรปรวนอยางไร กรณี

ของขอมูลมี 2 กลุม การทดสอบสามารถใช t-test ซ่ึงเปน

รูปแบบไมซับซอน แตกรณีของขอมูลที่ มีจํานวนกลุม

มากกวานั้น จําเปนตองใชการวิเคราะหแบบ ANOVA ใน

รูปแบบปกติซ่ึงใช F-test ขอมูลที่จะวิเคราะหดวยวิธีนี้ เปน

ขอมูลเชิงปริมาณ และมีขอตกลงเบื้องตน (Assumption)

ดังนี้

i. ขอมูลตองมีลักษณะแจกแจงแบบปกติ(ถาไม

เปนแบบปกติตองใชวิธีของ Nonparametric Statistics)

ii. ขอมูลแตละชุดตองเปนอิสระจากกัน

iii. มีความแปรปรวนของประชากรเทากัน (σ2

เทากันทุกกลุม)

ตัวอยางที่ตองมีการวิเคราะห ANOVA ไดแก การ

วิจัยแบบทดลองทางคลินิก (Clinical trial) ซ่ึงมีการจัดสรร

กลุมตางๆ แบบสุม (Randomization) กลุมตางๆ จะไดรับ

ปจจัย (factor) หรือวิธีการรักษา (treatment) ที่แตกตางกัน

เชนการใหยารักษาเปรียบเทียบส่ีชนิด หรือส่ีรูปแบบ ใน

กลุมคนไขที่ปวยดวยโรคหนึ่ง เพื่อดูผลการรักษาวามีความ

แตกตางกันหรือไม ชนิดของการวิเคราะหที่จะกลาวตอไป

จะขอกลาวเพียง 2 ชนิด ดังนี้

16.7.1 One-way ANOVA เปนวิ ธีที่ ง าย เพื่ อ

ศึกษาความผันแปรของกลุมขอมูลในระนาบเดียว เชนการ

วิเคราะหวา มีความแตกตาง ของ treatment แตละชนิด

หรือไม การวิเคราะหแบบระนาบเดียวนี้เหมาะสมกับ

รูปแบบการวิจัยทดลองที่มีการจัดสรรกลุมแบบสุมโดย

สมบูรณทุกมิติ (Completely randomized design, CRD)

เชน การศึกษาหนึ่งมี 5 treatments ตองการดูวามีความ

แตกตางกันหรือไม ถาใชวิธีการเปรียบเทียบครั้งละคูแบบ

t-test นั้นจะตองทําถึง 10 คู (5C2) ทําใหโอกาสที่จะไม

สามารถปฏิเสธ Ho เทากับ (0.95)10 หรือโอกาสปฏิเสธ Ho

คือ 1 – (0.95)10 = .4013 ซ่ึงมีคาสูงมาก และคา t ที่ไดแต

ละคาไมเปนอิสระกัน จึงนําไปสูการสรุปที่ไมถูกตองได การ

ดูความแตกตางในกรณีนี้ จําเปนตองวิ เคราะหความ

แปรปรวน ของทั้ง 5 กลุม ไปพรอมกันดวยวิธี One-way

ANOVA ในที่นี้จะกลาวถึงสูตรที่ใชกอน จากนั้นจะแสดง

การใชโปรแกรมสําเร็จรูปในการวิเคราะห ซ่ึงมีหลายชนิด

เชน SPSS, SAS, STATA, etc. โดยการนําเสนอผลการ

วิเคราะหดวยคอมพิวเตอร และวิธีการสรุปผลการวิเคราะห

ตอไป

กําหนดให Xij = คาสังเกตตัวที่ i จาก treatment ที่ j

โดย i = ลําดับที่ในแตละกลุม

j = ลําดับของ treatment นั้นๆ

ดังแสดงในตารางตอไป

Treatment

1 2 3-------------------k

X11 X12 X13-------------------X1k

X21 X22 X23-------------------X2k

X31 X32 X33-------------------X3k

| | | |

| | | |

| | | |

Xn11 Xn22 Xn33-----------------Xnkk

Total T1 T2 T3-------------------T

Mean 1X 2X 3X ---------------- X

ให Ti = ผลรวมของคาสังเกตในแตละ treatment

Xj = คาเฉลี่ยแตละ treatment

n = n1 + n2 -------nk

หลักการคํานวณเพื่อนําไปสรางตาราง ANOVA

Source of Variation df SS MS F-ratio

Between groups

Within groups

k-l

n-k

SSB

SSW

MSB

MSW

MSB = F

MSW

Total n-l SST

Page 25: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

248

สถิติในการวิจัย

หลักการคํานวณใชหลักการเดียวกับการหาคา

ความแปรปรวนในตัวอยางเพียงแตคํานวณแตละสวน เชน

ผลรวมกําลังสอง (Sum square, SS) และ Mean square,

MS) โดยคํานวณจาก SS/df นั่นเอง ขั้นตอนการคํานวณมี

ดังนี้

Correction term (CT) = กําลังสองของผลรวม

ทั้งหมด / n = 2T

N

SST = ผลรวมแตละคายกกําลังสอง - CT

= ∑∑ X2ij – CT

SSB = ผลรวมแตละ treatment (T) ยกกําลังสอง

จํานวนตัวอยางในแตละ treatment

= 222 2j31 2

1 2 3 j

...TTT TCTn n n n+ + + −

SSW (Sum square within) หรือ SSE (Sum

square error) = SST – SSB คา F ที่ไดเปนอัตราสวน

ระหวาง MSB (ความแปรปรวนระหวางกลุม) นั่นเอง

MSW (ความแปรปรวนภายในกลุม)

โดยมี df ที่ k–1 และ n–k

สมมติฐาน Ho : คาเฉลี่ยของประชากรในและกลุมเทากัน

μ1 = μ2 = μ3 = ..................μk

Ha : คาเฉลี่ยของประชากรตางกันอยางนอย 1คู

μi ≠ μj

การสรุปผล ถาคา F ที่คํานวณไดมากกวาคา F จากตาราง

แสดงวาปฏิเสธ Ho นั่นคือ คาเฉลี่ยตางกันอยางนอย 1 คู

ก็จะมีวิธีการตางๆ ทดสอบดูวาคูใดบางที่ตางกัน วิธีที่ใช

กันทั่วไปไดแก LSD (Least Significant Difference),

Duncan’s new multiple range test, Turkey HSD และ

Scheffe แตละวิธีจะมีขอดี ขอเสียตางกันไปจะไมกลาวใน

ที่นี้ ตัวอย า งที่ 16.19 จากการดู ผลของยากระตุ น ใน

สัตวทดลอง โดยจัดใหไดรับยาชนิดใดชนิดหนึ่งจาก 3 ชนิด

แลวดูผลการตอบสนองวาจะตอบสนองในเวลาเทาใด

(วินาที)ดังขอมูลขางลางนี้ จงทดสอบดูวาผลของยา แตละ

ชนิดมีความแตกตางในเรื่องของคาเฉล่ียระยะเวลาที่

ตอบสนองอยางมีนัยสําคัญทางสถิติที่ .05 หรือไม

ชนิดของยา I II III

16 6 8

14 7 10

14 7 9

13 8 10

13 4 6

12 8 7

12 9 10

17 6 9

17 8 11

17 6 11

19 4 9

14 9 10

15 5 9

20 5 5

คาเฉล่ีย 15.21 6.57 8.86

วิธีทํา

สมมติฐาน Ho : คาเฉลี่ยของระยะเวลาตอบสนองในยา

แตละชนิดไมตางกัน

μ1 = μ2 = μ3

Ha : μi ≠ μj อยางนอย 1 คู

ผลการวิเคราะหดวย SPSS ไดผลดังนี้

ไปเลือกเมนู Compare Means, One-way ANOVA (จะไม

กลาวถึงรายละเอียดการใชโปรแกรม) ไดผลดังนี้ ผลการ

ทดสอบ พบวาความแปรปรวนในประชากรแตละกลุม

ไมตางกัน (p = .142)

Page 26: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

249

สถิติในการวิจัย

Test of Homogeneity of Variances time

Levene Statistic df1 df2 Sig. 2.053 2 39 .142

ANOVA

time

Sum of Squares df Mean Square F Sig.

Between Groups 561.571 2 280.786 67.806 .000

Within Groups 161.500 39 4.141

Total 723.071 41

Post Hoc Tests Multiple Comparisons

time Tukey HSD

(I) treatment

(J) treatment

Mean Difference (I–J)

Std. Error Sig. 95% Confidence Interval

Lower Bound Upper Bound

1 2

3

8.643*

6.357*

.769

.769

.000

.000

6.77

4.48

10.52

8.23

2 1

3

-8.643*

-2.286*

.769

.769

.000

.014

-10.52

-4.16

-6.77

-.41

3 1

2

-6.357*

2.286*

.769

.769

.000

.014

-8.23

.41

-4.48

4.16

ผลการวิเคราะหดวย โปรแกรม SPSS จากตาราง

ANOVA แสดงคา F-Ratio ในหมายเลข ได 67.8058

และคา Sig. ในหมายเลข เทากับ 0.000 (คือคา

p<.001) ซ่ึงนอยกวาระดับนัยสําคัญ 0.05 จึงปฏิเสธ Ho

สรุปวามีความแตกตางกันอยางนอย 1 คู ระหวางคาเฉลี่ย

ของเวลาที่ตอบสนองในยาแตละชนิด ผลการทดสอบวาคู

ใดบางที่ตางกันโดยวิธี Tukey HSD เปรียบเทียบความ

แตกตางทีละคู ผลดังหมายเลข คูที่มีความแตกตางกัน

อยางมีนัยสําคัญทางสถิติ ไดแกคูของยาชนิดที่ 1 และ 2,

ยาชนิดที่ 1 และ 3, ยาชนิดที่ 2 และ 3 นั่นคือมีความ

แตกตางกันอยางมีนัยสําคัญทางสถิติทุกคู (p<.05)

Page 27: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

250

สถิติในการวิจัย

16.7.2 Two-way ANOVA จากการวิเคราะห

แบบระนาบเดียวขางตนนั้นจะมีความแตกตางเฉพาะ

ปจจัยที่ไดรับเทานั้นโดยหนวยตางๆที่ศึกษาในกลุมที่ไดรับ

ป จ จั ย เ ดี ย ว กั น นั้ น จ ะ ต อ ง มี ค ว า ม ค ล า ย กั น

(Homogeneous) แตถาในกลุมเดียวกันยังมีความ

แตกตางกันอีก เชนเพศตางกัน,กลุมอายุตางกัน จะตอง

พิจารณาถึงความแตกตางตรงนี้ดวย ความแตกตางเหลานี้

จะเรียกวา Block ดังนั้นการจัดหนวยทดลองใหไดรับปจจัย

นั้นๆ จะถูกวางแผนใหจัดสรรในรูปแบบของ Randomized

Complete Block design (RCB) การจัดดวยวิธีนี้ เพื่อ

ขจัดความคลาดเคลื่อนอันเกิดจากความแตกตางกันของ

block และการจัด block ที่เหมาะสมนั้น ขึ้นอยูกับผูวิจัย

และการจัดใหมีประสิทธิภาพนั้นควรใหมีความเหมือนกัน

ภายใน block นั้นๆ การวิเคราะห ชนิดนี้จึงเปนแบบสอง

ระนาบ ขอตกลงเบื้องตนมีขอกําหนดตางๆ เชนเดียวกับ

แบบ ร ะนาบ เ ดี ย ว และมี ข อ กํ า หนด เพิ่ ม คื อ ไ ม มี

interaction กันระหวาง treatment และ block โดยสรุป

ตารางการวิเคราะหความแปรปรวนชนิด 2 ระนาบ มีดังนี้

Source of

variation

df SS MS F-ratio

Treatments k-1 SSTr SSTr/(k-1) MSTr/MSE

Blocks n-1 SSBl SSBl/(n-1) MSBl/MSE

Residual (n-1)(k-1) SSE SSE/(n-1)(k-1)

Total kn-1

การสรุปผลจากคา F-ratio ใชหลักการเดียวกัน

กับชนิดการวิเคราะหระนาบเดียว

ในกรณีที่ขอมูลไมเปนไปตามขอตกลงเบื้องตนที่

กํ าหนดไว คือไมแจกแจงแบบปกติ ให ใชส ถิ ติแบบ

nonparamtric ในการวิเคราะห ซ่ึงการวิเคราะหแบบ

ระนาบเดียวใหใชวิธีการของ Kruskal-Wallis test การ

วิเคราะหแบบสองระนาบใหใชวิธีการของ Friedman test

นอกจากนี้ การวิเคราะหความแปรปรวนยังมีวิธีการอื่นๆ

ซ่ึงแตกตางกันไป ตามรูปแบบการวิจัยและสาขาวิชา เชน

ทางคลินิก ทางเกษตรทางการศึกษา เปนตน

16.8 สหสัมพันธและความถดถอย (Correlation and Regression )

ในการวิเคราะหความสัมพันธระหวางตัวแปร 2

ตัวที่เปนขอมูลชนิดจํานวนแบบตอเนื่องและวัดในคนๆ

เดียวกัน ทําไดสองแบบ คือแบบสหสัมพันธ (Correlation)

และแบบ วิเคราะหความถดถอย (Regression) กรณีไม

สามารถระบุตัวแปรใดเปนตัวแปรอิสระ (ตัวแปรตน)

ตัวแปรใดเปนตัวแปรผลลัพธ (ตัวแปรตาม) เชน อายุ และ

ความดันโลหิต การวิเคราะหความสัมพันธ ทําไดในแบบ

สหสัมพันธ วิเคราะหไดเพียงวา อายุ และ ความดันโลหิต

มีความสัมพันธกันในทิศทางใด ระดับความสัมพันธมาก

หรือนอย กรณีที่ทราบไดวาตัวแปรใดเปนตัวแปรอิสระตัว

แปรใดเปนตัวแปรตาม ผูวิจัยสามารถใชการวิเคราะห

ความถดถอยได เชน ถาทราบวาอายุ เปนตัวแปรอิสระ

ผูวิจัยทํานายคาความดันโลหิตซึ่งเปนตัวแปรตามได โดย

การสรางสมการหรือรูปแบบทํานายแบบฟงก ช่ันทาง

พีชคณิต 16.8.1 สหสัมพันธ (Correlation)

เม่ือเก็บขอมูลในแตละรายซึ่งไดมาเปนคูๆ แลว

ถาใหเปน (Xi, Yi), i = 1, 2 , 3, ........... n เปนคาสังเกต

จํานวน n ราย จงคํานวณคาสัมประสิทธิ์ สหสัมพันธ

(Correlation Coefficient) ไดดังนี้

r = 2 2

(x x )(y y )

(x x ) (y y )

∑ − −

∑ − ∑ − หรือ

2 22 2

xy ( x)( y) / n

( x) ( y)[ x ][ y ]

n n

∑ − ∑ ∑

∑ ∑∑ − ∑ −

r = the product moment correlation coefficient

หรือ Pearson’s correlation coefficient

โดยมีขอสมมติวา ขอมูลแจกแจงแบบปกติ

คา r จะมีคาอยูระหวาง -1 กับ 1

ถา r = 0 แสดงวา ตัวแปร X, Y ไมมี

ความสัมพันธกันเลย

ถา r เขาใกล 1 แสดงวาถาคา X เพิ่มขึ้น Y ก็

เพิ่มขึ้นดวย

Page 28: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

251

สถิติในการวิจัย

ถา r เขาใกล -1 แสดงวาถาคาใดคาหนึ่งลดลง

หรือเพิ่มขึ้นอีกคาหนึ่งจะเพิ่มขึ้นหรือลดลงกลับกัน อยางไร

ก็ตามเครื่องหมาย + หรือ - เพียงแตแสดงใหเห็นทิศทาง

ของความสัมพันธเทานั้น เม่ือดูระดับของความสัมพันธวา

มีมากนอยแคไหนจะไมคํานึงถึงเครื่องหมาย สรุปไดดังนี้

r ระดับของความสัมพันธ

>0.8 ถึง 1.0 มาก

>0.5 ถึง 0.8 ปานกลาง

>0.2 ถึง 0.5 นอย

0 ถึง 0.2 ไมควรสนใจ

อยางไรก็ตาม การใหเกณฑขางตนไมใชเกณฑที่

บังคับวาตองเปนไปตามนั้น ในบางสาขาอาจมีการ

ปรับเปล่ียนไดตามความสําคัญของงานวิจัย ตัวอยางที่ 16.20 จากการวัดความดันโลหิต Systolic

(SBP) และสอบถามอายุในผูหญิงจํานวน 14 คน ดังแสดง

ในตาราง จงวิเคราะหคาสหสัมพันธระหวางอายุและ SBP

วามีคามากนอยอยางไร

อายุ (ป) SBP (mm.Hg)

23

24

27

29

32

49

51

57

63

73

42

30

25

55

128

116

106

123

122

128

144

153

155

176

130

125

110

128

ในที่นี้จะแสดงผลการวิเคราะหสหสัมพันธดวยโปรแกรม

SPSS

ภาพที่ 16.1 Scatter Diagram แ ส ด ง ค ว า ม สั ม พั น ธ

ระหวาง อายุ และ SBP

จากภาพที่ 16.1 จะเห็นวาตัวแปร AGE และ

SBP มีความสัมพันธไปในทางบวก โดยเมื่ออายุมากขึ้น

คา SBP มีแนวโนมเพิ่มขึ้น เม่ือคํานวณคาสัมประสิทธิ์

สหสัมพันธ (r) ดังผลขางลาง

Correlations

age sbp

age Pearson Correlation 1 .883**

Sig. (2-tailed) .000

N 14 14

sbp Pearson Correlation .883** 1

Sig. (2-tailed) .000

N 14 14

**. Correlation is significant at the 0.01 level (2-taile

คา r ดังแสดงในหมายเลข มีคา .883 ซ่ึงมีคา

คอนขางมากและมีนัยสําคัญ (P= .000 หรือ p< .001)

ดังแสดงในหมายเลข นั่นคือคา r ตางไปจากที่ต้ัง Ho

ไววาเทากับ 0 คา N คือ 14 ในหมายเลข ผลการ

วิเคราะหสรุปวาอายุมีความสัมพันธกับ SBP ในทางบวก

หมายความวาถาอายุมากขึ้น SBP ก็มาก ขึ้นดวยแตใน

ที่นี้จะไมบอกวาตัวแปรใดเปนตัวแปรอิสระตัวแปรใดเปน

Page 29: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

252

สถิติในการวิจัย

ตั ว แป รตามและ ไม ส าม า รถบอกขนาดขอ งก า ร

เปล่ียนแปลงได ในขั้นตอนตอไปถากําหนดใหอายุเปนตัว

แปรอิสระและดูวาจะสงผลอยางไร กับตัวแปรตาม คือ

SBP ก็ตองวิเคราะหความถดถอยตอไป 16.8.2 ความถดถอยเชิงเสงตรง (Linear

regression) ในที่นี้จะกลาวถึงความถดถอยเชิงเสนตรงอยาง

งาย โดยมีตัวแปรตาม (Y) และตัวแปรอิสระ (X) เพียง

ตัวเดียว การกําหนดสมการเสนตรงที่เหมาะสมคือเสนตรง

ที่ทําใหผลตางระหวางคา Y จริง (Yi) กับคา Y ที่ทํานายได

(Yc) เม่ือยกกําลังสองแลวรวมกันจะมีคานอยที่สุด

นั่นคือ Minimize ∑(Yi - Yc)2 วิธีนี้เรียกวา Least

Square Method กําหนดใหสมการเสนตรง Y = a + b x

a คือคาคงที่ในสมการ (Constant)

b คือคา สัมประสิทธิ์ความถดถอย

(Regression coefficient)

สมการที่เหมาะสมจะเปน Regression equation

สูตรในการคํานวณคา a และ b มีดังนี้

2 2

xy x y / nb

x ( x) / n

∑ −∑ ∑=∑ − ∑

เนื่องจากสมการเสนตรงนี้จะผานจุด ( x , y )ดังนั้น

y a b x= + จึงหาคา a ไดจาก a y bx= −

ขอควรระวัง คือ ความสัมพันธในการวิเคราะหความ

ถดถอยนี้ไมสมมาตรกันดังนั้น regression ของตัวแปร y

บนตัวแปร x จะไมเหมือนกับ regression ของตัวแปร x

บนตัวแปร y

ผลวิเคราะหความถดถอยดวยโปรแกรม SPSS ดังขางลางนี้

Model Summary Model R

R Square Adjusted R

Square Std. Error of the

Estimate

1 .883a .780 .762 9.331

a. Predictors : (Constant), age

ANOVAb

Model Sum of Squaes df Mean Square F Sig.

1 Regression

Residual

Total

3701.963

1044.894

4746.857

1

12

13

3701.963

87.075

42.515 .000a

a. Predictors : (Constant), age b. Dependent Variable : sbp

Page 30: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

253

สถิติในการวิจัย

Coefficientsa

Model

Unstandardized Coefficients Standardized Coefficients

t Sig. B Std. Error Beta

1 (Constant)

Age

89.309

1.024

6.965

.157

.883

12.822

6.520

.000

.000

a. Dependent Variable : sbp

คา R-square = .78 ในหมายเลข หมายความวาการ

เปล่ียนแปลงของคา SBP อันเนื่องมาจากการเปลี่ยนแปลง

ของอายุนั้นมีอยู 78% สวนที่เหลืออีก 22% อาจเนื่องมา

จากตัวแปรอื่น เชน BMI, ความเครียด เปนตน ผลการ

วิเคราะหในหมายเลข Analysis of Variance นั้นเปน

การทดสอบวาสมการที่ไดเปนเสนตรงที่แทจริงหรือไม

(Test for Linearity) ซ่ึงคา F=42.51 (p-value = <.001)

ก็จะปฏิเสธ Ho ที่ต้ังไววาความสัมพันธไมเปนเสนตรง

แสดงวามีความสัมพันธเชิงเสนตรงจริง คาสัมประสิทธิ์

ความถดถอยในหมายเลข มีคา 1.024 คา slope หรือ

คา b นั่นเอง และมีนัยสําคัญทางสถิติ คือไมเทากับ 0

(ปฏิเสธ Ho : β = 0 และคาคงที่ (a) เทากับ 89.309 โดย

คา p-value (Sig.) = 0.000 (p<.001) เขียนเปนสมการได

ดังนี้

Y = 89.3 + 1.024X

หรือ SBP = 89.3 + 1.024 AGE

หมายความวา ถาคา x คืออายุเปล่ียนไป (เพิ่มขึ้น) 1 ป

คา SBP ก็จะเพิ่มขึ้น 1.024 หนวย (มม.ปรอท) และถา X =

0 เสนตรงนี้จะตัดแกน y ที่ 89.11 เรียกวาคา y-intercept

แตในความเปนจริงอายุไมมีเทากับ 0 ดังนั้นการนําเสนอ

กราฟเสนตรงจึงไมควรลากเสนตัดแกน Y ขอควรระวัง ก. ตองมีขอตกลงเบื้องตน (Assumption) วา

ขอมูลมีลักษณะแจกแจงแบบปกติ

ข. การวัดคาสังเกตแตละคู (x,y )จะตองทําใน

subject เดียวกัน

ค. ความสัมพันธที่พบนั้นไมใชความสัมพันธเชิง

สาเหตุ (Causation)

ง. การนําผลไปใชทํานายควรทําในชวงที่ขอมูล

นั้นกําหนด ถานําไปใชนอกชวงอาจไมถูกตอง เชน ถา

ตัวแปร x มากกวาหรือนอยกวาชวงที่นํามาศึกษาอาจไมมี

ความสัมพันธเชิงเสนตรงก็ได

จ. การสรุปผลของความสัมพันธไมสามารถสรุปถึง

ความสอดคลองกันได (Agreement)

ที่กลาวมาขางตนเปนความสัมพันธที่ ศึกษา

ระหวางตัวแปรเพียง 2 ตัว (Bivariate) แตในความเปนจริง

แลวการเปลี่ยนแปลงของ SBP นั้นคงไมใชอธิบายดวยอายุ

เพียงตัวแปรเดียว นั่นคืออาจมีตัวแปรอื่นๆ รวมดวย ซ่ึงตัว

แปรอิสระเหลานี้อาจไดแก น้ําหนัก, สวนสูง, เพศ, ฯลฯ

ดังนั้นการวิเคราะหจึงไมมีเพียง x ตัวเดียว ตัวแปรอิสระจึง

มีมากกวา 1 ตัว จึงเรียกวา Multiple regression แตถาตัว

แปรตาม y นั้นไมไดเปนตัวแปรชนิดตอเนื่อง อาจเปนตัว

แปรชนิด Binary data เชน การเปน/ไมเปนโรค, รอด/ตาย

การวิเคราะหชนิดนี้จะเรียกวา Binary logistic regression

การวิเคราะหชนิดที่มีตัวแปรอิสระมากกวา 1 ตัวนี้ มีหลาย

ชนิดขึ้นอยูกับลักษณะของตัวแปรและวัตถุประสงค ซ่ึง

เรียกรวมกันวา การวิเคราะหตัวแปรเชิงพหุ (Multivariable

analysis)

Page 31: สถิติในการว ิจัย - Unnop Thongteerakun · 2014-10-17 · f 226 e สถิติในการว ิจัย ข อมูลเป น 10 ส วน

 

254

สถิติในการวิจัย

เอกสารอางอิง 1. เติมศรี ชํานิจารกิจ สถิติประยุกตทางการแพทย โรงพิมพจุฬาลงกรณมหาวิทยาลัย กรุงเทพฯ 2540.

2. ทัสสนี นุชประยูร และเติมศรี ชํานิจารกิจ บรรณาธิการ สถิติในวิจัยทางการแพทย: โอเอสพริ้นติ้งสเฮาส, กรุงเทพฯ

2541.

3. Altman D.G. : Practical Statistics for Medical Research. Chapman & Hall 1996.

4. Armitage P. & Berry G. Statistical Methods in Medical Research 3rd edition. Blackwell Scientific Publication

Oxford, 1994.

5. Campbell M.J. & Machin D. Medical Statistics: A Commonsense Approach. John Wiley & Sons Ltd.

England 1991.

6. Colton T. Statistics in Medicine: Little, Brown and Company Boston 1974.

7. Daniel, WW Biostatistics: A Foundation for Analysis in the Health Sciences, 8th edition, Wiley, New

York, 2005.

8. Gardner, MJ & Altman, DG Confidence intervals rather than P values: estimation rather than hypothesis

testing. British Medical Journal 1986;292:746-750.

9. Lemeshow S, David W, Hosmer Jr, Klor J and Lwanga SK. Adequacy of sample size in Health studies

John Wiley & Sons 1990.

10. Levy P.S. & Lemeshow S. Sampling for Health Professionals Lifetime Learning publications, Belmont, CA,

1984.

11. Pagano M. & Gauvreau K. Principles of Biostatistics. Duxbury Press, Belmont, CA 1993.

12. Schlesselman JJ. Case-Control Studies: Design, Conduct, Analysis Oxford University Press 1982.