Upload
crevan
View
63
Download
10
Embed Size (px)
DESCRIPTION
สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology. นายแพทย์ชนินันท์ สนธิไชย พบ., FETP , สม., วว.เวชศาสตร์ป้องกัน แขนงระบาดวิทยา กลุ่มงานระบาดวิทยา กองควบคุมโรคติดต่อ สำนักอนามัย. สถิติ. เก็บรวบรวมข้อมูล เรียบเรียง การวิเคราะห์ การแปลผล การนำเสนอ. การอธิบายลักษณะข้อมูล. - PowerPoint PPT Presentation
สถิติเบื้องต้นสำ�หรบัง�นระบ�ดวทิย�Statistics for Epidemiology
น�ยแพทยช์นินันท์ สนธไิชยพบ ., FETP, สม ., วว.เวชศ�สตรป์้องกัน แขนงระบ�ดวทิย�
กลุ่มง�นระบ�ดวทิย� กองควบคมุโรคติดต่อ สำ�นักอน�มยั
สถิติ• เก็บรวบรวมขอ้มูล• เรยีบเรยีง• ก�รวเิคร�ะห์• ก�รแปลผล• ก�รนำ�เสนอ
ก�รอธบิ�ยลักษณะขอ้มูล• อัตร�สว่น (Ratio)• สดัสว่น (Proportion)• อัตร� (Rate)
อัตร�สว่น (Ratio)
• ค่�เปรยีบเทียบระหว�่งตัวเลข 2 จำ�นวน• เศษไมไ่ด้เป็นสว่นหนึ่งของสว่น• X:Y• อัตร�สว่นของช�ยต่อหญิง คือ 2:3
สดัสว่น (Proportion)
• ก�รเปรยีบเทียบจำ�นวนยอ่ยกับจำ�นวนรวม • เศษเป็นสว่นหนึ่งของสว่น• ผลรวมของสดัสว่น เป็น 1 หรอืรอ้ยละ 100 เสมอ• X/Y หรอื X/Y x 100• สดัสว่นของประช�กรช�ย คือ 0.4 หรอื รอ้ยละ 40
อัตร� (Rate)
• ก�รวดัโอก�สของก�รเกิดเหตกุ�รณ์หรอืจำ�นวนคว�มถ่ีในกลุ่มประช�กรท่ีศึกษ�
• มเีวล�เข�้ม�เกี่ยวขอ้ง• อัตร�เกิด อัตร�ต�ย
ลักษณะของตัวแปร
• แบง่ต�มลักษณะของตัวแปร– เชงิคณุภ�พ– เชงิปรมิ�ณ
• แบง่ต�มม�ตรก�รวดัตัวแปร– Nominal– Ordinal– Interval– Ratio
ลักษณะของตัวแปร
ตัวแปรเชงิคณุภ�พ (Qualitative Variable)• มคีณุสมบติัแตกต่�งกันในแง่ของชนิดหรอืประเภทหรอื
คณุลักษณะ• เชน่ เพศ อ�ชพี ภมูลิำ�เน�
ตัวแปรเชงิปรมิ�ณ (Quantitative Variable)• มคีว�มแตกต่�งกันต�มคว�มถ่ี จำ�นวน หรอืปรมิ�ณม�กน้อย• ส�ม�รถเรยีงลำ�ดับเปรยีบเทียบได้ว�่น�มใดดีกว�่หรอืด้อย
กว�่อีกน�มหนึ่ง• เชน่ อ�ยุ นำ้�หนัก สว่นสงู คะแนนสอบ
ม�ตรก�รวดัตัวแปร
ม�ตรน�มบญัญัติ (Nominal Scale)• เป็นก�รจำ�แนกขอ้มูลโดยใชน้�มเป็นเกณฑ์• ไมส่�ม�รถเปรยีบเทียบได้ว�่น�มหน่ึงดีกว�่น�มหน่ึง• เชน่ เพศ อ�ชพี
ม�ตรอันดับ (Ordinal Scale)• เป็นก�รจำ�แนกขอ้มูลโดยใชน้�มเป็นเกณฑ์• ส�ม�รถเรยีงลำ�ดับเปรยีบเทียบได้ว�่น�มใดดีกว�่หรอืด้อยกว�่อีกน�มหน่ึง• เชน่ ระดับก�รศึกษ� ระดับคว�มนิยม
ม�ตรอันตรภ�ค (Interval Scale)• เป็นก�รจำ�แนกขอ้มูลโดยใชน้�มและลำ�ดับ• ส�ม�รถวดัปรมิ�ณคว�มแตกต่�งของน�มได้• ไมม่ ี“0” ท่ีแท้จรงิ• เชน่ อุณหภมู ิไอคิว
ม�ตรอัตร�สว่น (Ratio Scale)• ส�ม�รถเปรยีบเทียบอัตร�สว่นระหว�่งปรมิ�ณได้• ม ี“0” ท่ีแท้จรงิ• เชน่ ร�ยได้ อ�ยุ นำ้�หนัก
ประเภทของสถิติในง�นระบ�ดวทิย�
ชวีสถิติBiostatistics
สถิติเชงิพรรณน�Descriptive Statistics
สถิติเชงิอนุม�นInferential Statistics
ก�รค�ดประม�ณParameter Estimation
ก�รทดสอบสมมติฐ�นHypothesis Testing
ก�รค�ดประม�ณเฉพ�ะค่�Point Estimation
ก�รค�ดประม�ณเป็นชว่งInterval Estimation
องค์ประกอบของสถิติ
ประช�กรPopulation
กลุ่มตัวอย�่งSample
พ�ร�มเิตอร ์(Parameter)
สถิติ (Statistics)
ค่�เฉลี่ยเลขคณิต μค่�เบีย่งเบนม�ตรฐ�น δค่�สดัสว่น π
ค่�เฉลี่ยเลขคณิต xค่�เบีย่งเบนม�ตรฐ�น sค่�สดัสว่น p
ประช�กรประเทศไทย63,525,062 คน
กลุ่มตัวอย�่ง1,000 คน
นำ้�หนักตัวเฉล่ีย (x) = 50 kg
นำ้�หนักตัวเฉลี่ย (μ) = ?? kgพ�ร�มเิตอร์
สถิติ
ตัวอย�่ง ต้องก�รทร�บนำ้�หนักตัวเฉล่ียของประช�กรไทย
สถิติเชงิอนุม�น
สถิติเชงิพรรณน� (Descriptive Statistics)
• ใชเ้พื่ออธบิ�ยลักษณะของขอ้มูลท่ีเก็บรวบรวมม�ได้– สดัสว่น อัตร� อัตร�สว่น (Proportion, Rate, Ratio)– ค่�กล�ง (Mean, Median, Mode)– ค่�ก�รกระจ�ย (Variance, SD, Range, Interquartile
Range)
ก�รวดัแนวโน้มเข�้สูส่ว่นกล�งและก�รวดัก�รกระจ�ย(Measures of Central Location and
Dispersion)
• ก�รวดัแนวโน้มเข�้สูส่ว่นกล�ง (Measure of Central Location)– เพื่อห�ค่�ท่ีเป็นตัวแทนท่ีดีท่ีสดุของกลุ่มประช�กร
• ก�รวดัก�รกระจ�ย (Measure of dispersion)– เพื่อดวู�่ประช�กรแต่ละคนมคีว�มแตกต่�งกันม�กน้อยเพยีงใด– เพื่อดคูว�มแตกต่�งของประช�กรแต่ละคนจ�กค่�กล�ง
1616
ก�รวดัแนวโน้มเข�้สูส่ว่นกล�ง Measure of Central Location
• Mean (Arithmetic Mean) ค่�เฉล่ียเลขคณิต
• Median มธัยฐ�น• Mode ฐ�นนิยม
ค่�เฉล่ียเลขคณิต (Arithmetic Mean)
• ค่�เฉล่ีย (Mean หรอื Average)• ผลรวมของขอ้มูลห�รด้วยจำ�นวนขอ้มูล• สญัลักษณ์ x
nx
x i
24 28 17 32 27 25 22 19 31
24+28+17+32+27+25+22+19+319
25 kg
ตัวอย�่งจงคำ�นวณค่�เฉล่ียนำ้�หนักตัวของนักเรยีน 9 คน
2259
=
=
nx
x i
=
ค่�เฉล่ีย คือ 25 kg
24 28 17 32 27 25 22 19 90
24+28+17+32+27+25+22+19+909
31.6 kg
ตัวอย�่งจงคำ�นวณค่�เฉล่ียนำ้�หนักตัวของนักเรยีน 9 คน
2849
=
=
nx
x i
=
ค่�เฉล่ีย คือ 31.6 kg
คณุสมบตัิของค่�เฉล่ีย
• คำ�นวณโดยอ�ศัยขอ้มูลทกุค่�• มคีว�มไวในกรณีท่ีมขีอ้มูลท่ีมค่ี�ต่�งไปจ�กกลุ่มม�กๆ• ห�กขอ้มูลมลัีกษณะเบ ้ค่�เฉล่ียจะไมส่�ม�รถเป็นตัวแทนของกลุ่ม
ขอ้มูลท่ีดีได้
มธัยฐ�น (Median)
• ค่�ขอ้มูลท่ีอยูต่ำ�แหน่งตรงกล�งของชุดขอ้มูลท่ีเรยีงลำ�ดับ• จำ�นวนขอ้มูลท่ีมค่ี�ม�กกว�่มธัยฐ�น เท่�กับจำ�นวนขอ้มูลท่ีมค่ี�น้อย
กว�่มธัยฐ�น• วธิกี�รห�ค่�มธัยฐ�น
– จดัเรยีงลำ�ดับขอ้มูลจ�กน้อยไปห�ม�ก– ห�ขอ้มูลท่ีอยูใ่นตำ�แหน่งตรงกล�งจ�กสตูร– กรณีจำ�นวนขอ้มูลเป็นเลขค่ี ค่�มธัยฐ�นคือขอ้มูลตำ�แหน่งกล�ง– กรณีจำ�นวนขอ้มูลเป็นเลขคู่ ค่�มธัยฐ�นจะอยูร่ะหว�่งขอ้มูล 2 ตำ�แหน่งกล�ง
และเท่�กับค่�เฉล่ียของขอ้มูล 2 ตำ�แหน่งนัน้
2)1(
nrankMiddle
24 28 17 32 27 25 22 19 31
ตัวอย�่งจงคำ�นวณค่�มธัยฐ�นนำ้�หนักตัวของนักเรยีน 9 คน
17 19 22 24 25 27 28 31 32
52)19(
2)1(
nrankMiddle
จดัลำ�ดับขอ้มูลจ�กน้อยไปห�ม�ก
ค่�มธัยฐ�น คือ 25 kg
24 28 17 32 27 25 22 19 90
ตัวอย�่งจงคำ�นวณค่�มธัยฐ�นนำ้�หนักตัวของนักเรยีน 9 คน
17 19 22 24 25 27 28 32 90
52)19(
2)1(
nrankMiddle
จดัลำ�ดับขอ้มูลจ�กน้อยไปห�ม�ก
ค่�มธัยฐ�น คือ 25 kg
24 28 17 32 27 25 22 19 31 38
ตัวอย�่งจงคำ�นวณค่�มธัยฐ�นนำ้�หนักตัวของนักเรยีน 10 คน
17 19 22 24 25 27 28 31 32 38
5.52)110(
2)1(
nrankMiddle
จดัลำ�ดับขอ้มูลจ�กน้อยไปห�ม�ก
ค่�มธัยฐ�น คือ = 26 kg22725
คณุสมบติัของค่�มธัยฐ�น
• ขอ้มูลท่ีมค่ี�ต่�งไปจ�กกลุ่มม�กๆ ไมม่ผีลต่อค่�มธัยฐ�น• นิยมใชใ้นกรณีท่ีขอ้มูลมลัีกษณะเบ ้
ฐ�นนิยม (Mode)
• ค่�ท่ีมคีว�มถ่ีสงูท่ีสดุ หรอืค่�ท่ีซำ้�กันม�กท่ีสดุ• มกัใชก้ับตัวแปรเชงิคณุภ�พ
ตัวอย�่งจงคำ�นวณค่�ฐ�นนิยมของนำ้�หนักตัวของนักเรยีน 9 คน
17 19 22 24 25 27 27 27 90
ค่�ฐ�นนิยม คือ 27 kg
ตัวอย�่งจงคำ�นวณค่�ฐ�นนิยมของนำ้�หนักตัวของนักเรยีน 9 คน
17 22 22 24 25 27 27 29 40
ค่�ฐ�นนิยม คือ 22 และ 27 kg
2929
ก�รวดัก�รกระจ�ย Measure of Dispersion
• Variance (คว�มแปรปรวน)• Standard Deviation: SD (ค่�เบีย่งเบน
ม�ตรฐ�น)• Range (พสิยั)• Percentile (เปอรเ์ซน็ไทล์)• Quartile (ควอไทล์)• Interquartile (อินเตอรค์วอไทล์)
78 79 80 81 82
ตัวอย�่งจงคำ�นวณค่�เฉล่ียคะแนนสอบของนักเรยีน 5 คน ในแต่ละหอ้งเรยีน
Mean = 80 คะแนน
70 75 80 85 90
Mean = 80 คะแนน
60 70 80 90 100
Mean = 80 คะแนน
Median = 80 คะแนน
Median = 80 คะแนน
Median = 80 คะแนน
78 79 80 81 82
ตัวอย�่งจงคำ�นวณค่�มธัยฐ�นคะแนนสอบของนักเรยีน 5 คน ในแต่ละหอ้งเรยีน
70 75 80 85 90
60 70 80 90 100
คว�มแปรปรวน (Variance) และค่�เบีย่งเบนม�ตรฐ�น (SD)
• Variance = s2= =
• SD = s = =
• ใชป้ระกอบกับค่�เฉล่ีย
1nsdifferencesquareofsum
1)( 2
nxxi
Variance1)( 2
nxxi
24 28 17 32 27 25 22 19 31
Degree of freedom
ค่�เฉล่ีย คือ 25 kgสุม่ตัวอย�่ง
ประช�กร 9 คน
กลุ่มตัวอย�่ง 3 คน
28 19 ??? Degree of freedom = n-1
ก�รวดัแนวโน้มเข�้สูส่ว่นกล�งและก�รวดัก�รกระจ�ยโดยใช ้Mean และ Standard Deviation
ก�รกระจ�ยแบบเบข้ว� (Skew to the right หรอื Positive skew)
ก�รกระจ�ยแบบเบซ้�้ย (Skew to the left หรอื Negative skew)
พสิยั (Range)
• คว�มแตกต่�งระหว�่งค่�น้อยท่ีสดุกับค่�ม�กท่ีสดุในชุดขอ้มูล• ค่�ม�กท่ีสดุ - ค่�น้อยท่ีสดุ
– ท�งสถิติ พสิยั...– ท�งระบ�ดวทิย� ตัง้แต่ ... ถึง ...
• ใชป้ระกอบกับค่�มธัยฐ�น
Median = 80 คะแนน
Median = 80 คะแนน
Median = 80 คะแนน
78 79 80 81 82
ตัวอย�่งค่�มธัยฐ�นและพสิยัของคะแนนสอบของนักเรยีน 5 คน ในแต่ละหอ้งเรยีน
70 75 80 85 90
60 70 80 90 100
Range 78-82 คะแนน
Range 70-90 คะแนน
Range 60-100 คะแนน
Percentiles• เกิดจ�กก�รแบง่ขอ้มูลเป็น 100 สว่นเท่�ๆ กัน เมื่อขอ้มูลถกู
เรยีงจ�กน้อยไปห�ม�ก• มค่ี�อยูร่ะหว�่ง -0100• Percentiles ท่ี P หม�ยถึง ค่�ท่ีมจีำ�นวนขอ้มูลน้อยกว�่รอ้ยละ
P ของชุดขอ้มูลทัง้หมด
10th Percentile
33rd Percentile
10%
33%
90%
67%
Quartiles
• เกิดจ�กก�รแบง่ขอ้มูลเป็น 4 สว่นเท่�ๆ กัน เมื่อขอ้มูลถกูเรยีงจ�กน้อยไปห�ม�ก
• แบง่เป็น Quartile ท่ี 1 , 2, 3 และ 4
Q1 คือ ค่� ณ ตำ�แหน่งท่ี Q3 คือ ค่� ณ ตำ�แหน่งท่ี 41n
1st Quartile 2nd Quartile 3rd Quartile 4th Quartile25th Percentile 50th Percentile 75th Percentile 100th Percentile
4)1(3 n
Median
Interquartile Range
• เป็นก�รวดัก�รกระจ�ยท่ีนิยมใชป้ระกอบกับค่�มธัยฐ�น• เป็นตัวแทนของขอ้มูลครึง่หน่ึงท่ีอยูใ่นชว่งกล�งของชุดขอ้มูล
ระหว�่ง P25-P75
1st Quartile 2nd Quartile 3rd Quartile 4th Quartile25th Percentile 50th Percentile 75th Percentile 100th Percentile
Interquartile Range
ก�รวดัแนวโน้มเข�้สูส่ว่นกล�งและก�รวดัก�รกระจ�ยโดยใช ้Median, Percentile, Quartile และ Interquartile
Range
ก�รเลือกวธิกี�รวดัแนวโน้มเข้�สูส่ว่นกล�งและวธิกี�รวดัก�รกระจ�ย
• ขึ้นอยูก่ับรูปแบบก�รกระจ�ยของขอ้มูล• ขอ้มูลมกี�รกระจ�ยแบบปกติ (Normal Distribution) ควรใช ้Mean และ
SD• ขอ้มูลมกี�รกระจ�ยแบบเบ ้(Skew Distribution) ควรใช ้Median และ
Range หรอื Interquartile Range
การกระจายแบบปกติ การกระจายแบบเบ้
สรุปแนวท�งก�รเลือกใชว้ธิกี�รวดัแนวโน้มเข้�สูส่ว่นกล�งและวธิกี�รวดัก�รกระจ�ย
รูปแบบก�รกระจ�ย ก�รวดัแนวโน้มเข�้สูส่ว่นกล�ง
ก�รวดัก�รกระจ�ย
ก�รกระจ�ยแบบปกติ (Normal Distribution)
ค่�เฉล่ียเลขคณิต (Arithmetic Mean)
ค่�เบีย่งเบนม�ตรฐ�น (Standard Deviation)
ก�รกระจ�ยแบบเบ ้(Skew Distribution)
ค่�มธัยฐ�น (Median) พสิยั (Range) หรอืInterquartile Range
ก�รกระจ�ยแบบ Exponential หรอื Logarithmic
ค่�เฉล่ียเรข�คณิต(Geometric Mean)
Geometric Standard Deviation
ตัวอย�่งก�รใชส้ถิติเชงิพรรณน�• ค่�มธัยฐ�นของอ�ยุผู้ป่วยเท่�กับ 29 ปี (พสิยั 15-56 ปี)• ระยะฟกัตัวของโรคเฉล่ียเท่�กับ 15 วนั (SD 3.6 วนั)• อัตร�สว่นผู้ป่วยเพศช�ยต่อเพศหญิงคือ 3:2• อัตร�ป่วยโรคไขเ้ลือดออกในเดือนมกร�คม 47 ร�ยต่อประช�กร
แสนคน• อัตร�ป่วยร�ยรอ้ยละ 3• ผู้ป่วยสว่นใหญ่เป็นนักเรยีน/นักศึกษ�รอ้ยละ 67
4646
สถิติเชงิอนุม�น (Inferential Statistics)• ใชเ้พื่อนำ�ผลสรุปของขอ้มูลท่ีคำ�นวณได้จ�กขอ้มูลตัวอย�่งไป
อ้�งอิงถึงค่�พ�ร�มเิตอร์– ก�รประม�ณค่�พ�ร�มเิตอร ์(Parameter Estimation)– ก�รทดสอบสมมติฐ�น (Hypothesis Testing)
ประช�กรประเทศไทย63,525,062 คน
กลุ่มตัวอย�่ง1,000 คน
(x) = 50 kg
μ = 50 kg / 48 kg / 55 kg
ตัวอย�่ง ต้องก�รทร�บนำ้�หนักตัวเฉล่ียของประช�กรไทย
(x) = 48 kg(x) = 55 kg
50 kg48 kg 55 kg
95% CI = 42-58 kg
42 kg 58 kg
5050
ชว่งคว�ม เชื่อมัน่(Confidence Interval)
• ห�กทำ�ก�รศึกษ�แบบเดียวกัน 100 ครัง้ จะได้ชว่งคว�มเชื่อมัน่ 100 ชว่ง ซึ่งจะม ี95 ชว่ง ท่ีครอบคลมุค่�พ�ร�มเิตอรท่ี์ต้องก�รห�
• ค่�ท่ีบง่บอกว�่ผลก�รศึกษ�ครัง้นี้ ค�ดว�่จะมค่ี�ผิดพล�ดไม่เกินชว่งท่ีกำ�หนด – 90% CI หม�ยคว�มว�่ จะมค่ี�ท่ีผิดพล�ดจ�กก�รคำ�นวณ 10%– 95% CI หม�ยคว�มว�่ จะมค่ี�ท่ีผิดพล�ดจ�กก�รคำ�นวณ 5%– 99% CI หม�ยคว�มว�่ จะมค่ี�ท่ีผิดพล�ดจ�กก�รคำ�นวณ 1%
5151
Confidence limits และ Confidence Interval
• ขดีจำ�กัดของชว่งเชื่อมัน่ (Confidence limits)– ตำ่�สดุท่ียอมรบัได้ เรยีกว�่ ขดีจำ�กัดล่�ง– ค่�สงูสดุท่ียอมรบัได้ เรยีกว่� ขดีจำ�กัดบน
• ชว่งเชื่อมัน่ (Confidence interval)– บอกคว�มเท่ียง (Reliability) ของผลก�รศึกษ� หรอือีกนัย
หนึ่งว�่มรีะดับของคว�มคล�ดเคล่ือนม�กน้อยเพยีงใด– ขึ้นกับจำ�นวนตัวอย�่งท่ีศึกษ�
ตัวอย�่ง• จ�กก�รศึกษ�เพื่อห�นำ้�หนักตัวเฉล่ียของประช�กรไทย โดยก�รสุม่ตัวอย�่ง
จำ�นวน 1,000 คน พบว�่ • ประช�กรไทยมนีำ้�หนักเฉล่ีย 50 kg (95% CI 42-58)• ถ้�ทำ�ก�รศึกษ�ซำ้�กัน 100 ครัง้ จะม ี95 ครัง้ ที่ได้นำ้�หนักเฉล่ียอยูร่ะหว�่ง 42
kg ถึง 58 kg• แต่ในท�งปฏิบติั ผู้ศึกษ�จะทำ�ก�รศึกษ�ครัง้เดียว ดังนัน้ ชว่งคว�มเชื่อมัน่จงึ
คำ�นวณได้จ�กสตูร
)%1(1002/2/
nZx
nZx (ทร�บค่� Variance)
)%1(1001,2/1,2/ nstx
nstx nn (ไมท่ร�บค่� Variance)
ก�รทดสอบสมมติฐ�น (Hypothesis testing)นำ้�หนักเฉล่ียของประช�กรจงัหวดั กมคีว�มแตกต่�งจ�กจงัหวดั ข หรอืไม่
ประช�กรจงัหวดั ก1,316,293 คน
ประช�กรจงัหวดั ข1,767,601 คน
กลุ่มตัวอย�่ง100 คน
กลุ่มตัวอย�่ง100 คน
x ก = 46 kg x ข = 49 kg≠
µ ก ??? µ ข
สรุป
• ประเภทของสถิติ• สถิติเชงิพรรณน�• ก�รใช ้Excel เบื้องต้น
ขอบคณุครบั