การวิเคราะห์ข้อมูลk4ds.psu.ac.th/shf/hna/files/HNADataAnalysis.pdf ·...

Preview:

Citation preview

การวเคราะหขอมล

ดร.นพ.วรสทธ ศรศรวชย

มลนธสขภาพภาคใต

โครงการพฒนาศกยภาพบคลากรดานการประเมนความจ าเปนดานสขภาพ เพอรองรบการบรหารจดการเขตสขภาพท 12

2

Reference: รศ.ดร.บณฑต ถนค ำรพ Workbook of Statistics

การวเคราะหขอมลทางสถต

1. สถตเชงพรรณนา Descriptive statistics

2. สถตเชงเปรยบเทยบ Comparative statistics

3. สถตเชงความสมพนธ Associative statistics

สถตเชงพรรณนาDescriptive Statistics

5

คากลาง

• สถตทนยมใชอธบายคากลาง เชน– คาเฉลย (Mean)

– คามธยฐาน (Median)

– คาฐานนยม (Mode)

6

คาเฉลย (Mean)

• คาเฉลย (Mean) ใชกบขอมลตอเนอง (Continuous variable) ทมการกระจายแบบปกต (Normal distribution) โดยการน าเอาคาของขอมลแตละตวมารวมกนแลวหารดวยจ านวนขอมลทงหมด

7

คามธยฐาน (Median)

• คามธยฐาน (Median) ใชกบขอมลทมการกระจายแบบไมปกต (Not normal distribution) เปนคาของขอมลทอยกงกลางของขอมลทงหมดหลงจากเรยงล าดบขอมลจากนอยไปมากหรอจากมากไปนอย

ตวอยาง จงหาคามธยฐานของขอมล 3, 7, 19, 25, 12, 18, 10

วธท า เรยงขอมลจากนอยไปมากได 3, 7, 10, 12, 18, 19, 25

ขอมลมทงหมด 7 ตว เมอเรยงล าดบขอมลแลวตวเลขทอยต าแหนงตรงกลาง คอ ตวเลขต าแหนงท 4 = (จ านวนขอมลทงหมด + 1)/2) ดงนนมธยฐานจงมคาเทากบ 12

8

คาฐานนยม (Mode)

• คาฐานนยม (Mode) เปนคาของขอมลทมความถสงสดในชดขอมลนน คาฐานนยมใชเปนคากลางไดกบขอมลทกประเภท

ตวอยาง จงหาฐานนยมของขอมลชดน 3, 2, 5, 3, 3,

3, 3, 3, 3, 5

วธท า ขอมลม 2 จ านวน 1 คา ม 3 จ านวน 7 คา ม 5 จ านวน 2 คา ดงนน ฐานนยมของขอมล คอ 3

9

การกระจาย

• สถตทนยมใชอธบายการกระจายของขอมล เชน– คาเบยงเบนมาตรฐาน (Standard deviation, SD)

– พสย (range)

– คาพสยระหวางควอไทล (interquartile range, IQR)

10

คาเบยงเบนมาตรฐาน

• คาเบยงเบนมาตรฐาน (Standard deviation, SD) เปนการอธบายดการกระจายของขอมลตอเนอง

SD S

X X

N

ii

N

2

1

11

พสย (range)

• พสย (range) เปนการอธบายการกระจายทงายทสด ใชแสดงลกษณะการกระจายของขอมลอยางหยาบๆ โดยหาความแตกตางของขอมลสงสดและต าสดของกลม

ตวอยาง ขอมลคอ 10, 12, 15, 18 และ 20

วธท า พสย = 20 - 10 = 10

12

พสย (range)

• ขอมลทมพสยกวาง แสดงวามการกระจายของขอมลมาก แตคาพสยทค านวณจากขอมลทมคาสงหรอต าผดปกตอยในชดขอมลจะท าใหพสยไมสามารถสะทอนการกระจายทแทจรง

• พสยใชไดกบทงขอมลล าดบและขอมลตอเนอง และเหมาะสมส าหรบการวดการกระจายของขอมลจ านวนนอยๆ เพราะงายตอการค านวณ

13

เปอรเซนไทล (percentile)

• เปอรเซนไทล (percentile) เปนการแบงขอมลออกเปน 100 สวนเทาๆ กน โดยต าแหนงทแบงม 99 คา คอ P1 P2 P3 ... P99โดยมธยฐาน = P50

Pi =i = ต าแหนงของเปอรเซนไทล

n = จ านวนขอมลทงหมด

14

ควอไทล (Quartile)

• ควอไทล (Quartile) เปนการแบงขอมลออกเปน 4 สวนเทาๆ กน โดยต าแหนงทแบงม 3 คาคอ Q1 Q2 Q3– ควอไทลท 1 (Q1) คอ จ านวนทแบงขอมลออกเปน 25% ทมคานอยกวา

และ 75% ทมคามากกวา (P25)– ควอไทลท 2 (Q2) คอ คามธยฐาน– ควอไทลท 3 (Q3) คอ จ านวนทแบงขอมลเปน 75% ทมคานอยกวา และ

25% ทมคามากกวา (P75)

i = ต าแหนงของควอไทลn = จ านวนขอมลทงหมด

15

คาพสยระหวางควอไทล

• คาพสยระหวางควอไทล (interquartile range, IQR) เปนวดการกระจายของขอมลดวยผลตางระหวางควอไทลท 3 และควอไทลท 1

ตวอยาง ขอมลอาย 10 คน = 6 17 25 31 41 48 48 70 88 92

วธท า คาพสยระหวางควอไทล (IQR) = Q3-Q1 = 70-25 = 45 (25, 70)

คาพสยระหวางควอไทลใชอธบายขอมลล าดบและขอมลตอเนอง ซงจะแสดงใหเหนวา รอยละ 50 ของขอมลทอยตรงกลางมชวงหางเทาใด

สถตเชงเปรยบเทยบ Comparative Statistics

17

การเปรยบเทยบขอมล

• การเปรยบเทยบขอมลแบงเปน 2 ประเภท– การเปรยบเทยบขอมลชนดตวแปรตอเนอง

– การเปรยบเทยบขอมลชนดตวแปรกลม

18

19

20

การเลอกใชสถต (ตอ)

• ตวอยาง 1: การเปรยบเทยบ ความเรว ในการขบรถของคนขบรถเพศชาย และ เพศหญง

• ใชสถต 2 sample t-test เพอทดสอบวาความแตกตางของ ความเรว เกดขนเพราะโอกาส (chance) จากการสมหรอไม

21

• หญง VS ชาย ใครขบ เรว กวากน?

N = 10,000 nช1 = 100 100

nญ1 = 100

100

การเลอกใชสถต (ตอ)

Mean ญ1 = 40

Mean ช1 = 100nญ2 = 100

100

Mean ญ2 = 130

22

• ตวอยาง 2: การประเมนผลโครงการรณรงคสงเสรมการไมขบรถเรวเกนก าหนด ประกอบดวยตวแปร

A. กลมการรณรงค (Group) คอ – การรณรงคดวยสอมวลชน (Group = 1)

– การรณรงคดวยมาตรการองคกร (Group = 2)

B. ความเรว ทวดในชวง:1. กอนด าเนนการรณรงค 1 เดอน (PreSpeed)

2. หลงด าเนนการรณรงค 1 เดอน (PostSpeed)

การเลอกใชสถต (ตอ)

23

การเลอกใชสถต (ตอ)

• ค าถามยอย 1: หลงจากรณรงคไปแลว 1 เดอน ความเรว ของกลมตวอยางทไดรบการรณรงคดวยสอมวลชน จะแตกตางไปจากกลมทไดรบการรณรงคดวยมาตรการองคกร หรอไม?

• ใชสถต 2 sample t-test for independent samples เพอทดสอบวาความแตกตางของ ความเรว ใน 2 กลมทการรณรงคตางกนเกดขนเพราะโอกาส (chance) จากการสมหรอไม

24

การเลอกใชสถต (ตอ)

• ค าถามยอย 2: ความเรวของกลมตวอยางหลงจากผานการรณรงคไปแลว 1 เดอน จะแตกตางไปจาก ความเรวกอนการรณรงค หรอไม?

• ใชสถต paired t-test for dependent samples เพอทดสอบวาความแตกตางของ ความเรว ในกลมเดยวกนกอนและหลงการรณรงค เกดขนเพราะโอกาส (chance) จากการสมหรอไม

25

การเลอกใชสถต (ตอ)

• ตวอยาง 3 การศกษาผลของ ลกษณะงาน (Group) ของพนกงานโรงงาน 3 กลมทมสภาพการท างานแตกตางกน วาจะม ความรในการขบรถ (Knowledge) แตกตางกนหรอไม

• ใชสถต ANOVA เพอทดสอบวา ความรในการขบรถ ในพนกงานทม สภาพการท างานแตกตางกน 3 กลม เกดขนเพราะโอกาส (chance) จากการสมหรอไม

26

การเลอกใชสถต (ตอ)

• ตวอยาง 4 การประเมนประสทธผลในการรณรงคการไมขบรถเรวเกนก าหนด โดยดจาก ความเรวทวดในชวงหลงด าเนนการรณรงค 1 เดอน (PostSpeed) กบ คะแนนความรในการขบรถ(Knowledge) วาตวแปรทงสองนมความสมพนธกนหรอไม อยางไร

• ใชสถต Pearson Correlation เพอทดสอบและหาระดบความสมพนธของ ความเรว (PostSpeed) กบ ความร (Knowledge)

สถตเชงความสมพนธAssociative Statistics

28

สถตเชงความสมพนธ

• ใชในการหาความสมพนธระหวางตวแปร 2 ตวหรอมากกวา ชวยใหสามารถท านายคาของตวแปรหนงจากอกตวแปรหนงได เชน ความสมพนธระหวาง การบงคบใชกฎหมายการสวมหมวกนรภย กบ การบาดเจบทศรษะ โดยความสมพนธระหวางตวแปรทควรพจารณา คอ

1. การทดสอบความสมพนธระหวางตวแปร

2. การหาขนาดความสมพนธระหวางตวแปร

29

การทดสอบความสมพนธระหวางตวแปร

• วเคราะหโดยใชตารางไขว (Cross tabulation) ในการสรปความสมพนธระหวาง 2 ตวแปรทเปนตวแปรกลม

• ตารางแสดงความสมพนธระหวางตวแปรอาจมขนาดตางๆ ขนอยกบจ านวนกลมของตวแปรแตละตว

• ในดานวทยาศาสตรสขภาพสวนใหญเปนความสมพนธระหวาง การเกดโรคกบปจจยการเกดโรค– ตวแปรผล/ตวแปรตาม มกแบงเปน 2 กลม คอ เปนโรค หรอ ไมเปนโรค – ตวแปรปจจย/ตวแปรตน มกแบงเปน 2 กลม คอ มปจจยเสยง หรอ ไมมปจจยเสยง

• ผลการศกษาจงแสดงอยในรปตาราง 2 x 2 แลวทดสอบความสมพนธดวยสถตChi square (X2) หรอ Fisher’s exact test

30

การหาขนาดความสมพนธระหวางตวแปร

• Risk ratio (RR)– เปนสถตทใชบอกขนาดความแตกตางของอตราการเกดโรคใน กลมทไดรบ

ปจจยเสยง วามจ านวนเปนกเทาของ กลมทไมไดรบปจจยเสยง

• Odds ratio (OR) – เปนการเปรยบเทยบอตราสวนของการเปนโรคและไมเปนโรคใน กลมท

ไดรบปจจยเสยง และ ไมไดรบปจจยเสยง

31

Risk Ratio (RR)

• เปนสถตทใชบอกขนาดความแตกตางของอตราการเกดโรคใน กลมทไดรบปจจยเสยง วาเปนกเทาของ กลมทไมไดรบปจจยเสยง

• RR = อตราการเกดโรคในกลมทไดรบปจจยเสยงอตราการเกดโรคในกลมทไมไดรบปจจยเสยง

• การแปลผล คอ RR > 1 กลมไดรบปจจยเสยงเสยงกวาRR < 1 กลมไมไดรบปจจยเสยงเสยงกวาRR = 1 ทงกลมไดหรอไมไดรบปจจยเสยงเสยงเทากน

32

Risk Ratio (RR) (ตอ)

• การค านวณคา RR จากสดสวนของการเกดโรคจะตองทราบจ านวนคนทไดรบหรอไมไดรบปจจยเสยง แลวตดตามคน 2 กลมดงกลาวเพอค านวณอตราการเกดโรคทแทจรง ท าให RR ใชไดกบขอมลจากการศกษาแบบมกลมตดตามผล (cohort study) หรอการทดลองเทานน สวนขอมลทไมสามารถหาอตราการเกดโรคทแทจรงได จะหาขนาดความสมพนธดวย Odds ratio

33

Risk Ratio (RR) (ตอ)

• ตวอยาง หาคา RR จากตารางดานลาง เพอดขนาดของความสมพนธ

จากผลการค านวณไดคา RR = [10/(10+40)] / [2/(2+48)] = 5

แสดงวา คนทท างานซอมเครองยนต จะมโอกาสเกดอบตเหตทางถนนเปน 5 เทา ของ คนทท างานส านกงาน

ลกษณะงาน

อบตเหตทางถนน

เกด ไมเกด รวม

ท างานซอมเครองยนต 10 40 50

ท างานส านกงาน 2 48 50

รวม 12 88 100

34

Odds Ratio (OR)

• เปนการเปรยบเทยบอตราสวนของการเปนโรคและไมเปนโรคในกลมทไดรบปจจยเสยง และ ไมไดรบปจจยเสยง

• OR = อตราสวนการเปนโรคและไมเปนโรคในกลมทไดรบปจจยเสยงอตราสวนการเปนโรคและไมเปนโรคในกลมทไมไดรบปจจยเสยง

• การแปลผล OR > 1 โอกาสเปนโรคในกลมทไดรบปจจยเสยงสงกวาOR < 1 โอกาสเปนโรคในกลมทไมไดรบปจจยเสยงสงกวาOR = 1 ไดหรอไมไดรบปจจยเสยงโอกาสเปนโรคเทากน

35

Odds Ratio (OR) (ตอ)

• ตวอยางเมอ 2 กลมเปนอสระตอกน

การศกษาการวจยเชงวเคราะหแบบภาคตดขวาง (cross-sectionalanalytical study) เพอดวาการเกด อบตเหตทางถนน ของผชายวยท างานมความสมพนธกบ อาย หรอไม

กลมอาย (ป)

อบตเหตทางถนน

เกด ไมเกด รวม

20-40 15 65 80

41-60 5 115 120

รวม 20 180 200

36

Odds Ratio (OR) (ตอ)

ค านวณคา OR ในกรณทประชากรทง 2 กลมเปนอสระตอกน

OR = (15/65)/(5/115) = 5.3

จากคา OR ไดแสดงวาคาโอกาสของการเกด อบตเหตทางถนน ของผชาย กลมอาย 20-40 ป สงเปน 5.3 เทาของ กลมอาย 41–60 ป

กลมอาย (ป)

อบตเหตทางถนน

เกด ไมเกด รวม

20-40 15 65 80

41-60 5 115 120

รวม 20 180 200

37

Odds Ratio (OR) (ตอ)

• ตวอยางเมอ 2 กลมไมเปนอสระตอกน

การศกษาวาผชายท ดมเหลา มโอกาสเกด อบตเหตทางถนนมากกวาผชายท ไมดมเหลา หรอไม ออกแบบงานวจยเปนแบบกลมผปวย–ไมปวยทถกจบคดวยอายและเพศ (Matched case-control study) มผลการศกษาดงน

กลมเกดอบตเหตทางถนน

ดม ไมดม รวม

กลมไมเกดอบตเหตทางถนน(กลมควบคม/Control)

ดม 2 3 5

ไมดม 10 25 35

รวม 12 28 40

38

Odds Ratio (OR) (ตอ)

ค านวณคา OR ในกรณทประชากรทง 2 กลมไมเปนอสระตอกน

OR = 10/3 = 3.3

กลมเกดอบตเหตทางถนน

ดม ไมดม รวม

กลมไมเกดอบตเหตทางถนน(กลมควบคม/Control)

ดม 2 3 5

ไมดม 10 25 35

รวม 12 28 40

39

ความสมพนธระหวาง RR กบ OR

• ในกรณทมอตราการเกดโรคต าๆ เชน < รอยละ 5 คา a จะเลกมากเมอเทยบกบคา b และคา c จะเลกมากเมอเทยบกบคา d จงท าใหสดสวนการเปนโรค (RR) มคาใกลเคยงกบคาอตราสวนของการเปนโรค (OR) ดงนนจงสามารถแปรผล OR ไดเหมอนกน RR

• RR = (2/100) / (8/900) = 2.25 VS OR = (2/98) / (8/892) = 2.28

ปจจย

อบตเหตทางถนน

เกด ไมเกด รวม

ม 2 (a) 98 (b) 100 (a+b)

ไมม 8 (c) 892 (d) 900 (c+d)

รวม 10 (a+c) 990 (b+d) 1,000 (a+b+c+d)

40

Recommended