27
Thanut Wongsaichue, Ph.D. (Demography) Human and Community Resource Development 190693 Data Analysis and Presentation ดร.ฐณัฐ วงศ์สายเชื อ 20150402 da2008 Data Analysis for Descriptive Statistics คณะศึกษาศาสตร์และพัฒนศาสตร์ Tel: 08-1923-0303 E-mail: [email protected] Homepage: http://pirun.ku.ac.th/~fedutnw/ การวิเคราะห์ข้อมูลด้วยสถิตเชิงพรรณนา

Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

  • Upload
    vanliem

  • View
    219

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

ดร.ฐณฐั วงศ์สายเชื อ20150402

da2008

Data Analysis for Descriptive Statistics

คณะศกึษาศาสตร์และพฒันศาสตร์Tel: 08-1923-0303E-mail: [email protected]: http://pirun.ku.ac.th/~fedutnw/

การวิเคราะห์ข้อมลูด้วยสถิตเชิงพรรณนา

Page 2: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

การกระจายตวัแบบปกติ (Normal distribution)ปัญหาข้อมลูมีความเบ้ ?

• ข้อมลูมี Positive และ Negative skewness มีลกัษณะรูปร่างอยา่งไร?• กรณีทีข้อมลูมี Positive skewness ต้องแก้ไขปัญหาอยา่งไร?• กรณีทีข้อมลูมี Negative skewness ต้องแก้ไขปัญหาอยา่งไร?

Page 3: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

ข้อมลูมีความเบ้

Positive Skew Negative SkewSymmetry

-1 ≤ Skewness ≥ 1Skewness > 1 Skewness < -1

Page 4: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

การกระจายตวัแบบปกติ (Normal distribution): ปัญหาข้อมลูมีความเบ้

การแก้ไขความเบ้ วิธีหนึงคือต้อง Transformation ข้อมลู

1. หาก positive skew มากๆ ต้องใช้ negative reciprocal root = -1/sqrt(oldvar)2. หาก positive skew กลางๆ ต้องใช้ log = lg10(oldvar)3. หาก positive skew เลก็น้อย-กลางๆ ต้องใช้ square root = sqrt(oldvar)4. หาก negative skew เลก็น้อย-กลางๆ ต้องใช้ square = (oldvar)*(oldvar)5. หาก negative skew มากๆ ต้องใช้ cube = (oldvar)*(oldvar) *(oldvar)

Source: Vaus, 2002

Page 5: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationงานวิจยัเชิงปริมาณทีผา่นมาของนิสติ

ให้นิสติเลา่ และแลกเปลียนถงึงานวิจยัของตนทีผา่นมา1. ชือเรือง โครงการวิจยั งานวิจยั วิทยานิพนธ์2. ความสําคญัและความเป็นมา3. งานวิจยัทีเกียวข้อง4. วตัถปุระสงค์5. ระเบียบวิธีวิจยั6. ขอบเขตการวิจยั7. ระยะเวลาทําวิจยั8. สถานทีทําการวิจยั หรือเก็บข้อมลู9. วิธีการวิเคราะห์ข้อมลูและนําเสนอ10. สรุปผลการวิจยั11. ประโยชน์ทีได้รับจากการวิจยั

Page 6: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationการวิเคราะห์ข้อมลูด้วยสถิตเชิงพรรณนา

1. การกระจายตวั (Distribution)2. แนวโน้มเข้าสูส่ว่นกลาง (Central tendency)3. ความแปรปรวน (Variation)4. ความเบ้ (Skewness)

Page 7: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationการนําเสนอสถิตเชิงพรรณนา

1. ตารางแจกแจงความถี (Frequency tables)2. กราฟ (Graphs)3. สถิติโดยภาพรวม (Summary statistics)

Page 8: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationตารางความถี (Frequency table)

สิงทีควรมี1. มีหมายเลขตารางและชือตาราง2. ตวัแปรกลุม่ ต้องมีป้ายชือแตล่ะกลุม่3. หวัตารางต้องมีร้อยละของข้อมลู

ทีสามารถวิเคราะห์ได้4. จํานวนข้อมลูทั งหมดทีวิเคราะห์ได้5. จํานวนข้อมลูทีขาด (Missing case)6. แหลง่ข้อมลู7. หมายเหตุ (เช่น ตวัอยา่งข้อคําถาม)

Source: Vaus, 2002

สิงทีไมค่วรมี1. ทศนิยม2. จํานวนตวัอยา่งในแตล่ะกลุม่3. ร้อยละรวม4. จํานวนกลุม่ตวัอยา่งทั งหมด

Page 9: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

ตวัอยา่งทีใช้ในรายวิชานี เป็นข้อมลูจากสํามะโนประชากรและเคหะ

ปี พ.ศ. 2543(ชดุข้อมลู 1%)

Page 10: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationตาราง 1 จํานวนสมาชิกในครัวเรือน

Total member

14036 2.3 2.3 2.351958 8.7 8.7 11.0

107516 18.0 18.0 29.0170994 28.6 28.6 57.6123955 20.7 20.7 78.355542 9.3 9.3 87.632746 5.5 5.5 93.017896 3.0 3.0 96.010287 1.7 1.7 97.8

6400 1.1 1.1 98.82453 .4 .4 99.21944 .3 .3 99.61118 .2 .2 99.7

574 .1 .1 99.8375 .1 .1 99.9144 .0 .0 99.968 .0 .0 99.9

180 .0 .0 100.019 .0 .0 100.020 .0 .0 100.022 .0 .0 100.072 .0 .0 100.025 .0 .0 100.031 .0 .0 100.0

598375 100.0 100.0

123456789101112131415161718192022242531Total

ValidFrequency Percent Valid Percent

CumulativePercent

Page 11: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationการใช้กราฟในแตล่ะประเภทข้อมลู

BarDot plotPie chartHistogramLine graphBox and whisker plot

Source: Vaus, 2002

FewFewFewManyManyMany

DiscreteDiscreteDiscreteContinuousContinuousContinuous

Usually nominal or ordinalUsually nominal or ordinalUsually nominal or ordinalIntervalIntervalOrdinal or interval

Type of graph # ofcategories

Discrete orcontinuous

Level of measurementof variable

Page 12: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Bar graph

Page 13: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Pie chart

Page 14: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Histogram

Page 15: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

Age group

0-45-910-1415-1920-2425-2930-3435-3940-4445-4950-5455-5960-6465-6970-7475-7980-8485-8990-9495-99Total

43,62150,00151,40852,57048,17451,63553,73853,22247,99738,36328,86822,58419,72014,99910,2495,8403,1641,493

512217

598,375

Frequency

สาํมะโนประชากรไทย ปี 2543

Page 16: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Line graph

Page 17: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543 Box plot

ยงัไมต่ดัoutlier cases

25%25%

25%

25%

Median

Page 18: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Box plot

ตดัoutlier casesแล้ว

Page 19: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and PresentationSummary statistics ในแตล่ะระดบัการวดั

Measure ofcentral tendency

Source: Vaus, 2002

Type of statistic

Measure ofdispersion

Mode Median Mean

Nominal Ordinal Interval

Variation ratio Range, decile range,Interquartile range

Variance,Standard deviation

Shape - - Skewness,Kurtosis

Page 20: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Measures ofCentral Tendency

Statistics

Recode age598375

031.0030.00

35

ValidMissing

N

MeanMedianMode

Mode

Page 21: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Measures ofDispersion

Variation ratio= 1-(31.4/100)= 0.69

Relationship to head of household

161920 27.1 27.1 27.1112631 18.8 18.8 45.9187600 31.4 31.4 77.230251 5.1 5.1 82.316810 2.8 2.8 85.1

44382 7.4 7.4 92.5

9688 1.6 1.6 94.130212 5.0 5.0 99.24881 .8 .8 100.0

598375 100.0 100.0

HH headWife/husbandUnmarried childrenMarried childrenChildren in-lawChildren of children,couples of childrenParents, grand parentsOther councilsOther residents, servantsTotal

ValidFrequency Percent Valid Percent

CumulativePercent

Page 22: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Measures ofDispersion

= 98-0 = 98 yearsRange = Highest value – Lowest value

Range = 98 years

Page 23: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Measures ofDispersion

10% Decile range (80%)

Decile range59 – 6 = 53 years

Statistics

Recode age598375

06.00

12.0018.0024.0030.0035.0041.0048.0059.00

ValidMissing

N

102030405060708090

Percentiles

10%

Page 24: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Measures ofDispersion

25% Interquartilerange(50%)

Interquartile range44 – 15 = 29 years

25%

Statistics

Recode age598375

015.0030.0044.00

ValidMissing

N

255075

Percentiles

Page 25: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

Statistics

598375 5983750 0

31.00 4.5119.513 1.955

380.776 3.82398 300 1

98 31

ValidMissing

N

MeanStd. DeviationVarianceRangeMinimumMaximum

Recode age Total member

Measures of Dispersion

sqrt (Variance) = Standard deviation

สาํมะโนประชากรไทย ปี 2543

Page 26: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

Shape: Skewness & Kurtosisสาํมะโนประชากรไทย ปี 2543

Statistics

598375 5983750 0

31.00 4.5119.513 1.955

.445 1.592

.003 .003-.465 7.151.006 .006

ValidMissing

N

MeanStd. DeviationSkewnessStd. Error of SkewnessKurtosisStd. Error of Kurtosis

Recode age Total member

Positive Skew Negative SkewSymmetry

Positive Kurtosis Negative KurtosisNormal

-1 ≤ Skewness ≥ 1Skewness > 1 Skewness < -1

-1 ≤ Kurtosis ≥ 1Kurtosis > 1 Kurtosis < -1

Page 27: Data Analysis for Descriptive Statistics - Pirun Web Serverpirun.ku.ac.th/~fedutnw/pubs/da2008_descriptive02.pdf · Data Analysis for Descriptive Statistics ... 3. หาก positive

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation