การวิเคราะหทางสถิติดวยโปรแกรม Stataสถิติเชิงพรรณนา

ผูชวยศาสตราจารยนิคม ถนอมเสียงสาขาวชิาวิทยาการระบาดและชีวสถิติ

คณะสาธารณสุขศาสตร มหาวิทยาลัยขอนแกนEmail: nikom@kku.ac.th

WebPage: https://home.kku.ac.th/nikom


ตัวแปรตอเนื่อง (interval, ratio)คาเฉลี่ย (Mean) ความแปรปรวน (Variance)

สวนเบี่ยงเบนมาตรฐาน (Standard Deviation)มัธยฐาน (Median) คลอรไทร (Quartile) etc. คําสั่ง summarize, tabstat

ตัวแปร nominal, ordinalการแจกแจงความถี่ รอยละ คําสั่ง tabulate, tab1

การสรางตัวแปรใหม: generate/การเปลี่ยนแปลง ขอมูล: recode และวเิคราะหขอมูลท่ีจัดกลุม tabulate, tab1

Prompt พิมพคําสั่ง

คําสั่ง summarize: วิเคราะห Mean, Standard deviation (sd)minimum, maximum

ใช Stata command: sum age weight height chol [Enter]summarize -- Summary statisticsคําสั่ง summarize [varlist] [if] [in] [weight] [, options]*detail=display additional statistics

พิมพคําสั่ง .summarize age weight height chol หรือ

.sum age weight height chol

คําสั่ง summarize [varlist], detail: วิเคราะห สถิติ Mean, Standard deviation (sd) minimum, maximum, variance, Median, Quartile etc. ใช Stata command: summarize age, detail [Enter]

พิมพคําสั่ง .summarize age, detail หรือ

.sum age, detail

ผลลัพธจากคาํสั่ง summarize age, detail: วิเคราะห สถิติ Mean, Standard deviation (sd) minimum, maximum, variance, Median, Quartile etc.



เปอรเซ็นไทลที่ 25 (P25) sinv คลอรไทลที่ 1 (Q1)

เปอรเซ็นไทลที่ 75 (P75) หรือ คลอรไทลที่ 3 (Q3)

เปอรเซ็นไทลที่ 50 (P50) หรือคลอรไทลที่ 2 (Q2)หรือมัธยฐาน

คําสั่ง summarize: วิเคราะห Mean, Standard deviation (sd)minimum, maximum, variance, Median, Quartile etc. ใช Stata Menu: Statistics/Summaries, table, and tests/Summary and descriptive statistics/Summary statistics

คําสั่ง summarize [varlist], detail: วิเคราะห สถิต ิMean, Standard deviation (sd) …, variance, Median, Quartile etc. ใช Stata Menu: Statistics/Summaries, table, and tests/Summary and descriptive statistics/Summary statistics


คําสั่ง tabstat [varlist], statistics(สถิติตางๆ):วเิคราะห สถิติเชิงพรรณนา โดยกําหนดเองใช Stata command:

tabstat age weight height chol, statistics(mean sd median p25 p75) [Enter]

พิมพคําสั่ง tabstat age weight height chol,

statistics(mean sd median p25 p75)

mean meancount count of nonmissing observationsn same as countsum summax maximummin minimumrange range = max - minsd standard deviationvariance variancecv coefficient of variation

(sd/mean)semean standard error of mean

(sd/sqrt(n))skewness skewnesskurtosis kurtosis

p1 1st percentilep5 5th percentilep10 10th percentileP25 25th percentilemedian median (same as p50)p50 50th percentile

(same as median)p75 75th percentileP90 90th percentilep95 95th percentilep99 99th percentileiqr interquartile range = p75 - p25q equivalent to specifying

p25 p50 p75

tabstat - Compact table of summary statisticsคําสั่ง tabstat varlist [if] [in] [weight] [, options]

คําสั่ง tabstat [varlist], statistics(สถิติตางๆ) column(variable)วเิคราะห สถิติเชิงพรรณนา โดยกําหนดเอง สถิติตามคอลัมนใช Stata command: tabstat age chol, statistics(mean sd median p25 p75) column(variable) [Enter]

พิมพคําสั่ง tabstat age chol, statistics(mean sd

median p25 p75) column(variable)

คําสั่ง tabstat [varlist], statistics(สถิติตางๆ):วเิคราะห สถิติเชิงพรรณนา โดยกําหนดเองใช Stata Menu: Statistics/Summaries, table, and tests/Others tables/

Compact table of summary statistics

ตัวแปรจําแนกประเภท (Categorical)nominal, ordinal เชน เพศ อาชีพ

การแจกแจงความถี ่และวิเคราะหสถิติแจกแจงจํานวนความถี่และรอยละตามกลุมตัวแปรเดี่ยว tabulate, tab1 เชน

.tabulate sex

.tab1 sex occสองตวัแปร (two way) แสดงรอยละ, คาสถิติ

tabulate ตัวแปร1 ตัวแปร2, [เงื่อนไข]tab ตัวแปร1 ตัวแปร2ม [เงื่อนไข]

.tab sex occ, chi exact exp col row

คําสั่ง tabulate <varlist1> วิเคราะหตารางแจกแจงความถี่ (ตัวแปรเดี่ยว) ใช Stata command

พิมพคําสั่ง tabulate sex [Enter]

พิมพคําสั่ง tabulate occ [Enter]

ผลการวิเคราะห ตารางแจกแจงความถ่ี ตัวแปรเพศ พบเพศชาย (รหัส 1) จํานวน 1 ราย 20%

เพศหญิง(รหัส 2) จํานวน 4 ราย 80%จํานวนขอมูลทั้งหมด 5 ราย ไมมีขอมูลสูญหาย

ผลการวิเคราะห ตารางแจกแจงความถ่ี ตัวแปรอาชีพ พบ รหัส 1 จํานวน 2 ราย 40%

รหัส 3 จํานวน 1 ราย 20%รหัส 4 จํานวน 2 ราย 40%

จํานวนขอมูลทั้งหมด 5 ราย ไมมีขอมูลสูญหาย

คําสั่ง tabulate วิเคราะหตารางแจกแจงความถี่ใช Stata Menu: Statistics/Summaries table, and tests/

Frequency tables/ One-way table

คําสั่ง tab1 <varlist> วิเคราะหตารางแจกแจงความถี่ (ตัวแปรเดี่ยว หรือมากกวา 1 ตัวแปร)

ใช Stata command

พิมพคําสั่ง tab1 occ [Enter]

คําสั่ง tab1 วิเคราะหตารางแจกแจงความถี ่(ตัวแปรมากกวา 1 ตัวแปร)

ใช Stata Menu: Statistics/Summaries table, and tests/Frequency tables/ Multiple One-way table

การสรางตัวแปรใหม: generate/การเปลี่ยนแปลงขอมูล: recodeสรางตัวแปรใหมจาก คํานวณ Body Mass Index (BMI)

BMI = weight (kg) ÷ height2 (m2)

สรางตัวแปรใหมใหเทากับ BMI

จัดกลุม ตามทฤษฏี

วิเคราะหขอมูลท่ีจัดกลุม tabulate, tab1

. gen bmi=weight/(height/100)^2

. list

. gen bmi_gr=bmi

. recode bmi_gr min/18.4=1 18.5/25=2


. tab1 bmi_gr

The World Health Organisation (WHO)

BMI BMI Category

Less than 15 Very severely


Between 15 to 16 Severely


Between 16 to 18.5Underweight

Between 18.5 to 25 Normal (healthy


Between 25 to 30 Overweight

Between 30 to 35 Moderately obese

Between 35 to 40 Severely obese

Over 40 Very severely obese








กลุม BMI

ปกติ 2 ราย 40%

สูง 3 ราย 60%


ลักษณะการแจกแจงขอมูล: เบเชิงบวก/เบเชิงลบ, สมมาตร


การตรวจสอบดวย graph histogram –graph two way

normal probability plot – pnorm

stem & leaf plot -stem

Box & Whisker เบเชิงบวก/ลบ, สมมาตร

ขอมูลสูงหรือต่ํากวาปกติ (outliers)


การตรวจสอบการแจกแจงแบบปกติดวยสถิต ิ-swilk

ลักษณะการแจกแจงขอมูลHistogram Normal Probability Plot

Stem & Leaf Box-Whisker

Histogram Stata Command พิมพคําสั่ง histogram chol , normal bin(5)

พิมพคําสั่ง histogram chol , normal bin(5) [Enter]

ตัวแปร sysbp มีลักษณะเบเชงิลบ (เบซาย)จํานวนแทงสี่เหลี่มผืนผาจํานวน 3 แทง (bin)Stata คํานวณจํานวนแทง (bin) จาก




Histogram Stata Menu: Graphics/Histogram


normal probability plot – Stata Commandpnorm [varlist]

พิมพคําสั่ง pnorm age [Enter]

normal probability plot – Stata Menu Statistics/Summaries, table, and tests/Distributional plots

and tests/ Normal probability plot, standardized


Stem & leaf plot: Stata Comand: stem [varlist] พิมพคําสั่ง stem chol [Enter]

พิมพคําสั่ง stem chol [Enter]

Stem & leaf plot ปรากฏขอมูลแบงเปน stem และ leafจํานวนขอมูล 5 ราย ไดแก 178, 257, 261, 265, 279คาต่ําสุดของ chol=178, คาสูงสุด=279ลักษณะเบเชิงลบ (เบซาย)

Stem & leaf plot: Stata MenuStatistics/Summaries, table, and tests/Distributional plots and tests/

Stem-and-leaf display


แผนภาพกลอง (Box & Whisker): Stata Command graph hbox [varlist] /* กราฟแนวนอน */ graph box [varlist] /* กราฟแนวตั้ง */

พิมพคําสั่ง graph box age, horizontal [Enter] หรือ graph hbox age [Enter]

แผนภาพกลอง (Box & Whisker) มีแนวโนมลักษณะสมมาตร

ระยะหาง Q2-Q1 = Q3-Q2ไมมีคานอกเกณฑ (outliers)

Q1 Q2 Q3

แผนภาพกลอง (Box & Whisker): Stata MenuGraphics/ Box plot/



Shapiro-Wilk Test; 4<=n<=2000

Shapiro-Fransia test; 10<=n<=5000

H0: ขอมูลมีการแจกแจงแบบปกติ

HA: ขอมูลไมใชการแจกแจงแบบปกติ

เมื่อ p-value >0.05 ขอมูลมีการแจกแจง


Shapiro-Wilk test/Shapiro-Francia test: Stata Commandswilk [varlist…]Sfracia [varlist…]

พิมพคําสั่ง swilk age chol [Enter]พิมพคําสั่ง swilk age chol [Enter]

การวิเคราะหดวยสถิติ Shapiro-Wilk /Shapiro-Franciaตัวแปร age มีการแจกแจงแบบปกติ (p-value > 0.05)ตัวแปร chol มีการแจกแจงไมปกต ิ(p-value < 0.05)

การวิเคราะหดวยสถิติ Shapiro-Franciaในผลลัพธนี ้ไมสามารถคํานวณได

เนื่องจาก n < 10 ราย

Shapiro-Wilk test/Shapiro-Francia test: Stata MenuStatistics/Summaries, table, and tests/Distributional plots and tests/

Shapiro-Wilk normality test
