Inferential statistics

Preview:

Citation preview

Kitti Krungkraipetch, MD.Faculty of MedicineBurapha University

Definition and concernmentConcept and rule of thumbStatistic approach Statistic application

Definition and concernment

สถ�ต�เช�งอนมาน (Inference Statistics)

เป�นสถ�ต�ท��ม�งศ�กษา และอธ�บายล�กษณะต�าง ๆ ของกล�มประชากรเป#าหมาย โดยท'าการรวบรวมข)อม*ลจาก ต�วอย�าง ซ��ง

เป�นส�วนหน��งของ ประชากร ท'าการว�เคราะห.ข)อม*ลจากกล�มต�วอย�าง และสรปผลการ

ว�เคราะห.ข)อม*ลไปส*�กล�มประชากรเป#าหมาย

Definition and concernment

Statistic categories descriptive stat

(size and origin; What, When, Where, Why)

Inferential stat. (statistic affirm; compare to, how to that can be refered to

population)

Definition and concernment

population

samples

Inferential to population

เป�นการวเคราะห ข�อม�ลและบรรยายล�กษณะข�อม�ลของกล��มต�วอย�าง ซ !งถ�ากล��มต�วอย�างด$จะอ�างองประชากรได�

Statistic approach

สถตอน�มานแบ�งได�เป�น 2 ประเภท ได�แก�Parametric statisticsNon-Parametric statistics

Parametric statistics must have1. Continuous data2. Large sample size3. Statistic sampling4. Normal distributionNon-Parametric did not.

Statistic approach

วธ$การของสถตเชงอน�มานประกอบด�วย 2 ส�วนค,อ 1 .การประมาณค�าพาราม�เตอร.(Estimation of Parameters)

2. การทดสอบสมมต�ฐานทางสถ�ต� (Testing of Statistical Hypothesis)

ไปศ กษาในช�!วโมงการทดสอบสมมตฐาน

What is difference?What is difference?

วธ$การของสถตเชงอน�มานการอน�มานค�าพารามเตอร ในล�กษณะน$2

เร$ยกว�าการประมาณค�าพาราม�เตอร.แต�ถ�าอยากทราบว�าข�อม�ลท$!ส��มมาน�2น

สน�บสน�นหร,อข�ดแย�งก�บข�อสงส�ยท$!ผ��ศ กษาก4าหนดไว�หร,อไม�แล�วจะเร$ยกการอน�มานล�กษณะน$2ว�า การทดสอบสมมต�ฐาน

วธ$การของสถตเชงอน�มาน การประมาณค�าพาราม�เตอร. 1 การประมาณแบบค�าเด�ยว ต�วสถตท$!จะใช�ประมาณพารามเตอร จะต�องเป�นต�วท$!คาดว�าจะให�

ค�าใกล�ก�บค�าพารามเตอร สมมตให� X1, X2 , ... , Xn เป�นต�วอย�างส��มขนาด n จากประชากร จะสร�างต�วสถตหน !งและค4านวณค�าของต�วสถตจากข�อม�ลในต�วอย�างขนาด n เพ,!อใช�ต�วสถตและค�าของต�วสถตน$2ในการประมาณค�าพารามเตอร เร$ยกต�วสถตน$2ว�า ต�วประมาณ (Estimator)

วธ$การของสถตเชงอน�มาน

ต�วประมาณ หมายถ ง ต�วสถตท$!ใช�ประมาณค�าพารามเตอร ในประชากร

ค�าของต�วสถตท$!ค4านวณได�จากต�วอย�างเร$ยกว�า

ค�าประมาณ (Estimate)

วธ$การของสถตเชงอน�มาน ค�ณสมบ�ตท$!ส4าค�ญของต�วประมาณม$ด�งน$2 1 . ความไม�ม�อคต� (Unbiasedness)

ถ�าค�าเฉล$!ยในระยะยาวหร,อค�าท$!คาด (Expected Value)ของต�วประมาณใดม$ค�าเท�าก�บพารามเตอร ท$!ต�องการประมาณจะเร$ยกต�วประมาณน�2นว�าต�วประมาณท��ไม�ม�อคต� (Unbiased Estimator) ต�วอย�างเช�น ต�วประมาณ X ม$ค�าเท�าก�บ m หร,อ E( X) = m

วธ$การของสถตเชงอน�มาน2. ความม�ประส�ทธ�ภาพ (Efficiency)

ถ�าต�วประมาณ 2 ต�วเป�นต�วประมาณท$!ไม�ม$อคตท�2งค�� แต�ต�วประมาณ

หน !งม$ค�าความแปรปรวนต4!ากว�าต�วประมาณอ$กต�วหน !งแล�วจะเล,อกต�ว

ประมาณท$!ม$ค�าความแปรปรวนต4!ากว�าเป�นต�วประมาณของพารามเตอร

เพราะต�วประมาณน$2จะให�ค�าประมาณท$!ใกล�ก�บค�าพารามเตอร ท$!เป�นค�า

จรงมากกว�าจะเร$ยกต�วประมาณน$2ว�า ต�วประมาณท��ม�ประส�ทธ�ภาพ (Efficient Estimator)

วธ$การของสถตเชงอน�มาน3. ความคงต�ว (Consistency) ถ�าต�วประมาณหน !งม$แนวโน�มท$!จะม$ค�าใกล�ค�าพารามเตอร

เม,!อต�วอย�างม$ขนาดใหญ�ข 2นแล�ว จะเร$ยกต�วประมาณน$2ว�า ต�วประมาณ

คงต�ว(Consistent Estimator)

ต�วประมาณคงต�วน$2อาจเป�นต�วประมาณท$!ม$อคตก7ได� แต�ความเอนเอ$ยง

จากค�าพารามเตอร น$2จะลดลงเม,!อ n ใหญ�ข 2น

วธ$การของสถตเชงอน�มาน2 การประมาณแบบช�วง

ค�าความน�าจะเป�นในท$!น$2เร$ยกว�า ระด�บความเช4�อม��น

(Level of Confidence) การประมาณค�าพารามเตอร แบบเป�นช�วงจะเป�นการ

ประมาณว�าค�าพารามเตอร หน !งคาดว�าจะม$ค�าอย��ระหว�างค�าสองค�าค,อ L และ U สมมตว�า พารามเตอร ท$!ต�องการประมาณในประชากรหน !งค,อ q ค�าประมาณแบบเป�นช�วง ของ q น$2จะอย��ในร�ป

สถตเชงอน�มาน L ≤ q ≤ U

น�!นค,อช�วงความเช,!อม�!น (1-α)100% ของเม,!อประชากรม$การแจก

แจงแบบปกตท$!ทราบค�าความแปรปรวน s จะค4านวณได�จาก

2 1/ 2

1

[ ( ) /( 1)]n

ii

s x x n

คะแนนสอบวชาสถต ของน�กศ กษาจ4านวน 600 คนม$การแจกแจกแบบปกตด�วยค�าของค�าเฉล$!ย และความแปรปรวน 2 ท$!ย�งไม�ทราบค�า แต�ผ��

ตรวจกระดาษค4าตอบต�องการประมาณค�าของ และ 2 จ งได�เล,อกต�วสถตเป�น ต�อจากน�2นก7

ท4าการส��มคะแนนน�กศ กษามา 10 คน พบว�าคะแนน ด�งกล�าวเป�นด�งน$2 ค,อ ( คะแนนเต7ม 100 คะแนน)

1 2 3 4 536, 42, 34, 40, 64x x x x x

6 7 8 9 1050, 22, 54, 60, 32x x x x x

ต�วอย�าง การประมาณค�า

x

ว�ธ�ท'า ค4านวณค�าค�าเฉล$!ยต�วอย�างและความแปรปรวนต�วอย�างได�ด�งน$2 ค,อค�าเฉล$!ยต�วอย�าง 1 2 10...

10

36 42 34 ... 32 =

10 43.40

x x xx

x ด�งน�2นในท$!น$2 estimator = และ43.40x

ความแปรปรวนต�วอย�าง :

2s 2 126.93s ด�งน�2นในท$!น$2 estimator = และ

2 22 1 10

2 2

( 43.40) ... ( 43.40)

10 1

(36 43.40) ... (32 43.40)

9 126.93 ( 11.26)

x xs

s

(1) ต�วสถต ประมาณค�าเฉล$!ย(ประชากร) (2) ต�วสถต ประมาณค�าความแปรปรวน(ประชากร)

จากต�วอย�างข�างต�นน�กศ กษาพบว�าเราได�ใช�

x2s 2

เหต�ผลท$!เราเล,อกต�วประมาณค�าเช�นน$2 เพราะว�าท�2ง และ ต�างก7เป�นต�วประมาณค�าท$!ไม�เอนเอ$ยง(unbiased estimater) ของท�2ง และ ( น�!นค,อ และ )

( )E X 2 2( )E S

x 2s 2

ม$ค4าถามต�อมาก7ค,อว�าค�าโดยประมาณท$!ให�มาน$2ม$ ความน�าเช,!อถ,อมากน�อยเพ$ยงใด เราจะน4าเคร,!อง

ม,ออะไรมาว�ดด$ ค4าตอบก7ค,อเราสามารถใช�standard error ว�ดความเท$!ยงตรงของการ

ประมาณค�าแบบจ�ดได� * ด�งต�วอย�างต�อไปน$2ต�วอย�างท�� ขอให�พจารณาคะแนนของน�กศ กษา10 ท�านตามท$!กล�าวไว�ในต�วอย�างท$!แล�วน�!นค,อ

36 42 34 40 6450 22 54 60 32

* โดยบทนยาม ถ�า เป�นต�วประมาณค�าของ แล�ว Standard error ของ จะเป�น standard deviation ของ

เราได�ค4านวณไว�แล�วว�าเราได�ค4านวณไว�แล�วว�า ค�าเฉล$!ยต�วอย�าง = 43.40

ส�วนเบ$!ยงเบนมาตรฐานต�วอย�าง s = 11.26 ส4าหร�บ standard error ของค�าเฉล$!ย ต�วอย�าง น�2นได�เคยกล�าวถ ง ไว�แล�วในบทก�อน

ว�าม$ค�าเท�าก�บ

x

/X n

25

x

แต�เน,!องจาก เป�นค�าของประชากรท$!เราไม�ทราบ ด�งน�2นจ งแทน ในสมการส�ดท�ายด�วย ส�วนเบ$!ยง

เบนมาตรฐานต�วอย�าง ค,อ s = 11.26 ผลล�พธ ก7ค,อ11.26

3.5610X

s

n

พบว�า standard error ม$ค�าราว 8.20% ของค�าเฉล$!ยต�วอย�าง ซ !งพอจะบอกได�ว�าการ

คาดคะเนแบบจ�ดของเราใกล�เค$ยงค�าของ ประชากรพอ สมควร

1) พารามเตอร : ค�าเฉล$!ยประชากร ข�อม�ล : estimator :

1 2 , ,..., nx x x

1

= /n

ii

x x n

27

สรปเร4�องการประมาณค�าแบบจดม�ด�งน�5

1 2 , ,..., nx x x2) พารามเตอร : ความแปรปรวนประชากร ข�อม�ล : estimator : 2

2 1

( )

1

n

ii

x x

Sn

ความเอนเอ$ยง = E[estimator - parameter]

ส�วนเบ$!ยงเบนมาตราฐานของต�วประมาณค�าซ !งเราเร$ยกว�า standard error ในกรณ$ของ mean

X n

28

6.3 การว�ดความน�าเช4�อถ4อของการประมาณค�า

6.4 การประมาณค�าแบบช�วง(Interval Estimation)

ในหลายกรณ$การประมาณค�าแบบจ�ดอาจจะไม�ให�ข�อม�ลท$!เพ$ยงพอเก$!ยวก�บต�ว

พารามเตอร ท$!เราสนใจ ด�งน�2นในบางคร�2งเรา จ งชอบท$!จะประมาณค�าพารามเตอร ด�วย

ช�วงของจ4านวนจรงเร$ยกช�วงท$!ใช�ในการ ประมาณค�าน$2ว�า ช�วงความเช4�อม��น (confidence

interval) และเราย�งม$วธ$การควบค�ม เพ,!อท$!จะก4าหนดว�าช�วงความเช,!อม�!นท$!ได�สร�างข 2นมาน$2ม$

ระด�บความเช4�อม��น (Level of significance) อย��ในระด�บใด

บทน�ยามบทน�ยาม : : ระด�บของความเช4�อม��น ระด�บของความเช4�อม��น (Level of Significance)(Level of Significance)

( ) 0.95P L U

หมายถ ง โอกาส (หร,อความน�าจะเป�น) ท$!พารามเตอร ของประชากรจะอย��ในช�วงความเช,!อ

ม�!นหน !ง ต�วอย�างเช�นเราเข$ยน

30

หมายความว�า ความน�าจะเป�นท$!พารามเตอร จะ อย��ในช�วง (L,U) ม$ค�าเท�าก�บ 0.95 หร,อกล�าวอ$ก

อย�างหน !งก7ค,อค�าของ จะอย��ในช�วง (L,U) ด�วยระด�บความเช,!อม�!น 95%

ร�ปข�างล�างน$2แสดงช�วงความเช,!อม�!นต�าง ๆ ท$! ใช�ในการประมาณค�าเฉล$!ยประชากร ซ !งม$ true

mean = 20

10

15

20

5

0

5 101520253035

YesYesYesYesYesYesYesYesYesYesYesYesYesYesYesYesYesYesYesYes

Sam

ple

nu

mb

er

True = 20

31

พ�จารณาออกได)เป�น 2 กรณ� ด�งน�5

32

การสร)างช�วงความเช4�อม��นส'าหร�บค�าเฉล��ยของประชากร

กรณ�ท�� 1 เม4�อขนาดของต�วอย�างเช�งส�มม�ขนาดใหญ�

n 30 กรณ�ท�� 2 เม4�อขนาดของต�วอย�างส�มม�ขนาด

เล9ก

n < 30

33

กรณ�ท�� 1 การสร)างช�วงความเช4�อม��นส'าหร�บ ค�าเฉล��ย

เม4�อขนาดต�วอย�าง n 30

x

จาก ทฤษฎ$บทลมตเข�าส��ส�วนกลาง จะได�ว�าค�าเฉล$!ยต�วอย�าง ม$การแจกแจงโดยประมาณเป�นแบบปกต

เราจะเร!มต�นด�วยการเล,อกต�วอย�างเชงส��ม (n 30) มาจากประชากร

ท$!ย�งไม�ทราบค�าเฉล$!ย แต�ขอสมม�ตว�าทราบ ค�าความแปรปรวน แล�วให� เป�นค�า

เฉล$!ยต�วอย�าง

1 2 , ,..., nx x x

2 x

2

( , )Nn

x

ด�งน�2น ต�วแปรส��ม

/

XZ

n

จ งม$การแจกแจงโดยประมาณแบบปกต N(0,1) เพราะฉะน�2น เม,!อม$การก4าหนดความน�าจะเป�น

1- มาให� ( เป�นค�าน�อยๆ เช�น 0.01, 0.05 หร,อ 0.10) เราสามารถหาค�า

จากตารางการแจกแจงแบบปกตได� เพ,!อว�า

(1)

/ 2 / 2( ) 1P z Z z

ต�วอย�างเช�น ถ)า

แล)ว

/2 /2

/2/2

L U

1-

1-

0-Z /2 Z /2

Z

X

1 1 0.05

0.95

/ 2 0.025 z

1.96

z

35

ขอให�ส�งเกตว�านพจน ในวงเล7บของสมการ 1( ) สามารถท$!จะเข$ยนใหม�ได�เป�น

/ 2 / 2 z X zn n

/ 2 / 2 X z X zn n

/ 2 / 2 X z X zn n

36

ด�งน�2น ความน�าจะเป�นในสมการ 1( ) จ งเข$ยนได�ใหม�เป�น (2)

/ 2 / 2P = 1- X z X zn n

เพราะฉะน�2นช�วงส��ม (random interval) ส4าหร�บการประมาณค�า

ค,อ

37

/ 2 / 2, X X z zn n

เม,!อได�ม$การส��มต�วอย�างหาค�าเฉล$!ยแล�ว ช�วง ส��ม (random interval) ก7จะเปล$!ยนเป�น

ช�วงของจ4านวนจรงด�งน$2/ 2 / 2, x z x zn n

3( )

= error =E ( )x

/ 2 /L x z n x / 2 /U x z n

ตามความเป�นจรงแล�วเราก7ไม�ทราบว�าช�วง(3)

น$2จะบรรจ�ค�า อย��ด�วยหร,อเปล�า แต�เราสามารถท$!จะกล�าวออกมาได�โดยอ�าง

(2) ว�า “ เราม$ความเช,!อม�!นถ ง (1-) 100% ว�า ช�วง (3) จะบรรจ� อย��ด�วย ”

หร,ออาจจะกล�าวอ$กอย�างหน !งว�าช�วง (3) ค,อ ช�วงความ เช,!อม�!น (confidence interval)

ส4าหร�บการประมาณค�า ด�วยระด�บความ เช,!อ ม�!น (1-) 100%

ขอให�ส�งเกตว�าในการหาช�วงความเช,!อม�!น (3 ) น�2น ต�องทราบค�าต�อไปน$2 ค,อ

38

(1) ค�าเฉล$!ยต�วอย�าง ค�าน$2หาได�จากการ เล,อกต�วอย�างเชงส��มขนาด n มา 1 ช�ด

สมม�ตว�าเป�น ต�อจาก ก7ค4านวณหาค�าเฉล$!ยต�วอย�าง

x

1 2, ,..., nx x x

1 2 ... nx x xx

n

(2) ค�า ค�าน$2หาได�จากการเป;ด ตารางการแจกแจงแบบปกต ( ส�วนค�า

น�2นเป�นค�าท$!เราก4าหนดข 2นมาเอง ถ�า ต�องการให�ม$ความเช,!อม�!นส�ง ก7ก4าหนด

ให�ม$ค�าน�อยเพ,!อว�า (1-) 100% จะได�ม$ค�ามาก)

/ 2z

(3) ต�องทราบค�า ค�าน$2เป�นค�าส�วนเบ$!ยง เบนของประชากรค�าน$2หาได�ล4าบาก เพราะ

เป�นค�าประชากรแต�ในทางปฏบ�ตแล�ว ค�าน$2จะได�จากประสบการณ ในการท4างานเร,!อง

น�2นจนช4านาญก7พอจะคาดเดาค�า ได� ใน กรณ$ท$!ไม�สามารถจะคาดเดาค�า ได� ก7ให�

ใช� sample standard deviation

แทน ในกรณ$ช�วงความเช,!อม�!น (3) ก7จะเปล$!ยนเป�น

2 1/ 2

1

[ ( ) /( 1)]n

ii

s x x n

4( )/ 2 / 2, s s

x z x zn n

โรงงานผลตสายเบรกแห�งหน !งต�องการทราบว�าสายเบรกท$!ผลตได� จะสามารถร�บแรง

ด งได�โดยเฉล$!ยเท�าใด เพ,!อท$!จะประมาณค�า เฉล$!ยของแรงด งน�2น โดยได�ม$การเล,อก

ต�วอย�างเชงส��มมา 32 เส�น แล�วท4าการตรวจสอบแรงด งของแต� ละเส�นต�อจากน�2นจ งหา

sample mean ออกมาได� 42,196 ปอนด จากประสบการณ ทางโรงงานทราบว�าส�วนเบ$!ยง

เบนมาตรฐานของแรงด งม$ค�าเท�าก�บ 500 ปอนด จงประมาณค�าแรงด งเฉล$!ยของสาย

เบรคท$!ผลตจากโรงงานน$2 ก4าหนดให� = 0.1

ต�วอย�าง

วธ$ท4าวธ$ท4า จะประมาณค�าเฉล$!ย ด�วยการหาช�วงเช,!อม�!น

ด�วยส�ตร (3) เราม$1) = 42,196 ปอนด 2) = 0.1 ,

3) = 500 ;

และ = 1.645 และ เพราะฉะน�2น โดยส�ตร (3) confidence interval

ส4าหร�บ ด�วยระด�บความเช,!อม�!น 90% ค,อ

/ 2 0.05= zz / 32 500/ 32

x

42

( 1.645 / 32, 1.645 / 32)x x

(42,196 1.645(500/ 32)

(42,051, 42,341)

กล�าวโดยสร�ปก7ค,อ ค�าของ จะอย��ใน ช�วง42,051 - 42,341 ด�วยระด�บความเช,!อ

ม�!น 90%

43

ในกรณ$น$2ต�องสมม�ตว�าประชากรท$!เราสนใจ ม$การแจกแจงแบบปกตด�วย เพ,!อว�าต�วแปรส��ม

/

X

S n

จะม$การแจกแจงแบบ t

44

กรณ�ท�� 2 การสร)างช�วงความเช4�อม��น ส'าหร�บค�าเฉล��ยเม4�อขนาดต�วอย�าง n < 30

ช�วงการประมาณค�าของ ท$!ระด�บความเช,!อ ม�!น (1-)100%

/ 2 ; 1 / 2 ; 1 n n

s sx t x t

n n

จ'านวนร)อยละของไขม�นในไส)กรอกท��ถ*กส�มเล4อกมา 10 ช�5นเป�นด�งน�5

25.2 21.3 22.8 17.0 29.8 21.0 25.5 16.0 20.9 19.5

45

ต�วอย�าง

Assume that these were selected from a normal population distribution. Please find 95% confidence interval for the population mean fat content.

ว�ธ�ท'า25.2 21.3 ... 19.5 219

21.9010 10

x

2 22 (25.2 21.9) ... (19.5 21.9)

9 17.08, s 4.134

s

The confidence interval of population mean fat content is

0.025,9

4.134. 21.90 2.262. 21.90 2.96

10 (18.94,24.86)

sx t

n

Point estimate ส'าหร�บโจทย.ข)อน�5 ค4อ 21.90x

สถตอน�มาน

เพ,!อใช�ในการพส�จน สมมตฐาน

ตารางสรปการใช)สถ�ต�ในการทดสอบสมมต�ฐาน

ตารางท�� 1 สรปหล�กการเล4อกใช)สถ�ต�ให)เหมาะสมก�บว�ตถประสงค.ของหล�กการว�เคราะห.และล�กษณะของข)อม*ล

ว�ตถ�ประสงค ของการ

วเคราะห ข�อม�ล

ระด�บการว�ด สถตท$!ใช� ค4าส�!งวเคราะห

ในSPSS version 10

ต�วแปรอสระ

ต�วแปรตาม

พรรณนาค�ณล�กษณะ ของข�อม�ล

Nominal /

Ordinal

Frequencies,

Percentage, Mode

Frequencies

Interval /

Ratio

Mean,

Standard Deviation

Range Variance,

Percentile,Quartile

Descriptive

ทดสอบความส�มพ�นธ ระหว�างต�วแปร 2 ต�ว

Nominal Nominal Phi,Cramer’s v,

Chi-square

Crosstabs

Ordinal Ordinal Spearman’s rho,

Kendall’s,Tau-a,

Tau-b,Tau-c

Correlate

Interval /

Ratio

Interval /

Ratio

Correlation Correlate

ว�ตถ�ประสงค ของการวเคราะห ข�อม�ล

ระด�บการว�ด สถตท$!ใช� ค4าส�!งวเคราะห ในSPSS

version 10ต�วแปรอสระ

ต�วแปรตาม

ทดสอบความส�มพ�นธ ระหว�างต�วแปร > 1 ต�ว/

พยากรณ ต�วแปรตามจากต�วแปรอสระ > 1

Interval /

Ratio

Interval /

Ratio

Multiple Regression Regression

ทดสอบความแตกต�างของค�าเฉล$!ยของประชากร 2 กล��ม -เป�นอสระต�อก�น

-ไม�เป�นอสระต�อก�น

Nominal

Nominal

Interval /

Ratio

Interval /

Ratio

t - test

t - test

Independence

Samples t-test Paired Samples t-test

ว�ตถ�ประสงค ของการวเคราะห ข�อม�ล

ระด�บการว�ด สถตท$!ใช� ค4าส�!งวเคราะห

ในSPSS version 10

ต�วแปอสระ

ต�วแปรตาม

ทดสอบความแตกต�างประชากร 2 กล��ม เม,!อ ประชากร 2 กล��ม-เป�นอสระต�อก�น

-ไม�เป�นอสระต�อก�น

Nominal

Nominal

Nominal

Nominal

Nominal

Ordinal Nominal

Ordinal

Chi-Square

Mann Whitney

McNemar Sign

test

Wilcoxon

Crosstabs

Nonparametric

Nonparametric

Nonparametric

ว�ตถ�ประสงค ของการวเคราะห

ข�อม�ล

ระด�บการว�ด สถตท$!ใช� ค4าส�!งวเคราะห ในSPSS

version 10ต�วแปรอสระ

ต�วแปรตาม

ทดสอบความแตกต�างของค�าเฉล$!ยของประชากร > 2 กล��มท$!เป�นอสระต�อก�น-เป�นอสระต�อก�น-ไม�เป�นอสระต�อก�น

Nominal

Nominal

Norminal&Interval

Interval

Interval

Interval

ANOVA

ANOVA

ANOVA

1-Way ANOVA

GLM-Univariate

(Interaction)

GLM-Univariate

(Covariate)

ว�ตถ�ประสงค ของการวเคราะห ข�อม�ล

ระด�บการว�ด สถตท$!ใช� ค4าส�!งวเคราะห ในSPSS version 10ต�วแป

อสระต�วแปรตาม

ทดสอบความแตกต�างของประชากร > 2 กล��มท$!-เป�นอสระต�อก�น-ไม�เป�นอสระต�อก�น

Nominal

Nominal

Nominal

Nominal

Nominal

Ordinal

Nominal

Ordinal

Chi-Square

Kruskal-wallis

Cochran’s Q

Friedman

Crosstab

Nonparametric

Nonparametric

Nonparametric

ท4านายการเป�นสมาชกของกล��ม

Interval /

Ratio

Nominal Discriminant Discriminant

การทดสอบพาราเมตรกในกรณ$ท$!ข�อม�ลไม�เป�นไปตามข�อก4าหนดจะท4าให�การแปลผลไม�ม$ความหมาย

(Meaningless) ด�งน�2นภายใต�สถานการณ เช�นน$2น�กวจ�ยจ งควรใช�การทดสอบนอนพาราเมตรก

ตารางท�� 2 การเปร�ยบเท�ยบประส�ทธ�ภาพของการทดสอบโดยใช)พาราเมตร�กก�นนอนพาราเมตร�กการประย�กต ใช� การทดสอบ

พาราเมตรก (Parametri

c Test)

การทดสอบนอนพาราเมตรก

(Non-parametric

Test)

ประสทธภาพของการทดสอบนอนพาราเมตรกก�บประชากรท$!ม$การแจกแจงปกต

ประชากร 2กล��มท$!เป�นอสระต�อก�น

t-test ,z-test

Wilcoxon rank-sum test

0.95

ประชากร 2กล��มท$!ไม�เป�นอสระต�อก�น

t-test ,z-test

Sign test Wilcoxon Signed ranks test

0.630.95

ประชากรหลายกล��มท$!เป�นอสระต�อก�น

Analysis of varianceANOVA (F-test)

Kruskal-Wallis test

0.95

การประย�กต ใช�

การทดสอบพาราเมตรก (Parametr

ic Test)

การทดสอบนอนพาราเมตรก

(Non-parametric

Test)

ประสทธภาพของการทดสอบนอนพาราเมตรกก�บประชากรท$!ม$การแจกแจงปกต

ความส�มพ�นธ Linear Correlation

Rank Correlation test

0.91

ความส��มหร,อกล��มต�วอย�างได�มาอย�างส��ม (Randomness)

Runs test -

การทดสอบค�าเฉล$!ย 1. ประชากร 1 กล��ม ข�อก4าหนดม$ด�งน$2 ข�อม�ลต�อได�จากการส��ม (random) Normal distribution curve ใช� z-test if sample ≥ 30 If sample ≤ 30, must know σ2 (ความแปรปรวน

ของประชากร) If not know σ2 use t-test

1. ประชากร 1 กล��ม

One sample t-test Z= mean –u0 = mean –u0

σmean σ/√n

σmean = standard error of mean (SE)

U0 = ค�าคงท$! ในทางปฏบ�ตม�กไม�ทราบค�า σ จ งใช�ค�า sd แทน σ ส�ตร

จ งเป�น Z= mean- u0

sd√n

1. ประชากร 1 กล��ม น4าค�า z ท$!ได�จากการเป;ดตารางและค�าท$!ค4านวณได�มา

เปร$ยบเท$ยบก�น ถ�า z ท$!ค4านวณได�ตกอย��ในเขตวกฤต จะปฏเสธ Ho และยอมร�บ Ha

1. ประชากร 1 กล��ม One sample t-test t= mean –u

SD/√n

Df= n-1

น4าค�า t ท$!ค4านวณได�เปร$ยบเท$ยบ ค�า t ในตารางค�าวกฤตท$!ระด�บน�ยส4าค�ญท$!ก4าหนด เช�น ค4านวณค�า t ได�เท�าก�บ -4.39 แต�ค�าท$จากตารางท$! α .05 และ df= 8

t.05,8 =± 2.306 ซ !งค�าท$ท$!ค4านวณได�อย��ในเขตวกฤตแสดงว�า

ปฏเสธ Ho, ยอมร�บ Ha

2. ประชากร 2 กล��มท$!เป�นอสระต�อก�น

ประชากร 2 กล��มไม�ม$ความส�มพ�นธ เก$!ยวข�องก�น เช�น การหารายได�เฉล$!ยของเกษตรกรในจ�งหว�ดขอนแก�นก�บจ�งหว�ดเช$ยงใหม�

ข�อก4าหนด Random sample and independent Normal distribution สถตท$!ใช�ค,อ z-test if n ≥ 30, normal distribution if ≤ 30, must know σ1

2 σ22 หร,อใช� t-test

Independent sample t-test

Hypothesis test has 2 process 1 variability test of population Ho: σ1

2 = σ22 , Ha = σ1

2 ≠ σ22

Set α level Test; Levene’s test for equality of variance: F-

test น4าค�าสถตเปร$ยบเท$ยบค�า sig. ก�บ α level หร,อเปร$ยบ

ค�า F ท$!ค4านวณได�ก�บค�า F ท$!ได�จากตาราง ถ�า F ค4านวณ ≥ F ตารางแสดงว�า σ1

2 ≠ σ22

ส�วนถ�า Fค4านวณ < F ตาราง แสดงว�า σ12 = σ2

2

แปรผลท$!ได�

Independent sample t-test

Hypothesis test has 2 process 1 variability test of population F = sd1

2 / sd22

ค�า F ให�เป;ดตาราง F.05 (df numerator/ df denominator)

F จะม$ค�าเป�นบวกเสมอ เพราะการยกก4าล�งสอง เศษต�องเอา sd ท$!ม$ค�ามากกว�าต�2งเป�นส�วนเสมอ

ส�วน df = n1+n2-2

Independent sample t-test

Hypothesis test has 2 process 2. test mean difference Two –way test; Ho: X1=X2 or X1-X2=0 Ha: X1-X2 ≠ 0 One-way test; Ho: X1≥ X2, Ha: X1<X2 or Ho: X1≤ X2, Ha: X1>X2

Independent sample t-test

Hypothesis test has 2 process 2. test mean difference If sample size ≥ 30, ใช� z test ได� Z = mean1 – mean2

√ σ2/n1 + σ2/n2 ในทางปฏบ�ตใช� sd แทน σ

Independent –sample t-test

If σ12 = σ2

2

t= mean1- mean2

√sp 2 (1/n1 +1/n2)

Df= n1 +n2-2

sp2 = ความแปรปรวนร�วม (pooled variance)

Sp2 = (n1 -1)s1

2 + (n2 -1) s22

n1 + n2 -2

Independent –sample t-test

If σ12 ≠ σ2

2

t= mean1- mean2

√s12/n1 +s2

2/n2

Df= (s2/n1 +s2/n2)

(s12/n1)2 /n1 + (s2

2/n2)2 /n2

Independent –sample t-test

T-test in practical point T-test can use in any sample if sample

recruitment from random sampling. T-test is more practical use than Z-test,

because we don’t know σ, so we use sd instead of σ.

If n1=n2, can use Sp without F –test before except n1≠ n2.

3. ประชากร 2 กล��มท$!ไม�เป�นอสระต�อก�น

ประชากรท�2งสองกล��มม$ความส�มพ�นธ ก�น หร,อใกล�เค$ยงก�นมาก เช�น การว�ดผลซ42า สาม$ภรยา ฝาแฝด ก�อนและหล�งการทดลอง เป�นต�น

สถตท$!เล,อกใช� ค,อ dependent t-test t = đ/ Sđ =đ/ Sd/√n ______________________

đ = ∑ d/n, Sd =√n∑d2 –(∑d)2/n(n-1)

Df = n-1 d = ความแตกต�างระหว�างคะแนนแต�ค�� n = แทนจ4านวนค��

3. ประชากร 2 กล��มท$!ไม�เป�นอสระต�อก�น

หร,อเข$ยนส�ตรใหม�ได�ด�งน$2 t = ∑ d / √n∑d2 –(∑d)2/n(n-1) Df = n-1 d = ความแตกต�างระหว�างคะแนนแต�ค�� n = แทนจ4านวนค��

3. ประชากร 2 กล��มท$!ไม�เป�นอสระต�อก�น

การแปลความ ถ�าค�าท$ ท$!ค4านวณตกอย��ในขอบเขตวกฤต จะปฏเสธ

Ho ยอมร�บ Ha => ผลการทดสอบระหว�างก�อนและหล�งทดลองแตก

ต�างก�นอย�างม$น�ยส4าค�ญทางสถตท$!ระด�บ... ถ�าค�าท$ ท$!ค4านวณตกอย��นอกขอบเขตวกฤต จะปฏเสธ

Ha ยอมร�บ Ho => ผลการทดสอบระหว�างก�อนและหล�งทดลองแตก

ต�างก�นอย�างไม�ม$น�ยส4าค�ญทางสถต

Interpretations จากการค4านวณด�วยโปรแกรมคอมพวเตอร

การทดสอบสองทาง การทดสอบทางเด�ยวAccept Ho if sig.≥ α Accept Ho if sig./2 ≥ α

Reject Ho if sig.< α Reject Ho if sig./2 < α

Note:ค�า sig. ได)มาจากการค'านวณด)วยโปรแกรม spss

การทดสอบความแตกต�างระหว�างส�ดส�วน(Testing the difference between two proportions) เช�น การเปร$ยบเท$ยบส�ดส�วนของผ��ท$!ด,!มส�ราแล�วเป�น

มะเร7งต�บก�บผ��ท$!ไม�ได�ด,!มส�ราแล�วเป�นมะเร7งต�บ เปร$ยบเท$ยบจ4านวนน�กเร$ยนท$!เร$ยนพเศษแล�วสอบเข�า

มหาวทยาล�ยได�ก�บน�กเร$ยนท$!ไม�ได�เร$ยนพเศษแล�วสอบเข�ามหาวทยาล�ยได�

ส�ตรการทดสอบ

Z = p1- p2 /√pq(1/n1 +1/n2)

การทดสอบความแตกต�างระหว�างส�ดส�วน(Testing the difference between two proportions)

Z = p1- p2 /√PQ(1/n1 +1/n2)

p1 = f1/n1 p2 = f2/n2

f1 , f2 = จ4านวนในกล��มต�วอย�างท$! 1 และ 2 ตามล4าด�บ n1,n2 = ขนาดกล��มต�วอย�างท$! 1 และ 2 ตามล4าด�บ P= f1+f2 / n1 +n2

Q=1-P Usually use if n ≥ 30

การทดสอบความแตกต�างระหว�างส�ดส�วน(Testing the difference between two proportions) Set α level Calculation z from z test format Open z value from table Compare z test and z value Summary if z test sit beyond the accept

region = reject Ho and accept Ha. If not = contrary result

การทดสอบไค-สแควร (chi-square test)

ล�กษณะข)อม*ลส'าหร�บการทดสอบด)วยไค-สแคว.

ประชากรไม�ม�การแจกแจงแบบปกต� (normal distribution)

ประชากรม�การแจกแจงเป�นกล�ม ๆ ไม�ต�อเน4�อง (discrete data)

ว�เคราะห.ได)ท�5งข)อม*ลเช�งปร�มาณ (ช��ง ตวง ว�ดได) ) และเช�งคณภาพ (ความถ�� อ�นด�บท�� ล'าด�บช�5น)

การทดสอบไค-สแควร (chi-square test) General agreements ค�าส�งเกตต�องอย��ในเซลใดเซลหน !งเท�าน�2น แต�ละค�าของข�อม�ลเป�นอสระก�นจากข�อม�ลอ,!น ข�อม�ลท$!น4ามาวเคราะห เป�นความถ$! กรณ$ตาราง 2*2 ค�าความถ$!ในแต�ละเซลต�อง ≥ 5 ถ�า

ค�าความถ$! < 5 ควรใช� ความน�าจะเป�นแม�นตรงฟ;สเชอร (Fisher exact probability)

การทดสอบไค-สแควร (chi-square test)

General agreements กรณ$ตารางใหญ�กว�า 2*2 ถ�าความถ$!คาดหมายค�าใดค�าหน !งน�อยกว�า 1 หร,อความถ$!

คาดหมายท$!ม$ค�าน�อยกว�า 5 เกนร�อยละ 20 (หร,อเกนหน !งในห�าของจ4านวนช�องท�2งหมด) แล�วไม�ควรทดสอบด�วยสถตไคก4าล�งสอง

อย�างไรก7ตาม แนวทางการแก�ในกรณ$ท$!ค�าคาดหมายม$ค�าต4!าด�งกล�าว อาจท4าได�โดยการรวมประเภทหร,อกล��มท$!อย��ใกล�ก�นเข�าด�วยก�น เพ,!อให�ความถ$!คาดหมายม$ค�ามากข 2น แต�ในการสร�ปผลควรท4าด�วยความระม�ดระว�ง เพราะเม,!อกล��มรวมก�นแล�วความหมายเดมอาจเปล$!ยนไป

การทดสอบไค-สแควร (chi-square test) General agreements df ≥ 2 if df=1 ค�าความถ$!ของobserve data ≥ 10 กรณ$ df=1 ค�า X2 must be adjust

การทดสอบไค-สแควร (chi-square test)

การทดสอบท$!ใช�บ�อย การทดสอบข�อม�ลท$!ม$ 1 มต เป�นการทดสอบเท�ยบความเหม4อนหร4อความกลมกล4น

(The X2 one-variable case or Goodness of fit test or Test of goodness of fit or Single classification)

การทดสอบการเป�นอ�สระก�นของสองประชากร (The X2 test of independence or the X2 two variable case or X2 Independence test)

การทดสอบเท�ยบความเหม4อนหร4อความกลมกล4น (goodness of fit test) ทดสอบว�าประชากรม$ส�ดส�วนการแจกแจงของข�อม�ลใน

แต�ละกล��มเท�าก�นหร,อไม� ทดสอบว�าประชากรม$ส�ดส�วนการแจกแจงของข�อม�ลใน

แต�ละกล��มเป�นแบบ binomial distribution หร,อไม� ทดสอบว�าประชากรม�ส�ดส�วนการแจกแจงของข)อม*ล

ในแต�ละกล�มเป�นไปตามส�ดส�วนท��คาดไว)หร4อไม� บางสถาบ�นเร$ยก การวเคราะห แบบทางเด$ยว (one

way analysis)

การทดสอบไค-สแควร (chi-square test) Goodness of fit test ทดสอบว�าประชากรม�ส�ดส�วนการแจกแจงของ

ข)อม*ลในแต�ละกล�มเป�นไปตามส�ดส�วนท��คาดไว)หร4อไม�

Formula

χ 2 = ∑ (O – E)2 E

χ2 = The value of chi squareO = The observed valueE = The expected value∑ (O – E)2 = all the values of (O – E) squared then added together

ข�2นตอนการทดสอบเข$ยนสมมตฐาน NULL HYPOTHESIS: Ho ALTERNATIVE HYPOTHESIS:

Ha set the LEVEL OF SIGNIFICANCE.

ทดสอบว�าประชากรม�ส�ดส�วนการแจกแจงเท�าก�นหร4อไม� กล�มบร�ษ�ทผ*)ผล�ตรองเท)าก�ฬาต)องการทราบความน�ยม

ของประชาชนในจ�งหว�ดกรงเทพฯท��ม�ต�อแบรนด.ต�าง ๆ 6 ชน�ด โดยการส�มต�วอย�างน�กก�ฬาจ'านวน 1200 คน

แบรนด. A B C D E F รวม

จ'านวนน�กก�ฬา

270

130

160

260

280

200

1200

จ'านวนท��คาด

200

200

200

200

200

200

1200

สมมตต�ฐาน (hypothesis)

Ho: รองเท)าก�ฬาทกแบรนด.ได)ร�บความน�ยมจากน�กก�ฬาใน กทม เท�าก�น

Ha: รองเท)าก�ฬาทกแบรนด.ได)ร�บความน�ยมจากน�กก�ฬาใน กทม ไม�เท�าก�น

ค'านวณตามส*ตรแล)วเปร�ยบเท�ยบก�บค�าท��ได)จากการเป=ดตารางตามระด�บน�ยส'าค�ญทางสถ�ต�ท��ต�5งไว)

โดยกรณ� single classification df = k-1 , k = จ'านวนประเภทหร4อจ'านวนกล�ม แต�ถ)าเป�น test for independent , df = (r-1)(c-1)

r = จ'านวนแถว c = จ'านวนคอล�มน.

กรณ$ท$!ไม�ได�ให�ค�าความคาดหว�งมาให� ให�เอาผลรวมความถ$!หารด�วยจ4านวนประเภทหร,อ

จ4านวนพวก 270+130+160+260+ 280+200 =

1200/6=200

กรณ$ท$! 2 การทดสอบความเป�นอสระและล�กษณะข�อม�ล เป�นการทดสอบความส�มพ�นธ ระหว�างต�วแปรต�2งแต� 2

ต�วข 2นไปข�อม�ลท$!ได�ม�กเป�นนามบ�ญญ�ตหร,อความถ$! ส�ดส�วนหร,อร�อยละโดยต�วแปรแต�ละต�วแบ�งเป�นประเภทหร,อเป�นกล��มย�อยๆต�2งแต� 2 กล��มข 2นไป ม�กเป�นตาราง 2*2 2*3 หร,อ3*4 เป�นต�น

สมมตฐานท$!ต�2งได�แก� Ho ต�วแปรท�2งสองไม�ม$ความส�มพ�นธ ก�น Ha ต�วแปรท�2งสองม$ความส�มพ�นธ ก�น

ระด�บการศ�กษาต'�ากว�า ป. 4ป .4 - ป . 6ม.1 - ม.3ม.4 - ม.6ว�ทยาล�ย/มหาว�ทยาล�ย

ระด�บพฤต�กรรมการใช)สารฆ�าแมลงน)อยมาก (test score 0-10)น)อย (test score 11-20)ปานกลาง (test score 21-30)ส*ง (test score 31-40)ส*งมาก (test score 41-50)

อาย<2526-3536-45>45

ประสบการณ.การท'าเกษตรกรรม

<5 ป@6-10 ป@11-20 ป@21-30 ป@31-40 ป@>40 ป@

เพศชายหญ�ง

กรณ$ท$! 2 การทดสอบความเป�นอสระObserved Frequencies (O)

Post Codes

LE1 LE2 LE3 LE4 LE5 & LE6

Row Total

Old Industry

9 13 10 10 8 50

Food Industry

4 3 5 9 21 42

Column Total

13 16 15 19 29 92

(Note: that although there are 3 cells in the table that are not greater than 5, these are observed frequencies. It is only the expected frequencies that have

to be greater than 5.)

Work out the expected frequency.

Expected frequency = row total x column totalGrand total

Post Codes

LE1 LE2 LE3 LE4 LE5 & LE6

Row Total

Old Industry

7.07

Food Industry

Column Total

Eg: expected frequency for old industry in LE1 = (50 x 13) / 92 = 7.07

Post Codes

LE1 LE2 LE3 LE4 LE5 & LE6

Row Total

Old Industry

7.07 8.70 8.15 10.33 15.76 50

Food Industry

5.93 7.30 6.85 8.67 13.24 42

Column Total

13 16 15 19 29 92

For each of the cells calculate.

Post Codes

LE1 LE2 LE3 LE4 LE5 & LE6

Row Total

Old Industry

0.53

Food Industry

Column Total

Eg: Old industry in LE1 is (9 –7.07)2 / 7.07 = 0.53

(O – E)2

E

Post Codes

LE1 LE2 LE3 LE4 LE5 &L E6

Old Industry

0.53 2.13 0.42 0.01 3.82

Food Industry

0.63 2.54 0.50 0.01 4.55

Add up all of the above numbers to obtain the value for chi square: χ2 = 15.14.

Look up the significance tables. These will tell you whether to accept the null hypothesis or reject it.

The number of degrees of freedom to use is: the number of rows in the table minus 1, multiplied by the number of columns minus 1. This is (2-1) x (5-1) = 1 x 4 = 4 degrees of freedom.

We find that our answer of 15.14 is greater than the critical value of 9.49 (for 4 degrees of freedom and a significance level of 0.05) and so we reject the null hypothesis.

‘The distribution of old established industry and food processing industries is significantly

different.’

การทดสอบไค-สแควร (chi-square test) น4าค�าท$!ค�า X2 ท$!ค4านวณได�เปร$ยบเท$ยบก�บค�าท$!ได�จาก

การเป;ดตารางแล�วด�ว�าค�าท$!ค4านวณได�ตกอย��ในช�วงยอมร�บหร,อปฏเสธสมมตฐาน จากน�2นท4าการสร�ปผลท$!ได�

การทดสอบไค-สแควร (chi-square test) ข�อจดจ4า ค�าไคสแควร บอกเพ$ยงความส�มพ�นธ ระหว�าง

ต�วแปรเท�าน�2นไม�ได�บอกทศทางของความส�มพ�นธ ว�าตามก�นหร,อตรงก�นข�ามและไม�บอกขนาดของความส�มพ�นธ ว�ามากน�อยเพ$ยงใด

ระว�งอย�าแปลความเก�นจร�ง

การทดสอบไค-สแควร (chi-square test)

การทดสอบความเป�นอ�สระต�อก�น

วธ$การเล,อกต�2ง

เพศ พรรค บ�คคล ผสมรวม

ชาย 107 26 33

166

หญง217 62 65

344

รวม 324 88 98

510

จากข�อม�ลน$2 จงทดสอบท$!ระด�บ 00. 5 ว�าเพศก�บวธ$การเล,อกต�2งม$ความ

ส�มพ�นธ ก�นหร,อไม�

สมมต�ฐาน เพศก�บวธ$การเล,อกต�2ง ม$ความส�มพ�นธ ก�น (หร,อส�ดส�วนของวธ$การเล,อกต�2งในแต�ละเพศแตกต�างก�น)

ค4าส�!งCROSSTABS /TABLES=sex BY election /FORMAT= AVALUE TABLES /STATISTIC=CHISQ /CELLS=COUNT EXPECTED.จะได�ผลล�พธ ด�งต�อไปน$2

Chi-Square Tests

.451a 2 .798

.457 2 .796

.003 1 .958

510

Pearson Chi-Square

Likelihood Ratio

Linear-by-Linear Association

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)

0 cells (.0%) have expected count less than 5. The minimum expected countis 28.64.

a.

หมายเหต� จ4านวนเซลล ท$!ม$ค�าคาดหมายน�อยกว�า 5 ม$จ4านวน 0 เซลล โดยม$ค�าคาดหมายต4!าส�ดค,อ 2864

แปลว�าไม�ข�ดต�อเง,!อนไขของการทดสอบไคก4าล�งสอง

ค�าไคก4าล�งสองเท�าก�บ 0451 ระด�บข�2นความเสร$เท�าก�บ 2 และค�าพ$เท�าก�บ

0798 ซ !งม$ค�ามากกว�า 005. แปลว�าเพศก�บวธ$การเล,อกต�2งไม�ม$ความส�มพ�นธ ก�น หมายความว�า ส�ดส�วนของเพศชายและหญงในการเล,อกต�2งแบบพรรค บ�คคล และแบบผสม ไม�แตกต�างก�น

Contingency table 2*2

ต�วแปร 2 ต�ว แต�ละต�วแบ�งเป�น 2 ประเภท A, B, C, D ค,อความถ$!ท$!ได�จากการส�งเกต

N ค,อจ4านวนความถ$!ท� 2งหมด

X2 = N (AD - BC)2

(A+B)(C+D)(A+C)(B+D)

df=(r-1)(c-1)

A B A+B

C D C+D

A+C B+D N

Yates’ correlation

ในกรณ$ข�อม�ลท$!จะใช� X2 วเคราะห อย��ในร�ปตาราง 2*2 ซ !ง df=1 กล��มต�วอย�างต�องใหญ�พอโดยไม�ม$ค�าความถ$!ในช�องใดๆต4!ากว�า 10 ถ�าม$ช�องใดช�องหน !งม$ความถ$!น�อยกว�า 10 จะต�องม$การปร�บแก�ค�า X2 โดยใช� Yates’ correlation โดยเอา 0.5 ลบออกจาก [O-E] ท�กต�ว ม$ส�ตรการค4านวณด�งน$2

X2 = ∑{ ( [O-E]-0.5)2/ E }[O-E] หมายถ งการเอา O-E โดยไม�ตดลบ

Yates’ correlation

หร,อ X2 = N (I AD-BC I- N/2)2

(A+B)(A+C)(C+D)(B+D)

หร,ออาจใช�การรวมความถ$!น�อยๆเข�าด�วยก�นเป�นเซลเด$ยวก�น เช�น รวมเซล ไม�เห7นด�วยอย�างย!ง ก�บเซล ไม�เห7นด�วย เป�นเซลเด$ยวก�น

การวเคราะห ความแปรปรวน (Analysis of Variance) ใช�ก�บงานวจ�ยท$!ต�องการเปร$ยบเท$ยบผลเฉล$!ยระหว�าง

กล��มต�างๆท$!น4ามาศ กษาต�2งแต� 3 กล��มข 2นไป เทคนคการวเคราะห ม$ช,!อเร$ยกว�า การวเคราะห ความ

แปรปรวน หร,อ ANOVA ผ��คดค�นการวเคราะห ด�งกล�าวค,อ Sir Ronald Fisher

โดยเร!มใช�คร�2งแรกในงานวจ�ยด�านเกษตรกรรม จนเป�นท$!ได�ร�บความนยมแพร�หลายในศาสตร สาขาอ,!นๆ

การวเคราะห ความแปรปรวน (Analysis of Variance) เช�น การเปร$ยบเท$ยบผลส�มฤทธ?ทางการเร$ยนระหว�าง

น�กเร$ยนท$!ม$บดาประกอบอาช$พแตกต�างก�น 3 วชาช$พค,อ คร� น�กธ�รกจ เกษตรกร

จากต�วอย�างด�งกล�าว ถ�าใช�สถตค�าท$ในการทดสอบต�องท4าการทดสอบหลายคร�2ง และท4าให�เกดค�า type 1 error เพ!มข 2น ด�งน�2นจ งใช�การวเคราะห ด�วย ANOVA ในการทดสอบ

การวเคราะห ความแปรปรวน (Analysis of Variance)

ความเข�าใจพ,2นฐาน ความแปรปรวนระหว�างกล��ม (Between –groups

variance) เป�นค�าท$!แสดงความแตกต�างของค�าเฉล$!ยระหว�างกล��มต�วอย�าง ถ�าค�าเฉล$!ยแตกต�างก�นมากจะม$ความแปรปรวนระหว�างก�นมาก

ความแปรปรวนภายในกล��ม เป�นการแสดงให�เห7นว�าค�าคะแนนท$!ได�รวบรวมภายในแต�ละกล��มม$การกระจายมากหร,อน�อย ค�าท$!ค4านวณได�เร$ยกว�า ความคลาดเคล,!อน

การวเคราะห ความแปรปรวน (Analysis of Variance) Ho: μ1= μ2= ….=μk

Ha: μ1≠ μ2 ≠ …. ≠ μk

ส�ตรท$!ใช�ค,อ F-ratio =MSB/MSW แล�วน4ามาเปร$ยบเท$ยบก�บ ค�าเอฟท$!ได�จากการเป;ดตารางIf the value of the test statistic falls in the rejection region, then reject Ho; Otherwise accept Ho กรณ$ท$!กล��มต�วอย�างม$สองกล��ม (k=2) ค�า t=√F หร,อ

t2=F

การวเคราะห ความแปรปรวน (Analysis of Variance) General agreements ข�อม�ลต�องเป�นมาตราอ�นตรภาคหร,ออ�ตราส�วน กล��มต�วอย�างต�องมาจากประชากรท$!ม$การแจกแจง

อย�างปกต กล��มต�วอย�างต�องเป�นอสระจากก�น กล��มต�วอย�างต�องมาจากประชากรท$!ม$ความแปรปรวน

เท�าก�น

การวเคราะห ความแปรปรวน (Analysis of Variance) ส!งท$!ต�องค4านวณหาได�แก� Total sum of squares (sst) ซ !งจะน4าไปหา MSt

(Mean square total) Between- groups sum of squares (ssb) น4าไป

หา MSb Within- groups sum of squares (ssw ) น4าไปหา

MSw

การวเคราะห ความแปรปรวน (Analysis of Variance) การวเคราะห ความแปรปรวนม$หลายแบบ แต�ท$!ใช�ก�น

บ�อยๆ ได�แก� One-way analysis of variance Two-way analysis of variance

การวเคราะห ความแปรปรวน (Analysis of Variance) One-way analysis of variance เป�นการวเคราะห ความแปรปรวนแบบม$ 1 ต�วประกอบ

โดยท4าการวเคราะห จากกล��มต�วอย�างต�2งแต� 3 กล��มข 2นไป เพ,!อตรวจสอบว�า ต�วแปรอสระ 1 ต�วซ !งแบ�งออกเป�น k ประเภทจะส�งผลแตกต�างก�นหร,อไม� โดยม$กล��มต�วอย�าง k กล��ม โดย

ว�ธ�ว�เคราะห.ความแปรปรวนแบบจ'าแนกทางเด�ยวความหมายของส�ญล�กษณะท��ใช)

ส'าหร�บเร4�องน�5 เพ4�อ ความสะดวกในการค'านวณและการว�เคราะห. ม�ด�งน�5ส�ญล�กษณ. k ค4อ จ'านวนประชากรท��น'ามาทดสอบ ค4อ ค�าเฉล��ยประชากรท�� i, i = 1, 2, 3, …, ki

ni ค4อ จ'านวนต�วอย�างท��เล4อกจากประชากรท�� in ค4อ จ'านวนต�วอย�างท�5งหมดท��เล4อกมาจากทกประชากร

xij ค4อ ค�าส�งเกตท��ได)จากต�วอย�างท�� j ท��เล4อกมาจากT1

ค4อ ผลรวมของค�าส�งเกตจากต�วอย�างท��เล4อกมาจาก ค4อ ค�าเฉล��ยของค�าส�งเกตจากต�วอย�างท��เล4อกมาจากix

ประชากรท�� i , j = 1, 2, 3, …, ni

ประชากรท�� i

ประชากรท�� iT ค4อ ยอดรวมของค�าส�งเกตจากต�วอย�างท��เล4อกมาจาก ค4อ ค�าเฉล��ยของค�าส�งเกตจากต�วอย�างท��เล4อกมาจาก

ประชากรทกประชากร

ประชากรทกประชากรx

T ค4อ ยอดรวมของค�าส�งเกตจากต�วอย�าง ท��เล4อกมาจากประชากรทกประชากร

ค4อ ค�าเฉล��ยของค�าส�งเกตจากต�วอย�างท�� เล4อกมาจากประชากรทกประชากร

x

ประชากรท��1 2 3 … k

X11

X12

X13

.

.X1n1

X21

X22

X23

.

.X2n2

X31

X32

X33

.

.X3n3

………………

Xk1

Xk2

Xk3

.

.Xknk

รวม T1 T2 T3 … Tk T

เฉล��ย X1 X2 X3 … Xk X

ผลรวมก'าล�งสองเฉล��ยท�5งหมด (total mean square)เข�ยนแทนด)วยส�ญล�กษณ. MS (T) โดยท��

k

i

n

jijk

ii

i

n

Tx

nTdf

TSSTMS

1 1

22

1

1

1

)(

)()(

SS (T) ค4อ ผลรวมก'าล�งสองท�5งหมด

df (T) ค4อ องศาแห�งความเป�นอ�สระของท�5งหมด

(Total sum of square)

(total deree of freedom)

ผลรวมก'าล�งสองเฉล��ยระหว�างประชากร

เข�ยนแทนด)วยส�ญล�กษณ. MS(B) โดยท��

k

i i

i

n

T

n

T

kBdf

BSSBMS

1

22

1

1

)(

)()(

SS (B) ค4อ ผลรวมก'าล�งสองระหว�างประชากรdf (T) ค4อ องศาแห�งความเป�นอ�สระระหว�างประชากร

(between mean square)

(between sum of square)

(between degree of freedom) = k-1

ผลรวมก'าล�งสองเฉล��ยภายในประชากรเข�ยนแทนด)วยส�ญล�กษณะ MS(W) โดยท��

k

i

n

j

k

i i

iijk

ii

i

n

Tx

knWdf

WSSWMS

1 1 1

22

1

1

)(

)()(

SS (W) ค4อ ผลรวมก'าล�งสองภายในประชากรdf (W) ค4อ องศาแห�งความเป�นอ�สระของภายในประชากร

(within mean square)

(within sum of square)

(within degree of freedom) = n-k

ถ)าประชาท�5ง k ประชากรม�การแจกแจงปกต� ท��ม�ความแปรปรวนเท�าก�นแล)ว อ�ตราส�วน ม�การแจกแจงแบบ F (F-distribution) ท��ม�องศาความเป�นอ�สระ k-1 และ n-k

)(

)(

WMS

BMS

การแจกแจงแบบ F ม�ล�กษณะเป�นโค)งไม�สมมาตร (asymmetrical shape) ขอบเขตของการปฏ�เสธ

สมมต�ฐานว�างอย*�ทางขวาของโค)ง

ถ)าต)องการทดสอบสมมต�ฐานว�างท��ว�าค�าเฉล��ยของ ประชากรท�5ง k ประชากรไม�ม�ความแตกต�างก�นหร4อ ท��ระด�บน�ยส'าค�ญ

k ...: 3210

จะปฏ�เสธ Ho ถ)าอ�ตราส�วน ม�ค�ามากกว�าค�า F ท��อ�านได)จากตารางท��องศาแห�งความเป�นอ�สระของระหว�างประชากร และภายในประชากร

)(

)(

WMS

BMSF

1 2

โดยท��วๆ ไป การทดสอบสมมต�ฐานโดยว�ธ�ความแปรปรวน น�ยมเข�ยนอย*�ในร*ปตารางว�เคราะห.ความแปรปรวน ด�งน�5

การปฏ�เสธ Ho หร4อยอมร�บ H1

น�5 หมายความว�าม�ค�าเฉล��ยของประชากรอย�างน)อยหน��งประชากรท��แตกต�างจากค�าเฉล��ยของประชากรอ4�นๆ ท��เหล4อ

ตารางว�เคราะห.ความแปรปรวนแบบจ'าแนกทางเด�ยว สาเหตของ

ความแปรปรวน

องศาแห�งความเป�นอ�สระ(df)

ผลรวมก'าล�งสอง

(SS)

ผลรวมก'าล�งสองเฉล��ย(MS)

อ�ตราส�วนF

ระหว�างประชากรภายในประชากร

รวม

k-1

-nk-n1

k

i i

i

n

T

n

TBSS

1

22

)(

k

i

n

j

k

i i

iij

i

n

TXWSS

1 1 1

22)(

k

i

n

jij

i

n

TXTSS

1 1

22)(

1

)()(

k

BSSBMS

kn

WSSWMS

)()(

)(

)(

WMS

BMS

ใช�เม,!อ n ในแต�ละกล��มต�วอย�างไม�เท�าก�น ในทางปฏบ�ต ถ�าค�า n เท�าก�นก7ใช�ส�ตรน$2ได�

การวเคราะห ความแปรปรวน (Analysis of Variance)

การสร�ปความหมาย ถ�า ค�าเอฟท$!ค4านวณได�น�อยกว�าค�าเอฟท$!ได�จากตาราง

จะยอมร�บ Ho แสดงว�าต�วแปรท$!สนใจศ กษาไม�ท4าให�เกดผลแตกต�างก�นของกล��มต�างๆหร,อให�ผลคล�ายคล งก�น

ถ�า ค�าเอฟท$!ค4านวณได�มากกว�าค�าเอฟท$!ได�จากตารางจะปฏเสธ Ho แสดงว�าม$ค�าเฉล$!ยอย�างน�อย 1 ค��ท$!แตกต�างก�นอย�างม$น�ยส4าค�ญทางสถต ณ ระด�บ...ท$!ก4าหนด (α) ซ !งจะต�องทดสอบต�อไปว�าค�าเฉล$!ยค��ใดบ�างท$!ม$ความแตกต�างก�นด�วยการเปร$ยบเท$ยบพห�ค�ณ: Multiple comparison test

Test of the equality of several variances

การทดสอบความเท�าก�นของความแปรปรวนหลายๆต�ว การวเคราะห ความแปรปรวนม$ข�อตกลงเบ,2องต�นว�า กล��มต�วอย�างต�องมาจากประชากรท$!ม$ความแปรปรวนเท�า

ก�น ถ�ากล��มต�วอย�างม$จ4านวนเท�าก�นม�กไม�ค�อยเป�นป@ญหาแต�ถ�า

กล��มต�วอย�าง แต�ละกล��มม$ขนาดไม�เท�าก�น จ4าเป�นท$!จะต�องทดสอบความ

แปรปรวนก�อนท$!จะท4าการวเคราะห

Test of the equality of several variances

Ho: σ21 = σ2

2 = …= σ2k

Ha: σ21 ≠ σ2

2 ≠ … ≠ σ2k

Test Statistic: The Bartlett test statistic is designed to test for equality of variances across groups against the alternative that variances are unequal for at least two groups.

Test of the equality of several variances ส�ตรท$!ใช�ค,อ

si2 is the variance of the ith group,

N is the total sample size, Ni is the sample size of the i th group,

k is the number of groups, sp

2 is the pooled variance.

Test of the equality of several variances The pooled variance is a weighted average of

the group variances and is defined as:

ก4าหนดระด�บน�ยส4าค�ญท$! α

Test of the equality of several variances The variances are judged to be unequal if, where is the upper critical value of the

chi-square distribution with k - 1 degrees of freedom and a significance level of α .

จากตาราง Test of Homogeneity of Variances ถ�า . ม$ค�าเกนระด�บน�ยส4าค�ญท$!ก4าหนดแล�ว แปลว�าความแปรปรวนของประชากรไม�แตกต�างก�น ไม�เช�นน�2น แปลว�าความแปรปรวน

ของประชากรแตกต�างก�น

Test of Homogeneity of Variances

X

1.811 3 18 .181

Levene Statistic df1 df2 Sig.

ตาราง

ในท$!น$2ค�าพ$ค,อ Sig.=0.181 ซ !งม$ค�าเกนกว�าระด�บน�ยส4าค�ญ 0.05 ด�งน�2นจ งสร�ปว�าความแปรปรวนของประชากรไม�แตกต�างก�น

หล�กการทดสอบถ)าความแปรปรวนของประชากรแตกต�างก�น

แล)ว แปลว�าสถ�ต� ANOVA ไม�เหมาะสมท��จะน'ามา

ใช)ก�บข)อม*ลชดน�5 ควรเล4อกใช)ว�ธ�ไม�อ�งพาราม�เตอร.

(Nonparametric methods) ในท��น�5ความแปรปรวนของประชากรไม�แตก

ต�างก�น ด�งน�5น จ�งสามารถใช)สถ�ต� ANOVA ทดสอบ

ค�าเฉล��ยต�อไปได)ข�5นตอนต�อไปค4อ ให)พ�จารณาตาราง

ANOVA ด�งต�อไปน�5

จากตาราง ANOVA ถ�า Sig. ม$ค�าเกนระด�บน�ยส4าค�ญท$!ก4าหนดแล�ว แปลว�าค�าเฉล$!ยของประชากรไม�แตกต�างก�น ไม�เช�นน�2น แปลว�าค�า

เฉล$!ยของประชากรแตกต�างก�นอย�างน�อยหน !งค��

ANOVA

X

1931.167 3 643.722 5.180 .009

2236.833 18 124.269

4168.000 21

Between Groups

Within Groups

Total

Sum of Squares df Mean Square F Sig.

ตาราง

ในท$!น$2ค�าพ$ค,อ Sig. = 0.009 ซ !งม$ค�าไม�เกนกว�าระด�บน�ยส4าค�ญ 0.05 ด�งน�2น จ งสร�ป

ว�าค�าเฉล$!ยของประชากรแตกต�างก�นอย�างน�อยหน !งค��

ถ)าค�าเฉล��ยของประชากรไม�แตกต�างก�นแล)ว

ก9ยต�การทดสอบเพ�ยงเท�าน�5 แต�ในท��น�5ค�าเฉล��ยของประชากรแตกต�าง ด�งน�5นจ�งต)องตรวจสอบต�อไป โดย

จะด*ตาราง Multiple Comparisons ว�าม�ค�าเฉล��ยค*�

ใดบ)างท��แตกต�างก�น

การเปร$ยบเท$ยบพห�ค�ณ (multiple comparison test) เม,!อวเคราะห ความแปรปรวนแล�วพบว�า reject Ho but

accept Ha แสดงว�าม$ค�าเฉล$!ยอย�างน�อยหน !งค��ท$!ม$ความแตกต�างก�นอย�างม$น�ยส4าค�ญทางสถต แต�ไม�ทราบว�าเป�นค��ใด จ งม$การทดสอบความแตกต�างด�งกล�าวเพ,!อหาค4าตอบ

โดยการเปร$ยบเท$ยบพห�ค�ณซ !งม$หลายวธ$โดยใช�โปรแกรมส4าเร7จร�ป กล�มท�� กล�มท�� 11 ในกรณ$ท$!ม$ความแปรปรวนเท�าก�น ในกรณ$ท$!ม$ความแปรปรวนเท�าก�น

นยมใช�ค4าส�!ง นยมใช�ค4าส�!ง LSD, Duncan, Tukey, SheffeLSD, Duncan, Tukey, Sheffe กล�มท�� กล�มท�� 22 ในกรณ$ท$!ม$ความแปรปรวนต�างก�น จะในกรณ$ท$!ม$ความแปรปรวนต�างก�น จะ

ใช�ค4าส�!ง ใช�ค4าส�!ง Tamhane’s T2, Games-Howell, Tamhane’s T2, Games-Howell, Dunnett’s CDunnett’s C

Multiple comparison test: MCT

จ4านวนค��ท$!ต�องน4ามาเปร$ยบเท$ยบหาได�จากส�ตร

nC2 = n(n-1)/2

เช�น ม$ค�าเฉล$!ย 6 ค�า n= 6

nC2 = 6(6-1)/2 =30/2

จ4านวนค��ท$!ต�องน4ามาเปร$ยบเท$ยบเท�าก�บ 15 ค��

nC2 = จ4านวนค��ท� 2งหมด n = จ4านวนค�าเฉล$!ย

ท�2งหมด

Multiple comparison test: MCT

Scheffe method CVd = √ (k-1)(F*)(MSw)(2/n) K= จ4านวนกล��มต�วอย�าง F* = ค�า F ท$!เป;ดจากตาราง MSw = mean square within-groups ท$!ได�จากการ

วเคราะห ความแปรปรวน n= จ4านวนต�วอย�างในแต�ละกล��มต�วอย�าง ถ�าจ4านวนใน

แต�ละกล��มไม�เท�าก�น ต�องใช� (1/ni +1/nj ) แทน 2/n

ni and nj แทนจ4านวนต�วอย�างในกล��มท$! 1 และกล��มท$! 2 ท$!น4ามาเปร$ยบเท$ยบก�น

Multiple comparison test: MCT

Scheffe method ความแตกต�างระหว�างค�าเฉล$!ย 2ค�าใดๆจะม$น�ยส4าค�ญ

ทางสถตเม,!อ ค�าความแตกต�างม$ค�ามากกว�า CVd

X X1 X2 X3

X1 - A B*

X2 - - C

X3 - - -

Multiple comparison test: MCT

Tukey’s HSD (Honestly significance difference) HSD = qα √MSw/n

qα หาจากตาราง table percentage points of the studentized range

MSw =mean square within-group n= จ4านวนต�วอย�างในแต�ละกล��มต�วอย�าง จ4านวนใน

แต�ละกล��มต�องเท�าก�น

Multiple comparison test: MCT

การเป;ดตารางต�องทราบค�า df ของ MSw จ4านวนค�าเฉล$!ยท�2งหมด k ระด�บน�ยส4าค�ญทางสถต α ในทางปฏบ�ตนยมใช�โปรแกรมส4าเร7จร�ปแทน แต�ควร

ทราบท$!มาและความหมายในการใช�งานด�วย การทดสอบท�2งหลายท$!กล�าวมาเร$ยกว�า post hoc (posterior) test ซ !งเป�นแปลว�า to follow ตามหล�งการวเคราะห ความแปรปรวนน�!นเอง

Multiple Comparisons

Dependent Variable: X

Scheffe

7.3667 6.7502 .757 -13.4166 28.1499

-17.4000 7.0503 .146 -39.1074 4.3074

4.2000 6.7502 .942 -16.5833 24.9833

-7.3667 6.7502 .757 -28.1499 13.4166

-24.7667* 6.7502 .016 -45.5499 -3.9834

-3.1667 6.4361 .970 -22.9827 16.6494

17.4000 7.0503 .146 -4.3074 39.1074

24.7667* 6.7502 .016 3.9834 45.5499

21.6000* 6.7502 .040 .8167 42.3833

-4.2000 6.7502 .942 -24.9833 16.5833

3.1667 6.4361 .970 -16.6494 22.9827

-21.6000* 6.7502 .040 -42.3833 -.8167

(J) TYPE

2.00

3.00

4.00

1.00

3.00

4.00

1.00

2.00

4.00

1.00

2.00

3.00

(I) TYPE

1.00

2.00

3.00

4.00

Mean

Difference (I-J) Std. Error Sig. Lower Bound Upper Bound

95% Confidence Interval

The mean difference is significant at the .05 level.*.

ตาราง Multiple

Comparisons ถ�าค�าเฉล$!ยของประชากรแตกต�างก�นแล�ว จะม$

ส�ญล�กษณ "*" ปรากฏอย��ท$!ม�มขวาบนของ

ผลต�างในท$!น$2เล,อกใช�สถต Scheffe และเล,อก

ระด�บน�ยส4าค�ญทางสถตท$! 005.

ปรากฏว�าค��ท$!ม$ความแตกต�างก�นม$สองค��ค,อ แบบท$! 2 ก�บ

แบบท$! 3 และ แบบท$! 3 ก�บแบบท$! 4

ตาราง Homogeneous SubsetsX

Scheffea,b

6 64.8333

6 68.0000

5 72.2000 72.2000

5 89.6000

.757 .122

TYPE

2.00

4.00

1.00

3.00

Sig.

N 1 2

Subset for alpha = .05

Means for groups in homogeneous subsets are displayed.

Uses Harmonic Mean Sample Size = 5.455.a.

The group sizes are unequal. The harmonic mean of the group sizesis used. Type I error levels are not guaranteed.

b.

ค�าเฉล$!ยท$!ไม�แตกต�างก�นอย�างม$น�ยส4าค�ญ โปรแกรม

จะจ�ดให�อย��ในเซตเด$ยวก�น ในท$!น$2โปรแกรมจ�ดได� 2 เซตย�อยค,อ

เซตท$! 1 ม$ 3 กล��มประกอบด�วย

แบบท$! 2 แบบท$! 4และแบบท$! 1

เซตท$! 2 ม$ 2 กล��มประกอบด�วย

แบบท$! 1 และแบบท$! 3

แบบท$! 1 อย��ท� 2งในเซตท$! 1และ

เซตท$! 2

การวเคราะห ความแปรปรวนแบบว�ดซ42าชนดม$ 1 ต�วประกอบ (one-way analysis of variance: repeated measures)

ใช�ในการวจ�ยเชงทดลองโดยม$กล��มต�วอย�างได�ร�บสภาพการทดลองหลายอย�าง หร,อม$กล��มต�วอย�าง k กล��ม (k≥3) โดยกล��มต�วอย�างแต�ละกล��มไม�เป�นอสระจากก�น (dependent samples)คนท�� สภาพการณ.ทดลอง (ต�วแปรอ�สระ)

ผลการทดลองท$!1

ผลการทดลองท$! 2

ผลการทดลองท$! 3

การวเคราะห ความแปรปรวนแบบว�ดซ42าชนดม$ 1 ต�วประกอบ (one-way analysis of variance: repeated measures)

ส�ตรท$!ใช� F= MS treat/ MS res MS treat =ค�าความแปรปรวนของส!งทดลอง MS res= ค�าความแปรปรวนของส�วนท$!เหล,อ (ความค

ลาดเคล,!อน) MS treat= SS treat/df treat MS res= SS res/df res

การวเคราะห ความแปรปรวนแบบว�ดซ42าชนดม$ 1 ต�วประกอบ (one-way analysis of variance: repeated measures)

1. G2 /kn 2. ∑∑X2 3. (∑Tj2

)/n 4. (∑Pi2

)/k

Source of variation

SS df

Between gr. SSb=4-1 df b=n-1

Within gr. SSw=2-4 df w=n(k-1)

Treatments SStreat=3-1 df treat=k-1

Residual SSres=2-3-4+1 df res=(n-1) (k-1)

Total SStotal=2-1 df total=kn-1

การวเคราะห ความแปรปรวนแบบว�ดซ42าชนดม$ 1 ต�วประกอบ (one-way analysis of variance: repeated measures)

G2 =ผลรมมของคะแนนท�2งหมดยกก4าล�งสอง k= จ4านวนส!งทดลอง หร,อจ4านวนค�าต�วแปรอสระ N= จ4านวนคน ∑∑X2 = ผลรวมของคะแนนแต�ละต�วยกก4าล�งสองท�กต�ว

ในท�กสภาพการณ การทดลอง ∑Tj

2 = ผลรวมของผลรวมของคะแนนแต�ละคอล�มน ยกก4าล�งสอง

Tj2 = ผลรวมของคะแนนแต�ละคอล�มน ยกก4าล�งสอง

∑Pi2 = ผลรวมของผลรวมของคะแนนแต�ละแถวยกก4าล�ง

สอง Pi

2 = ผลรวมของคะแนนแต�ละแถวยกก4าล�งสอง

การวเคราะห ความแปรปรวนแบบว�ดซ42าชนดม$ 1 ต�วประกอบ (one-way analysis of variance: repeated measures)

การแปรความ ถ�าค�าเอฟค4านวณมากกว�าค�าเอฟจากตาราง ให�ปฏเสธ

Ho และยอมร�บ Ha ซ !งต�องท4าการเปร$ยบเท$ยบแบบพห�ค�ณต�อไปว�าม$ค��ใดบ�างท$!แตกต�างก�นอย�างม$น�ยส4าค�ญทางสถต

Two way analysis of variance

Two way anova

2 ต�วแปรอสระ 1 ต�วแปรตาม ทดสอบความแตกต�างของค�าเฉล$!ยและปฏส�มพ�นธ

Two way anova

ส�ตรท$!ใช� การเปร$ยบเท$ยบผลต�างระหว�าต�วแปรทางแถว

เป�นการทดสอบต�วแปรอสระต�วท$! 1 F= MSR/MSE การเปร$ยบเท$ยบผลต�างระหว�าต�วแปรทางคอล�มน

เป�นการทดสอบต�วแปรอสระต�วท$! 2 F= MSC/MSE

Two way anova

ส�ตรท$!ใช� การเปร$ยบเท$ยบผลของปฏส�มพ�นธ ระหว�างต�วแปร

ทางแถวและทางคอล�มน เป�นการทดสอบผลร�วมก�นของต�วแปรอสระต�วท$! 1และ 2

F= MS(RC)/MSE การหา MSR, MSC, MS(RC), MSE ต�องหา SST,

SSR, SSC, SS(RC)

Source of variation

df SS MS F

Factor A r-1 SSR SSR/r-1 MSR/MSE

Factor B c-1 SSC MSC=SSC/c-1

MSC/MSE

interaction (r-1)(c-1) SS(RC) MS(RC)=SS(RC)/(r-1)(c-1)

MS(RC)/MSE

error rc(n-1) SSE=SST-SSR-SSC-

SS(RC)

MSE=SSE/rc(n-1)

total rcn-1 SST

ต�วอย�างการว�เคราะห.ความแปรปรวนสองทาง

Source DF SS MS F PFactor A 2 6100 3050 1.38 0.299Factor B 2 45300 22650 10.27 0.005Interaction 4 11200 2800 1.27 0.35Error 9 19850 2206Total 17 82450

ต�วอย�างการว�เคราะห.ความแปรปรวนสองทาง การแปลความ If F calculated >F table: reject Ho, Accept Ha ในกรณ$การด�ปฏส�มพ�นธ ถ�า ปฏเสธสมมตฐานว�าง

แสดงว�าผลต�างท$!เกดข 2นเกดจากต�วแปรอสระท�2งสองร�วมก�น ไม�ใช�จากต�วแปรต�วหน !งต�วใด เราเร$ยกว�า ต�วแปรท�2งสองม$ปฏส�มพ�นธ ต�อก�น

Analysis of Covariance

เป�นการหาความแตกต�างของค�าเฉล$!ยระหว�างกล��มต�วอย�างต�2งแต� 2 กล��มข 2นไป

โดยต�วแปรตามจะม$เพ$ยง 1 ต�วอย��ในมาตราการว�ดระด�บ Interval หร,อ Ratio Scale

ต�วแปรอสระต�2งแต� 1 ต�วข 2นไปอย��ในมาตราการว�ดระด�บ Nominal Scale และต�วแปรร�วมต�2งแต� 1 ต�วข 2นไปอย��ในมาตราการว�ดระด�บ Interval หร,อ Ratio Scale

Analysis of Covariance

ถ�าวเคราะห ก�บต�วแปรอสระ 1 ต�ว เร$ยกว�า One-way ANCOVA

ถ�าวเคราะห ก�บต�วแปรอสระ 2 ต�ว เร$ยกว�า Two-way ANCOVA

ถ�าวเคราะห ก�บต�วแปรอสระ 3 ต�ว เร$ยกว�า Three-way ANCOVA ฯลฯ

Factorial ANOVA

เป�นค4าท$!ใช�เร$ยกสถตในกล��มของการวเคราะห ความแปรปรวน ท�2ง ANOVA, ANCOVA และ Repeated Measure ท$!ม$ต�วแปรอสระต�2งแต� 2 ต�วข 2นไป

การหาความส�มพ�นธ. และการถดถอยเบ45องต)นสหส�มพ�นธ (correlation) เป�นสถตท$!ใช�หาความส�มพ�นธ

ระหว�างต�วแปรหร,อข�อม�ลโดยท$!ข�อม�ลด�งกล�าวได�จากส!งเด$ยวก�นเป�นค��ๆ เช�นความส�มพ�นธ ระหว�างระด�บสตป@ญญาของค��แฝด

สหส�มพ�นธ ต�องพจารณาด�งน$2 ข�อม�ลท$!จะหาความส�มพ�นธ อย��ในมาตราใด nominal

ordinal or interval, etc Distribution of data; linear or others Continuous or Discrete

สหส�มพ�นธ วธ$ท$!นยมใช�ได�แก� Pearson product-moment

correlation coefficient ใช�ในกรณ$ท$!ข�อม�ลเป�น อ�นตรภาค หร,ออ�ตราส�วน

ส�วนข�อม�ลนามบ�ญญ�ต จะใช� ไคแสควร ส�วนข�อม�ลอ�นด�บจะใช� Spearman rank-order

correlation coefficient

แผนภาพการกระจาย (scatter diagram)

Positive correlationNegative correlationCurvi-linear correlationperfect positive

correlationno correlation

ค�าส�มประส�ทธ�Bสหส�มพ�นธ. (corrrelation coefficiency)

เป�นค�าท��บอกระด�บความส�มพ�นธ. และท�ศทางความส�มพ�นธ.ระหว�างต�วแปร 2 ต�วแปร ท��การแจกแจงแบบปรกต� ซ��งให)ความช�ดเจนมากกว�าการใช)แผนภาพการกระจาย

ส�มประสทธ?สหส�มพ�นธ เพ$ยร ส�น เป�นการหาความส�มพ�นธ ระหว�างต�วแปร 2 ต�วท$!อย��ใน

มาตราการว�ดระด�บ Interval หร,อ Ratio Scale ค�าท$!ได�เร$ยกว�า "ส�มประสทธ?สหส�มพ�นธ " โดยปกตจะม$

ค�าอย��ระหว�าง -1.00 ถ ง 1.00

ส�มประสทธ?สหส�มพ�นธ เพ$ยร ส�น r xy =∑xy/ √ ∑x2 y 2

r xy ส�มประสทธ?สหส�มพ�นธ X คะแนนเบ$!ยงเบน(x-mean) ของคะแนนช�ด X y คะแนนเบ$!ยงเบน (y-mean) ของคะแนนช�ด y

การแปลความ ถ�าค�าอาร เข�าใกล� 1 ถ,อว�าม$ความส�มพ�นธ ก�นมาก เช�น

.7-.9 ถ�าค�าอาร เข�าใกล� 0.5 ถ,อว�าม$ความส�มพ�นธ ก�นปาน

กลาง เช�น .3-.7 ถ�าค�าอาร เข�าใกล� 0.00 ถ,อว�าม$ความส�มพ�นธ น�อย เช�น

น�อยกว�า.3 ถ�าค�าอาร เท�าก�บ 0.00 ถ,อว�าม$ความส�มพ�นธ ก�น อย�างไรก7ตามควรม$การทดสอบค�า r ด�วยว�าม$น�ยส�ญ

หร,อไม�ซ !งท4าได�โดยใช�การทดสอบค�าท$ (t-test)

การทดสอบค�า r t = r√N-2

√1-r2

N ค,อจ4านวนข�อม�ลท�2วหมดหร,อจ4านวนคน เป;ดตาราง t โดยใช� df= N-2 If t calculate ≥ t table → significant

correlation

Spearman Rank Correlation

เป�นการหาความส�มพ�นธ ระหว�างต�วแปร 2 ต�วท$!อย��ในมาตราการว�ดระด�บ Ordinal Scale โดยปกตจะม$ค�าอย��ระหว�าง -1.00 ถ ง 1.00

ถ�าม$ค�าตดลบหมายความว�า ต�วแปร 2 ต�วม$ความส�มพ�นธ ในทศทางตรงก�นข�าม

ถ�าม$ค�าเป�นบวกหมายความว�า ต�วแปร 2 ต�วม$ความส�มพ�นธ ในทศทางเด$ยวก�น

ถ�าม$ค�าเป�น 0 หมายความว�าต�วแปร 2 ต�วไม�ม$ความส�มพ�นธ

การว�เคราะห.การถดถอยอย�างง�ายการว�เคราะห.การถดถอยอย�างง�าย

(Simple Linear Regression )

Regression line

เป�นเส�นท$!สร�างข 2นเพ,!อพยากรณ ค�าต�วแปรหน !งจากอ$กต�วแปรหน !ง ก�อนสร�างเส�นถดถอยจะต�องทราบค�าส�มประสทธ?สหส�มพ�นธ ก�อนและทดสอบว�า ค�า r xy ท$!ได�ม$น�ยส4าค�ญทางสถตหร,อไม�

ต�วอย�าง บรษ�ทแห�งหน !งต�องการหาความส�มพ�นธ ระหว�างค�าโฆษณาก�บยอดขายจ งใช�ข�อม�ลค�าโฆษณาและยอดขายรายเด,อนของปCท$!ผ�านมาด�งน$2เด,อนท$! ค�าโฆษณา (แสนบาท) ยอดขาย (แสน

บาท)

123456789

101112

4.8

6.4

8

8.5

10.5

10

15

12

8

10

11.6

16

52

80

100

90

110

114

140

128

112

104

120

160

จากข�อม�ลสามารถสร�างแผนภาพการกระจายได�ด�งน$2

? x ?? ?? ?? ?? ?? ? ? ?

y

??? ??? ??? ??? ?? ?? ??

จากร*ป ท'าให)สามารถมองเห9นได)คร�าวๆว�าแผนภาพการกระจายระหว�าง 2 ต�วแปร ด*เหม4อนว�าจะม�ความส�มพ�นธ.ก�นในเช�งเส)นตรง และม�ท�ศทางส*งข�5นไป ด�งน�5น เราอาจจะสรปตรงน�5ได)ว�า ต�วแปร x (ค�าโฆษณา) และต�วแปร y (ยอดขาย ) ม�ความส�มพ�นธ.ก�น

x

ก4าหนดให� x และ y เป�นต�วแปรอสระและต�วแปรตาม ตามล4าด�บ จะสามารถเข$ยนร�ปแบบสมการถดถอยเชงเส�นอย�างง�ายท$!แสดงความส�มพ�นธ ระหว�างต�วแปรอสระ 1 ต�ว และต�วแปรตาม 1 ต�ว โดยอาศ�ยร�ปแบบสมการเส�นตรง

ทางคณตศาสตร ด�งน$2

ibxa ˆ y

โดยท$! a เป�น ค�าระยะต�ดแกน y (y-intercept)

ค,อ ค�าท$!เส�นตรงต�ดแกน y หร,อ ค�า y

เม,!อ x = 0 น�!นเอง b เป�น ค�าความช�น (slope) ของเส�นตรง ค,อ ค�าแสดงให�ทราบว�าเม,!อ x ม$ค�าเปล$!ยน

ไป 1

หน�วย y จะเปล$!ยนไปโดยเฉล$!ยเท�าใดหร,อ

เร$ยกค�าน$2ว�า ส�มประสทธ?ความถดถอย (regression coefficient)

ถ�า ถ�า bb ม$ค�าเป�นบวก หร,อม$ค�าเป�นบวก หร,อมากกว�า มากกว�า 0 0 หมายความว�าหมายความว�า

xx และ และ yy ม$ความส�มพ�นธ ไปในทศทางม$ความส�มพ�นธ ไปในทศทางเด$ยวก�นเด$ยวก�น

ถ�า ถ�า bb ม$ค�าเป�นลบ หร,อน�อยม$ค�าเป�นลบ หร,อน�อยกว�า กว�า 0 0 หมายความว�าหมายความว�า

xx และ และ yy ม$ความส�มพ�นธ ไปในทศทางตรงก�นข�ามม$ความส�มพ�นธ ไปในทศทางตรงก�นข�าม

ถ)า ถ)า bb ม�ค�าเท�าก�บ ม�ค�าเท�าก�บ 0 0 หมายความว�าหมายความว�า

การเปล��ยนแปลงของการเปล��ยนแปลงของ yy ไม�ข�5นก�บการเปล��ยนแปลงของไม�ข�5นก�บการเปล��ยนแปลงของ xx

ความคลาดเคล,!อนมาตรฐานในการพยากรณ (Standard error of estimate) ถ�าข�อม�ลสองช�ดท$!น4ามาหาความส�มพ�นธ ก�นน�2นคล�อยตาม

ก�นไม�เป�นเส�นตรง (r xy ≠ 1) จะท4าให�การพยากรณ ม$ความคลาดเคล,!อน

ถ�า r xy ม$ค�าส�ง ความคลาดเคล,!อนจะน�อยแต�ถ�าตรงก�นข�ามจะม$ความคลาดเคล,!อนมาก ซ !งค4านวณได�จาก

กรณ$พยากรณ Yเม,!อทราบค�า Xใช� ส�ตร Syx =Sy √1-r2

กรณ$พยากรณ X เม,!อทราบค�า Yใช� ส�ตร Sxy =Sx √1-r2

If r xy =1 , Standard error of estimate=0

Summary Table of Statistical Tests

Level of Measureme

nt

Sample Characteristics Correlation

1 Sample

2 Sample K Sample (i.e., >2)

Independent Dependent

Independent Dependent

Categorical or Nominal

Χ2 or bi-

nomial

Χ2 Macnarmar’s Χ2

Χ2 Cochran’s Q

 

Rank or Ordinal

  Mann Whitney U

‘U-test’

Wilcoxin Matched

Pairs Signed Ranks

Kruskal Wallis H‘H-test’

Friendman’s ANOVA

Spearman’s rho

Parametric (Interval &

Ratio)

z test or t test

t test between groups

t test within groups

1 way ANOVA between groups

1 way ANOVA

(within or repeated measure)

Pearson’s r

Factorial (2 way) ANOVA   

Advantages of Nonparametric Tests

Probability statements obtained from most nonparametric statistics are exact probabilities, regardless of the shape of the population distribution from which the random sample was drawn

If sample sizes as small as N=6 are used, there is no alternative to using a nonparametric test

Siegel, 1956

Advantages of Nonparametric Tests

Treat samples made up of observations from several different populations.

Can treat data which are inherently in ranks as well as data whose seemingly numerical scores have the strength in ranks

They are available to treat data which are classificatory

Easier to learn and apply than parametric tests

Siegel, 1956

Criticisms of Nonparametric Procedures Losing precision/wasteful of data Low power False sense of security Lack of software Testing distributions only

Power of a Test

Statistical power – probability of rejecting the null hypothesis when it is in fact false and should be rejected Power of parametric tests – calculated from

formula, tables, and graphs based on their underlying distribution

Power of nonparametric tests – less straightforward; calculated using Monte Carlo simulation methods

Some Commonly Used Statistical Tests

Normal theory based test

Corresponding nonparametric

test Purpose of test

t test for independentsamples

- Mann Whitney U test; - Wilcoxon rank sum

test

Compares two independent

samples

Paired t test Wilcoxon matche

- d pairs signed ranktest

Examines a set ofdifferences

Pearson correlationcoefficient

Spearman’s rank correlationcoefficient

Assesses the linear association betwe

en two variables.

One way analysis of variance (F test)

- Kruskal Wallis analysis of

variance by ranks

Compares three or more groups

Two way analysis ofvariance

Friedman Two wa y analysis of variance

Compares groups classified by two d

ifferent factors

Recommended