12
6. การแจกแจงแบบปกติ (Normal Distribution) โดยทั่วไป การแจกแจงของตัวแปรที่ต่อเนื่องกันที่สาคัญที่สุด ได้แก่ การแจกแจงปกติ และ ทฤษฎีต่างๆในทางสถิติมักตั ้งอยู่บนพื ้นฐาน ของการแจกแจงแบบนี ้ ลักษณะกราฟของการแจกแจง ปกติ เรียกว่า เส้นโค้งปกติมีลักษณะเป็นรูประฆังที่สมมาตร มีความโค้งพอดี ตัวแปรสุ่ม ที่มีลักษณะเป็นการแจกแจงปกตินี เรียกว่า ตัวแปรสุ่มปกติ (Normal Random Variable) มีรูปแบบคือ 2 2 1 2 2 1 , , X e x f ; X โดยที , , และ e ต่างเป็นค่าคงที(Constant) เมื่อ 14159 . 3 , 71828 . 2 e ถ้า เป็นตัวแปรสุ่มที่มีการแจกแจงปกติ มีมัชฌิมเลขคณิตเท่ากับ ความแปรปรวนเท่ากับ 2 เราใช้สัญลักษณ์ ) , ( ~ 2 แทน เราสามารถหาค่าของ ) ( x f ได้ทุกๆค่าของ ที่เป็น เลขจานวนจริง Example ถ้า เป็นการแจกแจงปกติเป็น มีมัชฌิมเลขคณิตเป็น 50 และส่วนเบี่ยงเบนมาตรฐาน เป็น 5 นั่นคือ ) 25 , 50 ( ~ และ 2 2 1 2 2 1 X e x f ; X 2 5 50 2 1 2 5 1 X e ; X จากสมการนี ้เราสามารถคานวณค่า ) ( x f ได้ทุกค่าของ ที่เป็นเลขจานวนจริง และนามาวาด รูปเป็นรูปกราฟเส้นโค้งได้

6. การแจกแจงแบบปกติ Normal Distribution)pattranuch.yolasite.com/resources/ECS232/6. stat.pdfและจะกระจายลดน อยลงไปทางค

Embed Size (px)

Citation preview

6. การแจกแจงแบบปกต (Normal Distribution) โดยทวไป การแจกแจงของตวแปรทตอเนองกนทส าคญทสด ไดแก การแจกแจงปกต และทฤษฎตางๆในทางสถตมกตงอยบนพนฐาน ของการแจกแจงแบบน ลกษณะกราฟของการแจกแจงปกต เรยกวา เสนโคงปกตมลกษณะเปนรประฆงทสมมาตร มความโคงพอด

ตวแปรสม ทมลกษณะเปนการแจกแจงปกตน เรยกวา ตวแปรสมปกต (Normal Random Variable)

มรปแบบคอ

2

2

1

22

1,,

X

exf ; X

โดยท ,, และ e ตางเปนคาคงท (Constant) เมอ 14159.3 , 71828.2e

ถา เปนตวแปรสมทมการแจกแจงปกต มมชฌมเลขคณตเทากบ ความแปรปรวนเทากบ 2 เราใชสญลกษณ ),(~ 2 แทน เราสามารถหาคาของ )(xf ไดทกๆคาของ ทเปน

เลขจ านวนจรง Example ถา เปนการแจกแจงปกตเปน มมชฌมเลขคณตเปน 50 และสวนเบยงเบนมาตรฐานเปน 5 นนคอ )25,50(~

และ

2

2

1

22

1

X

exf ; X

2

5

50

2

1

25

1

X

e

; X

จากสมการนเราสามารถค านวณคา )(xf ไดทกคาของ ทเปนเลขจ านวนจรง และน ามาวาดรปเปนรปกราฟเสนโคงได

1 2

1 2

1

2

1

2

1 2

จากรปตอไปนแสดงถงเสนโคงในลกษณะตางๆ เชน

เสนโคงปกตทม 21 และ 21 จะมลกษณะเหมอนกนทกประการ ผดแตต าแหนงของจดยอดของรปทง สองรปอยตางกน

21

เสนโคงปกตทม 21 และ 21 ลกษณะของเสนทงสองจะแตกตางกน เสนโคงปกตทมสวนเบยงเบนมาตรฐานมากกวาจะมลกษณะทแบน และลาดต ากวาเสนโคงปกตทมสวนเบยงเบนมาตรฐานนอย แตต าแหนงของจดยอดอยทเดยวกน

เสนโคงปกตทม 21 และ 21 ต าแหนงของจดยอดอยตางกน และความโคงของเสนปกตของทงสองรปกตางกน จะเหนไดวา เสนโคงปกตจะมลกษณะโดงมาก หรอโดงนอย ขนอยกบสวนเบยงเบนมาตรฐานถาสวนเบยงเบนมาตรฐานใหญ เสนโคงจะมลกษณะโดงนอยกวา เสนโคงทมมาตรฐานเลก

6.1 คณสมบตของเสนโคงปกต 1. เสนโคงจะมความถสงอยทคามชฌมเลขคณต และจะกระจายลดนอยลงไปทางคาสง และคาต าอยางสม าเสมอ 2. เสนโคงจะมลกษณะสมมาตรท คงท คาออรดเนตของจด เมอ k เปนคาคงท จะเทากนเชน ความสงของเสนโคงทจด จะเทากบความสงของเสนโคงทจด จากความสมมาตรของเสนโคงนเองจะไดคา มชฌมเลขคณต มธยฐาน และฐานนยม มคาเทากบ (mean=median=mode) 3. เสนโคงปกตมลกษณะเปนรประฆง ปลายเสนโคงทงสองจะคอยๆลาดลงสแกนนอน แตไมมโอกาสจะสมผสกบแกนนอน พนทภายใตเสนโคงปกตทมคะแนนมาตรฐานมากกวา 3 หรอมคะแนนมาตรฐานนอยกวา 3 จะมคานอยมาก 6.2 ทฤษฎทส าคญเกยวกบการแจกแจงปกต ทฤษฎทเกยวของกบการแจกแจงปกตไดแก Theorem1 : ถา มการแจกแจงปกต ทมมชฌมเลขคณตเปน และสวนเบยงเบนมาตรฐานเปน แลว dc กจะมการแจกแจงปกตทมมชฌมเลขคณตเปน dc และสวนเบยงเบนมาตรฐาน c Theorem2 : ถา NXXX ,...,, 21 เปนตวแปรสมทเปนอสระ ทมมชฌมเลขคณตเปน และสวนเบยงเบนมาตรฐานเปน ),...,2,1( Nii แลว NXXXS ...21 กจะมการแจกแจงปกตทมมชฌมเลขคณตเปน 1 และความแปรปรวน 2 Theorem3 : ถา 21, XX เปนตวแปรทเปนอสระตอกนและมการแจกแจงปกต โดยมมชฌมเลขคณตเปน 1 และสวนเบยงเบนมาตรฐานเปน )2,1( ii แลว 21 XXD กจะมการแจกแจงปกตทมมชฌมเลขคณตเปน 21 และความแปรปรวนเปน 2

2

2

1

6.3 พนทใตเสนโคงปกต เนองจาก ผลรวมของการทดลองสมตองเทากบหนง และพนทใตเสนโคงปกตทงหมดเหนอแกน มคาเทากบหนง ดงนนในการหาความนาจะเปนของตวแปรสมปกตใตอาจใชพนทภายใตเสนโคงปกตเปนตวแทนของตวแปรสมนน ดงนน พนทใตเสนโคงยอมขนอยกบคาของมชฌมเลขคณต และสวนเบยงเบนมาตรฐานของประชากรหมนนๆ ส าหรบตวแปรสม ซงเปนแบบ ),(~ 2 จะเหนไดวา

)( 21 dxedxxf

x2

1

2

1

2

2

1

2

1)(

เพอใหงายในการหาพนทใตเสนโคง ส าหรบทกๆคาของ และ ทเปลยนไปจงมการสรางตารางมาตรฐานของพนทใตเสนปกต (ดตาราง ) ซงแสดงถงพนทใตเสนโคงระหวาง 0 ถง

1 โดยท เปนคะแนนมาตรฐานทมการแจกแจงปกต ซงมคาเฉลย (mean) เทากบ 0 และสวนเบยงเบนมาตรฐานเทากบ 1 ตารางนจะใชไดกบขอมลทวๆไป ดงนนกอนทจะใชตารางน จงจ าเปนตองเปลยนขอมลดบทไดมาใหเปนคะแนนมาตรฐานเสยกอน โดยใชสตร

สวนเบยงเบนจากมชฌมเลขคณต สวนเบยงเบนมาตรฐาน

นนคอ x

y

y

p

p

ซงคาเฉลย (mean) และสวนเบยงเบนมาตรฐาน (standard deviation) ของ อาจหาไดดงน คอ

1

1

1 0

และ 2

z Var

Var

Var

2

1

VarVar 2

1

2

2

1

Definition การแจกแจงปกตแบบมาตรฐาน (Standard Normal Distribution) คอ การแจกแจงของตวแปรสมปกตทมมชฌมเลขคณต เปนศนย และสวนเบยงเบนมาตรฐาน เปนหนง ใชสญลกษณ 1,0~

ทจด ,

0

ทจด , 0 ทจด , 0

0 0 0 โดยทสวนโคงสมมาตร (symmetry) กนทจด ฉะนน จงไมจ าเปนตองสรางตารางทแสดงคา เปนลบไว เพราะขางท เปนบวกกใชไดส าหรบขางท เปนลบดวย

ตารางทสรางขน จะบอกคาพนทใตเสนโคงนบจาดจดมชฌมเลขคณต มายงจดทมคา ตรงทก าหนดให สมมตวาทจด ม 1 จากตารางอานพนทได 3413.0 พนทนคอ พนทลอมรอบดวยเสนโคงแกนนอนและเสนตรง 1 ดงรป หรอ 3413.010 นนเอง

นนคอ พนททงหมดทางขวามอ พนททงหมดทางซายมอ 5.0 ฉะนน 1 105.0

3413.05.0 8413.0 และ 1 105.0

3413.05.0 1587.0 ความนาจะเปนของ ทมคาอยระหวาง 1 และ 2 โดยท 1 และ

2 จะมคาเทากบความนาจะเปนของ ทตกอยระหวาง 1 และ 2

โดยท

1

1 และ

2

2

)( 21

21

)( 21 )0( 1 )0( 2 ถา 21 )( 21 )0(2 2

Example ถา X มการแจกแจงปกต ทมมชฌมเลขคณตเปน 3 และความแปรปรวนเปน 4 จงหาความนาจะเปนท X จะมคาอยระหวาง 3 และ 5 วธท า เพราะวา 4,3~ ตองการหา 53

เมอ 31 ,

1

1 , 2

33 0

เมอ 52 ,

2

2 , 2

35 1

ดงนน 53 )10( พนทระหวาง 0 และ 1

3413.0

6.4 การก าหนดระดบ (Grading) ในการพจารณาเปรยบเทยบคะแนนผลการสอบของนสตแตละคนในแตละกลม โดยการจดต าแหนงของคะแนน ก าหนดกลมของคะแนนเปนพวกๆ และใหระดบคะแนนในกลมนน เปนระดบคะแนน A,B,C,D หรอ E หรออาจแบงยอยเปนระดบ A,B+,B,C+,C,D+,D หรอ E สมมตใหการกระจายของคะแนนเปนแบบโคงปกต (ทมการกระจายเปนรประฆง) และมการใหระดบคะแนนเปน A,B,C,D หรอ E ขนแรกแบงการแจกแจงของโคงปกตนเปน 5 สวนเทาๆกน ตามแกนนอน (X) โดยท X แทนคะแนน โดยใหคะแนนสงสดของระดบ A มากกวาคาเฉลยอย 3 เทาของสวนเบยงเบนมาตรฐาน 3 และคะแนนต าสดของระดบ E นอยกวา คาเฉลยอย 3 เทาของสวนเบยงเบนมาตรฐาน 3 นนคอ 99.74 % ของคะแนนทงหมดจะอยภายใตในชอง 3 และ 3 (คะแนนสงสดของระดบ A ถงคะแนนต าสดของระดบ E จะกลมคะแนนทงหมดไวถง 99.74 % ) ดงรป

3 2 1 1 2 3 พสยของแตละเกรด (คะแนนสงสด-คะแนนต าสด) จะเทากบ 1.2 เทาของสวนเบยงเบนมาตรฐาน (6 เทาของสวนเบยงเบนมาตรฐาน ถกแบงออกเปน 5 สวนเทาๆ กนตามแนวแกน X) นนคอ ระดบ A คะแนนสงสด = 3 คะแนนต าสด = 8.1 ระดบ B คะแนนสงสด = 8.1 คะแนนต าสด = 6.0 ระดบ C คะแนนสงสด = 6.0 คะแนนต าสด = 6.0 ระดบ D คะแนนสงสด = 6.0 คะแนนต าสด = 8.1 ระดบ E คะแนนสงสด = 8.1 คะแนนต าสด = 0.3

Example สมมตวาคะแนนของการสอบวชาหนงมการแจกแจงเปนโคงปกตทมมชฌมเลขคณตเปน 65 และสวนเบยงเบนมาตรฐานเปน 15 จงหาคะแนนสงสดและคะแนนต าสดของผทไดคะแนนระดบ A,B,C,D หรอ E ระดบ A คะแนนสงสด = 110)153(65 คะแนนต าสด = 92)158.1(65 ระดบ B คะแนนสงสด = 92)158.1(65 คะแนนต าสด = 74)156.0(65 ระดบ C คะแนนสงสด = 74)156.0(65 คะแนนต าสด = 56)156.0(65 ระดบ D คะแนนสงสด = 56)156.0(65 คะแนนต าสด = 38)158.1(65 ระดบ E คะแนนสงสด = 38)158.1(65 คะแนนต าสด = 20)153(65 ในทางปฏบต การก าหนดระดบของคะแนนอาจท าไดหลายวธ เชน ควรจะก าหนดรอยละของผทไดระดบตางๆ กนดงน ระดบ A 5% ระดบ B+ 10% ระดบ B 15% ระดบ C+ 20% ระดบ C 30% ระดบ D+ 10% ระดบ D 8% ระดบ E 2% นนคอจะได ระดบ A - คะแนนต าสด 65.1 ระดบ B+ - คะแนนต าสด 04.1 ระดบ B - คะแนนต าสด 52.0 ระดบ C+ - คะแนนต าสด 0 ระดบ C - คะแนนต าสด 84.0 ระดบ D+ - คะแนนต าสด 28.1 ระดบ D - คะแนนต าสด 05.2

05.2 28.1 84.0 0 52.0 04.1 65.1 6.5 การประมาณคาของการแจกแจงทวนามโดยใชการแจกแจงปกต (Normal Approximation to the Binomial Distribution) เราทราบมาแลววา การแจกแจงทวนามทม 0 หรอ 0q จะไดรปเสนโคงเบเปนทางใดทางหนงถา 0 ละจ านวนการทดลองมากพอ จะไดรปเสนโคงทมลกษณะคลายคลงกบการแจกแจงพวซองเราจงประมาณคาของการแจกแจงทวนามโดยใชการแจกแจงพวซอง

ในกรณทการแจกแจงทวนาม ม 2

1p หรอ

2

1q เมอน ามาแสดงดวยแทงฮสโตแกรม

และเกลาเปนเสนโคง จะไดรปเสนทไมเบ เปนรประฆงทมสวนทงสองขางสมมาตรกน ดงนนเราอาจจะประมาณคาของการแจกแจงทวนามดวยการแจกแจงปกตได การประมาณคาของการแจกแจง

ทวนามดวยการแจกแจงปกต จะใชไดดเมอ 2

1p หรอ q

2

1 และ n มคามาก และแมวา n ม

คามาก และแมวา n จะไมโตนก แตถา p ไมเขาใกล 0 หรอ 1 จนเกนไป การประมาณคาของการแจกแจงทวนามดวยการแจกแจงปกตกยงใหผลดพอควร ประการส าคญกคอ ตวแปรสมของการแจกแจงทวนามเปนชนดไมตอเนองกน (Discrete Random Variable) เมอเราจะประมาณคาดวยการแจกแจงปกต เราจงตองปรบคาของตวแปรสมใหเปนตอเนองกน ทเรยกวา continuity correction เสยกอนโดยการพยายามขยายคาออกไปใหครอบคลมคาทตองการโดยทวไปเรามกจะน าคา 0.5 ไปบวกหรอลบออกจากคาทตองการ ความถกตองในการใชแจกแจงปกตประมาณคาแจกแจงทวนามนนขนอยกบคาของ n เปนส าคญ เมอ n ยงมคามาก คาทประมาณไดจะยงมคาใกลเคยงกบคาทหาได

จากทวนามโดยตรงมากขน แมวา p จะไมใกลกบ 2

1 ซงในการจะตดสนใจวาเราควรใชการแจกแจง

ปกต ประมาณคาของความนาจะเปนทไดจากการแจกแจงทวนามหรอไมนน เราอาจพจารณาคาของ np และ nq ถาคาทงสองนเกน 5 การประมาณคาความนาจะเปนแบบทวนามโดยใชการแจกแจงแบบปกต กจะใหผลด

ตวอยางท 1 ความนาจะเปนทนาย ก จะยงปนถกเปาในแตละนดเปน 0.4 ในการยงปนทงหมด 15 นด จงหา

ก. ความนาจะเปนทนาย ก. จะยงปนถกเปา 4 นด ข. ความนาจะเปนทนาย ก. จะยงปนถกเปา ตงแต 7 นด ถง 9 นด

วธท า การทดลองนเปนการทดลองแบบทวนามทม p = 0.4 , n=5

np 4.015 6

npq2 6.04.015 6.3

6.3 9.1

ให X เปนจ านวนครงทยงถกเปา

X อาจจะมคาเปน 0,1,2,…,15 พนททแรเงาคอพนททตองการหา

ก) 4 114

4

15 6.04.0C

1268.0 ประมาณคาโดยการใชการแจกแจงปกต 4 5.45.3~6.04.0

114

4

15 C

9.1

65.4

9.1

65.3

789.0316.1 0789.00316.1

2852.04062.0 1210.0

ข) 97

15159

76.04.0C

1515

6

0

15159

06.04.06.04.0 CC

= 0.9662-0.6098 = 0.3546

ประมาณคาโดยการใชการแจกแจงปกต

97

9.1

65.9

9.1

65.6~

842.1263.0 263.00842.10 = 0.4672-0.1036 = 0.3636

จะเหนไดวา ทง ก. และ ข. การประมาณคาของการแจกแจงทวนามโดยใชการแจกแจงปกตใหผลลพทใกลเคยงกนมาก

ตวอยางท 2 ทอดลกเตา 1 ลก 120 ครง จงหาความนาจะเปนทลกเตาจะขนหนา 6 นอยกวา 15 ครง

วธท า ให X เปนจ านวนครงทลกเตาขนหนา 6

X มการแจกแจงทวนาม ทม p 120,6

5,

6

1 nq

nq

6

1120 20

npq2

6

5

6

1120 67.16

2s 67.16 08.4

15

1206

5

6

112014

7X

xC

08.4

205.14

35.1

035.15.0

0885.0115.45.0

6.6 การประมาณคาของการแจกแจงพวซองโดยใชการแจกแจงปกต (Normal Approximation to the Poisson Distribution) พจารณาลกษณะของการแจกแจงพวซองเมอ มคาตางๆกน

1 2 5 10

Poisson distribution for selected values of ซงจะเหนวา เมอ 10 การแจกแจงปกตนนจะลกษณะเปนเสนโคงปกต และเนองจากในการแจกแจงแบบพวซอง 0p หรอ 0q ดงนนการท 10 กแสดงวา n ตองมคามก และเมอ n มคามาก เรากจะสามารถประมาณคาของการแจกแจงพวซองดวยการแจกแจงปกต เราจงตองปรบคาเชนเดยวกนกบการประมาณคาความนาจะเปนแบบทวนามทกลาวแลว

ตวอยางท 1 บรษทประกนชวตแหงหนงโดยเฉลยแลวในแตละวนจะมผโทรศพทเขามา 400 ครงจงหา

(ก) ความนาจะเปนทจะมผโทรศพทเขามา 450 ครง ในแตละวน (ข) ความนาจะเปนทจะมผโทรศพทไมนอยกวา 450 ครงในแตละวน (ค) ความนาจะเปนทจะมผโทรศพทไมเกน 380 ครงในแตละวน

วธท า ให X เปนจ านวนครงทจะมผโทรศพทเขามาในแตละวน 400,400~ 20,400 ก) 450 5.4505.449

20

4005.450

20

4005.449

525.2475.2 Z 525.20 Z 475.20 Z = 0.4942-0.4933=0.009 ข) 450 5.449

20

4005.449

475.2 Z = 0.5-0.4933 = 0.4942-0.4933 =0.009 = 0.0067 ค) 380 5.380

20

4005.380

975.0 Z = 0.5 0975.0 Z = 0.5-0.33525 = 0.16475