บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข...

Preview:

Citation preview

การเก็บรวบรวมและการวเิคราะหข์อ้มูล

ม ี 4 ขัน้ตอนในการเก็บรวบรวมขอ้มูล

1. การเก็บขอ้มูลดิบ (collection of raw data) 2. การระบุการแจกแจงทางสถิติ (identification of statistical distribut

ion) 3. การประมาณค่าของพารามเิตอร ์ (estimation of parameter)

4. การทดสอบค่าประมาณค่า (testing of estimator)

1. การเก็บขอ้มูลดิบ ในการเก็บขอ้มูลควรพจิารณาดังนี้

11. ทำาการวเิคราะหว์า่ขอ้มูลที่ถกูเลือกวา่พอแก่การทำาการจำาลองหรอืไม่

12. รวบรวมวา่เขา้พวกเป็นขอ้มูลชุดเดียวกัน แล้วทำาการตรวจสอบวา่เป็นอันหนึ่งอันเดียวกันหรอืไม่

13. ตรวจสอบวา่ตัวแปร 2 ตัวมคีวามสมัพนัธก์ันหรอืไม่ โดยการสรา้งแผนภาพการกระจาย (s catter diagram)

14. ความสมัพนัธข์องตัวแปรด้วยกันวา่มอีอโต้คอรเีรชัน่ (autocorrelation)

2. การระบุการแจกแจงทางสถิติ

ในการระบุการแจกแจงทางสถิติ ม ี การแจกแจงความถ ี่ (frequency distributi on) หรอื ฮิสโตแกรม (histogram) เพื่อดรููปรา่งของการกระจายหรอืการแจกแจง

การทำาฮิสโตแกรม มขีัน้ตอนในการทำาดังนี้

1. แบง่ขอ้มูลออกเป็นชว่งๆที่เท่ากัน

2. เขยีนค่าของชว่งบนแกนนอน

3. หาความถ่ีของแต่ละชว่ง

4. เขยีนความถ่ีลงบนแกนตัง้

5. เขยีนกราฟ

ขอ้มูลที่นำามาทำาฮิสโตแกรมมทีัง้ขอ้มูลที่ต่อเนื่องและไมต่่อเนื่อง

ตัวอยา่ง ขอ้มูลของรถบรรทกุที่มาจอดที่สถานีแหง่หนึ่ง ทกุๆ 5 นาทีระหวา่ง 700 705. , . ,... เป็นเวลา 5 วนัต่อสปัดาห ์ และทัง้หมด 20 สปัดาห์

จำานวนครัง้ ความถ่ี จำานวนครัง้ ความถ่ี ของการมาถึงต่อ การมาถึง

1 คาบ 1 คาบ

0 12 6 7

1 10 7 5

2 19 8 5

3 17 9 3

4 10 10 3

5 8 11 1

Y 20

18 16 ความถ ี่ 14

12 10 8 6 4

2 0 0 1 2 3 4 5

6 7 8 9 10 11 X จำานวนครัง้ของการมาถึง

การแจกแจงดังกล่าวมขีอ้ตกลงเบื้องต้น โดยการใชก้ารเขยีนกราฟของความน่าจะเป็น (prob ability plotting)

ขัน้ตอนของการเตรยีมดังนี้

1. เตรยีมกระดาษกราฟความน่าจะเป็น (probability paper) 2. ให ้ X i , i=1,2,..,n เป็นตัวอยา่งขอ้มูล

เรยีงขอ้มูลจากน้อยไปมาก

Y1 Y2 Y 3 ... Yn

3. เขยีนกราฟ Y j และ P j -12

/ nj 100( )

Pn1

50 P P / nj+1 j 100

เมื่อ -X1 2 1

4. ถ้ากราฟเป็นเสน้ตรงถือวา่การแจกแจงนัน้ใชไ้ด้

ตัวอยา่ง เก็บตัวอยา่งขอ้มูลจำานวน 20 จำานวน ซึ่งเป็นขอ้มูลของการติดตัง้ระบบหุน่ยนต ์ โดยนับเป็นจำานวนวนิาที

9979 9956 100. . . 17 10033.

10026 10041 99. . . 98 9983.

10023 10027 10. . 002 10047. .

9955 9962 996. . . 5 9982.

9996 9990 100. . . 06 9985.

วธิทีำา เรยีงขอ้มูลจากน้อยไปมาก ลำาดับ ค่า ลำาดับ ค่า ลำาดับ ค่า

1 9955 8 99. . 85 15 10023.

2 9956 9 99. . 90 16 10026.

3 9962 10 9. 996 17 10027. .

4 9965 11 9. 998 18 10033. .

5 9979 12 10. 002 19 10041. .

6 9985 13 10. 006 20 10047. .

7 9983 14 10. 017

เขยีนกราฟแกนตัง้คือ Yj แกนนอนคือ Pj 99 98

1005. 1004. 1003. 1002. 1001. 1000. 999. 998. 997. 996. 995. 1 2 3 5 10 20 30

40 50 60 70 80 90 96 9

8 99

Y1 9955= . P1 = 5020 2

5

Y2 9956= . P2 25= . + 10020 75= .

: : Y20 10057= . P20 =

975.

3. การประมาณค่าพารามเิตอร ์ ปกติค่าพารามเิตอรจ์ะม ี ค่าเฉล่ีย และความแปรปรวน

ก . การหาค่าเฉล่ียและค่าความแปรปรวน สตูรที่ใชก้รณีขอ้มูลไมแ่จกแจงความถ ี่

ค่าเฉล่ีย xx

N

ค่าแปรปรวน S2 = n x X)n(n -1)

2 2 (

สตูรที่ใชก้รณีขอ้มูลแจกแจงความถ ี่

ค่าเฉล่ีย xfx

N

ค่าแปรปรวน S2 = n fx fX)n(n -1)

2 2 (

ข . ตัวประมาณค่าพารามเิตอร ์ เป็นการที่ค่ามกีารเปล่ียนไปตามตัวอยา่งที่สุม่มาแต่ละครัง้

ตัวอยา่ง จากขอ้มูลของโทรศัพท์ที่กล่าวมาแล้ว เมื่อนำามาเขยีนฮิสโตแกรม และนำาไปเทียบกับการแจกแจง มาตรฐานพบวา่เป็นแบบปัวรซ์อง ซึ่งมพีารามเิตอรค์ือ เป็นค่าประมาณของค่าเฉล่ีย

xfx

N = 0(12) + 1(10)+..11(1)

100364.

S2 = n fx fX)n(n -1)

2 2 ( 763= . นอกจากนี้ยงัมตีัวประมาณค่าพารามเิตอรข์องการแจกแจงอีกดังนี้ แบบการแจกแจง สตูรของความน่าจะเป็น พารามเิตอร ์ ถ้าประมาณค่า พารามิ

เตอร์

ปัวรซ์องe

x! , x = 0,1,...

- -x =x

เอ็กซโ์ป1 e

- X

0, X>

X

เนนเชยีล สมำ่าเสมอ

(ต่อเนื่อง ) 1b - a ,a x b a,b

a =

b =

(ไมต่่อเนื่อง ) 1j - (i -1) X, 1{i,i+ ,..,j} i,j

i =ค่า Xk ตำ่าสดุ

j= ค่า Xk สงูสดุ

ปกติ e - (X- )2 2 /2 -, <X< , 2 X , 2 S2

แกมมา่ , 1X

ค่า Xi ตำ่าสดุ

ค่า X i สงูสดุ

ตัวอยา่ง จากขอ้มูลการมาถึงของรถ พบวา่ ได้ค่า

X 364= . ดังนัน้ ถ้าประมาณเป็นแบบปัวรซ์อง ได ้

364= .

หรอื 364= .

ตัวอยา่ง จากขอ้มูล

1783 1522 920 58

7 3653 146

2937 1492 736 37

2 3104 3535

พบวา่ ถ้าใหก้ารกระจายดังกล่าวเป็นแบบสมำ่าเสมอบนชว่ง (0,b) เมื่อ b เป็นจำานวนจรงิใดๆ

ค่าประมาณของ b คือb = n + 1

n [ค่าสงูสดุ-ค่าตำ่าสดุ] โดยที่ขอ้มูลที่กำาหนดใหค้่าตำ่าสดุคือ 100 จนถึง 100+b

ดังนัน้b = 12 + 1

12 -[3653 100]=3849

ตัวอยา่ง ถ้าการแจกแจงเป็นแบบปกติ

โดยใชข้อ้มูลของหุน่ยนต ์ และใชส้ตูร xx

N

S2 = n x X)n(n -1)

2 2 (

ประมาณค่าเฉล่ีย = X 1000065= .

และประมาณค่าความแปรปรวน 2 S2 00698 ตัวอยา่ง การแจกแจงแบบแกมมา่

ถ้าค่าประมาณคือ และ

= 1

x

โดยม ี M= ln xn

ln X ii=1

n

1 ซึ่งใชข้อ้มูลดังนี้

สัง่ซื้อ เวลาดำาเนิน (วนั ) สัง่ซื้อ เวลาดำาเนิน (วนั) (lead time) (lead

time) 1 70292 11.

30215. 2 10107 12.

17137. 3 48386 13.

44024. 4 20480 14.

10552. 5 13053 15.

37298. 6 25292 16.

16314. 7 14713 17.

28073. 8 39166 18.

39019. 9 17421 19.

32330. 10 13905 2.

0 36547.

xx

n

ii=1

n

564 32

2028 22

...

-M=3.34 120

,1M

( . ) . .63 99 014 7 14

เปิดตารางแกมมา่ 3728= .

= 1

28 22. 0035 ตัวอยา่ง การแจกแจงแบบเอ็กซโ์ปเนนเชยีล

ใชข้อ้มูลจำานวน 50 จำานวนดังนี้

79919 3081 0. . . 062 1961 5845. .

3027 6505 00. . . 21 0013 0123. .

6769 59899 1. . . 192 34760 5009. .

18387 1141 43. . . 565 24420 0433. .

144695 2663 1. . 7967 0091 9003. . .

0941 0878 33. . . 71 2157 7579. .

0624 5380 31. . . 48 7078 23960. .

0590 1928 03. . . 00 0002 0543. .

7004 31764 1. . . 005 0147 0219. .

3219 14382 1. . . 008 2336 0462. .

ได้ค่าประมาณ

1 111 894

0 084X ..

. ตัวอยา่ง การแจกแจงแบบไวบูลล ์

ใชข้อ้มูลของการแจกแจงแบบเอ็กซโ์ปเนนเชยีล ที่มจีำานวนขอ้มูล20

จำานวน มคี่าเฉล่ีย 11894. จงประมาณค่า 0

วธิทีำา X , X = 37,575.8502i

i=1

502141467 .

S

X nX

n -12

2i

i=1

n

2

= 37,575.850 - 50(141.467)49

622 650.

S = 24.453

01189424 953

0 477 XS

..

.

f(

) lnln

n

Xn X X

Xi

i=1

n ii=1

n

i

ii=1

n

นัน่คือ f(

) ln

ln

n X

n X X

Xi

i=1

n ii=1

n

i

ii=1

n0

0

0

= 500 477

38 294 50 292 629115125.

. ( . ).

เมื่อ 0

1189424 953

0 477 XS

..

.

และคำานวณหา f ( 0

) จากสตูร

f (

)

( ) ln )

( )

-n

n X lnX

X

n( X X

X

i ii=1

n

ii=1

n

ii=1

n

i

ii=1

n2

2 2

20

f (-50

(0.477)0 2

)

( . ).

( . )( . )

50 1057 781115125

50 292 629115125

2

2

-356110= . ดังนัน้

คำานวณค่า 1 0 477 0 522 . .

16.024-356.110

หลังจากนัน้ทำาการประมาณโดยการทำาหลายๆครัง้

X j X ii=1

50

j

X Xi ji=1

j ln

50

X Xii=1

50

i j

(ln ) 2 f( j )

0 0477 115125 2. . 92629 1057781. .

16024. 1 0522 129489 3. .

44713 1254111. . 1008.

2 0525 130603 3. . 48769 1269547. .

0004

3 0525 130608 3. . 48789 1269614. .

0.000

f ( j

) j+1

- 0 356110 0522. . - 1 313540 0525. . - 2 310853 0525. . - 3 310841 0525. . หา

= 130 60850.

1/0.525

6227= .

4. การทดสอบรูปแบบของการแจกแจง เพื่อดขูอ้มูลที่เก็บและการแจกแจงที่คิดเอาไวเ้หมาะสมกันดีในเชงิสถิติ

หรอืไม ่ โดยมวีธิกีารทดสอบที่นิยมใชก้ัน 2 วธิคีือ การทดสอบไคสแควร์

การทดสอบโคลโมโกรอ๊ฟ-สมรีน์๊อฟ

41. การทดสอบไคสแควร ์ โดยมขีัน้ตอนในการทดสอบคือ

1. ตัง้สมมติฐาน

X 0 ตัวแปรสุม่เป็นแบบการแจกแจง ...... Ha : ตัวแปรสุม่ไมเ่ป็นแบบการแจกแจง .... 2. คำานวณใชส้ตูร

2 i i2

ii=1

k o ee

( )

เมื่อ oi เป็นความถ่ีของค่าสงัเกตที่พบจรงิ (observed frequency)

e i เป็รความถ่ีคาดคะเนในพวกท ี่ i k จำานวนพวกหรอืจำานวนระดับของค่าสงัเกต

3. เปรยีบเทียบค่าที่คำานวณได้กับค่าในตาราง และสรุปผล ตัวอยา่ง จงทดสอบการแจกแจงปัวรซ์องโดยใชไ้คสแคว์ ขอ้มูลที่เก็ยรวบรวมเป็นดังนี้

0 12

1 10

2 19

3 17

4 10

5 8

6 7

7 5

8 5

9 3

10 3

11 1

0H : การแจกแจงเป็นแบบปัวรซ์อง

Ha : การแจกแจงไมเ่ป็นปังรซ์อง

คำานวนค่า P(X) =e

X!0

- X

คำานวณค่า

= x

0 12 1 10

113 64( ) ( ) ... .

P(0) = 0.026 P(6) =0.085 P(1)=0.096 P(7)=0.044 P(2)=0.174 P(8) = 0.020 P(3)=0.211 P(9)=0.008 P(4)=0.192 P(10)=0.003 P(5)=0.140 P(11)=0.001

X i o i e i ( )o ee

i i

i

2

0 12 26 7. .87

1 10 96. 2 19 174.

015

3 17 211.080.

4 10 192 4.41

5 8 140 2. . 57

,X=0,12,

122.

6 7 85 02. .6

7 5 44. 8 5 20. 9 3 080. 10 3 030. 11 1 01. 2768. ค่า ei = npi เชน่ e 1 = np1 100 0= ( .

026 26) = . ถ้า e i < 5 ดังนัน้จะนำามารวมกัน เชน่ e1+e2 12= .

2

ดังนัน้ ได้ค่า 2 2768= . องศาแหง่ความอิสระ - - - - k s 1 7 1 1 =5 พบวา่ ปฎิเสธ X 0

42. การทดสอบโคลโมโกรอ๊ฟ-สมรนี๊อฟสำาหรบัสาระสนิทรูปดี เหมาะกับกลุ่มตัวอยา่ง ขนาดเล็ก และไมม่พีารามเิตอร์ ตัวอยา่ง จงทำาการทดสอบวา่มกีารแจกแจงที่เป็นเอ็กซโ์ปเนนเชยีลหรอืไมจ่าก ขอ้มูล

04405320427. . . . 4 200 030 254. . .

05220218915. . . . 3 021 280 004. . .

13583223419. . . . 5 010 142 046. . .

00710907655. . . . 5 393 107 226. . .

28806711202. . . . 6 457 537 012. . .

17

7 6. 11.62

31916314610. . . . 8 206 085 083. . .

24421131529. . . . 0 658 064. .

วธิทีำา

X 0 : มกีารแจกแจงแบบเอ็กซโ์ปเนนเชยีล

Xa : ไมม่กีารแจกแจงแบบเอ็กซโ์ปเนนเชยีล

จากขอ้มูลดังกล่าวเป็นการเก็บขอ้มูลจาก 0 ถึง 100T= นาที

ดังนัน้นำามาเขยีนใหมเ่พื่อใหอ้ยูใ่นชว่ง (0,1) สำาหรบัในโคลโมโกรอ๊ฟใช้ 1 1 2T /T ,(T +T )/T , ... ดังนี้

00044000970030. . . 1 00575 00775 0080. . .

5 01147. 01111013130150. . .

2 01655 01676 0195. . . 6 01960.

02095029270316. . . 1 03356 03366 0350. . .

8 03553. 03561036700374. . .

6 04300 04694 0479. . . 6 05027.

05315053820549. . . 4 05520 05977 0651. . .

4 06526. 06845070080715. . .

4 07262 07468 0755. . . 3 07636.

07880079820820. . . 6 08417 08732 0902. . .

2 09680. 09744 D +

max1 i N

iN

R(i)

1054= . D- = max

1

i N

R(i) -i -1N

00080= . D = max(1.054,0.0080) =0.0154 005 50. ,n= , D005. = 136.

n =0.

1923

ซึ่งค่าที่คำานวณได้เป็น 01054. ดังนัน้ ไมป่ฎิเสธ X0

Recommended