22
กกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกก กก 4 กกกกกกกกกกกกกกกกกกกกกกกกกกกก 1. กกกกกกกกกกกกกกกก (collection of raw data) 2. กกกกกกกกกกกกกกกกกกกกกกกก (identification of stati stical distribution) 3. กกกกกกกกกกกกกกกกกกกกกกกกกก (estimation of paramete r) 4. กกกกกกกกกกกกกกกกกกกก (testing of estimator) 1. กกกกกกกกกกกกกกกก กกกกกกกกกกกกกกกกกกกกกกกกกกกกกกก 1.1 กกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกก กกกกกกก 1.2 กกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกก กกกกกกกกกกกกกกกกกกกก กกกกกกกกกกกกกกกกกกกกกกกกกกกกกก 1.3 กกกกกกกกกกกกกกกก 2 กกกกกกกกกกกกกกกกกกกกกกกกกกก กกกกกกกกกกก กกกกกกกกกกกกกกก (scatter diagram) 1.4 กกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกก (autoco rrelation) 2. กกกกกกกกกกกกกกกกกกกกกกกก กกกกกกกกกกกกกกกกกกกกกกกกกก กก กกกกกกกกกกกกกกกก (frequency distribution) กกกก กกกกกกกกก (histogram) กกกกกกกกกก กกกกกกกกกกกกกกกกกกกกกกกกกกกกก กกกกกกกกกกกกกกก กกกกกกกกกกกกกกกกกกกกกกก 1. กกกกกกกกกกกกกกกกกกกกกกกกกกกกกกกก 2. กกกกกกกกกกกกกกกกกกกกกกก 3. กกกกกกกกกกกกกกกกกกกกก 4. กกกกกกกกกกกกกกกกกกกกกกก 5. กกกกกกกกก

บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

การเก็บรวบรวมและการวเิคราะหข์อ้มูล

ม ี 4 ขัน้ตอนในการเก็บรวบรวมขอ้มูล

1. การเก็บขอ้มูลดิบ (collection of raw data) 2. การระบุการแจกแจงทางสถิติ (identification of statistical distribut

ion) 3. การประมาณค่าของพารามเิตอร ์ (estimation of parameter)

4. การทดสอบค่าประมาณค่า (testing of estimator)

1. การเก็บขอ้มูลดิบ ในการเก็บขอ้มูลควรพจิารณาดังนี้

11. ทำาการวเิคราะหว์า่ขอ้มูลที่ถกูเลือกวา่พอแก่การทำาการจำาลองหรอืไม่

12. รวบรวมวา่เขา้พวกเป็นขอ้มูลชุดเดียวกัน แล้วทำาการตรวจสอบวา่เป็นอันหนึ่งอันเดียวกันหรอืไม่

13. ตรวจสอบวา่ตัวแปร 2 ตัวมคีวามสมัพนัธก์ันหรอืไม่ โดยการสรา้งแผนภาพการกระจาย (s catter diagram)

14. ความสมัพนัธข์องตัวแปรด้วยกันวา่มอีอโต้คอรเีรชัน่ (autocorrelation)

2. การระบุการแจกแจงทางสถิติ

ในการระบุการแจกแจงทางสถิติ ม ี การแจกแจงความถ ี่ (frequency distributi on) หรอื ฮิสโตแกรม (histogram) เพื่อดรููปรา่งของการกระจายหรอืการแจกแจง

การทำาฮิสโตแกรม มขีัน้ตอนในการทำาดังนี้

1. แบง่ขอ้มูลออกเป็นชว่งๆที่เท่ากัน

2. เขยีนค่าของชว่งบนแกนนอน

3. หาความถ่ีของแต่ละชว่ง

4. เขยีนความถ่ีลงบนแกนตัง้

5. เขยีนกราฟ

ขอ้มูลที่นำามาทำาฮิสโตแกรมมทีัง้ขอ้มูลที่ต่อเนื่องและไมต่่อเนื่อง

Page 2: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

ตัวอยา่ง ขอ้มูลของรถบรรทกุที่มาจอดที่สถานีแหง่หนึ่ง ทกุๆ 5 นาทีระหวา่ง 700 705. , . ,... เป็นเวลา 5 วนัต่อสปัดาห ์ และทัง้หมด 20 สปัดาห์

จำานวนครัง้ ความถ่ี จำานวนครัง้ ความถ่ี ของการมาถึงต่อ การมาถึง

1 คาบ 1 คาบ

0 12 6 7

1 10 7 5

2 19 8 5

3 17 9 3

4 10 10 3

5 8 11 1

Y 20

18 16 ความถ ี่ 14

12 10 8 6 4

Page 3: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

2 0 0 1 2 3 4 5

6 7 8 9 10 11 X จำานวนครัง้ของการมาถึง

การแจกแจงดังกล่าวมขีอ้ตกลงเบื้องต้น โดยการใชก้ารเขยีนกราฟของความน่าจะเป็น (prob ability plotting)

ขัน้ตอนของการเตรยีมดังนี้

1. เตรยีมกระดาษกราฟความน่าจะเป็น (probability paper) 2. ให ้ X i , i=1,2,..,n เป็นตัวอยา่งขอ้มูล

เรยีงขอ้มูลจากน้อยไปมาก

Y1 Y2 Y 3 ... Yn

3. เขยีนกราฟ Y j และ P j -12

/ nj 100( )

Pn1

50 P P / nj+1 j 100

เมื่อ -X1 2 1

4. ถ้ากราฟเป็นเสน้ตรงถือวา่การแจกแจงนัน้ใชไ้ด้

ตัวอยา่ง เก็บตัวอยา่งขอ้มูลจำานวน 20 จำานวน ซึ่งเป็นขอ้มูลของการติดตัง้ระบบหุน่ยนต ์ โดยนับเป็นจำานวนวนิาที

9979 9956 100. . . 17 10033.

10026 10041 99. . . 98 9983.

10023 10027 10. . 002 10047. .

9955 9962 996. . . 5 9982.

9996 9990 100. . . 06 9985.

Page 4: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

วธิทีำา เรยีงขอ้มูลจากน้อยไปมาก ลำาดับ ค่า ลำาดับ ค่า ลำาดับ ค่า

1 9955 8 99. . 85 15 10023.

2 9956 9 99. . 90 16 10026.

3 9962 10 9. 996 17 10027. .

4 9965 11 9. 998 18 10033. .

5 9979 12 10. 002 19 10041. .

6 9985 13 10. 006 20 10047. .

7 9983 14 10. 017

Page 5: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

เขยีนกราฟแกนตัง้คือ Yj แกนนอนคือ Pj 99 98

1005. 1004. 1003. 1002. 1001. 1000. 999. 998. 997. 996. 995. 1 2 3 5 10 20 30

40 50 60 70 80 90 96 9

8 99

Y1 9955= . P1 = 5020 2

5

Y2 9956= . P2 25= . + 10020 75= .

: : Y20 10057= . P20 =

975.

3. การประมาณค่าพารามเิตอร ์ ปกติค่าพารามเิตอรจ์ะม ี ค่าเฉล่ีย และความแปรปรวน

Page 6: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

ก . การหาค่าเฉล่ียและค่าความแปรปรวน สตูรที่ใชก้รณีขอ้มูลไมแ่จกแจงความถ ี่

ค่าเฉล่ีย xx

N

ค่าแปรปรวน S2 = n x X)n(n -1)

2 2 (

Page 7: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

สตูรที่ใชก้รณีขอ้มูลแจกแจงความถ ี่

ค่าเฉล่ีย xfx

N

ค่าแปรปรวน S2 = n fx fX)n(n -1)

2 2 (

ข . ตัวประมาณค่าพารามเิตอร ์ เป็นการที่ค่ามกีารเปล่ียนไปตามตัวอยา่งที่สุม่มาแต่ละครัง้

ตัวอยา่ง จากขอ้มูลของโทรศัพท์ที่กล่าวมาแล้ว เมื่อนำามาเขยีนฮิสโตแกรม และนำาไปเทียบกับการแจกแจง มาตรฐานพบวา่เป็นแบบปัวรซ์อง ซึ่งมพีารามเิตอรค์ือ เป็นค่าประมาณของค่าเฉล่ีย

xfx

N = 0(12) + 1(10)+..11(1)

100364.

S2 = n fx fX)n(n -1)

2 2 ( 763= . นอกจากนี้ยงัมตีัวประมาณค่าพารามเิตอรข์องการแจกแจงอีกดังนี้ แบบการแจกแจง สตูรของความน่าจะเป็น พารามเิตอร ์ ถ้าประมาณค่า พารามิ

เตอร์

ปัวรซ์องe

x! , x = 0,1,...

- -x =x

เอ็กซโ์ป1 e

- X

0, X>

X

เนนเชยีล สมำ่าเสมอ

(ต่อเนื่อง ) 1b - a ,a x b a,b

a =

b =

(ไมต่่อเนื่อง ) 1j - (i -1) X, 1{i,i+ ,..,j} i,j

i =ค่า Xk ตำ่าสดุ

j= ค่า Xk สงูสดุ

ปกติ e - (X- )2 2 /2 -, <X< , 2 X , 2 S2

แกมมา่ , 1X

ค่า Xi ตำ่าสดุ

ค่า X i สงูสดุ

Page 8: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

ตัวอยา่ง จากขอ้มูลการมาถึงของรถ พบวา่ ได้ค่า

X 364= . ดังนัน้ ถ้าประมาณเป็นแบบปัวรซ์อง ได ้

364= .

หรอื 364= .

ตัวอยา่ง จากขอ้มูล

1783 1522 920 58

7 3653 146

2937 1492 736 37

2 3104 3535

พบวา่ ถ้าใหก้ารกระจายดังกล่าวเป็นแบบสมำ่าเสมอบนชว่ง (0,b) เมื่อ b เป็นจำานวนจรงิใดๆ

ค่าประมาณของ b คือb = n + 1

n [ค่าสงูสดุ-ค่าตำ่าสดุ] โดยที่ขอ้มูลที่กำาหนดใหค้่าตำ่าสดุคือ 100 จนถึง 100+b

ดังนัน้b = 12 + 1

12 -[3653 100]=3849

ตัวอยา่ง ถ้าการแจกแจงเป็นแบบปกติ

โดยใชข้อ้มูลของหุน่ยนต ์ และใชส้ตูร xx

N

S2 = n x X)n(n -1)

2 2 (

ประมาณค่าเฉล่ีย = X 1000065= .

และประมาณค่าความแปรปรวน 2 S2 00698 ตัวอยา่ง การแจกแจงแบบแกมมา่

ถ้าค่าประมาณคือ และ

= 1

x

โดยม ี M= ln xn

ln X ii=1

n

1 ซึ่งใชข้อ้มูลดังนี้

Page 9: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

สัง่ซื้อ เวลาดำาเนิน (วนั ) สัง่ซื้อ เวลาดำาเนิน (วนั) (lead time) (lead

time) 1 70292 11.

30215. 2 10107 12.

17137. 3 48386 13.

44024. 4 20480 14.

10552. 5 13053 15.

37298. 6 25292 16.

16314. 7 14713 17.

28073. 8 39166 18.

39019. 9 17421 19.

32330. 10 13905 2.

0 36547.

xx

n

ii=1

n

564 32

2028 22

...

Page 10: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

-M=3.34 120

,1M

( . ) . .63 99 014 7 14

เปิดตารางแกมมา่ 3728= .

= 1

28 22. 0035 ตัวอยา่ง การแจกแจงแบบเอ็กซโ์ปเนนเชยีล

ใชข้อ้มูลจำานวน 50 จำานวนดังนี้

79919 3081 0. . . 062 1961 5845. .

3027 6505 00. . . 21 0013 0123. .

6769 59899 1. . . 192 34760 5009. .

18387 1141 43. . . 565 24420 0433. .

144695 2663 1. . 7967 0091 9003. . .

0941 0878 33. . . 71 2157 7579. .

0624 5380 31. . . 48 7078 23960. .

0590 1928 03. . . 00 0002 0543. .

7004 31764 1. . . 005 0147 0219. .

3219 14382 1. . . 008 2336 0462. .

ได้ค่าประมาณ

1 111 894

0 084X ..

. ตัวอยา่ง การแจกแจงแบบไวบูลล ์

Page 11: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

ใชข้อ้มูลของการแจกแจงแบบเอ็กซโ์ปเนนเชยีล ที่มจีำานวนขอ้มูล20

จำานวน มคี่าเฉล่ีย 11894. จงประมาณค่า 0

วธิทีำา X , X = 37,575.8502i

i=1

502141467 .

S

X nX

n -12

2i

i=1

n

2

= 37,575.850 - 50(141.467)49

622 650.

S = 24.453

01189424 953

0 477 XS

..

.

f(

) lnln

n

Xn X X

Xi

i=1

n ii=1

n

i

ii=1

n

นัน่คือ f(

) ln

ln

n X

n X X

Xi

i=1

n ii=1

n

i

ii=1

n0

0

0

= 500 477

38 294 50 292 629115125.

. ( . ).

เมื่อ 0

1189424 953

0 477 XS

..

.

และคำานวณหา f ( 0

) จากสตูร

f (

)

( ) ln )

( )

-n

n X lnX

X

n( X X

X

i ii=1

n

ii=1

n

ii=1

n

i

ii=1

n2

2 2

20

f (-50

(0.477)0 2

)

( . ).

( . )( . )

50 1057 781115125

50 292 629115125

2

2

-356110= . ดังนัน้

Page 12: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

คำานวณค่า 1 0 477 0 522 . .

16.024-356.110

หลังจากนัน้ทำาการประมาณโดยการทำาหลายๆครัง้

X j X ii=1

50

j

X Xi ji=1

j ln

50

X Xii=1

50

i j

(ln ) 2 f( j )

0 0477 115125 2. . 92629 1057781. .

16024. 1 0522 129489 3. .

44713 1254111. . 1008.

2 0525 130603 3. . 48769 1269547. .

0004

3 0525 130608 3. . 48789 1269614. .

0.000

f ( j

) j+1

- 0 356110 0522. . - 1 313540 0525. . - 2 310853 0525. . - 3 310841 0525. . หา

= 130 60850.

1/0.525

6227= .

4. การทดสอบรูปแบบของการแจกแจง เพื่อดขูอ้มูลที่เก็บและการแจกแจงที่คิดเอาไวเ้หมาะสมกันดีในเชงิสถิติ

หรอืไม ่ โดยมวีธิกีารทดสอบที่นิยมใชก้ัน 2 วธิคีือ การทดสอบไคสแควร์

Page 13: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

การทดสอบโคลโมโกรอ๊ฟ-สมรีน์๊อฟ

41. การทดสอบไคสแควร ์ โดยมขีัน้ตอนในการทดสอบคือ

1. ตัง้สมมติฐาน

X 0 ตัวแปรสุม่เป็นแบบการแจกแจง ...... Ha : ตัวแปรสุม่ไมเ่ป็นแบบการแจกแจง .... 2. คำานวณใชส้ตูร

2 i i2

ii=1

k o ee

( )

เมื่อ oi เป็นความถ่ีของค่าสงัเกตที่พบจรงิ (observed frequency)

e i เป็รความถ่ีคาดคะเนในพวกท ี่ i k จำานวนพวกหรอืจำานวนระดับของค่าสงัเกต

3. เปรยีบเทียบค่าที่คำานวณได้กับค่าในตาราง และสรุปผล ตัวอยา่ง จงทดสอบการแจกแจงปัวรซ์องโดยใชไ้คสแคว์ ขอ้มูลที่เก็ยรวบรวมเป็นดังนี้

0 12

1 10

2 19

3 17

4 10

5 8

6 7

7 5

8 5

9 3

10 3

11 1

Page 14: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

0H : การแจกแจงเป็นแบบปัวรซ์อง

Ha : การแจกแจงไมเ่ป็นปังรซ์อง

คำานวนค่า P(X) =e

X!0

- X

คำานวณค่า

= x

0 12 1 10

113 64( ) ( ) ... .

P(0) = 0.026 P(6) =0.085 P(1)=0.096 P(7)=0.044 P(2)=0.174 P(8) = 0.020 P(3)=0.211 P(9)=0.008 P(4)=0.192 P(10)=0.003 P(5)=0.140 P(11)=0.001

X i o i e i ( )o ee

i i

i

2

0 12 26 7. .87

1 10 96. 2 19 174.

015

3 17 211.080.

4 10 192 4.41

5 8 140 2. . 57

,X=0,12,

122.

Page 15: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

6 7 85 02. .6

7 5 44. 8 5 20. 9 3 080. 10 3 030. 11 1 01. 2768. ค่า ei = npi เชน่ e 1 = np1 100 0= ( .

026 26) = . ถ้า e i < 5 ดังนัน้จะนำามารวมกัน เชน่ e1+e2 12= .

2

ดังนัน้ ได้ค่า 2 2768= . องศาแหง่ความอิสระ - - - - k s 1 7 1 1 =5 พบวา่ ปฎิเสธ X 0

42. การทดสอบโคลโมโกรอ๊ฟ-สมรนี๊อฟสำาหรบัสาระสนิทรูปดี เหมาะกับกลุ่มตัวอยา่ง ขนาดเล็ก และไมม่พีารามเิตอร์ ตัวอยา่ง จงทำาการทดสอบวา่มกีารแจกแจงที่เป็นเอ็กซโ์ปเนนเชยีลหรอืไมจ่าก ขอ้มูล

04405320427. . . . 4 200 030 254. . .

05220218915. . . . 3 021 280 004. . .

13583223419. . . . 5 010 142 046. . .

00710907655. . . . 5 393 107 226. . .

28806711202. . . . 6 457 537 012. . .

17

7 6. 11.62

Page 16: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

31916314610. . . . 8 206 085 083. . .

24421131529. . . . 0 658 064. .

วธิทีำา

X 0 : มกีารแจกแจงแบบเอ็กซโ์ปเนนเชยีล

Xa : ไมม่กีารแจกแจงแบบเอ็กซโ์ปเนนเชยีล

จากขอ้มูลดังกล่าวเป็นการเก็บขอ้มูลจาก 0 ถึง 100T= นาที

ดังนัน้นำามาเขยีนใหมเ่พื่อใหอ้ยูใ่นชว่ง (0,1) สำาหรบัในโคลโมโกรอ๊ฟใช้ 1 1 2T /T ,(T +T )/T , ... ดังนี้

00044000970030. . . 1 00575 00775 0080. . .

5 01147. 01111013130150. . .

2 01655 01676 0195. . . 6 01960.

02095029270316. . . 1 03356 03366 0350. . .

8 03553. 03561036700374. . .

6 04300 04694 0479. . . 6 05027.

05315053820549. . . 4 05520 05977 0651. . .

4 06526. 06845070080715. . .

4 07262 07468 0755. . . 3 07636.

Page 17: บทที่ ถstaff.cs.psu.ac.th/natikan/Simul/Doc/collect.doc · Web viewม 4 ข นตอนในการเก บรวบรวมข อม ล 1. การเก บข

07880079820820. . . 6 08417 08732 0902. . .

2 09680. 09744 D +

max1 i N

iN

R(i)

1054= . D- = max

1

i N

R(i) -i -1N

00080= . D = max(1.054,0.0080) =0.0154 005 50. ,n= , D005. = 136.

n =0.

1923

ซึ่งค่าที่คำานวณได้เป็น 01054. ดังนัน้ ไมป่ฎิเสธ X0