9
30.03.2013. 1 SOPuM Neparametarski testovi hipoteza I deo Neparametarski testovi Neparametarski testovi se koriste kada: se dokazuje da li uzorak odgovara nekoj raspodeli Hi kvadrat test Test Kolmogorova poređenje dve raspodele bez obzira na njihov oblik Test Kolmogorov-Smirnova U*-test Mann-Withney-a Test medijane

SOPUM_P06_2013

  • Upload
    jo-

  • View
    214

  • Download
    0

Embed Size (px)

DESCRIPTION

Statistička obradapodataka umašinstvu

Citation preview

Page 1: SOPUM_P06_2013

30.03.2013.

1

SOPuM

Neparametarskitestovi hipoteza I deo

Neparametarski testovi

Neparametarski testovi se koriste kada:

�se dokazuje da li uzorak odgovara nekoj raspodeli�Hi kvadrat test�Test Kolmogorova

�poređenje dve raspodele bez obzira na njihov oblik�Test Kolmogorov-Smirnova�U*-test Mann-Withney-a�Test medijane

Page 2: SOPUM_P06_2013

30.03.2013.

2

Test KolmogorovaPrimer 1

0.464 0.137 2.455 -0.323 -0.068

0.906 -0.513 -0.525 0.595 0.881

-0.482 1.678 -0.057 -1.229 -0.486

-1.787 -0.261 1.237 1.046 -0.508

Testirati hipotezu da je uzorak od 20 elemenata uzet iz popul acije sanormalnom raspodelom . Vrednosti pojedinih merenjaprikazane su u tabeli:

(((( )))). 20 1ℕℕℕℕ

Procedura testiranja hipoteza

1. Identifikacija raspodele po kojoj se podaci rasp oređujuako pretpostavka raspodele nije data konstruiše se histogram.Zadatkom je data pretpostavka o normalnoj raspodeli

2. Postavljanje sistema hipoteza

(((( )))) (((( ))))(((( ))))nH F x F x====0 0

(((( )))) (((( ))))(((( ))))nH F x F x≠≠≠≠1 0

3. Prag zna čajnosti: .αααα ==== 0 05

4. Statistika odlu čivanja: (((( )))) (((( ))))n nxD max F x F x= −= −= −= − 0

5. Kriti čna oblast odbacivanja H0 ααααλ λλ λλ λλ λ>>>>0

usvaja se

Page 3: SOPUM_P06_2013

30.03.2013.

3

6. Prora čun

(((( ))))i iF xΦΦΦΦ====0(((( ))))ix ,∀ ∈ − +∀ ∈ − +∀ ∈ − +∀ ∈ − + ⇒⇒⇒⇒4 4 (((( ))))~ , 20 1ℕℕℕℕ

(((( ))))n k k

n

, x x

kF x , x x x

n, x x

++++

<<<<= < <= < <= < <= < <

<<<<

1

1

0

1

6.1. Sortiranje podataka po rastu ćem redu

6.2. Određivaje empirijskih vrednosti raspodele na osnovu tab lica

6.3. Određivanje teorijskih vrednosti raspodele na osnovu

npr. (((( ))))x . . .ΦΦΦΦ= −= −= −= − ⇒⇒⇒⇒ − =− =− =− =1 1 787 1 79 0 037

(((( )))) (((( ))))i n i iD F x F x= −= −= −= − 0

npr. (((( ))))nF x .n

= = == = == = == = =1

1 10 05

20

6.4. Određivanje prora čunskih vrednosti statistike odlu čivanja

npr. D . . .= − == − == − == − =1 0 05 0 037 0 013

x i F0(x) Fn(x)

1 -1.787 0.037 0.05 0.013

2 -1.229 0.110 0.10 0.01

3 -0.525 0.300 0.15 0.150

4 -0.513 0.304 0.20 0.104

5 -0.508 0.306 0.25 0.056

6 -0.486 0.315 0.30 0.015

7 -0.482 0.315 0.35 0.035

8 -0.323 0.373 0.40 0.027

9 -0.261 0.397 0.45 0.053

10 -0.068 0.473 0.50 0.027

11 -0.057 0.477 0.55 0.073

12 0.137 0.554 0.60 0.046

13 0.464 0.679 0.65 0.029

14 0.595 0.724 0.70 0.024

15 0.881 0.811 0.75 0.061

16 0.906 0.818 0.80 0.018

17 1.046 0.852 0.85 0.002

18 1.237 0.892 0.90 0.008

19 1.678 0.953 0.95 0.003

20 2.455 0.993 1 0.007

(((( )))) (((( ))))nF x F x−−−− 0

0.150

6.5. Određivanje Dn

(((( )))) (((( ))))n nxD max F x F x= −= −= −= − 0

nD .==== 0 150

nD n .λλλλ = == == == =0 0 67

. .ααααλ λλ λλ λλ λ= == == == =0 05 1 355

7. Odluka

. .ααααλ λλ λλ λλ λ> ⇔ >> ⇔ >> ⇔ >> ⇔ >0 1 355 0 67

M: Nulta hipoteza se ne može odbaciti. I: Podaci se raspore đuju po normalnoj raspodeli

Page 4: SOPUM_P06_2013

30.03.2013.

4

Primer 2

Rezultati 1000 merenja odstupanja od nominalne mere izraže ni umm, dati su u tabeli. Da li se odstupanje od nominalne mere pon ašapo normalnoj raspodeli (((( )))), 20 1ℕℕℕℕ

25181

41158

9787

14247

20121

frekvencijeintervalfrekvencijeinterval

(((( )))), .−∞ −−∞ −−∞ −−∞ −2 0

[[[[ )))). , .− −− −− −− −2 0 1 5

[[[[ )))). , .− −− −− −− −1 5 1 0

[[[[ )))). , .− −− −− −− −1 0 0 5

[[[[ )))). , .−−−−0 5 0 0

[[[[ )))). , .0 0 0 5

[[[[ )))). , .0 5 1 0

[[[[ )))). , .1 0 1 5

[[[[ )))). , .1 5 2 0

[[[[ )))). , +∞+∞+∞+∞2 0

Procedura testiranja hipoteza

1. Identifikacija raspodele po kojoj se podaci raspo ređujuZadatkom je data pretpostavka o normalnoj raspodeli

2. Postavljanje sistema hipoteza

(((( )))) (((( ))))(((( ))))nH F x F x====0 0

(((( )))) (((( ))))(((( ))))nH F x F x≠≠≠≠1 0

3. Prag značajnosti:

4. Statistika odlu čivanja: (((( )))) (((( ))))n nxD max F x F x= −= −= −= − 0

5. Kriti čna oblast odbacivanja H0 ααααλ λλ λλ λλ λ>>>>0

.αααα ==== 0 05usvaja se

Page 5: SOPUM_P06_2013

30.03.2013.

5

6. Proračun

(((( ))))i iF xΦΦΦΦ====0(((( ))))ix ,∀ ∈ − +∀ ∈ − +∀ ∈ − +∀ ∈ − + ⇒⇒⇒⇒4 4 (((( ))))~ , 20 1ℕℕℕℕ

6.1. Sortiranje podataka po rastu ćem redu je ve ć urađeno

6.2. Određivaje empirijskih vrednosti raspodele na osnovu tab lica

6.3. Određivanje teorijskih vrednosti raspodele na osnovu

npr. (((( ))))x . . .ΦΦΦΦ= −= −= −= − ⇒⇒⇒⇒ − =− =− =− =1 2 25 2 25 0 0122

(((( )))) (((( ))))i n i iD F x F x= −= −= −= − 0

npr.

6.4. Određivanje prora čunskih vrednosti statistike odlu čivanja

npr. D . . .= − == − == − == − =1 0 0105 0 0122 0 0017

xi odgovara sredini intervala

(((( ))))k

n k i ki

F x n . nn

−−−−

====

= += += += + ∑∑∑∑

1

0

10 5

(((( ))))nF x . = + + + == + + + == + + + == + + + =

4

1 15821 47 87 0 234

1000 2

x F0(x) Fn(x)

1 -2.25 0.01222 0.0105 0.00172

2 -1.75 0.04006 0.0445 0.00444

3 -1.25 0.10565 0.1115 0.00585

4 -0.75 0.22663 0.2340 0.00737

5 -0.25 0.40129 0.4035 0.00221

6 0.25 0.59871 0.5945 0.00421

7 0.75 0.77337 0.7660 0.00737

8 1.25 0.89435 0.8855 0.00885

9 1.75 0.95994 0.9545 0.00544

10 2.25 0.98778 0.9875 0.00028

0.00885

(((( )))) (((( ))))nF x F x−−−− 0

6.5. Određivanje Dn

(((( )))) (((( ))))n nxD max F x F x= −= −= −= − 0

nD .==== 0 00885

nD n .λλλλ = == == == =0 0 28

. .ααααλ λλ λλ λλ λ= == == == =0 05 1 355

7. Odluka

. .ααααλ λλ λλ λλ λ> ⇔ >> ⇔ >> ⇔ >> ⇔ >0 1 355 0 28

M: Nulta hipoteza se ne može odbaciti.

I: Podaci se raspore đuju po normalnoj raspodeli

Page 6: SOPUM_P06_2013

30.03.2013.

6

Šta se dešava ako se ispituje da li se podaci raspore đuju po normalnoj raspodeli, a pri tome su eksperimentalni podaci van granica -4,+4 ili sredina ili varijansa nisu jednake 0 odnosno 1?

Normalizacija

Ispitivana je pouzdanost revolver struga. Mereno je vreme r adaizmeđu dva otkaza (u mašinskim časovima) i rezultati su prikazani utabeli. Testom Kolmogorova, koriste ći 7 intervala, ispitati da li seintenzitet otkaza ponaša po eksponencijalnom zakonu raspo de.

Primer 3

1.945 0.684 0.889 0.252 0.589

0.834 0.222 0.134 0.660 1.496

0.193 0.418 0.368 1.372 0.423

0.426 1.815 1.105 0.719 1.672

1.505 1.261 0.547 1.322 1.153

0.981 1.382 0.080 0.079 0.645

0.480 0.272 0.582 0.986 0.105

0.063 1.811 1.066 1.326 0.564

0.528 0.734 0.476 0.698 2.729

0.975 0.228 0.771 0.577 2.069

Page 7: SOPUM_P06_2013

30.03.2013.

7

X

% p

ada

proi

zvod

nje

0

10

20

30

40

50

60

70

80

90

100

0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100

Procedura testiranja hipoteza1. Identifikacija raspodele po kojoj se podaci raspo ređuju

Zadatkom je data pretpostavka o eksponencijalnoj

2. Postavljanje sistema hipoteza

(((( )))) (((( ))))(((( ))))nH F x F x====0 0

(((( )))) (((( ))))(((( ))))nH F x F x≠≠≠≠1 0

3. Prag značajnosti:

4. Statistika odlu čivanja: (((( )))) (((( ))))n nxD max F x F x= −= −= −= − 0

5. Kriti čna oblast odbacivanja H0 ααααλ λλ λλ λλ λ>>>>0

.αααα ==== 0 05usvaja se

Page 8: SOPUM_P06_2013

30.03.2013.

8

6. Proračun6.1. Određivanje granica intervala i formiranje frekvencija

6.2. Određivaje empirijskih vrednosti raspodele na osnovu tab lica

xi odgovara sredini intervala npr. (((( )))). , . x .⇒⇒⇒⇒ ====10 000 0 375 0 1875

0.9572.437517

0.9332.062526

0.8951.687545

0.8351.312574

0.7410.937583

0.5940.5625172

0.3630.1875111

F0(x)x if iinterval

(((( )))). , .0 000 0 375

[[[[ )))). , .0 375 0 750

[[[[ )))). , .0 750 1 125

[[[[ )))). , .1 125 1 500

[[[[ )))). , .1 500 1 875

[[[[ )))). , .1 875 2 250

[[[[ )))). ,∞∞∞∞2 250

(((( )))) .x . . .= ⋅ ⋅ + + ⋅ = == ⋅ ⋅ + + ⋅ = == ⋅ ⋅ + + ⋅ = == ⋅ ⋅ + + ⋅ = = ⇒⇒⇒⇒

1 41 62511 0 1875 1 2 4375 0 8325

50 50⋯⋯⋯⋯

xλλλλ

≈≈≈≈1

.λλλλ ≈≈≈≈ 1 2012

(((( )))) . xF x e − ⋅− ⋅− ⋅− ⋅= −= −= −= − 1 20120 1

(((( )))) . .F . e − ⋅− ⋅− ⋅− ⋅= −= −= −= − 1 2012 0 3750 375 1

(((( ))))F . .====0 375 0 363

6.3. Određivanje teorijskih vrednosti raspodele na osnovu

(((( )))) (((( ))))i n i iD F x F x= −= −= −= − 0

6.4. Određivanje prora čunskih vrednosti statistike odlu čivanja

npr. D . . .= − == − == − == − =1 0 363 0 22 0 143

(((( )))) in

fF x

n==== npr. (((( ))))n

fF x .

n= = == = == = == = =1

1

110 22

50

0.04310.9572.437517

0.0470.980.9332.062526

0.0450.940.8951.687545

0.0250.860.8351.312574

0.0210.720.7410.937583

0.0340.560.5940.5625172

0.1430.220.3630.1875111

Fn(x)F0(x)x if iinterval

(((( )))). , .0 000 0 375

[[[[ )))). , .0 375 0 750

[[[[ )))). , .0 750 1 125

[[[[ )))). , .1 125 1 500

[[[[ )))). , .1 500 1 875

[[[[ )))). , .1 875 2 250

[[[[ )))). ,∞∞∞∞2 250

6.5. Određivanje Dn

nD .==== 0 143

nD n .λλλλ = == == == =0 1 011

. .ααααλ λλ λλ λλ λ= == == == =0 05 1 3550.143

7. Odluka

. .ααααλ λλ λλ λλ λ> ⇔ >> ⇔ >> ⇔ >> ⇔ >0 1 355 1 011

M: Nulta hipoteza se ne može odbaciti. I: Podaci se raspore đuju po eksponencijalnoj raspodeli

Page 9: SOPUM_P06_2013

30.03.2013.

9

(((( )))) (((( ))))n xD max F x F x= −= −= −= −1 2

Test Kolmogorov-Smirnov-a

Ispituje da li su dve raspodele iste ili razli čite.

Postupak je isti kao kod testa Kolmogorova, ali su

Sistem hipoteza

(((( )))) (((( ))))(((( ))))H F x F x====0 1 2

(((( )))) (((( ))))(((( ))))H F x F x≠≠≠≠1 1 2

Statistika odlu čivanja

Domaći 05

Na sledećem času nastave