Upload
jo-
View
214
Download
0
Embed Size (px)
DESCRIPTION
Statistička obradapodataka umašinstvu
Citation preview
30.03.2013.
1
SOPuM
Neparametarskitestovi hipoteza I deo
Neparametarski testovi
Neparametarski testovi se koriste kada:
�se dokazuje da li uzorak odgovara nekoj raspodeli�Hi kvadrat test�Test Kolmogorova
�poređenje dve raspodele bez obzira na njihov oblik�Test Kolmogorov-Smirnova�U*-test Mann-Withney-a�Test medijane
30.03.2013.
2
Test KolmogorovaPrimer 1
0.464 0.137 2.455 -0.323 -0.068
0.906 -0.513 -0.525 0.595 0.881
-0.482 1.678 -0.057 -1.229 -0.486
-1.787 -0.261 1.237 1.046 -0.508
Testirati hipotezu da je uzorak od 20 elemenata uzet iz popul acije sanormalnom raspodelom . Vrednosti pojedinih merenjaprikazane su u tabeli:
(((( )))). 20 1ℕℕℕℕ
Procedura testiranja hipoteza
1. Identifikacija raspodele po kojoj se podaci rasp oređujuako pretpostavka raspodele nije data konstruiše se histogram.Zadatkom je data pretpostavka o normalnoj raspodeli
2. Postavljanje sistema hipoteza
(((( )))) (((( ))))(((( ))))nH F x F x====0 0
(((( )))) (((( ))))(((( ))))nH F x F x≠≠≠≠1 0
3. Prag zna čajnosti: .αααα ==== 0 05
4. Statistika odlu čivanja: (((( )))) (((( ))))n nxD max F x F x= −= −= −= − 0
5. Kriti čna oblast odbacivanja H0 ααααλ λλ λλ λλ λ>>>>0
usvaja se
30.03.2013.
3
6. Prora čun
(((( ))))i iF xΦΦΦΦ====0(((( ))))ix ,∀ ∈ − +∀ ∈ − +∀ ∈ − +∀ ∈ − + ⇒⇒⇒⇒4 4 (((( ))))~ , 20 1ℕℕℕℕ
(((( ))))n k k
n
, x x
kF x , x x x
n, x x
++++
<<<<= < <= < <= < <= < <
<<<<
1
1
0
1
6.1. Sortiranje podataka po rastu ćem redu
6.2. Određivaje empirijskih vrednosti raspodele na osnovu tab lica
6.3. Određivanje teorijskih vrednosti raspodele na osnovu
npr. (((( ))))x . . .ΦΦΦΦ= −= −= −= − ⇒⇒⇒⇒ − =− =− =− =1 1 787 1 79 0 037
(((( )))) (((( ))))i n i iD F x F x= −= −= −= − 0
npr. (((( ))))nF x .n
= = == = == = == = =1
1 10 05
20
6.4. Određivanje prora čunskih vrednosti statistike odlu čivanja
npr. D . . .= − == − == − == − =1 0 05 0 037 0 013
x i F0(x) Fn(x)
1 -1.787 0.037 0.05 0.013
2 -1.229 0.110 0.10 0.01
3 -0.525 0.300 0.15 0.150
4 -0.513 0.304 0.20 0.104
5 -0.508 0.306 0.25 0.056
6 -0.486 0.315 0.30 0.015
7 -0.482 0.315 0.35 0.035
8 -0.323 0.373 0.40 0.027
9 -0.261 0.397 0.45 0.053
10 -0.068 0.473 0.50 0.027
11 -0.057 0.477 0.55 0.073
12 0.137 0.554 0.60 0.046
13 0.464 0.679 0.65 0.029
14 0.595 0.724 0.70 0.024
15 0.881 0.811 0.75 0.061
16 0.906 0.818 0.80 0.018
17 1.046 0.852 0.85 0.002
18 1.237 0.892 0.90 0.008
19 1.678 0.953 0.95 0.003
20 2.455 0.993 1 0.007
(((( )))) (((( ))))nF x F x−−−− 0
0.150
6.5. Određivanje Dn
(((( )))) (((( ))))n nxD max F x F x= −= −= −= − 0
nD .==== 0 150
nD n .λλλλ = == == == =0 0 67
. .ααααλ λλ λλ λλ λ= == == == =0 05 1 355
7. Odluka
. .ααααλ λλ λλ λλ λ> ⇔ >> ⇔ >> ⇔ >> ⇔ >0 1 355 0 67
M: Nulta hipoteza se ne može odbaciti. I: Podaci se raspore đuju po normalnoj raspodeli
30.03.2013.
4
Primer 2
Rezultati 1000 merenja odstupanja od nominalne mere izraže ni umm, dati su u tabeli. Da li se odstupanje od nominalne mere pon ašapo normalnoj raspodeli (((( )))), 20 1ℕℕℕℕ
25181
41158
9787
14247
20121
frekvencijeintervalfrekvencijeinterval
(((( )))), .−∞ −−∞ −−∞ −−∞ −2 0
[[[[ )))). , .− −− −− −− −2 0 1 5
[[[[ )))). , .− −− −− −− −1 5 1 0
[[[[ )))). , .− −− −− −− −1 0 0 5
[[[[ )))). , .−−−−0 5 0 0
[[[[ )))). , .0 0 0 5
[[[[ )))). , .0 5 1 0
[[[[ )))). , .1 0 1 5
[[[[ )))). , .1 5 2 0
[[[[ )))). , +∞+∞+∞+∞2 0
Procedura testiranja hipoteza
1. Identifikacija raspodele po kojoj se podaci raspo ređujuZadatkom je data pretpostavka o normalnoj raspodeli
2. Postavljanje sistema hipoteza
(((( )))) (((( ))))(((( ))))nH F x F x====0 0
(((( )))) (((( ))))(((( ))))nH F x F x≠≠≠≠1 0
3. Prag značajnosti:
4. Statistika odlu čivanja: (((( )))) (((( ))))n nxD max F x F x= −= −= −= − 0
5. Kriti čna oblast odbacivanja H0 ααααλ λλ λλ λλ λ>>>>0
.αααα ==== 0 05usvaja se
30.03.2013.
5
6. Proračun
(((( ))))i iF xΦΦΦΦ====0(((( ))))ix ,∀ ∈ − +∀ ∈ − +∀ ∈ − +∀ ∈ − + ⇒⇒⇒⇒4 4 (((( ))))~ , 20 1ℕℕℕℕ
6.1. Sortiranje podataka po rastu ćem redu je ve ć urađeno
6.2. Određivaje empirijskih vrednosti raspodele na osnovu tab lica
6.3. Određivanje teorijskih vrednosti raspodele na osnovu
npr. (((( ))))x . . .ΦΦΦΦ= −= −= −= − ⇒⇒⇒⇒ − =− =− =− =1 2 25 2 25 0 0122
(((( )))) (((( ))))i n i iD F x F x= −= −= −= − 0
npr.
6.4. Određivanje prora čunskih vrednosti statistike odlu čivanja
npr. D . . .= − == − == − == − =1 0 0105 0 0122 0 0017
xi odgovara sredini intervala
(((( ))))k
n k i ki
F x n . nn
−−−−
====
= += += += + ∑∑∑∑
1
0
10 5
(((( ))))nF x . = + + + == + + + == + + + == + + + =
4
1 15821 47 87 0 234
1000 2
x F0(x) Fn(x)
1 -2.25 0.01222 0.0105 0.00172
2 -1.75 0.04006 0.0445 0.00444
3 -1.25 0.10565 0.1115 0.00585
4 -0.75 0.22663 0.2340 0.00737
5 -0.25 0.40129 0.4035 0.00221
6 0.25 0.59871 0.5945 0.00421
7 0.75 0.77337 0.7660 0.00737
8 1.25 0.89435 0.8855 0.00885
9 1.75 0.95994 0.9545 0.00544
10 2.25 0.98778 0.9875 0.00028
0.00885
(((( )))) (((( ))))nF x F x−−−− 0
6.5. Određivanje Dn
(((( )))) (((( ))))n nxD max F x F x= −= −= −= − 0
nD .==== 0 00885
nD n .λλλλ = == == == =0 0 28
. .ααααλ λλ λλ λλ λ= == == == =0 05 1 355
7. Odluka
. .ααααλ λλ λλ λλ λ> ⇔ >> ⇔ >> ⇔ >> ⇔ >0 1 355 0 28
M: Nulta hipoteza se ne može odbaciti.
I: Podaci se raspore đuju po normalnoj raspodeli
30.03.2013.
6
Šta se dešava ako se ispituje da li se podaci raspore đuju po normalnoj raspodeli, a pri tome su eksperimentalni podaci van granica -4,+4 ili sredina ili varijansa nisu jednake 0 odnosno 1?
Normalizacija
Ispitivana je pouzdanost revolver struga. Mereno je vreme r adaizmeđu dva otkaza (u mašinskim časovima) i rezultati su prikazani utabeli. Testom Kolmogorova, koriste ći 7 intervala, ispitati da li seintenzitet otkaza ponaša po eksponencijalnom zakonu raspo de.
Primer 3
1.945 0.684 0.889 0.252 0.589
0.834 0.222 0.134 0.660 1.496
0.193 0.418 0.368 1.372 0.423
0.426 1.815 1.105 0.719 1.672
1.505 1.261 0.547 1.322 1.153
0.981 1.382 0.080 0.079 0.645
0.480 0.272 0.582 0.986 0.105
0.063 1.811 1.066 1.326 0.564
0.528 0.734 0.476 0.698 2.729
0.975 0.228 0.771 0.577 2.069
30.03.2013.
7
X
% p
ada
proi
zvod
nje
0
10
20
30
40
50
60
70
80
90
100
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100
Procedura testiranja hipoteza1. Identifikacija raspodele po kojoj se podaci raspo ređuju
Zadatkom je data pretpostavka o eksponencijalnoj
2. Postavljanje sistema hipoteza
(((( )))) (((( ))))(((( ))))nH F x F x====0 0
(((( )))) (((( ))))(((( ))))nH F x F x≠≠≠≠1 0
3. Prag značajnosti:
4. Statistika odlu čivanja: (((( )))) (((( ))))n nxD max F x F x= −= −= −= − 0
5. Kriti čna oblast odbacivanja H0 ααααλ λλ λλ λλ λ>>>>0
.αααα ==== 0 05usvaja se
30.03.2013.
8
6. Proračun6.1. Određivanje granica intervala i formiranje frekvencija
6.2. Određivaje empirijskih vrednosti raspodele na osnovu tab lica
xi odgovara sredini intervala npr. (((( )))). , . x .⇒⇒⇒⇒ ====10 000 0 375 0 1875
0.9572.437517
0.9332.062526
0.8951.687545
0.8351.312574
0.7410.937583
0.5940.5625172
0.3630.1875111
F0(x)x if iinterval
(((( )))). , .0 000 0 375
[[[[ )))). , .0 375 0 750
[[[[ )))). , .0 750 1 125
[[[[ )))). , .1 125 1 500
[[[[ )))). , .1 500 1 875
[[[[ )))). , .1 875 2 250
[[[[ )))). ,∞∞∞∞2 250
(((( )))) .x . . .= ⋅ ⋅ + + ⋅ = == ⋅ ⋅ + + ⋅ = == ⋅ ⋅ + + ⋅ = == ⋅ ⋅ + + ⋅ = = ⇒⇒⇒⇒
1 41 62511 0 1875 1 2 4375 0 8325
50 50⋯⋯⋯⋯
xλλλλ
≈≈≈≈1
.λλλλ ≈≈≈≈ 1 2012
(((( )))) . xF x e − ⋅− ⋅− ⋅− ⋅= −= −= −= − 1 20120 1
(((( )))) . .F . e − ⋅− ⋅− ⋅− ⋅= −= −= −= − 1 2012 0 3750 375 1
(((( ))))F . .====0 375 0 363
6.3. Određivanje teorijskih vrednosti raspodele na osnovu
(((( )))) (((( ))))i n i iD F x F x= −= −= −= − 0
6.4. Određivanje prora čunskih vrednosti statistike odlu čivanja
npr. D . . .= − == − == − == − =1 0 363 0 22 0 143
(((( )))) in
fF x
n==== npr. (((( ))))n
fF x .
n= = == = == = == = =1
1
110 22
50
0.04310.9572.437517
0.0470.980.9332.062526
0.0450.940.8951.687545
0.0250.860.8351.312574
0.0210.720.7410.937583
0.0340.560.5940.5625172
0.1430.220.3630.1875111
Fn(x)F0(x)x if iinterval
(((( )))). , .0 000 0 375
[[[[ )))). , .0 375 0 750
[[[[ )))). , .0 750 1 125
[[[[ )))). , .1 125 1 500
[[[[ )))). , .1 500 1 875
[[[[ )))). , .1 875 2 250
[[[[ )))). ,∞∞∞∞2 250
6.5. Određivanje Dn
nD .==== 0 143
nD n .λλλλ = == == == =0 1 011
. .ααααλ λλ λλ λλ λ= == == == =0 05 1 3550.143
7. Odluka
. .ααααλ λλ λλ λλ λ> ⇔ >> ⇔ >> ⇔ >> ⇔ >0 1 355 1 011
M: Nulta hipoteza se ne može odbaciti. I: Podaci se raspore đuju po eksponencijalnoj raspodeli
30.03.2013.
9
(((( )))) (((( ))))n xD max F x F x= −= −= −= −1 2
Test Kolmogorov-Smirnov-a
Ispituje da li su dve raspodele iste ili razli čite.
Postupak je isti kao kod testa Kolmogorova, ali su
Sistem hipoteza
(((( )))) (((( ))))(((( ))))H F x F x====0 1 2
(((( )))) (((( ))))(((( ))))H F x F x≠≠≠≠1 1 2
Statistika odlu čivanja
Domaći 05
Na sledećem času nastave