Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
1
Osnovni pojmovi u statistici
Predmet statistike su masovne pojave odnosno pojave koje obuhvataju veliki broj
elemenata sa nekim zajedničkim obeležjem (tj. svojstvom). Statistika objašnjava načine
prikupljanja i grupisanja podataka, a zatim razrađuje metode proučavanja tih podataka s obzirom
na postavljeni cilj ispitivanja.
Mere centralne tendencije
Brojne karakteristike koje slučajnu veličinu u nizu problema dovoljno reprezentuju su
poznate pod imenom mere centralne tendencije. Tu spadaju sledeće brojne karakteristike:
1. Aritmetička srednja vrednost slučajne veličine predstavlja najvažniju meru centralne
tendencije. Ona se obeležava znakom x (,,iks srednje", ,,iks bar") i izračunava jednačinom:
n
x
n
x....xxx
n
ii
n
121
ili, kada se radi o grupisanim vrednostima:
n
ii
n
iii
n
nn
f
xf
f....ff
xf....xfxfx
1
1
21
2211
tj.
1
n
xf
x
n
iii
gde je: xi - uopštena oznaka svojstva odnosno veličine,
fi - učestalost svojstva odnosno veličine,
n - obim svojstva odnosno veličine (npr. broj uzoraka za ispitivanje).
Nedostatak srednje vrednosti je ta što ona uzima u obzir sve podatke, i one
najekstremnije, pa se tako gubi predstava tendencije te pojave. Ali, jednostavno izračunavanje
ove vrednosti je doprinelo da se ona najviše koristi.
2. Geometrijska srednja vrednost, npr. dva broja, jednaka je drugom korenu proizvoda ta
dva broja. Geometrijska sredina tri broja jednaka je trećem korenu iz proizvoda ta tri broja itd.
Prema tome, geometrijska srednja vrednost gx se definiše kao n-ti koren iz proizvoda n -
varijanata (brojeva):
nng x.....xxx 21
3. Harmonijska srednja vrednost predstavlja odnos obima probe (uzorka) prema sumi
(zbiru) recipročnih vrednosti svih varijanti uzorka, tj.:
2
1
1
ili 1
1
1
n
x
x
x
nx
n
i i
hn
i i
h
4. Srednja kvadratna vrednost predstavlja drugi koren količnika zbira kvadrata svih
varijanata i obima uzorka:
ili 1
2
1
2
n
xf
xn
x
x
n
iii
kv
n
ii
kv
Prva jednačina odnosi se na negrupisane, a druga jednačina na grupisane merne
vrednosti.
5. Srednja kubna vrednost predstavlja treći koren količnika zbira kubova svih varijanata i
obima uzorka:
3
1
3
31
3
ili n
xf
xn
x
x
n
iii
kub
n
ii
kub
6. Modus (modalna vrednost) predstavlja varijantu sa najvećom učestalošću xmod.
7. Medijana predstavlja vrednost varijante statističkog skupa ili mase koja deli varijacioni
niz na dva dela jednaka po obimu xmed.
Mere varijacije
Za ispitivanje bilo kog obeležja potrebno je poznavanje ne samo brojne karakteristike
mera centralne tendencije, već i stepen variranja elemenata oko srednje vrednosti nekog
statističkog skupa ili mase. Najpoznatije mere varijacije su:
1. Raspon je razlika između maksimalne i minimalne varijante u ispitivanom uzorku
R = xmax - xmin
Raspon kao mera varijacije koristi se za brzo, ali ne potpuno tačno određivanje rasipanja
u slučaju kada je n 10. Može se obeležiti i sa I (interval promene).
2. Linearno odstupanje od srednje vrenosti, ili samo odstupanje od srednje vrednosti se
dobija kao apsolutna vrednost od razlike svake vrednosti za xi i srednje vrednosti x :
xxΔx i
3. Srednje linearno (apsolutno) odstupanje predstavlja srednju vrednost linearnih
odstupanja:
3
n
xxf
ΘQn
xx
n
Δx
ΘQ
n
iii
n
ii
n
ii
111 ili
4. Koeficijent linearne neravnomernosti predstavlja odnos između srednjeg linearnog
odstupanja i srednje aritmetičke vrednosti:
100x
ΘN (%)
5. Disperzija prestavlja srednju vrednost kvadrata odstupanja pojedinačnih vrednosti od
srednje vrednosti. Obeležava se sa 2 ili D i ima dimenzije kao i slučajna veličina na kvadrat. Za
uzorke obima n 20 izračunava se po formuli:
1
11
2
1
2
n
xx
n
Δx
D
n
ii
n
ii
ili
11
2
n
xxf
D
n
iii
Ako je uzorak obima n > 20, onda je:
n
i
n
iiiii Δxf
nΔxf
nD
1 1
22 1
1-
1
tj.
n
xxf
D
n
iii
1
2
gde je: xxx ii .
6. Standardna devijacija ili srednje kvadratno odstupanje karakteriše stepen odstupanja
slučajne veličine od njene srednje vrednosti i ima iste dimenzije kao i slučajna veličina.
Obeležava se sa ili SD.
DSD
7. Koeficijent varijacije CV predstavlja relativno statističko merilo rasipanja slučajne
veličine oko srednje vrednosti:
(%) 100 x
SDCV
Statistička sigurnost
Karakteristično je da svaki statistički zaključak na osnovu uzorka obima n obično nije
sasvim pouzdan, već mu pripada samo određena verovatnoća ili određena statistička sigurnost S.
Statistička sigurnost izražava se procentima.
Za neku metodu, po kojoj se donosi zaključak na osnovu uzorka, kaže se da ima sigurnost
od 95 %, ako u 95 % slučajeva dovodi do ispravnih zaključaka a u preostalih 5 % slučajeva do
pogrešnih zaključaka.
4
U praksi ispitivanja tekstila najpogodnije je upotrebljavati statističke sigurnosti 95 %,
99 %, 99,9 % ili 95,44 % i 99,73 %. Ove vrednosti važe samo za Gausovu normalnu raspodelu
ili za raspodelu koja se ne razlikuje mnogo od normalne Gausove raspodele.
Ocena mera srednje vrednosti, standardne devijacije i koeficijenta varijacije
Tačnost aritmetičke sredine x ocenjuje se intervalom poverenja ili praktičnom granicom
greške.
Poznato je da se zaključak o ispitivanom skupu date statističke mase donosi na osnovu
uzorka pa je zato potrebno odrediti praktične granice odstupanja X , to jest:
xp pxX
gde je: X - srednja vrednost ispitivanog svojstva materijala u partiji,
px - srednja vrednost ispitivanog svojstva materijala u probi, odgovara srednjoj vrednosti
ispitivanog svojstva x ,
xp - greška srednje aritmetičke vrednosti probe.
Greška srednje vrednosti (praktična granica greške) određuje se iz jednačine:
n
SDpx
gde je: - faktor koji zavisi od statističke sigurnosti i ima vrednost:
kod S = 68,26 % = 1,000
kod S = 95 % = 1,960
kod S = 99 % = 2,576
kod S = 99,99 % = 3,291
U slučaju velikog broja merenja, faktor zamenjuje se faktorom t, pa je tada:
n
SDtpx
gde je: t - faktor koji zavisi od statističke sigurnosti i broja stepena slobode ns (ns = n - 1) čije su
vrednosti date u tabeli.
U praksi, veličina greške xp izražava se kao relativna greška srednje vrednosti izražena u
procentima:
(%) 100 x
pp x
r
Interval poverenja standardne devijacije SD kod uzoraka obima n 30, tj. greška
standardne devijacije, određuje se iz jednačine:
n
SDpSD
2
5
Za uzorke obima n 30 granica poverenja se određuje iz jednačine:
n
SDpSD
2
2
Interval poverenja koeficijenta varijacije CV određuje se iz jednačine:
1-
2
2
nc
n
n
CVp
n
CV
gde je: cn - koeficijent koji zavisi od broja merenja i može imati sledeće vrednosti:
n = 10 cn = 0,973
n = 15 cn = 0,982
n = 20 cn = 0,987
n 30 cn 1
Za uzorke obima n 30 koristi se takođe i jednačina:
n
CVpCV
2
2
Tabela. Vrednosti faktora t u zavisnosti od statističke sigurnosti i broja stepena slobode ns S = 70 % S = 80 % S = 90 % S = 95 % S = 99 % S = 99,9 %
1 1,96 3,08 6,31 12,71 63,66 636,62
2 1,39 1,89 2,92 4,30 9,92 31,60
3 1,25 1,64 2,35 3,18 5,84 12,94
4 1,19 1,53 2,13 2,78 4,60 8,61
5 1,16 1,48 2,02 2,57 4,03 6,86
6 1,13 1,44 1,94 2,45 3,71 5,96
7 1,12 1,42 1,90 2,37 3,50 5,41
8 1,11 1,40 1,86 2,31 3,36 5,04
9 1,10 1,38 1,83 2,26 3,25 4,78
10 1,09 1,37 1,81 2,23 3,17 4,59
14 2,15 2,98 4,14
19 2,09 2,86 3,88
24 2,064 2,797 3,745
29 2,045 2,756 3,659
30 2,042 2,750 3,646
100 1,984 2,626 3,390
200 1,972 2,601 3,340
300 1,968 2,592 3,324
400 1,966 2,588 3,315
500 1,965 2,586 3,310
1000 1,962 2,581 3,300
1,960 2,576 3,291
Linearna ili Uster-Sommerova metoda
Do nedavno, Uster-Sommer-ova metoda se skoro isključivo primenjivala u ispitivanju
tekstila i kontroli ravnomernosti pojedinih obeležja vlakana, traka, pređa ili gotovih proizvoda.
Sve brojne vrednosti dobijene pri merenju nekog obeležja se svrstavaju u dve grupe: gornju i
donju. U gornju grupu ulaze vrednosti veće od aritmetičke srednje vrednosti uključujući i one
koje su brojno jednake srednjoj vrednosti. Preostale vrednosti tj. brojne vrednosti manje od
6
aritmetičke sredine pripadaju donjoj grupi vrednosti. Ako se zbir u odgovarajućoj grupi podeli
brojem vrednosti u njoj, dobija se gornji, odnosno donji prosek. Na osnovu aritmetičke sredine,
gornjeg i donjeg proseka izračunava se odstupanje naviše, odnosno naniže, čija se aritmetička
sredina naziva prosečno odstupanje ili neravnomernost po Someru. Kada se ta vrednost oduzme
od 100 dobija se tzv. ravnomernost po Someru.
Odstupanje naviše je odnos razlike gornjeg proseka ( gx ) i srednje vrednosti ( x ) prema
aritmetičkoj sredini svih vrednosti izraženo u procentima tj.:
100
x
xxO
g
g (%)
Odstupanje naniže predstavlja odnos razlike srednje vrednosti ( x ) i donjeg proseka ( dx )
prema aritmetičkoj sredini svih vrednosti, tj.:
100
x
xxO d
d (%)
Neravnomernost po Someru NS se određuje iz jednačine:
2
dg
S
OON
(%)
a ravnonernost RS iz razlike:
SS NR 100 (%)
Prema Someru, ukoliko je neravnomernost ispitivanog obeležja nekog materijala do
10 %, onda se isti smatra vrlo ravnomernim, od 10÷15 % ravnomernim, a preko 15 %
neravnomernim.
I pored toga što je linearna metoda najjednostavnija i najstarija ona ima više nedostataka:
- ravnomernost razmatra jednostrano, tj. posebno gornje od donje grupe vrednosti, pa
time ne daje celokupnu ocenu ravnomernosti,
- uključivanjem vrednosti merenja koje su jednake aritmetičkoj sredini u gornju grupu
uvećana je ravnomernost gornje grupe na račun donje,
- simetričnost rezultata, koja je veoma važna linearna metoda, se narušava tj. različita su
odstupanja.
- Somerova metoda ne reaguje osetljivo (precizno) na uvećanje pojedinih odstupanja.
Grafički prikaz
Rezultati merenja jednog svojstva mogu se prikazati i grafički. U ispitivanju tekstila
najveće primene imaju sledeći grafici:
1. Poligon učestalosti se konstruiše tako da se na x-osu (apscisa) nanose vrednosti
ispitivanog svojstva (odnosno srednje vrednosti grupa) a na y-osu (ordinata) odgovarajuća
učestalost tih vrednosti (odnosno grupa).
2. Histogram se konstruiše tako što se na x-osu nanose granice grupa sa određenim
intervalom, a nad njima se crtaju pravougaonici sa visinom učestalosti tih grupa (y-osa).
3. Kumulativna kriva raspodele učestalosti se konstruiše tako što se na x-osu nanosi
kumulativna (zbirna) učestalost, a na y-osu vrednost svojstva.
7
Zadaci
1. Merenjem podužne mase pamučnih vlakana dobijene su sledeće vrednosti u dtex: 1,71;
1,73; 1,72; 1,69; 1,7; 1,71; 1,73; 1,71; 1,72; 1,7. Izračunati sve srednje vrednosti podužnih masa.
Neuređeni statistički
skup podataka, Ttvl (dtex)
Uređeni statistički skup
Ttvl (dtex)
Skraćeno predstavljanje uređenog statističkog skupa
Podužna masa Ttvl (dtex) Učestalost fi
1,71 1,69 1,69 1
1,73 1,7 1,7 2
1,72 1,7 1,71 3
1,69 1,71 1,72 2
1,7 1,71 1,73 2
1,71 1,71 xmod = 1,71 dtex
705,12
71,17,1
medx dtex
1,73 1,72
1,71 1,72
1,72 1,73
1,7 1,73
712,110
73,1272,1271,137,1269,11
n
Tf
T
n
iitvli
tvl dtex
dtex 712,173,173,172,172,171,171,171,17,17,169,1
10
21
gtvl
nntvltvltvlgtvl
T
T..... T TT
712,1
73,1
12
72,1
12
71,1
13
7,1
12
1,69
1
10
1
1
n
i itvl
i
htvl
Tf
nT dtex
712,110
73,1272,1271,137,1269,1
222221
2
n
Tf
T
n
iitvli
kvtvl dtex
712,110
73,1272,1271,137,1269,13
333333
1
3
n
Tf
T
n
iitvli
kubtvl dtex
2. Ispitivana je prekidna sila pamučne pređe dveju partija u cN. I partija: 98, 98, 98, 196,
196, 196 cN; II partija: 98, 98, 196, 196, 294, 294 cN. Potrebno je oceniti koja je partija
ravnomernija po prekidnoj sili.
- srednja vrednost
1476
19639831I
n
Ff
F
n
iaii
a cN
1966
29421962982II
aF cN
8
- koeficijent neravnomernosti
Iz 100x
N
i n
xxfn
iii
1 1001
xn
xxf
N
n
iii
(%)
33,331001476
1471963147983100
I
1I
I
a
n
iaaii
Fn
FFf
N %
33,331001966
19629421961962196982II
N %
Koeficijent neravnomernosti nije sigurna ocena varijacije. Zato se primenjuju disperzija,
standardna devijacija i koeficijent varijacije:
- disperzija
2,288116
1471963147983
1
22
1
2
I
n
Ff
D
n
iaii
cN2
2,768316
19629421961962196982222
II
D cN2
- standardna devijacija
67,532881,2 II DSD cN
65,877683,2 II SD cN
- koeficijent varijacije
% 36,51100147
53,67100
I
I a
I
F
SDCV
% 72,44100196
87,65II CV
Kao što se vidi CVI < CVII a to znači da je prva pređa ravnomernija po prekidnoj sili.
3. Pri ispitivanju dužine kratkih i finih vunenih vlakana jedne partije, iz uzete probe su
dobijene sledeće vrednosti dužine u mm: 50, 20, 70, 60, 30, 90, 50, 60, 10 i 60 mm. Izračunati:
srednju aritmetičku dužinu, srednje linearno odstupanje, koeficijent neravnomernosti, disperziju,
standardnu devijaciju, koeficijent varijacije, srednju vrednost dužine vlakana u partiji, relativnu
grešku srednje vrednosti pri statističkoj sigurnosti od 95 %.
- srednja aritmetička dužina
9
5010
901701603502301201101 1
n
lf
l
n
iii
mm
- srednje linearno odstupanje
mm 1810
509050705060350502503050205010
1
n
llfn
iii
- koeficijent neravnomernosti
3610050
18100
lN
%
- disperzija
2
2222222
1
2
mm 78,577
110
509050705060350502503050205010
1
D
D
n
lf
D
n
iii
- srednje kvadratno odstupanje (standardna devijacija)
04,2478,577 DSD mm
- koeficijent varijacije
08,4810050
04,24100
l
SDCV %
- srednja vrednost dužine vlakana u partiji (S = 95 %)
Za S = 95 % faktor je = 1,96
9,1410
24,041,96
n
SDp
l
mm
9,1450lp plL mm
gde je: ll p .
10
- relativna greška srednje vrednosti
8,2910050
9,14 100
l
pp l
r %
4. Pri merenju podužne mase pamučne pređe dobijene rezultate iz tabele predstaviti
grafički.
Granica grupe
podužnih masa (tex)
Učestalost,
fi
1012
1214
1416
1618
1820
2022
2224
2
8
9
12
10
5
4
Za lakše prikazivanje poslužiće sledeća tabela:
Granica grupe
(tex)
Srednja vrednost
(tex)
Apsolutna
učestalost
Relativna učestalost
fi (%)
Kumulativna
učestalost fi (%)
1012
1214
1416
1618
1820
2022
2224
11
13
15
17
19
21
23
2
8
9
12
10
5
4
4
16
18
24
20
10
8
4
20
38
62
82
92
100
50 100
Relativna učestalost za prvi red: % 410050
2if
10 12 14 16 18 20 22 24
0
5
10
15
20
25
f i (%
)
Tt (tex) Poligon raspodele podužne mase pređe Histogram raspodele podužne mase pređe
11
Kumulativna kriva raspodele podužne mase pređe
5. Pri ispitivanju dužine srednje dugih pamučnih vlakana jedne partije, iz uzete probe su
dobijene sledeće vrednosti dužine u mm: 14,5; 19,8; 22,6; 25,4; 16,1; 16; 23,9; 27; 27,7; 20,9;
21,3; 19,6; 23,1; 17; 21,9; 24,4; 28; 17,7; 23,1; 18,7; 19,1; 25,4; 20,5; 22,7; 23; 15,5; 27,1; 25;
18; 22,7; 18,5; 21,5; 19,9; 21,6; 24,1; 22; 20,1; 18,3; 24; 23,7. Rezultate klasirati prema klasnim
intervalom od 2 mm. Zatim izračunati: srednju aritmetičku dužinu, srednje linearno odstupanje,
koeficijent linearne neravnomernosti, disperziju, standardnu devijaciju, koeficijent varijacije,
srednju vrednost dužine vlakana u partiji pri statističkoj sigurnosti od 95 %, relativnu grešku
srednje vrednosti, poligon i histogram raspodele vlakana po dužini.
Granica
grupe (mm)
Broj vlakana u
grupi li (mm) ni (fi) li ni ai ll iai nll iai nll
2
1416
1618
1820
2022
2224
2426
2628
׀ ׀ ׀
׀ ׀ ׀ ׀
׀ ׀ ׀ ׀ ׀ ׀ ׀
׀ ׀ ׀ ׀ ׀ ׀ ׀ ׀
׀ ׀ ׀ ׀ ׀ ׀ ׀ ׀ ׀
׀ ׀ ׀ ׀ ׀
׀ ׀ ׀ ׀
15
17
19
21
23
25
27
3
4
7
8
9
5
4
45
68
133
168
207
125
108
6,35
4,35
2,35
0,35
1,65
3,65
5,65
19,05
17,4
16,45
2,8
14,85
18,25
22,6
120,9675
75,69
38,75
0,98
24,5025
66,6125
127,69
40 854 111,4 456,1925
- srednja aritmetička dužina
35,2140
854 1
n
ln
l
n
iii
mm
- srednje linearno odstupanje
785,240
4,1111
n
llnn
iii
mm
- koeficijent linearne neravnomernosti
0445,1310035,21
785,2100
lN
%
- disperzija (n 20)
12
21
2
i
mm 4048,1140
1925,456l
n
ln
D
n
ii
- srednje kvadratno odstupanje (standardna devijacija)
3771,34048,11 DSD mm
- koeficijent varijacije
8178,1510035,21
3771,3100
l
SDCV %
- srednja vrednost dužine vlakana u partiji (S = 95 %)
Za S = 95 % faktor je = 1,96
0466,140
3,37711,96
n
SDp
l
mm
0466,135,21 lp plL mm
gde je: ll p .
- relativna greška srednje vrednosti
9021,410035,21
0466,1 100
l
pp l
r %
6. Ispitivanjem broja uvoja vunene pređe dobijene su sledeće vrednosti u m-1: 650, 690,
620, 650, 660, 630, 650, 640, 660, 630 m-1. Odrediti ravnomernost pređe prema broju uvoja
Somerovom metodom.
13
64810
64801
n
Tf
T
n
iii
m-1
Merne vrednosti broja
uvoja T (m-1)
Grupe mernih vrednosti (m-1)
gornja donja
650 650
690 690
620 620
650 650
660 660
630 630
650 650
640 640
660 660
630 630
Σ 6480 Σ 3960 Σ 2520
648x 660gx 630dx
6606
39601
n
Tf
T
n
iii
g m-1
6304
25201
n
Tf
T
n
iii
d m-1
85,1100648
648660100
T
TTO
g
g %
77,2100648
630648100
T
TTO d
d %
31,22
77,285,1
2
dgS
OON %
69,9731,2100100 SS NR %
Tmax = 690 m-1, Tmin = 620 m-1,
Ispitivana pređa u pogledu ravnomernosti broja uvoja je vrlo ravnomerna jer je NS manje
od 10 % (2,31 %).