Upload
purity
View
58
Download
1
Embed Size (px)
DESCRIPTION
STATISTIKA 3. GRUPIRANJE, ANALIZA I GRAFIČKI PRIKAZ KVANTITATIVNIH PODATAKA. GRUPIRANJE NUMERIČKIH PODATAKA. Numerički podaci grupiraju se tako da se jedinice koje imaju istu ili sličnu vrijednost obilježja svrstavaju u istu grupu. Takve grupe nazivamo razredima. - PowerPoint PPT Presentation
Citation preview
STATISTIKA 3.STATISTIKA 3.GRUPIRANJE, ANALIZA I GRAFIČKI PRIKAZ GRUPIRANJE, ANALIZA I GRAFIČKI PRIKAZ
KVANTITATIVNIH PODATAKAKVANTITATIVNIH PODATAKA
GRUPIRANJE NUMERIČKIH PODATAKAGRUPIRANJE NUMERIČKIH PODATAKA
Princip preglednosti: podatke treba grupirati u što manje grupa čime se povećava preglednostPrincip preciznosti: podatke treba grupirati u što više grupa kako se ne bi smanjila preciznost
Numerički podaci grupiraju se tako da se jedinice koje imaju istu ili sličnu vrijednost obilježja svrstavaju u istu grupu. Takve grupe nazivamo razredima
Nužnost grupiranja kvantitativnih podataka Broj grupa (razreda) i principi preglednosti i preciznosti
VRSTE NUMERIČKOG OBILJEŽJA
Diskontinuirano Kontinuirano
Ako su gornje granice prethodnog razreda za jedinicu manje od donjih granica slijedećeg razreda moramo formirati prave ili precizne granice ovisno o vrsti numeričkog obilježja.
Svaki razred obuhvaća određeni raspon numeričkog obilježja ograničen donjom L1i i gornjom granicom L2i, tako da je: L1i<xi≤L2i
Prvom razredu može nedostajati donja, a zadnjem razredu gornja granica. U tom slučaju prilikom analize moramo procijeniti nedostajuće granice.
Nominalne granice
od do
1000 4999
5000 9999
10000 14999
15000 19999
Prave granice
od do
1000 5000
5000 10000
10000 15000
15000 20000
Precizne granice
od do
999,5 4999,5
4999,5 9999,5
9999,5 14999,5
14999,5 19999,5
Diskontinuirano obilježjeL1i ≤ xi ≤ L2i
Kontinuirano obilježje
L1i ≤ xi <L2i
Microsoft Excel Worksheet
Veličina razreda je raspon vrijednosti obilježja obuhvaćen razredom a izračunava se kao razlika između donje granice tog razreda i donje granice prethodnog razreda: ii=L1i-L1i-1
Razredna sredina je prosjek donje i gornje granice razreda. Ona predstavlja vrijednost obilježja cijelog razreda.
221 ii
i
LLx
Prave granice
od do
1000 5000
5000 10000
10000 15000
15000 20000
Razredna sredina
xi
3000
7500
12500
17500
VRSTE FREKVENCIJA
APSOLUTNE RELATIVNE KUMULATIVNE
“MANJE OD” “VIŠE OD”
Opseg statističkog skupa: broj jedinica statističkog skupaTotal: ukupna vrijednost obilježja Microsoft Excel
Worksheet
SREDNJE VRIJEDNOSTISREDNJE VRIJEDNOSTI
POTPUNEPOTPUNE(IZRAČUNATE)(IZRAČUNATE) POZICIONEPOZICIONE
ARITMETIČKA ARITMETIČKA SREDINASREDINA
MEDIJANMEDIJAN(KVARTILI)(KVARTILI)
GEOMETRIJSKA GEOMETRIJSKA SREDINASREDINA
HARMONIJSKA HARMONIJSKA SREDINASREDINA
MODMOD
ARITMETIČKA SREDINAARITMETIČKA SREDINA
Aritmetička sredina je jednaki dio obilježja koji otpada na svaku jedinicu statističkog skupa
n
ii
n
ii
xxNN
xx
1
1
Osobine aritmetičke sredine:
mase opseg
totalx
Grupirani nizNegrupirani niz
k
iii
k
iik
ii
k
iii
xffxf
xfx
11
1
1
min)(.3
0)(.2
.1
2
maxmin
xx
xx
xxx
i
i
min)(.3
0)(.2
.1
2
maxmin
xxf
xxf
xxx
ii
ii
Microsoft Excel Worksheet
Osnovne operacije sa znakom Σ:
3
1321
ii xxxx
3
1
3
1321321 )(
ii
ii xaxxxaaxaxaxax
3
1
3i
aaaaa
3
1
3
1321 3)(
i iii xbabxabxabxabxa
3
1
223
1
3
1
3
1
22222 23)2()(i
ii i i
iiii xbxabaxbabxabxa
Dokaz osobina aritmetičke sredine:
)()()()()()(
0
0)(
axNaxNxxaxxxax
xxxNx
xx
iii
iii
i
222
22
22
22
222
2222
2
)()()(
)()()(2)(
)())((2)(
)()()(2)(
)()(2)(
)())((2)()()()(
min)(
axNxxax
axNxxaxxx
axNaxxxxx
axNxxaxxxxx
axNxaaxxxxxx
axaxxxxxaxxxax
xx
ii
ii
ii
iii
iii
iiii
i
Microsoft Excel Worksheet
LINEARNA TRANSFORMACIJA OBILJEŽJALINEARNA TRANSFORMACIJA OBILJEŽJA
)()( axNaxi
N
axax i
)(
b
axdbdax iiii
N
dbax
Nbax
bax i
iiiiiiii faxfaxxxfaxxxfaxf )()()()()()(
dbaxf
dfbax
f
axfax
i
ii
i
ii
)(
Microsoft Excel Worksheet
Grafički prikažite slijedeće distribucije:
xi fi
1 202 103 304 255 15
Ukupno 100
Osobe koje traže zaposlenje u županiji "X" prema godinama starosti na 31. 12. 97osobe
od do u tis.
15 20 4620 25 34725 40 23740 50 6450 60 24
Broj zaposle
Broj trg. Radnji
Godine starosti
MODMOD
Mod je vrijednost obilježja koja se najčešće pojavljuje, odnosno vrijednost obilježja kojoj pripada najveća frekvencija
Broj zaposlenih
Broj trg. Radnji
xi fi
1 20
2 10
3 30
4 25
Ukupno 100
i)cb()ab(
)ab(LMo 1
Broj
neispravnih proizvoda
Broj kutija
od do fi
0 2 34
2 4 150
4 6 200
6 8 80
8 10 30
500
Modalni razred je razred sa najvećom frekvencijomAko razredi nisu jednaki potrebno je korigirati fr.L1-donja granica modalnog razredab - najveća frekvencijaa - frekvencija ispred modalnog razredac - frekvencija iza modalnog razredai - veličina modalnog razreda
59,42170
5042
80200150200
1502004
Mo
Broj neispravnih proizvoda
Broj kutija
od do fi
0 2 34
2 4 150
4 6 200
6 8 80
8 10 30
500
)()( ... 11 Lxi
bcbYLx
i
bcbYAC
)()( ... 11 Lx
i
abaYLx
i
abaYBD
)()( 11 LMoi
abaLMo
i
bcb
ba
i
ab
i
bcLMo
)( 1
abbc
ibaLMo )()( 1 i
cbab
abLMo
1
0
50
100
150
200
250
0 - 2 2 - 4 4 - 6 6 - 8 8 - 10
(L1; b) (L1+i; b)
(L1; a)
(L1+i; c)
Mo
)( 112
121 XX
XX
YYYY
KUMULATIVNI NIZOVIKUMULATIVNI NIZOVI
od do fi0 2 342 4 1504 6 2006 10 8010 14 3014 20 6
500
Broj neispravnih proizvoda
Broj kutija
Za slijedeću distribuciju frekvencija izračunajte obaKumulativna niza te objasnite njihovo značenje.Nacrtajte odgovarajuće grafove.
Microsoft Excel Worksheet
MEDIJANMEDIJAN
Medijan je srednja vrijednost obilježja koja statiatički niz dijeli na dva jednaka dijela; pola jedinica statističkog skupa ime vrijednost obilježja manju ili jednaku medijanu, a pola jedinica veću ili jednaku medijanu
Neparan broj jedinica:
Paran broj jedinica:
Statistički niz sortirati po veličini:
1
2int
rxMe
Nr
2
2
1
rr xxMe
Nr
Radni staž 9 radnika poduzeća "X"2313
5101215
792
a) Izračunajte medijan koristeći formulub) izračunajte medijan koristeći funkciju medianc) Objasnite značenje dobivenog rezultata
GRUPIRANI NIZOVI
Broj neispravnih proizvoda
Broj kutija
od do fi
0 2 34
2 4 150
4 6 200
6 8 80
8 10 30
10 12 6
500
F
34
184
384
464
494
500
if
fN
LMemed
2
1
L1 - donja granica medijalnog (kvartilnog) razreda
∑f - kumulativna frekvencija ispred medijalnog (kvartilnog) razreda
fmed - originalna frekvencija medijalnog (kvartilnog) razreda
i - veličina medijalnog (kvartilnog) razreda
Medijalni (kvartilni) razred je onaj koji ima kumulativni frekvenciju neposredno veću od N/2
66,466,042200
6642
200
1842504
Me
Broj neispravnih proizvoda
Broj kutija
od do fi
0 2 34
2 4 150
4 6 200
6 8 80
8 10 30
10 12 6
500
F
34
184
384
464
494
500
med
med
f
ifYLxLx
i
ffffYAB 11...
if
fNLMe
med
2
1
0
50
100
150
200
250
300
350
400
450
500
0 2 4 6 8 10 12
N/2
Me
A(L1; ∑f)
B(L1+i; ∑f+fmed)
Microsoft Excel Worksheet
Kvartili
Q1 (donji kvartil)
if
fNLQ
q
4
11
Donji kvartil je srednja vrijednost koja niz dijeli tako da 25% jedinica ima vrijednost obilježja manju ili jednaku Q1 a 75% veću ili jednaku
Q3 (gornji kvartil)
if
fNLQ
q
4
3
13
Gornji kvartil je srednja vrijednost koja niz dijeli tako da 75% jedinica ima vrijednost obilježja manju ili jednaku Q3 a 25% veću ili jednaku
Za slijedeće podatke izračunajte: aritmetičku sredinu, mod, medijan i kvartile
Studenti prema broju bodova na ispitu "X"
od do
0 10 18
10 20 46
20 30 59
30 40 113
40 50 135
50 60 88
60 70 34
70 100 7500
Broj bodova Br. studenata
MJERE DISPERZIJEMJERE DISPERZIJERASPON VARIJACIJE:
(Raspon između najveće i najmanje vrijednosti obilježja)
minmax XXR
INTERKVARTIL(Raspon srednjih 50% članova niza)
13 QQIQ
KOEFICIJENT KVARTILNE DEVIJACIJE(Relativna mjera za interkvartil)
1V0 Q13
13
QQVQ
22
2
22222
2 22
xN
x
N
xN
N
xx
N
x
N
xxxx
N
xx
i
iiiii
2
100x
V
VARIJANCA(Prosječno kvadratno odstupanje od prosjeka)
STANDARDNA DEVIJACIJA(Prosječno odstupanje od prosjeka)
KOEFICIJENT VARIJACIJE(Relativna mjera standardne devijacije)
222
2 xf
xf
f
xxf
Microsoft Excel Worksheet
MOMENTIMOMENTI
CENTRALNI MOMENTIMOMENTI OKO SREDINE
POMOĆNI MOMENTI
OKO NULE OKO “a”
Centralni ili glavni momenti (momenti oko aritmetičke sredine)Prosječno odstupanje od aritmetičke sredine na određenu potenciju
N
xxM i
ri
r
ii
i
rii
r f
xxfMM1=0
M0=1
M2=δ2
Za negrupirane podatke
Microsoft Excel Worksheet
Za grupirane podatke
Microsoft Excel Worksheet
Pomoćni momenti oko nuleProsječno odstupanje od nule
Za negrupirane podatke Za grupirane podatke
N
xm i
ri
r
ii
i
rii
r f
xfm
xm
m
1
0 1
Pomoćni momenti oko “a”Prosječno odstupanje od “a”
Za negrupirane podatke Za grupirane podatke
N
dm i
ri
r
ˆ
ii
i
ir
i
r f
dfm̂
dm
m
1
0
ˆ
1ˆ
Microsoft Excel Worksheet
Microsoft Excel Worksheet
Izračunavanje centralnih momenata preko pomoćnih
41
2121344
311233
2122
364
23
mmmmmmM
mmmmM
mmM
)ˆ3ˆˆ6ˆˆ4ˆ(
)ˆ2ˆˆ3ˆ(
)ˆˆ(
41
212134
44
31123
33
212
22
mmmmmmbM
mmmmbM
mmbM
STANDARIZIRANO OBILJEŽJESTANDARIZIRANO OBILJEŽJE
Za standardizirano obilježje vrijedi:
0z
1z
Standardizirano obilježje je oblik linearne transformacije obilježja ipokazuje odstupanje obilježja od prosjeka izraženo u standardnimdevijacijama.
iii
i zxxxx
z
0)(
1
N
xx
N
xx
N
zz
ii
i
11)(1)( 2
2
2
2
2
222
N
xx
N
xx
N
z
N
zz i
i
iiz
Microsoft Excel Worksheet
Koeficijent α3 33
3 M
22 3
Pearsonove mjere asimetrije
ok
MxS
)(3 e
k
MxS
33 kS
Bowleyeva mjera asimetrije13
13 2
mQQS ekq
11 kqS
0 38
x
Me
Mo1Q 3Q
0 38Me x
Mo1Q 3Q
0 38
x1Q Me
Mo
3Q
Simetrična Desnostrana Ljevostrana
ee
Oe
MQQM
MMx
31 ee
eo
MQQM
xMM
31 13 QMMQ
MMx
ee
oe
Microsoft Excel Worksheet
ZAOBLJENOSTZAOBLJENOST
0 444
4
M
Oštraα4>3
Normalnaα4=3
Tupa1,8<α4<3
Pravokutnaα4=1,8
U distribucija0<α4<1,8
Za slijedeće distribucije ocjenite asimetriju i zaobljenost
Studenti prema broju bodova na ispitu "X"
od do0 10 1810 20 4620 30 5930 40 11340 50 13550 60 8860 70 3470 100 7
500
Red. br. gospod.
Površina (ha)
1 52 33 24 15 46 37 68 3
Broj bodova Br. studenata
Zadaci za vježbu1.
Za 5 poduzeća zadani su slijedeći podaci
Poduzeće Ukupna plaća
Broj radnika Plaća po radniku
A B C D E
450000
750000
384000
200 300
120
3000 3500
3200 Ukupno 2684000 870
Plaću po radniku prikažite grafički i izračunajte prosječnu plaču za sva poduzeća zajedno
2. Akumulacija i udio akumulacije u neto proizvodu
Djelatnosti Akumulacija Udio akumulacije u
neto proizvodu INDUSTRIJA 849 0.567 PROMET I VEZE 689 0.579 TRGOVINA 841 0.756 UGOST. I TURIZAM 73 0.553 OSTALO 395 0.508
a) Izračunajte prosječni udio akumulacije u neto proizvodu za sve djelatnosti zajedno b) Grafički prikažite udio akumulacije u neto proizvodu po djelatnostima
3. Struktura prometa tereta s inozemstvom u lukama Hrvatske i indeks prometa TRANZIT=100 u Sloveniji
Promet tereta % u Hrvatskoj Indeks u Sloveniji IZVOZ 13 80 UVOZ 65 320 TRANZIT 22 100
Ako je u uvozu promet u Hrvatskoj bio 13000, a u Sloveniji 1600 strukturnim polukrugovima prikažite struktutu prometa u lukama slovenije i Hrvatske.
4. Živorođeni u Republici Hrvatskoj prema starosti majke 1990.
starost majke broj živorođenih 15 - 19 4 650 20 - 24 21 543 25 - 29 18 039 30 - 34 8 089 35 - 39 2 646 40 - (54) 485
a) Izračunajte najčešću starost majki b) Ocijenite asimetriju distribucije preko Pearsonovih mjera asimetrije