26
STATISTIKA STATISTIKA 3. 3. GRUPIRANJE, ANALIZA I GRAFIČKI PRIKAZ GRUPIRANJE, ANALIZA I GRAFIČKI PRIKAZ KVANTITATIVNIH PODATAKA KVANTITATIVNIH PODATAKA

STATISTIKA 3

  • Upload
    purity

  • View
    58

  • Download
    1

Embed Size (px)

DESCRIPTION

STATISTIKA 3. GRUPIRANJE, ANALIZA I GRAFIČKI PRIKAZ KVANTITATIVNIH PODATAKA. GRUPIRANJE NUMERIČKIH PODATAKA. Numerički podaci grupiraju se tako da se jedinice koje imaju istu ili sličnu vrijednost obilježja svrstavaju u istu grupu. Takve grupe nazivamo razredima. - PowerPoint PPT Presentation

Citation preview

Page 1: STATISTIKA  3

STATISTIKA 3.STATISTIKA 3.GRUPIRANJE, ANALIZA I GRAFIČKI PRIKAZ GRUPIRANJE, ANALIZA I GRAFIČKI PRIKAZ

KVANTITATIVNIH PODATAKAKVANTITATIVNIH PODATAKA

Page 2: STATISTIKA  3

GRUPIRANJE NUMERIČKIH PODATAKAGRUPIRANJE NUMERIČKIH PODATAKA

Princip preglednosti: podatke treba grupirati u što manje grupa čime se povećava preglednostPrincip preciznosti: podatke treba grupirati u što više grupa kako se ne bi smanjila preciznost

Numerički podaci grupiraju se tako da se jedinice koje imaju istu ili sličnu vrijednost obilježja svrstavaju u istu grupu. Takve grupe nazivamo razredima

Nužnost grupiranja kvantitativnih podataka Broj grupa (razreda) i principi preglednosti i preciznosti

VRSTE NUMERIČKOG OBILJEŽJA

Diskontinuirano Kontinuirano

Page 3: STATISTIKA  3

Ako su gornje granice prethodnog razreda za jedinicu manje od donjih granica slijedećeg razreda moramo formirati prave ili precizne granice ovisno o vrsti numeričkog obilježja.

Svaki razred obuhvaća određeni raspon numeričkog obilježja ograničen donjom L1i i gornjom granicom L2i, tako da je: L1i<xi≤L2i

Prvom razredu može nedostajati donja, a zadnjem razredu gornja granica. U tom slučaju prilikom analize moramo procijeniti nedostajuće granice.

Nominalne granice

od do

1000 4999

5000 9999

10000 14999

15000 19999

Prave granice

od do

1000 5000

5000 10000

10000 15000

15000 20000

Precizne granice

od do

999,5 4999,5

4999,5 9999,5

9999,5 14999,5

14999,5 19999,5

Diskontinuirano obilježjeL1i ≤ xi ≤ L2i

Kontinuirano obilježje

L1i ≤ xi <L2i

Microsoft Excel Worksheet

Veličina razreda je raspon vrijednosti obilježja obuhvaćen razredom a izračunava se kao razlika između donje granice tog razreda i donje granice prethodnog razreda: ii=L1i-L1i-1

Page 4: STATISTIKA  3

Razredna sredina je prosjek donje i gornje granice razreda. Ona predstavlja vrijednost obilježja cijelog razreda.

221 ii

i

LLx

Prave granice

od do

1000 5000

5000 10000

10000 15000

15000 20000

Razredna sredina

xi

3000

7500

12500

17500

VRSTE FREKVENCIJA

APSOLUTNE RELATIVNE KUMULATIVNE

“MANJE OD” “VIŠE OD”

Page 5: STATISTIKA  3

Opseg statističkog skupa: broj jedinica statističkog skupaTotal: ukupna vrijednost obilježja Microsoft Excel

Worksheet

SREDNJE VRIJEDNOSTISREDNJE VRIJEDNOSTI

POTPUNEPOTPUNE(IZRAČUNATE)(IZRAČUNATE) POZICIONEPOZICIONE

ARITMETIČKA ARITMETIČKA SREDINASREDINA

MEDIJANMEDIJAN(KVARTILI)(KVARTILI)

GEOMETRIJSKA GEOMETRIJSKA SREDINASREDINA

HARMONIJSKA HARMONIJSKA SREDINASREDINA

MODMOD

Page 6: STATISTIKA  3

ARITMETIČKA SREDINAARITMETIČKA SREDINA

Aritmetička sredina je jednaki dio obilježja koji otpada na svaku jedinicu statističkog skupa

n

ii

n

ii

xxNN

xx

1

1

Osobine aritmetičke sredine:

mase opseg

totalx

Grupirani nizNegrupirani niz

k

iii

k

iik

ii

k

iii

xffxf

xfx

11

1

1

min)(.3

0)(.2

.1

2

maxmin

xx

xx

xxx

i

i

min)(.3

0)(.2

.1

2

maxmin

xxf

xxf

xxx

ii

ii

Microsoft Excel Worksheet

Page 7: STATISTIKA  3

Osnovne operacije sa znakom Σ:

3

1321

ii xxxx

3

1

3

1321321 )(

ii

ii xaxxxaaxaxaxax

3

1

3i

aaaaa

3

1

3

1321 3)(

i iii xbabxabxabxabxa

3

1

223

1

3

1

3

1

22222 23)2()(i

ii i i

iiii xbxabaxbabxabxa

Page 8: STATISTIKA  3

Dokaz osobina aritmetičke sredine:

)()()()()()(

0

0)(

axNaxNxxaxxxax

xxxNx

xx

iii

iii

i

222

22

22

22

222

2222

2

)()()(

)()()(2)(

)())((2)(

)()()(2)(

)()(2)(

)())((2)()()()(

min)(

axNxxax

axNxxaxxx

axNaxxxxx

axNxxaxxxxx

axNxaaxxxxxx

axaxxxxxaxxxax

xx

ii

ii

ii

iii

iii

iiii

i

Microsoft Excel Worksheet

Page 9: STATISTIKA  3

LINEARNA TRANSFORMACIJA OBILJEŽJALINEARNA TRANSFORMACIJA OBILJEŽJA

)()( axNaxi

N

axax i

)(

b

axdbdax iiii

N

dbax

Nbax

bax i

iiiiiiii faxfaxxxfaxxxfaxf )()()()()()(

dbaxf

dfbax

f

axfax

i

ii

i

ii

)(

Microsoft Excel Worksheet

Page 10: STATISTIKA  3

Grafički prikažite slijedeće distribucije:

xi fi

1 202 103 304 255 15

Ukupno 100

Osobe koje traže zaposlenje u županiji "X" prema godinama starosti na 31. 12. 97osobe

od do u tis.

15 20 4620 25 34725 40 23740 50 6450 60 24

Broj zaposle

Broj trg. Radnji

Godine starosti

Page 11: STATISTIKA  3

MODMOD

Mod je vrijednost obilježja koja se najčešće pojavljuje, odnosno vrijednost obilježja kojoj pripada najveća frekvencija

Broj zaposlenih

Broj trg. Radnji

xi fi

1 20

2 10

3 30

4 25

Ukupno 100

i)cb()ab(

)ab(LMo 1

Broj

neispravnih proizvoda

Broj kutija

od do fi

0 2 34

2 4 150

4 6 200

6 8 80

8 10 30

500

Modalni razred je razred sa najvećom frekvencijomAko razredi nisu jednaki potrebno je korigirati fr.L1-donja granica modalnog razredab - najveća frekvencijaa - frekvencija ispred modalnog razredac - frekvencija iza modalnog razredai - veličina modalnog razreda

59,42170

5042

80200150200

1502004

Mo

Page 12: STATISTIKA  3

Broj neispravnih proizvoda

Broj kutija

od do fi

0 2 34

2 4 150

4 6 200

6 8 80

8 10 30

500

)()( ... 11 Lxi

bcbYLx

i

bcbYAC

)()( ... 11 Lx

i

abaYLx

i

abaYBD

)()( 11 LMoi

abaLMo

i

bcb

ba

i

ab

i

bcLMo

)( 1

abbc

ibaLMo )()( 1 i

cbab

abLMo

1

0

50

100

150

200

250

0 - 2 2 - 4 4 - 6 6 - 8 8 - 10

(L1; b) (L1+i; b)

(L1; a)

(L1+i; c)

Mo

)( 112

121 XX

XX

YYYY

Page 13: STATISTIKA  3

KUMULATIVNI NIZOVIKUMULATIVNI NIZOVI

od do fi0 2 342 4 1504 6 2006 10 8010 14 3014 20 6

500

Broj neispravnih proizvoda

Broj kutija

Za slijedeću distribuciju frekvencija izračunajte obaKumulativna niza te objasnite njihovo značenje.Nacrtajte odgovarajuće grafove.

Microsoft Excel Worksheet

Page 14: STATISTIKA  3

MEDIJANMEDIJAN

Medijan je srednja vrijednost obilježja koja statiatički niz dijeli na dva jednaka dijela; pola jedinica statističkog skupa ime vrijednost obilježja manju ili jednaku medijanu, a pola jedinica veću ili jednaku medijanu

Neparan broj jedinica:

Paran broj jedinica:

Statistički niz sortirati po veličini:

1

2int

rxMe

Nr

2

2

1

rr xxMe

Nr

Radni staž 9 radnika poduzeća "X"2313

5101215

792

a) Izračunajte medijan koristeći formulub) izračunajte medijan koristeći funkciju medianc) Objasnite značenje dobivenog rezultata

Page 15: STATISTIKA  3

GRUPIRANI NIZOVI

Broj neispravnih proizvoda

Broj kutija

od do fi

0 2 34

2 4 150

4 6 200

6 8 80

8 10 30

10 12 6

500

 

F

34

184

384

464

494

500

 

if

fN

LMemed

2

1

L1 - donja granica medijalnog (kvartilnog) razreda

∑f - kumulativna frekvencija ispred medijalnog (kvartilnog) razreda

fmed - originalna frekvencija medijalnog (kvartilnog) razreda

i - veličina medijalnog (kvartilnog) razreda

Medijalni (kvartilni) razred je onaj koji ima kumulativni frekvenciju neposredno veću od N/2

66,466,042200

6642

200

1842504

Me

Page 16: STATISTIKA  3

Broj neispravnih proizvoda

Broj kutija

od do fi

0 2 34

2 4 150

4 6 200

6 8 80

8 10 30

10 12 6

500

 

F

34

184

384

464

494

500

 

med

med

f

ifYLxLx

i

ffffYAB 11...

if

fNLMe

med

2

1

0

50

100

150

200

250

300

350

400

450

500

0 2 4 6 8 10 12

N/2

Me

A(L1; ∑f)

B(L1+i; ∑f+fmed)

Microsoft Excel Worksheet

Page 17: STATISTIKA  3

Kvartili

Q1 (donji kvartil)

if

fNLQ

q

4

11

Donji kvartil je srednja vrijednost koja niz dijeli tako da 25% jedinica ima vrijednost obilježja manju ili jednaku Q1 a 75% veću ili jednaku

Q3 (gornji kvartil)

if

fNLQ

q

4

3

13

Gornji kvartil je srednja vrijednost koja niz dijeli tako da 75% jedinica ima vrijednost obilježja manju ili jednaku Q3 a 25% veću ili jednaku

Za slijedeće podatke izračunajte: aritmetičku sredinu, mod, medijan i kvartile

Studenti prema broju bodova na ispitu "X"

od do

0 10 18

10 20 46

20 30 59

30 40 113

40 50 135

50 60 88

60 70 34

70 100 7500

Broj bodova Br. studenata

Page 18: STATISTIKA  3

MJERE DISPERZIJEMJERE DISPERZIJERASPON VARIJACIJE:

(Raspon između najveće i najmanje vrijednosti obilježja)

minmax XXR

INTERKVARTIL(Raspon srednjih 50% članova niza)

13 QQIQ

KOEFICIJENT KVARTILNE DEVIJACIJE(Relativna mjera za interkvartil)

1V0 Q13

13

QQ

QQVQ

Page 19: STATISTIKA  3

22

2

22222

2 22

xN

x

N

xN

N

xx

N

x

N

xxxx

N

xx

i

iiiii

2

100x

V

VARIJANCA(Prosječno kvadratno odstupanje od prosjeka)

STANDARDNA DEVIJACIJA(Prosječno odstupanje od prosjeka)

KOEFICIJENT VARIJACIJE(Relativna mjera standardne devijacije)

222

2 xf

xf

f

xxf

Microsoft Excel Worksheet

Page 20: STATISTIKA  3

MOMENTIMOMENTI

CENTRALNI MOMENTIMOMENTI OKO SREDINE

POMOĆNI MOMENTI

OKO NULE OKO “a”

Centralni ili glavni momenti (momenti oko aritmetičke sredine)Prosječno odstupanje od aritmetičke sredine na određenu potenciju

N

xxM i

ri

r

ii

i

rii

r f

xxfMM1=0

M0=1

M2=δ2

Za negrupirane podatke

Microsoft Excel Worksheet

Za grupirane podatke

Microsoft Excel Worksheet

Page 21: STATISTIKA  3

Pomoćni momenti oko nuleProsječno odstupanje od nule

Za negrupirane podatke Za grupirane podatke

N

xm i

ri

r

ii

i

rii

r f

xfm

xm

m

1

0 1

Pomoćni momenti oko “a”Prosječno odstupanje od “a”

Za negrupirane podatke Za grupirane podatke

N

dm i

ri

r

ˆ

ii

i

ir

i

r f

dfm̂

dm

m

1

0

ˆ

Microsoft Excel Worksheet

Microsoft Excel Worksheet

Page 22: STATISTIKA  3

Izračunavanje centralnih momenata preko pomoćnih

41

2121344

311233

2122

364

23

mmmmmmM

mmmmM

mmM

)ˆ3ˆˆ6ˆˆ4ˆ(

)ˆ2ˆˆ3ˆ(

)ˆˆ(

41

212134

44

31123

33

212

22

mmmmmmbM

mmmmbM

mmbM

Page 23: STATISTIKA  3

STANDARIZIRANO OBILJEŽJESTANDARIZIRANO OBILJEŽJE

Za standardizirano obilježje vrijedi:

0z

1z

Standardizirano obilježje je oblik linearne transformacije obilježja ipokazuje odstupanje obilježja od prosjeka izraženo u standardnimdevijacijama.

iii

i zxxxx

z

0)(

1

N

xx

N

xx

N

zz

ii

i

11)(1)( 2

2

2

2

2

222

N

xx

N

xx

N

z

N

zz i

i

iiz

Microsoft Excel Worksheet

Page 24: STATISTIKA  3

Koeficijent α3 33

3 M

22 3

Pearsonove mjere asimetrije

ok

MxS

)(3 e

k

MxS

33 kS

Bowleyeva mjera asimetrije13

13 2

QQ

mQQS ekq

11 kqS

0 38

x

Me

Mo1Q 3Q

0 38Me x

Mo1Q 3Q

0 38

x1Q Me

Mo

3Q

Simetrična Desnostrana Ljevostrana

ee

Oe

MQQM

MMx

31 ee

eo

MQQM

xMM

31 13 QMMQ

MMx

ee

oe

Microsoft Excel Worksheet

Page 25: STATISTIKA  3

ZAOBLJENOSTZAOBLJENOST

0 444

4

M

Oštraα4>3

Normalnaα4=3

Tupa1,8<α4<3

Pravokutnaα4=1,8

U distribucija0<α4<1,8

Za slijedeće distribucije ocjenite asimetriju i zaobljenost

Studenti prema broju bodova na ispitu "X"

od do0 10 1810 20 4620 30 5930 40 11340 50 13550 60 8860 70 3470 100 7

500

Red. br. gospod.

Površina (ha)

1 52 33 24 15 46 37 68 3

Broj bodova Br. studenata

Page 26: STATISTIKA  3

Zadaci za vježbu1.

Za 5 poduzeća zadani su slijedeći podaci

Poduzeće Ukupna plaća

Broj radnika Plaća po radniku

A B C D E

450000

750000

384000

200 300

120

3000 3500

3200 Ukupno 2684000 870

Plaću po radniku prikažite grafički i izračunajte prosječnu plaču za sva poduzeća zajedno

2. Akumulacija i udio akumulacije u neto proizvodu

Djelatnosti Akumulacija Udio akumulacije u

neto proizvodu INDUSTRIJA 849 0.567 PROMET I VEZE 689 0.579 TRGOVINA 841 0.756 UGOST. I TURIZAM 73 0.553 OSTALO 395 0.508

a) Izračunajte prosječni udio akumulacije u neto proizvodu za sve djelatnosti zajedno b) Grafički prikažite udio akumulacije u neto proizvodu po djelatnostima

3. Struktura prometa tereta s inozemstvom u lukama Hrvatske i indeks prometa TRANZIT=100 u Sloveniji

Promet tereta % u Hrvatskoj Indeks u Sloveniji IZVOZ 13 80 UVOZ 65 320 TRANZIT 22 100

Ako je u uvozu promet u Hrvatskoj bio 13000, a u Sloveniji 1600 strukturnim polukrugovima prikažite struktutu prometa u lukama slovenije i Hrvatske.

4. Živorođeni u Republici Hrvatskoj prema starosti majke 1990.

starost majke broj živorođenih 15 - 19 4 650 20 - 24 21 543 25 - 29 18 039 30 - 34 8 089 35 - 39 2 646 40 - (54) 485

a) Izračunajte najčešću starost majki b) Ocijenite asimetriju distribucije preko Pearsonovih mjera asimetrije