Skripta_Poslovna_statistika

POSLOVNA STATISTIKA – PRIMJENA STATISTIČKIH METODA U EKONOMIJI

Nakladnik:Marija Boban - vlastita naklada

Recenzenti:prof. dr. sc. Miodrag Ivković, izv.prof. prof. dr. sc. Miroslav Bača, izv. prof.

Grafi čka priprema:Tiskara Pečarić-Radočaj d.o.o., Karlovac

ISBN 978-953-56741-0-8

CIP zapis dostupan u računalnome katalogu Nacionalne i sveučilišne knjižnice u Zagrebu pod brojem 771661

Marija Boban Dijana Mečev

POSLOVNA STATISTIKA – PRIMJENA STATISTIČKIH METODA

U EKONOMIJI

ŠIBENIK, 2011. g.

SADRŽAJ

1. OSNOVNI POJMOVI STATISTIKE . . . . . . . . . . . . . . . . . . . . . . . 7 1.1. Što je statistika? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2. Podjela na deskriptivnu i inferencijalnu statistiku . . . . . . . . . . . . . . . 8 1.3. Vrste i izvori podataka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.4. Statistički skup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.5. Statistički niz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.6. Statističko obilježje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.7. Mjerne skale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.8. Grupiranje podataka, vrste grafi kona i njihova primjena . . . . . . . . . . . 12

2. STATISTIČKO TABELIRANJE I GRAFIČKO PRIKAZIVANJE STATISTIČKIH PODATAKA . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.1. Vrste statističkih tablica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.2. Grafi čko prikazivanje statističkih podataka . . . . . . . . . . . . . . . . . . 19 2.2.1. Dijagram točaka . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.2.2. S-L dijagram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.2.3. Jednostavni stupci . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.2.4. Dvostruki stupci . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.2.5. Razdijeljeni stupci . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.2.6. Strukturni krugovi i polukrugovi . . . . . . . . . . . . . . . . . . . . 25 2.2.7. Histogram. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3. SREDNJE VRIJEDNOSTI. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.1. Aritmetička sredina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.1.1. Jednostavna aritmetička sredina . . . . . . . . . . . . . . . . . . . . 29 3.1.2. Vagana ili ponderirana aritmetička sredina . . . . . . . . . . . . . . . 30 3.1.3. Aritmetička sredina preko odstupanja u jedinicama intervala . . . . . 31 3.2. Kronološka sredina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3.3. Harmonijska sredina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.4. Geometrijska sredina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.5. Mod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.6. Medijan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4. KVANTILI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.1. Kvartili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.2. Decili. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.3. Percentili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

5. MJERE DISPERZIJE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 5.1. Raspon varijacije. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 5.2. Interkvartil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 5.3. Varijanca i standardna devijacija. . . . . . . . . . . . . . . . . . . . . . . . 53 5.4. Srednje apsolutno odstupanje . . . . . . . . . . . . . . . . . . . . . . . . . 55 5.5. Koefi cijent varijacije. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 5.6. Koefi cijent kvartilne devijacije . . . . . . . . . . . . . . . . . . . . . . . . 56 5.7. Standardizirano obilježje . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 5.7.1. Pravilo Čebiševa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

6. ANALIZA VREMENSKIH NIZOVA . . . . . . . . . . . . . . . . . . . . . . . 59 6.1. Vremenski niz – defi nicija i vrste . . . . . . . . . . . . . . . . . . . . . . . 59 6.2. Metode relativnih brojeva . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.2.1. Postotni brojevi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.2.2. Relativni brojevi koordinacije. . . . . . . . . . . . . . . . . . . . . . 62 6.2.3. Indeksni brojevi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 6.2.3.1. Verižni indeksi. . . . . . . . . . . . . . . . . . . . . . . . . . 64 6.2.3.2. Indeksi na stalnoj bazi. . . . . . . . . . . . . . . . . . . . . . 66 6.2.3.3. Skupni indeksi. . . . . . . . . . . . . . . . . . . . . . . . . . 71 6.3. Srednje vrijednosti vremenskih nizova . . . . . . . . . . . . . . . . . . . . 76

7. TREND . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 7.1. Linearni trend . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 7.1.1. Ishodište na početku vremenskog razdoblja . . . . . . . . . . . . . . . 79 7.1.2. Ishodište u sredini vremenskog razdoblja (neparan broj godina) . . . . 82 7.1.3. Ishodište u sredini vremenskog razdoblja (paran broj godina) . . . . . 84 7.2. Parabolički trend . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 7.3. Eksponencijalni trend . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 7.4. Logaritamski trend . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

8. KORELACIJA I REGRESIJA . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 8.1. Korelacijska analiza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 8.1.1. Dijagram rasipanja . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 8.1.2. Koefi cijent linearne korelacije . . . . . . . . . . . . . . . . . . . . . . 90 8.2. Regresijska analiza. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 8.2.1. Jednostavna linearna regresija . . . . . . . . . . . . . . . . . . . . . . 91 8.2.2. Regresijski polinom . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 8.2.3. Jednostavna eksponencijalna regresija . . . . . . . . . . . . . . . . . 95 8.2.4. Višestruka (multipla) linearna regresija . . . . . . . . . . . . . . . . . 98

9. VJEROJATNOST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 9.1. Osnovni pojmovi i defi nicije vjerojatnosti. . . . . . . . . . . . . . . . . . . 99 9.2. Slučajna varijabla i teorijske distribucije vjerojatnosti . . . . . . . . . . . 102 9.2.1. Binomna distribucija . . . . . . . . . . . . . . . . . . . . . . . . . 103 9.2.2. Poissonova distribucija . . . . . . . . . . . . . . . . . . . . . . . . 104 9.2.3. Normalna distribucija . . . . . . . . . . . . . . . . . . . . . . . . . 105 9.2.4. Studentova sistribucija . . . . . . . . . . . . . . . . . . . . . . . . 108 9.2.4. Hi-kvadrat distribucija . . . . . . . . . . . . . . . . . . . . . . . . 108

10. METODA UZORAKA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 10.1. Procjena aritmetičke sredine osnovnog skupa . . . . . . . . . . . . . . . 113

PRIMJERI RIJEŠENIH ZADATAKA. . . . . . . . . . . . . . . . . . . . . . . . 116

PREGLED FORMULA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

LITERATURA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

7

1. OSNOVNI POJMOVI STATISTIKE

1.1. ŠTO JE STATISTIKA?

„ Statistički način mišljenja jednog će dana za svakodnevni život građana postati jednako neophodan kao znanje čitanja i pisanja.“

H.G Wells

Statističko promatranje je bilo poznato već u starom vijeku, ali se kao znanost javlja tek u 19. stoljeću kada se podaci počinju i znanstveno istraživati. Danas se statistika primjenjuje u svim znanostima (ekonomskim, socijalnim, medicinskim, pravnim itd.). Današnji menadžeri većinu modernih metoda menadžmenta ne mogu provoditi bez po-znavanja statističkog mišljenja koje im pomaže da se bolje snađu u suvremenim uvje-tima poslovanja i da tako ostvare najbolje rezultate. Mjerenjem dobivamo velik broj podataka i samo na osnovu njih teško je zaključiti nešto o procesu. Potreban nam je alat pomoću kojeg ćemo iz velikog broja podataka dobiti kratku, objektivnu informaciju na osnovu koje možemo donositi odluke i poduzeti potrebne aktivnosti za unapređenje procesa. Taj alat je statistika.

Statistika je znanstvena disciplina koja se bavi prikupljanjem, analizom i tumače-njem podataka masovnih pojava.1 Statistika kao znanost pomaže u organizaciji broj-čanih podataka, u razumijevanju statističkih metoda i u donošenju odluka. Drugim ri-ječima, bez statistike bi bilo vrlo teško podatke transformirati u informacije i znanje. Poznavanje osnovnih pojmova statistike potrebno nam je i kako bi mogli pratiti stručnu i znanstvenu literaturu, budući da su istraživanja često iznesena u vrlo skraćenom obliku uz pomoć niza statističkih termina i simbola, te radi analize rezultata prikupljenih istra-živanjem. Pri tome je važno znati da se glavni statistički principi i način mišljenja mogu usvojiti potpuno logičkim putem.

Zadatak statistike kao znanstvene discipline je da svojim metodama otkriva veze i odnose koji postoje među pojavama i da odredi značajke promatranih pojava. Da bi

1 Pojave koje se ne mogu pojedinačno istraživati već je potrebo istražiti sve jedinice da bi se otkrila svojstva tih pojava.

MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI

8

se ostvario postavljeni cilj istraživanja potrebno je provesti određene faze statističke djelatnosti, i to:

1. Statističko promatranje - faza prikupljanja informacija o statističkim jedinicama obuhvaćenih promatranom statističkom masom.

2. Grupiranje (klasifi kacija) - faza grupiranja informacija prema jednom ili više odabranih statističkih obilježja u kojoj se kao rezultat dobivaju statistički podaci. Sta-tistički podatak je sređena, odnosno obrađena informacija i predstavlja broj statističkih jedinica (frekvenciju) koje pripadaju pojedinom obliku statističkog obilježja.

3. Statistička analiza - faza u kojoj se na podatke o jednoj ili više promatranih sta-tističkih masa primjenjuju odgovarajuće statističke metode da bi se odredile značajke tih pojava.

1.2. PODJELA NA DESKRIPTIVNU I INFERENCIJALNU STATISTIKU

S obzirom na temeljne oznake razlikujemo deskriptivnu i inferencijalnu statistiku. Deskriptivna statistika koristi brojčane (numeričke) i grafi čke metode kako bi opisala populaciju. To znači da se u sklopu deskriptivne statistike za neku odabranu pojavu prikupljaju informacije, te uređuju, tabeliraju, grafi čki prikazuju, računaju i analiziraju različiti brojčani pokazatelji. U sklopu deskriptivne statistike primjenjuju se metode srednjih vrijednosti, mjera disperzije, mjera simetrije, mjera zaobljenosti. U sklopu in-ferencijalne statistike izabiru se uzorci. Primjerice, kada želimo na tržište plasirati novi proizvod izabrati ćemo uzorak potencijanih potrošača i ispitivati njihova mišljenja i potrebe za tim proizvodom. U sklopu inferencijalne statistike primjenjuju se metode procjena, testiranja i predviđanja o parametrima populacije tj. osnovnog skupa (procje-ne parametara, testiranje hipoteza, neparametrijski testovi).

1.3. VRSTE I IZVORI PODATAKA

Podaci (obilježja) su prikupljene informacije o jedinicama promatranja. Na primjer, jedinica promatranja može biti poduzeće, a podaci jesu: broj djelatnika, njihova sta-rost, stručna sprema, mjesečni prihodi itd. Podaci mogu biti kvalitativni i kvantitativni. Kvalitativni podaci iskazuju se pojmovno (riječima ili slovnim oznakama) i ne mogu biti zapisani u obliku broja (npr. spol, mjesto rođenja, državljanstvo, narodnost). Kvan-titativni podaci iskazuju se brojčano (npr. dob, broj članova kućanstva, radni staž, visina postojećih kreditnih obveza).


9

Izvori podataka mogu biti primarni i sekundarni. Primarni se podaci prikupljaju na temelju promatranja i eksperimenata. To su novi, neposredno prikupljeni podaci za potrebe nekog istraživanja, koji donose najažurnije informacije o danom predmetu. Njih je moguće pronaći u raznim znanstvenim i stručnim djelima, službenim statistikama i dokumentima i sl. No najčešće nisu praktični za izravno korištenje bez sekundarnih po-dataka, jer ih je puno i vrlo su raštrkani u velikom broju dokumenata i publikacija. Na-suprot njima, sekundarni podaci su gotove, istražene i objavljene informacije specija-liziranih institucija (gospodarska komora, centralna banka, državni zavod za statistiku, istraživački instituti itd.). Oni se mogu prikupiti brže i jeftinije od primarnih podataka - osobito putem Interneta.

1.4. STATISTIČKI SKUP

Statistički skup je skup podataka čiji su elementi (objekti, osobe, pojave) predmet statističke analize. Broj jedinica statističkog skupa N naziva se opsegom statističkog skupa. S obzirom na broj elemenata statistički skup može biti konačan i beskonačan. Statistički skup potrebno je defi nirati pojmovno (npr. redoviti studenti), prostorno (re-doviti studenti I. god. Veleučilišta u Šibeniku) i vremenski (intervalni – broj studenata u akademskoj godini 2009./2010.; trenutačni – broj studenata na dan 30.10.2010.). Pri-mjerice, statistički skup čine svi redovni studenti upisani u I. godinu studija akademske godine 2009./10. na Veleučilištu u Šibeniku. Taj skup broji N= 250 studenata. Studenti su jedinice, odnosno elementi tog skupa. Skup je u potpunosti defi niran pojmovno, pro-storno, vremenski i konačan je.

1.5 STATISTIČKI NIZ

Svrha uređivanja statističkih podataka je omogućiti donošenje sudova o danoj po-javi. Uređivanjem statističkih podataka nastaju statistički nizovi. Statističkim nizom zovemo niz frekvencija što nastaju grupiranjem s obzirom na njihova svojstva u stati-stičkom skupu. Ovisno o vrsti obilježja grupiranjem nastaju nominalni, ordinalni i nu-merički nizovi. Posebna vrsta su vremenski nizovi koji nastaju kronološkim uređenjem pojava. Statistički niz može biti:

a) negrupiran – podaci su zapisani slijedom kojim su i prikupljeni (npr. godine sta-rosti zaposlenih u poduzeću „XY“ : 24, 36, 57, 44, 27, 33, 40, 22, 57, 60)

b) grupiran - podaci se prikazuju u tablicama distribucije frekvencija2

2 Pojmom distribucija frekvencija obuhvaćaju se statistički sređeni, odnosno stručno grupirani podaci o masovnoj pojavi.


10

Primjer 1.1. Zaposleni u poduzeću „X“ prema godinama starosti na dan 31.12.2010.

Godinestarosti

xi

Broj djelatnika

fi

18-30 40

30-45 60

45-65 20

ukupno 120

Izvor: Podaci su simulirani

1.6. STATISTIČKO OBILJEŽJE

Statističko obilježje ili varijabla je svojstvo po kojem jedinice statističkog skupa međusobno nalikuju ili se međusobno razlikuju (npr. spol, godine, visina, ocjene itd.). Svako se statističko obilježje pojavljuje u dva ili više modaliteta. Na primjer, varijabla spol ima samo dva modaliteta – muški i ženski.

Varijable mogu biti kvalitativne i kvantitativne. Kvalitativna statistička obilježja mogu poprimiti različite oblike, ali se izražavaju opisno (npr. spol). Ako se modaliteti-ma ovog obilježja slučajno pridruže brojevi, s njima nisu dopuštene nikakve računske operacije. Kvantitativna statistička obilježja izražavaju se brojčano (npr. visina). Kva-litativna statistička obilježja se mogu podijeliti na nominalna i redoslijedna, a kvantita-tivna na kontinuirana i diskontinuirana.

Svojstva statističkih obilježja se mjere. Mjerenje je pridruživanje brojeva ili oznaka prema određenom pravilu, a pravila su dana mjernim skalama.

Prikaz 1. Vrste statističkih varijabli

Varijable

Kvalitativne Kvantitativne

Nominalne(spol, bračno

stanje)

Redoslijedne(stručna sprema)

Diskretne(broj djece, broj

kvarova)

Kontinuirane(težina, cijena,

prihod)

statistički niz: djelatnici, statističko obilježje: godine starosti.N = zbroj svih frekvencija u nizu = 120


11

1.7. MJERNE SKALE

Mjerne skale mjere svojstva (obilježja) pridruživanjem brojeva ili oznaka sukladno razini na kojoj je provedeno mjerenje. Razine mjerenja su nominalna, ordinalna (redo-slijedna), intervalna i omjerna.

Nominalna skala je dana u obliku nenumeričkog skupa, odnosno naziva ili atributa po kojima se elementi međusobni razlikuju ili međusobno nalikuju. Koristi se redanje po abecedi ili po učestalosti ili se, kada modaliteta ima mnogo, koriste tzv. nomenklatu-re. Nominalne varijable se dijele na :

a) Atributivne - pokazuju svojstvo (atribut) jedinice (npr. zanimanje, boja proizvoda, vrsta proizvoda),

b) zemljopisne - pokazuju povezanost jedinice s nekim prostorom (npr. mjesto rođe-nja, boravka itd.)

Redoslijedna ili ordinalna mjerna skala pridružuje brojeve, slovne oznake ili sim-bole elementima skupa prema stupnju (intenzitetu) mjernog svojstva (npr. ocjena razvi-jenosti zemlje: razvijena / srednje razvijena / nerazvijena). Modaliteti ove varijable su poredani po intenzitetu mjerenog svojstva i nižu se od najslabijeg prema najjačem ili obrnuto.

Intervalna mjerna skala pridružuje brojeve mjernim svojstvima elemenata skupova. Jednake razlike brojeva na skali predstavljaju jednake razlike mjerenog svojstva. Polo-žaj nule i mjerna jedinica određeni su dogovorno (npr. kod temperaturne skale ledište vode označeno je nulom).3

Omjerna ili numerička mjerna skala se sastoji od brojeva za koje vrijedi da njihove jednake razlike predstavljaju jednake razlike mjerenog svojstva. Nula na omjernoj skali upućuje na nepostojanje svojstva. Vrste numeričke varijable:

a) diskretna ili diskontinuirana – može poprimiti prebrojivo mnogo vrijednosti. Obično je broj vrijednosti takve varijable konačan i ona je najčešće cjelobrojna, kao npr. broj zaposlenih u poduzeću, broj studenata na Veleučilištu itd.

b) kontinuirana – može poprimiti bilo koju vrijednost u nekom intervalu i mogući broj njezinih vrijednosti je beskonačan, kao npr. starost, visina, težina, cijene itd.

Za razliku od diskretnog numeričkog obilježja čije se vrijednosti obično utvrđuju brojanjem, vrijednosti kontinuiranog numeričkog obilježja utvrđuju se mjerenjem.4

3 U društvenim istraživanjima koristi se Likertova skala za izražavanje stupnja slaganja ili neslaganja s nekim ili nečim: izrazito se slaže, slaže se, niti se slaže niti se ne slaže, ne slaže se, izrazito se ne slaže.

4 Rozga, A. i Grčić, B. (2000) Poslovna statistika, Veleučilište u Splitu, str. 7.


12

1.8. GRUPIRANJE PODATAKA, VRSTE GRANICA I NJIHOVA PRIMJENA

Često raspolažemo s vrlo velikim brojem podataka o pojavi koju želimo istražiti. Zadaća deskriptivnih metoda je da sumarno zahvate prikupljene podatke i na taj na-čin reduciraju njihov broj. Pritom u reduciranim informacijama moraju ostati sačuvane glavne značajke pojave koja se istražuje. U tu svrhu se provodi postupak grupiranja ili klasifi kacije podataka.5

Grupiranje je metoda kojom se postiže uopćavanje statističkih podataka. Statistički podaci se raščlane u dijelove prema modalitetima jednog obilježja. U jednoj grupi su elementi istog ili sličnog modaliteta obilježja prema kojem se grupiraju podaci. Broj jedinica svake grupe zove se frekvencija. Frekvencije mogu biti apsolutne i relativne. Broj podataka u grupi naziva se apsolutna frekvencija. Relativne frekvencije pokazuju relativnu veličinu pojave i udjele, te strukturu pojave. To mogu biti proporcije ili po-stoci.

Kod nominalnih statističkih nizova elementi se grupiraju prema modalitetima od-govarajućeg nominalnog obilježja. Kod redoslijednih nizova grupiranje se vrši kao i kod nominalnih, s tim da redoslijed modaliteta nije proizvoljan, već je određen rangom intenziteta obilježja koji pojedina grupa predstavlja, i to polazeći od najnižeg prema naj-višem rangu ili obrnuto. Kod numeričkih nizova jedinice grupiramo prema numeričkom obilježju pri čemu nastaje distribucija frekvencija. Grupiranje podataka se provodi pre-ma defi niranom obilježju po načelima iscrpnosti i isključivosti što znači da se razvrstati mora svaki podatak, a jedan podatak može biti član samo jedne grupe.

Primjer 1. 2. Tijekom jednog istraživanja o broju kupljenih proizvoda X u razdoblju od mjesec

dana provedenom na uzorku od N= 27 potrošača dobiveni su sljedeći rezultati:

24, 3, 27, 25, 14, 33, 10, 22, 7, 6, 3, 14, 12, 24, 11, 17, 17, 24, 16, 11, 6, 21, 12, 15, 4, 0, 5.

Potrebno je grupirati navedene podatke u 5 razreda. Radi bolje preglednosti podaci se najprije uređuju po veličini od najmanje prema najvećoj vrijednosti:

0, 3, 3, 4, 5, 6, 6, 7, 10, 11, 11, 12, 12, 14, 14, 15, 16, 17, 17, 21, 22, 24, 24, 24, 25, 27, 33.

5 Gogala, Z. (2001) Osnove statistike, Sinergija, Zagreb, str. 8.


13

Za formiranje razreda potrebno je znati koliko ih je (n) i kolika im je veličina (i). Broj razreda je zadan (n=5), a veličina će se odrediti prema formuli:

nRvi =

gdje je Rv raspon varijacije odnosno razlika između najveće i najmanje vrijednosti niza.

33033minmax =−=−= XXRv

66,6

533

====n

Rvi

Interval svakog razreda je 7, a ne 6, kako se u prvi trenutak čini. Prvi razred obuhva-ća sve rezultate od 0 do 6, dakle 0, 1, 2, 3, 4, 5 i 6, a to je 7 jedinica. Do apsolutnih fre-kvencija dolazi se brojanjem na temelju prethodno zadanog negrupiranog statističkog niza. Svaki idući razred počinje za jednu jedinicu više nego što prijašnji razred završava.

Brojkupljenih proizvoda

Brojpotrošača

fi 0-67-1314-2021-2728-34

76671

∑6 27

Formiranjem razreda postiže se veća preglednost, ali se u isto vrijeme gubi na preci-znosti i potpunosti statističkih informacija. Naime, iz formirane distribucije frekvencija vidljivo je da je bilo 7 potrošača koji su kupili 6 ili manje proizvoda, ali nije razvidno koliko potrošača je kupilo 1 proizvod, koliko 2 proizvoda itd. Iz navedenog se može zaključiti da svaka distribucija frekvencija u kojoj je barem jedan modalitet predstavljen razredom nije potpuno informativna.6

U slučajevima kada je gornja granica prethodnog razreda za jedinicu manja od donje granice tekućeg ili promatranog razreda (kao u primjeru 1.2.), takve granice zovu se još

6 Znak zbrajanja, sigma iz grčkog alfabeta


14

nominalnim granicama. Koriste se pri analiziranju diskontinuiranih numeričkih nizova za sva potrebna istraživanja.

Za potrebe analize kontinuiranog numeričkog obilježja kreiraju se prave granice. Formiraju se na način da se izjednače donja granica (i+1)-og i gornja granica i-tog razreda, tako da se donja granica smanji za jedinicu ili da se gornja poveća za jedinicu mjere promatranog numeričkog obilježja. Nakon što se prave granice jednom konstrui-raju, na temelju njih se dalje obavljaju sva izračunavanja i crtanja kontinuiranog nume-ričkog niza. Dakle, prave granice razreda se koriste za:

- izračunavanje parametara kontinuiranog numeričkog niza,- crtanja kontinuiranog numeričkog niza.

Tablica 1.1. Primjer pravih granica

Težina (u kg) Prave granice razreda

3-1920-3940-6970-109

3-2020-4040-7070-110

Težina je kontinuirano obilježje pa je za analizu potrebno kreirati prave granice. U prvi razred će biti svrstane osobe čija je težina 3 kg ili veća, ali je manja od 20 kg. Osobe teške 20 kg svrstavaju se u drugi razred.

Precizne granice formiraju se na način da se donja granica (i+1)-og razreda umanji, a gornja granica i-tog razreda uveća za polovicu razlike između tih granica. Potrebno ih je konstruirati samo kada se želi grafi čki prikazati diskontinuirani numerički niz. One ne služe ni za kakva računanja bilo kojeg niza.

Tablica 1.2. Primjer preciznih granicaBroj djece Precizne granice

12-34-56-8

0,5-1,51,5-3,53,5-5,55,5-8,5


15

Prikaz 2. Vrste granica i njihova primjena

Veličina razreda jednaka je razlici gornje i donje granice tog razreda, pri čemu se pretpostavlja da su granice razreda prave. Razredi numeričkog obilježja u pravilu su zatvoreni, tj. imaju donju i gornju granicu. No, postoje slučajevi kada prvi razred nema donju ili posljednji razred nema gornju granicu. Takvi razredi su otvoreni. Otvoreni se razredi formiraju kada nije moguće precizno utvrditi minimalnu odnosno maksimalnu vrijednost koju podaci mogu poprimiti. Za potrebe statističke analize nedostajuće se granice moraju procijeniti. Procijenjene se granice stavljaju u zagrade.

Ako su veličine razreda međusobno različite, potrebno je korigirati frekvencije. Ko-rigiranje se obično izvodi tako da se veličina najmanjeg razreda označi kao „jedinična“ te se sve veličine ostalih razreda podjele s jediničnom veličinom. S tako dobivenim brojem dijeli se svaka originalna frekvencija. Frekvencije se obvezno korigiraju:

- pri crtanju poligona frekvencija,- pri crtanju histograma,- pri izračunavanju moda.

Kumulativni niz (empirijska funkcija distribucije) nastaje postupnim zbrajanjem originalnih frekvencija (apsolutnih ili relativnih) numeričkog niza. Može se formirati kao kumulativni niz prema „dolje“ i kumulativni niz prema „gore“. Poznavanje kumu-lativnog niza potrebno je za proračunavanje nekih srednjih vrijednosti, ali i za grafi čko prikazivanje distribucije frekvencija.


16

Primjer 1.3. Nepismeno muško stanovništvo staro 10 i više godina u RH prema popisu iz 1991. godine

Starost (u god)

Brojosoba

Prave granice

Veličina razreda

Korigirane frekvencije

Kumulativni niz

„manje od“ „više od“

10-1920-3435-4950-64

65-(99)

96420182410598911980

10-2020-3535-5050-65

65-(100)

1015151535

9641345,31606,73992,73422,9

946296453741136323343

2334322397203791796911980

23343Izvor: SLJRH-96, str.73

U primjeru 1.3. razredi su različite veličine, te je za crtanje grafi kona i izračun moda potrebno korigirati frekvencije. Posljednji razred je poluotvoren, pa je maksimalna vri-jednost proizvoljno procijenjena i stavljena u zagrade. Bazna veličina za korigiranje frekvencija je 10. Korigirana frekvencija drugog razreda (1345,3) dobije se tako da se veličina tog razreda dijeli s baznom veličinom i dobije se koefi cijent 1,5 (15:10). S dobivenim se koefi cijentom dijeli originalna frekvencija (2018:1,5) te se tako dobije vrijednost korigirane frekvencije.

Tumačenje vrijednosti kumulativnih nizova: treća vrijednost kumulativnog niza „ma-nje od“ pokazuje kako je prema popisu iz 1991. u RH bilo 5374 nepismenih muških osoba mlađih od 50 godina. Druga vrijednost kumulativnog niza „više od“ pokazuje kako je bilo 22397 nepismenih muških osoba starijih od 20 godina itd.

Pitanja:1. Što je statistika?2. Kako se defi nira deskriptivna, a kako inferencijalna statistika?3. Kako nastaje statistički niz i kakav može biti?4. Kako se dijele statistička obilježja? 5. Koje su prednosti i nedostaci sekundarnih podataka? Navedite primjere sekundarnih

podataka.6. Defi nirajte pojmove: veličina razreda, razredna sredina, frekvencija.7. Kako se i kada računaju korigirane frekvencije?8. Navedite mjerne skale i njihova svojstva.9. Koje su faze statističke djelatnosti?10. Što su otvoreni razredi i gdje se pojavljuju?11. Kako se formira kumulativni niz „manje od“?

17

2. STATISTIČKO TABELIRANJE I GRAFIČKO PRIKAZIVANJE STATISTIČKIH

PODATAKA

2.1. VRSTE STATISTIČKIH TABLICA

Tabeliranje i grafi čko prikazivanje statističkih podataka ima za cilj da na jasan, cjelo-vit i pregledan način prezentira rezultate prikupljanja i grupiranja statističkih podataka.

S t a t i s t i č k a t a b l i c a

Br. tablice NASLOV

TUMAČ REDAKA(PREDSTUPAC)

TUMAČ STUPCA(ZAGLAVLJE)

UKUPNO

OZNAKA STUPCA

OZNAKA RETKA

POLJA TABLICE

ZBROJNI (MARGINALNI) STUPAC

UKUPNO ZBROJNI (MARGINALNI)REDAK

NAPOMENAOZNAKA IZVORA

Korisne upute:• Svaka tablica, osim naslova i izvora, ima tekstualni i brojčani dio. Sva mjesta u

tablici moraju biti popunjena tekstom ili brojem. • Kad god je to moguće u tablicu treba unijeti skraćene ili zaokružene brojeve.


18

• U praksi se na pojedinim mjestima stavljaju i znakovi koji upućuju na po-sebnost sadržaja danog polja. Znakovi u publikacijama Državnog zavoda za statistiku su:

- nema pojave … ne raspolaže se podatkom 0 podatak je manji od 0,5 upotrijebljene jedinice mjere

Ø prosjek 1) oznaka za napomenu ispod tabele * ispravljeni podatak ( ) nepotpun, tj. nedovoljno provjeren podatak

Kakav će oblik imati statistička tablica ovisit će o prikupljenim statističkim podaci-ma, tj. o tome je li jedan ili više statističkih skupova promatrano prema jednom ili više obilježja. S obzirom na to razlikuju se: jednostavne, skupne i kombinirane statističke tablice.

Jednostavne statističke tablice prikazuju samo jednu pojavu, jedan statistički niz, kada je grupiranje provedeno prema jednom obilježju (primjer 2.1.)

Primjer 2.1. Učenici i studenti koji su završili školovanje u RH xxxx godine:

VRSTA ŠKOLE BROJ OSOBAOsnovna škola 53213Srednja škola 49039Stručni studij 4618

Sveučilišni studij 8820ukupno

Izvor: Statistički ljetopis xxxx godine, str. xx

U skupnim statističkim tablicama dva ili više statističkih nizova su grupirani pre-ma jednom obilježju (primjer 2.2.).

Primjer 2.2. Učenici i nastavnici prema školskim ustanovama školske godine XXXXŠKOLE UČENICI/STUDENTI NASTAVNICISrednje škole 170307 864Stručni studij 12804 148Sveučilišni studij 38129 319ukupno



19

U kombiniranim statističkim tablicama prikazan je jedan statistički niz promatran prema dva ili više obilježja (primjer 2.3.).

Primjer 2.3. Studenti prema statusu studiranja i studijskim godinama ak. god. xxxx

Godinastudija

Status studiranja

Izvanredni Redoviti Prva godina 250 850

Druga godina 160 700 Treća godina 100 550 Ukupno 510 2100


Statističke tablice mogu se podijeliti i na: 1) opće ili izvještajne statističke tablice i 2) analitičke ili sumarne statističke tablice.

Opće statističke tablice prikazuju ogroman broj statističkih podataka o nekom pro-matranom statističkom skupu. Analitičke statističke tablice se konstruiraju za neku posebnu analizu i one su u pravilu preglednije.

2.2. GRAFIČKO PRIKAZIVANJE STATISTIČKIH PODATAKA

Grafi čkim načinom prikazivanja postiže se zorniji pregled osnovnih karakteristika statističkog niza. Grafi koni moraju biti jasni, jednostavni i pregledani. Dijelimo ih u tri skupine:

• Kartogrami• Linijski grafi koni• Površinski grafi koni

Kartogrami su geografske karte na kojima se na različite načine prikazuje prostor-na rasprostranjenost statističkog skupa. Jedinice se grupiraju prema goegrafskom obi-lježju, gdje sve grupe zajedno predstavljaju cjelovito geografsko područje. Kartogram može biti nacrtan kao dijagramska karta, piktogram ili statistička karta.

Linijski grafi kon (poligon frekvencija) se koristi za prikazivanje numeričkih i vre-menskih nizova. Statistički niz prikazan je linijama. Na apscisi je aritmetičko mjerilo za obilježje, a na ordinati za frekvencije. Može se nacrtati temeljem apsolutnih ili re-lativnih frekvencija. Ukoliko se prikazuje distribucija frekvencija s razredima različite veličine, na grafi kon se ucrtavaju korigirane frekvencije.


20

Primjer 2.4. Trgovačke radnje poduzeća X prema ostvarenom mjesečnom prometu u 000 kuna.

Promet(u 000 kn)

Broj radnji

fi

Veličina razreda

i


fci10-1515-2020-3030-4545-75

37696

55101530

37331

Izvor: podaci su simulirani

Trgovačke radnje poduzeća X prema ostvarenom mjesečnom prometu prikazane su li-nijskim grafi konom:

Površinski grafi koni su svi oni koji koriste geometrijske likove dovodeći skupove ili njihove dijelove u upravno proporcionalan razmjer s površinom upotrijebljenog ge-ometrijskog lika. Površinski grafi koni su: jednostavni stupci, dvostruki stupci, razdije-ljeni stupci, strukturni krugovi ili polukrugovi, kvadrati i histogrami.

Negrupirani numerički nizovi mogu se grafi čki prikazati pomoću dijagrama točaka i S-L dijagrama (stablo-list) uz uvjet relativno malog broja pojedinačnih vrijednosti promatrane numeričke varijable.


21

2.2.1. Dijagram točakaDijagram točaka (dot dijagram) formira se na način da se točke koje predstavljaju

pojedinu statističku jedinicu ucrtavaju iznad horizontalno položene osi s aritmetičkim mjerilom za promatrano numeričko obilježje.

Primjer 2.5. Promatrana je starosna struktura zaposlenika poduzeća „X“, (stanje na dan 31.12.2010. godine): 23, 25, 25, 28, 30, 30, 35, 35, 35, 36, 40, 40, 40, 40, 45, 45, 45, 50, 50, 50, 56, 60, 60, 65

Formiranje dijagrama točaka zahtjeva prethodno uređenje podataka po veličini, što je u primjeru već učinjeno.


2.2.2. S-L dijagramS-L dijagram (eng. steam-leaf ili stablo-list) specifi čan je jer ga se po obliku može

smatrati vrstom histograma, ali istovremeno se pri njegovoj konstrukciji ne gube poje-dinačni podaci kao što je slučaj s grafi čkim prikazima. Formiranje S-L dijagrama po-činje uređivanjem podataka po veličini. Zatim treba povući okomitu crtu i s njene lijeve strane ispisati vodeće znamenke (Stems). To su npr. oznake za desetice. Nakon toga s desne strane okomite crte (nasuprot vodećoj znamenci) navodi se druga znamenka broja (Leaf). Npr. ako je s lijeve strane vodeća znamenka 0, a nasuprot njoj znamenka 4, to znači da se radi o broju 04 tj. 4. Nasuprot jednoj vodećoj znamenci (“stablu“) može stajati više “listova“, ovisno koliko brojeva spada u pojedini razred.


22

Starosna struktura zaposlenika poduzeća „X“, (stanje na dan 31.12.2010. godine): 23, 25, 25, 28, 30, 30, 35, 35, 35, 36, 40, 40, 40, 40, 45, 45, 45, 50, 50, 50, 56, 60, 60, 65 iz primjera 2.5 prikazana je S-L dijagramom:


2.2.3. Jednostavni stupciJednostavni stupci su pravokutnici jednakih baza, a visine su im određene veliči-

nama originalnih frekvencija. Koriste se za grafi čko uspoređivanje frekvencija nekog geografskog ili atributivnog niza. Na apscisi se označavaju modaliteti obilježja, a na ordinati originalne frekvencije. Između stupaca se uzima konstantan razmak.

Primjer 2.6. Anketirani potrošači proizvoda X prema djelatnom statusu od lipnja do prosinca 2010.

Djelatni status Broj ispitanika

zaposlen 300

nezaposlen 60

umirovljenik 70

student 40



23

2.2.4. Dvostruki stupciNa temelju dvostrukih stupaca uspoređuju se frekvencije jednog niza međusobno,

frekvencije drugog niza međusobno, te istovremeno frekvencije jednog niza s frekven-cijama drugog niza. To su zapravo jednostavni stupci nacrtani jedni iza drugih ili jedni pored drugih.

Primjer 2.7. Anketirani potrošači proizvoda X prema djelatnom statusu i spolu od lipnja do prosinca 2010.

Djelatni status Broj ispitanikaMuško Žensko

zaposlen 130 170nezaposlen 36 24

umirovljenik 43 27student 18 22



24

2.2.5. Razdijeljeni stupciKada se želi grafi čki usporediti struktura s obzirom na neko obilježje unutar pojedi-

nih grupa, upotrebljavaju se razdijeljeni stupci. Stupci su podijeljeni na segmente koji predočuju pojedine frekvencije.

Primjer 2.8. Anketirani potrošači proizvoda X prema djelatnom statusu i spolu od lipnja do prosinca 2010.

Djelatni statusBroj ispitanika

Muško Žensko

zaposlen 130 170

nezaposlen 36 24

umirovljenik 43 27

student 18 22 Izvor: podaci su simulirani

Prva razdioba prvog stupca je na visini 130, a druga na visini 300 (130+170).


25

2.2.6. Strukturni krugovi i polukrugoviBroj stupnjeva sektora kruga ili polukruga potrebno je izračunati na temelju omjera

dijela i cjeline pomnoženog s 360, odnosno sa 180, već prema tome radi li se o krugu ili polukrugu. Na taj se način dolazi do kružnih isječaka kojima su površine proporcional-ne dijelovima frekvencija ili skupova.7

Primjer 2.9. Anketirani potrošači proizvoda X prema djelatnom statusu od lipnjado prosinca 2010.

Djelatni status Broj ispitanika Stupnjevi sektora kruga

zaposlen 300 229,8

nezaposlen 60 46,0

umirovljenik 70 53,6

student 40 30,6

ukupno 470 360,00 Izvor: podaci su simulirani

7 Serdar, V. i Šošić, I. (1982) Uvod u statistiku, Školska knjiga, Zagreb


26

2.2.7. HistogramU slučaju grupiranih numeričkih statističkih nizova ili distribucija frekvencija histo-

gram je jedan od najčešće korištenih grafi kona. Histogram je stupčani grafi kon sastav-ljen od stupaca različitih visina.

Ako je riječ o diskretnoj numeričkoj varijabli čiji su modaliteti izraženi pojedinač-nim vrijednostima, baze stupaca histograma bit će jednake, pa će površina svakog stup-ca biti proporcionalna odgovarajućim frekvencijama.8

Primjer 2.10. Studenti prema ocjenama iz kolegija „Poslovna statistika“ Veleučilišta u Šibeniku9, ljetni ispitni rok, ak. god. 2009./10.

Ocjena Broj studenata

1 28

2 21

3 11

4 8

5 6 Izvor: vlastita evidencija

Ako je pak riječ o diskretnoj ili kontinuiranoj varijabli čiji su modaliteti izraženi u razredima, moguća su dva slučaja:

a) razredi su jednake veličine – baze stupaca histograma će biti jednake, a visina stupaca proporcionalna originalnim frekvencijama,


9 U daljnjim primjerima VUŠ


27

b) razredi su različite veličine – originalne frekvencije nisu izravno usporedive te ih je nužno korigirati

Treba voditi računa da se za grafi čki prikaz koriste prave ili precizne granice.

Trgovačke radnje poduzeća X prema ostvarenom mjesečnom prometu u 000 kn iz primjera 2.4. prikazane histogramom:

Promet(u 000 kn) Broj radnji Veličina

razredaKorigirane frekvencije

10-1515-2020-3030-4545-75

37696

55101530

37331


Kako su razredi različite veličine, frekvencije su korigirane prema baznoj veličini 5.

Pitanja:

1. Što je tabeliranje i čemu služi? Navedite vrste statističkih tablica.2. Što svaka tablica mora imati?3. Koji se geometrijski likovi koriste kod površinskih grafi kona?4. U čemu se razlikuju izvještajne i analitičke tablice?5. Čemu služi grafi čko prikazivanje u statistici? Nabrojite vrste grafi kona.6. Kojom se vrstom grafi kona prikazuje distribucija frekvencija ili numerički niz?7. Kojom vrstom grafi kona se prikazuju geografski nizovi?8. Kako se grafi čki prikazuju negrupirani numerički nizovi?


28

3. SREDNJE VRIJEDNOSTI

„ Kada netko stoji jednom nogom na vrućoj peći, a drugom u hladnjaku, statističar bi rekao da se taj čovjek prosječno nalazi u ugodnoj temperaturi.“

Walter Heller

Srednja vrijednost je konstanta koja predstavlja niz varijabilnih podataka. Nju je moguće shvatiti i kao središnju vrijednost oko koje se gomilaju podaci, zbog čega se naziva još i mjerom centralne tendencije masovne pojave. Općenito, razlikuju se slije-deće vrste srednjih vrijednosti:

- aritmetička sredina,- kronološka sredina,- harmonijska sredina,- geometrijska sredina,- mod,- medijan.

Položajne srednje vrijednosti su mod i medijan, jer su određene položajem unutar danog niza. Sve ostale srednje vrijednosti su potpune budući da se za njihov izračun koriste svi podaci.

Izbor srednje vrijednosti ovisi o vrsti statističke varijable (obilježja) odnosno niza za koji se određuje. U analizi numeričkog niza po pravilu se rabe sve spomenute srednje vrijednosti. Ako je riječ o nominalnom nizu, upotrijebit će se, uz određene uvjete, mod, a u analizi redoslijednog niza mod i medijan.10 Zahtjevi kojima moraju odgovarati sve srednje vrijednosti su:

- mogućnost utvrđivanja srednje vrijednosti objektivnim računskim pravilom na je-dinstven način,

- srednja vrijednost mora biti sadržana između najmanje i najveće vrijednosti obi-lježja,

- ako su sve vrijednosti obilježja jednake, i srednja vrijednost mora biti jednaka toj vrijednosti.

10 Šošić, I. (2006) Primijenjena statistika, Školska knjiga, Zagreb, str. 55.


29

3.1. ARITMETIČKA SREDINA

Aritmetička sredina je najvažnija, najpoznatija i najviše upotrebljavana srednja vrijednost. Naziv koji se koristi za aritmetičku sredinu u svakodnevnom životu je „pro-sjek“ ili „prosječna vrijednost“. Ona predstavlja omjer zbroja svih vrijednosti nume-ričke varijable i broja njenih vrijednosti. Razlikuju se jednostavna i ponderirana ili vagana aritmetička sredina.

3.1.1. Jednostavna aritmetička sredinaJednostavna aritmetička sredina se primjenjuje kada podaci nisu grupirani, dakle

kada se raspolaže s pojedinačnim vrijednostima varijable.

NiN

xX

i

...2,1, ==∑

Veličina u brojniku izraza za aritmetičku sredinu naziva se total. Aritmetička sredina je dio totala koji otpada na jedinicu skupa podataka (populacije).

Primjer 3.1. Vrijednosti ostvarene dnevne zarade (u kn) u poduzeću X za isto radno vrijeme 8 zaposlenih radnika iznosile su:

135, 250, 172, 320, 270, 145, 180, 270

Zadatak je izračunati prosječnu dnevnu zaradu zaposlenih radnika.

75,2178

17428

270...250135==

+++=X

Dakle, prosječna dnevna zarada zaposlenih radnika u promatranom poduzeću je 217,75 kn.


30

3.1.2. Vagana ili ponderirana aritmetička sredinaKada su podaci grupirani, tj. kada je formirana distribucija frekvencija, svaka se

vrijednost varijable x pojavljuje s pripadnom frekvencijom. Zbog toga se vagana ari-tmetička sredina dobije pomoću izraza:

kifi

fixX

i

...2,1, ==

∑

∑

Numeričke vrijednosti varijable x zapisane su kao razredne sredine11, te zamjenjuju individualne vrijednosti numeričkog obilježja svakog od analiziranih numeričkih razre-da. Pojedinačni produkti xifi koji se zbrajaju u brojniku izraza za aritmetičku sredinu nazivaju se podtotali. Zbrojeni podtotali u slučaju vagane aritmetičke sredine predstav-ljaju total. Stoga je gornji izraz za aritmetičku sredinu u skladu s defi nicijom da je ona dio totala po jedinici skupa podataka.

Primjer 3.2. Poduzeća iz djelatnosti trgovine prema broju zaposlenih 2010. godine:

Broj zaposlenih

Broj poduzeća

fi

250-499500-749750-999

430175112

ukupno 717 Izvor: podaci su simulirani

Zadatak je izračunati prosječan broj zaposlenih u poduzećima iz djelatnosti trgovine.

Kako se radi o distribuciji frekvencija, prosječan broj zaposlenih računa se uz pomoć izraza za vaganu aritmetičku sredinu. Statistički niz poduzeća prema broju zaposlenih predstavlja primjer diskontinuiranog statističkog niza pa se razredne sredine računaju na temelju nominalnih, a ne pravih granica.

11 Razredna sredina (xi) je poluzbroj donje i gornje granice promatranog razreda.


31

podtotali

Broj zaposlenih

Broj poduzeća

fi (L1+L2)/2

razredna sredina

xi

fixi

250-499500-749750-999

430175112

(250+499)/2=(500+749)/2=(750+999)/2=

374,5624,5874,5

161035109287,5

97944

ukupno 717 - 368266,5

∑fi =N total

6,513717

5,368266

1

1 ===

∑

∑

=

=k

i

k

ii

fi

fixX

Poduzeća su u prosjeku imala 514 zaposlenih.

3.1.3. Aritmetička sredina preko odstupanja u jedinicama intervalaAritmetička sredina se može računati i preko odstupanja u jedinicama intervala, i to

pomoću izraza:

i

fdf

xXi

ii ⋅⋅

+=∑∑

0

Vrijednost xo predstavlja onu vrijednost razredne sredine koja ima najveću frekven-ciju. Vrijednost di dobije se tako da se od svakog xi oduzme xo i podijeli veličinom razre-da (i). Dobivene vrijednosti množe se sa fi, te se ukupna suma i ostali dobiveni rezultati uvrštavaju u formulu.


32

Primjer 3.3. Zaposleni u poduzeću „X“ prema godinama starosti 2010. godine:Godine starosti

Broj zaposlenih

fi

Prave granice

Razredna sredina

xidi fi di

21-2526-3031-3536-4041-4546-5051-5556-60

131623352115117

21-2626-3131-3636-4141-4646-5151-5656-61

23,528,533,538,543,548,553,558,5

-3-2-101234

-39-32-23021303328

141 18 Izvor: Podaci su simulirani

14,395

141185,380 =⋅+=⋅

⋅+=∑∑ i

fdf

xXi

ii

Prosječna starost zaposlenih u poduzeću „X“ je 39,14 godina.

Svojstva aritmetičke sredine:

1. Zbroj odstupanja vrijednosti numeričke varijable od njezine aritmetičke sredine jed-nak je nuli.

0)( =−∑ xxi 0)( =−∑ xxf ii

2. Zbroj kvadrata odstupanja originalnih vrijednosti numeričkog obilježja od aritmetič-ke sredine jednak je minimumu.

imumxxi min)( 2 =−∑ imumxxifi min)( 2 =−∑

3. Aritmetička sredina se uvijek nalazi između najmanje i najveće vrijednosti numerič-kog obilježja varijable xi.

maxmin XXX <<

4. Aritmetička sredina nije dovoljno reprezentativna kada u numeričkom nizu postoje ekstremno male ili velike vrijednosti promatranog obilježja. Npr. u nizu: 500, 720, 1000, 1200, 32000 prosječna vrijednost bila bi 7084. U ovom slučaju aritmetička sre-dina je posve nepouzdan pokazatelj zbog utjecaja jedne ekstremno visoke vrijednosti.


33

4. Aritmetička sredina nije pouzdana niti kada računamo vaganu sredinu na temelju dis-tribucije frekvencija (zbog razrednih sredina koje predstavljaju samo aproksimativnu zamjenu stvarne sredine odgovarajućeg razreda). Problem reprezentativnosti je do-datno pojačan kada postoje otvoreni razredi u distribuciji frekvencija, a osobito kada nije moguće objektivno procijeniti nepoznate granice otvorenih razreda.

3.2. KRONOLOŠKA SREDINA

Vremenski trenutačni niz sastavljen je od frekvencija čija je vrijednost utvrđena u određenom trenutku (satu, danu i sl.) te se tako utvrđene vrijednosti u pravilu ne mogu zbrajati. Iz toga proizlazi da se za vremenski trenutačni niz ne bi mogla izračunati sred-nja vrijednost. Zbog toga ponekad moramo odstupiti od stroge matematičke preciznosti i u određenim prilikama vremenski trenutačni niz transformirati u vremenski intervalni niz za koji se može izračunati srednja aritmetička vrijednost.

Primjer 3.4. Zadani su podaci o broju osoba koje su tražile posao u općini“X”:

Dan Broj osobaxi

31.12.2006.

31.03.2007.

31.04.2007.

31.07.2007.

30.09.2007.

5422

6224

7934

9681

9802

Kronološka sredina se računa prema formuli za ponderiranu sredinu:

∑∑ ⋅

=i

ii

fxf

X

Potrebno je odrediti koliki je vremenski interval između dana kada su zabilježeni podaci, te stvoriti korigirane pondere, tj. poluzbroj vremenskih intervala. Na kraju kori-steći formulu za ponderiranu aritmetičku sredinu (koristeći korigirane pondere) računa se prosječna vrijednost.


34

Dan Broj osoba (xi)

Vremenski interval

Korigirani ponderi (fi ) fi ·xi

031.12.2006. 5422 (0+3)/2= 1,5 8133

3 mjeseca31.03.2007. 6224 (3+1)/2= 2 12448

1 mjesec31.04.2007. 7934 (1+3)/2= 2 15868

3 mjeseca31.07.2007. 9681 (3+2)/2= 2,5 24202,5

2 mjeseca30.09.2007. 9802 (2+0)/2= 1 9802

0

Σ 9 70453,5

16,7282

95,70453==

⋅=∑∑

i

ii

fxf

X

3.3. HARMONIJSKA SREDINA

Harmonijska sredina se defi nira kao recipročna vrijednost aritmetičke sredine re-cipročnih vrijednosti numeričkih obilježja. Upotrebljava se kada se želi odrediti prosjek nekih odnosa, npr. prosječni kilometri na sat, prosječan broj slova u minuti itd. Upotre-bljava se rjeđe od aritmetičke sredine.

Jednostavna harmonijska sredina (za negrupirane nizove) računa se prema formuli:

Ni

x

NH

i

...2,1,1

==

∑


35

Za vaganu (ponderiranu) harmonijsku sredinu upotrebljava se sljedeći izraz:

ki

xf

fH

i

i

i

...2,1, ==

∑

∑

Harmonijska sredina se ne može izračunati kada se u skupu promatranih vrijednosti obilježja pojavljuje vrijednost nula ili negativan broj.

Primjer 3.5. Za nekoliko odabranih fakulteta dani su podaci o broju studenata i broju studenata po 1 nastavniku.

Fakultet Broj studenata Broj studenata po 1 nastavniku

Ekonomski 2500 10,87

Medicinski 1300 8,66

Pravni 2200 12,22 Izvor: podaci su simulirani

Zadatak je izračunati prosječan broj studenata po nastavniku za sve navedene fakul-tete zajedno.

Kada je već dana jedna prosječna vrijednost (broj studenata po nastavniku) koristi se harmonijska sredina da bi se odredila prosječna srednja vrijednost.

Fakultet Broj studenatafi

Broj studenata po nastavniku

xi

fi/xi

Ekonomski 2500 10,87 230Medicinski 1300 8,66 150

Pravni 2200 12,22 180∑ 6000 560

71,10

5606000

===∑∑

i

i

i

xff

H


36

3.4. GEOMETRIJSKA SREDINA

Geometrijska sredina je N-ti korijen iz produkta vrijednosti numeričke varijable. Brojčano se razlikuje od aritmetičke sredine (manja je), a kao i ostale srednje vrijedno-sti nalazi se između najmanje i najveće vrijednosti numeričkog obilježja. Jednostavna geometrijska sredina računa se pomoću izraza:

NiN

xiG ...2,1,

log==

∑

Izrazi za vaganu ili ponderiranu geometrijsku sredinu:

kixfN

GNixfG iiN ii ...2,1,log1log;...2,1, ==== ∑∏

kif

xfG

i

ii

...2,1,log

==∑

∑

Kod numeričkih nizova geometrijska sredina nema neku logičnu interpretaciju. U poslovnoj statistici najčešće se upotrebljava u analizi vremenskih nizova.12 Koristi se za izračunavanje prosječne stope promjene neke pojave (ako broj nije negativan ili nula).

Primjer 3.6. U poduzeću „X“ 2007. je bilo zaposleno 200, 2008. 900, a 2009. godine 1800 radnika. Postavlja se pitanje koliko se puta prosječno povećavao broj zaposlenih svake godine?

Broj zaposlenih 2008. bio je 4,5 puta veći u odnosu na 2007., a 2009. dva puta veći u odnosu na 2008. godinu.

3925.4 ==⋅=G

12 Biljan-August,M. et al. (2007)Upotreba statistike u ekonomiji, Ekonomski fakultet Rijeka, str. 43.


37

Kako se vidi, to odgovara stvarnom stanju, jer se od 2007. do 2009. broj zaposle-nih ukupno povećao devet puta (200∙3∙3=1800). Da smo računali aritmetičku sredinu (4,5+2)/2, dobili bismo netočan podatak, tj. 3,25.

3.5. MOD

Mod je vrijednost ili modalitet varijable koji se najčešće pojavljuje u nizu, tj. vri-jednost obilježja s najvećom frekvencijom. U odnosu na aritmetičku sredinu i medijan, mod je najmanje osjetljiv na izrazito velike i izrazito male vrijednosti obilježja. Me-đutim, osjetljiv je na različita grupiranja frekvencija. S obzirom na mod razlikuju se slijedeće distibucije:

a) unimodalna – ima samo 1 mod, b) bimodalna – ima 2 moda, c) multimodalna – ima više od 2 moda.

Kod nominalnih obilježja mod se određuje traženjem vrijednosti obilježja u nizu koje se najčešće javlja. Ako je niz grupiran, traži se najveća apsolutna frekvencija. Vri-jednost obilježja kojoj pripada ta najveća apsolutna frekvencija je mod.13

Primjer 3.6. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ pre-ma postignutom uspjehu, ljetni ispitni rok, ak. god. 2009./10.


IzvrstanVrlo dobar

DobarDovoljan

681121

Izvor: vlastita evidencija

Zadatak je odrediti mod tj. najčešću prolaznu ocjenu koju su studenti postigli u ljet-nom ispitnom roku iz kolegija „Poslovna statistika“. Niz je nominalan. Mod je modalitet nominalne varijable s najvećom frekvencijom. Najveći broj studenata je na ispitu dobilo ocjenu dovoljan pa je prema tome mod (modalna kategorija) za navedeni niz dovoljan.

Određivanje moda za distribuciju frekvencija ovisi o tome da li su formirane grupe, ili je obilježje dano u razredima. Ukoliko su formirane grupe, postupak je potpuno isti kao u prethodnom primjeru.

13 Biljan-August,M. et al.(2007) Upotreba statistike u ekonomiji, Ekonomski fakultet Rijeka, str. 47.


38

Primjer 3.7. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ pre-ma postignutom uspjehu, ljetni ispitni rok, ak. god. 2009./10.


5432

681121


Najčešća ocjena studenata VUŠ-a iz kolegija „Poslovna statistika“ na ljetnom ispit-nom roku ak. god. 2009./10. je 2 (Mo=2).

Kod distribucije frekvencija s formiranim razredima, mod nije moguće direktno oči-tati. Koristi se slijedeći izraz za izračunavanje moda:

i

cbababLMo ⋅−+−

−+=

)()()(

1

gdje je: L1 – donja granica modalnog razreda, b – frekvencija modalnog razreda, a – frekvencija koja prethodi modalnom razredu, c – frekvencija koja slijedi iza frekvencije modalnog razreda, i – veličina modalnog razreda.

Primjer 3.8. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ prema broju bodova koji su postigli, ljetni ispitni rok, ak. god. 2009./10.

Broj bodova

Broj studenatafi

Veličina razredai

51-6061-7071-8081-9091-100

18 b 6 c

976

99999


Modalni razred-razred s

najvećomfrekvencijom


39

U primjeru 3.8. svi razredi su jednake veličine. Modalni razred je onaj kojem pripada najveća originalna frekvencija. Obilježje je diskretno (diskontinuirano) pa je za izračun potrebno koristiti nominalne granice. Najveća originalna frekvencija je 18, pa je modal-ni razred 51 – 60.

569

)618()018()018(51 ≈⋅−+−

−+=oM

Najčešći broj bodova bio je 56.

Ukoliko su razredi različite veličine originalne frekvencije nisu izravno usporedive pa je modalni razred onaj kojem pripada najveća korigirana frekvencija.


Broj bodova Broj studenatafi

Veličina razreda

i


fci

51-5556-6061-6970-8687-100

1266157

4481613

12 b 6 c

33,752,15

Izvor:Vlastita evidencija

Najveća korigirana frekvencija je 12, pa je modalni razred 51 – 55.

544

)612()012()012(51 ≈⋅−+−

−+=oM

Vidljivo je da vrijednost moda u primjerima 3.8. i 3.9. nije ista, što je rezultat osjet-ljivosti moda na različita grupiranja frekvencija.

Modalni razred-razred s

najvećomkorigiranomfrekvencijom


40

3.6. MEDIJAN

Medijan je numerička vrijednost koja niz dijeli na dva jednaka dijela, na način da polovina elemenata imaju vrijednost numeričkog obilježja jednaku ili manju od medi-jana, dok druga polovina ima vrijednost jednaku ili veću od medijana. U statističkim distribucijama postoji samo jedan medijan i on se nalazi između najveće i najmanje vrijednosti obilježja.

Prednost medijana jest da na njega ne utječu ekstremno male ili velike vrijednosti obilježja, stoga je primjerena srednja vrijednost i kod izrazito asimetričnih distribuci-ja. Određivanje medijana sastoji se u pronalaženju vrijednosti obilježja na središnjoj poziciji u uređenom nizu. Ako se radi o negrupiranom numeričkom nizu, elemente je potrebno napisati redoslijedno (poredati ih po veličini), te će vrijednost središnjeg ele-menta (ukoliko je broj elemenata u nizu neparan) biti medijan. Ako je broj elemenata u nizu paran, medijan je vrijednost poluzbroja dvaju središnjih članova niza.

Medijalna vrijednost u primjeru 3.1. u kojem su dane vrijednosti dnevnih zarada u kn (135, 250, 172, 320, 270, 145, 180, 270) za isto radno vrijeme 8 zaposlenih radnika određuje se na slijedeći način: kako je riječ o negrupiranom numeričkom nizu, podaci se najprije trebaju poredati po veličini.

135, 145, 172, 180, 250, 270, 270, 320

Budući da je broj elemenata u nizu paran (N=8), vrijednost medijana bit će jednaka poluzbroju vrijednosti 4. i 5. člana.

4

28

2===

Nr

21++

=rr

exxM


41

215

2250180

254

=+

=+

=xxMe

Prvih 50% radnika zaradilo je 215 kn ili manje, a preostalih 50% radnika zaradilo je 215 kn ili više.

Da je bila promatrana zarada sedmorice radnika (npr. bez radnika koji dnevno zaradi 320 kn), vrijednost medijana odredila bi se na sljedeći način:

1)

2( +=NINTr

gdje je INT cijeli dio broja.

41)5,3(1)

27( =+=+= INTINTr

135, 145, 172, 180, 250, 270, 270

1804=

=Mer

Kod distribucije frekvencija diskretne numeričke varijable sa formiranim grupama,

za pronalaženje medijana koristi se kumulativni niz „manje od“. Pomoću prve kumula-tivne frekvencije koja je jednaka ili veća od N/2 identifi cira se pripadna vrijednost gru-pe, koja je u tom slučaju medijan. Ovo vrijedi bilo za slučaj da je N neparan, bilo da je paran, budući da sve jedinice u grupi imaju istu vrijednost obilježja. Jedino, ukoliko bi jedinice s redoslijedom N/2 i (N/2) +1 pripadale dvjema uzastopnim grupama, medijan bi se odredio kao poluzbroj vrijednosti obilježja tih dviju grupa.14

14 Gogala, Z. (2001.) Osnove statistike, Sinergija, Zagreb, str. 62.


42

Primjer 3.10. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ prema postignutom uspjehu, ljetni ispitni rok, ak. god. 2009./10.

Ocjena Broj studenata Kumulativni niz „manje od“

5432

681121

61425 46

∑ 46 - Izvor: vlastita evidencija

Zadatak je odrediti vrijednost koja niz dijeli na dva jednaka dijela.

Kako je N/2 = 23, medijan je obilježje s rednim brojem 23. Prva kumulativna fre-kvencija, jednaka ili veća od 23, jest treća po redu kumulativna frekvencija (25) uz koju stoji obilježje „3“. Dakle, polovina studenata dobila je ocjenu 3 ili manje, a polovina 3 ili više.

Ako se radi o distribuciji frekvencija s razredima, neovisno o tome je li obilježje diskontinuirano ili kontinuirano, za izračunavanje medijana može se primijeniti sljedeći izraz:

miif

fN

LMmed

i

e ...2,1,2

1 =⋅−

+=∑

gdje je: L1 - donja granica medijalnog razreda, - zbroj frekvencija do medijalnog razreda,

fmed - frekvencija medijalnog razreda,

i - veličina medijalnog razreda.

∑ if


43


Broj bodova

Broj studenatafi

Kumulativni niz„manje od“

51-5556-6061-6970-8687-100

1266157

121824397

∑ 46 -Izvor:Vlastita evidencija

Medijalni razred odgovara prvoj kumulativnoj frekvenciji u nizu koja uključuje omjer N/2. Dakle, medijalni razred bit će 61-69.

6886

182

46

61 ≈⋅−

+=eM

50% studenata je imalo 68 bodova ili manje, a preostalih 50% studenata je imalo 68 bodova ili više.

Svojstva medijana:

1. Medijan se uvijek nalazi između najmanje i najveće vrijednosti numeričkog obilježja varijable xi.

maxmin XMX e <<

2. Zbroj odstupanja podataka od medijana uzetih apsolutno je minimalan

min

1=∑

=

−

N

iei Mx min

1=∑

=

− i

k

iei fMx

3. Nije osjetljiv na ekstremne vrijednosti niti na distribucije frekvencija s otvorenim razredima (osim ako je rubni otvoreni razred ujednoi medijalni)

medijalni razred:N/2=23


44

Pitanja:

1. Što je srednja vrijednost?2. Defi nirajte aritmetičku sredinu. Koja su njena svojstva?3. Kada se i kako računaju harmonijska sredina i geometrijska sredina?4. Defi nirajte mod i medijan, čemu služe, u koju vrstu srednjih vrijednosti se ubra-

jaju i koja su im svojstva.5. Kada se mod ne može izračunati?


45

4. KVANTILI

Kvantili su vrijednosti numeričkog obilježja koje niz uređen po veličini dijele na q jednakih dijelova. Kvantili su kvartili, decili i precentili.

4.1. KVARTILI

Kvartili dijele numerički niz na četiri jednaka dijela. Postoji prvi ili donji kvartil (Q1) koji dijeli niz u omjeru 1:3, drugi kvartil ili medijan, te treći ili gornji kvartil (Q3) koji niz dijeli u omjeru 3:1.

Kada se kvartili računaju za negrupirani numerički niz, podatke je potrebno urediti po veličini i pronaći vrijednosti na traženoj kvartilnoj poziciji. U slučaju kada je N dje-ljiv sa 4, donji kvartil se određuje kao poluzbroj vrijednosti na pozicijama xr i xr+1 , (r = N/4). Analogni postupak ponavlja se kod određivanja trećeg kvartila, ali umjesto N/4 biti će 3N/4.

Vratimo se na primjer 3.1. u kojem su dane vrijednosti dnevnih zarada (u kn) za isto radno vrijeme 8 zaposlenih radnika. Zarade (u kn) poredane po veličini bile su slijedeće:

135, 145, 172, 180, 250, 270, 270, 320

2

48

4===

Nr

5,158

2172145

232

1 =+

=+

=xxQ


46

Jedna četvrtina radnika zaradilo je 158,5 kn ili manje, a tri četvrtine radnika ostvarilo je dnevnu zaradu od 158,5 kn ili veću.

6

483

43

=⋅

==Nr

270

2270270

276

1 =+

=+

=xxQ

Tri četvrtine radnika zaradilo je 270 kn ili manje , a jedna četvrtina radnika zaradila je 270 kn ili više.

Kada N nije djeljiv sa 4 ostatak koji se pojavljuje prilikom dijeljenja se zanemari, te cjelobrojni dio kvocijenta poveća za 1 i dobije se vrijednost koja je na poziciji prvog kvartila. Da je bila promatrana zarada sedmorice radnika (npr. bez radnika koji dnevno zaradi 320 kn):

135, 145, 172, 180, 250, 270, 270

vrijednost gornjeg i donjeg kvantila odredili bi na sljedeći način:

21)75,1(1)

4( =+=+= INTNINTr 61)25,5(1)

43( =+=+= INTNINTr

14521 == xQ 27063 == xQ

Ako je numerički niz grupiran prema diskretnom obilježju gdje su modaliteti pred-stavljeni pojedinačnim brojevima, kvartili se određuju uz pomoć kumulativnog niza „manje od“ i prethodno utvrđene procedure određivanja rednog broja odgovarajućeg člana niza s vrijednošću obilježja jednakom donjem ili gornjem kvartilu.15



47

Primjer 4. 1. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ prema postignutom uspjehu, ljetni ispitni rok, ak. god. 2009./10.

Ocjena Broj studenata Kumulativni niz„manje od“

2345

211186

21324046

46 - Izvor: vlastita evidencija

( ) 1215,111

446

=+=+⎟⎠⎞

⎜⎝⎛= INTINTr

12. član niza sadržan je u frekvenciji kumulativnog niza (21) uz koji stoji vrijednost obilježja „2“, pa je Q1=2.

( ) 3515,341

4463

=+=+⎟⎠⎞

⎜⎝⎛ ⋅

= INTINTr

35. član niza sadržan je u frekvenciji kumulativnog niza (40) uz koji stoji vrijednost obilježja „4“, pa je Q3=4.

Ako se donji i/ili gornji kvartil određuje za numerički niz grupiran u razrede, neo-visno da li je riječ o diskontinuiranom ili kontinuiranom obilježju, potrebno je koristiti slijedeće izraze:

qiif

fN

LQtk

i

...2,1,4

var11 =⋅

−+=

∑qii

f

fN

LQtk

i

...2,1,4

3

var13 =⋅

−+=

∑


48

gdje je: L1 - donja granica kvartilnog razreda, - zbroj frekvencija do kvartilnog razreda,

fkvart - frekvencija kvartilnog razreda,

i - veličina kvartilnog razreda.

Primjer 4.2. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ pre-ma broju bodova koji su postigli, ljetni ispitni rok, ak. god. 2009./10.

Broj bodova

Broj studenatafi

Kumulativni niz„manje od“

51-5556-6061-6970-8687-100

1266157

121824397

∑ 46 - Izvor:Vlastita evidencija

( ) 1215,111

446

=+=+⎟⎠⎞

⎜⎝⎛= INTINTr

Prva kumulativna frekvencija jednaka ili veća od 12, jest prva po redu kumulativna frekvencija, pa je kvartilni razred 51 – 55.

55412

04

46

511 ≈⋅−

+=Q

Jedna četvrtina ili 25% studenata je na ispitu postiglo 55 bodova ili manje, a tri če-tvrtine ili 75% je postiglo 55 bodova ili više.

( ) 3515,341

4463

=+=+⎟⎠⎞

⎜⎝⎛ ⋅

= INTINTr

∑ if


49

Prva kumulativna frekvencija jednaka ili veća od 35 jest četvrta kumulativna fre-kvencija, pa je kvartilni razred 70 – 86.

811615

244463

703 ≈⋅−

⋅

+=Q

Tri četvrtine ili 75% studenata je na ispitu postiglo 81 bod ili manje, dok je jedna četvrtina ili 25% studenata postiglo 81 bod ili više.

4.2. DECILI

Decili su kvantili koji niz dijele na 10 jednakih dijelova, a ima ih 9. Za negrupirane podatke i za slučaj kada N nije djeljiv sa deset bez ostatka, ostatak se zanemari te cjelo-brojni dio kvocijenta poveća za 1. Na taj način dobije se vrijednost koja je na poziciji pr-vog decila. Na analogan se način određuju vrijednosti preostalih decila pomoću izraza:

9,...2,1,1

10, =+⎟

⎠⎞

⎜⎝⎛== iiNINTrxD ri

Kada je i∙N djeljivo s deset bez ostatka tada vrijedi:

102,

1 iNrxxD rri =

+=

+

Decili distribucije frekvencija određuju se računski postupcima analognim onima za određivanje medijana i kvartila pomoću izraza:

9...2,1,10

1

1 =⋅−

⋅

+=∑

iif

fNi

LDidecil

gdje je: L1 - donja granica decilnog razreda,

- zbroj frekvencija do decilnog razreda,

fdecil - frekvencija decilnog razreda,

i - veličina decilnog razreda

∑ 1f


50

4.3. PERCENTILI

Percentili su kvantili koji niz dijele na 100 jednakih dijelova, a ima ih 99. Određuju se na način sličan onom opisanom za decile, odnosno kvartile. Podaci moraju biti uređe-ni po veličini. Kada N ili i∙N nije djeljivo sa sto bez ostatka, cjelobrojni dio se poveća za jedan i dobije se vrijednost koja je na poziciji i-tog percentila.

99,...2,1,1

100, =+⎟

⎠⎞

⎜⎝⎛== iiNINTrxP ri

Kada je i∙N djeljivo sa sto bez ostatka tada vrijedi:

1002,

1 iNrxxP rri =

+=

+

Percentil za distribucije frekvencija s razredima dobije se pomoću izraza:

99...2,1,100

1

1 =⋅−

⋅

+=∑

iif

fNi

LPpercentil

i

gdje je: L1 - donja granica percentilnog razreda,

- zbroj frekvencija do percentilnog razreda,

fpercentil - frekvencija percentilnog razreda, i - veličina percentilnog razreda

Pitanja:

1. Što su kvartili i zašto su značajni?2. Kako se kvartili računaju za negrupirani numerički niz?3. Objasnite slijedeće izraze: 3. decil, 75. percentil. 12. percentil.

∑ 1f


51

5. MJERE DISPERZIJE

Mjere disperzije brojčano izražavaju različitu raspršenost vrijednosti numeričkog obilježja oko srednjih vrijednosti. Nazivaju se još i mjere raspršenosti ili varijacije. Di-jele se na apsolutne mjere disperzije (izražavaju se u apsolutnim jedinicama) i relativne mjere disperzije (pokazuju relativno odstupanje- postotke).

Apsolutne mjere disperzije Relativne mjere disperzije

Raspon varijacijeInterkvartilVarijancaStandardna devijacijaSrednje apsolutno odstupanje

Koefi cijent varijacijeKoefi cijent kvartilne devijacije

5.1. RASPON VARIJACIJE

Raspon varijacije je najjednostavnija mjera odstupanja, a predstavlja razliku izme-đu najveće i najmanje vrijednosti niza.

minmax xxRv −=

Ako su podaci jednaki vrijednost mu je jednaka nuli, a povećava se povećanjem stupnja varijabilnost podataka.

Za distribuciju frekvencija diskontinuirane varijable s formiranim grupama raspon varijacije se određuje pomoću izraza:

1xxRv k −=

U primjeru 4.1. (str. 38.) raspon varijacije iznosi 5-2=3, što je maksimalna razlika u ocjenama studenata koji su položili ispit.

Kod distribucije frekvencija s formiranim razredima raspon varijacije se određuje kao razlika gornje granice posljednjeg i donje granice prvog razreda, ili izračunavanjem razlike razrednih sredina posljednjeg i prvog razreda. U primjeru 4.2. (str.39.) raspon varijacije iznosi 100-51=49, što je maksimalna razlika u broju bodova. Drugim riječi-ma, broj bodova studenata iz promatrane distribucije varirao je u rasponu od 49 bodova.


52

Prednost ove apsolutne mjere disperzije je u njenom jednostavnom računanju i in-terpretaciji. Međutim, ne može se reći da je riječ o pouzdanoj mjeri disperzije budući da se određuje pomoću samo dvije krajnje vrijednosti u nizu. U slučaju postojanja ekstre-mno malih i/ili ekstremno velikih vrijednosti obilježja, raspon varijacije nije precizna mjera raspršenosti budući da se tada dobije veliki raspon varijacije, a možda je većina elemenata skupa raspršena usko oko srednje vrijednosti. Raspon varijacije se kao mjera disperzije preporuča koristiti u mjerenju varijabilnosti cijena, praćenju valutnih tečaje-va, vrijednosti dionica i sl.

5.2. INTERKVARTIL

Interkvartil pokazuje raspon varijacije središnjih 50% jedinica niza, a računamo ga kao razliku gornjeg i donjeg kvartila:

13 QQIq −=

U primjeru 4.2. (str. 38.) već je izračunato da je Q1=55, a Q3=81 iz čega proizlazi da je interkvartil Q3-Q1=28. Dakle, broj bodova središnjih 50% studenata iz promatrane distribucije varira u rasponu od 28.

Interkvartil nije potpuna mjera disperzije budući da se, kao i raspon varijacije, odre-đuje pomoću samo dvije vrijednosti. Međutim, prednost u odnosu na raspon varijacije je što se primjenom ove mjere disperzije iz razmatranja isključuju ekstremne vrijednosti (eliminira se 25% najmanjih i 25% najvećih vrijednosti obilježja u nizu). Time se osi-gurava da na mjeru ne djeluju izrazito male i izrazito velike vrijednosti, što je prednost ove mjere disperzije u odnosu na raspon varijacije.

Raspon varijacije i interkvartilni raspon prikazuju se grafi čki B-P dijagramom (Box-Plot).


53

Prikaz 5.1. Box-Plot dijagram

Box-Plot dijagram konstruira se na način da se najprije na vodoravnoj osi odredi ari-tmetičko mjerilo prema rasponu varijacije varijable, zatim se označi položaj najmanje i najveće vrijednosti te kvartila i medijana. Slijedi crtanje pravokutnika.

Interdecil je razlika dvaju decila. Npr. ID8-D2 = D8-D2 mjeri raspon varijacije središ-njih 60% vrijednosti. Interprercentil je razlika percentila. Npr. IP90-P10=P90-P10 je raspon varijacije središnjih 80% podataka itd.

5.3. VARIJANCA I STANDARDNA DEVIJACIJA

Varijanca i standardna devijacija su najčešće korištene apsolutne mjere disperzi-je. Za razliku od raspona varijacije i interkvartila koji se određuju pomoću dviju vri-jednosti, ove mjere disperzije obuhvaćaju sve jedinice niza pa ih svrstavamo u potpune mjere disperzije.

Varijanca je aritmetička sredina kvadrata odstupanja od aritmetičke sredine skupa tj. prosječno kvadratno odstupanje od prosjeka. Nije pogodna za interpretaciju, budući da je izražena u mjernim jedinicama dignutim na kvadrat. Zbog toga se uz pomoć dru-gog korijena iz varijance izvodi standardna devijacija. Varijanca je defi nirana izrazima:

2

22 )(x

Nxi −= ∑σ

za negrupirane podatke,

2

22 )(x

fifixi −=

∑∑σ za grupirane podatke.


54

Standardna devijacija je pozitivan korijen iz varijance i izražena je u originalnim jedinicama mjere. Defi nira se kao prosječno odstupanje vrijednosti numeričkog obiljež-ja od aritmetičke sredine.

2σσ =±

Vratimo se na primjer 3.1. u kojem su dane dnevne zarade radnika (u kn): 135, 145, 172, 180, 250, 270, 270, 320

Potrebno je izračunati varijancu i standardnu devijaciju. Koriste se formule za negrupi-rane podatke.

x 135, 145, 172, 180, 250, 270, 270, 320

x2 18225, 21025, 29584, 32400, 62500, 72900, 72900, 102400 ∑ x2=411934

69,407675,2178

411934)( 222

2 =−=−= ∑ xN

xiσ

85,6369,4076 ==σ

Prosječno odstupanje dnevne zarade radnika od prosječne zarade iznosi 63,85 kn.

Vratimo se ponovo na primjer distribucije studenata VUŠ-a grupiranih prema broju bodova koje su postigli na ispitu iz „Poslovne statistike“. Varijancu i standardnu devija-ciju izračunat ćemo koristeći izraze za grupirane numeričke nizove:

Broj bodova

Broj studenatafi

Razredna sredina xi

fi xi xi2 fi xi

2

51-5556-6061-6970-8687-100

1266157

53586578

93,5

6323483901170654,5

2809336442256084

8742,25

33708201842535091260

61195,75

∑ 46 - 3194,5 231697,75Izvor:Vlastita evidencija


55

61,21345,69

4675,231697)( 22

22 =−=−=

∑∑ x

fixf ii

σ

62,1461,213 ==σ

Prosječno odstupanje od prosječnog broja bodova prikazane distribucije studenata bilo je 15 bodova.

5.4. SREDNJE APSOLUTNO ODSTUPANJE

Srednje apsolutno odstupanje ili MAD (eng. Mean Absolute Deviation) je pro-sječno apsolutno odstupanje od aritmetičke sredine. Prilikom računanja ne uzima se u obzir predznak individualnih vrijednosti, nego apsolutne razlike od aritmetičkih sredi-na. Dana je izrazom:

N

xxiMAD

∑ −=

za negrupirane podatke,

∑∑ −

=fi

fixxiMAD

za grupirane podatke

MAD se rjeđe upotrebljava kao mjera disperzije numeričkih nizova, a više kao mjera uspješnosti prognoziranja u analizi vremenskih nizova.

5.5. KOEFICIJENT VARIJACIJE

Koefi cijent varijacije predstavlja relativan omjer standardne devijacije i aritmetič-ke sredine pomnožen sa sto.

100⋅=

xV σ

Spada u potpune mjere disperzije jer obuhvaća sve elemente odabranog numeričkog statističkog niza, a izražava se u postotcima. Kada su sve vrijednosti numeričkog obi-lježja u jednom nizu jednake, koefi cijent varijacije će poprimiti vrijednost od 0%, što znači da nema disperzije. Ova relativna mjera disperzije omogućava usporedbu disper-zije u različitim skupovima podataka.


56

5.6. KOEFICIJENT KVARTILNE DEVIJACIJE

Koefi cijent kvartilne devijacije je omjer interkvartila i zbroja kvartila.

13

13

QQQQVq +

−=

Ova mjera se koristi u slučajevima kada se disperzija u pojedinim distribucijama mjeri interkvartilom, te predstavlja relativnu mjeru disperzije srednjih 50% jedinica u nizu. Može poprimiti vrijednost od 0 do 1. Što je koefi cijent bliži nuli, disperzija je manja i obrnuto.

5.7. STANDARDIZIRANO OBILJEŽJE

Standardizirano obilježje je pokazatelj relativnog položaja pojedinačne vrijednosti numeričke varijable u numeričkom nizu podataka. Pokazuje za koliko se standardnih devijacija originalno obilježje razlikuje od aritmetičke sredine.

Varijanca i standardna devijacija kao apsolutne mjere disperzije ne omogućuju uspo-redbu disperzije vrijednosti obilježja koje imaju različitu jedinicu mjere. Također mogu uputiti na pogrešan zaključak pri usporedbi disperzije obilježja nizova s različitim po-jedinačnim vrijednostima obilježja.16U tom slučaju se može računati standardizirano obilježje budući da je ono izraženo u jedinicama standardnih devijacija čime je omogu-ćena usporedba raznorodnih distribucija. Standardizirano obilježje se određuje pomoću izraza:

σxxizi −

= i=1,2,3...N

Svojstva standardiziranog obilježja:- aritmetička sredina standardiziranog obilježja jednaka je nuli,- standardna devijacija standardiziranog obilježja jednaka je 1.

Upravo ova svojstva omogućuju usporedivost disperzije u raznorodnim distribucija-ma. Tako primjerice ako se želi odrediti odstupa li više od prosjeka zaposlenik koji ima plaću 5 100 kn, ili zaposlenik koji ima 7 godina radnog staža za izračun će se koristiti standardizirano obilježje.

16 Biljan-August,M. et al. (2007)Upotreba statistike u ekonomiji, Ekonomski fakultet Rijeka, str. 54.


57

Standardizirana varijabla omogućuje:• usporedbu numeričkih nizova izraženih u istim mjernim jedinicama s različitim

stupnjem varijabilnosti,• usporedbu raznorodnih numeričkih nizova,• usporedbu relativnog položaja podataka u jednom nizu i u različitim numeričkim

nizovima.

5.7.1. Pravilo ČebiševaStandardizirana varijabla može poprimiti i pozitivne i negativne vrijednosti. One će

rijetko odstupati od aritmetičke sredine za više od ±3σ.

Dakle, u intervalu od ±3σ će se naći gotovo sva odstupanja individualnih vrijednosti numeričkog niza od aritmetičke sredine. Prema pravilu Čebiševa najmanja proporcija članova bilo koje populacije u intervalu ±kσ, k>1 iznosi:

Pojas od ±2σ obuhvaća najmanje 75% svih podataka, dok pojas od ±3σ sadrži naj-manje 88,89% svih podataka. U navedenom intervalu je moguće očekivati najmanje pN podataka.

Netipičan podatak je onaj koji se nalazi izvan pojasa ±2σ, tj. podatak koji od prosje-ka odstupa za više od dvije standardne devijacije.

Primjer 5.1. Prosječan broj bodova na 1. kolokviju iz kolegija „Poslovna statistika“ iznosi 58, a prosječno odstupanje od prosjeka 5. Na 2. kolokviju postignut je prosje-čan broj bodova 65, a prosječno odstupanje od prosjeka 4. Student je na 1. kolokviju postigao 64, a na drugome 68 bodova. Što se može zaključiti o uspjehu studenta na kolokvijima?


58

prvi kolokvij: 64,5,58 11 === xx σ

2,1

55864

1 =−

=z

drugi kolokvij: 68,4,52 22 === xx σ

75,0

46568

2 =−

=z

Student je na oba kolokvija postigao iznadprosječan rezultat. Bolji je bio na 1. kolo-kviju, jer je odstupanje od prosjeka na više za 1,2σ.

Pitanja:

1. Objasnite pojam raspršenosti ili disperzije.2. Defi nirajte pojmove: raspon varijacije, varijanca, standardna devijacija.3. Objasnite relativne mjere disperzije.4. Kada se može koristiti standardizirano obilježje?5. Kako glasi pravilo Čebiševa?


59

6. ANALIZA VREMENSKIH NIZOVA

6.1. VREMENSKI NIZ - DEFINICIJA I VRSTE

Vremenski niz je skup kronološki uređenih podataka o vrijednosti promatrane poja-ve. Prema načinu promatranja pojave u vremenu razlikuje se:

1. Intervalni niz – nastaje promatranjem pojave nad određenim vremenskim inter-valima (godina, kvartal, mjesec, dan i dr.), npr. godišnja proizvodnja, mjesečni broj prevezenih putnika, dnevni ostvareni promet, i dr. Podatke (frekvencije) in-tervalnog niza ima smisla zbrajati (svojstvo kumulativnosti). Primjerice, zbraja-njem dnevnog prometa neke trgovine dobije se tjedni promet, zbrajanjem tjednog mjesečni itd. Intervalni vremenski nizovi prikazuju se linijskim grafi konom ili površinskim grafi konom (obično su to stupci, koji su naslonjeni jedan na drugi, jer vrijeme teče kontinuirano). Kod linijskog grafi kona vrijednost pojave se nanosi na sredinu svakog promatranog razdoblja. Ako vremenska razdoblja nisu jedna-ka, potrebno je korigirati frekvencije, i to tako da se smanje frekvencije koje se odnose na veća vremenska razdoblja. Ako, na primjer, nakon godišnjih podataka o nekoj proizvodnji slijede mjesečni podaci, tada godišnje podatke radi usporedi-vosti treba podijeliti s 12.

2. Trenutačni niz – nastaje promatranjem pojave u određenom vremenskom tre-nutku (npr. stanje na tekućem računu, broj zaposlenih u poduzeću i dr.). Podatke (frekvencije) trenutačnog niza nema smisla zbrajati. Ako je na određeni dan u ne-kom poduzeću zaposleno 20 radnika i mjesec dana nakon toga u poduzeću se nije mijenjao broj zaposlenih te ih je i dalje 20, ne smijemo ih zbrajati jer bi to značilo da poduzeće ima 40 radnika. Trenutačni vremenski nizovi prikazuju se linijskim grafi konima.17

Grafi čkim prikazom vremenskih nizova postiže se jasnija i preglednija slika kretanja vrijednosti promatrane pojave kroz vrijeme. Slika grafi kona, kao i svi prikazi u stati-stici, mora biti jasna i potpuna. Radi lakšeg praćenja podataka poželjno je na grafi konu naznačiti mrežu. Dva ili više vremenskih nizova mogu se uspoređivati na istom grafi -konu ako su:

1. njihove vrijednosti izražene u istim mjernim jedinicama,2. njihove veličine nisu izrazito različite.

17 Napomena: vrijednosti trenutačnog niza se ne korigiraju jer pokazuju salda u navedenim vremenskim točkama


60

Primjer 6.1. Zaposleni u poduzeću „X“, razdoblje 2004. – 2008. (na dan 30.06. svake godine)

Godina Broj zaposlenih

2004.2005.2006.2007.2008.

1825403832


Zadatak je prikazati vremenski niz na odgovarajućem grafi konu.

Na linijskom grafi konu je prikazan zadani trenutačni vremenski niz. Na apscisi je označeno vrijeme u godinama, a na ordinati su vrijednosti pojave u originalnim jedi-nicama mjere. Vrijednosti pojave su označene na sredinu svake godine, jer je u tom trenutku za svaku godinu utvrđen broj zaposlenih.

Primjer 6.2. Izvoz i uvoz RH, siječanj – lipanj 2001., u mil USD

Mjesec I. II. III. IV. V. VI.Izvoz 321 375 397 344 388 409Uvoz 537 638 815 742 957 845

Izvor: SLJRH, str.349


61

6.2. METODE RELATIVNIH BROJEVA

Iako je moguće uspoređivanjem apsolutnih vrijednosti frekvencija utvrditi apsolut-ne promjene, odnosno razlike u vrijednostima nekog obilježja, na taj se način ipak ne mogu utvrditi proporcije prema cjelini ili nekoj vrijednosti. Takve se promjene i odnosi utvrđuju pomoću metoda relativnih brojeva.

Osnovna je prednost primjene metode relativnih brojeva u tome što je vrlo jedno-stavna i temelji se na osnovnim matematičkim operacijama. U statističkoj se analizi naj-češće primjenjuju: postotni brojevi, relativni brojevi koordinacije te indeksni brojevi.

6.2.1. Postotni brojeviPostotni brojevi se primjenjuju kada se želi usporediti udio određenog dijela u masi.

Pokazuju strukturu odnosno sastav statističkog skupa u stotim dijelovima cjeline i raču-naju se prema slijedećoj formuli:18

100:%: =cjelinadio

odakle je

cjelinadio 100% ⋅

=

18 Šimundić, S. i Boban, M. (2003) Zbirka zadataka iz statistike, Pravni fakultet Sveučilišta u Splitu, Split


62

Primjer 6.1. Na području Hrvatske živjelo je 1961. godine 4,160 milijuna stanovni-ka, a 1971. godine 4,426 milijuna stanovnika. Potrebno je izračunati koliki je postotak povećanja broja stanovnika u ovom 10- godišnjem razdoblju.

Apsolutno povećanje broja stanovnika u navedenom razdoblju bilo je:4426 – 4160 = 266

Navedeno apsolutno povećanje potrebno je izraziti relativno (u postotku).

%01,6

4426100266100% =⋅

=⋅=cjelina

dio

6.2.2. Relativni brojevi koordinacijeRelativni brojevi koordinacije pokazuju odnose frekvencija dvaju statističkih ni-

zova, grupiranih prema istom obilježju.

i

ii

BAR =

pri čemu je:

Ai – veličina pojave koja se uspoređuje,Bi – baza relativnog broja koordinacije (veličina s kojom se uspoređuje).

Relativni brojevi koordinacije dobiju se stavljanjem u omjer dviju koordinirajućih pojava, pri čemu je važno da dobiveni omjer ima logičnu interpretaciju. Na primjer, stavi li se u omjer broj stanovnika i veličina područja u km2 , dobije se broj stanovnika na km2.

Za relativne brojeve koordinacije često se određuje i aritmetička sredina, koja se računa kao vagana sredina u kojoj su ponderi veličine iz nazivnika relativnog broja koordinacije, ili njima proporcionalne veličine.

∑∑=

i

iii

BBR

R


63

Primjer 6.2. Koliko stanovnika u prosjeku dolazi na jednog liječnika u svim gradovima zajedno?

Gradovi Broj liječnikaBi

Broj stanovnika na

1 liječnikaRi

BiRi

A 1200 601,3 721560

B 2200 555,4 1221880

C 1500 720,2 1080300

D 2800 587,3 1644440

∑ 7700 - 4668180 Izvor: podaci su simulirani

26,606

77004668180

===∑∑

i

iii

BBR

R

U prosjeku na jednog liječnika dolazi 606 stanovnika.

6.2.3. Indeksni brojeviIndeksi vremenskog niza relativni su brojevi koji izražavaju odnos stanja jedne po-

jave (ili skupine pojava) u različitim razdobljima ili vremenskim točkama. Analiza sku-pne pojave izvodi se skupnim indeksima. Ako se indeksima prati razvoj jedne pojave u vremenu, tada je riječ o individualnim indeksima.

Individualni indeksi su: a) verižni (lančani) indeksi, b) indeksi na stalnoj bazi.

Skupni indeksi su: a) indeksi cijene, b) indeksi količine, c) indeksi vrijednosti.


64

6.2.3.1. Verižni indeksiVerižni indeksi (lančani, indeksi s promjenjivom bazom) pokazuju relativne pro-

mjene pojave u tekućem razdoblju u odnosu na prethodno razdoblje. Verižni indeks razdoblja Vt dobije se tako da se vrijednost tog razdoblja (t) podijeli s vrijednosti pret-hodnog razdoblja (t-1), a zatim omjer pomnoži sa 100:

100

1⋅=

−t

tt

YYV

Omjer tekuće i prethodne vrijednosti vremenskog niza nepomnožen sa 100 naziva se koefi cijentom dinamike.

Oduzme li se od verižnog indeksa 100, razlika će upućivati na iznos relativne pro-mjene razine u uzastopnim razdobljima:

100−= tt VS

Primjer 6.3. Godišnji neto prihod (u mil kn) trgovine „X“ za razdoblje 2004.-2008. bio je:

Godina Neto prihod (u mil kn)

Verižni indeksiVt

2004.2005.2006.2007.2008.

3433313735

-97,0593,94119,3594,59


U primjeru 6.3. za dani vremenski niz (neto prihod u milijunima kn trgovine „X“ u razdoblju 2004. – 2008.) izračunati su verižni indeksi:

05,97100

3433100

2004

20052005 =⋅=⋅=

YYV


65

Dobiveni rezultat interpretira se na slijedeći način: neto prihod trgovine „X“ u 2005. godini se smanjio za 2,95% (97,05-100) u odnosu na 2004. godinu.

94,93100

3331100

2005

20062006 =⋅=⋅=

YYV

Neto prihod trgovine „X“ u 2006. godini se smanjio za 6,06% (93,94-100) u odnosu na 2005. godinu.

35,119100

3137100

2006

20072007 =⋅=⋅=

YYV itd.

Neto prihod trgovine „X“ u 2007. godini se povećao za 19,35% (119,35-100) u od-nosu na 2006. godinu.

Verižni indeksi grafi čki se prikazuju grafi konom jednostavnih stupaca ili, češće, spe-cifi čnim linijskim grafi konom tako da se ordinata podiže za svaku godinu s ishodištem u prethodnoj godini. Ako su indeksi veći od 100, ordinate će biti okrenute iznad baze 100, a ako su indeksi manji od 100, bit će okrenute ispod baze 100.

Grafi kon 6.1. Verižni indeksi neto prihoda trgovine „X“ za razdoblje 2004. – 2008.


66

6.2.3.2. Indeksi na stalnoj baziIndeksi na stalnoj bazi (bazni indeksi) pokazuju relativne promjene u tekućem raz-

doblju u odnosu na neko odabrano bazno razdoblje. Dobijemo ih tako da svaki član vremenskog niza podijelimo s vrijednošću baznog razdoblja i pomnožimo sa 100.

100⋅=

b

tt

YYI

Za bazno razdoblje uzima se vrijeme u kojem pojava nije bila izložena neuobičaje-nim utjecajima. Krivim izborom baznog razdoblja mogu se dobiti pogrešne predodžbe o dinamici pojave.

Stopu promjene u tekućem razdoblju u odnosu na bazno razdoblje određuju se po-moću izraza:

100−= tt IS

Vratimo se primjeru 6.3. u kojem je dat godišnji neto prihod (u mil kn) trgovine „X“ za razdoblje 2004.-2008. Zadatak je izračunati indekse s bazom 2005. godinom.

Godina Neto prihod (u mil kn)

Bazni indeksi2005=100

2004.2005.2006.2007.2008.

3433313735

103,03100

93,94112,12106,06


Bazna godina u primjeru je 2005., te se sve vrijednosti dijele sa vrijednošću neto prihoda u 2005. godini, dakle sa 33:

03,103100

3334100

2005

20042004 =⋅=⋅=

YYI

itd.

Neto prihod trgovine „X“ u 2004. je bio veći za 3,03% (103,03-100) u odnosu na (baznu) 2005.godinu itd.


67

Indeksi na stalnoj bazi upravno su proporcionalni originalnim vrijednostima niza. Zbog toga se grafi čki prikazuju kao i frekvencije originalnog vremenskog niza. Razlika se nalazi samo u mjerilu ordinate na kojemu je kod prikaza ovih indeksa uočljiva linija 100, a to znači da ovo mjerilo ne počinje od nule. Na ovakvom grafi konu indeksi se mjere od linije 100 naviše ili naniže.19

a) Preračunavanje baznih indeksa u bazne indekse na drugoj bazi

Indeksi na stalnoj bazi mogu se preračunati u indekse na drugoj bazi tako da se svaki indeks na staroj bazi podijeli s indeksom godine koja je uzeta kao nova baza. Dakle, s indeksima se ovdje postupa na isti način kao da se radi o originalnim vrijednostima.

Indekse na bazi 2005. iz primjera 6.3. preračunat ćemo u indekse na bazi 2006.

Godina Bazni indeksi2005=100


2004.2005.2006.2007.2008.

103,03100

93,94112,12106,06

109,68106,45

100119,35112,90


100⋅=∗

b

tt

III

68,109100

94,9303,103100

2006

20042004 =⋅=⋅=∗

III

itd.

Za 2004. godinu vrijednost indeksa sada iznosi 109,68 što znači da je te godine neto prihod trgovine „X“ bio za 9,68% veći u odnosu na 2006.

19 Kero, K. i Bojanić-Glavica, B. (2003) Statistika u primjerima, FOI, Varaždin, str. 78.


68

b) Preračunavanje verižnih indeksa u bazne indekse

U mnogim situacijama nastaje potreba da se niz verižnih indeksa preračuna u indek-se na stalnoj bazi. To preračunavanje nije moguće izravno izvesti na bilo koju stalnu bazu. Potrebno je niz verižnih indeksa postupnim množenjem preračunati u indekse stalne baze prvog vremenskog razdoblja.

1001 ⋅=↑ −

t

tt

VII

1001 tt

tVII ⋅−

=↓

Sada ćemo verižne indekse koje smo prethodno izračunali preračunati u indekse na bazi 2007. godina.

Godina Verižni indeksiVt


2004.2005.2006.2007.2008.

-97,0593,94

119,35 ↓↑94,59

91,9189,2083,79100

94,59 Izvor: podaci su simulirani

79,83100

35,119100100

2007

20072006 =⋅=⋅=↑

VII

20,89100

94,9379,83100

2006

20062005 =⋅=⋅=↑

VII

91,91100

05,9720,89100

2005

20052004 =⋅=⋅=↑

VII

59,94100

59,94100100

200820072008 =

⋅==↓

⋅VII


69

c) Preračunavanje baznih indeksa u verižne indekse

S obzirom da je niz indeksa sa stalnom bazom upravno proporcionalan originalnom vremenskom nizu, s indeksima na stalnoj bazi dozvoljeno je računati kao sa originalnim frekvencijama. Stoga se za preračunavanje baznih indeksa u verižne koristi slijedeći izraz:

100

1⋅=

−t

tt

IIV

Iz tablice u kojoj su prikazani indeksi na bazi 2007. godina uzet ćemo vrijednosti indeksa za 2005. i 2006. godinu, te koristeći navedeni izraz izračunati verižni indeks za 2006.

94,93100

20,8979,83100

2005

20062006 =⋅=⋅=

IIV

Vrijednost verižnog indeksa za 2006. godinu je 93,94 što zaista i odgovara vrijedno-sti iz tablice.

d) Rekonstrukcija niza originalnih frekvencija pomoću indeksa i jedne originalne frekvencije

Pomoću niza indeksa, bilo baznih, bilo verižnih, te samo jedne originalne frekvenci-je iz razdoblja za koje su indeksi računati, moguće je rekonstruirati cijeli niz originalnih frekvencija. Dovoljno je npr. znati da je neto prihod trgovine „X“ 2005. godine iznosio 33 milijuna kuna. Pomoću indeksa možemo rekonstruirati neto prihod za svaku od po-jedinih godina.

Godina Verižni indeksiVt

2004.2005.2006.2007.2008.

-97,0593,94119,3594,59



70

332005 =Y

1001 ⋅=↑ −

t

tt

VYY

34100

05,9733100

2005

20052004 =⋅=⋅=

VYY

(neto prihod u 2004. godini)

1001 tt

tVYY ⋅−

=↓

31

10094,9333

10020062005

2006 =⋅

==⋅VYY

(neto prihod u 2006. godini)

Na sličan način mogu se koristiti indeksi na stalnoj bazi. Za ilustraciju ćemo uzeti indekse na bazi 2007. godina i podatak da je u 2005. vrijednost neto prihoda trgovine „X“ bila 33 milijuna kuna.

Godina Bazni indeksi2007=100

2004.2005.2006.2007.2008.

91,9189,2083,79100

94,59 Izvor: podaci su simulirani

332005 =Y

37

20,8910033100100

2005

2005=

⋅==

⋅=

⋅⋅

IY

IYY

t

tb


71

Izračunali smo da vrijednost originalne frekvencije bazne godine (2007.) iznosi 37. Ostale frekvencije se dobiju na slijedeći način:

100100 t

btb

tt

IYYYYI ⋅=⇒⋅=

34

10091,9137

1002004

2004 =⋅== ⋅IYI b

31

10079,8337

1002006

2006 =⋅== ⋅IYI b

itd.

6.2.3.3. Skupni indeksiSkupnim indeksima se mjere relativne promjene skupine pojava. Skupni se indeksi

računaju kao vagani prosjeci individualnih indeksa. Pri izračunavanju se u odnos stav-ljaju rezultati umnoška cijena i količina. Čitaju se na način da se od svakog indeksa odbije 100 te se tako dobivena razlika interpretira kao vrijednost koja pokazuje za ko-liko je postotaka vrijednost, količina ili cijena izvještajnog razdoblja veća ili manja od baznog razdoblja.

Najčešće se računaju tri vrste skupnih indeksa: skupni indeksi cijena, skupni in-deksi količina i skupni indeksi vrijednosti. Ovisno o načinu ponderiranja razlikuju se Laspeyresove i Paasheove (čitaj: Lasperove i Pašeove) skupni indeksi.

a) Laspeyresov skupni indeks količina

Kod Laspeyresovog skupnog indeksa količina cijene su fi ksirane na nivou baznog razdoblja tj. ponderi su iz nultog (baznog) razdoblja.

100

1)(01 ⋅

⋅⋅

=∑∑

ioio

ioip

pqpq

Q o

Sa 0 su označene sve veličine baznog razdoblja, a s 1 veličine tekućeg ili izvještaj-nog razdoblja. Količine su označene sa q, a cijene sa p. Oznaka po u zagradi na lijevoj strani izraza upućuje na to da su za pondere korištene cijene nultog razdoblja.


72

b) Paascheov skupni indeks količina

Kod Paascheovog skupnog indeksa količine cijene su fi ksirane na nivou izvještaj-nog razdoblja. Kao ponderi služe količine baznog po cijenama izvještajnog razdoblja.

100

1

11)(01 1 ⋅

⋅⋅

=∑∑

iio

iip

pqpq

Q

Da se radi o Paascheovu indesku upućuje i oznaka p1 u zagradi na lijevoj strani izraza.

Skupni indeks cijena prikazuje dinamiku cijena skupine pojava u tekućem izvještaj-nom razdoblju u odnosu na bazno razdoblje.

c) Laspeyresov skupni indeks cijena

Laspeyresov skupni indeks cijena izračunava se omjerom vrijednosti izvještajnog razdoblja i vrijednosti baznog razdoblja. Kao i kod svih ostalih Laspeyresovih indeksa ponderi su iz nultog (baznog) razdoblja.

100

1)(01 ⋅

⋅⋅

=∑∑

ioio

ioiq

qpqp

P o

d) Paascheov skupni indeks cijena

Kod računanja ovih indeksa kao ponderi se uzimaju količine izvještajnog razdoblja.

100

1

11)(01 1 ⋅

⋅⋅

=∑∑

iio

iiq

qpqp

P

Vrijednost je jednaka umnošku količine i cijene. Skupni indeks vrijednosti računa

se kao omjer vrijednosti tekućeg razdoblja i baznog razdoblja, pomnožen sa 100 (jer se radi o indeksnim brojevima).

100

0

1101 ⋅

⋅⋅

=∑∑

iio

ii

qpqp

V


73

Primjer 6.4. Dane su vrijednosti cijena i količina određenih proizvoda u 2007. i 2008. godini.

proizvodcijena količina

2007.po

2008.p1

2007.qo

2008.q1

ABCD

1200130015001000

100010501250850

154140138120

150130120100

a) Izračunajmo skupne indekse cijena s obzirom na količine iz baznog razdoblja.

p1q0 p0qo p1q1 p0q1

154000147000172500102000

184800182000207000120000

15000013650015000085000

180000169000180000100000

575500 693800 521500 629000

95,82100

693800575500100

1)(01 =⋅=⋅

⋅⋅

=∑∑

ioio

ioiq

qpqp

P o

Laspeyresov skupni indeks cijena iznosi 82,95 što znači da su se cijene svih proizvo-da zajedno smanjile za 17,05% u 2008. u odnosu na 2007., računajući uz neizmijenjene količine iz 2007. godine.

b) Izračunajmo skupne indekse cijena s obzirom na količine iz tekućeg razdoblja.

91,82100

629000521500100

1

11)(01 1 =⋅=⋅

⋅⋅

=∑∑

iio

iiq

qpqp

P

Paascheov skupni indeks cijena iznosi 82,91 što znači da su se cijene svih proizvoda

zajedno smanjile za 17,09% u 2008. u odnosu na 2007., računajući uz neizmijenjene količine iz 2008. godine.


74

c) Izračunajmo skupni indeks količina s obzirom na cijene iz tekućeg razdoblja.

62,90100

575500521500100

1

11)(01 1 =⋅=⋅

⋅⋅

=∑∑

iio

iip

pqpq

Q

Paascheov skupni indeks količina iznosi 90,62 što znači da su se količine svih vrsta proizvoda zajedno smanjile u 2008. u odnosu na 2007. za 9,38%, računajući uz neizmi-jenjene cijene iz 2008.

d) Izračunajmo skupni indeks količina s obzirom na cijene iz baznog razdoblja.

66,90100

693800629000100

1)(01 =⋅=⋅

⋅⋅

=∑∑

ioio

ioip

pqpq

Q o

Laspeyresov skupni indeks količina iznosi 90,66 što znači da su se količine svih vrsta proizvoda zajedno smanjile za 9,34% u 2008. u odnosu na 2007., računajući uz neizmijenjene cijene iz 2007.

e) Izračunajmo skupni indeks vrijednosti.

17,75100

693800521500100

0

1101 =⋅=⋅

⋅⋅

=∑∑

iio

ii

qpqp

V

Skupni indeks vrijednosti iznosi 75,17 što znači da je vrijednost svih vrsta proizvoda zajedno pala za 24,83% u 2008. u odnosu na 2007. godinu.

Skupni se indeksi uspješno koriste i kod izračunavanja indeksa troškova života, in-deksa cijena na veliko i na malo, kod postupka defl acioniranja itd. Pojave se vrijedno-sno prate pomoću cijena tekućeg razdoblja. Takve vrijednosti nazivaju se nominalnim vrijednostima. Cijene tijekom vremena često nisu postojane te je prosudba stvarnog razvoja pojave u vremenu nemoguća na osnovi vrijednosti koje su izražene u tekućim cijenama. Zbog toga, da bi se uočila stvarna dinamika, treba odstraniti utjecaj promjena cijena na vrijednost pojave. Taj se postupak u statistici zove defl acioniranje. Postu-pak defl acioniranja provodi se diobom nominalnih vrijednosti pojave odgovarajućim indeksom cijena koji nije pomnožen sa 100. U ovom postupku indeks cijena se naziva defl acijskim indeksom ili defl atorom.20

20 Kero, Z. i Bijanić-Glavica, B. (2003) Statistika u primjerima, FOI, Varaždin, str. 83.


75

Primjer 6.5. Dana je vrijednost BDP-a RH, te indeksi cijena u tablici koja slijedi:

Godina Vrijednost BDP-a (u mil kn)

Verižni indeksi cijena

1987.1988.1989.1990.1991.1992.

2.78.3

109.4487.0755.05521.0

-300.11300.1709.5223.0765.5

Izvor. SLJRH-93, str.121 i 140.

Izračunajmo vrijednost BDP-a po godinama u stalnim cijenama iz 1987.

Da bi izračunali tražene vrijednosti BDP-a moramo eliminirati utjecaj infl acije na nominalne iznose. Provest ćemo postupak defl acioniranja prilikom kojeg indeksi cijena moraju biti na stalnoj bazi.

Najprije ćemo preračunati verižne indekse cijena u indekse na stalnoj bazi iz 1987. godine.

1001 tt

tVII ⋅−

=↓

1,300

1001,300100

10019881987

1988 =⋅

==↓⋅VII

itd.

Dijeljenjem vrijednosti BDP-a u tekućim cijenama s indeksima cijena na stalnoj bazi iz 1987. dobit ćemo vrijednost BDP-a u stalnim cijenama iz 1987. godine.

7.2100

1007.2

1987 =⋅=BDP

766.2100

1.3003.8

1988 =⋅=BDP itd.


76

Godina Vrijednost BDP-a (u mil kn)

Verižni indeksi cijena

Indeksi cijena 1987=100

Vrijednost BDP-au cijenama iz 1987.

1987.1988.1989.1990.1991.1992.

2.78.3

109.4487.0755.05521.0

-300.11300.1709.5223.0765.5

100.00300.103901.3027679.7261725.78472510.87

2.7002.7662.8041.7591.2231.168

Od posebne važnosti je skupni indeks troškova života kao poseban oblik skupnog indeksa cijena. Njegovo kretanje odražava kretanje životnog standarda stanovništva. Pri njegovu se izračunu prate promjene cijena samo artikala i usluga potrebnih za svakod-nevan život. Služi za izračunavanje realnih plaća i indeksa realnih plaća. Realne plaće dobiju se tako da se nominalne plaće podijele s indeksima troškova života, te rezultat pomnoži sa 100.

Poseban oblik skupnog indeksa količina je skupni indeks fi zičkog obujma. Vrijed-nosti u tekućim cijenama dijele se s indeksom cijena (rezultat se množi sa 100, jer se radi o indeksnim brojevima) te se na taj način provodi postupak defl acioniranja kako bi se odstranio utjecaj cijena i dobila vrijednost u stalnim cijenama.

6.3. SREDNJE VRIJEDNOSTI VREMENSKIH NIZOVA

Najčešće srednje vrijednosti vremenskih nizova su aritmetička sredina, kronološka sredina i geometrijska sredina kao statičke vrijednosti, te trend kao dinamična vrijed-nost. Trend će detaljnije biti objašnjen u 7. poglavlju.

Izbor srednje vrijednosti vremenskog niza ovisi o tome radi li se o intervalnom ili trenutačnom nizu, te radi li se o stacionarnoj ili dinamičnoj pojavi. Kada je riječ o staci-onarnoj pojavi može se izračunati:

a) aritmetička sredina intervalnog vremenskog niza – zbroje se sve frekvencije niza i dobivena suma podijeli s brojem vremenskih grupa,

b) kronološka sredina trenutačnog vremenskog niza – svaka se frekvencija množi s vremenskim ponderom, tj. dužinom razdoblja za koje se pretpostavlja da ima frekvenciju na razini koju pokazuje pojava u defi niranom trenutku vremena21

c) geometrijsku sredinu za trenutačni i intervalni niz – naročito je značajan izračun geometrijske sredine metodom verižnih indeksa, i to pomoću izraza:

21 Primjer izračuna kronološke sredine vidjeti na stranici 26.


77

NVt

G ∑=log

Prosječnu stopu rasta ili pada promatrane pojave možemo odrediti na način da ge-ometrijsku sredinu računamo u obliku prosječnog verižnog indeksa:

1 32 ...− ⋅⋅⋅= n nVVVG ili

1

1−= n

n

yyG

Ako se geometrijska sredina računa pomoću navedenih izraza, prosječna stopa promjene iznosi:

100)1( ⋅−= Gs

Navedene srednje vrijednosti moraju biti reprezentativne što znači da na najbolji mogući način moraju odražavati stanja u kojima se nalazi pojava promatrana u vre-menu. Reprezentativnost pojedine srednje vrijednosti prosuđuje se pomoću varijance, standardne devijacije i koefi cijenta varijacije.

Pitanja:

1. Što je vremenski niz i kako nastaje? Nabrojite vrste vremenskih nizova.2. Kojom vrstom grafi kona se prikazuju vremenski nizovi?3. Kada se računaju relativni brojevi koordinacije i kakav odnos pokazuju?4. Kako se izračunavaju bazni indeksi i kako se grafi čki prikazuju? Što sve može

biti baza prilikom izračuna baznih indeksa?5. Kako se računaju i kako se grafi čki prikazuju verižni indeksi? Što služi kao baza

za izračunavanje verižnih indeksa?6. Kako se niz lančanih indeksa preračunava u niz indeksa na stalnu bazu? 7. Što su skupni indeksi?


78

7. TREND

Pojave promatrane u vremenu najčešće pokazuju određeno kretanje ili dinamiku. Često želimo na prigodan način izraziti dugoročnu tendenciju razvoja tih pojava u vre-menu, a to možemo pomoću trenda.

Trend je dinamička srednja vrijednost koja se izražava matematičkom funkcijom i pokazuje tendenciju promjena neke pojave u zavisnosti od vremena. Prema obliku funkcije razlikujemo:

1. Linearni trend2. Parabolički trend3. Eksponencijalni trend4. Logaritamski trend.

7.1. LINEARNI TREND

Kada pojava pokazuje u istim vremenskim razdobljima približno istu apsolutnu pro-mjenu (prirast ili pad) kaže se da je njezino kretanje približno linearno i da se može izraziti linearnom funkcijom:

bxay +=

gdje je: y – trend vrijednosti ili zavisna varijabla, a – vrijednost trenda u ishodištu, b – apsolutni prirast ili pad pojave, x – vremenska jedinica ili nezavisna varijabla.

Parametri a i b izračunavaju se prema formulama:

∑∑∑ ∑

−

−=

xxx

yxxyb 2 xbya −=


79

7.1.1. Ishodište na početku vremenskog razdoblja Primjer 7.1. Vrijednost prometa (u milijunima kn) trgovine „X“ za razdoblje 2004. –

2008.

Godina Promet (u mil kn)y

2004.2005.2006.2007.2008.

6778889397

423 Izvor: podaci su simulirani

Želimo odrediti jednadžbu odgovarajućeg trenda za prikazano razdoblje sa ishodi-štem na početku vremenskog razdoblja. Vremenska nul - točka će biti na početku niza (u 2004.).


Varijabla vrijemex xy x2

2004.2005.2006.2007.2008.

6778889397

01234

078176279388

014916

423 10 921 30

2

510

=== ∑N

xX 6,84

5423

=== ∑N

yy

5,7

102304232921

2 =⋅−⋅−

=−

−=

∑∑∑ ∑

xxx

yxxyb

6,6925,76,84 =⋅−=−= xbya


80

Uz jednadžbu trenda navode se slijedeće oznake: vrijeme za početnu vrijednost vari-jable x, jedinica mjere vremena, te jedinica mjere vrijednosti članova niza:

y = 69,6+7,5xx = 0, 2004. godinejedinica za x = 1 godinajedinica za y = milijun kn

Parametar b predstavlja prosječnu promjenu pojave u promatranom razdoblju za je-dinični porast varijable vrijeme. To znači da je promet trgovine „X“ u promatranom razdoblju prosječno na godinu rastao za 7,5 milijuna kn. Parametar a je konstantan član i tumači se kao vrijednost trenda za godinu u kojoj je x=0. 69,6 je vrijednost trenda prometa trgovine za 2004. godinu.

Pomoću jednadžbe trenda s procijenjenim parametrima i vrijednosti varijable vrije-me izračunavaju se vrijednosti trenda. Vrijednosti trenda procjene su razine pojave pre-ma trendu. Rezidualna odstupanja su razlike vrijednosti vremenskog niza i vrijednosti trenda te upućuju na disperziju oko trenda kao srednje vrijednosti.

Prva je vrijednost trenda jednaka:

6,6905,76,695,76,69 =⋅+=+= xy

Stvarna vrijednost prometa trgovine „X“ za tu godinu je 67 (mil kn), a razliku čini rezidualno odstupanje koje iznosi (69,6 – 67) 2,6 milijuna kuna.

Vrijednost trenda za 2005. godinu je:

1,7715,76,695,76,69 =⋅+=+= xy te je rezidualno odstupanje za tu godinu 0,9 milijuna kuna itd.

Pomoću jednadžbe trenda s procijenjenim parametrima možemo određivati progno-stičke vrijednosti prometa trgovine za buduća razdoblja. Ako se kretanje vrijednosti prometa nastavi po linearnom trendu čija jednadžba glasi y = 69,6 + 7,5 x onda 2013. možemo očekivati da će vrijednost trgovine „X“ biti slijedeća:

1,13795,76,69 =⋅+=y


81

Za 2013. godinu vrijednost varijable x je 9, pa smo tu vrijednost uvrstili u jednadžbu trenda i dobili prognostičku vrijednost prometa za navedenu godinu.

U mnogim statističkim istraživanjima javlja se potreba da se godišnja jednadžba trenda preračuna u mjesečnu. Što su kraća vremenska razdoblja za koja su podaci pri-kupljeni, izračunavanje trenda je duže jer ga je potrebno računati s puno više podataka. Zato je uobičajeno izračunati trend na bazi godišnjih podataka, a zatim ga preračunati u mjesečni. Pri tom treba voditi računa da se preračunavanje parametara s godišnjih vrijednosti na mjesečne razlikuje ovisno o tome da li je niz intervalni ili trenutačni. Godišnja jednadžba trenutačnog vremenskog niza pretvara se u mjesečnu jednadžbu trenda na slijedeći način:

xbay

12+=

S obzirom da su podaci trenutačnog vremenskog niza nastali sagledavanjem razine pojave u trenutku, parametar a ostaje isti u bilo kojoj jednadžbi linearnog trenda koja ima isto ishodište. Parametar b predstavlja godišnju apsolutnu promjenu pojave pa će se njegovim dijeljenjem sa 12 dobiti mjesečna apsolutna promjena.

Kod intervalnog vremenskog niza podaci se odnose na čitavo analizirano vremensko razdoblje. Ako se parametar a podijeli sa 12, kvocijent će predstavljati vrijednost trenda koja se odnosi na mjesec dana. Kada se parametar b podijeli sa 12, dobije se prosječna mjesečna vrijednost godišnje promjene. Kako bi se izračunala prosječna mjesečna vri-jednost mjesečne promjene, potrebno je parametar b još jednom podijeliti sa 12. Dakle, godišnju jednadžbu trenda intervalnog vremenskog niza pretvaramo u mjesečnu jed-nadžbu trenda pomoću slijedećeg izraza:

xbay

14412+=

U primjeru 7.1. radi se o intervalnom nizu čije su frekvencije nastale zbrajanjem tokom promatranog razdoblja. Godišnju jednadžbu trenda prevesti ćemo u mjesečnu:

xy 5,76,69 +=

xxy 052,08,5

1445,7

126,69

+=+=


82

y = 5,8+0,052xx = 0, 2004. godinejedinica za x = 1 mjesecjedinica za y = milijun kn

Promet trgovine „X“ u promatranom razdoblju prosječno se mjesečno povećavao za 0,052 milijuna kn.

Grafi čki ćemo prikazati linearni trend s ocijenjenim parametrima usporedno s origi-nalnim podacima.

Grafi kon 7.1. Prikaz linearnog trenda

Vidljivo je da promatrani vremenski niz ima tendenciju rasta, tj da se vrijednost pro-meta trgovine povećava i da postoji približna linearna kovarijacija vrijednosti prometa trgovine s vremenom.

7.1.2. Ishodište u sredini vremenskog razdoblja (neparan broj godina)Trend je moguće računati i na način da vremenska nul-točka bude u sredini niza. U

tom će slučaju aritmetička sredina varijable x (vrijeme) biti jednaka nuli, pa je računanje parametara a i b pojednostavljeno reduciranim izrazima:

∑∑= 2x

xyb

i

ya =


83

Vratit ćemo se primjeru 7.1. i odrediti jednadžbu linearnog trenda za razdoblje od 2004.-2008., ali sa ishodištem u sredini razdoblja. Vremenska nul-točka biti će u sredini niza (u 2006. godini).



2004.2005.2006.2007.2008.

6778889397

-2-1012

-134-78093194

41014

423 0 75 10 Izvor: podaci su simulirani

5,7

1075

2 ===∑∑

x

xyb 6,84

5423

=== ∑N

yy

6,84== ya

y = 84,6+7,5xx = 0, 2006. godinejedinica za x = 1 godinajedinica za y = milijun kn

Promet trgovine „X“ povećavao se prosječno godišnje za 7,5 milijuna kuna.


84

7.1.3. Ishodište u sredini vremenskog razdoblja (paran broj godina)Još jedna varijanta računanja jednadžbe linearnog trenda je s ishodištem u sredini

vremenskog razdoblja kada je duljina serije n paran broj. Sada ćemo odrediti jednadžbu linearnog trenda za razdoblje od 2005.- 2008. Promatrano razdoblje ima neparan broj godina.



2005.2006.2007.2008.

78889397

-2-112

-156-8893194

4114

356 0 43 10 Izvor: podaci su simulirani

3,4

1043

2 ===∑∑

x

xyb 89

4356

=== ∑N

yy

89== ya

y = 89+4,3xx = 0, 2006. godinejedinica za x = 1 godinajedinica za y = milijun kn

Promet trgovine „X“ povećavao se prosječno godišnje za 4,3 milijuna kuna.


85

7.2. PARABOLIČKI TREND

Parabolički trend se primjenjuje kada pojava koja se promatra u određenom vre-menskom razdoblju ne pokazuje približno iste apsolutne promjene. Grafi čki prikaz podataka za takav jedan vremenski niz pokazuje krivu liniju. Funkcija paraboličkog trenda glasi:

y = a + bx + cx2

Nepoznati parametri procjenjuju se metodom najmanjih kvadrata. S obzirom na broj računskih radnji, u izračunu se rabe suvremena računala koja pojednostavljuju i ubrza-vaju izračunavanje parametara, uz pretpostavku uporabe dobrih statističkih paketa.

Grafi kon 7.2. Prikaz paraboličnog trenda drugog stupnja


86

7.3. EKSPONENCIJALNI TREND

Eksponencijalni trend primjenjuje se ako statistička pojava pokazuje izrazito dina-mičan porast ili pad vrijednosti u vremenskom nizu. Opći oblik funkcije eksponencijal-nog trenda glasi:

y = a ∙ bx

Grafi kon 7.3. Prikaz jednostavnog eksponencijalnog trenda

Logaritamskom transformacijom model eksponencijalnog trenda svodi se na model linearnog trenda. U lineariziranom se modelu umjesto originalnih vrijednosti rabe nji-hovi logaritmi:

bxay logloglog +=

∑ ∑∑ ∑

⋅−

−=

xxx

yxyxb 2

)(log)(loglog

xb

Ny

a loglog

log −= ∑


87

7.4. LOGARITAMSKI TREND

Logaritamski trend se primjenjuje kada su odstupanja od izračunate linije trenda prevelika odnosno izvan zadovoljavajućih granica. Funkcija logaritamskog trenda glasi:

ye = a∙xb

gdje je: a – vrijednost trenda u ishodištu, b – parametar prirasta / pada pojave x – vremenska jedinica.

Linearizirani oblik funkcije trenda je:

xbay logloglog ⋅+=

Pitanja:

1. Što je trend? Kako glasi jednadžba linearnog trenda?2. Što znače parametri a i b u jednadžbi linearnog trenda?3. Kada će se u analizi vremenskih nizova upotrijebiti linearni trend, a kada eksponencijalni trend?


88

8. KORELACIJA I REGRESIJA

8.1. KORELACIJSKA ANALIZA

Korelacija je povezanost ili uzajamni odnos između dviju ili više masovnih pojava. Korelacijska analiza predstavlja skupinu statističkih metoda kojima se koristimo kada želimo utvrdili što utječe na pojave, na koji način i u kojoj mjeri. Njome utvrđujemo:

- postojanje veze među pojavama (koefi cijent korelacije),- jačinu i smjer veze među pojavama (koefi cijent korelacije i njegov predznak),- za koliko će se vrijednost jedne pojave promijeniti ako se druga promijeni za jednu

jedinicu (parametar b) itd.

8.1.1. Dijagram rasipanjaDijagram rasipanja je grafi čki prikaz odnosa dviju pojava. Omogućava nam da već

samim pogledom procijenimo da li postoji veza između dviju varijabli. Na dijagramu se vrlo lako uočava kojeg je smjera veza između pojava. Veza može biti pozitivna, nega-tivna, potpuna ili uopće ne mora postojati.

Pozitivna korelacija je prisutna kada rast jedne varijable prati rast druge varijable, odnosno pad jedne varijable prati pad druge. Negativna korelacija znači da rast jedne varijable prati pad druge varijable.

Kod potpune ili perfektne korelacije vrijednost jedne varijable može se s potpunom sigurnošću odrediti pomoću vrijednosti druge varijable.


89

Kada veza među pojavama ne postoji imamo odsustvo korelacije.


90

8.1.2. Koefi cijent linearne korelacijeMatematički pokazatelj kovarijacije je koefi cijent linearne korelacije (r). Engle-

ski matematičar Karl Pearson razradio je računski postupak za izračunavanje stupnja povezanosti između promatranih pojava. Vrijednost Pearsonovog koefi cijenta određuje jakost veze između pojava, a njegov predznak određuje smjer. Kreće se u intervalu od -1 do 1. Kada je vrijednost koefi cijenta jednaka 0 onda ne postoji korelacija između po-java. Što je vrijednost bliža 1 ili -1, linearna povezanost promatranih pojava je sve jača. Negativna vrijednost ukazuje da rast jedne pojave uzrokuje smanjenje druge, i obratno. Kada je koefi cijent pozitivan pojave istovremeno rastu ili padaju.

Prikaz 8.1. Smjer i jakost koefi cijenta linearne korelacije

Koefi cijent linearne korelacije računa se pomoću formule:

yx

N

iii

N

yxNyxr

σσ ⋅⋅

⋅⋅−⋅=∑=1


91

8.2. REGRESIJSKA ANALIZA

Regresijska analiza uključuje ispitivanje međusobne ovisnosti jedne pojave o dru-goj ili više njih. Regresijskoj je dakle analizi svrha istražiti povezanost među pojavama, zbog čega se regresijska i korelacijska analiza često upotrebljavaju kao sinonimi. Po-stoji ipak stanovita razlika, uglavnom u pristupu. U korelacijskoj je analizi naglasak na mjerenju stupnja povezanosti između varijabli, dok je u regresijskoj analizi naglasak na izražavanju veze prikladnim analitičkim izrazom, odnosno modelom. 22

8.2.1. Jednostavna linearna regresija Jednostavna linearna regresija predstavlja odnos između dviju pojava u kojem

promjenu jedne pojave prati približna linearna promjena druge. Linearnu regresiju ma-tematički možemo izraziti kao:

uxfY += )( gdje je: x – nezavisna varijabla y – zavisna varijabla u – greška relacije, varijabla koja izražava nepoznate i apstrahirane

utjecaje na varijaciju varijable y

Iz navedene formule izvodimo formule za jednadžbe dvaju pravaca koji predstavlja-ju pojave koje želimo usporediti:

bxaye += ybaxe ′+′=

Parametri jednadžbi ye i xe određuju se pomoću izraza:

∑∑∑ ∑

−

−=

xxx

yxxyb 2 xbya −=

∑∑∑ ∑

−

−=′

yyy

xyxyb 2 ybxa ′−=′

22 Gogala, Z. (2001) Osnove statistike, Sinergija, Zagreb, str. 145.


92

U tom slučaju koefi cijent korelacije računa se kao geometrijsku sredinu parametara b i b’ prema formuli:

bbb ′⋅±=

Primjer 8.1. Raspolaže se godišnjim podacima o ostvarenom prometu (u milijunima kn) trgovačke radnje „Z“ za razdoblje 2002. – 2008. Na temelju računovodstvenih po-dataka utvrđen je i neto prihod po godinama za navedeno razdoblje. Podaci su dani u tabeli:

Godina Ostvaren promet(u mil kn)

Neto prihod(u mil kn)

2002. 65 30

2003. 72 33

2004. 70 31

2005. 75 34

2006. 82 40

2007. 84 41

2008. 76 39

Prvi i uobičajeni korak u analizi odnosa među dvjema pojavama sastoji se u crtanju dijagrama rasipanja. Cilj je pomoću njega utvrditi oblik veze između promatranih va-rijabli. Budući da se prikazuje odnos pojava, mjerilo na osima ne mora početi s nulom.


93

Iz dijagrama rasipanja uočljivo je da s povećanjem prometa postoji tendencija pove-ćanja neto prihoda. Dijagram također pokazuje da se odnos ostvarenog prometa i neto prihoda može analitički izraziti modelom jednostavne linearne regresije.

Parametre u modelu procijenit ćemo metodom najmanjih kvadrata:

GodinaOstvaren promet

(u mil kn)x

Neto prihod(u mil kn)

y x2 y2 xy

2002. 65 30 4225 900 19502003. 72 33 5184 1089 23762004. 70 31 4900 961 21702005. 75 34 5625 1156 25502006. 82 40 6724 1600 32802007. 84 41 7056 1681 34442008. 76 35 5776 1225 2660

∑ 524 244 39490 8612 18430

86,74

7524

=== ∑N

xx 86,34

7244

=== ∑N

yy

62,052486,743949024486,7418430

2 =⋅−⋅−

=−

−=

∑∑∑ ∑

xxxyxxy

b

55,1186,7462,086,34 −=⋅−=−= xbya

Linearna je regresijska jednadžba, odnosno model s procjenama parametara:

xy 62,055,11 +−=

Konstantni član a=-11,55 je regresijska vrijednost neto prihoda ako je promet jednak nuli. To znači da kad trgovina „Z“ ne bi ostvarila nikakav promet, prema regresiji bi imala gubitak od 11,55 milijuna kuna. Regresijski koefi cijent b=0,62 pokazuje da ako se promet poveća za milijun kuna, regresijska vrijednost neto prihoda povećat će se za 0,62 milijuna kuna.


94

Regresijske vrijednosti su vrijednosti regresijske funkcije s procijenjenim para-metrima. Izračunavaju se tako da se u regresijsku jednadžbu redom uvrštavaju stvarne vrijednosti nezavisne varijable. Prva je regresijska vrijednost:

75,286562,055,1162,055,111 =⋅+−=+−= xy

Prema regresiji, za ostvaren promet od 65 milijuna kuna očekivani neto prihod je 28,75 milijuna kuna, a stvarna zabilježena vrijednost je 30 milijuna kuna. Razliku čini rezidualno odstupanje.

Rezidualna odstupanja su procjene vrijednosti slučajne veličine u modelu regresi-je. Izračunavaju se tako da se od stvarne vrijednosti zavisne varijable y oduzme pripa-dajuća regresijska vrijednost. Prvo je rezidualno odstupanje:

25,175,28301 =−=u itd.

8.2.2. Regresijski polinomModel jednostavne linearne regresije koji je prezentiran u poglavlju 8.2.1. može se

primijeniti u ograničenom broju slučajeva, tj. samo u slučaju kada odgovarajuću pro-mjenu nezavisne varijable prati približno linearna promjena zavisne varijable. U real-nom životu nelinearne ovisnosti mnogo su češće. No, s nelinearnim ovisnostima između različitih pojava ili varijabli javljaju se i problemi u procesu njihovog objašnjavanja, a osobito pri pokušaju da se takve ovisnosti prezentiraju uz pomoć odgovarajućeg regre-sijskog modela.23 U slučaju da veza između varijabli x i y nije linearna, upotrebljava se regresijski polinom k-tog stupnja:24

Y=a0 + b1∙ x+b2 ∙ x2+....+bk ∙ x

k

Ocjena parametara uz pomoć odgovarajućih matrica (vektora):

b=(xTx)-1 (xTy)

23 Rozga, A. i Grčić, B. (2000) Poslovna statistika, Veleučilište u Splitu, Split, str. 141.

24 Šimundić, S. i Boban, M. (2003) Zbirka zadataka iz statistike, Pravni fakultet Sveučilišta u Splitu, Split, str. 64.


95

Matrični izračun odgovarajućih suma kvadrata odstupanja:

SP=bT(xTy)

SR=yTy-bT(xTy)

ST= yTy-N∙y2

8.2.3. Jednostavna eksponencijalna regresijaModel jednostavne eksponencijalne regresije defi niran je na slijedeći način:

y=b0∙b1x

Da bi se za ocjenu parametara upotrijebila metoda najmanjih kvadrata, potrebno je početni logaritamski model logaritamskom transformacijom prevesti u logaritamsko – linearni oblik:

logy=log b0 + log b1∙x

Nadalje vrijedi da je:

2loglog

log 21xNx

yxNyxb

⋅−

⋅⋅−=

∑∑ xbyb ⋅−= 10 logloglog

gdje su:

Nx

x ∑=N

yy ∑= log

log

jednostavne aritmetičke sredine varijabli x i logy.

Transformacijom: b0=10log b0 i b1=10log b1

se dobiju originalne vrijednosti parametara modela.


96

Parametar b0 je konstantan član, tj. Očekivana vrijednost zavisne varijable kada je nezavisna varijabla jednaka nuli. Parametar b1 interpretira se kao ocjena prosječne stope promjene varijable y, kada varijabla x poraste za jednu jedinicu.

Primjer 8.2. U tablici je dana vrijednost osnovnih sredstava(u 00 mil kn) i profi t (u mil kn) 7 poduzeća prehrambene industrije:

Osnovna sredstva (u 00 mil kuna)

x

Profi t(u mil kn)

y

3 3

3,5 6

3,8 10

4,5 19

5,0 31

5,2 52

5,8 55 Izvor: podaci su simulirani

Analizu odnosa osnovnih sredstava i profi ta ćemo započeti ucrtavanjem vrijednosti x i y u dijagram rasipanja.

Dijagram pokazuje da se odnos osnovnih sredstava i profi ta može analitički izraziti modelom jednostavne eksponencijalne regresije.


97

Podaci potrebni za izračun koefi cijenata a0 i b1 prikazani su u slijedećoj tablici:

Osnovna sredstva (u 00 mil kuna)

x

Profi t(u mil kn)

ylog y x2 xi ∙logy

3 3 0,47712 9,00 1,43136

3,5 6 0,77815 12,25 2,72353

3,8 10 1,00000 14,44 3,80000

4,5 19 1,27875 20,25 5,75436

5,0 31 1,49136 25,00 7,45680

5,2 52 1,71600 27,04 8,92320

5,8 55 1,74036 33,64 10,0941

30,8 176 8,48174 141,62 40,18335

4,4

78,30=== ∑

Nx

x 21168,17

48174,8loglog === ∑

Ny

y

4695,0

36,19762,14121168,14,4718335,40

2loglog

log 21 =⋅−⋅⋅−

=⋅−

⋅⋅−=

∑∑

xNxyxNyx

b

85412,04,44695,021168,1log 0 −=⋅−=b

b0=10 -0,85412 = 0,13992

b1=100,4695 = 2,94781

y=b0∙b1x=0,13992 ∙ 0,94781x

Parametar b0=0,13992 predstavlja očekivanu razinu profi ta u slučaju da osnovna sredstva budu jednaka nuli. Parametar b1= 2,94781 predstavlja prosječnu stopu promje-ne profi ta, kada se osnovna sredstva povećaju za milijun kuna.


98

8.2.4. Višestruka (multipla) linearna regresijaUkoliko pojava y ovisi o više neovisnih pojava x, postavlja se model višestruke

linearne regresije. Model multiple linearne regresije može se napisati kao:

y= a0 + b1 ∙x1 + b2 ∙x2 + ..... + bk ∙xk

Obrada modela višestruke linearne regresije ima istu zadaću kao i obrada kod jedno-stavne linearne regresije. Treba izračunati nepoznate parametre pri čemu se primjenjuje metoda najmanjih kvadrata.

b= (xTx)-1 (xTy)

Matrični izračun odgovarajućih suma kvadrata odstupanja:

SP =bT (xTy)

SR= yTy-bT (xTy)

ST= yTy-N∙y2

Pitanja:

1. Što je korelacija? Kakva može biti prema obliku, smjeru i jakosti?2. Što je dijagram rasipanja? Šta se iz njega može saznati?3. Kako se određuje koefi cijent korelacije i koje vrijednosti može zauzeti?4. Objasnite pojmove regresijska vrijednost i rezidualno odstupanje.


99

9. VJEROJATNOST

Vjerojatnost je brojčana mjera nastupa neizvjesnih, odnosno slučajnih događa-ja. Slučajni događaji su oni događaji koji se mogu, ali ne moraju dogoditi. Postoje tri osnovne defi nicije vjerojatnosti: klasična (a priori), statistička ili empirijska (a poste-riori) i subjektivna.

9.1. OSNOVNI POJMOVI I DEFINICIJE VJEROJATNOSTI

Klasična defi nicija vjerojatnosti jednog događaja smatra se omjerom broja za njega povoljnih slučajeva, prema broju svih jednako mogućih slučajeva. Ona se u matematič-kom obliku zapisuje kao:

nmDP =)(

gdje je:

P(D) – vjerojatnost događaja D,m – broj povoljnih slučajeva,n – broj svih jednako mogućih slučajeva.

Vjerojatnost a posteriori ili empirijska vjerojatnost je granična vjerojatnost relativne frekvencije povoljnog ishoda događaja D, ako broj pokušaja raste u beskonačnost.

nmDP lim)( =

∞→n

Ako se sud o vjerojatnosti nastupa slučajnog događaja temelji na individualnoj pro-sudbi ili intuiciji riječ je o subjektivnoj vjerojatnosti. Naime, za neke događaje je ka-rakteristično da se ne može utvrditi vjerojatnost ni na temelju klasične niti na temelju statističke defi nicije vjerojatnosti (relativnom frekvencijom), pa se koristi subjektivna vjerojatnost.

Subjektivna vjerojatnost spada među psihološke, a ne statističke pojmove i stoga sa statističkom (ili matematičkom) vjerojatnosti nema mnogo zajedničkoga. Ljudi, na


100

primjer, u većini slučajeva vjeruju da će dobiti glavni zgoditak u igrama na sreću, ali praktički ne vjeruju da će im se dogoditi neka prometna nesreća, iako je vjerojatnost za nesreću, na žalost, puno veća nego vjerojatnost dobitka na lotu.25

Svojstva vjerojatnosti:

1. Vjerojatnost nastupa događaja D je nenegativan broj.2. Vjerojatnost nemogućeg događaja jednaka je 0, a vjerojatnost sigurnog događaja 1.

3. Vjerojatnost nenastupanja događaja D jednaka je:

)(1)( DPDP −=

4. Za događaje D1 i D2, vjerojatnost nastupa barem jednog od njih jednaka je:

)()()()( 212121 DDPDPDPDDP ∩−+=∪

5. Ako su D1 i D2 dva međusobno isključiva događaja, vjerojatnost da će nastupiti doga-đaj D1 ili D2 jednaka je zbroju njihovih vjerojatnosti:

)()()( 2121 DPDPDDP +=∪

6. Uvjetna vjerojatnost je vjerojatnost nastupa jednog elementarnog događaja uz uvjet nastanka drugog događaja. Vjerojatnost nastupa događaja D2 uz uvjet da je nastupio događaj D1 :

P(D2 | D1) =

)()(

1

12

DPDDP ∩

,P(D1) › 0

25 Petz, B. (1985) Osnove statističke metode za nematematičare, SNL, Zagreb, str. 29.


101

7. Ako su dva događaja neovisna, tada vrijedi:

)()()( 2121 DPDPDDP ⋅=∩

To je vjerojatnost da će nastupiti i D1 i D2.

Primjer 9.1. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ prema postignutom uspjehu, ljetni ispitni rok, ak. god. 2009./10.

Ocjena Broj studenata2345

21118646


Kolika je vjerojatnost da ćemo slučajnim odabirom jednog studenta odabrati studenta koji: a) je na ispitu dobio ocjenu 3, b) nije dobio ocjenu 3, c) dobio ocjenu 2 ili 3, d) dobio ocjenu 2 i 3?

a) 11 studenata dobilo je na ispitu ocjenu 3 pa je broj povoljnih događaja m=11. Ukupno je ispit položilo 46 studenata, te je broj svih mogućih događaja n=46.

24,0

4611)3( ==P

b) Događaj „nije dobio ocjenu 3“ suprotan je događaju P(3), pa vrijedi:

76,024,01)3( =−=P

c) Događaji da student dobije ocjenu 2 ili ocjenu 3 su međusobno isključivi, jer ne mogu nastupiti istovremeno. Vjerojatnost da nastupi jedan ili drugi događaj jednaka je zbroju njihovih vjerojatnosti.

7,0

4611

4621)32( =+=∪P


102

d) Događaj „dobio ocjenu 2 i 3“ je nemoguć, pa je njegova vjerojatnost jednaka nuli.

9.2. SLUČAJNA VARIJABLA I TEORIJSKE DISTRIBUCIJE VJEROJATNOSTI

Slučajna varijabla je numerička funkcija koja svakom ishodu slučajnog pokusa pri-družuje realan broj. Ona je diskretna ako poprima konačan broj vrijednosti ili prebroji-vo mnogo njih. Kontinuirana slučajna varijabla poprima bilo koju vrijednost iz nekog intervala: npr. visina u centimetrima, cijena, tečaj promjene valute, debljina predmeta itd. Navedeni primjeri mogu poprimiti bilo koju vrijednost, a točnost mjerenja ovisi samo o mjernom instrumentu.

U dosadašnjim primjerima distribucije su bile formirane grupiranjem opažanja ili elemenata skupa prema nekom obilježju. Nasuprot takvim empirijskim distribucija-ma postoje teorijske distribucije koje se mogu očekivati u skladu s iskustvom ili na temelju nekih pretpostavki. Svaka teorijska distribucija ima svoj zakon vjerojatnosti po kojem su distibuirane vrijednosti slučajne varijable X. Osim funkcije vjerojatnosti te distribucije imaju očekivanje, varijancu, koefi cijent asimetrije i koefi cijent zaobljenosti. Zavisno od tipa distribucije dijelimo na diskretne i kontinuirane. Diskretne distribucije su: binomna, poissonova i hipergeometrijska, a kontinuirane normalna (gaussova), studentova ili t-distribucija i gama distribucija.

Najčešća distribucija s kojom se u životu susrećemo je normalna distribucija, u kojoj

Distribucijevjerojatnosti

Distribucije diskretne slučajne varijable

binomna normalna

Poissonova Studentova

hipergeometrijska gama

i druge i druge

Distribucije kontinuiraneslučajne varijable


103

nalazimo najviše srednjih, a najmanje ekstremno malih ili ekstremno velikih rezultata. No to ne mora uvijek biti tako, jer se mnoge pojave raspoređuju i na druge načine. Tako je, na primjer, poznato da se broj ozljeda na radu distribuira asimetrično: najveći broj ljudi ili se ne ozljedi, ili se ozljedi samo jednom na radu, a vrlo mali broj ljudi se na radu ozlijedi više puta.26

9.2.1. Binomna distribucijaBinomna ili Bernoullieva27 distribucija upotrebljava se u slučajevima kada je slu-

čajna varijabla prirodni broj i kada je vjerojatnost događaja konstantna. Primjerena je za upotrebu kada je broj jedinica uzorka relativno manji u odnosu na veliki broj jedinica osnovnog skupa.

Formula za izračunavanje vjerojatnosti pojavljivanja nekog ishoda kod binomne distri-bucije glasi:

( ) (1 )k n knP X k p p

k−⎛ ⎞

= = −⎜ ⎟⎝ ⎠ ,

nk ,...,2,1,0=

gdje je: p – vjerojatnost da će se nešto dogoditi, 1-p ili q – vjerojatnost da se to neće dogoditi, k – broj „pogodaka“ n – veličina uzorka

Formula podrazumijeva da su događaji: a) dihotomni (da padaju u samo dvije kategorije) b) međusobno isključivi, c) međusobno neovisni, d) izabrani na slučaj.

Najjednostavniji primjer Binomne distribucije je bacanje novčića. Nadalje, u pro-cesu proizvodnje proizvodi su označeni kao ispravni ili neispravni, tvrtka koja se bavi ugovorima će ili zaključiti ugovor ili neće, novi pristupnici ili prihvaćaju ponudu odre-đenog zaposlenja ili odbacuju itd.

26 Petz, B. (1985) Osnove statističke metode za nematematičare, SNL, Zagreb, str. 11.

27 James Bernouli (1654-1705) je formulirao ovu distribuciju 1690. u djelu “Ars Conjectandi” koja je objavljena osam godina nakon njegove smrti.


104

Binomna distribucija ima veliku primjenu kod statističke kontrole kvalitete kada se proizvodi klasifi ciraju kao dobri i loši i kada se želi procijeniti interval npr. loših proi-zvoda u nekom skupu.28

Očekivanje slučajne varijable X distribuirane po binomnom zakonu distribucije je:

E ( X ) = n p

Varijanca i standardna devijacija slučajne varijable x distribuirane po Binomnom zako-nu distribucije je:

2( )V x n p q n p qσ σ= = ⋅ ⋅ ⇒ = ⋅ ⋅

Primjer 9.2. Automatski stroj izrađuje proizvod s konstantnim postotokom škarta od 3% (p=0.03). Ako se u uzorak izabere n=5 proizvoda, zadatak je odrediti vjerojatnost da su dva proizvoda neispravna.

008214.0)03,01(03.0

25

)2( )25(2 =−⋅⎟⎟⎠

⎞⎜⎜⎝

⎛= −P

To znači da ako bismo proizvode pakirali u kutije po 5 proizvoda, bez oprethodnog odvajanja dobrih od loših proizvoda, onda bi 0,8% kutija sadržavalo 2 neispravna pro-izvoda.

9.2.2. Poissonova distribucijaPoissonova29 distribucija je teorijska distribucija diskretne slučajne varijable X čiji

je analitički oblik zadan izrazom:

( )!

k mm eP X kk

−

= = , 0,1,2,...,k m=

gdje je m aritmetička sredina, a često se umjesto m koristi λ (lambda) i vrijedi da je m=np. Konstanta e je baza prirodnig logaritama i iznosi 2,718282 dok je sa k označena slučajna varijabla koja može zauzeti vrijednosti od 0 do n.

28 Kero, Z. i Bijanić-Glavica, B. (2003) Statistika u primjerima, FOI, Varaždin, str. 174.

29 Simeon Dennis Poisson (1781-1840) je otkrio i objavio ovu distribuciju u knjizi “Recherches sur la probabilité des jugements en matières criminelles et matière civile” 1838


105

Očekivana vrijednost, varijanca i standardna devijacija Poissonove distribucije dana je formulom:

( )E X m= ; 2( )V x mσ= = ; mσ =

O Poissonovoj distribuciji govori se u onim slučajevima kada je slučajna varijabla prirodan broj i vjerojatnost događaja konstantna i vrlo mala, a skup je beskonačno velik. Prikladna je za relativno rijetke događaje.

Tipična primjena Poissonove distribucije u statističkoj kontroli kvalitete je pri odre-đivanju modela pojavljivanja nedostataka (defekata) ili neusklađenosti po jedinici (npr. proizvoda, ili po smjeni, po stroju i sl.). U praksi vrijedi da se ova distribucija koristi kada je n≥50 i p≤0,10.

Poissonova distribucija je nesimetrična distribucija, a oblik joj ovisi samo o m. Uko-liko se m povećava, nesimetričnost distribucije se smmanjuje te ona teži normalnoj distibuciji.

Primjer 9.3. Osigurane osobe prijavljuju u prosjeku 0,4 šteta godišnje. Zadatak je odre-diti vjerojatnost da neki vlasnik police prijavi barem jednu štetu godišnje.

Rješenje: p (bar jedna šteta)= 1 – p (nema štete)

32968,067032,014,0!0

1 04,0

=−≈−=−e

9.2.3. Normalna distribucijaNormalna distribucija, naziva se još i Gaussova,30je najpoznatija teorijska distribu-

cija vjerojatnosti kontinuirane slučajne varijable. Ima široku primjenu u donošenju po-slovnih odluka. Za slučajnu varijablu X kažemo da je distribuirana po zakonu normalne distribucije ako je područje njenih vrijednosti ( ),−∞ +∞ . Formula za izračun funkcije gustoće vjerojatnosti normalne distribucije je:

2121( )

2

t

f t eμδ

δ π

−⎛ ⎞− ⎜ ⎟⎝ ⎠=

, t>0

30 Johan Carl Friedrich Gauss (1777-1855) , Disquisitiones generales circa superfi ces curva, 1828


106

gdje je μ srednja vrijednost, δ standardna devijacija, a t bilo koja vrijednost kontinu-irane varijable.

Grafi čki prikaz normalne distribucije je normalna krivulja koja je zvonasta oblika i simetrična, a očekivana vrijednost, mod i medijan poprimaju jednaku vrijednost.

Graf 9.1. Grafi čki prikaz normalne distribucije

Kada su rezultati pravilno, simetrično i „normalno” grupirani oko aritmetičke sre-

dine, onda se u intervalu koji obuhvaća σ1±x nalazi 68,26% svih rezultata. To znači da ako aritmetičkoj sredini na jednu i na drugu stranu „dodamo” vrijednost standardne devijacije, obuhvatit ćemo oko 68% rezultata. Nadalje vrijedi da je u intervalu koji obu-

hvaća σ3±x 95,44%, a σ3±x 99,73% rezultata.

Kako su parametri normalne distribucije izraženi u mjernim jedinicama varijable, usporedivost raznorodnih distribucija možemo osigurati jedino standardiziranjem. Bilo koja normalna distribucija može se prevesti u standardiziranu (jediničnu) normalnu dis-tribuciju Z sa sredinom jednakom 0 i varijancom jednakom 1. Potrebno je prevesti vri-jednost t u Z oduzimanjem aritmetičke sredine od vrijednosti varijable t i dijeljenjem te vrijednosti sa stanndardnom devijacijom prema formuli:

tz μδ−

=

Međutim, riječ je o istoj distribuciji samo što se mijenja mjerna skala. Možemo izraziti problem pomoću originalnih vrijednosti ili pomoću standardiziranih vrijednosti.

Primjer 9.4. Ako je t mormalno distribuirana slučajna varijabla sa aritmetičkom sredi-nom jednakom 100 i standardnom devijacijom 50, Z-vrijednost je:

2

50100200

=−

=Z


107

To znači da t=200 odstupa od sredine jednake 100 za dvije standardne devijacije.

Standardizirana normalna distribucija je tabelirana i sadrži vrijednosti normalnalne funkcije distribucije (površine ispod normalne krivulje). Pomoću tablice površina is-pod normalne krivulje očitava se vjerojatnost da će se vrijednost kontinuirane slučajne varijable naći u intervalu z1-z2. Tablica je konstruirana samo za desnu stranu standardi-zirane normalne krivulje pa su sve vrijednosti pozitivne. Za odgovarajuće negativne z vrijednosti površina je jednaka.

U predstupcu tablice površina ispod normalne krivulje se nalaze vrijednosti standar-

diziranog obilježja z izražene s brojevima s jednom decimalom. Druga decimala nazna-čena je u zaglavlju tabele. Te vrijednosti označuju udaljenost standardiziranog obilježja od aritmetičke sredine uzduž apscise.

Iz tablice je primjerice moguće očitati da se u pojasu od aritmetičke sredine skupa do jedne standardne devijacije nalazi 0,3413 jedinica, uz pretpostavku da se radi o nor-malno distribuiranim jedinicama.


108

To znači da se u intervalu σ00,1±x nalazi (2∙34,13%) 68,26% svih jedinica skupa s obzirom na promatrano obilježje tih jedinica.

9.2.4. Studentova distribucijaStudentova31 distribucija naziva se još i t-distribucija, a svoju primjenu u statistici

ima kod procjene parametara osnovnog skupa i kod testiranja hipoteza na osnovu uzor-ka. Funkcija gustoće vjerojatnosti za t-razdiobu glasi:

( )2 2

1

1 11 , 12 2 1

nf tn tn B

n

=⎛ ⎞−⎛ ⎞− +⎜ ⎟⎜ ⎟−⎝ ⎠⎝ ⎠

gdje je 1 1,2 2

nB −⎛ ⎞⎜ ⎟⎝ ⎠

beta funkcija s parametrima 1 1,2 2

n −, a n je broj elemenata. Oblik

Studentove distribucije ovisi o veličini n. Veličina (n-1) predstavlja broj „stupnjeva slo-bode“ i označava se često malim grčkim slovom ν (ni). Za velike vrijednosti n (n>30) Studentova se distribucija približava standardiziranoj normalnoj. Za manje vrijednosti n (n<30) Studentova je distribucija više razvučena po apscisi od normalne utoliko više što je n manje. Studentova distribucija je simetrična.

9.2.5. Hi-kvadrat distribucijaTeorijska hi-kvadrat distribucija primjenjuje se kada treba donijeti odluku o signifi -

kantnosti razlika stvarnih (opaženih) i teorijskih (očekivanih) frekvencija. Defi nira se kao zbroj odnosa kvadrata razlika između opaženih i očekivanih vrijednosti prema oče-kivanim vrijednostima ili:

gdje je f0 empirijska ili opažena frekvencija, a ft teorijska ili očekivana frekvencija.

31 Otkrio ju je W.S.Gosset koji se koristio pseudonim student kad ju je publicirao


109

Hi-kvadrat test najčešće se upotrebljava kada se želi ispitati razina značajnosti ra-zlike između očekivane distribucije podataka i dobivenih podataka, i/ili između dviju ili više skupina nezavisnih kvalitativnih podataka.

Primjer 9.5 Želimo ispitati razliku prema spolu između studenata VUŠ-a koji su pola-gali ispit iz kolegija „Poslovna statistika“ u ljetnom i jesenskom ispitnom roku u aka-demskoj godini 2009./10. U ljetnom ispitnom roku od 120 studenata 70% su bile žene, a u jesenskom ispitnom roku od 140 studenata 40% su bili muškarci.

Prvi korak je izrada kontingencijske tablice:Ljetni ispitni rok Jesenski ispitni rok Ukupno

M 36 56 92Ž 84 84 168

Ukupno 120 140 260

Zatim je potrebno izračunati očekivane frekvencije ft prema formuli:

∑∑ ∑⋅=

ukupnostupcaretka

ft

te je: 42

26092120

1 ≈⋅

=ft ,

78260

1681202 ≈

⋅=ft

itd.

Tablica s očekivanim frekvencijama:Ljetni ispitni rok Jesenski ispitni rok Ukupno

M 42 50 92Ž 78 90 168

Ukupno 120 140 260

Treći korak u izradi hi-kvadrat testa je računanje hi-kvadrat vrijednosti:f0 ft f0-ft (f0-ft)

2 (f0-ft)2/ft

36 42 -6 36 0,8656 50 6 36 0,7284 78 6 36 0,4684 90 -6 36 0,40


110

pa empirijski hi-kvadrat ili test veličina iznosi 0,86+0,72+0,46+0,40=2,4.

Vrijednosti hi-kvadrat distribucije su tabelirane. Iz tablice granične vrijednosti hi-kva-drata iščitamo hi-kvadrat vrijednost za odabranu razinu značajnosti i odgovarajući broj stupnjeva slobode. Stupnjevi slobode (DF-eng. degree of freedom ili k) određuju se pomoću formule:

)1()1( −⋅−= srk

gdje je r broj redaka, a s broj stupaca. U našem primjeru je stoga 1)12()12( =−⋅−=k .

Iz tablice se vidi da granična vrijednost hi-kvadrata uz 1 stupanj slobode, a na razini signifi kantnosti od 5%, iznosi 3,841.

Ako je test veličina manja od granične vrijednosti hi-kvadrata prihvaćamo hipotezu H0 da ne postoji statistički značajna razlika u raspodjeli studenata muškog i ženskog spola između ljetnog i jesenskog ispitnog roka. Ako je test veličina veća od granične vrijed-nosti hi-kvadrata odbacuje se hipoteza H0 i prihvaća hipoteza H1 – da postoji značajna razlika u raspodjeli. Kako je u našem primjeru 2,4<3,842 prihvaćamo H0 i zaključujemo da nema statistički značajne razlike u raspodjeli.

Hi-kvadrat test može se računati samo sa frekvencijama. Prema tome, u tablicu ne smi-jemo unositi postotke. Hi-kvadrat kod 2∙2 tablica smije se upotrijebiti ako je N veći od 40. Kada je N manji od 40, ali veći od 20, dozvoljeno je računati hi-kvadrat samo ako niti jedna očekivana frekvencija nije manja od 5. Nadalje, hi-kvadrat se može računati ako je najviše 20% očekivanih frekvencija manje od 5 i sve očekivane frekvencije veće od 1. Ako taj uvjet nije zadovoljen, neke kategorije je potrebno spajati da bi se povećala očekivana frekvencija.


111

Pitanja

1. Defi nirajte vjerojatnost a priori i vjerojatnost a posteriori.2. Što je subjektivna vjerojatnost?3. Kakvi su to međusobno isključivi događaji? Navedite primjer.4. Što je uvjetna vjerojatnost?5. Koje su karakteristike Poissonove distribucije?6. Objasnite tablicu normalne Gaussove distribucije.7. Koje su karakteristike hi kvadrat testa? Kada se ne smije primjeniti?


112

10. METODA UZORAKA

Pri različitim statističkim istraživanjima obrada prikupljenog materijala često zahti-jeva dugotrajno angažiranje opreme i osoblja, što može biti preskupo i može zahtije-vati previše vremena. Primjerice, kada bismo htjeli odrediti kolika je prosječna visina punoljetnih osoba u gradu Šibeniku, morali bismo stvarno pronaći svakog punoljetnog građanina grada Šibenika, što ne bi bilo niti lako niti jeftino. Isto tako, kada bismo htjeli testirati kvalitetu nekog prehrambenog proizvoda bilo bi besmisleno testirati sve koma-de iz serije, jer se testiranjem često proizvodi uništavaju. Zbog toga se često provodi reprezentativno ispitivanje kod kojeg se iz osnovnog skupa ili populacije na strogo određen način izabere samo dio elemenata koji se naziva uzorkom. Pomoću uzorka se procjenjuju karakteristike osnovnog skupa, a statističkom metodom određuje se po-uzdanost i preciznost te procjene. Svi ti postupci čine metodu koja se zove metoda uzoraka.

Uzorak je slučajan (eng. random sample) kada svaki element osnovnog skupa ima jednaku šansu da bude izabran. Pri tom nije riječ o „bilo kako izabranom“ slučajnom uzorku već se on sastavlja prema određenim principima koji odgovaraju zakonu sluča-ja. Jednom izabrana jedinica uzorka pri ponovnom izboru se može vraćati u osnovni skup, ali i ne mora. Stoga postoji jednostavni slučajni izbor uzorka bez ponavljanja i s ponavljanjem. Najčešće korištena metoda za odabir slučajnog uzorka je odabir uzorka pomoću tablice slučajnih brojeva. Danas se za odabir slučajnog uzorka pretežno koristi računalo.

Slučajan izbor je moguć i primjenom sistematskog izbora jedinica u uzorak kada se odabir jedinki promatranja odvija po nekom sistemu (npr. svaki peti vlasnik telefonskog broja prema telefonskom imeniku). Sistematski uzorak se rabi u metodi promatranja, telefonskom ispitivanju itd. Osim slučajnog i sistematskog uzorka, postoji i tzv. stratifi -cirani uzorak koji se uzima iz karakterističnih dijelova (stratuma) osnovnog skupa koji ga sačinjavaju. Drugim riječima, populacija se podijeli u „potpopulacije“ prema pro-stornim, demografskim, sociološkim ili nekim drugim karakteristikama, te se iz svake od grupa uzima slučajni uzorak.

Da bi se pomoću uzorka mogle procijeniti karakteristike osnovnog skupa, važno je da uzorak bude reprezentativan (da dobro opisuje populaciju). Na reprezentativnost uzorka utječu njegova apsolutna veličina, varijabilnost obilježja i metoda uzorkovanja. Što veću preciznost želimo, i što je pojava koju ispitujemo varijabilnija, to nam je veći uzorak potreban.


113

10.1. PROCJENA ARITMETIČKE SREDINE OSNOVNOG SKUPA

Pretpostavimo da želimo saznati kolika su prosječna primanja svih građana grada Šibenika koji su u radnom odnosu. Do ovog podatka možemo doći na način da izraču-namo prosječna primanja na reprezentativnom uzorku i zaključimo da su ona istovjetna prosječnim primanjima svih građana grada Šibenika. U ovom slučaju aritmetička sre-dina populacije (μ) je procijenjena brojem. No procjenu je moguće izvršiti i intervalom čija će širina ovisiti o željenoj pouzdanosti procjene. Što je interval širi, procjena je pouzdanija, tj. veća je vjerojatnost da će se u njemu naći aritmetička sredina populacije. Intervalna procjena aritmetičke sredine osnovnog skupa dobiva se na slijedeći način:

)()( xSezxxSez ⋅+<<⋅− μμ

gdje je: μ – aritmetička sredina uzorka, )(xSe - standardna greška pri procjeni aritmetičke sredine, z - koefi cijent pouzdanosti procjene

Koefi cijent “z” dobije se iz tablice površina ispod normalne krivulje kada veličina uzor-ka premaši 30 jedinica. Najčešće se formiraju intrevali procjene s 95%-tnom pouzdano-sti, a u tom slučaju koefi cijent pouzdanosti iznosi 1,96 (0,95:2=0,4750).

Tablica 10.1. „z” vrijednosti za najčešće razine pouzdanosti

Razina pouzdanosti Z vrijednost90% 1,6595% 1,9699% 2,58

99,9% 3,291

Ukoliko je n ≤ 30 jedinica, upotrebljava se „t” iz Studenove distribucije umjesto koefi cijenta „z”. Želimo li primjerice napraviti intrevalnu procjenu aritmetičke sredine populacije s 95% pouzdanosti, proporcija preostalih jedinica smještenih na krajevima distribucije je 1-0,95=0,05. Na desnom kraju distribucije se tada nalazi proporcija jedi-nica 0,05:2=0,025 pa ćemo traženi koefi cijent pouzdanosti naći u stupcu t.025 i u retku koji odgovara broju stupnjeva slobode k = n-1.

Vratimo se na primjer prosječnih primanja građana Šibenika. Pretpostavimo da smo slučajnim izborom izabrali uzorak od 1 200 ispitanika i na njemu odredili prosječna pri-manja. Potom ponovimo taj postupak još jednom i dobijemo neki novi uzorak s novom


114

aritmetičkom sredinom. Uzorkovanje ponavljamo 100 puta i svaki put dobijemo neku aritmetičku sredinu primanja. Svakoj aritmetičkoj sredini uzorka pridružujemo i pripa-dajući interval pouzdanosti. Od ukupno stotinu pripadajućih 95%-tnih intervala pouzda-nosti, njih 95% će sadržavati pravu aritmetičku sredinu populacije. Kao takav, interval pouzdanosti je objektivna procjena (ne)preciznosti i veličine uzorka nekog istraživanja.

Iako postoje i neki drugi načini, interval pouzdanosti načešće računamo pomoću stan-dardne greške. Način izračuna standardne greške )(xSe ovisi o veličini frakcije odabi-ranja koja predstavlja omjer broja jedinica u uzorku i broja jedinica u osnovnom skupu:

Nnf =

gdje je: n – broj jedinica u uzorku, N – broj jedinica u osnovnom skupu.

nxSe σ=)( ako je f < 0.05, odnosno

1)(

−−

⋅=N

nNn

xSe σ ako je f ≥ 0.05

Ukoliko standardna devijacija osnovnog skupa (σ) nije poznata, a uzorak je sluča-jan i dovoljno velik može se pretpostaviti da je standardna devijacija uizorka (s) dobra procjena standardne devijacije populacije, pa standardnu pogrešku aritmetičke sredine računamo:

nsxSe =)(

Standardna greška je manja što je uzorak veći i varijabilnost podataka manja.

Kako danas mnogi statistički programi nude mogućnost izračuna i iskaza intervala po-uzdanosti za većinu statističkih pokazatelja, malo tko će uistinu ručno računati interval pouzdanosti za svoje podatke. No, važno je poznavati ulazne varijable iz kojih računa-mo interval pouzdanosti kako bismo mogli bolje razumjeti njegovo značenje i interpre-taciju.32

32 Šimundić, A. (2008), Interval pouzdanosti, Biochemia medica, Vol.18 No.2, 154-61


115

Primjer 10.1. Iz osnovnog skupa od 35 000 zaposlenih uzeli smo uzorak od 2 000 zapo-slenih i ustanovili da je prosječna plaća u uzorku iznosila 8 300kn, a standardna devi-jacija 1 250. Potrebno je izvršiti intervalnu procjenu prosječne plaće uz signifi kantnost od 99%.

1)(

−−

⋅=N

nNn

xSe σ

14,27

135000200035000

20001250)( =

−−

⋅=xSe

14,2758,2830014,2758,28300 ⋅+<<⋅− x

02,83708,8246 << x

Prosječna plaća osnovnog skupa kreće se u intervalu od 8246,8 do 8370,02 kn.

Pitanja

1. Što je metoda uzoraka?2. Koje su vrste uzoraka?3. Što utječe na reprezentativnost uzorka?4. Što je interval pouzdanosti?5. Objasnite intervalnu procjenu aritmetičke sredine osnovnog skupa?


116

PRIMJERI RIJEŠENIH ZADATAKA

1. Prema statističkom istraživanju o godinama starosti zaposlenih provedenom u po-duzeću „XY“ dobiveni su slijedeći rezultati:

24, 23, 56, 37, 24, 36, 55, 42, 31, 25, 26, 42, 42, 26, 32, 35, 45, 33, 46, 65, 34, 24, 28, 33, 40, 33, 54, 22, 60, 58, 51, 59, 27, 45, 23, 33, 46, 21, 41, 28, 56, 39, 51, 57, 22, 57, 23, 34, 51, 59, 62, 57, 24, 35

a) Grupirajte navedene podatke tako da formirate razrede veličine i=5. b) Iz tako grupiranih podataka izračunajte prosječnu starost- i to preko odstupanja u

jedinicama intervala!c) Odredite mjeru raspona vrijednosti obilježja srednjih 50% jedinica za distribuciju

godina starosti u instituciji „XY“.d) Koliko iznosi starost u godinama koja distribuciju zaposlenika dijeli u omjeru

1:5?e) Koliko iznosi starost u godinama koja distribuciju zaposlenih u poduzeću „XY“

dijeli na dva jednaka dijela.

Rješenje:a) grupiranje


9445 =⇒=⇒= n

nnRvi

broj razreda

Starost(prave granice)

fi xi di fi di Kum.niz

21-2626-3131-3636-4141-4646-5151-5656-6161-66

11510462592

23,528,533,538,543,548,553,558,563,5

012345678

0520122410306316

11 16 Q1

26 30 Me

3638

43 Q35254

54 - - 180 -


117

b) aritmetička sredina

405

541805,230 =⋅+=⋅

⋅+=∑∑ i

fdf

xXi

ii

c) interkvartil

5,2855

115,13264

11 =⋅−

+=⋅−

+=∑

qq

i

if

fN

LQ

5,5355

385,405143

13 =⋅−

+=⋅−

+=∑

qq

ii

if

fN

LQ

13 QQIQ −=

255,285,5313 =−=−= QQIQ

d) postotak

8,10100

2054100

%20100

%100%

205:1005:1

=⋅

=⋅

=

⋅=

=

=⇒

∑ ifdio

cjelinadio

cjelinadio


118

e) medijan

25,3754

2627362

1 =⋅−

+=⋅−

+=∑

m

med

i

if

fN

LMe

2. Iznosi godišnjih plaća i radnog staža za 11 zaposlenih u jednom uredu poduzeća „XY“ u Šibeniku u 2007. godini bili su kako slijedi:

Plaće(u 000 kn) 44 67 32 78 29 89 67 34 93 139 58

Radni staž (u god) 12 32 17 10 34 5 19 17 31 17 24

a) Grupirajte navedene podatke o plaćama tako na formirate 5 razreda.b) Iz tako grupiranih podataka izračunajte prosječnu plaću- i to preko odstupanja u

jedinicama intervala!c) Odredite vrijednost plaće za koju vrijedi da je prvih 10% zaposlenih imalo toliku

plaću i manju, a preostalih 90% zaposlenih veću plaću.d) Pomoću vrijednosti dviju relativnih mjera disperzije odredite disperziju zadanog

uzorka plaća tijekom 2007. godine.e) Koliko iznosi vrijednost koja radni staž dijeli u omjeru 1:4?f) Odredite najčešći radni staž zaposlenih u uredu poduzeća „XY“ te vrijednost rad-

nog staža koja niz dijeli na dva jednaka dijela.

Rješenje:a) grupiranje


22

5110

===n

Rvi

veličina razreda


119

plaće(u 000 kn)

fi xi di fi di kum.niz

29-5151-7373-9595-117117-139

43301

406284106128

01234

03604

4 D17101011

ukupno 11 - 10 13 -

b) aritmetička sredina

6622

1113400 =⋅+=⋅

⋅+=∑∑ i

fdf

xXi

ii

c) prvi decil

35224

01,12910

11 =⋅−

+=⋅−

+=∑

idfdecil

fN

LD

d) koefi cijent varijacije i koefi cijent kvartilne devijacije

Plaće uređene po veličini (u 000 kn): 29 32 34 44 58 67 67 78 89 93 139

100⋅=

xV σ

36,6611730

=== ∑N

xx

i

895,98436,66

1159274)( 22

22 =−=−= ∑ x

Nxiσ 38,31895,984 ==σ


120

29,47100

36,6638,31100 =⋅=⋅=

xV σ

N=11N/4 = 2,75 3N/4 = 8,25 INT (2,75)+1= 3 INT (8,25)+1=9

Q1= vrijednost 3. člana niza = 34Q3= vrijednost 9. člana niza = 89

45,0

12355

34893489

13

13 ==+−

=+−

=QQQQVq

e) postotak

75,2100

2511100

%25100

%100%

254:1004:1

=⋅

=⋅

=

⋅=

=

=⇒

∑ ifdio

cjelinadio

cjelinadio

f) mod = 17 (vrijednost koja se u nizu najviše pojavljuje) medijan: 5 10 12 17 17 17 19 24 31 32 34 (podaci o radnom stažu uređeni po veličini)

61)5,5(1)2

( =+=+= INTNINTxr

Me = vrijednost 6. člana niza = 17


121

3. Prema izvješću Sveučilišta „XY“ u razdoblju od 1997.- 2006. godine podaci o odno-su broja profesora i broja studenata na fakultetu „Z“ bili su kako slijedi:

Godina 1997. 1998. 1999. 2000. 2001. 2002. 2003. 2004. 2005. 2006.

Brojprofesora 45 57 65 86 99 112 96 93 89 86

Brojstudenata 590 610 780 840 880 890 910 950 980 990

a) Odredite osnovne parametre jednadžbe linearnog trenda sa ishodištem u sredini razdoblja za distribuciju profesora u razdoblju od 2003.-2006. godine.

b) Ako se kretanje broja profesora nastavi prema trendu čije ste parametre izračunali pod (a), koliki se broj može očekivati u 2013. godini ?

c) Neka je varijabla X broj studenata, a varijabla Y broj profesora. Odredite parame-tre linearne regresijske jednadžbe Xe i Ye.

d) Odredite regresijske vrijednosti koristeći parametre jednadžbe Ye.e) Izračunajte koefi cijent korelacije i objasnite njegovo značenje.

Rješenje:

a)

Godina

Broj profesora

y x xy x2

2003.2004.2005.2006.

96938986

-2-112

-192-9389172

4114

ukupno 364 0 -24 10

4,2

1024

2 −=−

=−

−=

∑∑∑ ∑

xxxyxxy

b 9104,291 =⋅+=−= xbya


122

b)

xbxaye 4,291−=+=

2013. godina → X=9

654,6994,291 ≈=⋅−=ey

c)Studenti

xProfesori

y xy x2 y2

590610780840880890910950980990

455765869911296938986

26550347705070072240871209968087360883508722085140

348100372100608400705600774400792100828100902500960400980100

20253249422573969801125449216864979217396

8420 828 719130 7271800 72422

12,0

84208427271800828842719130

2 =⋅−⋅−

=−

−=

∑∑∑ ∑

xxxyxxy

b 68,58288,827242284208,82719130

2=

⋅−⋅−

=−

−=′

∑∑∑ ∑

yyyxyxy

b

24,1884212,08,82 −=⋅−=−= xbya 7,3718,8268,5842 =⋅−=′−=′ ybxa

xbxaye 12,024,18 +−=+= yybaxe 68,57,371 +=′+′=


123

d)

xye 12,024,18 +−=

X1=590 ; 5359012,024,181 ≈⋅+−=y

Prema regresiji na 590 studenata procjenjuje se 53 profesora, a stvarna zabilježena vri-jednost je 45. Razliku čini REZIDUALNO ODSTUPANJE.

X2=610 ; Y2=55 X3=780 ; Y3=75 itd.

e) 83,068,512,0 +=⋅±=′⋅±= bbr Postoji jaka veza pozitivnog smjera.

4. Broj izrečenih presuda na općinskom sudu u županiji „XY“ u razdoblju 2001.-2006. godine za maloljetne osobe bio je kako slijedi:

Godina 2001. 2002. 2003. 2004. 2005. 2006.

Maloljetne osobe - 110 108 103 101 100

a) Odredite apsolutne vrijednosti presuda izrečenih maloljetnim osobama ukoliko je poznato da je broj maloljetnih osuđenih osoba u 2003. iznosio 1820.

b) Izračunajte indekse maloljetnih osoba na bazi 2004.=100.c) Izračunajte bazne indekse tako da za bazu uzmete prosječan broj izrečenih presu-

da u razdoblju 2001.-2006.

Rješenje:

a)

18756,1874

1001820103

100100 0304

0403

0404 ≈=

⋅=

⋅=⇒⋅=

YVYYYV

18954,1893100

6,187310105 ≈=

⋅=Y


124

b)

100⋅=

b

tt Y

YI

1875=bY

71,81100

18751532

01 =⋅=I

c)

1783

610700

==x

1783=bY

92,85100

17831532

=⋅=tI

Godina Maloljetne osobe Yt Ib

2004.=100Ib

Ø = 1002001.2002.2003.2004.2005.2006.

-110108103101100

153216851820187518941894

81,7189,8797,07100,00101,01101,01

85,9294,50102,08105,16106,23106,23

5. Ispitivana je obiteljska situacija i sklonost nasilničkom ponašanju:

Obiteljska situacijaSklonost nasilničkom

ponašanjuRoditelji u

brakuLoši odnosi u

brakuRoditelji

rastavljeniNeskloni 900 416 98

Umjereno skloni 230 67 123Jako skloni 75 55 223


125

Uz signifi kantnost od 5% istražite da li se sklonost nasilničkom ponašanju razlikuje u odnosu na obiteljsku situaciju roditelja u braku i obiteljsku situaciju loših odnosa u braku u odnosu na roditelje koji su umjereno skloni i jako skloni nasilničkom ponaša-nju.

Rješenje: H0 .... ne razlikuje se sklonost nasilničkom ponašanju u odnosu na obiteljsku situacijuH1 .... postoji značajna razlika u sklonosti nasilničkom ponašanju u odnosu na obiteljsku

situaciju

230 6775 55

297130

305 122 427

fi fti fi -fti (fi -fti)2 (fi -fti)2/fti230756755

212,1492,8684,8637,14

17,86-17,86-17,8617,86

318,98318,98318,98318,98

1,503,443,768,59

2ּג =17,29

stupnjevi slobode: 1)12()12()1()1( =−⋅−=−⋅−= srk

Hi-kvadrat vrijednost uz 1 stupanj slobode i na razini signifi kantnosti 5% = 3,841

3,841<17,29 odbacujemo H0 i prihvaćamo H1

∑∑ ∑⋅=

ukupnostupcaretka

fti

86,92427

130305

14,212427

297305

=⋅

=

=⋅

=

fti

fti


126

PREGLED FORMULA

1. SREDNJE VRIJEDNOSTI

a) aritmetička sredina – jednostavna (negrupirani podaci)

Nx

xi∑= (i = 1,2,3…N)

xi – pojedinačne vrijednosti numeričke varijable (obilježja) x, N – broj podataka (broj vrijednosti)

b) aritmetičlka sredina – ponderirana ili vagana (grupirani podaci)

∑∑=

fifx

xii

( i= 1,2,3…k)

fi – frekvencije, xi – vrijednosti numeričke varijable (obilježja) ili razredne sredine u distribuciji frekvencija

c) aritmetička sredina – preko odstupanja u jedinicama intervala

i

fdf

xXi

ii ⋅⋅

+=∑∑

0

(i = 1,2,3...k)

ixxd i

i0−

=

x0 – vrijednost razredne sredine razreda koji ima najveću frekvenciju, i-veličina razre-da, fi –frekvencije


127

d) harmonijska sredina – jednostavna

∑=

ix

NH 1 (i =1,2,3 … N)

xi – vrijednosti numeričke varijable, N – broj podataka

e) harmonijska sredina - ponderirana

∑

∑=

i

i

i

xf

fH

(i=1,2,3…N)

fi –frekvencije modaliteta numeričke varijable x, xi – vrijednosti numeričke varijable (obilježja)

f) medijan – negrupirani podaci

2,

2

1)2

(,2

NrINTN

NINTrINTN

==

+=≠

)(21

1++=

=

rr

r

xxMe

xMe

N – broj članova numeričkog ili redoslijednog niza, INT-cijeli dio razlomka, r- redni broj podatka u nizu podataka uređenih po veličini


128

g) medijan – grupirani podaci

if

fN

LMmed

m

ii

e ⋅−

+=∑=1

12

L1 - donja granica medijalnog razreda, N/2 – poluzbroj fekvencija, ∑fi - zbroj frekven-cija do medijalnog razreda, fmed - frekvencija medijalnog razreda, i - veličina medi-jalnog razreda.

h) mod Vrijednost moda je najčešća vrijednost među članovima ili obilježje s najvećom fre-

kvencijom. Mod distribucije frekvencija s razredima:

i

cbababLMo ⋅−+−

−+=

)()()(

1

L1 – donja granica modalnog razreda, b – frekvencija modalnog razreda, a – frekvencija koja prethodi modalnom razredu, c – frekvencija koja slijedi iza frekvencije modalnog razreda, i – veličina modalnog razreda.

i) geometrijska sredina – jednostavna

N

xG

i∑=

log

(i=1,2…N)

N – broj vrijednosti, xi – vrijednosti numeričke varijable


129

j) geometrijska sredina – ponderirana

∑∑

=i

ii

f

xfG

log

(i=1,2….k)

fi –frekvencije distribucije

k) geometrijska sredina – metodom verižnih indeksa

N

VtG

∑=

log

(t=1,2…N)

N – broj vrijednosti, Vt – verižni indeks

lj) prosječna stopa rasta/pada

NNxxxG ....21 ⋅=

N – broj vrijednosti, xi – vrijednosti numeričke varijable


130

2. KVANTILI

a) donji i gornji kvartil – negrupiran ipodaci

)(21

11

1

++=

=

rr

r

xxQ

xQ

4,

4

1)4

(,4

NrINTN

NINTrINTN

==

+=≠

)(21

13

3

++=

=

rr

r

xxQ

xQ

43,

43

1)4

3(,4

3

NrINTN

NINTrINTN

==

+=≠

N – broj članova numeričkog ili redoslijednog niza, INT-cijeli dio razlomka, r- redni broj podatka u nizu podataka uređenih po veličini

b) donji i gornji kvartil – grupirani podaci

if

fN

LQtk

i

⋅−

+=∑var

114

if

fN

LQtk

i

⋅−

+=∑

var13

43

(i=1,2...q)

L1 - donja granica kvartilnog razreda, ∑fi - zbroj frekvencija do kvartilnog razreda, fkvart - frekvencija kvartilnog razreda, i - veličina kvartilnog razreda, N/4 – jedna četvrti-na sume frekvencija, 3N/4 – tri četvrtine sume frekvencija

c) kvantili – negrupirani podaci

)(21

1++=

=

rrp

rp

xxQ

xQ

qNprINT

qNp

qNpINTrINT

qNp

==

+=≠

,

1)(,


131

N – broj članova numeričkog ili redoslijednog niza, INT-cijeli dio razlomka, r- redni broj podatka u nizu podataka uređenih po veličini, q-red kvantila, p-redni broj kvantila

d) kvantili – grupirani podaci

if

fq

Np

LQkvant

i

p ⋅−

+=∑

1

L1 - donja granica kvantilnog razreda, ∑fi - zbroj frekvencija do kvantilnog razreda, fkvant - frekvencija kvantilnog razreda, i - veličina kvantilnog razreda

3. MJERE DISPERZIJE

a) raspon varijacije

minmax xxRv −=xmax – najveća vrijednost niza, xmin – najmanja vrijednost niza

b) interkvartil

13 QQIq −=

Q1- donji kvartil, Q3- gornji kvartil

c) koefi cijent kvartilne devijacije

13

13

QQQQVq +

−=

Q1- donji kvartil, Q3- gornji kvartil


132

d) varijanca i standardna devijacija – negrupirani podaci

2

22 )(x

Nxi −= ∑σ

2σσ =± (i=1,2…N)

N – broj vrijednosti, xi – vrijednosti numeričke varijable, x - aritmetička sredina

e) varijanca i standardna devijacija – grupirani podaci

2

22 )(x

fifixi −=

∑∑σ

2σσ =± (i=1,2…k)

fi – frekvencije, xi – vrijednosti numeričke varijable (obilježja) ili razredne sredine u

distribuciji frekvencija, x - aritmetička sredina

f) koefi cijent varijacije

100⋅=

xV σ

σ – standardna devijacija, x - aritmetička sredina

g) standardizirano obilježje

σxxizi −

= (i=1,2,3…N)

xi – vrijednosti numeričke varijable x, x - aritmetička sredina, σ – standardna devi-jacija


133

h) srednje apsolutno odstupanje- negrupirani podaci

N

xxiMAD

∑ −=

i) srednje apsolutno odstupanje- grupirani podaci

∑∑ −

=fi

fixxiMAD

4. RELATIVNI BROJEVI

a) postotni brojevi

100:%: =cjelinadio

cjelinadio 100% ⋅

= %100⋅

=diocjelina

b) relativni brojevi koordinacije

100⋅=

i

ii

BAR

Ai, Bi – frekvencije/statistički nizovi grupirani prema istom obilježju

c) bazni indeksi

100⋅=b

tt

yyI

(t=1,2…n)

t – tekuće razdoblje, b – bazno razdoblje


134

d) odnos stopa i baznih indeksa

100−= tt ISSt – stopa promjene vrijednosti pojave u vremenu t prema razdoblju b

e) verižni indeksi

100

1⋅=

−t

tt

yyV

(t=2,3…n)

t – tekuće razdoblje, t-1 – prethodno razdoblje

f) odnos stopa i verižnih indeksa

100−= tt VSSt – stope promjene pojave u uzastopnim razdobljima

g) pretvaranje indeksa na stalnoj bazi u verižne indekse

1001⋅=

−t

tt

IIV

h) pretvaranje verižnih indeksa u bazne indekse

1001 ⋅=↑ −t

tt

VII

1001 tt

tVII ⋅−

=↓

i) Laspeyresov skupni indeks količina

1001

)(01 ⋅⋅⋅

=∑∑

ioio

ioip

pqpq

Q o

pi0 – cijena u baznoj godini, qi1 – količina u tekućoj godini, qi0 – količina u baznoj godini


135

j) Paascheov skupni indeks količina

100

1

11)(01 1 ⋅

⋅⋅

=∑∑

iio

iip

pqpq

Q

pi1 – cijena u tekućoj godini, qi1 – količina u tekućoj godini, qi0 – količina u baznoj godini

k) Laspeyresov skupni indeks cijena

1001

)(01 ⋅⋅⋅

=∑∑

ioio

ioiq

qpqp

P o

qi0 – količina u baznoj godini, pi0 – cijena u baznoj godini, pi1 – cijena u tekućoj godini

l) Paascheov skupni indeks cijena

1001

11)(01 1 ⋅

⋅⋅

=∑∑

iio

iiq

qpqp

P

qi1 – količina u tekućoj godini, pi0 – cijena u baznoj godini, pi1 – cijena u tekućoj godini

lj) Skupni indeks vrijednosti

1000

1101 ⋅

⋅⋅

=∑∑

iio

ii

qpqp

V

qi0 – količina u baznoj godini, qi1 – količina u tekućoj godini, pi0 – cijena u baznoj godini, pi1 – cijena u tekućoj godini


136

5. TREND

a) linearni trend

bxay +=∑∑

∑ ∑−

−=

xxx

yxxyb 2 xbya −=

y – trend vrijednosti ili zavisna varijabla, a – vrijednosti trenda u ishodištu, b – apsolut-ni prirast ili pad pojave, x – vremenska jedinica ili nezavisna varijabla

b) eksponencijalni trend

y = a ∙ bx

log ye=loga + x log b

c) parabolički trend

y = a + bx + cx2

d) logaritamski trend

ye = a∙xb

xbay logloglog ⋅+=


137

KORELACIJA I REGRESIJA

a) koefi cijent linearna korelacija

yx

N

iii

N

yxNyxr

σσ ⋅⋅

⋅⋅−⋅=∑=1 bbb ′⋅±=

b) linearna regresija uxfY += )( bxaye += ybaxe ′+′=

∑∑∑ ∑

−

−=

xxx

yxxyb 2

ybxa ′−=′∑∑

∑ ∑−

−=′

yyy

xyxyb 2

xbya −=

x – nezavisna varijabla, y – zavisna varijabla, u – greška relacije

7. VJEROJATNOST

a) klasična defi nicija vjerojatnosti slučajnog događaja D

nmDP =)(

m – broj povoljnih događaja, n – broj svih mogućih događaja

b) vjerojatnost nastupa međusobno isključivih događaja

)()()( 2121 DPDPDDP +=∪


138

c) vjerojatnost nastupa barem jednog događaja

)()()()( 212121 DDPDPDPDDP ∩−+=∪

d) vjerojatnost nastupa neovisnih događaja

)()()( 2121 DPDPDDP ⋅=∩

8. METODA UZORAKA

a) procjena aritmetičke sredine osnovnog skupa

)()( xSezxxSez ⋅+<<⋅− μμ

05,0,)( <= fn

xSe σ

05,0,1

)( ≥−−

⋅= fN

nNn

xSe σ

Nnf =

μ – aritmetička sredina uzorka, )(xSe - standardna greška pri procjeni aritmetičke sre-dine, z - koefi cijent pouzdanosti procjene, n – broj jedinica u uzorku, N – broj jedinica u osnovnom skupu.


139

L I T E R A T U R A:

1) Biljan-August,M. et al. (2007)Upotreba statistike u ekonomiji, Ekonomski fakultet Rijeka

2) Gogala, Z. (2001) Osnove statistike, Sinergija, Zagreb3) Kero, K. i Bojanić-Glavica, B. (2003) Statistika u primjerima, FOI, Varaždin4) Petz, B. (1985) Osnove statističke metode za nematematičare, SNL, Zagreb5) Rozga,A.(2003) Statistika za ekonomiste, Sveučilište u Splitu6) Rozga, A. i Grčić, B. (2000) Poslovna statistika, Veleučilište u Splitu7) Serdar, V. i Šošić, I. (1982) Uvod u statistiku, Školska knjiga, Zagreb8) Šimundić, A. (2008), Interval pouzdanosti, Biochemia medica, Vol.18 No.2, 154-619) Šimundić, S. i Boban, M. (2003) Zbirka zadataka iz statistike, Pravni fakultet

Sveučilišta u Splitu10) Šošić, I. (2002) Pregled formula iz statistike, Školska knjiga, Zagreb11) Šošić, I. (2006) Primijenjena statistika, Školska knjiga, Zagreb

ISBN: 978-953-56741-0-8

Documents

Skripta_Poslovna_statistika