Upload
petra-sabok
View
203
Download
15
Embed Size (px)
Citation preview
POSLOVNA STATISTIKA – PRIMJENA STATISTIČKIH METODA U EKONOMIJI
Nakladnik:Marija Boban - vlastita naklada
Recenzenti:prof. dr. sc. Miodrag Ivković, izv.prof. prof. dr. sc. Miroslav Bača, izv. prof.
Grafi čka priprema:Tiskara Pečarić-Radočaj d.o.o., Karlovac
ISBN 978-953-56741-0-8
CIP zapis dostupan u računalnome katalogu Nacionalne i sveučilišne knjižnice u Zagrebu pod brojem 771661
Marija Boban Dijana Mečev
POSLOVNA STATISTIKA – PRIMJENA STATISTIČKIH METODA
U EKONOMIJI
ŠIBENIK, 2011. g.
SADRŽAJ
1. OSNOVNI POJMOVI STATISTIKE . . . . . . . . . . . . . . . . . . . . . . . 7 1.1. Što je statistika? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2. Podjela na deskriptivnu i inferencijalnu statistiku . . . . . . . . . . . . . . . 8 1.3. Vrste i izvori podataka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.4. Statistički skup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.5. Statistički niz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.6. Statističko obilježje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.7. Mjerne skale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.8. Grupiranje podataka, vrste grafi kona i njihova primjena . . . . . . . . . . . 12
2. STATISTIČKO TABELIRANJE I GRAFIČKO PRIKAZIVANJE STATISTIČKIH PODATAKA . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1. Vrste statističkih tablica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.2. Grafi čko prikazivanje statističkih podataka . . . . . . . . . . . . . . . . . . 19 2.2.1. Dijagram točaka . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.2.2. S-L dijagram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.2.3. Jednostavni stupci . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.2.4. Dvostruki stupci . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.2.5. Razdijeljeni stupci . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.2.6. Strukturni krugovi i polukrugovi . . . . . . . . . . . . . . . . . . . . 25 2.2.7. Histogram. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3. SREDNJE VRIJEDNOSTI. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.1. Aritmetička sredina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.1.1. Jednostavna aritmetička sredina . . . . . . . . . . . . . . . . . . . . 29 3.1.2. Vagana ili ponderirana aritmetička sredina . . . . . . . . . . . . . . . 30 3.1.3. Aritmetička sredina preko odstupanja u jedinicama intervala . . . . . 31 3.2. Kronološka sredina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3.3. Harmonijska sredina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.4. Geometrijska sredina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.5. Mod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.6. Medijan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4. KVANTILI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.1. Kvartili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.2. Decili. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.3. Percentili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5. MJERE DISPERZIJE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 5.1. Raspon varijacije. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 5.2. Interkvartil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 5.3. Varijanca i standardna devijacija. . . . . . . . . . . . . . . . . . . . . . . . 53 5.4. Srednje apsolutno odstupanje . . . . . . . . . . . . . . . . . . . . . . . . . 55 5.5. Koefi cijent varijacije. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 5.6. Koefi cijent kvartilne devijacije . . . . . . . . . . . . . . . . . . . . . . . . 56 5.7. Standardizirano obilježje . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 5.7.1. Pravilo Čebiševa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
6. ANALIZA VREMENSKIH NIZOVA . . . . . . . . . . . . . . . . . . . . . . . 59 6.1. Vremenski niz – defi nicija i vrste . . . . . . . . . . . . . . . . . . . . . . . 59 6.2. Metode relativnih brojeva . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.2.1. Postotni brojevi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.2.2. Relativni brojevi koordinacije. . . . . . . . . . . . . . . . . . . . . . 62 6.2.3. Indeksni brojevi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 6.2.3.1. Verižni indeksi. . . . . . . . . . . . . . . . . . . . . . . . . . 64 6.2.3.2. Indeksi na stalnoj bazi. . . . . . . . . . . . . . . . . . . . . . 66 6.2.3.3. Skupni indeksi. . . . . . . . . . . . . . . . . . . . . . . . . . 71 6.3. Srednje vrijednosti vremenskih nizova . . . . . . . . . . . . . . . . . . . . 76
7. TREND . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 7.1. Linearni trend . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 7.1.1. Ishodište na početku vremenskog razdoblja . . . . . . . . . . . . . . . 79 7.1.2. Ishodište u sredini vremenskog razdoblja (neparan broj godina) . . . . 82 7.1.3. Ishodište u sredini vremenskog razdoblja (paran broj godina) . . . . . 84 7.2. Parabolički trend . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 7.3. Eksponencijalni trend . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 7.4. Logaritamski trend . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
8. KORELACIJA I REGRESIJA . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 8.1. Korelacijska analiza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 8.1.1. Dijagram rasipanja . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 8.1.2. Koefi cijent linearne korelacije . . . . . . . . . . . . . . . . . . . . . . 90 8.2. Regresijska analiza. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 8.2.1. Jednostavna linearna regresija . . . . . . . . . . . . . . . . . . . . . . 91 8.2.2. Regresijski polinom . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 8.2.3. Jednostavna eksponencijalna regresija . . . . . . . . . . . . . . . . . 95 8.2.4. Višestruka (multipla) linearna regresija . . . . . . . . . . . . . . . . . 98
9. VJEROJATNOST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 9.1. Osnovni pojmovi i defi nicije vjerojatnosti. . . . . . . . . . . . . . . . . . . 99 9.2. Slučajna varijabla i teorijske distribucije vjerojatnosti . . . . . . . . . . . 102 9.2.1. Binomna distribucija . . . . . . . . . . . . . . . . . . . . . . . . . 103 9.2.2. Poissonova distribucija . . . . . . . . . . . . . . . . . . . . . . . . 104 9.2.3. Normalna distribucija . . . . . . . . . . . . . . . . . . . . . . . . . 105 9.2.4. Studentova sistribucija . . . . . . . . . . . . . . . . . . . . . . . . 108 9.2.4. Hi-kvadrat distribucija . . . . . . . . . . . . . . . . . . . . . . . . 108
10. METODA UZORAKA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 10.1. Procjena aritmetičke sredine osnovnog skupa . . . . . . . . . . . . . . . 113
PRIMJERI RIJEŠENIH ZADATAKA. . . . . . . . . . . . . . . . . . . . . . . . 116
PREGLED FORMULA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
LITERATURA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
7
1. OSNOVNI POJMOVI STATISTIKE
1.1. ŠTO JE STATISTIKA?
„ Statistički način mišljenja jednog će dana za svakodnevni život građana postati jednako neophodan kao znanje čitanja i pisanja.“
H.G Wells
Statističko promatranje je bilo poznato već u starom vijeku, ali se kao znanost javlja tek u 19. stoljeću kada se podaci počinju i znanstveno istraživati. Danas se statistika primjenjuje u svim znanostima (ekonomskim, socijalnim, medicinskim, pravnim itd.). Današnji menadžeri većinu modernih metoda menadžmenta ne mogu provoditi bez po-znavanja statističkog mišljenja koje im pomaže da se bolje snađu u suvremenim uvje-tima poslovanja i da tako ostvare najbolje rezultate. Mjerenjem dobivamo velik broj podataka i samo na osnovu njih teško je zaključiti nešto o procesu. Potreban nam je alat pomoću kojeg ćemo iz velikog broja podataka dobiti kratku, objektivnu informaciju na osnovu koje možemo donositi odluke i poduzeti potrebne aktivnosti za unapređenje procesa. Taj alat je statistika.
Statistika je znanstvena disciplina koja se bavi prikupljanjem, analizom i tumače-njem podataka masovnih pojava.1 Statistika kao znanost pomaže u organizaciji broj-čanih podataka, u razumijevanju statističkih metoda i u donošenju odluka. Drugim ri-ječima, bez statistike bi bilo vrlo teško podatke transformirati u informacije i znanje. Poznavanje osnovnih pojmova statistike potrebno nam je i kako bi mogli pratiti stručnu i znanstvenu literaturu, budući da su istraživanja često iznesena u vrlo skraćenom obliku uz pomoć niza statističkih termina i simbola, te radi analize rezultata prikupljenih istra-živanjem. Pri tome je važno znati da se glavni statistički principi i način mišljenja mogu usvojiti potpuno logičkim putem.
Zadatak statistike kao znanstvene discipline je da svojim metodama otkriva veze i odnose koji postoje među pojavama i da odredi značajke promatranih pojava. Da bi
1 Pojave koje se ne mogu pojedinačno istraživati već je potrebo istražiti sve jedinice da bi se otkrila svojstva tih pojava.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
8
se ostvario postavljeni cilj istraživanja potrebno je provesti određene faze statističke djelatnosti, i to:
1. Statističko promatranje - faza prikupljanja informacija o statističkim jedinicama obuhvaćenih promatranom statističkom masom.
2. Grupiranje (klasifi kacija) - faza grupiranja informacija prema jednom ili više odabranih statističkih obilježja u kojoj se kao rezultat dobivaju statistički podaci. Sta-tistički podatak je sređena, odnosno obrađena informacija i predstavlja broj statističkih jedinica (frekvenciju) koje pripadaju pojedinom obliku statističkog obilježja.
3. Statistička analiza - faza u kojoj se na podatke o jednoj ili više promatranih sta-tističkih masa primjenjuju odgovarajuće statističke metode da bi se odredile značajke tih pojava.
1.2. PODJELA NA DESKRIPTIVNU I INFERENCIJALNU STATISTIKU
S obzirom na temeljne oznake razlikujemo deskriptivnu i inferencijalnu statistiku. Deskriptivna statistika koristi brojčane (numeričke) i grafi čke metode kako bi opisala populaciju. To znači da se u sklopu deskriptivne statistike za neku odabranu pojavu prikupljaju informacije, te uređuju, tabeliraju, grafi čki prikazuju, računaju i analiziraju različiti brojčani pokazatelji. U sklopu deskriptivne statistike primjenjuju se metode srednjih vrijednosti, mjera disperzije, mjera simetrije, mjera zaobljenosti. U sklopu in-ferencijalne statistike izabiru se uzorci. Primjerice, kada želimo na tržište plasirati novi proizvod izabrati ćemo uzorak potencijanih potrošača i ispitivati njihova mišljenja i potrebe za tim proizvodom. U sklopu inferencijalne statistike primjenjuju se metode procjena, testiranja i predviđanja o parametrima populacije tj. osnovnog skupa (procje-ne parametara, testiranje hipoteza, neparametrijski testovi).
1.3. VRSTE I IZVORI PODATAKA
Podaci (obilježja) su prikupljene informacije o jedinicama promatranja. Na primjer, jedinica promatranja može biti poduzeće, a podaci jesu: broj djelatnika, njihova sta-rost, stručna sprema, mjesečni prihodi itd. Podaci mogu biti kvalitativni i kvantitativni. Kvalitativni podaci iskazuju se pojmovno (riječima ili slovnim oznakama) i ne mogu biti zapisani u obliku broja (npr. spol, mjesto rođenja, državljanstvo, narodnost). Kvan-titativni podaci iskazuju se brojčano (npr. dob, broj članova kućanstva, radni staž, visina postojećih kreditnih obveza).
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
9
Izvori podataka mogu biti primarni i sekundarni. Primarni se podaci prikupljaju na temelju promatranja i eksperimenata. To su novi, neposredno prikupljeni podaci za potrebe nekog istraživanja, koji donose najažurnije informacije o danom predmetu. Njih je moguće pronaći u raznim znanstvenim i stručnim djelima, službenim statistikama i dokumentima i sl. No najčešće nisu praktični za izravno korištenje bez sekundarnih po-dataka, jer ih je puno i vrlo su raštrkani u velikom broju dokumenata i publikacija. Na-suprot njima, sekundarni podaci su gotove, istražene i objavljene informacije specija-liziranih institucija (gospodarska komora, centralna banka, državni zavod za statistiku, istraživački instituti itd.). Oni se mogu prikupiti brže i jeftinije od primarnih podataka - osobito putem Interneta.
1.4. STATISTIČKI SKUP
Statistički skup je skup podataka čiji su elementi (objekti, osobe, pojave) predmet statističke analize. Broj jedinica statističkog skupa N naziva se opsegom statističkog skupa. S obzirom na broj elemenata statistički skup može biti konačan i beskonačan. Statistički skup potrebno je defi nirati pojmovno (npr. redoviti studenti), prostorno (re-doviti studenti I. god. Veleučilišta u Šibeniku) i vremenski (intervalni – broj studenata u akademskoj godini 2009./2010.; trenutačni – broj studenata na dan 30.10.2010.). Pri-mjerice, statistički skup čine svi redovni studenti upisani u I. godinu studija akademske godine 2009./10. na Veleučilištu u Šibeniku. Taj skup broji N= 250 studenata. Studenti su jedinice, odnosno elementi tog skupa. Skup je u potpunosti defi niran pojmovno, pro-storno, vremenski i konačan je.
1.5 STATISTIČKI NIZ
Svrha uređivanja statističkih podataka je omogućiti donošenje sudova o danoj po-javi. Uređivanjem statističkih podataka nastaju statistički nizovi. Statističkim nizom zovemo niz frekvencija što nastaju grupiranjem s obzirom na njihova svojstva u stati-stičkom skupu. Ovisno o vrsti obilježja grupiranjem nastaju nominalni, ordinalni i nu-merički nizovi. Posebna vrsta su vremenski nizovi koji nastaju kronološkim uređenjem pojava. Statistički niz može biti:
a) negrupiran – podaci su zapisani slijedom kojim su i prikupljeni (npr. godine sta-rosti zaposlenih u poduzeću „XY“ : 24, 36, 57, 44, 27, 33, 40, 22, 57, 60)
b) grupiran - podaci se prikazuju u tablicama distribucije frekvencija2
2 Pojmom distribucija frekvencija obuhvaćaju se statistički sređeni, odnosno stručno grupirani podaci o masovnoj pojavi.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
10
Primjer 1.1. Zaposleni u poduzeću „X“ prema godinama starosti na dan 31.12.2010.
Godinestarosti
xi
Broj djelatnika
fi
18-30 40
30-45 60
45-65 20
ukupno 120
Izvor: Podaci su simulirani
1.6. STATISTIČKO OBILJEŽJE
Statističko obilježje ili varijabla je svojstvo po kojem jedinice statističkog skupa međusobno nalikuju ili se međusobno razlikuju (npr. spol, godine, visina, ocjene itd.). Svako se statističko obilježje pojavljuje u dva ili više modaliteta. Na primjer, varijabla spol ima samo dva modaliteta – muški i ženski.
Varijable mogu biti kvalitativne i kvantitativne. Kvalitativna statistička obilježja mogu poprimiti različite oblike, ali se izražavaju opisno (npr. spol). Ako se modaliteti-ma ovog obilježja slučajno pridruže brojevi, s njima nisu dopuštene nikakve računske operacije. Kvantitativna statistička obilježja izražavaju se brojčano (npr. visina). Kva-litativna statistička obilježja se mogu podijeliti na nominalna i redoslijedna, a kvantita-tivna na kontinuirana i diskontinuirana.
Svojstva statističkih obilježja se mjere. Mjerenje je pridruživanje brojeva ili oznaka prema određenom pravilu, a pravila su dana mjernim skalama.
Prikaz 1. Vrste statističkih varijabli
Varijable
Kvalitativne Kvantitativne
Nominalne(spol, bračno
stanje)
Redoslijedne(stručna sprema)
Diskretne(broj djece, broj
kvarova)
Kontinuirane(težina, cijena,
prihod)
statistički niz: djelatnici, statističko obilježje: godine starosti.N = zbroj svih frekvencija u nizu = 120
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
11
1.7. MJERNE SKALE
Mjerne skale mjere svojstva (obilježja) pridruživanjem brojeva ili oznaka sukladno razini na kojoj je provedeno mjerenje. Razine mjerenja su nominalna, ordinalna (redo-slijedna), intervalna i omjerna.
Nominalna skala je dana u obliku nenumeričkog skupa, odnosno naziva ili atributa po kojima se elementi međusobni razlikuju ili međusobno nalikuju. Koristi se redanje po abecedi ili po učestalosti ili se, kada modaliteta ima mnogo, koriste tzv. nomenklatu-re. Nominalne varijable se dijele na :
a) Atributivne - pokazuju svojstvo (atribut) jedinice (npr. zanimanje, boja proizvoda, vrsta proizvoda),
b) zemljopisne - pokazuju povezanost jedinice s nekim prostorom (npr. mjesto rođe-nja, boravka itd.)
Redoslijedna ili ordinalna mjerna skala pridružuje brojeve, slovne oznake ili sim-bole elementima skupa prema stupnju (intenzitetu) mjernog svojstva (npr. ocjena razvi-jenosti zemlje: razvijena / srednje razvijena / nerazvijena). Modaliteti ove varijable su poredani po intenzitetu mjerenog svojstva i nižu se od najslabijeg prema najjačem ili obrnuto.
Intervalna mjerna skala pridružuje brojeve mjernim svojstvima elemenata skupova. Jednake razlike brojeva na skali predstavljaju jednake razlike mjerenog svojstva. Polo-žaj nule i mjerna jedinica određeni su dogovorno (npr. kod temperaturne skale ledište vode označeno je nulom).3
Omjerna ili numerička mjerna skala se sastoji od brojeva za koje vrijedi da njihove jednake razlike predstavljaju jednake razlike mjerenog svojstva. Nula na omjernoj skali upućuje na nepostojanje svojstva. Vrste numeričke varijable:
a) diskretna ili diskontinuirana – može poprimiti prebrojivo mnogo vrijednosti. Obično je broj vrijednosti takve varijable konačan i ona je najčešće cjelobrojna, kao npr. broj zaposlenih u poduzeću, broj studenata na Veleučilištu itd.
b) kontinuirana – može poprimiti bilo koju vrijednost u nekom intervalu i mogući broj njezinih vrijednosti je beskonačan, kao npr. starost, visina, težina, cijene itd.
Za razliku od diskretnog numeričkog obilježja čije se vrijednosti obično utvrđuju brojanjem, vrijednosti kontinuiranog numeričkog obilježja utvrđuju se mjerenjem.4
3 U društvenim istraživanjima koristi se Likertova skala za izražavanje stupnja slaganja ili neslaganja s nekim ili nečim: izrazito se slaže, slaže se, niti se slaže niti se ne slaže, ne slaže se, izrazito se ne slaže.
4 Rozga, A. i Grčić, B. (2000) Poslovna statistika, Veleučilište u Splitu, str. 7.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
12
1.8. GRUPIRANJE PODATAKA, VRSTE GRANICA I NJIHOVA PRIMJENA
Često raspolažemo s vrlo velikim brojem podataka o pojavi koju želimo istražiti. Zadaća deskriptivnih metoda je da sumarno zahvate prikupljene podatke i na taj na-čin reduciraju njihov broj. Pritom u reduciranim informacijama moraju ostati sačuvane glavne značajke pojave koja se istražuje. U tu svrhu se provodi postupak grupiranja ili klasifi kacije podataka.5
Grupiranje je metoda kojom se postiže uopćavanje statističkih podataka. Statistički podaci se raščlane u dijelove prema modalitetima jednog obilježja. U jednoj grupi su elementi istog ili sličnog modaliteta obilježja prema kojem se grupiraju podaci. Broj jedinica svake grupe zove se frekvencija. Frekvencije mogu biti apsolutne i relativne. Broj podataka u grupi naziva se apsolutna frekvencija. Relativne frekvencije pokazuju relativnu veličinu pojave i udjele, te strukturu pojave. To mogu biti proporcije ili po-stoci.
Kod nominalnih statističkih nizova elementi se grupiraju prema modalitetima od-govarajućeg nominalnog obilježja. Kod redoslijednih nizova grupiranje se vrši kao i kod nominalnih, s tim da redoslijed modaliteta nije proizvoljan, već je određen rangom intenziteta obilježja koji pojedina grupa predstavlja, i to polazeći od najnižeg prema naj-višem rangu ili obrnuto. Kod numeričkih nizova jedinice grupiramo prema numeričkom obilježju pri čemu nastaje distribucija frekvencija. Grupiranje podataka se provodi pre-ma defi niranom obilježju po načelima iscrpnosti i isključivosti što znači da se razvrstati mora svaki podatak, a jedan podatak može biti član samo jedne grupe.
Primjer 1. 2. Tijekom jednog istraživanja o broju kupljenih proizvoda X u razdoblju od mjesec
dana provedenom na uzorku od N= 27 potrošača dobiveni su sljedeći rezultati:
24, 3, 27, 25, 14, 33, 10, 22, 7, 6, 3, 14, 12, 24, 11, 17, 17, 24, 16, 11, 6, 21, 12, 15, 4, 0, 5.
Potrebno je grupirati navedene podatke u 5 razreda. Radi bolje preglednosti podaci se najprije uređuju po veličini od najmanje prema najvećoj vrijednosti:
0, 3, 3, 4, 5, 6, 6, 7, 10, 11, 11, 12, 12, 14, 14, 15, 16, 17, 17, 21, 22, 24, 24, 24, 25, 27, 33.
5 Gogala, Z. (2001) Osnove statistike, Sinergija, Zagreb, str. 8.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
13
Za formiranje razreda potrebno je znati koliko ih je (n) i kolika im je veličina (i). Broj razreda je zadan (n=5), a veličina će se odrediti prema formuli:
nRvi =
gdje je Rv raspon varijacije odnosno razlika između najveće i najmanje vrijednosti niza.
33033minmax =−=−= XXRv
66,6
533
====n
Rvi
Interval svakog razreda je 7, a ne 6, kako se u prvi trenutak čini. Prvi razred obuhva-ća sve rezultate od 0 do 6, dakle 0, 1, 2, 3, 4, 5 i 6, a to je 7 jedinica. Do apsolutnih fre-kvencija dolazi se brojanjem na temelju prethodno zadanog negrupiranog statističkog niza. Svaki idući razred počinje za jednu jedinicu više nego što prijašnji razred završava.
Brojkupljenih proizvoda
Brojpotrošača
fi 0-67-1314-2021-2728-34
76671
∑6 27
Formiranjem razreda postiže se veća preglednost, ali se u isto vrijeme gubi na preci-znosti i potpunosti statističkih informacija. Naime, iz formirane distribucije frekvencija vidljivo je da je bilo 7 potrošača koji su kupili 6 ili manje proizvoda, ali nije razvidno koliko potrošača je kupilo 1 proizvod, koliko 2 proizvoda itd. Iz navedenog se može zaključiti da svaka distribucija frekvencija u kojoj je barem jedan modalitet predstavljen razredom nije potpuno informativna.6
U slučajevima kada je gornja granica prethodnog razreda za jedinicu manja od donje granice tekućeg ili promatranog razreda (kao u primjeru 1.2.), takve granice zovu se još
6 Znak zbrajanja, sigma iz grčkog alfabeta
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
14
nominalnim granicama. Koriste se pri analiziranju diskontinuiranih numeričkih nizova za sva potrebna istraživanja.
Za potrebe analize kontinuiranog numeričkog obilježja kreiraju se prave granice. Formiraju se na način da se izjednače donja granica (i+1)-og i gornja granica i-tog razreda, tako da se donja granica smanji za jedinicu ili da se gornja poveća za jedinicu mjere promatranog numeričkog obilježja. Nakon što se prave granice jednom konstrui-raju, na temelju njih se dalje obavljaju sva izračunavanja i crtanja kontinuiranog nume-ričkog niza. Dakle, prave granice razreda se koriste za:
- izračunavanje parametara kontinuiranog numeričkog niza,- crtanja kontinuiranog numeričkog niza.
Tablica 1.1. Primjer pravih granica
Težina (u kg) Prave granice razreda
3-1920-3940-6970-109
3-2020-4040-7070-110
Težina je kontinuirano obilježje pa je za analizu potrebno kreirati prave granice. U prvi razred će biti svrstane osobe čija je težina 3 kg ili veća, ali je manja od 20 kg. Osobe teške 20 kg svrstavaju se u drugi razred.
Precizne granice formiraju se na način da se donja granica (i+1)-og razreda umanji, a gornja granica i-tog razreda uveća za polovicu razlike između tih granica. Potrebno ih je konstruirati samo kada se želi grafi čki prikazati diskontinuirani numerički niz. One ne služe ni za kakva računanja bilo kojeg niza.
Tablica 1.2. Primjer preciznih granicaBroj djece Precizne granice
12-34-56-8
0,5-1,51,5-3,53,5-5,55,5-8,5
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
15
Prikaz 2. Vrste granica i njihova primjena
Veličina razreda jednaka je razlici gornje i donje granice tog razreda, pri čemu se pretpostavlja da su granice razreda prave. Razredi numeričkog obilježja u pravilu su zatvoreni, tj. imaju donju i gornju granicu. No, postoje slučajevi kada prvi razred nema donju ili posljednji razred nema gornju granicu. Takvi razredi su otvoreni. Otvoreni se razredi formiraju kada nije moguće precizno utvrditi minimalnu odnosno maksimalnu vrijednost koju podaci mogu poprimiti. Za potrebe statističke analize nedostajuće se granice moraju procijeniti. Procijenjene se granice stavljaju u zagrade.
Ako su veličine razreda međusobno različite, potrebno je korigirati frekvencije. Ko-rigiranje se obično izvodi tako da se veličina najmanjeg razreda označi kao „jedinična“ te se sve veličine ostalih razreda podjele s jediničnom veličinom. S tako dobivenim brojem dijeli se svaka originalna frekvencija. Frekvencije se obvezno korigiraju:
- pri crtanju poligona frekvencija,- pri crtanju histograma,- pri izračunavanju moda.
Kumulativni niz (empirijska funkcija distribucije) nastaje postupnim zbrajanjem originalnih frekvencija (apsolutnih ili relativnih) numeričkog niza. Može se formirati kao kumulativni niz prema „dolje“ i kumulativni niz prema „gore“. Poznavanje kumu-lativnog niza potrebno je za proračunavanje nekih srednjih vrijednosti, ali i za grafi čko prikazivanje distribucije frekvencija.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
16
Primjer 1.3. Nepismeno muško stanovništvo staro 10 i više godina u RH prema popisu iz 1991. godine
Starost (u god)
Brojosoba
Prave granice
Veličina razreda
Korigirane frekvencije
Kumulativni niz
„manje od“ „više od“
10-1920-3435-4950-64
65-(99)
96420182410598911980
10-2020-3535-5050-65
65-(100)
1015151535
9641345,31606,73992,73422,9
946296453741136323343
2334322397203791796911980
23343Izvor: SLJRH-96, str.73
U primjeru 1.3. razredi su različite veličine, te je za crtanje grafi kona i izračun moda potrebno korigirati frekvencije. Posljednji razred je poluotvoren, pa je maksimalna vri-jednost proizvoljno procijenjena i stavljena u zagrade. Bazna veličina za korigiranje frekvencija je 10. Korigirana frekvencija drugog razreda (1345,3) dobije se tako da se veličina tog razreda dijeli s baznom veličinom i dobije se koefi cijent 1,5 (15:10). S dobivenim se koefi cijentom dijeli originalna frekvencija (2018:1,5) te se tako dobije vrijednost korigirane frekvencije.
Tumačenje vrijednosti kumulativnih nizova: treća vrijednost kumulativnog niza „ma-nje od“ pokazuje kako je prema popisu iz 1991. u RH bilo 5374 nepismenih muških osoba mlađih od 50 godina. Druga vrijednost kumulativnog niza „više od“ pokazuje kako je bilo 22397 nepismenih muških osoba starijih od 20 godina itd.
Pitanja:1. Što je statistika?2. Kako se defi nira deskriptivna, a kako inferencijalna statistika?3. Kako nastaje statistički niz i kakav može biti?4. Kako se dijele statistička obilježja? 5. Koje su prednosti i nedostaci sekundarnih podataka? Navedite primjere sekundarnih
podataka.6. Defi nirajte pojmove: veličina razreda, razredna sredina, frekvencija.7. Kako se i kada računaju korigirane frekvencije?8. Navedite mjerne skale i njihova svojstva.9. Koje su faze statističke djelatnosti?10. Što su otvoreni razredi i gdje se pojavljuju?11. Kako se formira kumulativni niz „manje od“?
17
2. STATISTIČKO TABELIRANJE I GRAFIČKO PRIKAZIVANJE STATISTIČKIH
PODATAKA
2.1. VRSTE STATISTIČKIH TABLICA
Tabeliranje i grafi čko prikazivanje statističkih podataka ima za cilj da na jasan, cjelo-vit i pregledan način prezentira rezultate prikupljanja i grupiranja statističkih podataka.
S t a t i s t i č k a t a b l i c a
Br. tablice NASLOV
TUMAČ REDAKA(PREDSTUPAC)
TUMAČ STUPCA(ZAGLAVLJE)
UKUPNO
OZNAKA STUPCA
OZNAKA RETKA
POLJA TABLICE
ZBROJNI (MARGINALNI) STUPAC
UKUPNO ZBROJNI (MARGINALNI)REDAK
NAPOMENAOZNAKA IZVORA
Korisne upute:• Svaka tablica, osim naslova i izvora, ima tekstualni i brojčani dio. Sva mjesta u
tablici moraju biti popunjena tekstom ili brojem. • Kad god je to moguće u tablicu treba unijeti skraćene ili zaokružene brojeve.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
18
• U praksi se na pojedinim mjestima stavljaju i znakovi koji upućuju na po-sebnost sadržaja danog polja. Znakovi u publikacijama Državnog zavoda za statistiku su:
- nema pojave … ne raspolaže se podatkom 0 podatak je manji od 0,5 upotrijebljene jedinice mjere
Ø prosjek 1) oznaka za napomenu ispod tabele * ispravljeni podatak ( ) nepotpun, tj. nedovoljno provjeren podatak
Kakav će oblik imati statistička tablica ovisit će o prikupljenim statističkim podaci-ma, tj. o tome je li jedan ili više statističkih skupova promatrano prema jednom ili više obilježja. S obzirom na to razlikuju se: jednostavne, skupne i kombinirane statističke tablice.
Jednostavne statističke tablice prikazuju samo jednu pojavu, jedan statistički niz, kada je grupiranje provedeno prema jednom obilježju (primjer 2.1.)
Primjer 2.1. Učenici i studenti koji su završili školovanje u RH xxxx godine:
VRSTA ŠKOLE BROJ OSOBAOsnovna škola 53213Srednja škola 49039Stručni studij 4618
Sveučilišni studij 8820ukupno
Izvor: Statistički ljetopis xxxx godine, str. xx
U skupnim statističkim tablicama dva ili više statističkih nizova su grupirani pre-ma jednom obilježju (primjer 2.2.).
Primjer 2.2. Učenici i nastavnici prema školskim ustanovama školske godine XXXXŠKOLE UČENICI/STUDENTI NASTAVNICISrednje škole 170307 864Stručni studij 12804 148Sveučilišni studij 38129 319ukupno
Izvor: Statistički ljetopis xxxx godine, str. xx
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
19
U kombiniranim statističkim tablicama prikazan je jedan statistički niz promatran prema dva ili više obilježja (primjer 2.3.).
Primjer 2.3. Studenti prema statusu studiranja i studijskim godinama ak. god. xxxx
Godinastudija
Status studiranja
Izvanredni Redoviti Prva godina 250 850
Druga godina 160 700 Treća godina 100 550 Ukupno 510 2100
Izvor: Statistički ljetopis xxxx godine, str. xx
Statističke tablice mogu se podijeliti i na: 1) opće ili izvještajne statističke tablice i 2) analitičke ili sumarne statističke tablice.
Opće statističke tablice prikazuju ogroman broj statističkih podataka o nekom pro-matranom statističkom skupu. Analitičke statističke tablice se konstruiraju za neku posebnu analizu i one su u pravilu preglednije.
2.2. GRAFIČKO PRIKAZIVANJE STATISTIČKIH PODATAKA
Grafi čkim načinom prikazivanja postiže se zorniji pregled osnovnih karakteristika statističkog niza. Grafi koni moraju biti jasni, jednostavni i pregledani. Dijelimo ih u tri skupine:
• Kartogrami• Linijski grafi koni• Površinski grafi koni
Kartogrami su geografske karte na kojima se na različite načine prikazuje prostor-na rasprostranjenost statističkog skupa. Jedinice se grupiraju prema goegrafskom obi-lježju, gdje sve grupe zajedno predstavljaju cjelovito geografsko područje. Kartogram može biti nacrtan kao dijagramska karta, piktogram ili statistička karta.
Linijski grafi kon (poligon frekvencija) se koristi za prikazivanje numeričkih i vre-menskih nizova. Statistički niz prikazan je linijama. Na apscisi je aritmetičko mjerilo za obilježje, a na ordinati za frekvencije. Može se nacrtati temeljem apsolutnih ili re-lativnih frekvencija. Ukoliko se prikazuje distribucija frekvencija s razredima različite veličine, na grafi kon se ucrtavaju korigirane frekvencije.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
20
Primjer 2.4. Trgovačke radnje poduzeća X prema ostvarenom mjesečnom prometu u 000 kuna.
Promet(u 000 kn)
Broj radnji
fi
Veličina razreda
i
Korigirane frekvencije
fci10-1515-2020-3030-4545-75
37696
55101530
37331
Izvor: podaci su simulirani
Trgovačke radnje poduzeća X prema ostvarenom mjesečnom prometu prikazane su li-nijskim grafi konom:
Površinski grafi koni su svi oni koji koriste geometrijske likove dovodeći skupove ili njihove dijelove u upravno proporcionalan razmjer s površinom upotrijebljenog ge-ometrijskog lika. Površinski grafi koni su: jednostavni stupci, dvostruki stupci, razdije-ljeni stupci, strukturni krugovi ili polukrugovi, kvadrati i histogrami.
Negrupirani numerički nizovi mogu se grafi čki prikazati pomoću dijagrama točaka i S-L dijagrama (stablo-list) uz uvjet relativno malog broja pojedinačnih vrijednosti promatrane numeričke varijable.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
21
2.2.1. Dijagram točakaDijagram točaka (dot dijagram) formira se na način da se točke koje predstavljaju
pojedinu statističku jedinicu ucrtavaju iznad horizontalno položene osi s aritmetičkim mjerilom za promatrano numeričko obilježje.
Primjer 2.5. Promatrana je starosna struktura zaposlenika poduzeća „X“, (stanje na dan 31.12.2010. godine): 23, 25, 25, 28, 30, 30, 35, 35, 35, 36, 40, 40, 40, 40, 45, 45, 45, 50, 50, 50, 56, 60, 60, 65
Formiranje dijagrama točaka zahtjeva prethodno uređenje podataka po veličini, što je u primjeru već učinjeno.
Izvor: podaci su simulirani
2.2.2. S-L dijagramS-L dijagram (eng. steam-leaf ili stablo-list) specifi čan je jer ga se po obliku može
smatrati vrstom histograma, ali istovremeno se pri njegovoj konstrukciji ne gube poje-dinačni podaci kao što je slučaj s grafi čkim prikazima. Formiranje S-L dijagrama po-činje uređivanjem podataka po veličini. Zatim treba povući okomitu crtu i s njene lijeve strane ispisati vodeće znamenke (Stems). To su npr. oznake za desetice. Nakon toga s desne strane okomite crte (nasuprot vodećoj znamenci) navodi se druga znamenka broja (Leaf). Npr. ako je s lijeve strane vodeća znamenka 0, a nasuprot njoj znamenka 4, to znači da se radi o broju 04 tj. 4. Nasuprot jednoj vodećoj znamenci (“stablu“) može stajati više “listova“, ovisno koliko brojeva spada u pojedini razred.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
22
Starosna struktura zaposlenika poduzeća „X“, (stanje na dan 31.12.2010. godine): 23, 25, 25, 28, 30, 30, 35, 35, 35, 36, 40, 40, 40, 40, 45, 45, 45, 50, 50, 50, 56, 60, 60, 65 iz primjera 2.5 prikazana je S-L dijagramom:
Izvor: podaci su simulirani
2.2.3. Jednostavni stupciJednostavni stupci su pravokutnici jednakih baza, a visine su im određene veliči-
nama originalnih frekvencija. Koriste se za grafi čko uspoređivanje frekvencija nekog geografskog ili atributivnog niza. Na apscisi se označavaju modaliteti obilježja, a na ordinati originalne frekvencije. Između stupaca se uzima konstantan razmak.
Primjer 2.6. Anketirani potrošači proizvoda X prema djelatnom statusu od lipnja do prosinca 2010.
Djelatni status Broj ispitanika
zaposlen 300
nezaposlen 60
umirovljenik 70
student 40
Izvor: podaci su simulirani
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
23
2.2.4. Dvostruki stupciNa temelju dvostrukih stupaca uspoređuju se frekvencije jednog niza međusobno,
frekvencije drugog niza međusobno, te istovremeno frekvencije jednog niza s frekven-cijama drugog niza. To su zapravo jednostavni stupci nacrtani jedni iza drugih ili jedni pored drugih.
Primjer 2.7. Anketirani potrošači proizvoda X prema djelatnom statusu i spolu od lipnja do prosinca 2010.
Djelatni status Broj ispitanikaMuško Žensko
zaposlen 130 170nezaposlen 36 24
umirovljenik 43 27student 18 22
Izvor: podaci su simulirani
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
24
2.2.5. Razdijeljeni stupciKada se želi grafi čki usporediti struktura s obzirom na neko obilježje unutar pojedi-
nih grupa, upotrebljavaju se razdijeljeni stupci. Stupci su podijeljeni na segmente koji predočuju pojedine frekvencije.
Primjer 2.8. Anketirani potrošači proizvoda X prema djelatnom statusu i spolu od lipnja do prosinca 2010.
Djelatni statusBroj ispitanika
Muško Žensko
zaposlen 130 170
nezaposlen 36 24
umirovljenik 43 27
student 18 22 Izvor: podaci su simulirani
Prva razdioba prvog stupca je na visini 130, a druga na visini 300 (130+170).
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
25
2.2.6. Strukturni krugovi i polukrugoviBroj stupnjeva sektora kruga ili polukruga potrebno je izračunati na temelju omjera
dijela i cjeline pomnoženog s 360, odnosno sa 180, već prema tome radi li se o krugu ili polukrugu. Na taj se način dolazi do kružnih isječaka kojima su površine proporcional-ne dijelovima frekvencija ili skupova.7
Primjer 2.9. Anketirani potrošači proizvoda X prema djelatnom statusu od lipnjado prosinca 2010.
Djelatni status Broj ispitanika Stupnjevi sektora kruga
zaposlen 300 229,8
nezaposlen 60 46,0
umirovljenik 70 53,6
student 40 30,6
ukupno 470 360,00 Izvor: podaci su simulirani
7 Serdar, V. i Šošić, I. (1982) Uvod u statistiku, Školska knjiga, Zagreb
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
26
2.2.7. HistogramU slučaju grupiranih numeričkih statističkih nizova ili distribucija frekvencija histo-
gram je jedan od najčešće korištenih grafi kona. Histogram je stupčani grafi kon sastav-ljen od stupaca različitih visina.
Ako je riječ o diskretnoj numeričkoj varijabli čiji su modaliteti izraženi pojedinač-nim vrijednostima, baze stupaca histograma bit će jednake, pa će površina svakog stup-ca biti proporcionalna odgovarajućim frekvencijama.8
Primjer 2.10. Studenti prema ocjenama iz kolegija „Poslovna statistika“ Veleučilišta u Šibeniku9, ljetni ispitni rok, ak. god. 2009./10.
Ocjena Broj studenata
1 28
2 21
3 11
4 8
5 6 Izvor: vlastita evidencija
Ako je pak riječ o diskretnoj ili kontinuiranoj varijabli čiji su modaliteti izraženi u razredima, moguća su dva slučaja:
a) razredi su jednake veličine – baze stupaca histograma će biti jednake, a visina stupaca proporcionalna originalnim frekvencijama,
8 Rozga, A. i Grčić, B. (2000) Poslovna statistika, Veleučilište u Splitu, str. 35.
9 U daljnjim primjerima VUŠ
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
27
b) razredi su različite veličine – originalne frekvencije nisu izravno usporedive te ih je nužno korigirati
Treba voditi računa da se za grafi čki prikaz koriste prave ili precizne granice.
Trgovačke radnje poduzeća X prema ostvarenom mjesečnom prometu u 000 kn iz primjera 2.4. prikazane histogramom:
Promet(u 000 kn) Broj radnji Veličina
razredaKorigirane frekvencije
10-1515-2020-3030-4545-75
37696
55101530
37331
Izvor: podaci su simulirani
Kako su razredi različite veličine, frekvencije su korigirane prema baznoj veličini 5.
Pitanja:
1. Što je tabeliranje i čemu služi? Navedite vrste statističkih tablica.2. Što svaka tablica mora imati?3. Koji se geometrijski likovi koriste kod površinskih grafi kona?4. U čemu se razlikuju izvještajne i analitičke tablice?5. Čemu služi grafi čko prikazivanje u statistici? Nabrojite vrste grafi kona.6. Kojom se vrstom grafi kona prikazuje distribucija frekvencija ili numerički niz?7. Kojom vrstom grafi kona se prikazuju geografski nizovi?8. Kako se grafi čki prikazuju negrupirani numerički nizovi?
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
28
3. SREDNJE VRIJEDNOSTI
„ Kada netko stoji jednom nogom na vrućoj peći, a drugom u hladnjaku, statističar bi rekao da se taj čovjek prosječno nalazi u ugodnoj temperaturi.“
Walter Heller
Srednja vrijednost je konstanta koja predstavlja niz varijabilnih podataka. Nju je moguće shvatiti i kao središnju vrijednost oko koje se gomilaju podaci, zbog čega se naziva još i mjerom centralne tendencije masovne pojave. Općenito, razlikuju se slije-deće vrste srednjih vrijednosti:
- aritmetička sredina,- kronološka sredina,- harmonijska sredina,- geometrijska sredina,- mod,- medijan.
Položajne srednje vrijednosti su mod i medijan, jer su određene položajem unutar danog niza. Sve ostale srednje vrijednosti su potpune budući da se za njihov izračun koriste svi podaci.
Izbor srednje vrijednosti ovisi o vrsti statističke varijable (obilježja) odnosno niza za koji se određuje. U analizi numeričkog niza po pravilu se rabe sve spomenute srednje vrijednosti. Ako je riječ o nominalnom nizu, upotrijebit će se, uz određene uvjete, mod, a u analizi redoslijednog niza mod i medijan.10 Zahtjevi kojima moraju odgovarati sve srednje vrijednosti su:
- mogućnost utvrđivanja srednje vrijednosti objektivnim računskim pravilom na je-dinstven način,
- srednja vrijednost mora biti sadržana između najmanje i najveće vrijednosti obi-lježja,
- ako su sve vrijednosti obilježja jednake, i srednja vrijednost mora biti jednaka toj vrijednosti.
10 Šošić, I. (2006) Primijenjena statistika, Školska knjiga, Zagreb, str. 55.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
29
3.1. ARITMETIČKA SREDINA
Aritmetička sredina je najvažnija, najpoznatija i najviše upotrebljavana srednja vrijednost. Naziv koji se koristi za aritmetičku sredinu u svakodnevnom životu je „pro-sjek“ ili „prosječna vrijednost“. Ona predstavlja omjer zbroja svih vrijednosti nume-ričke varijable i broja njenih vrijednosti. Razlikuju se jednostavna i ponderirana ili vagana aritmetička sredina.
3.1.1. Jednostavna aritmetička sredinaJednostavna aritmetička sredina se primjenjuje kada podaci nisu grupirani, dakle
kada se raspolaže s pojedinačnim vrijednostima varijable.
NiN
xX
i
...2,1, ==∑
Veličina u brojniku izraza za aritmetičku sredinu naziva se total. Aritmetička sredina je dio totala koji otpada na jedinicu skupa podataka (populacije).
Primjer 3.1. Vrijednosti ostvarene dnevne zarade (u kn) u poduzeću X za isto radno vrijeme 8 zaposlenih radnika iznosile su:
135, 250, 172, 320, 270, 145, 180, 270
Zadatak je izračunati prosječnu dnevnu zaradu zaposlenih radnika.
75,2178
17428
270...250135==
+++=X
Dakle, prosječna dnevna zarada zaposlenih radnika u promatranom poduzeću je 217,75 kn.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
30
3.1.2. Vagana ili ponderirana aritmetička sredinaKada su podaci grupirani, tj. kada je formirana distribucija frekvencija, svaka se
vrijednost varijable x pojavljuje s pripadnom frekvencijom. Zbog toga se vagana ari-tmetička sredina dobije pomoću izraza:
kifi
fixX
i
...2,1, ==
∑
∑
Numeričke vrijednosti varijable x zapisane su kao razredne sredine11, te zamjenjuju individualne vrijednosti numeričkog obilježja svakog od analiziranih numeričkih razre-da. Pojedinačni produkti xifi koji se zbrajaju u brojniku izraza za aritmetičku sredinu nazivaju se podtotali. Zbrojeni podtotali u slučaju vagane aritmetičke sredine predstav-ljaju total. Stoga je gornji izraz za aritmetičku sredinu u skladu s defi nicijom da je ona dio totala po jedinici skupa podataka.
Primjer 3.2. Poduzeća iz djelatnosti trgovine prema broju zaposlenih 2010. godine:
Broj zaposlenih
Broj poduzeća
fi
250-499500-749750-999
430175112
ukupno 717 Izvor: podaci su simulirani
Zadatak je izračunati prosječan broj zaposlenih u poduzećima iz djelatnosti trgovine.
Kako se radi o distribuciji frekvencija, prosječan broj zaposlenih računa se uz pomoć izraza za vaganu aritmetičku sredinu. Statistički niz poduzeća prema broju zaposlenih predstavlja primjer diskontinuiranog statističkog niza pa se razredne sredine računaju na temelju nominalnih, a ne pravih granica.
11 Razredna sredina (xi) je poluzbroj donje i gornje granice promatranog razreda.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
31
podtotali
Broj zaposlenih
Broj poduzeća
fi (L1+L2)/2
razredna sredina
xi
fixi
250-499500-749750-999
430175112
(250+499)/2=(500+749)/2=(750+999)/2=
374,5624,5874,5
161035109287,5
97944
ukupno 717 - 368266,5
∑fi =N total
6,513717
5,368266
1
1 ===
∑
∑
=
=k
i
k
ii
fi
fixX
Poduzeća su u prosjeku imala 514 zaposlenih.
3.1.3. Aritmetička sredina preko odstupanja u jedinicama intervalaAritmetička sredina se može računati i preko odstupanja u jedinicama intervala, i to
pomoću izraza:
i
fdf
xXi
ii ⋅⋅
+=∑∑
0
Vrijednost xo predstavlja onu vrijednost razredne sredine koja ima najveću frekven-ciju. Vrijednost di dobije se tako da se od svakog xi oduzme xo i podijeli veličinom razre-da (i). Dobivene vrijednosti množe se sa fi, te se ukupna suma i ostali dobiveni rezultati uvrštavaju u formulu.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
32
Primjer 3.3. Zaposleni u poduzeću „X“ prema godinama starosti 2010. godine:Godine starosti
Broj zaposlenih
fi
Prave granice
Razredna sredina
xidi fi di
21-2526-3031-3536-4041-4546-5051-5556-60
131623352115117
21-2626-3131-3636-4141-4646-5151-5656-61
23,528,533,538,543,548,553,558,5
-3-2-101234
-39-32-23021303328
141 18 Izvor: Podaci su simulirani
14,395
141185,380 =⋅+=⋅
⋅+=∑∑ i
fdf
xXi
ii
Prosječna starost zaposlenih u poduzeću „X“ je 39,14 godina.
Svojstva aritmetičke sredine:
1. Zbroj odstupanja vrijednosti numeričke varijable od njezine aritmetičke sredine jed-nak je nuli.
0)( =−∑ xxi 0)( =−∑ xxf ii
2. Zbroj kvadrata odstupanja originalnih vrijednosti numeričkog obilježja od aritmetič-ke sredine jednak je minimumu.
imumxxi min)( 2 =−∑ imumxxifi min)( 2 =−∑
3. Aritmetička sredina se uvijek nalazi između najmanje i najveće vrijednosti numerič-kog obilježja varijable xi.
maxmin XXX <<
4. Aritmetička sredina nije dovoljno reprezentativna kada u numeričkom nizu postoje ekstremno male ili velike vrijednosti promatranog obilježja. Npr. u nizu: 500, 720, 1000, 1200, 32000 prosječna vrijednost bila bi 7084. U ovom slučaju aritmetička sre-dina je posve nepouzdan pokazatelj zbog utjecaja jedne ekstremno visoke vrijednosti.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
33
4. Aritmetička sredina nije pouzdana niti kada računamo vaganu sredinu na temelju dis-tribucije frekvencija (zbog razrednih sredina koje predstavljaju samo aproksimativnu zamjenu stvarne sredine odgovarajućeg razreda). Problem reprezentativnosti je do-datno pojačan kada postoje otvoreni razredi u distribuciji frekvencija, a osobito kada nije moguće objektivno procijeniti nepoznate granice otvorenih razreda.
3.2. KRONOLOŠKA SREDINA
Vremenski trenutačni niz sastavljen je od frekvencija čija je vrijednost utvrđena u određenom trenutku (satu, danu i sl.) te se tako utvrđene vrijednosti u pravilu ne mogu zbrajati. Iz toga proizlazi da se za vremenski trenutačni niz ne bi mogla izračunati sred-nja vrijednost. Zbog toga ponekad moramo odstupiti od stroge matematičke preciznosti i u određenim prilikama vremenski trenutačni niz transformirati u vremenski intervalni niz za koji se može izračunati srednja aritmetička vrijednost.
Primjer 3.4. Zadani su podaci o broju osoba koje su tražile posao u općini“X”:
Dan Broj osobaxi
31.12.2006.
31.03.2007.
31.04.2007.
31.07.2007.
30.09.2007.
5422
6224
7934
9681
9802
Kronološka sredina se računa prema formuli za ponderiranu sredinu:
∑∑ ⋅
=i
ii
fxf
X
Potrebno je odrediti koliki je vremenski interval između dana kada su zabilježeni podaci, te stvoriti korigirane pondere, tj. poluzbroj vremenskih intervala. Na kraju kori-steći formulu za ponderiranu aritmetičku sredinu (koristeći korigirane pondere) računa se prosječna vrijednost.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
34
Dan Broj osoba (xi)
Vremenski interval
Korigirani ponderi (fi ) fi ·xi
031.12.2006. 5422 (0+3)/2= 1,5 8133
3 mjeseca31.03.2007. 6224 (3+1)/2= 2 12448
1 mjesec31.04.2007. 7934 (1+3)/2= 2 15868
3 mjeseca31.07.2007. 9681 (3+2)/2= 2,5 24202,5
2 mjeseca30.09.2007. 9802 (2+0)/2= 1 9802
0
Σ 9 70453,5
16,7282
95,70453==
⋅=∑∑
i
ii
fxf
X
3.3. HARMONIJSKA SREDINA
Harmonijska sredina se defi nira kao recipročna vrijednost aritmetičke sredine re-cipročnih vrijednosti numeričkih obilježja. Upotrebljava se kada se želi odrediti prosjek nekih odnosa, npr. prosječni kilometri na sat, prosječan broj slova u minuti itd. Upotre-bljava se rjeđe od aritmetičke sredine.
Jednostavna harmonijska sredina (za negrupirane nizove) računa se prema formuli:
Ni
x
NH
i
...2,1,1
==
∑
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
35
Za vaganu (ponderiranu) harmonijsku sredinu upotrebljava se sljedeći izraz:
ki
xf
fH
i
i
i
...2,1, ==
∑
∑
Harmonijska sredina se ne može izračunati kada se u skupu promatranih vrijednosti obilježja pojavljuje vrijednost nula ili negativan broj.
Primjer 3.5. Za nekoliko odabranih fakulteta dani su podaci o broju studenata i broju studenata po 1 nastavniku.
Fakultet Broj studenata Broj studenata po 1 nastavniku
Ekonomski 2500 10,87
Medicinski 1300 8,66
Pravni 2200 12,22 Izvor: podaci su simulirani
Zadatak je izračunati prosječan broj studenata po nastavniku za sve navedene fakul-tete zajedno.
Kada je već dana jedna prosječna vrijednost (broj studenata po nastavniku) koristi se harmonijska sredina da bi se odredila prosječna srednja vrijednost.
Fakultet Broj studenatafi
Broj studenata po nastavniku
xi
fi/xi
Ekonomski 2500 10,87 230Medicinski 1300 8,66 150
Pravni 2200 12,22 180∑ 6000 560
71,10
5606000
===∑∑
i
i
i
xff
H
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
36
3.4. GEOMETRIJSKA SREDINA
Geometrijska sredina je N-ti korijen iz produkta vrijednosti numeričke varijable. Brojčano se razlikuje od aritmetičke sredine (manja je), a kao i ostale srednje vrijedno-sti nalazi se između najmanje i najveće vrijednosti numeričkog obilježja. Jednostavna geometrijska sredina računa se pomoću izraza:
NiN
xiG ...2,1,
log==
∑
Izrazi za vaganu ili ponderiranu geometrijsku sredinu:
kixfN
GNixfG iiN ii ...2,1,log1log;...2,1, ==== ∑∏
kif
xfG
i
ii
...2,1,log
==∑
∑
Kod numeričkih nizova geometrijska sredina nema neku logičnu interpretaciju. U poslovnoj statistici najčešće se upotrebljava u analizi vremenskih nizova.12 Koristi se za izračunavanje prosječne stope promjene neke pojave (ako broj nije negativan ili nula).
Primjer 3.6. U poduzeću „X“ 2007. je bilo zaposleno 200, 2008. 900, a 2009. godine 1800 radnika. Postavlja se pitanje koliko se puta prosječno povećavao broj zaposlenih svake godine?
Broj zaposlenih 2008. bio je 4,5 puta veći u odnosu na 2007., a 2009. dva puta veći u odnosu na 2008. godinu.
3925.4 ==⋅=G
12 Biljan-August,M. et al. (2007)Upotreba statistike u ekonomiji, Ekonomski fakultet Rijeka, str. 43.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
37
Kako se vidi, to odgovara stvarnom stanju, jer se od 2007. do 2009. broj zaposle-nih ukupno povećao devet puta (200∙3∙3=1800). Da smo računali aritmetičku sredinu (4,5+2)/2, dobili bismo netočan podatak, tj. 3,25.
3.5. MOD
Mod je vrijednost ili modalitet varijable koji se najčešće pojavljuje u nizu, tj. vri-jednost obilježja s najvećom frekvencijom. U odnosu na aritmetičku sredinu i medijan, mod je najmanje osjetljiv na izrazito velike i izrazito male vrijednosti obilježja. Me-đutim, osjetljiv je na različita grupiranja frekvencija. S obzirom na mod razlikuju se slijedeće distibucije:
a) unimodalna – ima samo 1 mod, b) bimodalna – ima 2 moda, c) multimodalna – ima više od 2 moda.
Kod nominalnih obilježja mod se određuje traženjem vrijednosti obilježja u nizu koje se najčešće javlja. Ako je niz grupiran, traži se najveća apsolutna frekvencija. Vri-jednost obilježja kojoj pripada ta najveća apsolutna frekvencija je mod.13
Primjer 3.6. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ pre-ma postignutom uspjehu, ljetni ispitni rok, ak. god. 2009./10.
Ocjena Broj studenata
IzvrstanVrlo dobar
DobarDovoljan
681121
Izvor: vlastita evidencija
Zadatak je odrediti mod tj. najčešću prolaznu ocjenu koju su studenti postigli u ljet-nom ispitnom roku iz kolegija „Poslovna statistika“. Niz je nominalan. Mod je modalitet nominalne varijable s najvećom frekvencijom. Najveći broj studenata je na ispitu dobilo ocjenu dovoljan pa je prema tome mod (modalna kategorija) za navedeni niz dovoljan.
Određivanje moda za distribuciju frekvencija ovisi o tome da li su formirane grupe, ili je obilježje dano u razredima. Ukoliko su formirane grupe, postupak je potpuno isti kao u prethodnom primjeru.
13 Biljan-August,M. et al.(2007) Upotreba statistike u ekonomiji, Ekonomski fakultet Rijeka, str. 47.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
38
Primjer 3.7. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ pre-ma postignutom uspjehu, ljetni ispitni rok, ak. god. 2009./10.
Ocjena Broj studenata
5432
681121
Izvor: vlastita evidencija
Najčešća ocjena studenata VUŠ-a iz kolegija „Poslovna statistika“ na ljetnom ispit-nom roku ak. god. 2009./10. je 2 (Mo=2).
Kod distribucije frekvencija s formiranim razredima, mod nije moguće direktno oči-tati. Koristi se slijedeći izraz za izračunavanje moda:
i
cbababLMo ⋅−+−
−+=
)()()(
1
gdje je: L1 – donja granica modalnog razreda, b – frekvencija modalnog razreda, a – frekvencija koja prethodi modalnom razredu, c – frekvencija koja slijedi iza frekvencije modalnog razreda, i – veličina modalnog razreda.
Primjer 3.8. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ prema broju bodova koji su postigli, ljetni ispitni rok, ak. god. 2009./10.
Broj bodova
Broj studenatafi
Veličina razredai
51-6061-7071-8081-9091-100
18 b 6 c
976
99999
Izvor: vlastita evidencija
Modalni razred-razred s
najvećomfrekvencijom
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
39
U primjeru 3.8. svi razredi su jednake veličine. Modalni razred je onaj kojem pripada najveća originalna frekvencija. Obilježje je diskretno (diskontinuirano) pa je za izračun potrebno koristiti nominalne granice. Najveća originalna frekvencija je 18, pa je modal-ni razred 51 – 60.
569
)618()018()018(51 ≈⋅−+−
−+=oM
Najčešći broj bodova bio je 56.
Ukoliko su razredi različite veličine originalne frekvencije nisu izravno usporedive pa je modalni razred onaj kojem pripada najveća korigirana frekvencija.
Primjer 3.9. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ prema broju bodova koji su postigli, ljetni ispitni rok, ak. god. 2009./10.
Broj bodova Broj studenatafi
Veličina razreda
i
Korigirane frekvencije
fci
51-5556-6061-6970-8687-100
1266157
4481613
12 b 6 c
33,752,15
Izvor:Vlastita evidencija
Najveća korigirana frekvencija je 12, pa je modalni razred 51 – 55.
544
)612()012()012(51 ≈⋅−+−
−+=oM
Vidljivo je da vrijednost moda u primjerima 3.8. i 3.9. nije ista, što je rezultat osjet-ljivosti moda na različita grupiranja frekvencija.
Modalni razred-razred s
najvećomkorigiranomfrekvencijom
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
40
3.6. MEDIJAN
Medijan je numerička vrijednost koja niz dijeli na dva jednaka dijela, na način da polovina elemenata imaju vrijednost numeričkog obilježja jednaku ili manju od medi-jana, dok druga polovina ima vrijednost jednaku ili veću od medijana. U statističkim distribucijama postoji samo jedan medijan i on se nalazi između najveće i najmanje vrijednosti obilježja.
Prednost medijana jest da na njega ne utječu ekstremno male ili velike vrijednosti obilježja, stoga je primjerena srednja vrijednost i kod izrazito asimetričnih distribuci-ja. Određivanje medijana sastoji se u pronalaženju vrijednosti obilježja na središnjoj poziciji u uređenom nizu. Ako se radi o negrupiranom numeričkom nizu, elemente je potrebno napisati redoslijedno (poredati ih po veličini), te će vrijednost središnjeg ele-menta (ukoliko je broj elemenata u nizu neparan) biti medijan. Ako je broj elemenata u nizu paran, medijan je vrijednost poluzbroja dvaju središnjih članova niza.
Medijalna vrijednost u primjeru 3.1. u kojem su dane vrijednosti dnevnih zarada u kn (135, 250, 172, 320, 270, 145, 180, 270) za isto radno vrijeme 8 zaposlenih radnika određuje se na slijedeći način: kako je riječ o negrupiranom numeričkom nizu, podaci se najprije trebaju poredati po veličini.
135, 145, 172, 180, 250, 270, 270, 320
Budući da je broj elemenata u nizu paran (N=8), vrijednost medijana bit će jednaka poluzbroju vrijednosti 4. i 5. člana.
4
28
2===
Nr
21++
=rr
exxM
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
41
215
2250180
254
=+
=+
=xxMe
Prvih 50% radnika zaradilo je 215 kn ili manje, a preostalih 50% radnika zaradilo je 215 kn ili više.
Da je bila promatrana zarada sedmorice radnika (npr. bez radnika koji dnevno zaradi 320 kn), vrijednost medijana odredila bi se na sljedeći način:
1)
2( +=NINTr
gdje je INT cijeli dio broja.
41)5,3(1)
27( =+=+= INTINTr
135, 145, 172, 180, 250, 270, 270
1804=
=Mer
Kod distribucije frekvencija diskretne numeričke varijable sa formiranim grupama,
za pronalaženje medijana koristi se kumulativni niz „manje od“. Pomoću prve kumula-tivne frekvencije koja je jednaka ili veća od N/2 identifi cira se pripadna vrijednost gru-pe, koja je u tom slučaju medijan. Ovo vrijedi bilo za slučaj da je N neparan, bilo da je paran, budući da sve jedinice u grupi imaju istu vrijednost obilježja. Jedino, ukoliko bi jedinice s redoslijedom N/2 i (N/2) +1 pripadale dvjema uzastopnim grupama, medijan bi se odredio kao poluzbroj vrijednosti obilježja tih dviju grupa.14
14 Gogala, Z. (2001.) Osnove statistike, Sinergija, Zagreb, str. 62.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
42
Primjer 3.10. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ prema postignutom uspjehu, ljetni ispitni rok, ak. god. 2009./10.
Ocjena Broj studenata Kumulativni niz „manje od“
5432
681121
61425 46
∑ 46 - Izvor: vlastita evidencija
Zadatak je odrediti vrijednost koja niz dijeli na dva jednaka dijela.
Kako je N/2 = 23, medijan je obilježje s rednim brojem 23. Prva kumulativna fre-kvencija, jednaka ili veća od 23, jest treća po redu kumulativna frekvencija (25) uz koju stoji obilježje „3“. Dakle, polovina studenata dobila je ocjenu 3 ili manje, a polovina 3 ili više.
Ako se radi o distribuciji frekvencija s razredima, neovisno o tome je li obilježje diskontinuirano ili kontinuirano, za izračunavanje medijana može se primijeniti sljedeći izraz:
miif
fN
LMmed
i
e ...2,1,2
1 =⋅−
+=∑
gdje je: L1 - donja granica medijalnog razreda, - zbroj frekvencija do medijalnog razreda,
fmed - frekvencija medijalnog razreda,
i - veličina medijalnog razreda.
∑ if
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
43
Primjer 3.11. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ prema broju bodova koji su postigli, ljetni ispitni rok, ak. god. 2009./10.
Broj bodova
Broj studenatafi
Kumulativni niz„manje od“
51-5556-6061-6970-8687-100
1266157
121824397
∑ 46 -Izvor:Vlastita evidencija
Medijalni razred odgovara prvoj kumulativnoj frekvenciji u nizu koja uključuje omjer N/2. Dakle, medijalni razred bit će 61-69.
6886
182
46
61 ≈⋅−
+=eM
50% studenata je imalo 68 bodova ili manje, a preostalih 50% studenata je imalo 68 bodova ili više.
Svojstva medijana:
1. Medijan se uvijek nalazi između najmanje i najveće vrijednosti numeričkog obilježja varijable xi.
maxmin XMX e <<
2. Zbroj odstupanja podataka od medijana uzetih apsolutno je minimalan
min
1=∑
=
−
N
iei Mx min
1=∑
=
− i
k
iei fMx
3. Nije osjetljiv na ekstremne vrijednosti niti na distribucije frekvencija s otvorenim razredima (osim ako je rubni otvoreni razred ujednoi medijalni)
medijalni razred:N/2=23
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
44
Pitanja:
1. Što je srednja vrijednost?2. Defi nirajte aritmetičku sredinu. Koja su njena svojstva?3. Kada se i kako računaju harmonijska sredina i geometrijska sredina?4. Defi nirajte mod i medijan, čemu služe, u koju vrstu srednjih vrijednosti se ubra-
jaju i koja su im svojstva.5. Kada se mod ne može izračunati?
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
45
4. KVANTILI
Kvantili su vrijednosti numeričkog obilježja koje niz uređen po veličini dijele na q jednakih dijelova. Kvantili su kvartili, decili i precentili.
4.1. KVARTILI
Kvartili dijele numerički niz na četiri jednaka dijela. Postoji prvi ili donji kvartil (Q1) koji dijeli niz u omjeru 1:3, drugi kvartil ili medijan, te treći ili gornji kvartil (Q3) koji niz dijeli u omjeru 3:1.
Kada se kvartili računaju za negrupirani numerički niz, podatke je potrebno urediti po veličini i pronaći vrijednosti na traženoj kvartilnoj poziciji. U slučaju kada je N dje-ljiv sa 4, donji kvartil se određuje kao poluzbroj vrijednosti na pozicijama xr i xr+1 , (r = N/4). Analogni postupak ponavlja se kod određivanja trećeg kvartila, ali umjesto N/4 biti će 3N/4.
Vratimo se na primjer 3.1. u kojem su dane vrijednosti dnevnih zarada (u kn) za isto radno vrijeme 8 zaposlenih radnika. Zarade (u kn) poredane po veličini bile su slijedeće:
135, 145, 172, 180, 250, 270, 270, 320
2
48
4===
Nr
5,158
2172145
232
1 =+
=+
=xxQ
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
46
Jedna četvrtina radnika zaradilo je 158,5 kn ili manje, a tri četvrtine radnika ostvarilo je dnevnu zaradu od 158,5 kn ili veću.
6
483
43
=⋅
==Nr
270
2270270
276
1 =+
=+
=xxQ
Tri četvrtine radnika zaradilo je 270 kn ili manje , a jedna četvrtina radnika zaradila je 270 kn ili više.
Kada N nije djeljiv sa 4 ostatak koji se pojavljuje prilikom dijeljenja se zanemari, te cjelobrojni dio kvocijenta poveća za 1 i dobije se vrijednost koja je na poziciji prvog kvartila. Da je bila promatrana zarada sedmorice radnika (npr. bez radnika koji dnevno zaradi 320 kn):
135, 145, 172, 180, 250, 270, 270
vrijednost gornjeg i donjeg kvantila odredili bi na sljedeći način:
21)75,1(1)
4( =+=+= INTNINTr 61)25,5(1)
43( =+=+= INTNINTr
14521 == xQ 27063 == xQ
Ako je numerički niz grupiran prema diskretnom obilježju gdje su modaliteti pred-stavljeni pojedinačnim brojevima, kvartili se određuju uz pomoć kumulativnog niza „manje od“ i prethodno utvrđene procedure određivanja rednog broja odgovarajućeg člana niza s vrijednošću obilježja jednakom donjem ili gornjem kvartilu.15
15 Rozga, A. i Grčić, B. (2000) Poslovna statistika, Veleučilište u Splitu, str. 66.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
47
Primjer 4. 1. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ prema postignutom uspjehu, ljetni ispitni rok, ak. god. 2009./10.
Ocjena Broj studenata Kumulativni niz„manje od“
2345
211186
21324046
46 - Izvor: vlastita evidencija
( ) 1215,111
446
=+=+⎟⎠⎞
⎜⎝⎛= INTINTr
12. član niza sadržan je u frekvenciji kumulativnog niza (21) uz koji stoji vrijednost obilježja „2“, pa je Q1=2.
( ) 3515,341
4463
=+=+⎟⎠⎞
⎜⎝⎛ ⋅
= INTINTr
35. član niza sadržan je u frekvenciji kumulativnog niza (40) uz koji stoji vrijednost obilježja „4“, pa je Q3=4.
Ako se donji i/ili gornji kvartil određuje za numerički niz grupiran u razrede, neo-visno da li je riječ o diskontinuiranom ili kontinuiranom obilježju, potrebno je koristiti slijedeće izraze:
qiif
fN
LQtk
i
...2,1,4
var11 =⋅
−+=
∑qii
f
fN
LQtk
i
...2,1,4
3
var13 =⋅
−+=
∑
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
48
gdje je: L1 - donja granica kvartilnog razreda, - zbroj frekvencija do kvartilnog razreda,
fkvart - frekvencija kvartilnog razreda,
i - veličina kvartilnog razreda.
Primjer 4.2. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ pre-ma broju bodova koji su postigli, ljetni ispitni rok, ak. god. 2009./10.
Broj bodova
Broj studenatafi
Kumulativni niz„manje od“
51-5556-6061-6970-8687-100
1266157
121824397
∑ 46 - Izvor:Vlastita evidencija
( ) 1215,111
446
=+=+⎟⎠⎞
⎜⎝⎛= INTINTr
Prva kumulativna frekvencija jednaka ili veća od 12, jest prva po redu kumulativna frekvencija, pa je kvartilni razred 51 – 55.
55412
04
46
511 ≈⋅−
+=Q
Jedna četvrtina ili 25% studenata je na ispitu postiglo 55 bodova ili manje, a tri če-tvrtine ili 75% je postiglo 55 bodova ili više.
( ) 3515,341
4463
=+=+⎟⎠⎞
⎜⎝⎛ ⋅
= INTINTr
∑ if
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
49
Prva kumulativna frekvencija jednaka ili veća od 35 jest četvrta kumulativna fre-kvencija, pa je kvartilni razred 70 – 86.
811615
244463
703 ≈⋅−
⋅
+=Q
Tri četvrtine ili 75% studenata je na ispitu postiglo 81 bod ili manje, dok je jedna četvrtina ili 25% studenata postiglo 81 bod ili više.
4.2. DECILI
Decili su kvantili koji niz dijele na 10 jednakih dijelova, a ima ih 9. Za negrupirane podatke i za slučaj kada N nije djeljiv sa deset bez ostatka, ostatak se zanemari te cjelo-brojni dio kvocijenta poveća za 1. Na taj način dobije se vrijednost koja je na poziciji pr-vog decila. Na analogan se način određuju vrijednosti preostalih decila pomoću izraza:
9,...2,1,1
10, =+⎟
⎠⎞
⎜⎝⎛== iiNINTrxD ri
Kada je i∙N djeljivo s deset bez ostatka tada vrijedi:
102,
1 iNrxxD rri =
+=
+
Decili distribucije frekvencija određuju se računski postupcima analognim onima za određivanje medijana i kvartila pomoću izraza:
9...2,1,10
1
1 =⋅−
⋅
+=∑
iif
fNi
LDidecil
gdje je: L1 - donja granica decilnog razreda,
- zbroj frekvencija do decilnog razreda,
fdecil - frekvencija decilnog razreda,
i - veličina decilnog razreda
∑ 1f
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
50
4.3. PERCENTILI
Percentili su kvantili koji niz dijele na 100 jednakih dijelova, a ima ih 99. Određuju se na način sličan onom opisanom za decile, odnosno kvartile. Podaci moraju biti uređe-ni po veličini. Kada N ili i∙N nije djeljivo sa sto bez ostatka, cjelobrojni dio se poveća za jedan i dobije se vrijednost koja je na poziciji i-tog percentila.
99,...2,1,1
100, =+⎟
⎠⎞
⎜⎝⎛== iiNINTrxP ri
Kada je i∙N djeljivo sa sto bez ostatka tada vrijedi:
1002,
1 iNrxxP rri =
+=
+
Percentil za distribucije frekvencija s razredima dobije se pomoću izraza:
99...2,1,100
1
1 =⋅−
⋅
+=∑
iif
fNi
LPpercentil
i
gdje je: L1 - donja granica percentilnog razreda,
- zbroj frekvencija do percentilnog razreda,
fpercentil - frekvencija percentilnog razreda, i - veličina percentilnog razreda
Pitanja:
1. Što su kvartili i zašto su značajni?2. Kako se kvartili računaju za negrupirani numerički niz?3. Objasnite slijedeće izraze: 3. decil, 75. percentil. 12. percentil.
∑ 1f
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
51
5. MJERE DISPERZIJE
Mjere disperzije brojčano izražavaju različitu raspršenost vrijednosti numeričkog obilježja oko srednjih vrijednosti. Nazivaju se još i mjere raspršenosti ili varijacije. Di-jele se na apsolutne mjere disperzije (izražavaju se u apsolutnim jedinicama) i relativne mjere disperzije (pokazuju relativno odstupanje- postotke).
Apsolutne mjere disperzije Relativne mjere disperzije
Raspon varijacijeInterkvartilVarijancaStandardna devijacijaSrednje apsolutno odstupanje
Koefi cijent varijacijeKoefi cijent kvartilne devijacije
5.1. RASPON VARIJACIJE
Raspon varijacije je najjednostavnija mjera odstupanja, a predstavlja razliku izme-đu najveće i najmanje vrijednosti niza.
minmax xxRv −=
Ako su podaci jednaki vrijednost mu je jednaka nuli, a povećava se povećanjem stupnja varijabilnost podataka.
Za distribuciju frekvencija diskontinuirane varijable s formiranim grupama raspon varijacije se određuje pomoću izraza:
1xxRv k −=
U primjeru 4.1. (str. 38.) raspon varijacije iznosi 5-2=3, što je maksimalna razlika u ocjenama studenata koji su položili ispit.
Kod distribucije frekvencija s formiranim razredima raspon varijacije se određuje kao razlika gornje granice posljednjeg i donje granice prvog razreda, ili izračunavanjem razlike razrednih sredina posljednjeg i prvog razreda. U primjeru 4.2. (str.39.) raspon varijacije iznosi 100-51=49, što je maksimalna razlika u broju bodova. Drugim riječi-ma, broj bodova studenata iz promatrane distribucije varirao je u rasponu od 49 bodova.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
52
Prednost ove apsolutne mjere disperzije je u njenom jednostavnom računanju i in-terpretaciji. Međutim, ne može se reći da je riječ o pouzdanoj mjeri disperzije budući da se određuje pomoću samo dvije krajnje vrijednosti u nizu. U slučaju postojanja ekstre-mno malih i/ili ekstremno velikih vrijednosti obilježja, raspon varijacije nije precizna mjera raspršenosti budući da se tada dobije veliki raspon varijacije, a možda je većina elemenata skupa raspršena usko oko srednje vrijednosti. Raspon varijacije se kao mjera disperzije preporuča koristiti u mjerenju varijabilnosti cijena, praćenju valutnih tečaje-va, vrijednosti dionica i sl.
5.2. INTERKVARTIL
Interkvartil pokazuje raspon varijacije središnjih 50% jedinica niza, a računamo ga kao razliku gornjeg i donjeg kvartila:
13 QQIq −=
U primjeru 4.2. (str. 38.) već je izračunato da je Q1=55, a Q3=81 iz čega proizlazi da je interkvartil Q3-Q1=28. Dakle, broj bodova središnjih 50% studenata iz promatrane distribucije varira u rasponu od 28.
Interkvartil nije potpuna mjera disperzije budući da se, kao i raspon varijacije, odre-đuje pomoću samo dvije vrijednosti. Međutim, prednost u odnosu na raspon varijacije je što se primjenom ove mjere disperzije iz razmatranja isključuju ekstremne vrijednosti (eliminira se 25% najmanjih i 25% najvećih vrijednosti obilježja u nizu). Time se osi-gurava da na mjeru ne djeluju izrazito male i izrazito velike vrijednosti, što je prednost ove mjere disperzije u odnosu na raspon varijacije.
Raspon varijacije i interkvartilni raspon prikazuju se grafi čki B-P dijagramom (Box-Plot).
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
53
Prikaz 5.1. Box-Plot dijagram
Box-Plot dijagram konstruira se na način da se najprije na vodoravnoj osi odredi ari-tmetičko mjerilo prema rasponu varijacije varijable, zatim se označi položaj najmanje i najveće vrijednosti te kvartila i medijana. Slijedi crtanje pravokutnika.
Interdecil je razlika dvaju decila. Npr. ID8-D2 = D8-D2 mjeri raspon varijacije središ-njih 60% vrijednosti. Interprercentil je razlika percentila. Npr. IP90-P10=P90-P10 je raspon varijacije središnjih 80% podataka itd.
5.3. VARIJANCA I STANDARDNA DEVIJACIJA
Varijanca i standardna devijacija su najčešće korištene apsolutne mjere disperzi-je. Za razliku od raspona varijacije i interkvartila koji se određuju pomoću dviju vri-jednosti, ove mjere disperzije obuhvaćaju sve jedinice niza pa ih svrstavamo u potpune mjere disperzije.
Varijanca je aritmetička sredina kvadrata odstupanja od aritmetičke sredine skupa tj. prosječno kvadratno odstupanje od prosjeka. Nije pogodna za interpretaciju, budući da je izražena u mjernim jedinicama dignutim na kvadrat. Zbog toga se uz pomoć dru-gog korijena iz varijance izvodi standardna devijacija. Varijanca je defi nirana izrazima:
2
22 )(x
Nxi −= ∑σ
za negrupirane podatke,
2
22 )(x
fifixi −=
∑∑σ za grupirane podatke.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
54
Standardna devijacija je pozitivan korijen iz varijance i izražena je u originalnim jedinicama mjere. Defi nira se kao prosječno odstupanje vrijednosti numeričkog obiljež-ja od aritmetičke sredine.
2σσ =±
Vratimo se na primjer 3.1. u kojem su dane dnevne zarade radnika (u kn): 135, 145, 172, 180, 250, 270, 270, 320
Potrebno je izračunati varijancu i standardnu devijaciju. Koriste se formule za negrupi-rane podatke.
x 135, 145, 172, 180, 250, 270, 270, 320
x2 18225, 21025, 29584, 32400, 62500, 72900, 72900, 102400 ∑ x2=411934
69,407675,2178
411934)( 222
2 =−=−= ∑ xN
xiσ
85,6369,4076 ==σ
Prosječno odstupanje dnevne zarade radnika od prosječne zarade iznosi 63,85 kn.
Vratimo se ponovo na primjer distribucije studenata VUŠ-a grupiranih prema broju bodova koje su postigli na ispitu iz „Poslovne statistike“. Varijancu i standardnu devija-ciju izračunat ćemo koristeći izraze za grupirane numeričke nizove:
Broj bodova
Broj studenatafi
Razredna sredina xi
fi xi xi2 fi xi
2
51-5556-6061-6970-8687-100
1266157
53586578
93,5
6323483901170654,5
2809336442256084
8742,25
33708201842535091260
61195,75
∑ 46 - 3194,5 231697,75Izvor:Vlastita evidencija
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
55
61,21345,69
4675,231697)( 22
22 =−=−=
∑∑ x
fixf ii
σ
62,1461,213 ==σ
Prosječno odstupanje od prosječnog broja bodova prikazane distribucije studenata bilo je 15 bodova.
5.4. SREDNJE APSOLUTNO ODSTUPANJE
Srednje apsolutno odstupanje ili MAD (eng. Mean Absolute Deviation) je pro-sječno apsolutno odstupanje od aritmetičke sredine. Prilikom računanja ne uzima se u obzir predznak individualnih vrijednosti, nego apsolutne razlike od aritmetičkih sredi-na. Dana je izrazom:
N
xxiMAD
∑ −=
za negrupirane podatke,
∑∑ −
=fi
fixxiMAD
za grupirane podatke
MAD se rjeđe upotrebljava kao mjera disperzije numeričkih nizova, a više kao mjera uspješnosti prognoziranja u analizi vremenskih nizova.
5.5. KOEFICIJENT VARIJACIJE
Koefi cijent varijacije predstavlja relativan omjer standardne devijacije i aritmetič-ke sredine pomnožen sa sto.
100⋅=
xV σ
Spada u potpune mjere disperzije jer obuhvaća sve elemente odabranog numeričkog statističkog niza, a izražava se u postotcima. Kada su sve vrijednosti numeričkog obi-lježja u jednom nizu jednake, koefi cijent varijacije će poprimiti vrijednost od 0%, što znači da nema disperzije. Ova relativna mjera disperzije omogućava usporedbu disper-zije u različitim skupovima podataka.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
56
5.6. KOEFICIJENT KVARTILNE DEVIJACIJE
Koefi cijent kvartilne devijacije je omjer interkvartila i zbroja kvartila.
13
13
QQQQVq +
−=
Ova mjera se koristi u slučajevima kada se disperzija u pojedinim distribucijama mjeri interkvartilom, te predstavlja relativnu mjeru disperzije srednjih 50% jedinica u nizu. Može poprimiti vrijednost od 0 do 1. Što je koefi cijent bliži nuli, disperzija je manja i obrnuto.
5.7. STANDARDIZIRANO OBILJEŽJE
Standardizirano obilježje je pokazatelj relativnog položaja pojedinačne vrijednosti numeričke varijable u numeričkom nizu podataka. Pokazuje za koliko se standardnih devijacija originalno obilježje razlikuje od aritmetičke sredine.
Varijanca i standardna devijacija kao apsolutne mjere disperzije ne omogućuju uspo-redbu disperzije vrijednosti obilježja koje imaju različitu jedinicu mjere. Također mogu uputiti na pogrešan zaključak pri usporedbi disperzije obilježja nizova s različitim po-jedinačnim vrijednostima obilježja.16U tom slučaju se može računati standardizirano obilježje budući da je ono izraženo u jedinicama standardnih devijacija čime je omogu-ćena usporedba raznorodnih distribucija. Standardizirano obilježje se određuje pomoću izraza:
σxxizi −
= i=1,2,3...N
Svojstva standardiziranog obilježja:- aritmetička sredina standardiziranog obilježja jednaka je nuli,- standardna devijacija standardiziranog obilježja jednaka je 1.
Upravo ova svojstva omogućuju usporedivost disperzije u raznorodnim distribucija-ma. Tako primjerice ako se želi odrediti odstupa li više od prosjeka zaposlenik koji ima plaću 5 100 kn, ili zaposlenik koji ima 7 godina radnog staža za izračun će se koristiti standardizirano obilježje.
16 Biljan-August,M. et al. (2007)Upotreba statistike u ekonomiji, Ekonomski fakultet Rijeka, str. 54.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
57
Standardizirana varijabla omogućuje:• usporedbu numeričkih nizova izraženih u istim mjernim jedinicama s različitim
stupnjem varijabilnosti,• usporedbu raznorodnih numeričkih nizova,• usporedbu relativnog položaja podataka u jednom nizu i u različitim numeričkim
nizovima.
5.7.1. Pravilo ČebiševaStandardizirana varijabla može poprimiti i pozitivne i negativne vrijednosti. One će
rijetko odstupati od aritmetičke sredine za više od ±3σ.
Dakle, u intervalu od ±3σ će se naći gotovo sva odstupanja individualnih vrijednosti numeričkog niza od aritmetičke sredine. Prema pravilu Čebiševa najmanja proporcija članova bilo koje populacije u intervalu ±kσ, k>1 iznosi:
Pojas od ±2σ obuhvaća najmanje 75% svih podataka, dok pojas od ±3σ sadrži naj-manje 88,89% svih podataka. U navedenom intervalu je moguće očekivati najmanje pN podataka.
Netipičan podatak je onaj koji se nalazi izvan pojasa ±2σ, tj. podatak koji od prosje-ka odstupa za više od dvije standardne devijacije.
Primjer 5.1. Prosječan broj bodova na 1. kolokviju iz kolegija „Poslovna statistika“ iznosi 58, a prosječno odstupanje od prosjeka 5. Na 2. kolokviju postignut je prosje-čan broj bodova 65, a prosječno odstupanje od prosjeka 4. Student je na 1. kolokviju postigao 64, a na drugome 68 bodova. Što se može zaključiti o uspjehu studenta na kolokvijima?
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
58
prvi kolokvij: 64,5,58 11 === xx σ
2,1
55864
1 =−
=z
drugi kolokvij: 68,4,52 22 === xx σ
75,0
46568
2 =−
=z
Student je na oba kolokvija postigao iznadprosječan rezultat. Bolji je bio na 1. kolo-kviju, jer je odstupanje od prosjeka na više za 1,2σ.
Pitanja:
1. Objasnite pojam raspršenosti ili disperzije.2. Defi nirajte pojmove: raspon varijacije, varijanca, standardna devijacija.3. Objasnite relativne mjere disperzije.4. Kada se može koristiti standardizirano obilježje?5. Kako glasi pravilo Čebiševa?
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
59
6. ANALIZA VREMENSKIH NIZOVA
6.1. VREMENSKI NIZ - DEFINICIJA I VRSTE
Vremenski niz je skup kronološki uređenih podataka o vrijednosti promatrane poja-ve. Prema načinu promatranja pojave u vremenu razlikuje se:
1. Intervalni niz – nastaje promatranjem pojave nad određenim vremenskim inter-valima (godina, kvartal, mjesec, dan i dr.), npr. godišnja proizvodnja, mjesečni broj prevezenih putnika, dnevni ostvareni promet, i dr. Podatke (frekvencije) in-tervalnog niza ima smisla zbrajati (svojstvo kumulativnosti). Primjerice, zbraja-njem dnevnog prometa neke trgovine dobije se tjedni promet, zbrajanjem tjednog mjesečni itd. Intervalni vremenski nizovi prikazuju se linijskim grafi konom ili površinskim grafi konom (obično su to stupci, koji su naslonjeni jedan na drugi, jer vrijeme teče kontinuirano). Kod linijskog grafi kona vrijednost pojave se nanosi na sredinu svakog promatranog razdoblja. Ako vremenska razdoblja nisu jedna-ka, potrebno je korigirati frekvencije, i to tako da se smanje frekvencije koje se odnose na veća vremenska razdoblja. Ako, na primjer, nakon godišnjih podataka o nekoj proizvodnji slijede mjesečni podaci, tada godišnje podatke radi usporedi-vosti treba podijeliti s 12.
2. Trenutačni niz – nastaje promatranjem pojave u određenom vremenskom tre-nutku (npr. stanje na tekućem računu, broj zaposlenih u poduzeću i dr.). Podatke (frekvencije) trenutačnog niza nema smisla zbrajati. Ako je na određeni dan u ne-kom poduzeću zaposleno 20 radnika i mjesec dana nakon toga u poduzeću se nije mijenjao broj zaposlenih te ih je i dalje 20, ne smijemo ih zbrajati jer bi to značilo da poduzeće ima 40 radnika. Trenutačni vremenski nizovi prikazuju se linijskim grafi konima.17
Grafi čkim prikazom vremenskih nizova postiže se jasnija i preglednija slika kretanja vrijednosti promatrane pojave kroz vrijeme. Slika grafi kona, kao i svi prikazi u stati-stici, mora biti jasna i potpuna. Radi lakšeg praćenja podataka poželjno je na grafi konu naznačiti mrežu. Dva ili više vremenskih nizova mogu se uspoređivati na istom grafi -konu ako su:
1. njihove vrijednosti izražene u istim mjernim jedinicama,2. njihove veličine nisu izrazito različite.
17 Napomena: vrijednosti trenutačnog niza se ne korigiraju jer pokazuju salda u navedenim vremenskim točkama
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
60
Primjer 6.1. Zaposleni u poduzeću „X“, razdoblje 2004. – 2008. (na dan 30.06. svake godine)
Godina Broj zaposlenih
2004.2005.2006.2007.2008.
1825403832
Izvor: podaci su simulirani
Zadatak je prikazati vremenski niz na odgovarajućem grafi konu.
Na linijskom grafi konu je prikazan zadani trenutačni vremenski niz. Na apscisi je označeno vrijeme u godinama, a na ordinati su vrijednosti pojave u originalnim jedi-nicama mjere. Vrijednosti pojave su označene na sredinu svake godine, jer je u tom trenutku za svaku godinu utvrđen broj zaposlenih.
Primjer 6.2. Izvoz i uvoz RH, siječanj – lipanj 2001., u mil USD
Mjesec I. II. III. IV. V. VI.Izvoz 321 375 397 344 388 409Uvoz 537 638 815 742 957 845
Izvor: SLJRH, str.349
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
61
6.2. METODE RELATIVNIH BROJEVA
Iako je moguće uspoređivanjem apsolutnih vrijednosti frekvencija utvrditi apsolut-ne promjene, odnosno razlike u vrijednostima nekog obilježja, na taj se način ipak ne mogu utvrditi proporcije prema cjelini ili nekoj vrijednosti. Takve se promjene i odnosi utvrđuju pomoću metoda relativnih brojeva.
Osnovna je prednost primjene metode relativnih brojeva u tome što je vrlo jedno-stavna i temelji se na osnovnim matematičkim operacijama. U statističkoj se analizi naj-češće primjenjuju: postotni brojevi, relativni brojevi koordinacije te indeksni brojevi.
6.2.1. Postotni brojeviPostotni brojevi se primjenjuju kada se želi usporediti udio određenog dijela u masi.
Pokazuju strukturu odnosno sastav statističkog skupa u stotim dijelovima cjeline i raču-naju se prema slijedećoj formuli:18
100:%: =cjelinadio
odakle je
cjelinadio 100% ⋅
=
18 Šimundić, S. i Boban, M. (2003) Zbirka zadataka iz statistike, Pravni fakultet Sveučilišta u Splitu, Split
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
62
Primjer 6.1. Na području Hrvatske živjelo je 1961. godine 4,160 milijuna stanovni-ka, a 1971. godine 4,426 milijuna stanovnika. Potrebno je izračunati koliki je postotak povećanja broja stanovnika u ovom 10- godišnjem razdoblju.
Apsolutno povećanje broja stanovnika u navedenom razdoblju bilo je:4426 – 4160 = 266
Navedeno apsolutno povećanje potrebno je izraziti relativno (u postotku).
%01,6
4426100266100% =⋅
=⋅=cjelina
dio
6.2.2. Relativni brojevi koordinacijeRelativni brojevi koordinacije pokazuju odnose frekvencija dvaju statističkih ni-
zova, grupiranih prema istom obilježju.
i
ii
BAR =
pri čemu je:
Ai – veličina pojave koja se uspoređuje,Bi – baza relativnog broja koordinacije (veličina s kojom se uspoređuje).
Relativni brojevi koordinacije dobiju se stavljanjem u omjer dviju koordinirajućih pojava, pri čemu je važno da dobiveni omjer ima logičnu interpretaciju. Na primjer, stavi li se u omjer broj stanovnika i veličina područja u km2 , dobije se broj stanovnika na km2.
Za relativne brojeve koordinacije često se određuje i aritmetička sredina, koja se računa kao vagana sredina u kojoj su ponderi veličine iz nazivnika relativnog broja koordinacije, ili njima proporcionalne veličine.
∑∑=
i
iii
BBR
R
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
63
Primjer 6.2. Koliko stanovnika u prosjeku dolazi na jednog liječnika u svim gradovima zajedno?
Gradovi Broj liječnikaBi
Broj stanovnika na
1 liječnikaRi
BiRi
A 1200 601,3 721560
B 2200 555,4 1221880
C 1500 720,2 1080300
D 2800 587,3 1644440
∑ 7700 - 4668180 Izvor: podaci su simulirani
26,606
77004668180
===∑∑
i
iii
BBR
R
U prosjeku na jednog liječnika dolazi 606 stanovnika.
6.2.3. Indeksni brojeviIndeksi vremenskog niza relativni su brojevi koji izražavaju odnos stanja jedne po-
jave (ili skupine pojava) u različitim razdobljima ili vremenskim točkama. Analiza sku-pne pojave izvodi se skupnim indeksima. Ako se indeksima prati razvoj jedne pojave u vremenu, tada je riječ o individualnim indeksima.
Individualni indeksi su: a) verižni (lančani) indeksi, b) indeksi na stalnoj bazi.
Skupni indeksi su: a) indeksi cijene, b) indeksi količine, c) indeksi vrijednosti.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
64
6.2.3.1. Verižni indeksiVerižni indeksi (lančani, indeksi s promjenjivom bazom) pokazuju relativne pro-
mjene pojave u tekućem razdoblju u odnosu na prethodno razdoblje. Verižni indeks razdoblja Vt dobije se tako da se vrijednost tog razdoblja (t) podijeli s vrijednosti pret-hodnog razdoblja (t-1), a zatim omjer pomnoži sa 100:
100
1⋅=
−t
tt
YYV
Omjer tekuće i prethodne vrijednosti vremenskog niza nepomnožen sa 100 naziva se koefi cijentom dinamike.
Oduzme li se od verižnog indeksa 100, razlika će upućivati na iznos relativne pro-mjene razine u uzastopnim razdobljima:
100−= tt VS
Primjer 6.3. Godišnji neto prihod (u mil kn) trgovine „X“ za razdoblje 2004.-2008. bio je:
Godina Neto prihod (u mil kn)
Verižni indeksiVt
2004.2005.2006.2007.2008.
3433313735
-97,0593,94119,3594,59
Izvor: podaci su simulirani
U primjeru 6.3. za dani vremenski niz (neto prihod u milijunima kn trgovine „X“ u razdoblju 2004. – 2008.) izračunati su verižni indeksi:
05,97100
3433100
2004
20052005 =⋅=⋅=
YYV
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
65
Dobiveni rezultat interpretira se na slijedeći način: neto prihod trgovine „X“ u 2005. godini se smanjio za 2,95% (97,05-100) u odnosu na 2004. godinu.
94,93100
3331100
2005
20062006 =⋅=⋅=
YYV
Neto prihod trgovine „X“ u 2006. godini se smanjio za 6,06% (93,94-100) u odnosu na 2005. godinu.
35,119100
3137100
2006
20072007 =⋅=⋅=
YYV itd.
Neto prihod trgovine „X“ u 2007. godini se povećao za 19,35% (119,35-100) u od-nosu na 2006. godinu.
Verižni indeksi grafi čki se prikazuju grafi konom jednostavnih stupaca ili, češće, spe-cifi čnim linijskim grafi konom tako da se ordinata podiže za svaku godinu s ishodištem u prethodnoj godini. Ako su indeksi veći od 100, ordinate će biti okrenute iznad baze 100, a ako su indeksi manji od 100, bit će okrenute ispod baze 100.
Grafi kon 6.1. Verižni indeksi neto prihoda trgovine „X“ za razdoblje 2004. – 2008.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
66
6.2.3.2. Indeksi na stalnoj baziIndeksi na stalnoj bazi (bazni indeksi) pokazuju relativne promjene u tekućem raz-
doblju u odnosu na neko odabrano bazno razdoblje. Dobijemo ih tako da svaki član vremenskog niza podijelimo s vrijednošću baznog razdoblja i pomnožimo sa 100.
100⋅=
b
tt
YYI
Za bazno razdoblje uzima se vrijeme u kojem pojava nije bila izložena neuobičaje-nim utjecajima. Krivim izborom baznog razdoblja mogu se dobiti pogrešne predodžbe o dinamici pojave.
Stopu promjene u tekućem razdoblju u odnosu na bazno razdoblje određuju se po-moću izraza:
100−= tt IS
Vratimo se primjeru 6.3. u kojem je dat godišnji neto prihod (u mil kn) trgovine „X“ za razdoblje 2004.-2008. Zadatak je izračunati indekse s bazom 2005. godinom.
Godina Neto prihod (u mil kn)
Bazni indeksi2005=100
2004.2005.2006.2007.2008.
3433313735
103,03100
93,94112,12106,06
Izvor: podaci su simulirani
Bazna godina u primjeru je 2005., te se sve vrijednosti dijele sa vrijednošću neto prihoda u 2005. godini, dakle sa 33:
03,103100
3334100
2005
20042004 =⋅=⋅=
YYI
itd.
Neto prihod trgovine „X“ u 2004. je bio veći za 3,03% (103,03-100) u odnosu na (baznu) 2005.godinu itd.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
67
Indeksi na stalnoj bazi upravno su proporcionalni originalnim vrijednostima niza. Zbog toga se grafi čki prikazuju kao i frekvencije originalnog vremenskog niza. Razlika se nalazi samo u mjerilu ordinate na kojemu je kod prikaza ovih indeksa uočljiva linija 100, a to znači da ovo mjerilo ne počinje od nule. Na ovakvom grafi konu indeksi se mjere od linije 100 naviše ili naniže.19
a) Preračunavanje baznih indeksa u bazne indekse na drugoj bazi
Indeksi na stalnoj bazi mogu se preračunati u indekse na drugoj bazi tako da se svaki indeks na staroj bazi podijeli s indeksom godine koja je uzeta kao nova baza. Dakle, s indeksima se ovdje postupa na isti način kao da se radi o originalnim vrijednostima.
Indekse na bazi 2005. iz primjera 6.3. preračunat ćemo u indekse na bazi 2006.
Godina Bazni indeksi2005=100
Bazni indeksi2006=100
2004.2005.2006.2007.2008.
103,03100
93,94112,12106,06
109,68106,45
100119,35112,90
Izvor: podaci su simulirani
100⋅=∗
b
tt
III
68,109100
94,9303,103100
2006
20042004 =⋅=⋅=∗
III
itd.
Za 2004. godinu vrijednost indeksa sada iznosi 109,68 što znači da je te godine neto prihod trgovine „X“ bio za 9,68% veći u odnosu na 2006.
19 Kero, K. i Bojanić-Glavica, B. (2003) Statistika u primjerima, FOI, Varaždin, str. 78.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
68
b) Preračunavanje verižnih indeksa u bazne indekse
U mnogim situacijama nastaje potreba da se niz verižnih indeksa preračuna u indek-se na stalnoj bazi. To preračunavanje nije moguće izravno izvesti na bilo koju stalnu bazu. Potrebno je niz verižnih indeksa postupnim množenjem preračunati u indekse stalne baze prvog vremenskog razdoblja.
1001 ⋅=↑ −
t
tt
VII
1001 tt
tVII ⋅−
=↓
Sada ćemo verižne indekse koje smo prethodno izračunali preračunati u indekse na bazi 2007. godina.
Godina Verižni indeksiVt
Bazni indeksi2007=100
2004.2005.2006.2007.2008.
-97,0593,94
119,35 ↓↑94,59
91,9189,2083,79100
94,59 Izvor: podaci su simulirani
79,83100
35,119100100
2007
20072006 =⋅=⋅=↑
VII
20,89100
94,9379,83100
2006
20062005 =⋅=⋅=↑
VII
91,91100
05,9720,89100
2005
20052004 =⋅=⋅=↑
VII
59,94100
59,94100100
200820072008 =
⋅==↓
⋅VII
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
69
c) Preračunavanje baznih indeksa u verižne indekse
S obzirom da je niz indeksa sa stalnom bazom upravno proporcionalan originalnom vremenskom nizu, s indeksima na stalnoj bazi dozvoljeno je računati kao sa originalnim frekvencijama. Stoga se za preračunavanje baznih indeksa u verižne koristi slijedeći izraz:
100
1⋅=
−t
tt
IIV
Iz tablice u kojoj su prikazani indeksi na bazi 2007. godina uzet ćemo vrijednosti indeksa za 2005. i 2006. godinu, te koristeći navedeni izraz izračunati verižni indeks za 2006.
94,93100
20,8979,83100
2005
20062006 =⋅=⋅=
IIV
Vrijednost verižnog indeksa za 2006. godinu je 93,94 što zaista i odgovara vrijedno-sti iz tablice.
d) Rekonstrukcija niza originalnih frekvencija pomoću indeksa i jedne originalne frekvencije
Pomoću niza indeksa, bilo baznih, bilo verižnih, te samo jedne originalne frekvenci-je iz razdoblja za koje su indeksi računati, moguće je rekonstruirati cijeli niz originalnih frekvencija. Dovoljno je npr. znati da je neto prihod trgovine „X“ 2005. godine iznosio 33 milijuna kuna. Pomoću indeksa možemo rekonstruirati neto prihod za svaku od po-jedinih godina.
Godina Verižni indeksiVt
2004.2005.2006.2007.2008.
-97,0593,94119,3594,59
Izvor: podaci su simulirani
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
70
332005 =Y
1001 ⋅=↑ −
t
tt
VYY
34100
05,9733100
2005
20052004 =⋅=⋅=
VYY
(neto prihod u 2004. godini)
1001 tt
tVYY ⋅−
=↓
31
10094,9333
10020062005
2006 =⋅
==⋅VYY
(neto prihod u 2006. godini)
Na sličan način mogu se koristiti indeksi na stalnoj bazi. Za ilustraciju ćemo uzeti indekse na bazi 2007. godina i podatak da je u 2005. vrijednost neto prihoda trgovine „X“ bila 33 milijuna kuna.
Godina Bazni indeksi2007=100
2004.2005.2006.2007.2008.
91,9189,2083,79100
94,59 Izvor: podaci su simulirani
332005 =Y
37
20,8910033100100
2005
2005=
⋅==
⋅=
⋅⋅
IY
IYY
t
tb
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
71
Izračunali smo da vrijednost originalne frekvencije bazne godine (2007.) iznosi 37. Ostale frekvencije se dobiju na slijedeći način:
100100 t
btb
tt
IYYYYI ⋅=⇒⋅=
34
10091,9137
1002004
2004 =⋅== ⋅IYI b
31
10079,8337
1002006
2006 =⋅== ⋅IYI b
itd.
6.2.3.3. Skupni indeksiSkupnim indeksima se mjere relativne promjene skupine pojava. Skupni se indeksi
računaju kao vagani prosjeci individualnih indeksa. Pri izračunavanju se u odnos stav-ljaju rezultati umnoška cijena i količina. Čitaju se na način da se od svakog indeksa odbije 100 te se tako dobivena razlika interpretira kao vrijednost koja pokazuje za ko-liko je postotaka vrijednost, količina ili cijena izvještajnog razdoblja veća ili manja od baznog razdoblja.
Najčešće se računaju tri vrste skupnih indeksa: skupni indeksi cijena, skupni in-deksi količina i skupni indeksi vrijednosti. Ovisno o načinu ponderiranja razlikuju se Laspeyresove i Paasheove (čitaj: Lasperove i Pašeove) skupni indeksi.
a) Laspeyresov skupni indeks količina
Kod Laspeyresovog skupnog indeksa količina cijene su fi ksirane na nivou baznog razdoblja tj. ponderi su iz nultog (baznog) razdoblja.
100
1)(01 ⋅
⋅⋅
=∑∑
ioio
ioip
pqpq
Q o
Sa 0 su označene sve veličine baznog razdoblja, a s 1 veličine tekućeg ili izvještaj-nog razdoblja. Količine su označene sa q, a cijene sa p. Oznaka po u zagradi na lijevoj strani izraza upućuje na to da su za pondere korištene cijene nultog razdoblja.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
72
b) Paascheov skupni indeks količina
Kod Paascheovog skupnog indeksa količine cijene su fi ksirane na nivou izvještaj-nog razdoblja. Kao ponderi služe količine baznog po cijenama izvještajnog razdoblja.
100
1
11)(01 1 ⋅
⋅⋅
=∑∑
iio
iip
pqpq
Q
Da se radi o Paascheovu indesku upućuje i oznaka p1 u zagradi na lijevoj strani izraza.
Skupni indeks cijena prikazuje dinamiku cijena skupine pojava u tekućem izvještaj-nom razdoblju u odnosu na bazno razdoblje.
c) Laspeyresov skupni indeks cijena
Laspeyresov skupni indeks cijena izračunava se omjerom vrijednosti izvještajnog razdoblja i vrijednosti baznog razdoblja. Kao i kod svih ostalih Laspeyresovih indeksa ponderi su iz nultog (baznog) razdoblja.
100
1)(01 ⋅
⋅⋅
=∑∑
ioio
ioiq
qpqp
P o
d) Paascheov skupni indeks cijena
Kod računanja ovih indeksa kao ponderi se uzimaju količine izvještajnog razdoblja.
100
1
11)(01 1 ⋅
⋅⋅
=∑∑
iio
iiq
qpqp
P
Vrijednost je jednaka umnošku količine i cijene. Skupni indeks vrijednosti računa
se kao omjer vrijednosti tekućeg razdoblja i baznog razdoblja, pomnožen sa 100 (jer se radi o indeksnim brojevima).
100
0
1101 ⋅
⋅⋅
=∑∑
iio
ii
qpqp
V
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
73
Primjer 6.4. Dane su vrijednosti cijena i količina određenih proizvoda u 2007. i 2008. godini.
proizvodcijena količina
2007.po
2008.p1
2007.qo
2008.q1
ABCD
1200130015001000
100010501250850
154140138120
150130120100
a) Izračunajmo skupne indekse cijena s obzirom na količine iz baznog razdoblja.
p1q0 p0qo p1q1 p0q1
154000147000172500102000
184800182000207000120000
15000013650015000085000
180000169000180000100000
575500 693800 521500 629000
95,82100
693800575500100
1)(01 =⋅=⋅
⋅⋅
=∑∑
ioio
ioiq
qpqp
P o
Laspeyresov skupni indeks cijena iznosi 82,95 što znači da su se cijene svih proizvo-da zajedno smanjile za 17,05% u 2008. u odnosu na 2007., računajući uz neizmijenjene količine iz 2007. godine.
b) Izračunajmo skupne indekse cijena s obzirom na količine iz tekućeg razdoblja.
91,82100
629000521500100
1
11)(01 1 =⋅=⋅
⋅⋅
=∑∑
iio
iiq
qpqp
P
Paascheov skupni indeks cijena iznosi 82,91 što znači da su se cijene svih proizvoda
zajedno smanjile za 17,09% u 2008. u odnosu na 2007., računajući uz neizmijenjene količine iz 2008. godine.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
74
c) Izračunajmo skupni indeks količina s obzirom na cijene iz tekućeg razdoblja.
62,90100
575500521500100
1
11)(01 1 =⋅=⋅
⋅⋅
=∑∑
iio
iip
pqpq
Q
Paascheov skupni indeks količina iznosi 90,62 što znači da su se količine svih vrsta proizvoda zajedno smanjile u 2008. u odnosu na 2007. za 9,38%, računajući uz neizmi-jenjene cijene iz 2008.
d) Izračunajmo skupni indeks količina s obzirom na cijene iz baznog razdoblja.
66,90100
693800629000100
1)(01 =⋅=⋅
⋅⋅
=∑∑
ioio
ioip
pqpq
Q o
Laspeyresov skupni indeks količina iznosi 90,66 što znači da su se količine svih vrsta proizvoda zajedno smanjile za 9,34% u 2008. u odnosu na 2007., računajući uz neizmijenjene cijene iz 2007.
e) Izračunajmo skupni indeks vrijednosti.
17,75100
693800521500100
0
1101 =⋅=⋅
⋅⋅
=∑∑
iio
ii
qpqp
V
Skupni indeks vrijednosti iznosi 75,17 što znači da je vrijednost svih vrsta proizvoda zajedno pala za 24,83% u 2008. u odnosu na 2007. godinu.
Skupni se indeksi uspješno koriste i kod izračunavanja indeksa troškova života, in-deksa cijena na veliko i na malo, kod postupka defl acioniranja itd. Pojave se vrijedno-sno prate pomoću cijena tekućeg razdoblja. Takve vrijednosti nazivaju se nominalnim vrijednostima. Cijene tijekom vremena često nisu postojane te je prosudba stvarnog razvoja pojave u vremenu nemoguća na osnovi vrijednosti koje su izražene u tekućim cijenama. Zbog toga, da bi se uočila stvarna dinamika, treba odstraniti utjecaj promjena cijena na vrijednost pojave. Taj se postupak u statistici zove defl acioniranje. Postu-pak defl acioniranja provodi se diobom nominalnih vrijednosti pojave odgovarajućim indeksom cijena koji nije pomnožen sa 100. U ovom postupku indeks cijena se naziva defl acijskim indeksom ili defl atorom.20
20 Kero, Z. i Bijanić-Glavica, B. (2003) Statistika u primjerima, FOI, Varaždin, str. 83.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
75
Primjer 6.5. Dana je vrijednost BDP-a RH, te indeksi cijena u tablici koja slijedi:
Godina Vrijednost BDP-a (u mil kn)
Verižni indeksi cijena
1987.1988.1989.1990.1991.1992.
2.78.3
109.4487.0755.05521.0
-300.11300.1709.5223.0765.5
Izvor. SLJRH-93, str.121 i 140.
Izračunajmo vrijednost BDP-a po godinama u stalnim cijenama iz 1987.
Da bi izračunali tražene vrijednosti BDP-a moramo eliminirati utjecaj infl acije na nominalne iznose. Provest ćemo postupak defl acioniranja prilikom kojeg indeksi cijena moraju biti na stalnoj bazi.
Najprije ćemo preračunati verižne indekse cijena u indekse na stalnoj bazi iz 1987. godine.
1001 tt
tVII ⋅−
=↓
1,300
1001,300100
10019881987
1988 =⋅
==↓⋅VII
itd.
Dijeljenjem vrijednosti BDP-a u tekućim cijenama s indeksima cijena na stalnoj bazi iz 1987. dobit ćemo vrijednost BDP-a u stalnim cijenama iz 1987. godine.
7.2100
1007.2
1987 =⋅=BDP
766.2100
1.3003.8
1988 =⋅=BDP itd.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
76
Godina Vrijednost BDP-a (u mil kn)
Verižni indeksi cijena
Indeksi cijena 1987=100
Vrijednost BDP-au cijenama iz 1987.
1987.1988.1989.1990.1991.1992.
2.78.3
109.4487.0755.05521.0
-300.11300.1709.5223.0765.5
100.00300.103901.3027679.7261725.78472510.87
2.7002.7662.8041.7591.2231.168
Od posebne važnosti je skupni indeks troškova života kao poseban oblik skupnog indeksa cijena. Njegovo kretanje odražava kretanje životnog standarda stanovništva. Pri njegovu se izračunu prate promjene cijena samo artikala i usluga potrebnih za svakod-nevan život. Služi za izračunavanje realnih plaća i indeksa realnih plaća. Realne plaće dobiju se tako da se nominalne plaće podijele s indeksima troškova života, te rezultat pomnoži sa 100.
Poseban oblik skupnog indeksa količina je skupni indeks fi zičkog obujma. Vrijed-nosti u tekućim cijenama dijele se s indeksom cijena (rezultat se množi sa 100, jer se radi o indeksnim brojevima) te se na taj način provodi postupak defl acioniranja kako bi se odstranio utjecaj cijena i dobila vrijednost u stalnim cijenama.
6.3. SREDNJE VRIJEDNOSTI VREMENSKIH NIZOVA
Najčešće srednje vrijednosti vremenskih nizova su aritmetička sredina, kronološka sredina i geometrijska sredina kao statičke vrijednosti, te trend kao dinamična vrijed-nost. Trend će detaljnije biti objašnjen u 7. poglavlju.
Izbor srednje vrijednosti vremenskog niza ovisi o tome radi li se o intervalnom ili trenutačnom nizu, te radi li se o stacionarnoj ili dinamičnoj pojavi. Kada je riječ o staci-onarnoj pojavi može se izračunati:
a) aritmetička sredina intervalnog vremenskog niza – zbroje se sve frekvencije niza i dobivena suma podijeli s brojem vremenskih grupa,
b) kronološka sredina trenutačnog vremenskog niza – svaka se frekvencija množi s vremenskim ponderom, tj. dužinom razdoblja za koje se pretpostavlja da ima frekvenciju na razini koju pokazuje pojava u defi niranom trenutku vremena21
c) geometrijsku sredinu za trenutačni i intervalni niz – naročito je značajan izračun geometrijske sredine metodom verižnih indeksa, i to pomoću izraza:
21 Primjer izračuna kronološke sredine vidjeti na stranici 26.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
77
NVt
G ∑=log
Prosječnu stopu rasta ili pada promatrane pojave možemo odrediti na način da ge-ometrijsku sredinu računamo u obliku prosječnog verižnog indeksa:
1 32 ...− ⋅⋅⋅= n nVVVG ili
1
1−= n
n
yyG
Ako se geometrijska sredina računa pomoću navedenih izraza, prosječna stopa promjene iznosi:
100)1( ⋅−= Gs
Navedene srednje vrijednosti moraju biti reprezentativne što znači da na najbolji mogući način moraju odražavati stanja u kojima se nalazi pojava promatrana u vre-menu. Reprezentativnost pojedine srednje vrijednosti prosuđuje se pomoću varijance, standardne devijacije i koefi cijenta varijacije.
Pitanja:
1. Što je vremenski niz i kako nastaje? Nabrojite vrste vremenskih nizova.2. Kojom vrstom grafi kona se prikazuju vremenski nizovi?3. Kada se računaju relativni brojevi koordinacije i kakav odnos pokazuju?4. Kako se izračunavaju bazni indeksi i kako se grafi čki prikazuju? Što sve može
biti baza prilikom izračuna baznih indeksa?5. Kako se računaju i kako se grafi čki prikazuju verižni indeksi? Što služi kao baza
za izračunavanje verižnih indeksa?6. Kako se niz lančanih indeksa preračunava u niz indeksa na stalnu bazu? 7. Što su skupni indeksi?
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
78
7. TREND
Pojave promatrane u vremenu najčešće pokazuju određeno kretanje ili dinamiku. Često želimo na prigodan način izraziti dugoročnu tendenciju razvoja tih pojava u vre-menu, a to možemo pomoću trenda.
Trend je dinamička srednja vrijednost koja se izražava matematičkom funkcijom i pokazuje tendenciju promjena neke pojave u zavisnosti od vremena. Prema obliku funkcije razlikujemo:
1. Linearni trend2. Parabolički trend3. Eksponencijalni trend4. Logaritamski trend.
7.1. LINEARNI TREND
Kada pojava pokazuje u istim vremenskim razdobljima približno istu apsolutnu pro-mjenu (prirast ili pad) kaže se da je njezino kretanje približno linearno i da se može izraziti linearnom funkcijom:
bxay +=
gdje je: y – trend vrijednosti ili zavisna varijabla, a – vrijednost trenda u ishodištu, b – apsolutni prirast ili pad pojave, x – vremenska jedinica ili nezavisna varijabla.
Parametri a i b izračunavaju se prema formulama:
∑∑∑ ∑
−
−=
xxx
yxxyb 2 xbya −=
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
79
7.1.1. Ishodište na početku vremenskog razdoblja Primjer 7.1. Vrijednost prometa (u milijunima kn) trgovine „X“ za razdoblje 2004. –
2008.
Godina Promet (u mil kn)y
2004.2005.2006.2007.2008.
6778889397
423 Izvor: podaci su simulirani
Želimo odrediti jednadžbu odgovarajućeg trenda za prikazano razdoblje sa ishodi-štem na početku vremenskog razdoblja. Vremenska nul - točka će biti na početku niza (u 2004.).
Godina Promet (u mil kn)y
Varijabla vrijemex xy x2
2004.2005.2006.2007.2008.
6778889397
01234
078176279388
014916
423 10 921 30
2
510
=== ∑N
xX 6,84
5423
=== ∑N
yy
5,7
102304232921
2 =⋅−⋅−
=−
−=
∑∑∑ ∑
xxx
yxxyb
6,6925,76,84 =⋅−=−= xbya
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
80
Uz jednadžbu trenda navode se slijedeće oznake: vrijeme za početnu vrijednost vari-jable x, jedinica mjere vremena, te jedinica mjere vrijednosti članova niza:
y = 69,6+7,5xx = 0, 2004. godinejedinica za x = 1 godinajedinica za y = milijun kn
Parametar b predstavlja prosječnu promjenu pojave u promatranom razdoblju za je-dinični porast varijable vrijeme. To znači da je promet trgovine „X“ u promatranom razdoblju prosječno na godinu rastao za 7,5 milijuna kn. Parametar a je konstantan član i tumači se kao vrijednost trenda za godinu u kojoj je x=0. 69,6 je vrijednost trenda prometa trgovine za 2004. godinu.
Pomoću jednadžbe trenda s procijenjenim parametrima i vrijednosti varijable vrije-me izračunavaju se vrijednosti trenda. Vrijednosti trenda procjene su razine pojave pre-ma trendu. Rezidualna odstupanja su razlike vrijednosti vremenskog niza i vrijednosti trenda te upućuju na disperziju oko trenda kao srednje vrijednosti.
Prva je vrijednost trenda jednaka:
6,6905,76,695,76,69 =⋅+=+= xy
Stvarna vrijednost prometa trgovine „X“ za tu godinu je 67 (mil kn), a razliku čini rezidualno odstupanje koje iznosi (69,6 – 67) 2,6 milijuna kuna.
Vrijednost trenda za 2005. godinu je:
1,7715,76,695,76,69 =⋅+=+= xy te je rezidualno odstupanje za tu godinu 0,9 milijuna kuna itd.
Pomoću jednadžbe trenda s procijenjenim parametrima možemo određivati progno-stičke vrijednosti prometa trgovine za buduća razdoblja. Ako se kretanje vrijednosti prometa nastavi po linearnom trendu čija jednadžba glasi y = 69,6 + 7,5 x onda 2013. možemo očekivati da će vrijednost trgovine „X“ biti slijedeća:
1,13795,76,69 =⋅+=y
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
81
Za 2013. godinu vrijednost varijable x je 9, pa smo tu vrijednost uvrstili u jednadžbu trenda i dobili prognostičku vrijednost prometa za navedenu godinu.
U mnogim statističkim istraživanjima javlja se potreba da se godišnja jednadžba trenda preračuna u mjesečnu. Što su kraća vremenska razdoblja za koja su podaci pri-kupljeni, izračunavanje trenda je duže jer ga je potrebno računati s puno više podataka. Zato je uobičajeno izračunati trend na bazi godišnjih podataka, a zatim ga preračunati u mjesečni. Pri tom treba voditi računa da se preračunavanje parametara s godišnjih vrijednosti na mjesečne razlikuje ovisno o tome da li je niz intervalni ili trenutačni. Godišnja jednadžba trenutačnog vremenskog niza pretvara se u mjesečnu jednadžbu trenda na slijedeći način:
xbay
12+=
S obzirom da su podaci trenutačnog vremenskog niza nastali sagledavanjem razine pojave u trenutku, parametar a ostaje isti u bilo kojoj jednadžbi linearnog trenda koja ima isto ishodište. Parametar b predstavlja godišnju apsolutnu promjenu pojave pa će se njegovim dijeljenjem sa 12 dobiti mjesečna apsolutna promjena.
Kod intervalnog vremenskog niza podaci se odnose na čitavo analizirano vremensko razdoblje. Ako se parametar a podijeli sa 12, kvocijent će predstavljati vrijednost trenda koja se odnosi na mjesec dana. Kada se parametar b podijeli sa 12, dobije se prosječna mjesečna vrijednost godišnje promjene. Kako bi se izračunala prosječna mjesečna vri-jednost mjesečne promjene, potrebno je parametar b još jednom podijeliti sa 12. Dakle, godišnju jednadžbu trenda intervalnog vremenskog niza pretvaramo u mjesečnu jed-nadžbu trenda pomoću slijedećeg izraza:
xbay
14412+=
U primjeru 7.1. radi se o intervalnom nizu čije su frekvencije nastale zbrajanjem tokom promatranog razdoblja. Godišnju jednadžbu trenda prevesti ćemo u mjesečnu:
xy 5,76,69 +=
xxy 052,08,5
1445,7
126,69
+=+=
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
82
y = 5,8+0,052xx = 0, 2004. godinejedinica za x = 1 mjesecjedinica za y = milijun kn
Promet trgovine „X“ u promatranom razdoblju prosječno se mjesečno povećavao za 0,052 milijuna kn.
Grafi čki ćemo prikazati linearni trend s ocijenjenim parametrima usporedno s origi-nalnim podacima.
Grafi kon 7.1. Prikaz linearnog trenda
Vidljivo je da promatrani vremenski niz ima tendenciju rasta, tj da se vrijednost pro-meta trgovine povećava i da postoji približna linearna kovarijacija vrijednosti prometa trgovine s vremenom.
7.1.2. Ishodište u sredini vremenskog razdoblja (neparan broj godina)Trend je moguće računati i na način da vremenska nul-točka bude u sredini niza. U
tom će slučaju aritmetička sredina varijable x (vrijeme) biti jednaka nuli, pa je računanje parametara a i b pojednostavljeno reduciranim izrazima:
∑∑= 2x
xyb
i
ya =
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
83
Vratit ćemo se primjeru 7.1. i odrediti jednadžbu linearnog trenda za razdoblje od 2004.-2008., ali sa ishodištem u sredini razdoblja. Vremenska nul-točka biti će u sredini niza (u 2006. godini).
Godina Promet (u mil kn)y
Varijabla vrijemex xy x2
2004.2005.2006.2007.2008.
6778889397
-2-1012
-134-78093194
41014
423 0 75 10 Izvor: podaci su simulirani
5,7
1075
2 ===∑∑
x
xyb 6,84
5423
=== ∑N
yy
6,84== ya
y = 84,6+7,5xx = 0, 2006. godinejedinica za x = 1 godinajedinica za y = milijun kn
Promet trgovine „X“ povećavao se prosječno godišnje za 7,5 milijuna kuna.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
84
7.1.3. Ishodište u sredini vremenskog razdoblja (paran broj godina)Još jedna varijanta računanja jednadžbe linearnog trenda je s ishodištem u sredini
vremenskog razdoblja kada je duljina serije n paran broj. Sada ćemo odrediti jednadžbu linearnog trenda za razdoblje od 2005.- 2008. Promatrano razdoblje ima neparan broj godina.
Godina Promet (u mil kn)y
Varijabla vrijemex xy x2
2005.2006.2007.2008.
78889397
-2-112
-156-8893194
4114
356 0 43 10 Izvor: podaci su simulirani
3,4
1043
2 ===∑∑
x
xyb 89
4356
=== ∑N
yy
89== ya
y = 89+4,3xx = 0, 2006. godinejedinica za x = 1 godinajedinica za y = milijun kn
Promet trgovine „X“ povećavao se prosječno godišnje za 4,3 milijuna kuna.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
85
7.2. PARABOLIČKI TREND
Parabolički trend se primjenjuje kada pojava koja se promatra u određenom vre-menskom razdoblju ne pokazuje približno iste apsolutne promjene. Grafi čki prikaz podataka za takav jedan vremenski niz pokazuje krivu liniju. Funkcija paraboličkog trenda glasi:
y = a + bx + cx2
Nepoznati parametri procjenjuju se metodom najmanjih kvadrata. S obzirom na broj računskih radnji, u izračunu se rabe suvremena računala koja pojednostavljuju i ubrza-vaju izračunavanje parametara, uz pretpostavku uporabe dobrih statističkih paketa.
Grafi kon 7.2. Prikaz paraboličnog trenda drugog stupnja
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
86
7.3. EKSPONENCIJALNI TREND
Eksponencijalni trend primjenjuje se ako statistička pojava pokazuje izrazito dina-mičan porast ili pad vrijednosti u vremenskom nizu. Opći oblik funkcije eksponencijal-nog trenda glasi:
y = a ∙ bx
Grafi kon 7.3. Prikaz jednostavnog eksponencijalnog trenda
Logaritamskom transformacijom model eksponencijalnog trenda svodi se na model linearnog trenda. U lineariziranom se modelu umjesto originalnih vrijednosti rabe nji-hovi logaritmi:
bxay logloglog +=
∑ ∑∑ ∑
⋅−
−=
xxx
yxyxb 2
)(log)(loglog
xb
Ny
a loglog
log −= ∑
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
87
7.4. LOGARITAMSKI TREND
Logaritamski trend se primjenjuje kada su odstupanja od izračunate linije trenda prevelika odnosno izvan zadovoljavajućih granica. Funkcija logaritamskog trenda glasi:
ye = a∙xb
gdje je: a – vrijednost trenda u ishodištu, b – parametar prirasta / pada pojave x – vremenska jedinica.
Linearizirani oblik funkcije trenda je:
xbay logloglog ⋅+=
Pitanja:
1. Što je trend? Kako glasi jednadžba linearnog trenda?2. Što znače parametri a i b u jednadžbi linearnog trenda?3. Kada će se u analizi vremenskih nizova upotrijebiti linearni trend, a kada eksponencijalni trend?
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
88
8. KORELACIJA I REGRESIJA
8.1. KORELACIJSKA ANALIZA
Korelacija je povezanost ili uzajamni odnos između dviju ili više masovnih pojava. Korelacijska analiza predstavlja skupinu statističkih metoda kojima se koristimo kada želimo utvrdili što utječe na pojave, na koji način i u kojoj mjeri. Njome utvrđujemo:
- postojanje veze među pojavama (koefi cijent korelacije),- jačinu i smjer veze među pojavama (koefi cijent korelacije i njegov predznak),- za koliko će se vrijednost jedne pojave promijeniti ako se druga promijeni za jednu
jedinicu (parametar b) itd.
8.1.1. Dijagram rasipanjaDijagram rasipanja je grafi čki prikaz odnosa dviju pojava. Omogućava nam da već
samim pogledom procijenimo da li postoji veza između dviju varijabli. Na dijagramu se vrlo lako uočava kojeg je smjera veza između pojava. Veza može biti pozitivna, nega-tivna, potpuna ili uopće ne mora postojati.
Pozitivna korelacija je prisutna kada rast jedne varijable prati rast druge varijable, odnosno pad jedne varijable prati pad druge. Negativna korelacija znači da rast jedne varijable prati pad druge varijable.
Kod potpune ili perfektne korelacije vrijednost jedne varijable može se s potpunom sigurnošću odrediti pomoću vrijednosti druge varijable.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
89
Kada veza među pojavama ne postoji imamo odsustvo korelacije.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
90
8.1.2. Koefi cijent linearne korelacijeMatematički pokazatelj kovarijacije je koefi cijent linearne korelacije (r). Engle-
ski matematičar Karl Pearson razradio je računski postupak za izračunavanje stupnja povezanosti između promatranih pojava. Vrijednost Pearsonovog koefi cijenta određuje jakost veze između pojava, a njegov predznak određuje smjer. Kreće se u intervalu od -1 do 1. Kada je vrijednost koefi cijenta jednaka 0 onda ne postoji korelacija između po-java. Što je vrijednost bliža 1 ili -1, linearna povezanost promatranih pojava je sve jača. Negativna vrijednost ukazuje da rast jedne pojave uzrokuje smanjenje druge, i obratno. Kada je koefi cijent pozitivan pojave istovremeno rastu ili padaju.
Prikaz 8.1. Smjer i jakost koefi cijenta linearne korelacije
Koefi cijent linearne korelacije računa se pomoću formule:
yx
N
iii
N
yxNyxr
σσ ⋅⋅
⋅⋅−⋅=∑=1
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
91
8.2. REGRESIJSKA ANALIZA
Regresijska analiza uključuje ispitivanje međusobne ovisnosti jedne pojave o dru-goj ili više njih. Regresijskoj je dakle analizi svrha istražiti povezanost među pojavama, zbog čega se regresijska i korelacijska analiza često upotrebljavaju kao sinonimi. Po-stoji ipak stanovita razlika, uglavnom u pristupu. U korelacijskoj je analizi naglasak na mjerenju stupnja povezanosti između varijabli, dok je u regresijskoj analizi naglasak na izražavanju veze prikladnim analitičkim izrazom, odnosno modelom. 22
8.2.1. Jednostavna linearna regresija Jednostavna linearna regresija predstavlja odnos između dviju pojava u kojem
promjenu jedne pojave prati približna linearna promjena druge. Linearnu regresiju ma-tematički možemo izraziti kao:
uxfY += )( gdje je: x – nezavisna varijabla y – zavisna varijabla u – greška relacije, varijabla koja izražava nepoznate i apstrahirane
utjecaje na varijaciju varijable y
Iz navedene formule izvodimo formule za jednadžbe dvaju pravaca koji predstavlja-ju pojave koje želimo usporediti:
bxaye += ybaxe ′+′=
Parametri jednadžbi ye i xe određuju se pomoću izraza:
∑∑∑ ∑
−
−=
xxx
yxxyb 2 xbya −=
∑∑∑ ∑
−
−=′
yyy
xyxyb 2 ybxa ′−=′
22 Gogala, Z. (2001) Osnove statistike, Sinergija, Zagreb, str. 145.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
92
U tom slučaju koefi cijent korelacije računa se kao geometrijsku sredinu parametara b i b’ prema formuli:
bbb ′⋅±=
Primjer 8.1. Raspolaže se godišnjim podacima o ostvarenom prometu (u milijunima kn) trgovačke radnje „Z“ za razdoblje 2002. – 2008. Na temelju računovodstvenih po-dataka utvrđen je i neto prihod po godinama za navedeno razdoblje. Podaci su dani u tabeli:
Godina Ostvaren promet(u mil kn)
Neto prihod(u mil kn)
2002. 65 30
2003. 72 33
2004. 70 31
2005. 75 34
2006. 82 40
2007. 84 41
2008. 76 39
Prvi i uobičajeni korak u analizi odnosa među dvjema pojavama sastoji se u crtanju dijagrama rasipanja. Cilj je pomoću njega utvrditi oblik veze između promatranih va-rijabli. Budući da se prikazuje odnos pojava, mjerilo na osima ne mora početi s nulom.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
93
Iz dijagrama rasipanja uočljivo je da s povećanjem prometa postoji tendencija pove-ćanja neto prihoda. Dijagram također pokazuje da se odnos ostvarenog prometa i neto prihoda može analitički izraziti modelom jednostavne linearne regresije.
Parametre u modelu procijenit ćemo metodom najmanjih kvadrata:
GodinaOstvaren promet
(u mil kn)x
Neto prihod(u mil kn)
y x2 y2 xy
2002. 65 30 4225 900 19502003. 72 33 5184 1089 23762004. 70 31 4900 961 21702005. 75 34 5625 1156 25502006. 82 40 6724 1600 32802007. 84 41 7056 1681 34442008. 76 35 5776 1225 2660
∑ 524 244 39490 8612 18430
86,74
7524
=== ∑N
xx 86,34
7244
=== ∑N
yy
62,052486,743949024486,7418430
2 =⋅−⋅−
=−
−=
∑∑∑ ∑
xxxyxxy
b
55,1186,7462,086,34 −=⋅−=−= xbya
Linearna je regresijska jednadžba, odnosno model s procjenama parametara:
xy 62,055,11 +−=
Konstantni član a=-11,55 je regresijska vrijednost neto prihoda ako je promet jednak nuli. To znači da kad trgovina „Z“ ne bi ostvarila nikakav promet, prema regresiji bi imala gubitak od 11,55 milijuna kuna. Regresijski koefi cijent b=0,62 pokazuje da ako se promet poveća za milijun kuna, regresijska vrijednost neto prihoda povećat će se za 0,62 milijuna kuna.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
94
Regresijske vrijednosti su vrijednosti regresijske funkcije s procijenjenim para-metrima. Izračunavaju se tako da se u regresijsku jednadžbu redom uvrštavaju stvarne vrijednosti nezavisne varijable. Prva je regresijska vrijednost:
75,286562,055,1162,055,111 =⋅+−=+−= xy
Prema regresiji, za ostvaren promet od 65 milijuna kuna očekivani neto prihod je 28,75 milijuna kuna, a stvarna zabilježena vrijednost je 30 milijuna kuna. Razliku čini rezidualno odstupanje.
Rezidualna odstupanja su procjene vrijednosti slučajne veličine u modelu regresi-je. Izračunavaju se tako da se od stvarne vrijednosti zavisne varijable y oduzme pripa-dajuća regresijska vrijednost. Prvo je rezidualno odstupanje:
25,175,28301 =−=u itd.
8.2.2. Regresijski polinomModel jednostavne linearne regresije koji je prezentiran u poglavlju 8.2.1. može se
primijeniti u ograničenom broju slučajeva, tj. samo u slučaju kada odgovarajuću pro-mjenu nezavisne varijable prati približno linearna promjena zavisne varijable. U real-nom životu nelinearne ovisnosti mnogo su češće. No, s nelinearnim ovisnostima između različitih pojava ili varijabli javljaju se i problemi u procesu njihovog objašnjavanja, a osobito pri pokušaju da se takve ovisnosti prezentiraju uz pomoć odgovarajućeg regre-sijskog modela.23 U slučaju da veza između varijabli x i y nije linearna, upotrebljava se regresijski polinom k-tog stupnja:24
Y=a0 + b1∙ x+b2 ∙ x2+....+bk ∙ x
k
Ocjena parametara uz pomoć odgovarajućih matrica (vektora):
b=(xTx)-1 (xTy)
23 Rozga, A. i Grčić, B. (2000) Poslovna statistika, Veleučilište u Splitu, Split, str. 141.
24 Šimundić, S. i Boban, M. (2003) Zbirka zadataka iz statistike, Pravni fakultet Sveučilišta u Splitu, Split, str. 64.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
95
Matrični izračun odgovarajućih suma kvadrata odstupanja:
SP=bT(xTy)
SR=yTy-bT(xTy)
ST= yTy-N∙y2
8.2.3. Jednostavna eksponencijalna regresijaModel jednostavne eksponencijalne regresije defi niran je na slijedeći način:
y=b0∙b1x
Da bi se za ocjenu parametara upotrijebila metoda najmanjih kvadrata, potrebno je početni logaritamski model logaritamskom transformacijom prevesti u logaritamsko – linearni oblik:
logy=log b0 + log b1∙x
Nadalje vrijedi da je:
2loglog
log 21xNx
yxNyxb
⋅−
⋅⋅−=
∑∑ xbyb ⋅−= 10 logloglog
gdje su:
Nx
x ∑=N
yy ∑= log
log
jednostavne aritmetičke sredine varijabli x i logy.
Transformacijom: b0=10log b0 i b1=10log b1
se dobiju originalne vrijednosti parametara modela.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
96
Parametar b0 je konstantan član, tj. Očekivana vrijednost zavisne varijable kada je nezavisna varijabla jednaka nuli. Parametar b1 interpretira se kao ocjena prosječne stope promjene varijable y, kada varijabla x poraste za jednu jedinicu.
Primjer 8.2. U tablici je dana vrijednost osnovnih sredstava(u 00 mil kn) i profi t (u mil kn) 7 poduzeća prehrambene industrije:
Osnovna sredstva (u 00 mil kuna)
x
Profi t(u mil kn)
y
3 3
3,5 6
3,8 10
4,5 19
5,0 31
5,2 52
5,8 55 Izvor: podaci su simulirani
Analizu odnosa osnovnih sredstava i profi ta ćemo započeti ucrtavanjem vrijednosti x i y u dijagram rasipanja.
Dijagram pokazuje da se odnos osnovnih sredstava i profi ta može analitički izraziti modelom jednostavne eksponencijalne regresije.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
97
Podaci potrebni za izračun koefi cijenata a0 i b1 prikazani su u slijedećoj tablici:
Osnovna sredstva (u 00 mil kuna)
x
Profi t(u mil kn)
ylog y x2 xi ∙logy
3 3 0,47712 9,00 1,43136
3,5 6 0,77815 12,25 2,72353
3,8 10 1,00000 14,44 3,80000
4,5 19 1,27875 20,25 5,75436
5,0 31 1,49136 25,00 7,45680
5,2 52 1,71600 27,04 8,92320
5,8 55 1,74036 33,64 10,0941
30,8 176 8,48174 141,62 40,18335
4,4
78,30=== ∑
Nx
x 21168,17
48174,8loglog === ∑
Ny
y
4695,0
36,19762,14121168,14,4718335,40
2loglog
log 21 =⋅−⋅⋅−
=⋅−
⋅⋅−=
∑∑
xNxyxNyx
b
85412,04,44695,021168,1log 0 −=⋅−=b
b0=10 -0,85412 = 0,13992
b1=100,4695 = 2,94781
y=b0∙b1x=0,13992 ∙ 0,94781x
Parametar b0=0,13992 predstavlja očekivanu razinu profi ta u slučaju da osnovna sredstva budu jednaka nuli. Parametar b1= 2,94781 predstavlja prosječnu stopu promje-ne profi ta, kada se osnovna sredstva povećaju za milijun kuna.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
98
8.2.4. Višestruka (multipla) linearna regresijaUkoliko pojava y ovisi o više neovisnih pojava x, postavlja se model višestruke
linearne regresije. Model multiple linearne regresije može se napisati kao:
y= a0 + b1 ∙x1 + b2 ∙x2 + ..... + bk ∙xk
Obrada modela višestruke linearne regresije ima istu zadaću kao i obrada kod jedno-stavne linearne regresije. Treba izračunati nepoznate parametre pri čemu se primjenjuje metoda najmanjih kvadrata.
b= (xTx)-1 (xTy)
Matrični izračun odgovarajućih suma kvadrata odstupanja:
SP =bT (xTy)
SR= yTy-bT (xTy)
ST= yTy-N∙y2
Pitanja:
1. Što je korelacija? Kakva može biti prema obliku, smjeru i jakosti?2. Što je dijagram rasipanja? Šta se iz njega može saznati?3. Kako se određuje koefi cijent korelacije i koje vrijednosti može zauzeti?4. Objasnite pojmove regresijska vrijednost i rezidualno odstupanje.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
99
9. VJEROJATNOST
Vjerojatnost je brojčana mjera nastupa neizvjesnih, odnosno slučajnih događa-ja. Slučajni događaji su oni događaji koji se mogu, ali ne moraju dogoditi. Postoje tri osnovne defi nicije vjerojatnosti: klasična (a priori), statistička ili empirijska (a poste-riori) i subjektivna.
9.1. OSNOVNI POJMOVI I DEFINICIJE VJEROJATNOSTI
Klasična defi nicija vjerojatnosti jednog događaja smatra se omjerom broja za njega povoljnih slučajeva, prema broju svih jednako mogućih slučajeva. Ona se u matematič-kom obliku zapisuje kao:
nmDP =)(
gdje je:
P(D) – vjerojatnost događaja D,m – broj povoljnih slučajeva,n – broj svih jednako mogućih slučajeva.
Vjerojatnost a posteriori ili empirijska vjerojatnost je granična vjerojatnost relativne frekvencije povoljnog ishoda događaja D, ako broj pokušaja raste u beskonačnost.
nmDP lim)( =
∞→n
Ako se sud o vjerojatnosti nastupa slučajnog događaja temelji na individualnoj pro-sudbi ili intuiciji riječ je o subjektivnoj vjerojatnosti. Naime, za neke događaje je ka-rakteristično da se ne može utvrditi vjerojatnost ni na temelju klasične niti na temelju statističke defi nicije vjerojatnosti (relativnom frekvencijom), pa se koristi subjektivna vjerojatnost.
Subjektivna vjerojatnost spada među psihološke, a ne statističke pojmove i stoga sa statističkom (ili matematičkom) vjerojatnosti nema mnogo zajedničkoga. Ljudi, na
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
100
primjer, u većini slučajeva vjeruju da će dobiti glavni zgoditak u igrama na sreću, ali praktički ne vjeruju da će im se dogoditi neka prometna nesreća, iako je vjerojatnost za nesreću, na žalost, puno veća nego vjerojatnost dobitka na lotu.25
Svojstva vjerojatnosti:
1. Vjerojatnost nastupa događaja D je nenegativan broj.2. Vjerojatnost nemogućeg događaja jednaka je 0, a vjerojatnost sigurnog događaja 1.
3. Vjerojatnost nenastupanja događaja D jednaka je:
)(1)( DPDP −=
4. Za događaje D1 i D2, vjerojatnost nastupa barem jednog od njih jednaka je:
)()()()( 212121 DDPDPDPDDP ∩−+=∪
5. Ako su D1 i D2 dva međusobno isključiva događaja, vjerojatnost da će nastupiti doga-đaj D1 ili D2 jednaka je zbroju njihovih vjerojatnosti:
)()()( 2121 DPDPDDP +=∪
6. Uvjetna vjerojatnost je vjerojatnost nastupa jednog elementarnog događaja uz uvjet nastanka drugog događaja. Vjerojatnost nastupa događaja D2 uz uvjet da je nastupio događaj D1 :
P(D2 | D1) =
)()(
1
12
DPDDP ∩
,P(D1) › 0
25 Petz, B. (1985) Osnove statističke metode za nematematičare, SNL, Zagreb, str. 29.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
101
7. Ako su dva događaja neovisna, tada vrijedi:
)()()( 2121 DPDPDDP ⋅=∩
To je vjerojatnost da će nastupiti i D1 i D2.
Primjer 9.1. Studenti VUŠ-a koji su položili ispit iz kolegija „Poslovna statistika“ prema postignutom uspjehu, ljetni ispitni rok, ak. god. 2009./10.
Ocjena Broj studenata2345
21118646
Izvor: vlastita evidencija
Kolika je vjerojatnost da ćemo slučajnim odabirom jednog studenta odabrati studenta koji: a) je na ispitu dobio ocjenu 3, b) nije dobio ocjenu 3, c) dobio ocjenu 2 ili 3, d) dobio ocjenu 2 i 3?
a) 11 studenata dobilo je na ispitu ocjenu 3 pa je broj povoljnih događaja m=11. Ukupno je ispit položilo 46 studenata, te je broj svih mogućih događaja n=46.
24,0
4611)3( ==P
b) Događaj „nije dobio ocjenu 3“ suprotan je događaju P(3), pa vrijedi:
76,024,01)3( =−=P
c) Događaji da student dobije ocjenu 2 ili ocjenu 3 su međusobno isključivi, jer ne mogu nastupiti istovremeno. Vjerojatnost da nastupi jedan ili drugi događaj jednaka je zbroju njihovih vjerojatnosti.
7,0
4611
4621)32( =+=∪P
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
102
d) Događaj „dobio ocjenu 2 i 3“ je nemoguć, pa je njegova vjerojatnost jednaka nuli.
9.2. SLUČAJNA VARIJABLA I TEORIJSKE DISTRIBUCIJE VJEROJATNOSTI
Slučajna varijabla je numerička funkcija koja svakom ishodu slučajnog pokusa pri-družuje realan broj. Ona je diskretna ako poprima konačan broj vrijednosti ili prebroji-vo mnogo njih. Kontinuirana slučajna varijabla poprima bilo koju vrijednost iz nekog intervala: npr. visina u centimetrima, cijena, tečaj promjene valute, debljina predmeta itd. Navedeni primjeri mogu poprimiti bilo koju vrijednost, a točnost mjerenja ovisi samo o mjernom instrumentu.
U dosadašnjim primjerima distribucije su bile formirane grupiranjem opažanja ili elemenata skupa prema nekom obilježju. Nasuprot takvim empirijskim distribucija-ma postoje teorijske distribucije koje se mogu očekivati u skladu s iskustvom ili na temelju nekih pretpostavki. Svaka teorijska distribucija ima svoj zakon vjerojatnosti po kojem su distibuirane vrijednosti slučajne varijable X. Osim funkcije vjerojatnosti te distribucije imaju očekivanje, varijancu, koefi cijent asimetrije i koefi cijent zaobljenosti. Zavisno od tipa distribucije dijelimo na diskretne i kontinuirane. Diskretne distribucije su: binomna, poissonova i hipergeometrijska, a kontinuirane normalna (gaussova), studentova ili t-distribucija i gama distribucija.
Najčešća distribucija s kojom se u životu susrećemo je normalna distribucija, u kojoj
Distribucijevjerojatnosti
Distribucije diskretne slučajne varijable
binomna normalna
Poissonova Studentova
hipergeometrijska gama
i druge i druge
Distribucije kontinuiraneslučajne varijable
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
103
nalazimo najviše srednjih, a najmanje ekstremno malih ili ekstremno velikih rezultata. No to ne mora uvijek biti tako, jer se mnoge pojave raspoređuju i na druge načine. Tako je, na primjer, poznato da se broj ozljeda na radu distribuira asimetrično: najveći broj ljudi ili se ne ozljedi, ili se ozljedi samo jednom na radu, a vrlo mali broj ljudi se na radu ozlijedi više puta.26
9.2.1. Binomna distribucijaBinomna ili Bernoullieva27 distribucija upotrebljava se u slučajevima kada je slu-
čajna varijabla prirodni broj i kada je vjerojatnost događaja konstantna. Primjerena je za upotrebu kada je broj jedinica uzorka relativno manji u odnosu na veliki broj jedinica osnovnog skupa.
Formula za izračunavanje vjerojatnosti pojavljivanja nekog ishoda kod binomne distri-bucije glasi:
( ) (1 )k n knP X k p p
k−⎛ ⎞
= = −⎜ ⎟⎝ ⎠ ,
nk ,...,2,1,0=
gdje je: p – vjerojatnost da će se nešto dogoditi, 1-p ili q – vjerojatnost da se to neće dogoditi, k – broj „pogodaka“ n – veličina uzorka
Formula podrazumijeva da su događaji: a) dihotomni (da padaju u samo dvije kategorije) b) međusobno isključivi, c) međusobno neovisni, d) izabrani na slučaj.
Najjednostavniji primjer Binomne distribucije je bacanje novčića. Nadalje, u pro-cesu proizvodnje proizvodi su označeni kao ispravni ili neispravni, tvrtka koja se bavi ugovorima će ili zaključiti ugovor ili neće, novi pristupnici ili prihvaćaju ponudu odre-đenog zaposlenja ili odbacuju itd.
26 Petz, B. (1985) Osnove statističke metode za nematematičare, SNL, Zagreb, str. 11.
27 James Bernouli (1654-1705) je formulirao ovu distribuciju 1690. u djelu “Ars Conjectandi” koja je objavljena osam godina nakon njegove smrti.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
104
Binomna distribucija ima veliku primjenu kod statističke kontrole kvalitete kada se proizvodi klasifi ciraju kao dobri i loši i kada se želi procijeniti interval npr. loših proi-zvoda u nekom skupu.28
Očekivanje slučajne varijable X distribuirane po binomnom zakonu distribucije je:
E ( X ) = n p
Varijanca i standardna devijacija slučajne varijable x distribuirane po Binomnom zako-nu distribucije je:
2( )V x n p q n p qσ σ= = ⋅ ⋅ ⇒ = ⋅ ⋅
Primjer 9.2. Automatski stroj izrađuje proizvod s konstantnim postotokom škarta od 3% (p=0.03). Ako se u uzorak izabere n=5 proizvoda, zadatak je odrediti vjerojatnost da su dva proizvoda neispravna.
008214.0)03,01(03.0
25
)2( )25(2 =−⋅⎟⎟⎠
⎞⎜⎜⎝
⎛= −P
To znači da ako bismo proizvode pakirali u kutije po 5 proizvoda, bez oprethodnog odvajanja dobrih od loših proizvoda, onda bi 0,8% kutija sadržavalo 2 neispravna pro-izvoda.
9.2.2. Poissonova distribucijaPoissonova29 distribucija je teorijska distribucija diskretne slučajne varijable X čiji
je analitički oblik zadan izrazom:
( )!
k mm eP X kk
−
= = , 0,1,2,...,k m=
gdje je m aritmetička sredina, a često se umjesto m koristi λ (lambda) i vrijedi da je m=np. Konstanta e je baza prirodnig logaritama i iznosi 2,718282 dok je sa k označena slučajna varijabla koja može zauzeti vrijednosti od 0 do n.
28 Kero, Z. i Bijanić-Glavica, B. (2003) Statistika u primjerima, FOI, Varaždin, str. 174.
29 Simeon Dennis Poisson (1781-1840) je otkrio i objavio ovu distribuciju u knjizi “Recherches sur la probabilité des jugements en matières criminelles et matière civile” 1838
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
105
Očekivana vrijednost, varijanca i standardna devijacija Poissonove distribucije dana je formulom:
( )E X m= ; 2( )V x mσ= = ; mσ =
O Poissonovoj distribuciji govori se u onim slučajevima kada je slučajna varijabla prirodan broj i vjerojatnost događaja konstantna i vrlo mala, a skup je beskonačno velik. Prikladna je za relativno rijetke događaje.
Tipična primjena Poissonove distribucije u statističkoj kontroli kvalitete je pri odre-đivanju modela pojavljivanja nedostataka (defekata) ili neusklađenosti po jedinici (npr. proizvoda, ili po smjeni, po stroju i sl.). U praksi vrijedi da se ova distribucija koristi kada je n≥50 i p≤0,10.
Poissonova distribucija je nesimetrična distribucija, a oblik joj ovisi samo o m. Uko-liko se m povećava, nesimetričnost distribucije se smmanjuje te ona teži normalnoj distibuciji.
Primjer 9.3. Osigurane osobe prijavljuju u prosjeku 0,4 šteta godišnje. Zadatak je odre-diti vjerojatnost da neki vlasnik police prijavi barem jednu štetu godišnje.
Rješenje: p (bar jedna šteta)= 1 – p (nema štete)
32968,067032,014,0!0
1 04,0
=−≈−=−e
9.2.3. Normalna distribucijaNormalna distribucija, naziva se još i Gaussova,30je najpoznatija teorijska distribu-
cija vjerojatnosti kontinuirane slučajne varijable. Ima široku primjenu u donošenju po-slovnih odluka. Za slučajnu varijablu X kažemo da je distribuirana po zakonu normalne distribucije ako je područje njenih vrijednosti ( ),−∞ +∞ . Formula za izračun funkcije gustoće vjerojatnosti normalne distribucije je:
2121( )
2
t
f t eμδ
δ π
−⎛ ⎞− ⎜ ⎟⎝ ⎠=
, t>0
30 Johan Carl Friedrich Gauss (1777-1855) , Disquisitiones generales circa superfi ces curva, 1828
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
106
gdje je μ srednja vrijednost, δ standardna devijacija, a t bilo koja vrijednost kontinu-irane varijable.
Grafi čki prikaz normalne distribucije je normalna krivulja koja je zvonasta oblika i simetrična, a očekivana vrijednost, mod i medijan poprimaju jednaku vrijednost.
Graf 9.1. Grafi čki prikaz normalne distribucije
Kada su rezultati pravilno, simetrično i „normalno” grupirani oko aritmetičke sre-
dine, onda se u intervalu koji obuhvaća σ1±x nalazi 68,26% svih rezultata. To znači da ako aritmetičkoj sredini na jednu i na drugu stranu „dodamo” vrijednost standardne devijacije, obuhvatit ćemo oko 68% rezultata. Nadalje vrijedi da je u intervalu koji obu-
hvaća σ3±x 95,44%, a σ3±x 99,73% rezultata.
Kako su parametri normalne distribucije izraženi u mjernim jedinicama varijable, usporedivost raznorodnih distribucija možemo osigurati jedino standardiziranjem. Bilo koja normalna distribucija može se prevesti u standardiziranu (jediničnu) normalnu dis-tribuciju Z sa sredinom jednakom 0 i varijancom jednakom 1. Potrebno je prevesti vri-jednost t u Z oduzimanjem aritmetičke sredine od vrijednosti varijable t i dijeljenjem te vrijednosti sa stanndardnom devijacijom prema formuli:
tz μδ−
=
Međutim, riječ je o istoj distribuciji samo što se mijenja mjerna skala. Možemo izraziti problem pomoću originalnih vrijednosti ili pomoću standardiziranih vrijednosti.
Primjer 9.4. Ako je t mormalno distribuirana slučajna varijabla sa aritmetičkom sredi-nom jednakom 100 i standardnom devijacijom 50, Z-vrijednost je:
2
50100200
=−
=Z
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
107
To znači da t=200 odstupa od sredine jednake 100 za dvije standardne devijacije.
Standardizirana normalna distribucija je tabelirana i sadrži vrijednosti normalnalne funkcije distribucije (površine ispod normalne krivulje). Pomoću tablice površina is-pod normalne krivulje očitava se vjerojatnost da će se vrijednost kontinuirane slučajne varijable naći u intervalu z1-z2. Tablica je konstruirana samo za desnu stranu standardi-zirane normalne krivulje pa su sve vrijednosti pozitivne. Za odgovarajuće negativne z vrijednosti površina je jednaka.
U predstupcu tablice površina ispod normalne krivulje se nalaze vrijednosti standar-
diziranog obilježja z izražene s brojevima s jednom decimalom. Druga decimala nazna-čena je u zaglavlju tabele. Te vrijednosti označuju udaljenost standardiziranog obilježja od aritmetičke sredine uzduž apscise.
Iz tablice je primjerice moguće očitati da se u pojasu od aritmetičke sredine skupa do jedne standardne devijacije nalazi 0,3413 jedinica, uz pretpostavku da se radi o nor-malno distribuiranim jedinicama.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
108
To znači da se u intervalu σ00,1±x nalazi (2∙34,13%) 68,26% svih jedinica skupa s obzirom na promatrano obilježje tih jedinica.
9.2.4. Studentova distribucijaStudentova31 distribucija naziva se još i t-distribucija, a svoju primjenu u statistici
ima kod procjene parametara osnovnog skupa i kod testiranja hipoteza na osnovu uzor-ka. Funkcija gustoće vjerojatnosti za t-razdiobu glasi:
( )2 2
1
1 11 , 12 2 1
nf tn tn B
n
=⎛ ⎞−⎛ ⎞− +⎜ ⎟⎜ ⎟−⎝ ⎠⎝ ⎠
gdje je 1 1,2 2
nB −⎛ ⎞⎜ ⎟⎝ ⎠
beta funkcija s parametrima 1 1,2 2
n −, a n je broj elemenata. Oblik
Studentove distribucije ovisi o veličini n. Veličina (n-1) predstavlja broj „stupnjeva slo-bode“ i označava se često malim grčkim slovom ν (ni). Za velike vrijednosti n (n>30) Studentova se distribucija približava standardiziranoj normalnoj. Za manje vrijednosti n (n<30) Studentova je distribucija više razvučena po apscisi od normalne utoliko više što je n manje. Studentova distribucija je simetrična.
9.2.5. Hi-kvadrat distribucijaTeorijska hi-kvadrat distribucija primjenjuje se kada treba donijeti odluku o signifi -
kantnosti razlika stvarnih (opaženih) i teorijskih (očekivanih) frekvencija. Defi nira se kao zbroj odnosa kvadrata razlika između opaženih i očekivanih vrijednosti prema oče-kivanim vrijednostima ili:
gdje je f0 empirijska ili opažena frekvencija, a ft teorijska ili očekivana frekvencija.
31 Otkrio ju je W.S.Gosset koji se koristio pseudonim student kad ju je publicirao
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
109
Hi-kvadrat test najčešće se upotrebljava kada se želi ispitati razina značajnosti ra-zlike između očekivane distribucije podataka i dobivenih podataka, i/ili između dviju ili više skupina nezavisnih kvalitativnih podataka.
Primjer 9.5 Želimo ispitati razliku prema spolu između studenata VUŠ-a koji su pola-gali ispit iz kolegija „Poslovna statistika“ u ljetnom i jesenskom ispitnom roku u aka-demskoj godini 2009./10. U ljetnom ispitnom roku od 120 studenata 70% su bile žene, a u jesenskom ispitnom roku od 140 studenata 40% su bili muškarci.
Prvi korak je izrada kontingencijske tablice:Ljetni ispitni rok Jesenski ispitni rok Ukupno
M 36 56 92Ž 84 84 168
Ukupno 120 140 260
Zatim je potrebno izračunati očekivane frekvencije ft prema formuli:
∑∑ ∑⋅=
ukupnostupcaretka
ft
te je: 42
26092120
1 ≈⋅
=ft ,
78260
1681202 ≈
⋅=ft
itd.
Tablica s očekivanim frekvencijama:Ljetni ispitni rok Jesenski ispitni rok Ukupno
M 42 50 92Ž 78 90 168
Ukupno 120 140 260
Treći korak u izradi hi-kvadrat testa je računanje hi-kvadrat vrijednosti:f0 ft f0-ft (f0-ft)
2 (f0-ft)2/ft
36 42 -6 36 0,8656 50 6 36 0,7284 78 6 36 0,4684 90 -6 36 0,40
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
110
pa empirijski hi-kvadrat ili test veličina iznosi 0,86+0,72+0,46+0,40=2,4.
Vrijednosti hi-kvadrat distribucije su tabelirane. Iz tablice granične vrijednosti hi-kva-drata iščitamo hi-kvadrat vrijednost za odabranu razinu značajnosti i odgovarajući broj stupnjeva slobode. Stupnjevi slobode (DF-eng. degree of freedom ili k) određuju se pomoću formule:
)1()1( −⋅−= srk
gdje je r broj redaka, a s broj stupaca. U našem primjeru je stoga 1)12()12( =−⋅−=k .
Iz tablice se vidi da granična vrijednost hi-kvadrata uz 1 stupanj slobode, a na razini signifi kantnosti od 5%, iznosi 3,841.
Ako je test veličina manja od granične vrijednosti hi-kvadrata prihvaćamo hipotezu H0 da ne postoji statistički značajna razlika u raspodjeli studenata muškog i ženskog spola između ljetnog i jesenskog ispitnog roka. Ako je test veličina veća od granične vrijed-nosti hi-kvadrata odbacuje se hipoteza H0 i prihvaća hipoteza H1 – da postoji značajna razlika u raspodjeli. Kako je u našem primjeru 2,4<3,842 prihvaćamo H0 i zaključujemo da nema statistički značajne razlike u raspodjeli.
Hi-kvadrat test može se računati samo sa frekvencijama. Prema tome, u tablicu ne smi-jemo unositi postotke. Hi-kvadrat kod 2∙2 tablica smije se upotrijebiti ako je N veći od 40. Kada je N manji od 40, ali veći od 20, dozvoljeno je računati hi-kvadrat samo ako niti jedna očekivana frekvencija nije manja od 5. Nadalje, hi-kvadrat se može računati ako je najviše 20% očekivanih frekvencija manje od 5 i sve očekivane frekvencije veće od 1. Ako taj uvjet nije zadovoljen, neke kategorije je potrebno spajati da bi se povećala očekivana frekvencija.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
111
Pitanja
1. Defi nirajte vjerojatnost a priori i vjerojatnost a posteriori.2. Što je subjektivna vjerojatnost?3. Kakvi su to međusobno isključivi događaji? Navedite primjer.4. Što je uvjetna vjerojatnost?5. Koje su karakteristike Poissonove distribucije?6. Objasnite tablicu normalne Gaussove distribucije.7. Koje su karakteristike hi kvadrat testa? Kada se ne smije primjeniti?
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
112
10. METODA UZORAKA
Pri različitim statističkim istraživanjima obrada prikupljenog materijala često zahti-jeva dugotrajno angažiranje opreme i osoblja, što može biti preskupo i može zahtije-vati previše vremena. Primjerice, kada bismo htjeli odrediti kolika je prosječna visina punoljetnih osoba u gradu Šibeniku, morali bismo stvarno pronaći svakog punoljetnog građanina grada Šibenika, što ne bi bilo niti lako niti jeftino. Isto tako, kada bismo htjeli testirati kvalitetu nekog prehrambenog proizvoda bilo bi besmisleno testirati sve koma-de iz serije, jer se testiranjem često proizvodi uništavaju. Zbog toga se često provodi reprezentativno ispitivanje kod kojeg se iz osnovnog skupa ili populacije na strogo određen način izabere samo dio elemenata koji se naziva uzorkom. Pomoću uzorka se procjenjuju karakteristike osnovnog skupa, a statističkom metodom određuje se po-uzdanost i preciznost te procjene. Svi ti postupci čine metodu koja se zove metoda uzoraka.
Uzorak je slučajan (eng. random sample) kada svaki element osnovnog skupa ima jednaku šansu da bude izabran. Pri tom nije riječ o „bilo kako izabranom“ slučajnom uzorku već se on sastavlja prema određenim principima koji odgovaraju zakonu sluča-ja. Jednom izabrana jedinica uzorka pri ponovnom izboru se može vraćati u osnovni skup, ali i ne mora. Stoga postoji jednostavni slučajni izbor uzorka bez ponavljanja i s ponavljanjem. Najčešće korištena metoda za odabir slučajnog uzorka je odabir uzorka pomoću tablice slučajnih brojeva. Danas se za odabir slučajnog uzorka pretežno koristi računalo.
Slučajan izbor je moguć i primjenom sistematskog izbora jedinica u uzorak kada se odabir jedinki promatranja odvija po nekom sistemu (npr. svaki peti vlasnik telefonskog broja prema telefonskom imeniku). Sistematski uzorak se rabi u metodi promatranja, telefonskom ispitivanju itd. Osim slučajnog i sistematskog uzorka, postoji i tzv. stratifi -cirani uzorak koji se uzima iz karakterističnih dijelova (stratuma) osnovnog skupa koji ga sačinjavaju. Drugim riječima, populacija se podijeli u „potpopulacije“ prema pro-stornim, demografskim, sociološkim ili nekim drugim karakteristikama, te se iz svake od grupa uzima slučajni uzorak.
Da bi se pomoću uzorka mogle procijeniti karakteristike osnovnog skupa, važno je da uzorak bude reprezentativan (da dobro opisuje populaciju). Na reprezentativnost uzorka utječu njegova apsolutna veličina, varijabilnost obilježja i metoda uzorkovanja. Što veću preciznost želimo, i što je pojava koju ispitujemo varijabilnija, to nam je veći uzorak potreban.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
113
10.1. PROCJENA ARITMETIČKE SREDINE OSNOVNOG SKUPA
Pretpostavimo da želimo saznati kolika su prosječna primanja svih građana grada Šibenika koji su u radnom odnosu. Do ovog podatka možemo doći na način da izraču-namo prosječna primanja na reprezentativnom uzorku i zaključimo da su ona istovjetna prosječnim primanjima svih građana grada Šibenika. U ovom slučaju aritmetička sre-dina populacije (μ) je procijenjena brojem. No procjenu je moguće izvršiti i intervalom čija će širina ovisiti o željenoj pouzdanosti procjene. Što je interval širi, procjena je pouzdanija, tj. veća je vjerojatnost da će se u njemu naći aritmetička sredina populacije. Intervalna procjena aritmetičke sredine osnovnog skupa dobiva se na slijedeći način:
)()( xSezxxSez ⋅+<<⋅− μμ
gdje je: μ – aritmetička sredina uzorka, )(xSe - standardna greška pri procjeni aritmetičke sredine, z - koefi cijent pouzdanosti procjene
Koefi cijent “z” dobije se iz tablice površina ispod normalne krivulje kada veličina uzor-ka premaši 30 jedinica. Najčešće se formiraju intrevali procjene s 95%-tnom pouzdano-sti, a u tom slučaju koefi cijent pouzdanosti iznosi 1,96 (0,95:2=0,4750).
Tablica 10.1. „z” vrijednosti za najčešće razine pouzdanosti
Razina pouzdanosti Z vrijednost90% 1,6595% 1,9699% 2,58
99,9% 3,291
Ukoliko je n ≤ 30 jedinica, upotrebljava se „t” iz Studenove distribucije umjesto koefi cijenta „z”. Želimo li primjerice napraviti intrevalnu procjenu aritmetičke sredine populacije s 95% pouzdanosti, proporcija preostalih jedinica smještenih na krajevima distribucije je 1-0,95=0,05. Na desnom kraju distribucije se tada nalazi proporcija jedi-nica 0,05:2=0,025 pa ćemo traženi koefi cijent pouzdanosti naći u stupcu t.025 i u retku koji odgovara broju stupnjeva slobode k = n-1.
Vratimo se na primjer prosječnih primanja građana Šibenika. Pretpostavimo da smo slučajnim izborom izabrali uzorak od 1 200 ispitanika i na njemu odredili prosječna pri-manja. Potom ponovimo taj postupak još jednom i dobijemo neki novi uzorak s novom
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
114
aritmetičkom sredinom. Uzorkovanje ponavljamo 100 puta i svaki put dobijemo neku aritmetičku sredinu primanja. Svakoj aritmetičkoj sredini uzorka pridružujemo i pripa-dajući interval pouzdanosti. Od ukupno stotinu pripadajućih 95%-tnih intervala pouzda-nosti, njih 95% će sadržavati pravu aritmetičku sredinu populacije. Kao takav, interval pouzdanosti je objektivna procjena (ne)preciznosti i veličine uzorka nekog istraživanja.
Iako postoje i neki drugi načini, interval pouzdanosti načešće računamo pomoću stan-dardne greške. Način izračuna standardne greške )(xSe ovisi o veličini frakcije odabi-ranja koja predstavlja omjer broja jedinica u uzorku i broja jedinica u osnovnom skupu:
Nnf =
gdje je: n – broj jedinica u uzorku, N – broj jedinica u osnovnom skupu.
nxSe σ=)( ako je f < 0.05, odnosno
1)(
−−
⋅=N
nNn
xSe σ ako je f ≥ 0.05
Ukoliko standardna devijacija osnovnog skupa (σ) nije poznata, a uzorak je sluča-jan i dovoljno velik može se pretpostaviti da je standardna devijacija uizorka (s) dobra procjena standardne devijacije populacije, pa standardnu pogrešku aritmetičke sredine računamo:
nsxSe =)(
Standardna greška je manja što je uzorak veći i varijabilnost podataka manja.
Kako danas mnogi statistički programi nude mogućnost izračuna i iskaza intervala po-uzdanosti za većinu statističkih pokazatelja, malo tko će uistinu ručno računati interval pouzdanosti za svoje podatke. No, važno je poznavati ulazne varijable iz kojih računa-mo interval pouzdanosti kako bismo mogli bolje razumjeti njegovo značenje i interpre-taciju.32
32 Šimundić, A. (2008), Interval pouzdanosti, Biochemia medica, Vol.18 No.2, 154-61
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
115
Primjer 10.1. Iz osnovnog skupa od 35 000 zaposlenih uzeli smo uzorak od 2 000 zapo-slenih i ustanovili da je prosječna plaća u uzorku iznosila 8 300kn, a standardna devi-jacija 1 250. Potrebno je izvršiti intervalnu procjenu prosječne plaće uz signifi kantnost od 99%.
1)(
−−
⋅=N
nNn
xSe σ
14,27
135000200035000
20001250)( =
−−
⋅=xSe
14,2758,2830014,2758,28300 ⋅+<<⋅− x
02,83708,8246 << x
Prosječna plaća osnovnog skupa kreće se u intervalu od 8246,8 do 8370,02 kn.
Pitanja
1. Što je metoda uzoraka?2. Koje su vrste uzoraka?3. Što utječe na reprezentativnost uzorka?4. Što je interval pouzdanosti?5. Objasnite intervalnu procjenu aritmetičke sredine osnovnog skupa?
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
116
PRIMJERI RIJEŠENIH ZADATAKA
1. Prema statističkom istraživanju o godinama starosti zaposlenih provedenom u po-duzeću „XY“ dobiveni su slijedeći rezultati:
24, 23, 56, 37, 24, 36, 55, 42, 31, 25, 26, 42, 42, 26, 32, 35, 45, 33, 46, 65, 34, 24, 28, 33, 40, 33, 54, 22, 60, 58, 51, 59, 27, 45, 23, 33, 46, 21, 41, 28, 56, 39, 51, 57, 22, 57, 23, 34, 51, 59, 62, 57, 24, 35
a) Grupirajte navedene podatke tako da formirate razrede veličine i=5. b) Iz tako grupiranih podataka izračunajte prosječnu starost- i to preko odstupanja u
jedinicama intervala!c) Odredite mjeru raspona vrijednosti obilježja srednjih 50% jedinica za distribuciju
godina starosti u instituciji „XY“.d) Koliko iznosi starost u godinama koja distribuciju zaposlenika dijeli u omjeru
1:5?e) Koliko iznosi starost u godinama koja distribuciju zaposlenih u poduzeću „XY“
dijeli na dva jednaka dijela.
Rješenje:a) grupiranje
442165minmax =−=−= XXRv
9445 =⇒=⇒= n
nnRvi
broj razreda
Starost(prave granice)
fi xi di fi di Kum.niz
21-2626-3131-3636-4141-4646-5151-5656-6161-66
11510462592
23,528,533,538,543,548,553,558,563,5
012345678
0520122410306316
11 16 Q1
26 30 Me
3638
43 Q35254
54 - - 180 -
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
117
b) aritmetička sredina
405
541805,230 =⋅+=⋅
⋅+=∑∑ i
fdf
xXi
ii
c) interkvartil
5,2855
115,13264
11 =⋅−
+=⋅−
+=∑
i
if
fN
LQ
5,5355
385,405143
13 =⋅−
+=⋅−
+=∑
ii
if
fN
LQ
13 QQIQ −=
255,285,5313 =−=−= QQIQ
d) postotak
8,10100
2054100
%20100
%100%
205:1005:1
=⋅
=⋅
=
⋅=
=
=⇒
∑ ifdio
cjelinadio
cjelinadio
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
118
e) medijan
25,3754
2627362
1 =⋅−
+=⋅−
+=∑
m
med
i
if
fN
LMe
2. Iznosi godišnjih plaća i radnog staža za 11 zaposlenih u jednom uredu poduzeća „XY“ u Šibeniku u 2007. godini bili su kako slijedi:
Plaće(u 000 kn) 44 67 32 78 29 89 67 34 93 139 58
Radni staž (u god) 12 32 17 10 34 5 19 17 31 17 24
a) Grupirajte navedene podatke o plaćama tako na formirate 5 razreda.b) Iz tako grupiranih podataka izračunajte prosječnu plaću- i to preko odstupanja u
jedinicama intervala!c) Odredite vrijednost plaće za koju vrijedi da je prvih 10% zaposlenih imalo toliku
plaću i manju, a preostalih 90% zaposlenih veću plaću.d) Pomoću vrijednosti dviju relativnih mjera disperzije odredite disperziju zadanog
uzorka plaća tijekom 2007. godine.e) Koliko iznosi vrijednost koja radni staž dijeli u omjeru 1:4?f) Odredite najčešći radni staž zaposlenih u uredu poduzeća „XY“ te vrijednost rad-
nog staža koja niz dijeli na dva jednaka dijela.
Rješenje:a) grupiranje
11029139minmax =−=−= XXRv
22
5110
===n
Rvi
veličina razreda
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
119
plaće(u 000 kn)
fi xi di fi di kum.niz
29-5151-7373-9595-117117-139
43301
406284106128
01234
03604
4 D17101011
ukupno 11 - 10 13 -
b) aritmetička sredina
6622
1113400 =⋅+=⋅
⋅+=∑∑ i
fdf
xXi
ii
c) prvi decil
35224
01,12910
11 =⋅−
+=⋅−
+=∑
idfdecil
fN
LD
d) koefi cijent varijacije i koefi cijent kvartilne devijacije
Plaće uređene po veličini (u 000 kn): 29 32 34 44 58 67 67 78 89 93 139
100⋅=
xV σ
36,6611730
=== ∑N
xx
i
895,98436,66
1159274)( 22
22 =−=−= ∑ x
Nxiσ 38,31895,984 ==σ
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
120
29,47100
36,6638,31100 =⋅=⋅=
xV σ
N=11N/4 = 2,75 3N/4 = 8,25 INT (2,75)+1= 3 INT (8,25)+1=9
Q1= vrijednost 3. člana niza = 34Q3= vrijednost 9. člana niza = 89
45,0
12355
34893489
13
13 ==+−
=+−
=QQQQVq
e) postotak
75,2100
2511100
%25100
%100%
254:1004:1
=⋅
=⋅
=
⋅=
=
=⇒
∑ ifdio
cjelinadio
cjelinadio
f) mod = 17 (vrijednost koja se u nizu najviše pojavljuje) medijan: 5 10 12 17 17 17 19 24 31 32 34 (podaci o radnom stažu uređeni po veličini)
61)5,5(1)2
( =+=+= INTNINTxr
Me = vrijednost 6. člana niza = 17
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
121
3. Prema izvješću Sveučilišta „XY“ u razdoblju od 1997.- 2006. godine podaci o odno-su broja profesora i broja studenata na fakultetu „Z“ bili su kako slijedi:
Godina 1997. 1998. 1999. 2000. 2001. 2002. 2003. 2004. 2005. 2006.
Brojprofesora 45 57 65 86 99 112 96 93 89 86
Brojstudenata 590 610 780 840 880 890 910 950 980 990
a) Odredite osnovne parametre jednadžbe linearnog trenda sa ishodištem u sredini razdoblja za distribuciju profesora u razdoblju od 2003.-2006. godine.
b) Ako se kretanje broja profesora nastavi prema trendu čije ste parametre izračunali pod (a), koliki se broj može očekivati u 2013. godini ?
c) Neka je varijabla X broj studenata, a varijabla Y broj profesora. Odredite parame-tre linearne regresijske jednadžbe Xe i Ye.
d) Odredite regresijske vrijednosti koristeći parametre jednadžbe Ye.e) Izračunajte koefi cijent korelacije i objasnite njegovo značenje.
Rješenje:
a)
Godina
Broj profesora
y x xy x2
2003.2004.2005.2006.
96938986
-2-112
-192-9389172
4114
ukupno 364 0 -24 10
4,2
1024
2 −=−
=−
−=
∑∑∑ ∑
xxxyxxy
b 9104,291 =⋅+=−= xbya
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
122
b)
xbxaye 4,291−=+=
2013. godina → X=9
654,6994,291 ≈=⋅−=ey
c)Studenti
xProfesori
y xy x2 y2
590610780840880890910950980990
455765869911296938986
26550347705070072240871209968087360883508722085140
348100372100608400705600774400792100828100902500960400980100
20253249422573969801125449216864979217396
8420 828 719130 7271800 72422
12,0
84208427271800828842719130
2 =⋅−⋅−
=−
−=
∑∑∑ ∑
xxxyxxy
b 68,58288,827242284208,82719130
2=
⋅−⋅−
=−
−=′
∑∑∑ ∑
yyyxyxy
b
24,1884212,08,82 −=⋅−=−= xbya 7,3718,8268,5842 =⋅−=′−=′ ybxa
xbxaye 12,024,18 +−=+= yybaxe 68,57,371 +=′+′=
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
123
d)
xye 12,024,18 +−=
X1=590 ; 5359012,024,181 ≈⋅+−=y
Prema regresiji na 590 studenata procjenjuje se 53 profesora, a stvarna zabilježena vri-jednost je 45. Razliku čini REZIDUALNO ODSTUPANJE.
X2=610 ; Y2=55 X3=780 ; Y3=75 itd.
e) 83,068,512,0 +=⋅±=′⋅±= bbr Postoji jaka veza pozitivnog smjera.
4. Broj izrečenih presuda na općinskom sudu u županiji „XY“ u razdoblju 2001.-2006. godine za maloljetne osobe bio je kako slijedi:
Godina 2001. 2002. 2003. 2004. 2005. 2006.
Maloljetne osobe - 110 108 103 101 100
a) Odredite apsolutne vrijednosti presuda izrečenih maloljetnim osobama ukoliko je poznato da je broj maloljetnih osuđenih osoba u 2003. iznosio 1820.
b) Izračunajte indekse maloljetnih osoba na bazi 2004.=100.c) Izračunajte bazne indekse tako da za bazu uzmete prosječan broj izrečenih presu-
da u razdoblju 2001.-2006.
Rješenje:
a)
18756,1874
1001820103
100100 0304
0403
0404 ≈=
⋅=
⋅=⇒⋅=
YVYYYV
18954,1893100
6,187310105 ≈=
⋅=Y
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
124
b)
100⋅=
b
tt Y
YI
1875=bY
71,81100
18751532
01 =⋅=I
c)
1783
610700
==x
1783=bY
92,85100
17831532
=⋅=tI
Godina Maloljetne osobe Yt Ib
2004.=100Ib
Ø = 1002001.2002.2003.2004.2005.2006.
-110108103101100
153216851820187518941894
81,7189,8797,07100,00101,01101,01
85,9294,50102,08105,16106,23106,23
5. Ispitivana je obiteljska situacija i sklonost nasilničkom ponašanju:
Obiteljska situacijaSklonost nasilničkom
ponašanjuRoditelji u
brakuLoši odnosi u
brakuRoditelji
rastavljeniNeskloni 900 416 98
Umjereno skloni 230 67 123Jako skloni 75 55 223
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
125
Uz signifi kantnost od 5% istražite da li se sklonost nasilničkom ponašanju razlikuje u odnosu na obiteljsku situaciju roditelja u braku i obiteljsku situaciju loših odnosa u braku u odnosu na roditelje koji su umjereno skloni i jako skloni nasilničkom ponaša-nju.
Rješenje: H0 .... ne razlikuje se sklonost nasilničkom ponašanju u odnosu na obiteljsku situacijuH1 .... postoji značajna razlika u sklonosti nasilničkom ponašanju u odnosu na obiteljsku
situaciju
230 6775 55
297130
305 122 427
fi fti fi -fti (fi -fti)2 (fi -fti)2/fti230756755
212,1492,8684,8637,14
17,86-17,86-17,8617,86
318,98318,98318,98318,98
1,503,443,768,59
2ּג =17,29
stupnjevi slobode: 1)12()12()1()1( =−⋅−=−⋅−= srk
Hi-kvadrat vrijednost uz 1 stupanj slobode i na razini signifi kantnosti 5% = 3,841
3,841<17,29 odbacujemo H0 i prihvaćamo H1
∑∑ ∑⋅=
ukupnostupcaretka
fti
86,92427
130305
14,212427
297305
=⋅
=
=⋅
=
fti
fti
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
126
PREGLED FORMULA
1. SREDNJE VRIJEDNOSTI
a) aritmetička sredina – jednostavna (negrupirani podaci)
Nx
xi∑= (i = 1,2,3…N)
xi – pojedinačne vrijednosti numeričke varijable (obilježja) x, N – broj podataka (broj vrijednosti)
b) aritmetičlka sredina – ponderirana ili vagana (grupirani podaci)
∑∑=
fifx
xii
( i= 1,2,3…k)
fi – frekvencije, xi – vrijednosti numeričke varijable (obilježja) ili razredne sredine u distribuciji frekvencija
c) aritmetička sredina – preko odstupanja u jedinicama intervala
i
fdf
xXi
ii ⋅⋅
+=∑∑
0
(i = 1,2,3...k)
ixxd i
i0−
=
x0 – vrijednost razredne sredine razreda koji ima najveću frekvenciju, i-veličina razre-da, fi –frekvencije
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
127
d) harmonijska sredina – jednostavna
∑=
ix
NH 1 (i =1,2,3 … N)
xi – vrijednosti numeričke varijable, N – broj podataka
e) harmonijska sredina - ponderirana
∑
∑=
i
i
i
xf
fH
(i=1,2,3…N)
fi –frekvencije modaliteta numeričke varijable x, xi – vrijednosti numeričke varijable (obilježja)
f) medijan – negrupirani podaci
2,
2
1)2
(,2
NrINTN
NINTrINTN
==
+=≠
)(21
1++=
=
rr
r
xxMe
xMe
N – broj članova numeričkog ili redoslijednog niza, INT-cijeli dio razlomka, r- redni broj podatka u nizu podataka uređenih po veličini
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
128
g) medijan – grupirani podaci
if
fN
LMmed
m
ii
e ⋅−
+=∑=1
12
L1 - donja granica medijalnog razreda, N/2 – poluzbroj fekvencija, ∑fi - zbroj frekven-cija do medijalnog razreda, fmed - frekvencija medijalnog razreda, i - veličina medi-jalnog razreda.
h) mod Vrijednost moda je najčešća vrijednost među članovima ili obilježje s najvećom fre-
kvencijom. Mod distribucije frekvencija s razredima:
i
cbababLMo ⋅−+−
−+=
)()()(
1
L1 – donja granica modalnog razreda, b – frekvencija modalnog razreda, a – frekvencija koja prethodi modalnom razredu, c – frekvencija koja slijedi iza frekvencije modalnog razreda, i – veličina modalnog razreda.
i) geometrijska sredina – jednostavna
N
xG
i∑=
log
(i=1,2…N)
N – broj vrijednosti, xi – vrijednosti numeričke varijable
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
129
j) geometrijska sredina – ponderirana
∑∑
=i
ii
f
xfG
log
(i=1,2….k)
fi –frekvencije distribucije
k) geometrijska sredina – metodom verižnih indeksa
N
VtG
∑=
log
(t=1,2…N)
N – broj vrijednosti, Vt – verižni indeks
lj) prosječna stopa rasta/pada
NNxxxG ....21 ⋅=
N – broj vrijednosti, xi – vrijednosti numeričke varijable
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
130
2. KVANTILI
a) donji i gornji kvartil – negrupiran ipodaci
)(21
11
1
++=
=
rr
r
xxQ
xQ
4,
4
1)4
(,4
NrINTN
NINTrINTN
==
+=≠
)(21
13
3
++=
=
rr
r
xxQ
xQ
43,
43
1)4
3(,4
3
NrINTN
NINTrINTN
==
+=≠
N – broj članova numeričkog ili redoslijednog niza, INT-cijeli dio razlomka, r- redni broj podatka u nizu podataka uređenih po veličini
b) donji i gornji kvartil – grupirani podaci
if
fN
LQtk
i
⋅−
+=∑var
114
if
fN
LQtk
i
⋅−
+=∑
var13
43
(i=1,2...q)
L1 - donja granica kvartilnog razreda, ∑fi - zbroj frekvencija do kvartilnog razreda, fkvart - frekvencija kvartilnog razreda, i - veličina kvartilnog razreda, N/4 – jedna četvrti-na sume frekvencija, 3N/4 – tri četvrtine sume frekvencija
c) kvantili – negrupirani podaci
)(21
1++=
=
rrp
rp
xxQ
xQ
qNprINT
qNp
qNpINTrINT
qNp
==
+=≠
,
1)(,
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
131
N – broj članova numeričkog ili redoslijednog niza, INT-cijeli dio razlomka, r- redni broj podatka u nizu podataka uređenih po veličini, q-red kvantila, p-redni broj kvantila
d) kvantili – grupirani podaci
if
fq
Np
LQkvant
i
p ⋅−
+=∑
1
L1 - donja granica kvantilnog razreda, ∑fi - zbroj frekvencija do kvantilnog razreda, fkvant - frekvencija kvantilnog razreda, i - veličina kvantilnog razreda
3. MJERE DISPERZIJE
a) raspon varijacije
minmax xxRv −=xmax – najveća vrijednost niza, xmin – najmanja vrijednost niza
b) interkvartil
13 QQIq −=
Q1- donji kvartil, Q3- gornji kvartil
c) koefi cijent kvartilne devijacije
13
13
QQQQVq +
−=
Q1- donji kvartil, Q3- gornji kvartil
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
132
d) varijanca i standardna devijacija – negrupirani podaci
2
22 )(x
Nxi −= ∑σ
2σσ =± (i=1,2…N)
N – broj vrijednosti, xi – vrijednosti numeričke varijable, x - aritmetička sredina
e) varijanca i standardna devijacija – grupirani podaci
2
22 )(x
fifixi −=
∑∑σ
2σσ =± (i=1,2…k)
fi – frekvencije, xi – vrijednosti numeričke varijable (obilježja) ili razredne sredine u
distribuciji frekvencija, x - aritmetička sredina
f) koefi cijent varijacije
100⋅=
xV σ
σ – standardna devijacija, x - aritmetička sredina
g) standardizirano obilježje
σxxizi −
= (i=1,2,3…N)
xi – vrijednosti numeričke varijable x, x - aritmetička sredina, σ – standardna devi-jacija
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
133
h) srednje apsolutno odstupanje- negrupirani podaci
N
xxiMAD
∑ −=
i) srednje apsolutno odstupanje- grupirani podaci
∑∑ −
=fi
fixxiMAD
4. RELATIVNI BROJEVI
a) postotni brojevi
100:%: =cjelinadio
cjelinadio 100% ⋅
= %100⋅
=diocjelina
b) relativni brojevi koordinacije
100⋅=
i
ii
BAR
Ai, Bi – frekvencije/statistički nizovi grupirani prema istom obilježju
c) bazni indeksi
100⋅=b
tt
yyI
(t=1,2…n)
t – tekuće razdoblje, b – bazno razdoblje
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
134
d) odnos stopa i baznih indeksa
100−= tt ISSt – stopa promjene vrijednosti pojave u vremenu t prema razdoblju b
e) verižni indeksi
100
1⋅=
−t
tt
yyV
(t=2,3…n)
t – tekuće razdoblje, t-1 – prethodno razdoblje
f) odnos stopa i verižnih indeksa
100−= tt VSSt – stope promjene pojave u uzastopnim razdobljima
g) pretvaranje indeksa na stalnoj bazi u verižne indekse
1001⋅=
−t
tt
IIV
h) pretvaranje verižnih indeksa u bazne indekse
1001 ⋅=↑ −t
tt
VII
1001 tt
tVII ⋅−
=↓
i) Laspeyresov skupni indeks količina
1001
)(01 ⋅⋅⋅
=∑∑
ioio
ioip
pqpq
Q o
pi0 – cijena u baznoj godini, qi1 – količina u tekućoj godini, qi0 – količina u baznoj godini
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
135
j) Paascheov skupni indeks količina
100
1
11)(01 1 ⋅
⋅⋅
=∑∑
iio
iip
pqpq
Q
pi1 – cijena u tekućoj godini, qi1 – količina u tekućoj godini, qi0 – količina u baznoj godini
k) Laspeyresov skupni indeks cijena
1001
)(01 ⋅⋅⋅
=∑∑
ioio
ioiq
qpqp
P o
qi0 – količina u baznoj godini, pi0 – cijena u baznoj godini, pi1 – cijena u tekućoj godini
l) Paascheov skupni indeks cijena
1001
11)(01 1 ⋅
⋅⋅
=∑∑
iio
iiq
qpqp
P
qi1 – količina u tekućoj godini, pi0 – cijena u baznoj godini, pi1 – cijena u tekućoj godini
lj) Skupni indeks vrijednosti
1000
1101 ⋅
⋅⋅
=∑∑
iio
ii
qpqp
V
qi0 – količina u baznoj godini, qi1 – količina u tekućoj godini, pi0 – cijena u baznoj godini, pi1 – cijena u tekućoj godini
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
136
5. TREND
a) linearni trend
bxay +=∑∑
∑ ∑−
−=
xxx
yxxyb 2 xbya −=
y – trend vrijednosti ili zavisna varijabla, a – vrijednosti trenda u ishodištu, b – apsolut-ni prirast ili pad pojave, x – vremenska jedinica ili nezavisna varijabla
b) eksponencijalni trend
y = a ∙ bx
log ye=loga + x log b
c) parabolički trend
y = a + bx + cx2
d) logaritamski trend
ye = a∙xb
xbay logloglog ⋅+=
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
137
KORELACIJA I REGRESIJA
a) koefi cijent linearna korelacija
yx
N
iii
N
yxNyxr
σσ ⋅⋅
⋅⋅−⋅=∑=1 bbb ′⋅±=
b) linearna regresija uxfY += )( bxaye += ybaxe ′+′=
∑∑∑ ∑
−
−=
xxx
yxxyb 2
ybxa ′−=′∑∑
∑ ∑−
−=′
yyy
xyxyb 2
xbya −=
x – nezavisna varijabla, y – zavisna varijabla, u – greška relacije
7. VJEROJATNOST
a) klasična defi nicija vjerojatnosti slučajnog događaja D
nmDP =)(
m – broj povoljnih događaja, n – broj svih mogućih događaja
b) vjerojatnost nastupa međusobno isključivih događaja
)()()( 2121 DPDPDDP +=∪
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
138
c) vjerojatnost nastupa barem jednog događaja
)()()()( 212121 DDPDPDPDDP ∩−+=∪
d) vjerojatnost nastupa neovisnih događaja
)()()( 2121 DPDPDDP ⋅=∩
8. METODA UZORAKA
a) procjena aritmetičke sredine osnovnog skupa
)()( xSezxxSez ⋅+<<⋅− μμ
05,0,)( <= fn
xSe σ
05,0,1
)( ≥−−
⋅= fN
nNn
xSe σ
Nnf =
μ – aritmetička sredina uzorka, )(xSe - standardna greška pri procjeni aritmetičke sre-dine, z - koefi cijent pouzdanosti procjene, n – broj jedinica u uzorku, N – broj jedinica u osnovnom skupu.
MARIJA BOBAN, DIJANA MEČEVPOSLOVNA STATISTIKA - PRIMJENA STATISTIČKIH METODA U EKONOMIJI
139
L I T E R A T U R A:
1) Biljan-August,M. et al. (2007)Upotreba statistike u ekonomiji, Ekonomski fakultet Rijeka
2) Gogala, Z. (2001) Osnove statistike, Sinergija, Zagreb3) Kero, K. i Bojanić-Glavica, B. (2003) Statistika u primjerima, FOI, Varaždin4) Petz, B. (1985) Osnove statističke metode za nematematičare, SNL, Zagreb5) Rozga,A.(2003) Statistika za ekonomiste, Sveučilište u Splitu6) Rozga, A. i Grčić, B. (2000) Poslovna statistika, Veleučilište u Splitu7) Serdar, V. i Šošić, I. (1982) Uvod u statistiku, Školska knjiga, Zagreb8) Šimundić, A. (2008), Interval pouzdanosti, Biochemia medica, Vol.18 No.2, 154-619) Šimundić, S. i Boban, M. (2003) Zbirka zadataka iz statistike, Pravni fakultet
Sveučilišta u Splitu10) Šošić, I. (2002) Pregled formula iz statistike, Školska knjiga, Zagreb11) Šošić, I. (2006) Primijenjena statistika, Školska knjiga, Zagreb
ISBN: 978-953-56741-0-8