59
SKRIPTA ZA III PARCIJALNI ISPIT IZ STATISTIKE REGRESIONA ANALIZA Utvrđivanje zakonitosti I pravilnosti koje vladaju između masovnih pojava, te trasiranje puta za kreiranje odgovarajućeg modela, zadatak je regresione analize. Regresija je zapravo skraćeni naziv od regresija prema aritmetkoj sredini, koja dolazi od opšte statističke zakonitosti da je rezultat jedne varij.bliži aritmetkoj sredini nego što je rezultatu varijable koja je služila za predvanje. U užem smislu, regresiona analiza podrazumijeva skup statistkih metoda koji omogućuju utrvđivanje zavisnoti između pojava I procjenjivanje jedne varijable na osnovu vrijednosti neke druge ili više drugih varijabli. U širem smislu, ova analiza obuhvata, pored navedenih metoda I statističke metode koji omogućavaju praćenje kovarijacije između pojava I utvrđivanje međuzavisnosti između dvije ili više pojava. KOVARIJANSA predstavlja kvantitativni izraz slaganja varijacija vrijednosti obilježja posmatranih pojava. Regresioni model omogućava da se s određenim stepenom pouzdanosti procjenjuju I predviđaju vrijednosti zavisne varijable na osnovu vrijednosti nezavisne varijable. Međuzavisnost pojava se utvrđuje primjenom korelacione analize. Korelacionim modelom se utvrđuje da li su dvije pojave povezane , tj da li se mjenjaju zajedno, da li im je pravac mjenjanja isti, koji je stepen povezanosti i sl. Regresiona analiza može se odnosti na posmatranje osnovnog skupa ili na njegov uzorak. Češći je slučaj da se analiza izvodi na osnovu uzorka. Iz osnovnog skupa uzima se reprezentativan uzorak i na osnovu njega donosi se zaključak o parametrima skupa. Za ovu analizu mogu se koristiti 2 vrste podataka: a)podaci koji izražavaju stanje određenog momenta 1

Statistika

Embed Size (px)

DESCRIPTION

statistika 3 parcijala

Citation preview

Page 1: Statistika

SKRIPTA ZA III PARCIJALNI ISPIT IZ STATISTIKE

REGRESIONA ANALIZAUtvrđivanje zakonitosti I pravilnosti koje vladaju između masovnih pojava, te trasiranje puta za kreiranje odgovarajućeg modela, zadatak je regresione analize.

Regresija je zapravo skraćeni naziv od regresija prema aritmetičkoj sredini, koja dolazi od opšte statističke zakonitosti da je rezultat jedne varij.bliži aritmetičkoj sredini nego što je rezultatu varijable koja je služila za predviđanje.

U užem smislu, regresiona analiza podrazumijeva skup statističkih metoda koji omogućuju utrvđivanje zavisnoti između pojava I procjenjivanje jedne varijable na osnovu vrijednosti neke druge ili više drugih varijabli.U širem smislu, ova analiza obuhvata, pored navedenih metoda I statističke metode koji omogućavaju praćenje kovarijacije između pojava I utvrđivanje međuzavisnosti između dvije ili više pojava.

KOVARIJANSA predstavlja kvantitativni izraz slaganja varijacija vrijednosti obilježja posmatranih pojava.Regresioni model omogućava da se s određenim stepenom pouzdanosti procjenjuju I predviđaju vrijednosti zavisne varijable na osnovu vrijednosti nezavisne varijable. Međuzavisnost pojava se utvrđuje primjenom korelacione analize. Korelacionim modelom se utvrđuje da li su dvije pojave povezane , tj da li se mjenjaju zajedno, da li im je pravac mjenjanja isti, koji je stepen povezanosti i sl.Regresiona analiza može se odnosti na posmatranje osnovnog skupa ili na njegov uzorak. Češći je slučaj da se analiza izvodi na osnovu uzorka.Iz osnovnog skupa uzima se reprezentativan uzorak i na osnovu njega donosi se zaključak o parametrima skupa.Za ovu analizu mogu se koristiti 2 vrste podataka:a)podaci koji izražavaju stanje određenog momentab)podaci koji se dobivaju na osnovu posmatranja neke pojave u vremenskim intervalima i takvi podaci se obrazuju u vremenski niz.Nužno je upozoriti na opasnost formalne interpretacije rezulatat, koji proizilaze iz primjene regres.analize.Validnost i pouzdanost rezultata reg.analize zavise od stvarnog poznavanja materije koju ona treba interpretirati.

-KOVARIJACIJA-Za utvrđivanje kvantitativnog izraza slaganja varijacija vrijednosti obilježja posmatrane pojave korsitimo kovarijaciju.Postoje slijedeći pokazatelji kovarijacije:a) INDEKS DIFERENCIJALNE KOVARIJACIJE:računa se na osnovu predznaka varijacija kao razlika među modalitetima obilježja u utvrđenom nizu njihovih podataka. Nedostatak mu je u tome što uzima u obzir samo predznak varijacija od jednog do drugog modaliteta, a zanemaruje intenzitet zabilježenih varijacija.

1

Page 2: Statistika

b) PONDERISANI INDEKS DIFERENCIJALNE KOVARIJACIJEje obuhvatniji od prethodnog indeksa jer uzima u obzir i predznake i intenzitet zabilježenih varijacija. Računa se kao odnos razlike i zbira pozitivnih i negativnih proizvoda varijacija.c) KOEFICIJENT DIFERENCIJALNE KOVARIJACIJERačuna se kao odnos između razlike pozitivnih i negativnih proizvoda varijacija prema geometriskoj sredini kvadrata uzastopnih varijacija.

2

Page 3: Statistika

d)KOEFICIJENT TENDENCIJE

je kompleksan izraz uzajamnosti varijacija obilježja posmatranih pojava. On obuhvata i odstupanja oko aritmetičke sredine. Uzima vrijednost iz intervala [-1,+1], pri čemu neg.vrijednosti označavaju suprotnosmjerno slaganje varijacija, a pozitivne, istosmjerno slaganje. Što je njegova apsolutna vrije.bliža 1, između varijacija obilježja pojava postoji viši stepen istosmjernog ili suprotnosmjernog kvantit.slaganja.

-KOVARIJANSA-predstavlja prosječan stepen varijacija obilježja posmatrane pojave i pomoću nje nije moguće direktno mjerenje stepena kovarijacije, tj stepena jačine veze između posmatranih pojava. Kovarijansom procjenjujemo postoji li kovarijacija između pojava, ali ne i stepen. Ona je neka vrsta prosjeka, odnosno ukupnosti odstupanja svih podataka od aritmetičkih sredina posmatranih serija. Izračunava se kao prosječno istovremeno odstupanje vrijednosti obilježja od svojih aritmetičkih sredina. Jednaka je nuli ako je stand.devijacija barem jedne varij.jednaka nuli. Ako postoji tendencija da iznadprosječna vrijednost jedne varijable dolazi sa iznadprosječnom vrijednošću druge varijable, onda je kovarijansa pozitivna i obrnuto. Kovarijansa je negativna ako iznadprosječne vrijenosti jedne varijable prate ispodprosječne vrijednosti druge varijable.

Zadatak regresione analize je da utvrdi zakonitosti u varijacijama zavisne varijable Y, koje su određene varijacijama nezavisne varijable X, s ciljem da se predvide nepoznate vrijednosti varijable Y kada je poznata X.Nezavisna varijabla je ona varijabla od koje na neki način zavisi ono što istražujemo. To je ona varijabla koju istraživač namjerno mjenja da bi ustanovio kako će te promjene djelovati na zavisnu varijablu koju on istražuje.Zavisna varijabla je ona varijabla koju istražujemo i želimo rastumačiti zbog čega ona poprima različite vrijednosti i koju možemo predvidjeti iz vrijednosti neke druge varijable. U slučajevima kada istraživač ne može svojevoljno manipulisati X on prati promjene na Y u vezi sa spontanim promjenama na X.

Regresija kvantificira vezu između pojava, neophodno je kvalitativnom analizom ispravno identifikovati varijablu/e koja stvarno uzrokuje promjene u zavisnoj varijabli.

Veze kod kojih povećanju(smanjenju) vrijednosti nezavisne varijable X istovremeno odgovara povećanje(smanjenje) zavisne varijable Y nazivamo pozitivnim(istosmjernim) vezama. Ako povećanju jedne varijable odgvara smanjenje druge varijable radi se o negativnom (suprotnosmjernim) vezama.

Prema jačini veze između pojava mogu biti FUNKCIONALNE I STATISTIČKE.

Funkcionalne veze se javljaju u slučaju kada jednom vrijednosti nezavisne promjenjive X odgovara samo jedna, tačno određena vrijednost zavisne promjenjive Y. Karakteristično je da im se pri zajedničkom mjenjanju veličina promjene uvijek podudaraju i da u svakoj vrijednosti jedne pojave odgovara uvijek ista vrijednost druge pojave. Označava se sa izrazom Y=f(x), pri čemu svakoj vrijednosti X odgovara tačno određena vrijednost Y.

3

Page 4: Statistika

Statističke( slučajne) veze se najčešće susreću u društvenim i privrednim pojavama. S obzirom na to da zavisna varijabla Y svaku od različitih vrijednosti može uzeti s određenom vjerovatnoćom i kako njene ishode u pojedinačnim situacijama ne možemo sa sigurnošću predvidjeti, ona je slučajna varijabla. Iako po obliku podsjećaju na funkcionalne veze, labavije su od njih, nisu tako određene i podložne su variranju.

Kada svakom jediničnom porastu vrijednosti jedne varijable odgovara približno jednaka linearna promjena druge varijable, kažemo da je oblik veze između pojava LINEARAN. U okviru regresione analize modeli se djele na linearne i nelinearne.

U regres.analizi se koriste podaci koji izražavaju stanje određenog momenta (uzorak,osn.skup) i podaci koji se dobiju na osnovu posmatranja neke pojave u vremenskim intervalima, koji obrazuju vremenski niz. U ekonomskim istraživanjima između različitih varijabli razlikujemo vezu na osnovu jedne jednačine, na osnovu više jednačina i vezu na simultanoj osnovi. Na osnovu jedne jednačine sagledava se zavisnost između zavisne varijable i jedne ili više nezavisnih varijabli. Kod veza na bazi više jednačina radi se o ispitivanju uticaja više varijabli na zavisnu varijablu, ali posebno za svaku nezavisnu varijablu. Treću grupu čine dvije ili više zavisnih varijabli kada su u simultanoj vezi sa određenim brojem bezavisnih varijabli.

Regresiona analiza obuhvata slijedeće etape:-odrediti zavisnu i nezavisnu varijablu-izabrati slučajan uzorak-grafički predstaviti na dijagramu rasipanja-na osnovu dijagrama rasipanja procjeniti oblik veze-konsturisati odgovarajući model-ocjeniti primjenom odgovarajucih metoda prarametre modela-izračunati rezidualna odstupanja i analizirati ih-testiranjem validnosti modela procjeniti kvalitet modela-primjena modela za procjenu i predviđanje zavisne varijable.

DIJAGRAM RASIPANJA je grafiči prikaz kojim se uočava priroda odnosa dviju pojava predstavljena vrijednostima numeričkog obilježja. Prije bilo kakve kvantitativne analize obavezno treba prikazati podatke na ovom dijagramu, koji se crta u pravouglom koordinatnom sistemu.Numerička podloga za njegovu konstrukciju su vrijenosti varijabli x i y, pri čemu se na apcisu nanose jedinične vrijednosti pojave koju smo označili kao nezavisna varijabla x, a na ordinatu jedinice zavisne varijable y. Ucrtavanjem svih empiriskih parova podataka može se na prvi pogled dobiti važna slika o eventualnom postojanju, obliku, smjeru, jačini veze između posmatranih pojava.

4

Page 5: Statistika

slika LINEARNA VEZA /DIJAGRAM RASIPANJA/

Slika a) prikazuje funkcionalnu vezu između nezavisne i zavisne varijable. Zamišljena linija koja povezuje sve tačke na slici je pravac, od koje nema odstupanja. Zbog toga se kaže da je ova veza funkcionalna i pozitivna jer je pravac rastući.U praksi gotovo nikad ne postoji ovakav primjer, nego je češći slučaj na slici b). Zamišljena linija između tačaka na slici je takđe pravac, ali su prisutna određena odstupanja. Pozitiva i negativna odstupanja od pravca se tumače uticajima drugih varijabli iz prakse. Zbog toga kažemo da je veza statistička. I ova veza je pozitivna jer je zamišljeni pravac rastući.Slika c) pokazuje funkcionalnu vezu između zavisne i nezavisne varijable a zamišljena linija koja povezuje sve tačke na slici je opet prava. Pored toga što je veza funkcionalna porast jedne varijable prati pad druge varijable, pa kažemo da je veza negativna.U praksi je gotovo nemoguće sresti ovakav primjer, ali čest je primjer slika d). Zamišljena linija između tačaka je pravac, a pozitivna i negativna odstupanja od pravca tumače se uticajima drugih varijabli. Veza je statistička, a kako je zamišljeni pravac opadajući, veza je negativna.

5

Page 6: Statistika

slika DIJAGRAM RASIPANJA / nelinearna veza i odsutnost veze/

Slika a) pokazuje funkcionalu krivolinijsku vezu između zavisne i nezavisne varijable. Zamišljena linija koja povezuje sve tačke na slici je eksponencijalna kriva. Porast vrijednosti jedne varijable prati porast vrijednosti druge varijable, pa je posmatrana veza pozitivna. U praksi se češći je slučaj slike b) gdje je zamišljena linija kriva i prisutna su pozitivna i negativna odstupanja zbog uticaja ostalih varijabli. Ovo je statistička veza, porast jedne prati porast druge, pa je smijer pozitivan. Slika c) upućuje na zaključak da nema povezanosti između posmatranih pojava. Zamišljena linija između tačaka ne postoji, jer se za jednu vrijednost nezavisne varijable može dogoditi više različitih vrijednosti zavisne varijable. Odsustvo kvantitativnih slaganja je prikazano na slici d) jer za razliku vrijednosti nezavisne varijable dobijamo istu vrijednost zavisne varijable.

6

Page 7: Statistika

MODEL JEDNOSTAVNE LINEARNE REGRSIJE Polazni model jedn,lin.regresije je

Yi=α+βxi+εigdje Y predstvalja zavisnu varijablu, X vrijednost nezavisne varijable, α odsječak na y osi, β koeficijent nagiba i ε statistički član ( slučajna greška).Zadatak regresione analize jeste pronaći najbolju liniju regresije uzorka i koristiti je umjesto nepoznate linije regresije osnovnog skup, kako bismo na osnovu nje izvršili predviđanje.

Model jednostavne lin.regresije za n posmatnanih pojava varijabli x i y može se napisati kao yi=a+bxi+ei

y- empirijska vrijednost te opservacije, a i b odjsečak na y osi i koeficijet nagiba, ei- rezidualna odstupanja. (odnosi se na uzorak)

Liniju regresije u uzorku možemo predstaviti na slijedeći način:y* = a+bx

gdje a+bx predstavlja funkcionalni dio modela gdje su ai b parametri koje treba procjeniti a y* predstavlja procjenjenu vrijednost Y na osnovu posmatranih vrijednsoti od xi do X. Procjene a i b se razlikuju od stvarnih vrijednosti α i β.

U statistici je predloženo više obj.metoda koje se korsite da si između empirijskih tačaka povukli onu pravu liniju koja ih najbolje reprezentuje. Najčešće se koristi metoda najmanjih kvadrata, koja obezbjeđuje minimum odstupanja prilagođenog modela od tačaka dijagrama rasipanja.

Rezidualna odstupanja predstavljaju ocjenu slučajne greške u polaznom modelu jednostavne lin.regrecije. Rezidual će biti pozitivan ako se empirijska vrijednost nalazi iznad prave, negativna ispod prave. Regresiona prava će dobroi reprezentovati empirijski raspored ako su vrijednosti reziduala male, i obrnuto. Cilj reg.analize jeste primjeniti metod koji će minimizirati rezidualna odstupanja. ei= yi-y*Relativna rezidualna odstupanja računaju se dijeljenjem tih odstupanja pripadajućom stvarnom vrijednosti zavisne varijable puta 100.Standardizovana rezidualna odstupanja se računaju dijeljenjem rezidualnih odstupanja standardnom devijacijom regresije.

Model jednostavne lin.regresije ima slijedeće osobine:-zbir odstupanja stvarnih vrijednosti zavisne varijable od regresijskih vrijednosti =0-zbir kvadrata tih odstupanja je minimalan-zbir proizvoda vrijednosti zavisne varijable i rezidualnih odstupanja =0-zbir proizvoda nezavisne vrijable i rezidualnih odstupanja=0-aritmetička sredina stvarnih vrijednosti zavisne varijable = aritm.sredini regre.vrijednosti zavisne varijable

7

Page 8: Statistika

MJERE REPREZENTATIVNOSTI REGRESIONOG MODELA(str 315)Regresiona analiza ne završava konstruisanjem regresione linije,već je potrebna I informacija o stupnju varijabiliteta,koji utiče na reprezentativnost regresionog modela.Reprezentativnost regresionog modela mjeri se stepenom varijacije,empirijskih vrednosti zaisne varijable u odnosu na regresione vrednosti utvrđene modelom.Prvi izvor varijabiliteta rezultat je varijacija u vrednostima nezavisne varijable X I može se protumačiti regresionim modelom.Drugi izvor varijabiliteta je rezultat djelovanja slučajne greške I ne može se protumačiti regresionim modelom.Mjere za procjenu reprezentativnosti regr.temelji se na raščlanjivanju odstupanja empirijskih vrijednosti zavisne varijable od njenog prosjeka. Formula 4.21 I 4.22 str 315 knjiga

gdje lijeva strana predstavlja zbir kvadrata odstupanja empirijskih vrijednosti zavisne varijable od njene aritm.sredine( ukupni varijabilitet). Prvi član sa desne strane je zbir kvadrata odstupanja regresionih vrijednosti od njene aritm.sredine ( protumačeni varijabilitet). Odstupanja empirijskih vrijednosti zavisne varijable od regresijskih vrijednosti predstavlja drugi član s desna( neprotupačeni varijabilitet)

Pokazateje varijacije podataka nazivamo mjerama disperzije koje omogućavaju posmatranje varijabiliteta podataka u odnosu na regresionu liniju.Veća rasprašenost tačaka oko regresione linije uvijek znači manju reprezentativnost regresionog modela I suprotno.

Odstupanja vrijednosti numeričkog obilježja od aritm.sredine zavisne varijable su različita po predznaku I veličini a njihov zbir je jednak 0.

Budući da skoro nikad ne raspolažemo svim podacima osnovnog skupa,varijansu regresije ne možemo ni izračunati.

Standardna devijacija regresije pokazuje prosječno odstupanje empirijske vrednosti zavisne varijable Y od regresionih vrednosti utvrđenih modelom.(Formula 130)

8

Page 9: Statistika

Standardna devijacija regresije je apsolutna mjera disperzije jer je izražena u istim mjernim jedinicama kao I zavisna varijabla.Koeficijent varijacije regresije je relativna mjera disperzije I računa se kao omjer standardne devijacije regresije I aritm.sredine zavisne varijable pomnožene sa 100. (Formula 132)Koeficijent determinacije je pokazatelj reprezentativnosti regresije I računa se po formuli 126. Koeficijent determinacije je pokazatelj reprezentativnosti, koji predstavlja omjer protumačenog varijabiliteta i ukupnog varijabiliteta.(formula 126)

To je relativna mjera i pokazuje kolko su varijacije zavisne varijable Y protumačene nezavisnom varijablom X. Velika vrijednost koeficijenta ukazuje na malu disperziju oko pravca, što povećava reprezentativnost modela.Kao analitički pokazatelj koristi se i korigovani koeficijent determinacije, koji zavisi od stepena slobode i može biti negativan. Ovaj koeficijent je manji ili jednak koeficijentu determinacije.

Ako se varijabla x0 nalazi između drugih nezavisnih promjenjivih i ako se na osnovu nje predviđa prosječna vrijednost zavisne promjenjive, onda se radi o INTERPOLACIJI. Kod interpolacije nezavisna promjenjiva x0 se nalazi između najmanje i najveće vrijednosti nezavisne varijable uzorka. Ako se vrijednost nezavinse varijable nalazi izvan intervala koji je dat empirijskim podacima uzorka, onda je riječ o EKSTRAPOLACIJI.

INFERENCIJALNO STATISTIČKA ANALIZA U MODELU JEDNOSTAVNE LINEARNE REGRESIJETeorijske pretpostavke za analizu modela metodama inferencijalne statistike odnose se na svojstva zavisne varijable Y ili ekvivalentno na svosjstva slučajne varijable εi .-Očekivana vrednost zavisne varijable Y za date vrednosti neovisne varijable X funkcija je vrijednosti neovisne varijable I parametara α I β.Ta se funkcija zove regresiona funkcija osnovnog skupa.Ekvivalentna pretpostavka εi=0 za svako i.-Varijansa zavisne varijable za date vrednosti nezavisne varijable je konstantna I jednaka kvadratu standardne devijacije za svako i.-Vrednosti zavisne varijable međusobno su nekolinearne slučajne velićine odnosno njihova kovarijansa je jednaka nuli.Ekvivalentno vrijednosti slučajne varijable εi međusobno su nekolinearne slučajne veličine.-Zavisna varijabla je normalno distribuisana,odnosno slučajne varijale εi su indentično normalno distribuirane.

Kvalitet modela jednostvane linearne regresije se mjeri testiranjem značajnosti parametra βH0: β=0 H1: β≠0Prema nultoj hipotezi regresiona varijabla X je suvišna u modelu dok H1 sadrži tvrdnju da regresiona varijabla X objašnjava varijacije varijable Y.U praksi nisu poznate vrijednosti koeficijenata regresione linije osnovnog skupa,njihove vrednosti procjenićemo na osnovu uzorka.U tom slučaju slijedi da je :H0: b=0 H1:b≠0Test statistika predstavlja omjer procjene regresionog koeficijenta sa standardnom greškom te procjene.(formula 134)Ako je apsolutna vrednost testovne veličine manja od kritične vrednosti onda se prihvata nulta hipoteza I suprotno.Pod brojem stepeni slobode nekog statističkog parametra podrazumjevamo broj neovisnih opažanja n umanjen za broj parametara k potrebnih da bi se odredio dati parametar.Broj događaja koji pri izračunavanju nekog statističkog parametra mogu slobodno varirati nazivamo broj stepeni slobode.

9

Page 10: Statistika

Za testiranje hipoteza u modelu jednostavne linearne regresije koristi se I F-test.Uobičajeno je da se empirijski F-omjer navodi u tabeli analize varijanse (ANOVA).Odluka se donosi poređenjem empirijskog F-omjera sa kritičnim vrednostima F-distribucije uz odgovarajući nivo značajnosti α I br.stepeni slobode (1;n-2).Ukoliko je empirijski F-omjer manji od teorijskog prihvata se H0 I obratno.Ako su ispunjene pretpostavke u regresivnom modelu I ako uzorak potiće iz normalne distribucirane populacije,tada sampling distribucija regresivnog koeficijenta normalnog oblika intervala procjene β se računa kao (fomula 135 druga samo što umjesto y0 je b a umjesto t je z).Kada je osnovni skup normalne distribucije s nepoznatom varijansom sampling distribucije sa (n-2) stepena slobode.Procjena je pouzdanija što je interval širi tj. Veća je vjerovatnoća da će se u njemu naći posmatrani parametar..Jednačina regresie omogućava procenu vrednosti zavisne varijable za određenu vrijednost neavisne varijable koja nije postojala kao jedinica.Kod interpolacije nezavisne promjenjive x0 nalazi se između najmanje I najveće vrednosti nezavisne varijable uzorka.Procjena zavisne varijable provodi se brojem I intervalom.Brojem pomoću regresione jednačine I jednak je regresionoj vrednosti a intervalom (druga formula 135) a procjena standardne greške procjene regresije se računa (treća formula 135).Da bi predviđanje pomoću regresionog modela bilo validno neophodno je da se parametar β statistički značajno razlikuje od nule te je potreban visok nivo koeficijenta determinacije.

JEDNOSTAVNA KRIVOLINIJSKA REGRESIJA

Nelinearne dvodimenzionalne regresione modele moguće je odgovarajućom transformacijom svesti na model jednostavne linearne regresije.Transformacija se provodi na vrijednostima zavisne I nezavisne varijable,a zavisi od oblika funkcionalnog dijela modela,koji izvire iz teorijskih postavki područja u kome se model primjenjuje.Model kojim se izražavaju nelinearni odnosi među pojavama naziva se modelom jednostavne krivolinijske regresije.

Navedeni nelinearni regresioni modeli analiziraju se na isti način kao I model jednostavne linearne regresije,s tim da pri interpretaciji rezultata vodimo račna da sa statističke veličine izračunate za model sa transformisanim a ne sa originalnim vrijednostima varijabli.

KORELACIONA ANALIZA-se bavi istraživanjem uzajamnih odnosa među pojavama, ali ne i uzročno-posljedičnim vezama među njima.

Ako postoji jaka veza između dvije posm.pojave nije uvijek moguće odrediti nezavisnu i zavisnu varijablu, te ispitujemo međuzavisnost između posm.varijabli. Kada su dvije pojave povezane stohasticki a ne zna se da li se mjenjaju istovremeno ili se razlikuju u pogledu momenata mjenjanja gocori se o korelacionoj povezanosti. Za korelaciju je najbitniji pravac promjena dvije korelaciono povezane pojave isti, govori se o pozitivnoj korelaciji, a kada je pravac različit, riječ je o negativnoj korelaciji.

10

Page 11: Statistika

Zadatak korelacione analize je da utvrdi stepen slaganja varijacija posmatranih pojava i objasni oblik, smjer i jačinu veze između varijabli.

KOEFICIJENT JEDNOSTAVNE LINEARNE KORELACIJE-je brojčani pokazatelj kojim se izražava pojava u statističkoj analizi. Izražava međusobni odnos dvije pojave kada se on ispoljava u nekoj pravolinjskoj tendenciji.Postoji više vrsta koeficijenata korelacije, ali se u praksi najčešće koristi Pearsonov koeficijent korelacije, koji u obzir uzima kovarijansu i standardne devijacije obje posmatrane pojave. Pearsnov koeficijent korelacije je broj koji pokazuje u kojoj su mjeri dvije uporedive pojave povezane, odnosno u kojem se obimu mjenjaju kada jedna promjena izaziva promjenu druge pojave.Koeficijent linearne korelacije mjeri jačinu i smjer povezanosti posmatranih pojava, a varira u zatvorenom intervalu od -1 do +1. Znak + ukazuje na direktnu vezu, a - na inverznu linearnu vezu. Viša apsolutna vrijednost ukazuje na višu povezanost.Interpretacija visine pojedinog koeficijenta korelacije zavisi u prvom redu o pojavam čija se povezanost ispituje, o ustanovljenim korelacijama u sličnim situacijama, o praktičnim zahtjevima o pojedinim konkretnim slučajevima, tako da vrijednost ovog koeficijenta ne treba shvatati grubo.

Koeficijent korelacije r moguće je izračunati pomoću koeficijenta determinacije ili pomoću proizvoda regresijskog koeficijenta b i omjera standardnih devijacija varijabli x i y. Koeficijent korelacije jednak je geometrijskoj sredini koeficijenata smjera obje regresione linije, a predznak se određuje prema predznaku regres.koeficijentVisina korelacije nije samo odraz stepena povezanosti između dvije varijable, nego može biti posljedica različitih uticaja, od kojih su najvažniji:

-nelinearna veza-simetrična i unimodalna dustribucija posmatranih varijabli-grupisanje rezultata-kauzalna interpretacija korelacije-uticaj raspona-eliminisanje vrijednosti oko aritmetičke sredine-podskupovi s različitim aritmetičkim sredinama

U praksi se ponekad javlja potreba za računanjem korelacije između dvije kontinuirane varijable, po pretpostavci normalno distribuirane u osnovnom skupu, s tim da je jedna od varijabli namjerno dihotomizirana.

Dihotomija varijabli ( podjela na 2 modaliteta) predstavlja najgrublje moguće mjerenje, jer posmatranu pojavu razlikujemo samo u dvije kategorije. Svođenje na 2 modaliteta je obično posljedica jedinog načina na koji se mogu dobiti podaci. Za računanje korelacije između kontinuirane i dihotomizirane varijable koriste se slijedeći koeficijenti: biserijski koeficijent i point biserijski koeficijent FORMULE

TESTIRANJE ZNAČAJNOSTI PROCJENE KOEFICIJENTA rU koleracionoj analizi ima nekoliko postupaka koji se mogu koristiti za testiranje značajnosti koeficijenat korelacije. Uglavno u praksi nije poznata vrijednost koeficijenta korelacije osnovnog skupa, njegovu značajnost procjenjujemo na osnovu uzorka. Ako za neki koeficijent korelacije, izračunat na reprezentativnom uzorku za osnovni skup, utvrdimo da je statistički značajan, onda se on značajno razlikuje od nule. U suprotnom slučaju, ako utvrdimo da koeficijnet korelacije niije statistički značajan,

11

Page 12: Statistika

onda se on ne razlikuje značajano od nule(0). Test hipoteze3 o značajnosti parametra p može biti dvosmijeran i jednosmijeran. Kod dvosmijernog testiranja hipoteze između pojava u osnovnom skupu ne postoji linearna korelacija: H0: p=0 H1:p≠0. Alternativna hipoteza pokazuje da u osnovnom skupu postoji linearna korelacija, ali ne govori ništa o jačini veze. Testiranje hipoteze o koeficijentu korelacije zasnovano je na odgovarajućoj sampling distribuciji. Ako uzorak potiče iz osnovnog skupa onda test stetistika predstavlja omjer procjene koeficijenta korelacije sa st.greškom te procjene:FOR.140 i slijedi Studentov raspored sa(n-2) stepeni slobode. Stand.greška procjene koef korelacije se računa:FOR.140.I pkazuje koliko u prosjeku koef korel uzorka odstupa od keof korel Osnovnog skupa. Odluka se donosi poređenjem testovne veličine sa odgovarajućim kritičnim(tabličnim) vr sampling distribucije. Ako je apsolutna vrijednost testovne vel manja od kritične vrijednopsti(uz određeni nivo značajnosti) onda se prihvata nulta hipoteza, odnosno koef koerl nije statistički značajan i superotno.Upoređivanjem p-vrijednosti sa unaprijed određenim nivoom značajnosti može se donijeti odluka o odbacivanju ili prohvatanj H0. Ako je p<α , onda ćemo odbaciti H0 i prihvatiti H1, a ako je p> α zaključujemo da nemamo dovoljno razloga da odbacimo H0.

BISERIJSKI KOEFICIJENT KORELACIJEZa primjenu ovog koeficijenta neophodno je da se ispune 2 uslova. Prvi se odnosi ba pretpostavku da se prva varijabla normalno raspoređuje u osnovnom skupu i da njene mjere potiču s intervalne mjerne skale.Drugi uslov podrazumjeva namjernu podjelu druge varijable na 2 modaliteta.Mjera povezanosti dvije kontinuirane varijable, od kojih ni jedna po svojoj prirodi nije dihotomna, ali se podaci jedne varijable djele u 2 kategorije, iskazuje se koeficijentom biserijske korelacije. Primjena koef je opravdana kada je varijabla Y kontinuirano mjerena, ali postoje nepravilnosti koje onemogućavaju primjenu koeficijenta r.Postupak za izračunavanje biserijskog koeficijenta:a)prvo se računa aritm.sredina -)onih rezultata varijable x kod kojih se u varijabli y nalazi prva dihotomna oznaka i --)onih rezultata varijable x kod kojih se u varijabli y nalazi druga dihotomna oznaka.b) proporcija p i q se dobija na osnovu mjera frekvencija svakog od dihotomnih modaliteta varijable Y.c) nakon toga se računa standardna devijacija varijable xd)u tabeli se nađe vrijednost proporcije p ili q u koloni s tim nazivom,a zatim se u istom redu potraži odgovarajuća vrijednost izraza pq/ye) vrijednost biserijskog koeficijenta se dobija uvrštavanjem prethodnih izračunatih vrijednosti u izraz 2.1

POINT BISERIJSKI KOEFICIJENT KORELACIJEU praksi se često javlja potreba za računanjem korelacije između 2 vari., pri čemu je jedna od varijabli kontinuirana, a druga po svojoj prirodi atributivna ili dihotomna. Mjera povezanosti dvije varijable od kojih je jedna kvantitativna i kontinuirana, a druga po svojoj prirodi dihotomna utvrđuje se point biserijskim koeficijentom. Za primjenu ovog koef. neophodno je ispuniti slijedeće uslove: prva varijabla se normalno raspoređuje u populaciji i potiče sa intervalne skale, a druga varijabla je po svojoj prirodi dihotomna i nikako ne može biti normalno raspoređena. Između ove dvije diskretne kategorije postoji prekid, diskontinuitet, u jednoj tački, od koje potiče naziv metode. Ima širi primjenu nego biser.kof. Preporučuje se računanje biserijskog koef kada je dihotomna varijabla van svake sumnje nornalno distrubuirana. Ako postoji mala sumnja da dihotomna vari. nije normalno distribuirana, primjenjuje se point biserijski koeficijent korelacije.

12

Page 13: Statistika

KOEFICIJENTI KORELACIJE RANGA

Korelacija ranga je metoda kojom se mjeri povezanost rangova dvije ili više varijabli ranga. Ako su varijable numeričke, treba ih transformisati u varijable ranga. Raširena metoda neparametarske statistike.Nije potrebno da posmatrane pojave budu u linearnom odnosu. Koeficijent rang korelacije ima prednost nad r koeficijentom kada kod mjernih rez postoje extremne vrijednosti.Ispitivanje stepena povezanosti između pojava datih u obliku modaliteta rang varijable nie moguće na isti način kao i za modalitete numeričkih nizova. Neophodan je drugačiji pristup, jer varijable nemaju potrebna metrička svojstva. Izdvajamo Spearmanov koeficijent(2 varijable ranga) i Kendelov koeficijent(za grupu varijabli ) rang korelacije.

-Spearmanov koeficijent korelacije ranga--koristimo za utvrđivanje stepena povezanosti između pojava kod kojih su podaci dati u obliku modaliteta rang varijable. To je u stvari koeficijent r primjenjen na rangirane podatke. Varira u zatvorenom intervalu od -1(perfektna inverzna veza) do +1(perfektna direktna veza).0 ukazuje na odsustvo veze između posmatranih pojava.Koeficijent je jednak -1 kada je redosljed modaliteta prve rang varijable suprotan od redosljeda druge rang varijable u paru i tada govorimo o perfektnoj inverznoj vezi.O perfektnoj direktvoj vezi govorimo kada je koeficijent jednak 1, odnosno kada su u svakom paru rangovi jednaki. Tada je svako d=0. Koeficijent je jednak nuli za najveće neslaganje rangova, odnosno kada je zbir kvadrata razlika rangova jednak.

Kendelov koeficijet Wu praksi ponekad imamo slučajeva kada nas zanima slaganje između tri i više nizova ranga. U tu svrhu koristi se Kendelov W koeficijent. U brojniku se nalazi aritmetička sredina rangova za i-ti red i aritmetička sredina svih rangova.Kendelov koeficijent ne može biti negativnog predznaka. pr.Ako se članovi komislije nikako ne slažu, koeficijent W je jednak 0, a ako se slažu u potpunosti, jednak je 1. Ovaj koeficijent testira odnos između stvarnog slaganja i maksimalnog mogućeg slaganja. Testiranje značajnosti W vrši se poređenjem testovne veličine s tabličnom veličinom za odgovarajući nivo značajnosti alfa, veličinu uzorka n i K varijabli ranga.Može se utvrditi i pomoću hi- kvadrat testa. U koliko se utvrdi da je hi-kvadrat značajan, onda je i W koef značajan.

KOEFICIJENTI ASOCIJACIJE

-se korsite za mjerenje povezanosti dvije ili više nominalnih varijabli. Mjerenje stepena povezanosti između modaliteta nominalne varijable nije moguće na isti način kao i za modalitete numeričkih i ordinalnih nizova. Neophodan je drugačiji pristup, jer nominalne varijable nemaju potrebna metrička svojstva modaliteta numeričke ili rang varijable. Nominalna skla je najnepreciznija skala i služi samo za klasifikaciju.Ovi koeficijenti daju samo približnu indikaciju asocijacije između posmatranih pojava, pa je potrebno posebnu pažnju posvetiti kvantitativnom mjerenju stepena i smjera, te tumačenje njihove veze.

13

Page 14: Statistika

Podaci se unose u kontigencijsku tabelu. Upotrebom izraza kontigencija, umjesto korelacija, želi se naglasiti oblik povezanosti koji se javlja između diskontinuiranih nominalnih varijabli.Manje se radi o odnosu modaliteta posmatranih pojava, a više o međusobnom stanju modaliteta posmatranih varijabli. U literaturi se navode slijedeći koeficijenti asocijacije: Pearsonov koeficijent kontigencije C, Cramerov koeficijent K i koeficijent fi.

Pearsonov koeficijent kontigencijeKontigencijom C se utvrđuje zavisnost dva obilježja u dvodimenzionalnoj tabeli kontigencije. Koeficijent C ne zahtjeva simetričnu raspodjelu posmatranih varijabli. Asocijcija između nominalnih varijabli je slabija kada su razlike između empirijskih i očekivanih frekvencija manje. Koeficijent kontigencije C se zasniva na hi-kvadart testu.C=Hi kvadrat test se koristi kada trebamo utvrditi da li neke opažene frekencije zajedno odstupaju od očekivanih vrijednosti. Kreće se u zatvorenom intervalu od 0 do 1. Min vrijed je 0, a max zavisi od broja posmatranih modaliteta, ali nikad nie veća od 1. Vrijednost koef. ukazuje na postojanje povezanosti, ali ne i na smijer, odnosno da li je veza pozitivna ili negativna. Istraživač određuje smijer na osnovu kretanja podataka u tabeli kontigencije. Ovaj koef se koristi za diskontinuirane podatke, njegovo poređenje sa koefi r obično nie opravdano. Koef C nie pouzdana mjera onda kada se u tabeli kontigencije jave suviše male očekivane vrijednosti. Može se poboljpati smanjenjem tabele.

Cramerov koeficijent asocijacije KZbog teškoća u interpretaciji koeficijenta kontigencije C u praksi se sve više koristi koeficijent K. Polaznu osnovu za računanje C koeficijenta čine razlike između empirijskih i očekivanih frekvencija, odnosno testova vrijednost hi kvadrata.K=Kreće se u zatvorenom intervalu od 0 do 1. Koef poprima vrijednost 0 u slučaju nezavisnih nominalnih varijabli. Koeficijent uzima max vrijednost 1, u slučaju potpunog slaganja posmatranih varijabli. Ovom koeficijentu se ne pridružuje predznak

Koeficijent fi-mjeri se povezanost dvije varijable koje su obje po svojoj prirodi dihotomne ili je jedna takva, a druga dihotomna samo po obliku( a po prirodi numerička i kontinuirana). Za računanje ovog koef neophodno je da da bar jedna varijabla bude prirodno podjeljena na dva modaliteta. Koeficijent fi se često upotrebljava i u slučajevima kada je jedna od varijabli po prirodi kontunuirana, a samo se prikazuje dihotomno zbog razgraničenja na odeđenom mjestu kontiniuma. Radi se o parametarskoj metodi, jer se ne može pretpostaviti normalna distribucija kod dihotomnih varijabli. Računa se dir iz tabele kontigencije a i može se izvesti iz hi-kvadrata.Fi koeficijent varira od -1 do 1. Vrijednost 1 postiže samo ako je(a+b)=(a+c), odnosno -1 postiže ako je (a+b)=(b+d). [ a,b,c,d pojedine frekencije iz 4 ćelije tabele. a i d na jednoj dijagonali a, b i c na drugoj dijagonali. ]

KORELACIJA IZMEĐU NOMINALNE I RANG VARIJABLE

14

Page 15: Statistika

U praksi se ponekad javlja potreba za mjerenjem stepena povezanosti između pojava datih u obliku nominalne varijable i rang varijable. Potreban je drugačiji pristup, jer nominalna i rang varijabla nemaju poterbna metrička svojstva modaliteta numeričke varijable.Tu korelaciju računamo najčešće Kendelovim tau koeficijentom i Freemanovim teta koeficijentom.

Kendelov tau koeficijent-koristimo kada želimo da utvrdimo povezanost varijabli od kojih je jedna rang varijabla a druga dihotomna nominalna varijabla. U koliko nie svejedno da li jedinica pripada jednoj ili drugoj grupi, onda to znači da postoji povezanost između posmatranih pojava.(formula)

Freemanov teta koeficijent-koristimo kada želimo da mjerimo povezanost pojava koje su predstavljene rang varijablom i dihotomnom nominalnom varijablom. Koef tau i teta se značajno razlikuju, a prednost ide Freemanovom teta koeficijentu, jer kod potpune povezanosti koeficijent teta daje očekivani maximalnu rezultat 1, bez obzira na vel uzorka, dok se koef tau smanjuje što je uzorak veći.

(formula)Ris predstavlja zbir rangova ispod prilikom poređenja ranga svake jedinice prvog podskupa sa rangovima svih jedinica drugog podskupa, a Riz , zbir rangova iznad.Možemo ga koristiti i kada nema vezanih rangova.

PARCIJALNA KORELACIJAZakon jedne varijable poretpostavlja eliminisanje djelovanja svih drugih varijabli da bi se utvrdila povezanost varijabli koje su predmet posmatranja. U tom slučaju će se primjeniti postupak kojim se uvtrđuje povezanost dvije varijable uz eliminisanje treće varijable. Ovim postupkom se od ukupne korelacije oduzima onaj dio koji je nastao djelovanjem treće varijable. Tako dobiveni dio ukupne korelacije naziva se parcijalna korelaija.

(formula 2.40)Koeficijent parcijalne korelacije uzima vrijednosti od -1 do 1.Parcijalna korelacija može biti linearna i nelinearna. U praksi se u glavnom koristi metom linerane parcijalne korelacije.

ZAKLJUČNA RAZMATRANJA O MJERAMA KORELACIJEKoeficijent korelacije je indeksni broj i nije mjera na linearnoj skali jednakih jedinica. Razlike između velikih vrijednosti r i su mnogo veće nego one između malih vrijednosti r. Ne možemo tvrditi da je kod koeficijenta r= 0,6 dva puta veća povezanost nego kada je r= 0,3, ali možemo reći da je r= 0,75 ukazuje na isto tako čvrstu povezanost kao što to pokazuje r= 0,7.U vezi interpretacije koeficijenta korelacije prisutna su dva gledišta: teorijsko i praktično. S teorijskog gledišta svaki koeficijent korelacije koji je statistički značajan može da ukazuje na neku povezanost između pojava, pa je opravdano uzeti i male koeficijente korelacije kao pokazatelje povezanosti, ali na pojave koje su predmet našeg posmatranja utiču različiti fktori i okolnosti, koji izmiču našoj kontroli. S obzirom da vrlo rijetko dobijemo potpunu korelaciju, slijedi da prilikom interpretacije nekog koeficijenta korelacije treba uvijek uzeti u obzir uslove pod kojima je izračunat.S druge strane gledišta, koeficijent korelacije je indikativanza povezanost između posmatranih pojava (možda i za neku zakonitost u teorijskom smislu), može biti bez praktičnih važnosi. Koeficijenti korelacije služe, pored ostalog, i za statistička predviđanja. Ako je korelacija između pojava visoka, onda je statističko predviđanje sigurnije i obratno. Koeficijent korelacije ne predstavlja nikakvu apsolutnu prirodnu činjenicu i da ga možemo tumačiti uvažavajući uslove u kojima je izračunat. Potrebno je da znamo koja varijabla se mjeri, kojim mjernim

15

Page 16: Statistika

instrumentima, pod kojim okolnostima i u kojoj populaciji. Prema tome, koeficijent korelacije je potpuno relevantan okolnostima pod kojima je izračunat i treba da bude interpretiran u svijetlu tih okolnosti.

MULTIPLA LINEARNA KORELACIJA

Kod multiple linearne korelacije istražujemo povezaost dviju ili više nezavisnih varijabli sa zavisnom varijablom.Koeficijenti multiple korelacije su značajniji jedino u slučaju kada raspolažemo dovoljnim brojem podataka i kada su svi pojedinačni koeficijenti korelacije r linearni. Jedno od značajnih područija istraživanja koje se zasniva na utvrđivanju višestruke povezanosti je prognoza budućeg uspjeha na osnovu rez prethodnih testova i sl.Koeficijent multiple linearna korelacije možemo računati pomoću elemenata korelacione matrice, kao drugi korjen iz koeficijenta multiple determinacije, pomoću regresionih koeficijenata i omjera stand.devijacija varijabli i na druge načine. Varira u intervalu od 0 do1. Ne pridružuje mu se predznak.Postoje 2 gledišta tumačenja koefi multiple lin korelacije: teorijsko i praktično.Sa teorijskog gledišta, svaki koef korelacije koji je stat značajan može da ukazuje na neku povezanost između pojava. Međutim, na pojave koje su predmet našeg posmatranja utiču i razl faktori i oklnosti, koji izmiču našoj kontroli.Sa praktičnog gledišta, koef korelacije koji je indikativan za povezanost između posmatranih pojava, može biti bez praktične važnosti. Koef korelacije služe, pored ostalog, i za stat predviđanja. Ako je korelacija između pojava visoka, onda je stat predviđanje sigurnije i obrnuto.

Parametarske metode se primjenjuju pod strogo određenim uslovima o normalnosti rasporeda posmatranih varijabli. Neparametarske metode su nezavisne od oblika distribucije varijabli, pa su i ti koeficijenti manje pouzdane mjere korelacije.

DINAMIČKA ANALIZA VREMENSKIH NOZOVA

U desktiptivnoj statistici za nedovosmisleno određivanje pripadnosti elem posmatranom osnovnom skupu, neophodno je je pojmovno, prostorno i vremensko definisanje.Pojmovno definisanje osn skupa podrazumjeva da se tačno i precizno odredi osobina koju mora da ima svaka stat jedicnica da bi bila uključena u skup.Prostorno odrediti skup znači tačno odrediti prostor na kojem pripadaju stat jedinice. Vremensko definisanje skupa podrazumijeva da se precizno odredi vrijeme kada ce se posmatranje realizirati.Dinamička analiza obuhvata istraživanje zakonitosti kretanje masovnih pojava u vremenu, odnosno omogućava praćenej promjena pojave u vremenu i predviđanje tendencije razvoja pojava. Ova analiza podrazumjeva praćenje kvantitativnih promjena pojava, kako u obimu tako i u strukturi tokom vremena. Zakonitosti kretanja masovnih pojava kroz vrijeme često su predmet ekonom. i drusštvenih istraživanja, a u otkrivanju tih zakonitosti pomažu nam metode stat analize vrem nizova( serija). Pomoću vrem serija koje predstavljuju nizove podataka o niovu posmatranih pojava u sukcesivnim vremenskim intervalima, prelazi se sa stat aspekta na dinamički aspekt posmatranja.

VREMENSKI NIZ KAO IZRAZ DINAMIKE

16

Page 17: Statistika

-je skup hronološki uređenih vrijednosti posmatrane pojave. Vrijednosti čijim redanjem nastaje vremenski niz zove se frekvencija.Prema načinu nastanka, razlikujemo intervali i trenutni.Ako je neku pojavu moguće posmatrati samo u nekom intervalu dobićemo frekvencije pojedinih vremenskih jedinica, čijim uređivanjem nastaje intervalni vremenski niz. Sve one pojave koje imaju jedan smjer kretanja, koji je određen početkom i krajem perioda, možemo posmatrati samo u određenom periodu vremena.Kod trenutnog vremenskog niza radi se o pojavama čija priroda nameće posmatranje samo u jednom trenutku ili presjeku. Rez ovakvih posmatranja su frekvencije koje pokazuju nivo pojave u određenom trenutku, a njihovim uređenjem nastaje trenutni vrem.niz.

Sabiranjem vrijednosti pojave po odabranim vremenskim intervalima nastaju frekvencije intervalnog vrem niza. Ovaj niz ima svojstvo kumulativnosti, pa se zato frekv mogu sabirati. Trenutni niz predstavlja skup hronološki uređenih vrijednosti, koje predstavljuju stanja pojava u odabranim vrem tačkama.

Prema načinu iskazivanja posmatrane pojave razlikujemo izvorni i izvedeni vrem niz.Izvorni vrem niz nastaje hronološkim uređenjem veličina koje su rezultat direktnog mjerenja pojava po odabranim vremenskim intervalima.Ukoliko su frekvencije rezultat brojčanih operacija nad jednim ili više vrem nizova onda se radi o izvedenom vrem nizu.

Konzistentnost vremenskog niza Ispravni zaključci o dinamici posmatrane pojave mogući su ako je vremenski niz konzistentan, odnosno ako se radi o uporedivim podacima. Pose b nu p ažn j u t r e b a u sm j e r i t i n a : d e f i n i sa n j e i m j e r e n j e var ij ab l e n a i st i n a č i n u c jel om po s m a t r a no m p er i o d u , i s t e v r e me n s k e j e d i n i c e po s m a t r a n j a , a d m i n i st r a t i v no t e r i o t o r i j a l n e p r o m je ne, t e n a s t a b i l no st c ij ena k o d v r ij e d no sn o g i s t r a ž i va n j a . Tokom vremena mjenja se definicija posmatranih pojava, mjenjaju se kriteriji razgraničenja, metodi mjerenja i načina iskazivanja. Ovaj problem je posebno izražen kod dužeg posmatranja neke pojave gdje kao neminovnost dolazi do promjene njenog sadržaja, a samim tim i njenog definisanja, mjerenja i iskazivanja. Sve to značajno utiče na upoređivanje podataka.Drugi faktor na koji trebamo obratiti pažnju kada se radi o zahtjevu uporedivosti nizova je vremenski interval posmatranja. Podatke ima smisla upoređivati samo ako se odnose na iste vremenske jedinice. Vremenske jedinice dobijamo tako što stat skup raščlanimo prema vremenskom obilježju. To znači da će svaka vremenska jedinica biti definisana jednim vremenskim periodom, a frekvencije te jedinice predstavljat će onaj dio skupa koji pripada tom periodu. Za vrem obilježje upotrebljavamo kalendarska razdoblja:godina, polugodište, kvartal...Kod rasporeda frekvencija u desktiptivnoj statistici uvijek se prije upoređivanja frekvencija provjerava da li su razredi jednake veličine. Ako nisu, onda se koriguju, pa tek onda uporešuju frekvencije. Radi uporedivosti podataka, sličan postupak ćemo koristiti i kod analize konzistentnosti niza. Frekvencije se koriguju svođenjem na najmanji vremenski interval.Kod trenutnog vremenskog niza varijacije dužine istih kalendarskih jedinica ne utiču na njihovu uporedivost. Poželjno je da su frekvencije vezane za jednako udaljene vremenske tačke, jer to pojednostavljuje postupke.

17

Page 18: Statistika

Česte administrativno teriotorijalne promjene takođe otežavaju uporedivost podataka. Kroz duži vremenski period je teško zadržati prostornu definiciju pojave, jer se u vremenu mjenjaju i prostorne granice. U slučajevima gdje je to moguće, potrebno je pregrupisati podatke u nizove uporedivih podataka.Posebnu pažnju zaslužuju nizovi koji dinamiku pojava izražavaju vrijednosno. Kod ovih nizova promjene cijena značajno determiniraju veličine pojave. Da bi se u ovakvim slučajevima sagledala realna dinamika posmatrane pojave potrebno je eliminisati uticaj promjena u tekućim cijenama na njeno ponašanje. To se radi na taj način što se vrijednost prodaje za čitav posmatrani period obračunava po stalnim cjenama, odnosno cijenama iz perioda koji se odabere kao bazni.

CILJEVI I PRISTUPI ANALIZE VREMENSKIH NIZOVAAnalizom vrem nizova želimo postići slijedeće ciljeve:

Desktipcija pojave - u prvoj etapi izučavanja osnovnih karakteristika vrem niza koristimo graf prikazivanje i deskriptivnu statistiku.

Objašnjenje varijacije pojave- kada raspolažemo sa više vremenskih nizova moguće je koristiti varijacije jednog niza za objašnjenje varijacija drugog niza.

Predviđanje razvoja pojave- na osnovu prošlih opservacija identificiramo i procjenjujemo model vremenskog niza i zatim ga korsitmo za predviđanje budućih nivoa pojave. Predviđanje se bazira na pokazateljima dinamike ili modelima vremenskih pojava.

Kontrola procesa- ovaj zadatak analize posebno je interesantan u analizi vremenskih nizova koji se javljaju u statističkoj kontroli kvaliteta. Potreba za regulacijom procesa javlja se kod različitih neusklađenosti, koje su rezultat pojave premalih ili prevelikih vrijednosti niza.

Statističke metode možemo razvrstati u dvije grupe:

a) metode koje analizi vremenskih nizova pristupaju sa stanovišta vremenaIstraživanje razvojnih tendencija vremenskih nizova u funkciji vremena je

predmet ove metode. Postoje dva pristupa: 1) sastoji se u utvrđivanju analitičkih izraza kojima se opisuje razvoj pojave i to pomoću f-je vremena. 2) izvire iz težnje da se statistički opiše dinamička struktura pojave a ne njeno kretanje u vremenu. Ovaj pristup podrazumijeva mjerenje stepena i smjera korelacije članova niza, razmaknutih jedan, dva ili više perioda kao i analitičko izražavanje te međuzavisnosti.

b) metode koje joj prilaze sa stanovišta frekvencijaova metoda spada u područije spektralne i harmonijske analize. Manje se koristi od prethodne metode, jer je mnogo složenija.

GRAFIČKO PRIKAZIVANJE VREMENSKIH NIZOVA

Da bi frekvencije, odnosno podaci i rezultati koje izražavaju vremenski nizovi postali razumljiviji, u statistici se za njihovo predstavljanje koristi grafičko prikazivanje. Danas se konstrukcija grafikona i dijagrama vrši pomoću statističkih ili sličnih računarskih programa. Vremenski nizovi se mogu grafički prikazati na više načina.

18

Page 19: Statistika

Tekstualni dio grafikona treba da sadrži: naslov, oznaku jedinice mjerenja, oznake perioda na apsici, izvor podataka i po potrebi objašnjenje i napomene.Na grafikonima, radi lakšeg prikazivanja, često se označava mreža. Ona se u pravouglom koordinatnom sistemu sastoji od spleta horizontalnih i vertikalnih linija, koje uobičajno prolaze kroz karakteristične tačke mjerila na koordinatnim osama.U koliko intervali posmatranja nisu jednaki, neophodno je korigovati frekvencije. Vremenski niz sa korigovanim frekvencijama prikazuje se linijskim ili površinskim grafikonima.Intervalni niz prikazuje se linijskim i površinskim grafikonima.

Linijski grafikoni su jednodimenzionalni i koriste se za prikazivanje vremenskih nizova kod pojava koje imaju svoj tok, dinamiku i razvoj. Naglašavaju brzinu, a ne veličinu promjena. Preglednost linijskih grafikona doprinosi i prekid mjerila na ordinati. Postupak izostavljan ja djela aritimetičkog mjerila na ordinati omogućava jasnie uočavanje malih varijacija pojave i tada je riječ o horizontalnom prekidu grafikona.Grafikon se konstruira tako što se na apsicu unosi aritmetičko mjerilo za vrijeme, a na ordinatu aritimetičko mjerilo za frekvencije. Linijski grafikon nastaje spajanjem tačaka čije su koordinate date sredinama posmatranih vremenskih perioda i frekvencijama. Apcise tih tačaka određene su sredinama dužina koje predstavljaju periode a ordinate tačaka zavise od frekvencija. Apsolutne razlike frekvencija pojedinačnih posmatranih pojava predstavljene su razlikama ordinata dviju tačaka, dok je intenzitet promjena pojave predstavljen srminama linija.

Površinski grafikoni imaju dvije dimenzije i kod njih su frekvencije niza predstavljene površinama različitih geometrijskih oblika. Ova vrsta graf se koristi kada se želi istaknuti veličina, a ne vrijeme i brzina promjene u vremenu.Histogram stupaca se crta u pravouglom koordinatnom sistemu, pri čemu se frekvencije prikazuju stupcima jednakih osnovica. Površina stupaca jednaka je proizvodu osnovice i visine. Razlikujemo jednostruke, razdjeljene, dvostruke i višestruke stupce. Razdjeljeni stupci se korsite za prikazivanje strukture pojave u apsolutnim ili relativnim vrijednostima. Pomoću dvostrukih i višestrukih stupaca se vrši poređenje više vremenskih nizova po obimu, strukturi i značaju. Horizontalni histogrami se koriste kada težište treba staviti na poređenje a ne na vremensku komponentu, dva ili više vremenskih nizova.

Poređenje vrem nizova čije su frekcencije na izrazito različitim nivoima nie adekvatno na grafikonu sa aritmetičkim mjerilom, jer varijacije pojava nisu uočljive. Sagledavanje relativnih promjena omogućava nam logaritamsko mjerilo, odnosno primjena polulogaritamskog grafikona. Logaritamsko mjerilo je takvo mjerilo kod kojeg su logaritmi brojeva prikazani određenim dužinama na tom mjerilu. Omogućava nam dobro uočavanje manjih varijacija pri nižim frekvencijama. Strmine linija na grafikonu govore o jačini relativnih promjena. što je razumljivo jer razlika logaritma predstavlja omjer-relativan broj.

19

Page 20: Statistika

Polulogaritamski grafikon se koristi za grafičko prikazivanje dva ili više nizova različitih brojčanih nivoa, pri čemu se na apcisi konstruiše aritmetičko mjerilo a na ordinati logaritamsko mjerilo. Ovaj grafikon se konstruira u pravouglom koordinatnom sistemu, a nastaje spajanjem tačaka čije su koordinate date vrijednostima varijable vrijeme u aritmetičkom mjerilu na apcisi a frekvencijama prema logaritamskom mjerilu na ordinati.

Trenutni vremenski niz se grafički prikazuje linijskim grafikonom i predstavlja stanja u odabranim vremenskim trenucima. Frekvencije niza s različitim udaljenostima nie potrebno korigovati jer ovaj niz nema svojstvo kumulativnosti.

Za grafičko prikazivanje određenih vremenskih nizova koristi se polarni koordinatni sistem. Polarni dijagram se koristi za prikazivanje vremenskih nizova kod kojih su naglašene sezonske varijacije. On se zasniva na duži, koja polazi od jednog proizvoljnog početka, a sama duž predstavlja polarnu osu. Iz tako slobodno izabrane tačke povuče se onoliko poluosi ( radij-vektora) koliko ima intervala u posmatranom vremenskom nizu. Radij-vektori djele ravninu na segmente jednake veličine. Na njih se nanose frekvencije vremenskog niza, pri čemu udaljenost od ishodišta zavisi od veličine empirijskih frekvencija. Za mjesečne podatke mreža polarnog dijagrama se konstruiše tako što se kroz ishodište položi 12 dužina, između kojih je ugao od 30 stepeni. Zatim se na jedan radij-vektor označi aritimetičko mjerilo za frekvencije, te nacrtaju koncetrični krugovi koji prolaze markantnim tačkama mjerila. Spajanjem tačaka dobija se kriva. Što je sezonski uticaj veći, kriva će biti bliža kružnici s većim radijusom i obrnuto. Sezonska pojava često se posmatra kavartalno. Ako vremenski niz čine kvartalni podaci, ugao između dvaju susjednih vektora iznosi 90 stepeni, a pripadajući sektor označava kvartal. Dalje se konstruira na isti način kao i kada radimo sa mjesečnim podacima.

RELATIVNI POKAZATELJI DINAMIKE-mjere promjene jedne pojave ili grupe homogenih pojava u toku vremena u odnosu na neki bazni period. Jednu od najjednostavnijih metoda analize dinamike predstavljaju indeksni brojevi. Indeksi su relativni brojevi koji pokazuju odnose različitih stanja jedne pojave ili jedne grupe pojava u različitim intervalima ili momentima vremena. Olakšavaju sagledavanje dinamike posmatrane pojave jer nepregledne serije svode na procente. Osobina indeksa da izražava odnose promjena pojava u toku vremena i relativna jednostavnost njegovog izračunavanja, uticala je da se indeksi u praksi upotrebljavaju kao najprikladnije sredstvo statističke analize dinamike masovnih pojava.

Razlikujemo indekse strukture i indekse dinamike.Indeksi strukture pokazuju odnos djelova prema cjelini posmatrane pojave u jednom trenutku ili intervalu vremena, dok indeksi dinamike pokazuju promjene u nivou pojave tokom vremena.Indeksi dinamike pokazuju za koliko se jedna pojava ili grupa homogenih pojava promjenila u svom razvojnom toku.

Najpoznatija podjela indeksa dinamike je na individualne i grupne.Individualni indeksi pokazuju odnos između dva stanja posmatrane pojave, a grupni indeksi pokazuju odnos između dva stanja skupine pojava.

20

Page 21: Statistika

Individualni indeksi-pružaju sintetički pogled na evoluciju u odnosu na bazni period i omogućavaju praćenje promjena analiziranih veličina između svih posmatranih perioda. Individualni indeksi se djele na indekse po stalnoj bazi (bazni indeksi) i indekse sa promjenjivom bazom ( lančani indeksi).

Bazni indeksiračunamo kao omjer između veličine pojave u posmatranom i baznom periodu. Period prema kojem se vrši poređenje, naziva se bazni period i označava se sa 100. Kako se sve frekvencije niza dijele s nivoom pojave u baznom periodu, bazni indeksi su proporcionalni veličinama iz kojih su izračunati. Prvi korak u konstrukciji ovog indeksa je izbor baznog perioda. U praksi se često uzima prvi ili zadnji period u nizu kao bazni, i to ima određeni smisio. U sličajevima kada je izbor baznog perioda otežan, ili onemogućen, preporučuje se da se za bazu odabere neka druga veličina, npr aritmetička sredina freksvencija niza ili neka druga vrijednost. Za bazni period treba odabrati period u kojem pojava pokazuje relativno stabilan nivo, ili onaj period u kojem pojava nie bila izložena neubičajnim uticajima.Bazni indeks pokazuje koliko jedinica pojave u vremenu t tolazi na svakih 100 jedinica pojave u periodu b. Uvijek su pozitivni brojevi, mogu biti veći, manji ili jednaki 100. Razlika između 2 bazna indeksa pokazuje indeksne bodove, koji pokazuju apsolutnu a ne relativnu razliku opaženih podataka. Ako od baznog indeksa oduzmemo 100, dobit ćemo stopu promjene novia pojave u odnosu na bazi period.

Lančani indeksiračunamo ih tako što za bazu uzimamo svaki put podatke iz prethodnog perioda. Ovi indeksi nazivaju se i koeficijenti dinamike, jer pokazuju dinamiku i tempo promjene posmatrane pojave u odnosu na prethodni period.Lančani indeksi pokazuju koliko jedinica pojave u periodu t dlazi na svakih 100 jedinica pojave u periodu t-1. Kod lančanih indeksa broj 100 ne označava bazu, nego stagnaciju razvoja neke pojave. Vrijednost iznad 100 pokazuje da je u tekućem periodu pojava zabilježila rast, dok vrijednost ispod 100 pokazuje da je došlo do smanjenja novoa razvoja pojave u odnosu na prethodni period.

OSOBINE INDEKSA:

Osibina identiteta- indeks ostaje nepromjenjen ako se posmatrana veličina ne mjenja.

Osobina tranzitivnosti-ovu osobinu zadovoljavaju indeksi čiji je proizvod jednak odnosu veličine pojave u posmatranom i baznom periodu.

Osibina recipročnosti- se može definisati u odnosu na vrijeme, a govori da je recipročan indeks neutralan u odnosu na vrijeme.

Osobina cirkularnosti- kada je zadovoljena osobina tranzitivnostii recipročnosti, može se reći i da je zadovoljena osobina cirkularnosti.

21

Page 22: Statistika

Prosječna stopa promjenePored individualnih indeksa za iskazivanje relativnih varijacija posmatrane pojave koristi se i prosječna stopa promjene. Ona nije najsretnije rješenje, jer stopa može biti pozitivnog i negativnog predznaka, pa samo ona sa pozitivnim predznakom upućuje na nivo rasta pojave. Može se izračunati na 3 načina: na osnovu geometrijske sredine lančanih indeksa, na osnovu orginalnih podataka i na osnovu baznih indeksa. Geometrijska sredina lančanih indeksa može se izračunati i onda ako su poznati samo prvi i zadnji član niza. Iz osobine tranzitivnosti proističe drugi način za računanje prosječne stope promjene, odnosno direknto iz podataka vremenskog niza. Osnovni nedostatak ovako izračunate prosječne stope rasta proističe iz činjenice da se ona praktično računa samo na osnovu prve i zadnje vrijednosti posmatrane pojave. Ona će biti dobar reprezentat samo ako su koeficijenti dinamike u uzastopnim periodima približno jednaki.Prosječna stopa promjene može da se računa i na osnovu baznih indeksa, jer su oni direknto proporcionalni s empirijskim frekvencijama. Nedostatak ovako dobivene stope jeste što ona uprosječuje rast pojave u svim periodima, bez obzira na različite varijanse unutar niza.Prosječna stopa može se koristiti za predviđanje razvoja pojave, uz pretpostavku da će se pojava i u narednim periodima mjenjati prema izračunatoj stopi.Pored predviđanja razvoja pojave, na osnovu ove stope može se izračunati u kojem će periodu, uz nastavak ispoljene tendencije, pojava dostići određeni nivo.

Grupni indeksiGrupni indeksi omogućavaju sintezu varijacija više srodnih pojava, jer se zbog nekih zajedničkih osobina mogu da posmatraju kao jedna cjelina.Grupni indeksi nam omogućavaju praćenje kretanja kompleksnih pojava, kao što su: proizvodnja, troškovi, cijene, produktivnost rada i sl. Toliko su važni da se kod spominjanja samog pojma indeksa, bez daljeg raščlanivanja podrazumijeva grupni a ne individualni indeksi.

Postupak analize grupe pojava pomoću indeksa provodi se u nekoliko koraka:

- definisanje grupe pojava i namjene grupnih indeksa- izbor elemenata za grupni indeks i njihova identifikacija- prikupljanje podataka o elementima- izbor baze indeksa, određivanje pondera i izraza za izračunavanje grupnih indeksa- ocjena reprezentativnosti indeksa kao prosječnih veličina i provođenje testova o

njihovim teorijskim svojstvima.

22

Page 23: Statistika

Grupni indeksi mogu biti bazni ili lančani. Za računanje grupnih indeksa koristimo metod srednjih vrijednosti i metod agregata.Prema metodu srednjih vrijednosti grupni indeksi se računaju tako što se odredi aritmetička sredina, harmonijska ili geometrijska sredina individualnih indeksa vremenskih nizova. Prema drugom metodu grupni indeksi se računaju tako što se zbir podataka sastavljenih nizova u tekućem periodu stavi u odnos prema zbiru podataka tih nizova u baznom periodu. Zajednička vrijednost na koju se svode različite pojave predstavlja složenu veličinu ( agregat), pa otuda i sam naziv postupka.

Primjena metoda srednjh vrijednosti i metoda agregata u izračunavanju neponderisanih grupnih indeksa opravdana je samo u slučaju kada sastavni nizovi imaju približno isti značaj. U praksi je najčešće slučaj da sastavni nizovi agregata za koje računamo grupni indeks nemaju isti značaj. Zato ove indekse ponderišemo u cilju obezbjeđivanja njihove veće reprezentativnosti kao pokazatelja dinamike više srodnih vremenskih nizova. U stati praksi najčešće korišteni metodi ponderisanja su Laspeyresov i Paascheov metod.

Grupni indeks cijena-je relativan pokazatelj dinamije kretanja cijena grupe pojava u tekućem peridu u odnosu na bazni period. Za računanje koristimo metod srednjih vrijednosti i metod agregata.Prema prvom metodu, grupni indeksi se računaju tako što se odredi sredina individualnih indeksa vremenskih nizova. Prema metodu agregata grupni indeksi se računaju tako što se zbir podataka sastavljenih nizova u tekućem periodu stavi u odnos prema zbiru podataka sastavljenih nizova u tekućem periodu.Metod srednjih vrijednosti ne polazi od orginalnih podataka, nego od njihovih individualnih indeksa, izačunatih na isti bazni period.U praksi se najčešće upotrebljavaju aritmetički i geometrijski indeksi, dok je harmonijski indeks koristi za specifična istraživanja dinamike cijena. Nedostatak ovakvog računanja grupnog indeksa cijena jeste taj što se daje svim nizovima jednak značaj. U praksi je rijedak slučaj da svaka cijena ima jedan ponder. izračunata vrijednost neće biti adevatna ako se u grupi pojavi neke ekstrem, koji na promjeniti indeks na zjanačno visok ili nizak nivo. Ponderisanje ima cilj da istakne relativni značaj pojedinih sastavnih nizova u skupu. Na ovaj način, povećava se reprezentativnost grupnih indeksa kao pokazatelja dinamike vremenskih nizova.

Laspeyresov grupni indeks cijena pokazuje za koliko procenata su se promjenile cijene grupe pojava zajedno u tekućem u odnosu na bazi period, računajući uz neizmjenjene količine iz baznog perioda.( ponderise uzimaju iz baznog perioda)

Paascheov grupni indeks cijena pokazuje za koliko procenata su se promjenile cijene grupe pojava zajedno u tekućem u odnosu na bazni period, računajući uz neizmjenjene količine iz baznog perioda.( ponderi se uzimaju iz trekućeg perioda)

23

Page 24: Statistika

Laspeyresov i Paascheov indeks su jednaki samo u dva slučaja: prvi, kada količine u tekućem periodu ostanu nepromjenjene, i drugi, kada promjena količina ne znači i pr omjenu strukture u tekućem u odnosu na bazni period. Nemaju osobinu tranzitivnosti, ali se pretpostavlja da imaju, jer je numerički skoro zadovoljena. Ponderi Laspeyresovog indeksa su stalni, dok se ponderi Paascheova indeksa mjenjaju za svaki period za koji se računa taj indeks. Nedostatak grupnih indeksa računatih ponderima iz tekućeg perioda je često mjenjanje pondera, pri čemu rezultirajući indeksi nisu međusobno uporedivi. Jedan od razloga zbog koji se ovaj indeks rjeđe koristi od Laspeyresovog je i to što u praksi često ne raspolažemo adekvatnim tekićim/izvještajnim podacima za određivanje pondera.Zbog navedenih problema moguća je kombinacija pondera iz baznog i tekićeg perioda. Fisherov "idealni" grupni indeks cijena računa se kao geometrijska sredina Laspeyresovog i Paascheovog indeksa cijena. Međutim, u praksi nalazi manju primjenu zbog komplikovanos. Za izračunavanje grupnog indeksa cijena koristi je i Marschall-Edgeworthov indeks, kod kojeg se za ponderisanje koristi zbir ponderacionih faktora iz baznog i tekučeg perioda. Ako su svi proizvodi iskazani u istim mjernim jedinicama za ponderisanje aritimetičke sredine individualnih indeksa cijena koristimo količine, a ako mjerne jedinice nisu iste za ponder, koristimo vrijednost.

Grupni indeks količina-pokazuje relativne promjene fizičkog obima grupe pojava. Pri konstrukciji ovih indeksa javljaju se isti problemi kao i kod indeksa cijena. Za svaki vremenski niz u grupi možemo izračunati individualne indekse količina, kojima se upoređuju relativne promjene količina u grupi. Nedostatak ovakvog računanja indeksa( srednji aritmetički gruoni indeks količina) količina je različit značaj količina u praktičnim primjenama. Dobivena vrijednost neće biti adekvatna, ako se pojave ekstremne vrijednosti. Računanje agregatnog neponderisanog grunog indeksa količina je dato kao omjer zbira količina u tekućem i baznom periodu, takođe nije dobar pokazatelj dinamike grupe, s obzirom na prisustvo različitih mjernih jedinica članova zbira ili različite raspone varijacije. Rješenje se nalazi u ponderisanju količina cijenama, odnosno u vrijednosnom izražavanju. Izborom stalnih cijena onemogućava se uticaj promjena cijena na količine u obračunu indeksa. Za pondere možemo uzeti količine iz baznog ili iz tekućeg perioda. Za pondere se u praksi mogu koristiti i neke druge veličine ( najčešće prosječne ili neke druge cijene). I Laspeyresov i Paascheov grupni indeks količina javljaju se u agregatnom obliku, gdje se mjere promjene fizičkog obima, jer su cijene nepromjenjene.Laspeyresov indeks količina pokazuje za koliko procenata su se promjenile količine grupe pojava zajedno u tekućem u odnosu na bazni period, računajući uz neizmjenjene cijene iz baznog perioda.Paascheov indeks količina pokazuje za koliko procenata su se promjenile količine grupe pojava zajedno u tekućem u odnosu na bazni period, računajući uz neizmjenjene cijene iz tekućeg perioda.Kada metod srednjih vrijednosti uzima za pondere vrijednosti iz baznog perioda, onda dobijamo isti rezultat kao i primjenom metoda agregata sa ponderima iz baznog perioda.

24

Page 25: Statistika

Grupni indeks vrijednosti-računa se samo u agrehatnom obliku, i to tako da se vrijednosti tekućeg perioda podjele sa vrijednostima baznog perioda i pomnože sa 100.Ovaj indeks možemo dobiti i množenjem grupnih indeksa cijena i količina od kojih jedan mora biti Laspeyresov a drugi Paascheov. Ovaj indeks se računa kao proizvod indeksa cijena sa ponderom iz baznog perioda i indeksa količina sa ponderom iz tekućeg perioda, odnosno kao proizvod indeksa cijena sa ponderom iz tekućeg perioda i indeksa količina sa ponderima iz baznog pedioda.

Kako cijene nisu postojane u vremenu, procjena realnog razvoja pojave u vremenu nije moguća na osnovu vrijednosti izraženih u tekućim cijenama. Realan uvid u razvoj posmatranih pojava postiže se eliminisanjem uticaja promjena cijena. Postupak eliminisanja uticaja cijena na vrijednosno izražene pojave naziva se deflacioniranje i provodi se dijeljenjem vrijednosti izmaženih u tekućim cijenama sa odgovarajućim grupnim indeksom cijena nemnoženim sa 100. Za ovaj grupni indeks koristi se naziv deflator ili deflacijski indeks. U inflatornim uslovima, kada cijene zamagljuju realnu sliku o razvoju pojave, potreba za deflacioniranjem dolazi do posebnog izražaja. Deflacionirane vrijednosti predstavljaju procjenu realnih veličina i za njih se kaže da su izražene u stalnim cijenama.

Suprotan postupak od deflacioniranja naziva se revalorizacija i predstavlja usklađivanje vrijednosti pojava s nastalim promjenama cijena. Često se vrijednosti za niz perioda daju u cjenama jednog vremenskog perioda. Postupak revalorizacije se provodi množenjem vrijednosti u stalnim cijenama odgovarajućim indeksima cijena nemnoženim sa 100.

TESTIRANJE OSOBINA INDEKSNIH BROJEVA

Za testiranje dosljednosti individualnih i grupnih indeksa najčešće se primjenjuju: test vremenske reverzibilnosti, test faktorske reverzibilnosti i test cirkularnosti.Test vremenske reverzibilnosti (osobina recipročnosti) podrazumjeva da se inverzijom bazne i tekuće vrijednosti ostvaruje recipročnost indeksa, odnosno da upotrijebljeni izraz za računanje indeksa ispunjava

uslov: I t 1(t 2=100)×I t 2(t 1=100 )=1

Ovaj test je važan u slučajevima kada se često mijenja baza indeksnih brojeva. Ako izrazi za računanje indeksa ne zadovoljavaju vremensku reverzibilnost, onda kod preračunavanja indeksa s jedne na drugu bazu dolazi do većih ili manjih odstupanja. Od indeksa računatih prema metodu srednjih vrijednosti , aritmetički i harmonijski indeksi ne zadovoljavaju ovaj zahtjev, dok da geometrijski indeksi, modus i medijana, zadovoljavaju. Agregatni indeks je ponderisan količinom i geometrijski indeks zadovoljava test reverzibilnosti.Pored vremenske reverzibilnosti, indeksi treba da zadovolje i faktorsku reverzibilnost. Indeks cijena pomnožen indeksom količina treba dati vrijednost.

I p1 =

p11

p10 dok je indeks količina za istu godinu sa istom bazom I q 1=

q11

q10

Množenjem indeksa cijena sa indeksom količina dobijemo isti rezultat kao kada direktno računamo indeks vrijednosti za neki proizvod :

I pq =

p1 q1

p0 q0

Ovim primjerom smo pokazali da individualni indeksi zadovoljavaju faktorsku reverzibilnost. Indeksi čiji je proizvod jednak odnosu nivoa posmatrane pojave u tekućem i baznom periodu zadovoljavaju test cirkularnosti. Pored grupnih indeksa, ovaj test zadovoljava srednji grupni indeks, koji

25

Page 26: Statistika

se dobija kao medijan individualnih indeksa, aritmetički i geometrijski neponderisani indeksi i agregatni indeksi sa baznim ponderima. U odnosu na testove reverzibilnosti ovaj test je od manjeg značaja, jer se više koristi za poređenje specifičnih vremenskih intervala a manje za poređenje većeg broja intervala.

ODABRANE METODE ANALIZE VREMENSKIH NIZOVA

U statističkoj literaturi navodi se podjela metoda analize vremenskih pojava nakvantitativne i kvalitativne.Kvalitativne metode koriste se kada se podaci o nekoj pojavi ne mogu kvantificirati ili kada podaci nisu dostupni. Za ove metode je karakteristično da su procjene budućih stanja rezultata rada eksperata. Delphi metoda i metoda scenarija su najčešće korištene kvalitativne metode.Delphi metoda zasniva se na procesu usklađivanja mišljenja eksperata, dok se kod sastavljanja scenarija prvo utvrđuju uslovi u kojima se predviđa odvijanje događaja. Menadžer bira onaj scenariji koji će se prema njegovom sudu ostvariti sa najvećom vjerovatnoćom.Za primjenu kvantitativnih metoda neophodno je da su podaci u prošlom i sadašnjem periodu dostupni, da oslikavaju pravu prirodu posmatrane pojave i da se mogu kvantificirati.Ova metoda koristi statistički pristup, i one su usmjerene na analizu osnovnih karakteristika pojedinačnog niza i na prognoziranje njenih budućih vrijednosti.

Druga grupa metoda koristi ekonometrijski pristu ( kauzalne metode). Ove metode zasnivaju se na pretpostavci da je posmatrana pojava u uzročno-posljedičnoj vezi sa jednom ili više drugih pojava. Koristimo ih kada varijacije jedne pojave objašnjavamo varijacijama druge pojave. Kauzalne metode spadaju u regresionu analizu vremenskih pojava i njima ocjenjujemo regresioni model zavisne varijable u funkciji drugih nezavisnih varijabli.

Holt Wintersov metod izglađivanjaosnovni nedostatak metoda jednostavnog eksponencijalnog izglađivanja je što neomogućava tretman nizova sa trendom i sezonom, prevalizazi ovaj metod izglađivanja. Predstavlja proširenje metoda jednostavnog eksponencijalnog izglađivanja dvjema jednačinama od kojih prvom vršimo reviziju ocjene trenda, a drugom previziju ocjene sezone.

Strukturni modeliradio se o regresionim modelima kod kojih su regresori funkcije vremena sa koeficijentima koji se mjenjaju tokom vremena. Prethodna dva modela( model jednostavnog eksponencijalnog izglađivanja i holt wintersov model ) su preteća ovog modela. Sa računske strane veoma su zahtejvni te zahtvejvaju velik oiskustvo za njihovu uspješnu primjenu.

Box-Jenkinsov metodZasnovan je na klasi ARIMA modela. Na osnovu analize podataka vremenskog niza identifikuje se odgovarajući model iz ove klase a zatim se vrši njegovo ocjenjivanje i provjera adekvatnosti. Postupak se ponavlja ako se pokaže da je model neadekvatan. Ovaj metod daje napreciznije prognoze. Metod je fleksibilan jer razmatra veoma široku klasu mdoela među kojima se po definisanom postupku bira onaj koji najbolje reprezentuje podatke. Osnovni nedostatak metoda dolazi do izražaja već kod etape

26

Page 27: Statistika

identifikacije, a to je da je za korištenje ovog metoda potreban dobro uvježban analitičar sa velikim iskustvom. U svakoj etapi zahtjeva se intervencija od strane analitičara i donošenje odluke u kojem pravcu nastaviti dalje. Uzimajući u obzir velike troškove koji se javljaju pri korištenju ovog metoda, neki autori ga preporučuju samo ako se pokaže da je analitičar kompetentan da koristi metod, da je kompleksnost opravdana ciljevima koji se žele postići i da varijacije u nizu nisu pod dominantnim uticajem trenda i sezone.

Metod stepenaste autoregresijeModel je predložen od strane Newbolda i Gangera i može se posmatrati kao varijanta Box- Jenkinsovog metoda. Njime je pokušano prevazilaženje potrebe za intrevencijom analitičara u svakoj etapi gradnje modela definisanjem potpuno automatskog postupka izbora modela iz klase autoregresionih modela. Sam metod je zasnovan na postupku uključivanja regresora u stepenastoj regresiji. Njihova prednost je u potpunoj automatizaciji uz korištenje standardnih statističkih programskih paketa sa programima za stepenastu regresiju. Nedostatak je što se ograničava samo na klasu autoregresionih modela, iako modelirani vremenski niz može biti generisan procesom pokretnih sredina ili mješovotim ARMA procesom.

Parzenovi ARARMA modeliParzen je izvršio modifikaciju u početnoj etapi Box-Jenkinsovogg modela u tom smislu što ne zahtjeva diferenciranje vremenskog niza u cilju postizanja njegove stacionarnosti. On predlaže korištenje autoregresionih modela prvog ili drugog reda čiji koeficijenti mogu biti veći od jedinice u cilju otklanjanja nestacionarnosti. Nakon toga se niz reziduala tih modela tretira kao stacionarni niz i za nju se bira model iz klase ARMA modela, korištenjem jednog od formanih kriterija. Time je subjektivnost postupka izbora modela, koja je karakteristika Box-Jenkinsovg pristupa, u cjelini ili barem djelimično eliminisana. Ovaj iskorak predstavlja glavni argument koji govori u prilog ovog modela.

Bayesov metodBayesov pristup prognoziranju može se posmatrati kao stohatička verzija Holt-Wintersovog metoda izglađivanja. Omogućava definisanje ne jednog, nego čitavog skupa modela sa apriornim vjerovatnoćama koje analitičar pridružuje svakom modelu iz tog skupa, odnosno koje pridružuje njegovim koeficijentima. Zatim se koeficijenati modela ponovo izračunavaju čim nova opservacija postane dostupna, odnosno određuju se apriorne vjerovatnoće. U praksi je ograničena prijmena ovog metoda zbog računske složenosti i poteškoća koje korisnici imaju u razumijevanju dobivenih rezultata.

27

Page 28: Statistika

KLASIČNA DEKOMPOZICIJA VREMENSKOG NIZADekompozicija vremenskog niza podrazumijeva njegovo raščlanjivanje na sastavne

komponente. Cilj dekompozicije vremenskog niza je identifikovanje uticaja svake komponente pojedinačno. Ova identifikacija je posebno značajna kod pojava sa izraženim periodičnim varijacijama, koje mogu da zamagle pravu sliku o njenom osnovnom kretanju. Na osnovu empirijskog niza i izračunatih nekih od komponenti možemo utvrditi uticaj ostalih faktora sadržanih u nepoznatim komponentama. Brojni faktori koji određuju kretanje vremenskih pojava, prema prirodi svog djelovanja, mogu podjeliti na sistematske i nesistematske. Kod sisitematskih komponenti prisutne su određene pravilnosti u djelovanju na posmatrane pojave. One su u stat literaturi detaljno razrađene i pronađeni su adekvatni postupci za njihovo kvantificiranje. U ove komponente ubrajamo : trend, cikličnu i sezonsku komponentu. Za razliku od njih, rezidualna( slučajna, iregularna, stohastička) komponenta je nesistematska.Vremenski niz može sadržavati nijednu, jednu ili sve tri sistematske komponente, međutim u analizi je uvijek prisutna rezidualna komponenta.

Opšti model vremenske pojave javlja se u aditivnom ili multiplikativnom obliku, a rijetko je kombinovanog( mješovitog) oblika. Međusobna veza datih komponenti može biti aditivna, multiplikavitna ili kombinovana.Kod aditivnog modela svako zapažanje vremenskog niza jednako je zbiru 4 komponente, odnosno:

Y=T+C+S+RY-vremenski niz; T-trend; C-cikličnu; S-sezonsku; R-slučajnu(rezidualnu) komponentu.

U aditivnom modelu sve komponente su izražene u istim mjernim jedinicama kao i orginalni niz. Kod ovog modela pretpostavlja se da sezonska i rezidualna komponenta ne zavise od trenda, da se amplituda sezonskih varjacija ne mijenja s vremenom, te da je tokom godine prosjek sezonskih fluktuacija jednak nuli. Model se koristi kada sa smanjenjem(povećanjem) nivoa pojave tokom vremena uticaj sezonske komponente ostaje nepromjenjen. Treba napomenuti da se trend i ciklična komponenta često ne razdvajaju i zajednički označavaju sa T.

Multiplikativni model predstavlja proizvod 4 komponente i dat je slijedećim izrazom:Y= T * Ic * Is * Irgdje je trend komponenta data u orginalnim mjernim jedinicama, a ostale 3 komponente

izražene su kao indeksi.

28

Page 29: Statistika

Model se logaritamskom transforamcijom svodi na aditivni oblik:logY= logT+logIc+logIs+logIrOvaj model se najčešće koristi u praksi, jer on pretpostavlja relativan uticaj komponenti na vremenski niz. Multiplikavitni model nije pogodan ako vrijednosti nekih komponenti imaju negativan predznak ili su bliske nuli,pa se za to koristi kombinaovani oblik. Aditivnim i multiplikativnim modelom se predstavlja razvoj nivoa pojave, a ne njena dinamička struktura.Primjer kombinovanog modela dat je slijedećim izrazom:

Y=T*C+RUslov za primjenu kombinovanog modela je da su sezonska i rezidualna komponenta međusobno nezavisne, ali da obje zavise od trenda. U praksi su moguće sve kombinacije.U svakoj kombinaciji pristuna je slučajna komponenta. To je zbog toga što se kretanje pojava u vremenu ne može objasniti samo f-jom vremena.

TREND KOMPONENTATrend predstavlja razvojnu tendenciju pojave u posmatranom vremenskom periodu. Ova tendencija označava karakterističnu i zakonomjernu liniju kretanja posmatrane pojave u vremenu kao niz prosječnih, teorijskih tačaka kroz koje bi pojava prolazila u svojoj prirodi, da nije bilo uticaja sistematskih i nesistematskih faktora u njenom toku.Trend izražava prosječno stanje u svakom od posmatranih perioda, pa zbog te osobine onpredstavlja dinamičku srednju vrijednost.Kada te teorijske podatke unesemo između empirijskih podataka niza vršimo interpolaciju trenda. Svako procjenjivanje nivoa posmatrane pojave izvan vremenskog raspona u kojem je dat niz empirijskih podataka, bilo da je procjenjivanje za buduće ili prošlo vrijeme, naziva se ekstrapolacija trenda.Procjenjivanje se zasniva na pretpostavci da će se svi faktori koji su djelovali na kretanje pojave u prošlosti, djelovati i dalje u istom smjeru i približnim intenzitetom.Cilj dinamičke analize vremenskih nizova metodom trenda je predviđanje budućeg razvoja posmatrane pojave na temelju ispoljene i uočene zakonitosti njenog kretanja. Trend komponenta se pripisuje djelovanju postojanih faktora, kao što su: razvoj nauke i tehnike, rast populacije, ponašanje potrošača...Ako se kod izdvajanja trend komponente svim korištenim podacima pridaje isti značaj bez ozbira na njihovu udaljenost od sadašnjeg perioda, onda je riječ o globalnom trendu. Razvijeni su i metodi ocjenjivanja lokalnog trenda kod kojih se novijim podacima pridaje veći značaj u odnosu na podatke sa početka vremenskog niza. Trend koji pod uticajem raznih rezidualnih faktora i kojeg ne možemo predvidjeti na osnovu prošlih i sadašnjih podataka naziva se stohastički trend.Teorijski posmatrano, za primjenu trenda potrebno je onoliko podataka koliko je dovoljno da se sagledaju barem 2 zaokružena ciklusa karakterističnih varijacija, kako bi se moglo govoriti o ponavljanju različitosti njihovih nastajanja. Mada ne postoji egzaktno pravilo kojim se određuje dovoljna dužina vremenskog niza, u statističkoj literaturi se najčešće uzima period od najmanje 10 godišnjih frekvencija.

29

Page 30: Statistika

Osnovna razlika između metode najmanjih kvadrata u regresionoj analizi i metode najmanjih kvadrata kod trenda je slijedeća:

1. u regresionoj analizi elementi slučajnog uzorka su međusobno nezavisni, a u analizi vremenskih nizova podaci nisu nezavisni, jer u obzir uzimamo njihov vremenski poredak

2. za razliku od regresione analize, gdje je za svaku vrijednost nezavisne varijable moguće putem uzorka uzeti veći br vrijednosti zavisne varijable, kod vremenskih nizova nije moguće uzeti više od jednog podatka u jednom periodu vremena.

3. zbog prethodno navedenog, intervali procjene prosječne vrijednosti i intervali predviđanja individualne vrijednosti zavisne varijable koje smo korsitili kod regrsije, kod analize trenda su krajnje nepouzdani i nećemo ih koristiti.

4. kod izračunavanja standardne greške regresije zbir kvadrata odstupanja smo dijelili sa brojem stepeni slobode. Kod trenda ćemo formulisati mjeru sa istim značenjem ali zbir kvadrata odstupanja nećemo djeliti sa stepenima slobode.

IZBOR VRSTE TRENDA

Za izbor vrste trenda primjenjuju se odgovarajuće statističke metode apriornog( prethodnog) i aposteriornog ( naknadnog ) opredjeljenja. U metode apriornog opredjeljenja ubrajamo: grafički prikaz, metod diferencije, izračunavanje pomičnih prosjeka.

Prvu sliku o dinamici pojave tokom vremena možemo uočiti na osnovu grafičkog prikaza vremenskog niza. Ovaj metod je krajnje subjektivan.

Metod diferencije se bazira na izračunavanju razlika uzastopnih članova niza. Ako su apsolutne razlike uzastopnih frekvencija približno jednake tokom cijelog obuhvaćenog perioda, tada će linearna f-ja najbolje odražavati dugoročnu razvojnu tendenciju pojave. Prva diferencija predstavlja razliku između vrijednosti podataka vremenskog niza u 2 sukcesivna perioda. Kvadratna f-ja (parabola drugog stenepa) će najbolje odražavati dugoročnu tendenciju ako su druge diferencija približno jednake. F-je višeg stepena odgovarale bi za one vremenske nizove čije su treće diferencije približno jednake. Kada su razlike logaritamskih vrijednosti uzastopnih podataka približno jednake, pojava ispoljava osobine geometrijske progresije, pa će tada najbolje odgovarati eksponencijalna f-ja.Ima slučajeva kada je kretanje pojave takvo da se opšta dugoročna razvojna tendencija ne može izraziti ni jednom do sad navedenom f-jom. Tada se primjenjuju složene f-je krive kojima se najbolje aproksimira takvo kretanje, i tu spada: modifikovana eksponencijalna kriva, Gompertzova kriva i logistička kriva. Pogodne su za izračunavanje dugoročne razvojne tendencije kod pojava koje su u svom kretanju približavaju jednoj granici- asimptoti.

Izračunavanjem pomičnih prosjeka povezuju se promjene manjih ili većih grupa podataka, pa se u izvjesnoj mjeri elminiraju kratkoročne i srednjoročne oscilacije i ističe osnovni dugoročni razvoj pojave u vidu prosječnog kretanja. Osnovna ideja metoda pomičnih prosjeka je u zamjeni orginalnih podataka sa aritimetičkim sredinama, čijom promjenom eliminiramo tekuća kolebanja. Ovi prosjeci mogu da se računaju u obliku proste ili vagane aritmetičke sredine.

30

Page 31: Statistika

LINEARNI TRENDAko se analizirana pojava mjenja na približno isti apsolutni iznos tokom cijelog obuhvaćenog perioda tada će linearni trend najbolje odražavati dugoročnu razvojnu tendenciju. Odsječak kod linearnog trenda predstavlja prosjek vremenskog niza u posmatranom periodu, dok nagib pokazuje prosječnu promjenu vremenskog niza u sukcesivnim vremenskim intervalima odgovarajućeg perioda. Parametri su nepoznate veličine i jedino možemo da ih procjenimo pomoću uzorka.Model linearnog trenda predstavlja model trend-polinoma prvog stepena, jer je njegov deterministički dio linearna f-ja vremena.Konstantni član a predstavlja vrijednost trenda za vremenski period koji prethodi prvom(x=0), dok b pokazuje prosječnu linearnu promjenu posmatrane pojave pri jediničnoj promjeni varijable vrijeme.Ekstrapolacija trenda predstavlja produživanje linije trenda izvan intervala obuhvaćenog vremenskim nizom. Cilj ekstrapolacije je prognoziranje nivoa posmatrane pojave u budućnosti. Na kvalitet prognoziranja utiče mnogo faktora: dužina posmatranog vremenskog niza, relativna društveno-ekonomska stabilnost i sl. Model sa ocjenjenim parametrima može se koristiti u prognostičke svrhe ako pretpostavimo da će trend biti postojan u prognostičkom horizontu.

PARABOLIČKI TRENDKada su druge diferencije (razlike prvih diferencija) približno jednake umjesto linearnog trenda koristi se parabolički trend. Druge diferencije vrijednosti polinima drugog stepena su konstantne, pa je to razlog njegovog izbora kao f-je vremena u modelu trenda.Radi se o onim pojavama čije se kretanje u posmatranom periodu odvija na disharmonično, odnosno na početku brže, a zatim kasnie sporije i obratno. Ovaj model treba tretirati kao analitički izraz dinamike pojave i posmatrati ga kao cjelovit izraz.Parametar a kod paraboličkog trenda predstavlja vrijednost trenda u periodu označenom 0. Kada je predznak parametra b2 negativan, onda je otvor parabole okrenut prema dole, odnosno ako je parametar b2 pozitivan, otvor parabole je okrenut prema gore.Pri ekstrapolaciji paraboličkog trenda treba biti veoma oprezan, jer pojava koja je u posmatranom periodu imala rast i opadanje može ponovo obrnuto smjer svog kretanja. U prognoziranje kretanja pojave za udaljenije periode ne treba se upuštati.

EKSPONENCIJALNI TREND-pripada grupi nelinearnih f-ja i koristimo ga kada vremenski niz pokazuje karakteristike geometrijske progresije. Osnovna karakteristika ovakvih kretanja se može uočiti već na grafičkom prikazu gdje empirijske vrijednosti na početku sporije rastu a kasnije sve brže i brže. Ovaj trend se najbolje prilagođava empirijskim podacima vremenskog niza kada pojava pokazuje približno jednaku ralativnu promjenu (rast ili pad), odnosno kada su apsolutne razlike logaritmovanih podataka približno iste. Ovaj trend je najbolje prilagođen vremenskom nizu ako se u polulogaritamskom grafikonu podaci grupišu približno oko prave linije. Konstantni član a predstavlja vrijednost trenda za vremenski period u kojem je x=0, dok na osnovu b možemo računati prosječnu stopu promjene. Eksponencijalna prosječna stopa promjene pokazuje za koliko procenata pojava, u prosjeku, raste ili opada u posmatranom periodu. Rješavanje eksponencijalne f-je se vrši pomoću logaritmovanja. Logaritmiranjem eksponencijalni trend smo transformovali u model linearnog trenda. U literaturi se za ovaj model koristi i ime log-lin model, jer je vremenski niz y logaritamovan a na desnoj strani su orginalne vrijednosti var vrijeme x.Do procjene param.dolazimo antilogaritmovanjem prethodno dobivenih vrijednosti.

31

Page 32: Statistika

CIKLIČNA KOMPONENTADa bi se kod vremenskih pojava ustanovila prisutnost cikličnih kretanja neophodan je vremenski niz sa dovoljno obuhvaćenim obnavljanjima. Međutim, u praksi se ne raspolaže vremenskim nizovima sa dovoljno članova, pa se trend i ciklična komponenta posmatraju zajedno.Cikličnu komponentu predstavljaju faktori koji svojim djelovanjem na posmatrane pojave dovode do njihovih oscilacija iznad ili ispod utvrđene prosječne razvojne tendencije u trajanju od nekoliko godina. Kada se pojava obnavlja napribližno jednak način s periodom od dvije ili više godina, kažemo da su prisutne ciklične varijacije. Početak ciklusa označava relativno nizak nivo pojave, koja se u fazi rasta povećava do nekog maksimuma, nakon kojeg slijedi pad pojave. Poslije minimuma, slijedi rast i obnavljanje puta na približno jednak način. Kod prognoziranja javljaju se velike poteškoće, jer se kod posmatranih pojava mijenja i trajanje i (dužina) ciklusa i indenzitet odstupanja (amplituda).Testiranje značajnosti ciklične komponente bazirano je na rasporedu frekvencije dužine pojedinih faza, tj razmaka između prevojnih tačaka. Ove tačke u stvari pokazuju momente kada niz prestaje da raste i počinje da opada i obrnuto. Kada su ciklične varijacije značajne, broj dugotrajnih faza biće veći.

METODE IZGLAĐIVANJAU svakom vremenskom nizu prisutna su određena kolebanja vrijednosti pojedinačnih frekvencija, koja nekada mogu otežati oučavanje osnovne razvojne tendencije posmatrane pojave. Da bismo riješili taj problem, potrebno je reducirati slučajne varijacije primjenom postupaka izglađivanja vremenskog niza. Izglađivanje vremenskog niza podrazumijeva izačunavanje aritimetičkih sredina za posmatranu pojavu. Na ovaj način se reducira uticaj sezonske i rezidualne komponente, dok se trend i ciklična komponenta manifestuju u nešto jasnijem obliku.Metoda pomičnih prosjeka i metoda jednostavnog eksponencijalnog izglađivanja predstavljaju najčešće korištene metode pomoću kojih se vrši izglađivanje vremenskih nizova.

Metoda pomičnih prosjekaPomični prosjeci predstavljaju transforamaciju orginalnog vremenskog niza gdje se svaka frekvencija zamjenjuje prosjekom. Prosjek se računa na osnovu određenog broja narednih i isto toliko prethodnih frekvencija. S obzirom na to da se primjenom ove metode pomjeramo od početka niza sve do njenog kraja, ova metoda je dobila naziv pomični prosjek. Izglađivanje se bazira na ideji da će svaka neregularna komponenta u svakom vremenskom trenutku prouzrokovati manji efekat ako je u toj tački uprosječimo s njenim susjednim veličinama. Što više članova niza uzmemo za računanje prosjeka, linija će biti izglađenija, ali će nam nedostajati više prosjeka u odnosu na broj orginalnih podataka.U praksi koristimo 2 oblika ove metode: jednostavni i ponderisani(vagani).Jednostavni pomični prosjeci predstavljaju prosjeke m uzastopnih frekvencija posmatranog vremenskog niza. Ako je broj članova pomičnog prosjeka M neparan, tada će ukupno M-1 orginalnih podataka ostati bez svog pomičnog prosjeka. Ovaj nedostatak metode je sve više izražen što uzimamo grupe sa većim brojem članova. Ako je broj članova pomičnog prosjeka M paran, onda ce ukupno M orginalnih podataka ostati bez svog pomičnog prosjeka.

32

Page 33: Statistika

U slučaju kada je broj članova pomičnog prosjeka M paran, aritmetička sredina neće se uklapati u neki tačno određen period, nego između 2 perioda za koja raspolažemo empirijskim podacima. Kako su ovako dobiveni prosjeci nepodesni za korištenje, provodimo postupak centriranja. Ovaj postupak se provodi na različite načine i omogućava da se centrirani prosjeci računaju kao aritmetička sredina prethodno izračunatih pomičnih prosjeka od 2 člana.Prednost metode pomičnih prosjeka ogleda se u jednostavnom izračunavanju. Poteškoće u primjeni ove metode javljaju se kod izbora dužine pomičnog prosjeka M i pondera frekvencija. U praksi se obično za veće fluktuacije oko trenda koristi prosjek veće dužine i obratno. Nedostatak je i manjak podataka o trendu u početnim i završnim vremenskim periodima.Oscilacije nisu pravilne i nemaju stalan period obnavljanja. Pomični prosjeci, ustvari, sugerišu da postoji ciklično kretanje i ta se pojava naziva Slutcky-Yuleov efekat.

Metoda jednostavnog eksponencijalnog izglađivanjaCilj ove metode je ozglađivanje empirijskih podataka, kako bi se eliminisali ili reducirali slučajni uticaji kod posmatrane pojave.Ova metoda nudi kompromis, nudeći prognoze koje se baziraju na ponderisanom prosjeku sadašnjih i ranijih vrijednosti. Metoda bazirana na ideji o kvalitetu raspoloživih podataka, koji u najvećoj mjeri zavise od njihove starosti. Stariji podaci su manje korisni, pa im je potrebno dati manju važnost. Noviji podaci zadržavaju najvjerovatnije informacije o onome što je za realno očekivati da će se dogoditiu budućnosti. U izračunavanju tog prosjeka, najveći ponder pridaje se najnovijem podatku, nešto manji podatku koji mu neposredno prethodi, još manji njemu prethodnom podatku.Jednostavno eksponencijalno izglađivanje podrazumijeva transforamaciju vremenskog niza gdje su orginalni podaci zamjenjeni ponderisanim prosjekom svih prethodnih podataka, sa ponderima koji se eksponencijalno smanjuju sa starošću podataka.Ovaj metod je primjeren za izglađivanje vremenskih nizova bez sistematskih komponenti. Koristi se za pojave koje karakterišu slučajne varijacije oko prosjeka, odnosno one koje nemaju izražen trend. Sadrži li trend, koristit ćemo model dvostrukog, trostrukog odnosno višestrukog eksponencijalnog izglađivanja. Prisutnost sezonske komponente takođe će upućivati na korištenej odg modela izglađivanja.Ulogu pondera ima konstanta izglađivanja α koja može uzeti vrijednost između 0 i 1. Ponderi predstavljaju geometrijski red, a njihov zbir je jednak 1. Konstanta izglađivanja određuje brzinu kojom protekle vrijednosti gube svoj uticaj na izglađenu vrijednost u vremenu t. Veća vrijednost konstante izglađivanja znači brži gubitak uticaja i obrnuto. Što je vrijednost konstante manja, vremenski niz će biti više izglađen. Ne postoji egzaktan način određivanja konstante izglađivanja. U praksi se najčešće uzimaju vrijednosti između 0.2 i0.3. Jedna od mogućnosti određivanja konstante jeste i lično iskustvo.Uspješnost izglađivanja utvrđuje se na osnovu razlike između orginalnih podataka i izglađenih vrijednosti. Bira se ona vrijednost konstante koja minimizira vrijednost srednje kvadratne greške. Najvažnije prednosti ove metode su : uzima u obzir sve prošle podatke, zahtjeva mali broj podataka, veći značaj daje novijim podacima, predstavlja osnovu nekim razrađenijim metodama prognoziranja. Nedostaci metode: izbor konstante izglađivanje nije jednostavan, ne može se koristiti u analizi pojava sa izraženim trendom i sezonalom, najčešće nie dobar metod za srednjeročno i dugoročno prognoziranje, velike slučajne fluktuacije mogu jako uticati na kvaltiet prognoziranja.

33

Page 34: Statistika

SEZONSKA KOMPONENTAutiče na kretanje pojave tako da ona odstupa od svoje osnovne tendencije utvrđene trendom na više ili na niže. Prisustvo sezonskih varijacija zamagljuje uočavanje osnovne razvojne tendencije pojave, pa se samo njihovim isključivanjem može sagledati osnovni razvojni tok. Postupak isključivanja sezonskih varijacija iz vremenskog niza naziva se desezoniranje ili sezonsko izglađivanje. Sezonski uticaj je izražen u turizmu, saobraćaju, građevini..Sezonske varijacije pokazuju promjene određene pojave, koje se ponavljaju tokom više godina u isto doba, u istom smjeru i približno istim intenzitetom. Kod nekih ekonomskih i društvenih pojava sezonske varijacije se izražavaju na isti način tokom vremena. Kada se sezonal ispoljava na približno na isti način iz godine u godinu, kažemo da je djelovanje sezonskih faktora stabilno. Tada za sezonsku komponentu kažemo da je determinističke prirode, jer se njena priroda ne mjenja tokom više godina. Ako sezonske varijacije mjenjaju intenzitet i periodičnost ponavljanja u svakom narednom periodu onda govorimo o nestabilnom sezonskom ritmu. U tom slučaju sezonska komponenta je stohastičke prirode. Smjer i intenzitet sezonskog varijabiliteta mjeri se sezonskim indeksima. Sezonski indeksi su relativni brojevi koji mjere jačinu sezonskog uticaja u određenom mjesecu(kvartalu) tokom više godina. Tipični indeksi predstavljaju uopšten intenzitet sezonskog varijabiliteta za više godina. Preko specifičnih izračunavaju se tipični sezonski indeksi, koji treba da reprezentuju sezonska odstupanja tokom cjeog posmatranog perioda. Indeksi čija je vrijednost preko 100 pokazuju da posmatrana pojava zbog sezonskih uticaja raste. Indeksi čija je vrijednost ispod 100 pokazuju da pojava opada pod uticajem sezone. S obzirom na to da sezonski indeksi variraju oko 100 njihov zbir kod kvadratnog niza mora biti jednak 400, tj. kod mjesečnog niza mora iznositi 1200. Kod oba niza prosjek je jednak 100.Prve informacije u analizi sezonskog karaktera pojave najlakše je dobiti iz grafičkog prikaza. Najjednostavniji je linijski grafikon sa ucrtanim podacima svih posmatranih perioda, jer on omogućava oučavanje sezonskih kolebanja.Osnov za numeričko izražavanje sezonskih uticaja je model. Iskustva pokazuju da u procesu analize vremenskih nizova multiplikativni modeli daju bolje rezultate.Za ciklične pojave je karakteristično da se obnavljaju u periodu od najmanje dvije godine, ali se u praksi javlja problem vremenskih nizova odgovarajuće dužine. Jedno od mogućih rješenja za prevazilaženje ovog problema je spajanje trenda i ciklične komponente u jednu komponentu. ( Y= T * Is * Ir )Postoje 2 pristupa mjerenju sezonskih varijacija: empirijski(tradiocionalni) i regresioni (modelski) pristup. Mod modelskog pristupa sezonska priroda se mjeri uključivanjem sezonskih nezavisnih varijabli u regresioni model vremenskog niza ili posebnom vrstom modela tzv. ARIMA modelima.Mjerenje sezonskih varijacija po metodu pomičnih prosjeka zasniva se na njihovom izdvajanju od ostalih komponenti. Osnovna ideja je da ovi prosjeci obuhvate zajedno trend i cikličnu komponentu, te da se djeljenjem orginalnih frekvencija s pripadajućim pomičnim prosjecima isključi njihov uticaj. Na ovaj način ostaju još sezonska i rezidualna komponenta. Specifični sezonski koeficijenti, osim sezonskih, u sebi sadrže i neregularne uticaje, koji se isključuju tako što se izračunavaju prosjeci svih specifičnih sezonskih koeficijenata za istoimene kvartale(mjesece). Množenjem tih prosjeka sa 100 dobijamo sezonske indekse.Da bismo u analizi vremenskog niza dobili čist uticaj sezone, neophodne je podjeliti orginalne frekvencije sa trend, ciklus i rezidualnom komponentom.

34

Page 35: Statistika

Analiza sezonske pojave za kvartalne podatke po metodu odnosa prema pomičnom prosjeku obuhvata sljedeće korake:

• izračunati centrirane četveromjesečne pomične prosjeke za niz kvartalnih podataka

• izračunati omjere orginalnih frekvencija i pripadajućih vrijednosti pomičnih prosjeka

• izračunati prosjek ili medijan izračunatih omjera u preth koraku za istoimene kvartale

• ako je zbir tipičnih sezonskih koeficijenata jednak 4, onda te vrijednosti predstavljaju sezonske faktore. Vrijednosti se koriguju ako zbir nije jednak 4. Sezonski faktori istoimenih kvartala jednaki su za cjeli posmatrani period.

• djeljenjem orginalnih frekcencija niza tipičnim sezonskim koeficijentima dobijaju se desezonirane vrijednosti, tj vrijednosti niza očišćene od uticaja sezone.

• djeljenjem desezoniranih vrijednosti odgovarajućim pomičnim prosjecima izračunavaju se faktori rezidualnog uticaja.

Analiza sezonske pojave za mjesečne podatke po metodu odnosa prema pomičnim prosjecima vrši se analogno kao i za kvartalne podatke. Prvo se izračunaju dvanaestomjesečni pomični prosjeci, zatim se orginalne frekvencije podjele pripadajućim pomičnim prosjecima, računaju se sezonski faktori(čiji zbir treba biti jednak 12)-koji omogućavaju desezoniranje, i na kraju se izračunavaju faktori rezidualnog uticaj

35