31
Skripta iz statistike Pojam I razvoj statistike: Reč statistika prvi put je objavljena u prvoj polovini XVIII veka u radovima Gottfried Achenwal-a, profesora univeryiteta u Getingu. Uveo je u praksu naziv statistika I smatrao je da taj naziv dolazi od italijanske reči ‘stato’ što znači država. Statistika se prvobitno odnosila na skup numeričkih podataka o stanju posmatrane pojave. Otuda se kao poreklo reči ‘statistika’ navodi I latinska reč status,što znači stanje a statistika bi bila opisivanje stanja. Osnovni zadatak statističkih akcija svodio se u početku na prikupljanje podataka o brojnom stanju stanovnika, vojnika, poreskih obaveznika, imovine, jer su vladari oduvek želeli da znaju kolika je njihova vojna I finansijska moć. Prva upotreba statistike se smatra da je bila upotrebljena još u Kini pre 4000 godina, u Egiptu 3000 godina pre naše ere. Prvi organizovaniji popis je izvršen u starom veku u rimskoj republici. Ovi popisi su bili vr.značajni za razvoj statistike, a vršeni su svake pete godine u odredjeno vreme I na istom mestu. Stanovnici su davali podatke cenzoru (popisivaču) o imenu, polu,starosti I prebivalištu I imovnom stanju zasebe I članove svoje porodice. Prvi popis izvršen je 550 godine za vlade servija Tulija. Taj popis Rimljani zovu cenzus, kako su se kasnije zvala u drgim zemljama razna statistička snimanja- cenzusi. U sreednjem veku se ekonomska snaga države zasnivala na poljoprivredi, zbog čega su uglavnom bili vršeni popisi stoke I zemljišta. U XVI veku su u nekim evropskim zemljama ustanovljeni registri rodjenih, umrlih, venčanih lica, iz kojih se kasnije javljaju prvi organi statističke službe I prve statističke publikacije. Začeci statistike kao naučne discipline nastali su skoro istovremeno u Nemačkoj I Engleskoj u XVIII veku, kada se javljaju

Skripta Iz Statistike

  • Upload
    -

  • View
    154

  • Download
    2

Embed Size (px)

DESCRIPTION

statistika 1

Citation preview

Page 1: Skripta Iz Statistike

Skripta iz statistike

Pojam I razvoj statistike:Reč statistika prvi put je objavljena u prvoj polovini XVIII veka u radovima Gottfried Achenwal-a, profesora univeryiteta u Getingu. Uveo je u praksu naziv statistika I smatrao je da taj naziv dolazi od italijanske reči ‘stato’ što znači država.

Statistika se prvobitno odnosila na skup numeričkih podataka o stanju posmatrane pojave. Otuda se kao poreklo reči ‘statistika’ navodi I latinska reč status,što znači stanje a statistika bi bila opisivanje stanja. Osnovni zadatak statističkih akcija svodio se u početku na prikupljanje podataka o brojnom stanju stanovnika, vojnika, poreskih obaveznika, imovine, jer su vladari oduvek želeli da znaju kolika je njihova vojna I finansijska moć.

Prva upotreba statistike se smatra da je bila upotrebljena još u Kini pre 4000 godina, u Egiptu 3000 godina pre naše ere. Prvi organizovaniji popis je izvršen u starom veku u rimskoj republici. Ovi popisi su bili vr.značajni za razvoj statistike, a vršeni su svake pete godine u odredjeno vreme I na istom mestu. Stanovnici su davali podatke cenzoru (popisivaču) o imenu, polu,starosti I prebivalištu I imovnom stanju zasebe I članove svoje porodice. Prvi popis izvršen je 550 godine za vlade servija Tulija. Taj popis Rimljani zovu cenzus, kako su se kasnije zvala u drgim zemljama razna statistička snimanja- cenzusi.

U sreednjem veku se ekonomska snaga države zasnivala na poljoprivredi, zbog čega su uglavnom bili vršeni popisi stoke I zemljišta. U XVI veku su u nekim evropskim zemljama ustanovljeni registri rodjenih, umrlih, venčanih lica, iz kojih se kasnije javljaju prvi organi statističke službe I prve statističke publikacije.

Začeci statistike kao naučne discipline nastali su skoro istovremeno u Nemačkoj I Engleskoj u XVIII veku, kada se javljaju dve statističke koncepcije. Po jednoj koju je zastupala nemačka Univerzitetska statistika, inspirisana radovima H.Conringa, I njegovih sledbenikaod kojih su najpoznatiji M.Schmeitzel I G. Achenwel, zadatak statistike je sistematizacija podataka o stanovništvu I privredi u cilju vodjenja državne politike, bez pretenzija na otkrivanje zakonitosti. Zadatak statistike zasivao se uglavnom na opisu, deskripciji, pa je I kasnije ovaj pravac nazvan još I deskriptivna škola ili državopis.

Dok je u Nemačkoj I ostalim zemljama kontinentalne Evrope razvoj statistike bio pod snažnim uticajem univerzitetske škole-državopisa, dotle se u Engleskoj razvila druga statistička koncepcija Politička aritmetika. Ona je istakla zahtev za matematičkom obradom statističkih podataka I otkrivanjem zakonitosti u ponašanju posmatranih pojava, čime je otvoren put brzom razvoju savremene statistike. Pripadnici ove škole, J.Graunt, w.Petty, E.Hallez I njihovi sledbenici postigli su značajne rezultate u istraživanju odnosa demografskih,socioločkih I ekonomskih pojava.

Page 2: Skripta Iz Statistike

Od kraja XVIII veka naglo se razvija statistička teorije I metodologija zahvaljujući pre svega razvoju teorije verovatnoće I složenijim matematičkim operacijama, čemu su posebni doprineli P.Laplace I A.Quetelet. polazeći od rezultata njihovih radova otkrivena su I razredjena tokom XIX veka nova tehnička rešenja I teorijska saznanja koju su omogućila još brži razvoj I savremena dostignuća statistike.

Značaj I uloga A.Quetelta razvoju statistike naročito se ogleda u njegovom doprinosu razvoja medjunarodne statistike. Na njegovu inicijativu je održan prvi kongres statističara u Briselu 1853.godine. Medjunarodni statistički institut je osnovan je 1885.godine I do danas neprekidno radi prvenstveno na teoriji statistike.

Medju značajnijim statističarima izdvajaju se W.S.Gosset, L.H.Tippett,U.Jule, M.G.Kendall,R.A.Fischer,zates,W.M.Deming,N-Jeyman,A.A.Čuprov,Klomogorov,Gnedenko,Lehman…

Značajan podstrek bržem razvoju I široj primeni statistike tokom druge polovine Xxveka predstavljao je nesumnjivo I nagli razvoj sistema elektronskih računara koji velikom brzinom apsorbuju preradjuju I emituju informacije.

Pomoću statističkih metoda vrše se procene,odmeravaju rizici,istražuju tendencije,analiziraju odnosi I faktori koji ih odredjuju.Ona se bavi I kvantitativnom deskripcijom stanja, ali stanja shvaćenog u smislu trenutka li tačke na dinamičnoj liniji razvoja.

Pod statistikom se danas podrazumeva trostruki sadržaj. Pored statistike u užem smislu ili deskriptivne statistike, ona obuhvata statističku analizu I statističku teoriju.

*Statistika u užem smislu ili deskriptivna statistika usmerena je na prikupljanje, obradu I prezentiranje podataka.

*Statistička analiza podrazmeva skup statističkih metoda kvantitativne analize pojava I njihovih odnosa, koji omogućuju pribavljanje numeričkih informacija, njihovu kvalitativnu interpretaciju, donošenje zaključaka I formulisanje zakonitosti ponašanja posmatranih pojava.

* Statistička teorija iznalazi statističke metode, objašnjava ih, dokazuje I usavršava.

Predmet i statističkog izražavanjaPredmet statističkog istraživanja su masovne pojave,koje su po svojoj prirodi varijabilne, pa ih treba posmatrati na velikom broju slučajeva i na osnovu tih posmatranja doneti zaključke. Zbog toga se statistika najčešće interpretira kao naučni metod kvantitativnog istrivanja masovnih pojava. Dakle statistika istražuje masovne pojave i to istraživanje ima kvantitativan karakter.

Page 3: Skripta Iz Statistike

Varijabilitet je opšte svojstvo svih pojava jer svaka pojava nastaje pod uticajem nekih faktora. Ponašanje pojave zavisi od prirode, broja i načina kombinovanja ovih faktora. Kako faktori koji deluju na pojavu varijabilni, to će i pojava pokazati manje ili više su faktori koji deluju na pojavu varijabilni to će i pojava pokazati manje ili više izražen varijabilitet. Najmanji varijabilitet individualnih slučajeva pokazuju tzv. Elementarne pojave, čije se ponašanje javlja kao rezultat delovanja malog broja faktora. Odnosi izmedju ovih pojava i faktora koji ih uslovljavaju ponavljaju se na približno isti način u svim konkretnim slučajevima. Otuda se kod takvih pojava može uspešno primenjivati metod pojedinačnog posmatranja, tj. Ispitivanje se ograničava na jedan ili nekoliko slučajeva.

Ponašanje ovakvih pojava se ispituje primenom klasičnog eksperimentalnog metoda. Uticaj faktora se prati njegovim sistematskim menjanjem dok se ostali faktori drže konstantim. Apsolutna konstantnost se ne može praktično ostvariti, jer je izvestan varijabilitet uvek prisutan i može uticati na rezultat eksperimenta.

Za razliku od elementarnih pojava, kod pojava koje ispoljavaju veću varijabilnost ispitivanje jednog ilin samo malog broja slučajeva i uopštavanje dobijenih rezultata moglo bi da dovede do pogrešnog zaključka. Posmatranjem većeg broja slučajeva dolazi do izražaja izvesne pravilnosti.

Primena statističke metodologije omogućava nam ne samo da uočimo opšte karakteristike varijabilnih pojava, nego i da otkrijemo pravilnosti u tendencijama ovakvih pojava. Pravilnosti koje uočavamo nazivaju se statističkim zakonitostima ili masovnim zakonitostima,ne samo zbog velikog broja posmatranjana osnovu kojih se do njih dolazi,već i zbog pravilnosti koja važi samo u masi. Pojedinačni slučajevi pokazuju manja ilki veća odstupanja od ovih pravilnosti.

Statistika se razlikuje od evidencije. Zadatak evidencije je da po utvrdjenoj šemi registruje sve pojedinačne slučajeve sa njihovim individualnim svojstvima. Evidencija ima više operativni karakter i služi statistici kao izvor podataka. Na osnovu evidencije možemo u svakom trenutuku pribaviti informacije o svakoj jedinici pojedinačno :koliko svaki radnik ima godina, koliki je njegov radni staž...

Pojam statistike je znatno širi. Ona uočava što je zajedničko za ceo posmatrani skup. Do ovih zajedničkih karakteristika statistika dolazi na osnovu posmatranja svojstava svake pojedine jedinice. Pri tome statistiku ne interesuju svojstva posmatranih jedinica , već joj ona služe samo kao polazna osnova u analizi. Statistiku interesuju karakteristike skupova.

Važniji zadatak statistike je merenje i analiza odstupanja individualnih karakteristika elemenata skupa od utvrdjenih zajedničkih karakteristika-istraživanje njihovog varijabiliteta.

*Statistika se ne bavi prevashodno prosecima, kako joj se to pogrešno pripisuje, nego mnogo više odstupanjima od prosekam ili neke druge zajedničke karakteristike, nastojeći da otkrije opšte karakteristike varijabiliteta posmatranog skupa.

Page 4: Skripta Iz Statistike

Statistika je po svojoj prirodi induktivni metod. Ona može polaziti od izvesnih hipoteza, ali zaključke donositi na osnovu iskustva, činjenica,dogadjaja, i statističkih eksperimenata. To je empirijski metod i jedan je od brojnih prilaza kreiranju novih i potvrdjivanju postojećih saznanja, na području naučnog istraživanja.

Postoji i opšta statistička teorija kao osnova statističkih metoda koji su više ili manje prilagodjeni zahtevima istraživanja i specifičnostima oblasti u kojima se primenjuju. Statistika se prema tome u pogledu kvalitativnih pretpostavki u velikoj meri oslanja na matično naučno područje i deduktivni metod. Ona odredjuje značaj odlika pojednih pojava u skupu polazeći od njihovog brojčanog učešća. Prebrojava individualne manifestacije posmatrane pojave i prema učestalosti-frekvenciji, koju pojedine njene odluke pokazuju u celom posmatranom skupu, odredjuje njihov kvantitativan značaj. Tako dobijeni rezultati se podvrgavaju manje ili više složenoj matematičkoj borbi u cilju pribavljanja novih informacija.

Statistički skup I uzorakDa bi se kvantitativnom analizom varijabiliteta jedne pojave utvrdile njene osnovne karakteristike, treba prvo ispitati njen individualni slučaj.

Skup svih elemenata na kojima se izvesna pojava statistički posmatra zove se statistički sup ili populacija. Statistički skup se može sastojati od mase stvari ili bića, čije se osobine posmatraju u datom momentu da bi se utvrdila struktura skupa po tim osobinama. Skup može sačinjavati I masa dogadjaja , čije se karakteristike posmatraju tokom vremena onda onako kako se oni zbivaju.

Pojedinačni elemetni iz kojih se skup sastoji: preduzeća, poljoprivredne površine, stanovnici, delegate, zaključeni brakovi, živorodjeni…-nazivaju se elementima ili jedinicama skupa.

Formiranje statističkog skupa zavisi od prirodne pojave, cilja istraživanja I raspoloživih mogućnosti posmatranja. Ali pored toga kod formiranja statističkog skupa mora se voditi računa da statistički skup zadovolji svojstvo da bude relativno homogen.

Da bi mnoštvo jedinica sačinjavalo statistički skup, one moraju imati maker jednu zajedničku osobinu. Ukoliko jedinice imaju više zajedničkih osobina, utoliko je skup homogeniji. Kada jedinice nemaju ni jednu zajedničku karakteristiku, one ne mogu sačinjavati statistički skup. Statistički skup je homogen kada su jedinice koje ga sačinjavaju istovrsne a pokazuju samo razlike u pogledu ispitivanih odlika.

Medjutim, kada se odlike čiji se varijabilitet ispituje odabiraju s obzirom na praktične ciljeve istraživanja to se u praksi susrećemo sa sa skupovima čiji se stepen homogenosti mali.

Page 5: Skripta Iz Statistike

Jedinice koje sačinjavaju statistički skup moraju biti istovrsne, ali ne I istovetne. Istovetne jedinice nisu predmet statističkog istraživanja, jer bismo ispitivanjem jedne ili nekoliko njih pribavili infornacije o svim ostalim. Jedinice statističkog skupa iako istovrsne, razlikuju se medjusobno po izvesnim osobinama. Karakteristika statističkog skupa je da je relativno homogena ali takodje I diferenciran u pogledu nekih osobina. Skup nezaposlenog stanovništva je homogen u pogledu konstituitivne osobine, jer ga sačinjavaju nezaposleni radon sposobni stanovnici. Svrha statističkog posmatranja je upravo ispitivanje diferenciranosti skupa u pogledu nekih osobina I njihovo kvantitativno odredjivanje.

Pre nego što se pristupi proučavanju statističkog skupa, treba taj skup definisati -:prostorno,vremenski I pojmovno.

*Prostorno odrediti statistički skup znači odrediti prostor(teritoriju), na koji se odnose ili kojem pripadaju statističke jedinice. Obično se to razgraničavanje vrši prema teritorijalnim društveno-političkim zajednicama.

*Vremenski odrediti skup znači odrediti moment ili razdoblje vremena u kojem će se obuhvatiti sve jedinice koje ulaze u statistički skup. U zavisnosti od prirode pojave koje ispitujemo jedinice skupa I njehove karakteristike odredjujemo ili u pojedinim momentima ili u intervalima vremena. Sadržinsko odredjenje statističkog skupa iiziskuje odredjivanje osobine koja mora da ima svaka jedinica da bi bila uključena u skup.

*Prostorno, vremensko I sadržinsko odredjivanje statističkog skupa je neophodno da bi podaci bili pravilno prikupljenii nedjusobno uporedivi, odnosno upotrebljivi za analizu.

*Osobine po kojima se jedinice odredjenog statističkog skupa medjusobno razlikuju, ili se mogu razlikovati, nazivaju se statističkim obeležjima . Različiti vidovi u kojima se obeležje može javiti nazivaju se modalitetima tog obeležja.

Obeležja se mogu deliti prema više kriterijuma, ali najvažnija podela na : atributivni I numerički.

*Atributivna obeležja se izražavaju opisno, rečima. Ako je statistički skup stanovništvo, atributivna obeležja po kojima se jedinice skupa razlikuju:pol,zanimanje,narodnost,pismenost.. Osnovna razlika atributivnog obeležja je da njegovi modaliteti ne odražavaju intenzitet posmatrane osobine već samo njene različite pojavne oblike.

*Obeležja koja se izražavaju brojčano su numerička. U skupu stanovništva jedinice se medju sobom razlikuju po sledećim numeričkim obeležjima :visni,telesnoj masi, godinama starosti… Modaliteti numeričkog obeležja pokazuju intenzitet posmatrane karakteristike. Numerička obeležja mogu biti:prekidna I neprekidna. Prekidna obeležja uzimaju samo izolovane –diskontinuirane vrednosti. Do ovih numeričkih vrednosti dolazimo najlešće prebrojavanjem. Takva obeležja su: veličina domaćinstva,veličina preduzeća prema broju zaposlenih.. Ali ako

Page 6: Skripta Iz Statistike

numeričko obeležje može imati unutrašnju vrednost jednog interval, nazivamo ga neprekidnim ili kontinuiranim. Modalitete ovih obeležja odredjuemo merenjem.

Neka obeležja se mogu izraziti I atributivno I numerički. Za statističku obradu numerička obeležja su pogodnija od atributivnih, zbog mogućnosti njihove šire matematičke obrade.

Podaci dobijeni masovnim posmatranjem sup o pravilu brojni I iziskuju posebnu obradu pomoću specijalnih statističkih metoda, cilj primene tih metoda jeste uprošćeno rečeno reduciranje I sinteza podataka. Kako celokupnu količinu podataka naša svest nije spremna da primim mi ih zamenjujemo relativno malim brojem numeričkih karakeristika koje adekvatno reprezentuju celinu , odnosno izražavaju bitne karakteristike čitavog skupa. Ovi numerički pokazatelji su karakteristika skupa I nazivaju se parametrima skupa. Zavisno od toga na koju se karakteristiku odnose razlikujemo : paramater lokacije, disperzije I oblik rasporeda skupa. Do potpune I tačne informacije o karakteristikama skupa dolazimo samo kada izvršimo popis.

*Zahvaljujući primeni teorije verovatnoće, potpunu obuhvatanost skupa zamenjujemo statističkim zaključivanjem. Pod statističkim zaključivanjem podrazumevamo postupak donošenja zaključka o karakteristikama statističkog skupa na osnovu posmatranja samo jednog dela tog skupa-uzroka. Uzrok je reprezentativan deo skupa, u kojem se posmatrana pojava ipoljava približno isto kao u celom skupu.

Informacije koje dobijamo uopštavanjem rezultata ovakvog posmatranja mogu sadržati veće ili manje greške. Ove greške tj.razlike izmedju karakteristika skupa i uzroka ili zbog velikog varijabiliteta u osnovnom skupu. Napredak statističke teorije omogućio je da se ove greške kao i mogućnost njihovog javljanja kvantitativno iskažu.

Dve osnovne osobine statističkog zaklučivanja čine:ocenjivanje nepoznatih parametara skupa i testiranja statističkih hipoteza.

Ako je cilj statističkog istraživanja da se oceni vrednost nepoznatog parametra, primenjujemo postupak statističkog ocenjivanja. Često je medjutim osnovna svrha istraživanja proveravanje neke pretpostavke o karakteristici osnovnog skupa, kada primenjujemo testiranje hipoteze. Statistička teorija eksperimenta, koja koristi uzroke za izvodjenje eksperimenata, odnosno istraživanje uticaja pojedinih faktora na ponašanje masnovnih pojava. Za razliku od običnog eksperimenta, ovaj statistički karakteriše posmatranje varijabiliteta više od jednog faktora, što omogućuje ne samo ocenu njihovog direktnog uticaja na posmatranu pojavu, već i ocenu zaduženog uticaja i eventualne interakcije.

Oslonac na teoriju verovatnoće omogućio je i razvoj novih statističkih metoda koji spadaju u područje statističke teorije odlučivanja. Statističko zaključivanje ovde nalazi primenu u odlučivanju u uslovima kada se njihovi ishodi ne mogu precizno odrediti zbog uticaja okruženja. Posebno mesto zauzima Bayes-ova statistika, zasnovana na subjektivnim verovatnoćama koje se

Page 7: Skripta Iz Statistike

primenom Bayesovog postupka uz dodatne inf. Modifikuju u pravcu približavanja objektivnim verovatnoćama.

Deskriptivna analizaStatistički metodi istraživanja masovnih pojava mogu se podeliti u 2 osnovne grupe. Jedna obuhvata metode prikupljanja sredjivanja, prikazivanja podataka i metode odredjivanja parametara skupova-deskriptivna statistika. Drugu grupu sačinjavaju metodi statističke analize, čiji je osnovni zadatak objašnjenje varijabiliteta pomoću klasifikovanih, korelacionih i drugih statističkih pokazatelja, kao i stat. Zaključivanje na osnovu uzroka. Ovim metodima bavi se analitička statistika, koja se medjutim ne može strogo razgraničiti od deskriptivne statistike.

Ceo proces statističkog istraživanja se može svesti na 3 os. Etape: 1) statističko posmatranje, 2)sredjivanje grupiusanje i obrada podataka,3) statistička analiza.

Prikuplanje sredivanje i obrada podataka- Opredeljenje cilja istraživanjaU prvoj etapi stat. Istraživanja rešavaju se metodološki problemi istraživanja. Odredjuje se cilj, predmet, jedinice,obeležje, vreme posmatranja,šeme grupisanja i obrade... Postavlja se pre svega cilj istraživanja, jer od njega zavise i metodološko-tehničke i organizacione osnove istraživanja.

Cilj istraživanja se mora postaviti jasno, konkretno i precizno, kako bi se što bolje definisali predmet posmatranja, obeležja i jedinica posmatranja. Nejasno formulisan tip može dovesti do suvišnih pitanja, što opterečuje stat. Istraživanje i dovodi do ispuštanja rezultata.

Planom prikupljanja podataka odredjuju se i definišu modaliteti obeležja i dogadjaji koji će se obuhvatiti u skopu njihovih def. I način merenja i iskazivanja. Merenje nije uvek moguće izvršiti s preciznošču. Nivo merenja zavisi od same prirode pojave i posmatranih obeležja.

Merne skaleSvaki nivo merenja ima posebnu skalu sa odredjenim jedinicama mere, pri čemu se uspešnost merenja izražava količinom pribavljenih informacija. Postoje 4 merenja I 4 skale: nominalna, ordinalna, intervalna I skala odnosa;

1)Nominalna skala- je najnepreciznija. U ovoj skali brojevise koriste kao pojava koje se mogu klasifikovati samo na odredjen broj I tip modaliteta. Tako se klasifikuju pol, bračno stanje… u ovoj skali se merenje svodi na razvrstavanje po odredjenoj šemi-na klasifikaciju. Postoje atributivna obeležja koja imaju veliki broj modaliteta (zanimanje, uzrok smrti), pa se razvrstavanje –klasifikacija pojedinih modalieta vrši u srodne grupe u okviru posmatranog obeležja. Jednoobrazno utvrdjeni nazvi grupa I podgrupa nazivaju se nomenkulature.

Page 8: Skripta Iz Statistike

2)Ordinalna skala- svodi merenje modaliteta na njihovo rangiranje po značenju s obzirom na usvojene kriterijume I to brojevima koji označavaju rang, ali ne pokazuju veličinu njihovoh razlikovanja. Relativan značaj pojedinih modaliteta zavisi I od samog broja modaliteta.

3)Intervalna skala odnosa- pokazuju ne samo redosled modaliteta nego I meru njihovog razlikovanja. Pri tome obaveštenje o apsolutnim razlikama omogućuje intervalna a o relativnim razlikama I skala odnosa.

*Intervalnu skalu karakteriše odredjena jedinica mere, kao npr. Za kalendarsko vreme , potencijalnu energiju,temperature…Medjutim veličina intervalne skale ne moraju biti jednoznačno odredjene odredjene, već se biraju po nekom kriterijumu. Možemo imati više različitih intervalnih mera za merenje iste veličine( Celzijusova skala, Frenhajtova skala), gde se kod svake nula nalazi na različitoj fizičkoj temperature I gde temperaturne jedinice nisu medjusobno jednake.

Najviši nivo merenja se postiže primenom skale odnosa, koja obezbedjuje značenje bilo kod odnosa merenih objekata, kao što su visina u cm, telesna masa u kg… Skalu odnosa karakteriše ne samo upotreba jedinica merenja nego I prava nulta tačka. Ova skala nam dopušta da iskažemo proporcionalan odnos modaliteta koje merimo. Ova skala je najpreciznija. Intervalna skala I skala odnosa se često u ek. Literature nazivaju kardilnim skalama.

Metodi prikupljanja podatakaDa bi se saznale karakteristike ranije definisanog statističkog skupa, odlučujemo se za onaj metod posmatranja(prikupljanja podataka), koji će sa najmanje troškova da obezbedi tražene rezultate. Dakle za svaku statističku akciju, potrebno je izabrati najefikasniju vrstu, metod posmatranja. Pojava koja se posmatra može se obuhvatiti na svim jedinicama statističkog skupa ili samo na jednom njegovom delu (delimično posmatranje).

Statistički popisStatistički popis je takav oblik statističkog posmatranja pri kojem se obuhvataju sve jedinice posmatranja jednog statističkog skupa u odredjenom momentu koji se zove ‘kritični momenat’. Na taj način se dobija potpun uvid u stanje I strukturu skupa po raznim obeležjima. S obzirom na organizacione teškoće I velika materijalna sredstva koja zahtevaju popisi istog statističkog skupa sprovode se u dužim vremenskim intervalima. Vremenski intervali izmedju propisa odredjuju se u zavisnosti od intenziteta promena skupa u vremenu. Npr. Popisi stanovništva obavljaju se nakon svake 5 ili 10 godine, jer se stanovništvo menja dosta sporo, a popisi stoke svake godine, zaro što se trajno stanje stoke menja vrlo brzo. Popis se sprovodi kada proučavana pojava u najvećoj meri najpotpunije dolazi do izražaja. Kritični moment treba da bude u vreme kada je posmatrani statistički skup u najmanjem kretanju.

Page 9: Skripta Iz Statistike

Statistički izveštajStatističkim izveštajem se obavlja snimanje promena statističkog skupa u sukcesivnim vremenskim intervalima. Statističke izveštaje podnose izveštajne jedinice na statističkim upitnicima I u rokovima koji su propisani metodološkimuputstvima statističkog organa koji org. odredjenu stat. izveštajnu službu.

Primmenom ovog oblika posmatranja može se obuhvatiti stanje posmatranog skupa u sukcesivnim momentima, kao kretanje pojave u sukcesivnim intervalima.

Metodi potpunog posmatranja stat. skupa- statistički popis I statički izveštaj, daju nesumnjivo najsigurnije I najbolje rezultate.

Statistički uzorakUzroci se primenjuju po pravilu kao zamena ili dopuna popisnog metoda , a u novije vreme I kao zamena izveštajnog metoda. Osnovni problem koji se moraju rešiti su: izbor vrste uroka ž, kao I veličina uzroka. Odabrane jedinice uzroka posmatraju se na isti način kao I kod popisa a onda se na osnovu rezultata uzroka vrši statističko zaključivanje.

Primena bilo kog metoda posmatranja iziskuje jednoobrazno prikupljanje podataka. To se postiže izradom odgovarujućih statističkih upitnika I pripremom izveštavača koji će ih popunjavati. Upitnici sadrže pitanje o posmatranim obeležjima I prazna polja za odgovore. Greške mogu biti slučajne I sistematske . Dok se slučajne greške uglavnom medjusobno potiru I nemaju naročitog uticaja na rezulatate istraživanja, sistemske greške uvek utiču na rezultat, pa se one moraju otkloniti ili bar sagledati o njima voditi računa.

Sredjivanje I obradaSredjivanje I osnovna obrada statističkog materijala , prikupljenog preok statističkih upitnika, predstavlja veoma obiman, a u organizaciono-tehničkom pogledu I veoma složen posao, jer se susrećemo sa velikim brojem stat. upitnika I znatno večim brojem individualnih podataka. U zavinosti od toga gde se vrši sredjivanje statističke gradje, razlikujemo :centralizovano,decentralizovano I kombinovano sredjivanje. Iako decentralizacija omogučuje brže objavljivanje rezultate posmatranja za pojedina područja, centralizovano sredjivanje se često primenjuje jer obezbedjuje bolju organizaciju sredjivanja, upotrebu jedinstvenog metoda, stručnost obrade kao I efikasnije korišćenje tehnike za obradu podataka. Kombinovano sredjivanje se koristi obično kod stat. akcija u cilju dobijanja brzih prethodnih rezultata, pa se jedan deo sredjivanja vrši decentralizovano, a drugi se obavlja centralizovano.

Page 10: Skripta Iz Statistike

Prikazivanje podataka –statističke serijeKao rezultat sredjivanja stat. materijala dobijamo stat. serije. Nizove sredjenih stat. podataka koji prikazuju strukturu skupa po nekom obeležju, ili raspored skupa u prostoru, ili rpomeu skupa u vremenu nazivamo stat.serijama. Prema načinu formiranja I analitičkom sadržaju, delimo ih na serije strukture I vremenske serije.

Serije struktureSerije strukture pokazuju raspored statističkog skupa po modalitetima, odnosno po vrednostima obeležja. Sastoji se iz 2 reda objašnjenja. U jednom su modaliteti a u drugom broj jedinica, odnosno frekvencije, koje pokazuju koliko se puta pojedini modaliteti javljaju unutar posmatranog statističkog skupa. U zavisnosti od vrste obeležja na osnovu kojeg je izvršeno grupisanje podataka, postoje serije strukture sa atributivnim I serije strukture sa numeričkim obeležjem.

Modaliteti atributivnih obeležja se iskazuju opisno I za njihovo grupisanje potrebno je imati jasnu šemu klasifikacije. Klasifikacija se vrši po kriterijumu koji najviše odgovara prirodi samog obeležja (pol:muški, ženski; pismenost: pismen, nepismen;)U serije strukture po atributivnom obeležju mogu se svrstati I geografske serije, jer su I kod njih u šemi grupisanja modaliteti dati opisno, nazivima teritorijalnih područja. One prikazuju strukturu, tj. Teritorijalni raspored posmatranog statističkog skupa u datom momentu ili vremenskom periodu.

(pr. Tabela br.stanovnika u jugoslaviji 1981.)

Ovakve serije se nazivaju nacionalnim geografskim serijama,jer pokazuju raspored posmatranog skupa u drđavnim granicama, a samim tim pružaju informacije o razlikama u veličini posmatranog skupa njihovih delova u okviru nacionalne teritorije. Za razliku of nacionalnih, medjunarodne geografske serije pokazuju rasprostranjenost statističkog skupa u više zemalja na jednom kontinentu ili pak celom svetu. Dok se za atributivna obeležja postavlja problem gradiranja vrednosti.

Gradiranje brojčanih vrednosti oveih obeležja se razlikuje u zavisnosti da li je obeležje prekidno ili neprekidno- diskontinuirano i kontinuirano. Prekidne vrednosti obeležja se grupišu jednostavnon po veličini.-od niže vrednosti ka višoj.

Problem gradiranja se u praksi pojavljuje kod neprekidnih obeležja i kod prekidnih sa velikim brojem modaliteta. Ovde se postavlja pitanje broja grupa, odnosno veličine grupnih intervala.Iz iskustva je poznato da veći broj grupnih intervala daje detaljniju informaciju o sastavu skupa , a da manji broj grupnih intervala bolje otkriva pravilnosti o ponašanju skupa.

Veličina grupnog intervala se ponekad odredjuje na taj način, tako što se prvo odredi broj grupa (klasa) pomoću tzv. Sturges-ovog pravila a to znači po obrascu

K=1+3,3log N

Page 11: Skripta Iz Statistike

Gde N označava ukupan broj podataka, pa se razlika najveće i najmanje vrednosti obeležja podeli brojem

i=Xmax-Xmin/K

Pri formiranju grupnih intervala preporučljivo je početi sa vrednošću manjom od najmanje u seriji a završiti sa većom od najveće u vrednosti u seriji. Serije strukture po numeričkom obeležju nazivaju se rasporedima frekvencije( distribucijama ili razdeobama frekvencija). Rasporedi frekvencija omogućavaju uspešnu komparaciju dveju ili više serija: grafički ili raznim deskriptivnim merama , uz pretpostavku da gubitak o inf. Nije veliki. Geografske serije radi bolje statističke obrade mogu se transformisati u rasporede frekvencije. Kod geografskih istraživanja tj. Prostorno diferenciranih faktora mora koristiti geografska serija bilo da je uredjena po postojećim teritorijalnim društveno-političkim jedinicama ili rekonstruisanim, homogenim područjima. Struktura jednog skupa u datom obeležju pokazuje kako su modaliteti toga obeležja rasporedjeni u skupu, tj. Koliko jedinica posmatranja otpada na svaki modalitet obeležja. Broj jedinica koji odgovara u jednom atributu ili jednoj vrednosti obeležja jeste frekvencija (aps-frekvencija) tog atributa, odnosno te vrednosti.

Ako frekvenciju (f) izvesnog atributa ili izvesne vrednosti obeležja stavimo u odnos prema ukupnom broju jedinica tog skupa (∑fi), onda dobijamo relativnu frekvenciju. Relativna frekvencija se obično izražava u procentima. Relativne frekvencije povećavaju mogućnost analize statističkog skupa prikazanog u seriji , jer u odnosu apsolutne frekvencije proširuju informacije o strukturi posmatranog skupa.

Vremenske serijeVremenske (hronološke serije) su nizovi statističkih podataka koji pokazuju varijacije pojava tokom vremena. One se kao i serije strukture pokazuju u dva niza , s tim što se kod ovih serija prvi niz uvek odnosi na vreme (godina,kvartal,mesec),a drugi na veličinu (nivo) pojave u posmatranom modelu. Prema prirodi podataka koji sadrže, vremenske serije se dele na : momentalne i intervalne.

Vremenske serije koje pokazuju veličinu ili nivo pojave u tačno odredjenim sukcesivnim momentima nazivaju se momentim serijama.( pr.stanje novca u blagajni na kraju svakog dana). Kod momentalnih vremenskih serija nema smisla sumiranje podataka.

Intervalne vremenske serije pokazuju tok (kretanje) pojave u sukcesivnim vremenskim intervalima:izdaci za isharnu po danima, proizvodnju uglja iz meseca u mesec...Ove serije dobijamo kao rezultate izveštajnog metoda(registrovanja) i podaci se mogu sabirati (kumulirati).

Page 12: Skripta Iz Statistike

Tabelarno prikazivanjeStatistička tabela je jedan od oblika prikazivanja serija ili statističkih podataka u preglednoj i priklanodj formi koja olakšava da se rezultati stat. Istraživanja sagledaju što jasnije i potpunije i olakšava korisniku uporedjenje podataka.

Statističku tabelu dobijamo ukrštanjem vertikalnih i horizontalnioh linija koje nazivamo poljima tabele.Prvi red naziva se zaglavlje , a prva kolona pretkolona.Pretkolona i zaglavlje služe za unošenje modaliteta obeležja, vremenskih intervala i geografskih područja. Pretkolona omogućava pravilno čitanje statističkih podataka sadržanih u redovima tabele,a zaglavlje za čitanje stat. Podataka u kolonama tabele.

One po sadržini mogu biti proste, složene i kombinovane. Prosta tabela sadrži podatke jedne serije koje se mogu odnositi na serije strukture i vremenske tabele. Složena stat.tabela dobija se spajanjem više prostih tabela koje pokazuju razl. Podatke pri tom su rasčlanjene prema istom obeležju i u medjusobnoj su sadržinskoj vezi-lična primanja po delatnostima...

U kombinovanoj tabeli izlažu se podaci serija dobijenih ukurštanjem dva ili više obeležja, čije se oznake unose u zaglavlje i pretkolonu. Ovakve tabele imaju analitički značaj, samo treba nastojati da kombinovana tabela ne bude pretrpana i komplikovana. Svaka stat. Tabela mora imati naslov, koji stavlja iznad nje i koji treba kratko ali dovoljno da opredeli sadržaj tabele. Stat. Tabele se dele na obradne i analitičke. Obradne su obimne, sa detaljnim podacima, koje služe za stavljanje analitičkih tabela i kao takve predstvaljaju dokumentaciju statistike. Analitičke tabele sz sažetije. Imaju za cilj da istaknu vezu izmedju prikazanih obeležja i omoguće njihovu uspešniju analizu.

Grafičko prikazivanjeGrafički prikazi pomoću oznaka na geo. Kartama nazivaju se kartogramima.Njihova primena je da ograničena na geografske serije.Geometrijski oblici, odnosno dijagrami, pružaju šire i raznovrsnije mogućnosti za jasnije prikazivanje i uporedjivanje veličina i oblika. Izbor dijagrama zavisi od podataka i ciljeva istraživanja. Oni mogu biti u vidu tačaka, linijski, površinski, i prostorni.

Grafički prikazi stat. Podatakau vidu tačaka se nazivaju stigmogramima. Linijski dijagrami imaju jednu dimenziju i zato služe za prikazivanje modaliteta jednog obeležja. Površinskim dijagramima, koje zovemo histogramima, može se prikazati broj obeležja, jer se površine, pored toga što imaju 2 dimenzije, mogu još deliti na manje različito osenčene površine. Prostorni dijagrami –stereogrami omogućuju prikazivanje u 3 dimezije,ali se retko upotrebljavajum jer je takvo prikazivanje komplikovano. Koriste se i slike. Grafičko prikazivanje vrši se u koordinatnim i vankoordinatnim sistemima.

Page 13: Skripta Iz Statistike

Deskriptivne mereStatističke teorije i strukture i vremenske serije, date u vidu tabela ili grafičkih prikaza, služi stat. Analizi kao polazna osnova za istraživanje pravilnosti i zakonitosti posmatranih pojava. Raščlanjavanjem i uporedjivanjem podataka i samih serija stat. Analiza nastoji da te pravilnosti i zakonitosti otkrije i formuliše. Pokazatelje rasporeda frekvenicje koji pokazuju ceo osnovni skup, nazivamo parametrima skupa i svrstavamo ih u tri grupe. Jednu sačinjavaju srednje vrednosti , kao i mere centralne tendencije rasporeda. Drugu čine mere disperzije i treću čine mere oblika rasporeda. Kao značajan parametar skupa javlja se i relativno učešće.

Pokazatelji rasporedi frekvencija reprezentuju skup ili uzorak, odnosno pripisuju se skupu ili uzroku uzavisnosti da li se analizira raspored frekvnecija skupa ili raspored frekvencija uzroka. Deksriptivna mere koje se odnose na sve jedinice skupa nazivaju se parametrima skupa, a deskriptivne mere koje se odnose na uzorak su statistike uzroka.

Mere centralne tendencijeRasporedi frekvencija pružaju široku mogućnost za otkrivanje karakteristika skupova, analizu njihove strukture i unutrašnje odnose. Oni otkrivaju pre svega, tendenciju grupisanja-koncentracije pojedinih vrednosti obeležja oko vrednosti karakteristične za posmatrani skup. Potrebu merenja centralne vrednosti obeležja uslovljava varijabilnost vrednosti i obeležja stat.skupa. Srednja vrednost treba da bude pokazatelj centralne tendencije.Ona predstavlja meru centralne tendencije i pokazuje lokaciju skupa. To je jedan od najznačajnijih pokazatelja numeričkih karakteristika serije koju po datim merilima reprezentuje čitav skup i omogućuje uporedjenje izmedju raznih skupova. Ona se koristi za sažimanje strukture skupa i za praćenje njegove dinamike, kao i osnova za ispitivanje drugih karakteristika serije kao što su varijacija , oblik rasporedjivanja i slično.

U zavisnosti od načina odredjivanja centralne vrednosti obeležja skupa srednje vrednosti se dele na: izračunate (aritmetička,geometrijska,harmonijska,kvadratna,kubna), koje izračunavaju na osnovu vrednosti i obeležja i pozicione (modus i medijana),koje se odredjuju položajem u seriji. Koja će se srednja vrednost uzeti kao paramter stat. Skupa zavisi od posmatrane pojave i od načina grupisanja podataka u rasporedu frekvencija. Svaka od nabrojanih srednjih vrednosti mora da ispuni uslove:da utvrdjuje objektivnim matematičkim postupkom, da se njena vrednost nalazi izmedju najniže i najviše vrednosti posmatranog obeležja medjusobno jednake i srednja vrednost mora biti jednaka toj vrednosti obeležja.

Aritmetička sredinaNajširu upotrebu u stat analizi zauzima aritmetička sredina, ili popularnije-prosek.

Aritmetička sredina skupa se dobija kad se zvir svih vrednosti obeležja podeli sa njihovim brojem. Ako posmatramo obeležje X, njegove vrednosti x1,x2,x3....xN, njihov broj N, aritmetička sredina skupa, koju ćemo označiti sa µ

Page 14: Skripta Iz Statistike

Dobija se :µ= x1+x2+.....xN/ N= 1/N*∑xi ILI UPROŠĆENIJE µ=∑x/N

Za uzroak, veličine n, aritmetička sredina negrupisanih podataka uzroka koju označavamo sa x ( čitamo 'x bar') jednaka je

× (sa crtom iznad)= ∑x/n

*Ovo je primer aritmetičke sredine negrupisanih podataka.Svaki podatak se javlja samo jedanput (sa frekvencijom 1), pa se srednja vrednost dobija iz zbira vrednosti podataka podeljenog njihovim brojem.

U stat. Istraživanjima lešče se susrećemo sa većim brojem vrednosti podataka i njihovim različitim frekvencijama, upravo grupisanim podacima u vidu rasporeda frekvencija. U takvim slučajevima moramo pri izračunavanju aritemtičke sredine uzeti u obzir razlike u frekvencijama. Označimo različite vrednosti obeležja sa x1,x2,x3....xi,....xk, a njihove odg. Frekvencije sa f1,f2,.....fi....fk, pa će aritmetička sredina skupa biti:

µ=f1x1+f2x2+....fkxk/N TJ. N=f1+f2+.....fk=∑fi

Analogno, ponderisana aritmetička sredina uroka biće : x (sa crtom iznad) 1/n*∑fixi

Aritmetička sredina grupisanih podataka poznata je pod nazivom ponderisana aritmetička sredina, jer se sve vrednosti u skupu ili uzroku uzimaju u skupu onoliko puta koliko se one javljaju, tj. Ponderišu sa njihovim frekvencijama.

n= f1+f2+.....fk= ∑fi

Ako je raspore dfrekvencija dat u vidu k grupnih intervala, aritmetička sredina skupa kao i uzroka, izračunava se kao ponderisana aritmetička sredina središnjih vrednosti grupnih intervala x'i.

µ=1/N∑fix'i ILI x(sa crtom iznad) =1/n∑fix'i

Izračunavanje aritemtičke sredine grupnih intervala polazi od pretpostavke da su vrednosti obeležja unutar intervala ravnomerno rasporedjene, što u praksi najčešće nije slučaj, pa dobijeni rezultat pokazuje izvesno sistematsko odstupanje od aritmetičke sredine skupa ili uzroka na osnovu negrupisanih podataka. Obim ovog odstupanja zavisi od širine grupnih intervala i rasporeda unutar njih.

Na vrednost aritmetičke sredine utiču sve vrednosti posmatranog obeležjam pa je ona u pravom smislu sintetički pokazatelj. Važna osobina aritmetočke sredine je da ona izravnava apsolutne varijacije vrednosti obeležja. Ako u skupu ili uzroku ima ekstremnih vrednosti, ona može dati iskrivljenu sliku, time ako raspored frekvencija nije simetričan.

Page 15: Skripta Iz Statistike

*Velike apsolutne razlike koje u ovoj seriji postoje izmedju pojedinih njenih članova , aritmetička sredina je izravnala. Za serije čije vrednosti obeležja znatno odstupaju od aritmetičke sredine kažemo da imaju veliku rasprđenost ili disperziju, koja nije uvek očigledna.

Aritmetička sredina ima osobine koje karakterišu kao srednju vrednost izvesne osobine značajne za njenu primenu i izračunavanje.

1)Aritmetička sredina veća je od najmanje i manja od najveće vrednosti posmatranog obeležja

x1 µ xk

2) Aritmetička sredina se izjednačuje sa vrednostima obeležja, kada su one medjusobne jednake

x1=x2=.....xi=.....xk=a=µ

3)Zvir odstupanja aritemtičke sredine od pojednih vrednosti obeležja jednak 0

*za negrupisane podatke ∑(xi-µ)=0

*Za grupisane podatke ∑fi(xi-µ)=0

4)Zbir kvadrata odstupanja od aritemtičke sredine od pojednih vrednosti obeležja manji je od zbira kvadrata odstupanja bilo koje vrednosti obeležja xo, od ostalih vrednosti obeležja:

∑(xi-µ) ∑(xi-xo)

Aritmetička sredina je često decimalan broj koji se ne pokalapa ni sa jednom vrednošću obeležja, i kao takva ponekad može biti nelogična.

Geometrijska sredinaGeometrijska sredina je srednja vrednost koja izravnava relativne ili proporcionalne promene izmedju podataka, za razliku od aritmetičke sredine koja izravnava apsolutne razlike izmedju vrednosti podataka posmatrane serije. One se prema tome, ne dobija iz zbira, nego iz proizvoda vrednosti podataka , s tim što iz ovog uzima pozitina vrednost korena čiji je izložitelj jednak njihovom broju.. Ako posmatrano obeležje, obeležimo sa X, a njegove vrednosti kao x1,x2,.....xN, onda će geometrijska sredina tih vrednosti biti definisana formulom:

G=

Zbog činjenice da se geometrijska sredina dobija iz proizvoda obeležja njeno izračunjavanje nije moguće ako je neka vrednost serije jednaka nuli, manja od nule. Njeno izračunavanje ima smisla samo kada su sve vrednosti posmatranog obeležja veća od nule. Polazeći od ove pretostavke, zaključujemo

Page 16: Skripta Iz Statistike

G=N

Ukoliko su grupisani podaci, primenjuje se obrazac za ponderisanu geometrsijsku sredinu. U tom slučaju frekvencije pojednih modaliteta obeležja uzimaju se njihovi izložitelji , a iz proizvoda vrednosti vadi se koren čiji je izložitelj jednak zbiru frekvencija.

U ekonomskim istraživanjima dinamike naročito je rasprostranjena upotreba geometrijske sredine za izračunavanje stope rasta na osnovu lanččanih indeksa. Lančani indeks se dobija kao odnos vrednosti u prethodnom intervalu(godini, kvartalu,mesecu).Geometrijska sredina koristi se i za procenu brojnog stanja stanovništva u godinama izmedju dva popisa, pod uslovom da se stanovništvo povećava približno po geometrijskoj progresiji.

Harmonijska sredinaHarmonijska sredina je recipročna vrednost aritmetičke sredine recipročnih vrednosti obeležja.Slično kao kod aritmetičke i geometrijske sredine, imamo prostu harmonijsku sredinu

H=N/∑

Harmonijsku sredinu ima smisla tražiti samo za ona obeležja čije su vrednosti različite od nule. Osetljiva je na male vrednosti članova serije. Ona ima osobine srednje vrednosti, ali njena interpretacija nije jednostavna ni očigledna.Primenjuje se za izračunavanje indeksnih brojeva, tj. Srednjeg indeksa, i u slučajevima kada su obeležja statističkih jednica izražena u obliku tzv.recipročnih pokazatelja.

ModusKoju srednju vrednost odabrati kao najpodesniju karakteristiku rasporeda frekvencija zavisi u krajnjoj liniji , od cilja istraživanja. Kada se govori o srednjoj vrednosti kao tipičnoj vrednosti onda se u stvari misli na modus.

*Modus je vrednost obeležja koja u posmatranoj seriji ima najveću frekvenciju, najčešće se javlja i zato je najtipičnija vrednost u seriji.

Za serije negrupisanih podataka se odredjuje jednostavno. Kada je u jednoj seriji samo jedna vrednost obeležja sa največom frekvencijom , kao u našem primeru , kažemo da je unimodalna, a ako postoje dve ili više takvih vrednosti , serija je bimodalna, odnosno multimodalna.

Page 17: Skripta Iz Statistike

U slučajevima kada nekoj vrednosti obeležja odgovara frekvencija veća od frekvnecije vrednosti obeležja neposredno ispred i iza nje , ta se vrednost naziva sporednim modusom.. Takvih modusa u seriji može biti više.

Može se desiti i da modusa nema. Za serije grupisanih podataka, odnosno neprekidnih vrednosti obeležja, modus nije lako uočljiv. Treba ga tražiti u intervalu sa najvećom frekvencijom , koja se naziva modalnim.

Mo= L1+

Gde je L1 donja granica modalnog intervala, i dužina grupnog intervala , a f1,f2 i f3 redom frekvencije predmodalnog,modalnog i poslemodalnog intervala.

*Apcisa tačke preseka , koja se dobija dijagonalnim spajanjem početne i krajnje vrednosti modalnog intervala sa gornjom granicom predmodalnog , odnosno donjom granicom poslemodalnog intervala, predtsvlja približnu vrednost modusa.

Modus je pogodan pokazatelj rasporeda uz unimodalne serije i to naročito ako je frekvencija modalne vrednosti velika. U takvim slučajevima modus je tipična vrednost koja pokazuje u pravom smislu centralnu tendenciju posmatrane serije. Modus daje potpuniju informaciju o tendenciji okupljanja vrednosti obeležja srednje vrednosti. Pošto na veličinu modusa ne utiču promene frekvencija obeležja, pa ni frekvencije ekstremnih vrednosti (sve dok je frekvencija modalne vrednosti maksimalna), modus se može odrediti i u slučajevima kad frekvencije ekstremnih vrednosti obeležja nisu poznate , ali se ztna da se nalaze na krajevima rasporeda, tj. Da im je frekvencija mala. Modus se može koristit kao mera centralne tendencije atributivnih serija. Modus se može naći na početku ili kraju rasporeda . kad ekstremne vrednosti imaju najveću frekvenciju kao kod rasporeda u obliku slova L i J, pa u takvim slučajevima gubi svojstvo pokazatelja centralne tendencije.

MedijanaMedijana je ona vrednost obeležja koja se nalazi u sredini serije uredjene po veličini obeležja, odnosno to je vrednost obeležja koja deli sumu svih frekvencija na dva jednaka dela, tako da jedna polovina obuhvaćenih slučajeva ima manju a druga polovina veću vrednost od medijane.

Ako su vrednosti obeležja poredjane po veličini i od njih obrazovana serija negrupisanih podataka

x1,x2......xi.....xN

pri odredjivanju medijane treba razlikovati slučajeve kada je broj članova N neparan i paran broj. Ako je N neparan broj, tada srednji član deli niz na dva jednaka dela.

Page 18: Skripta Iz Statistike

Ako je broj članova niza N paran, u njemu postoje dva srednja člana, pa se za ma koju veličinu ta dva člana može smatrati da niz deli na dva jendaka dela i po definiciji može uzeti kao medijana. Za serije grupisanih podataka medijana se dobija interpolacijom izmedju donje i gornje garnice intervala grupe u kojoj se medijana nalazi.

(Medijana) Me=L1+

Gde je L1 donja granica medijalnog intervala, N je broj članova serije, ∑f1, zbir frekvencija predmedijalnog intervala, fMe frekvencija medijalnog intervala, a i dužina medijalnog intervala.

Ovaj metod se zasniva na pretpostavci o ravnomernom rasporedu članova serije unutar intervalne grupe, mada to nije uvek slučaj.

Medijana se može i grafički odrediti pomoću kumulativnog dijagrama frekvencija. Apcisa preseka, kumulante, ispod i kumulante iznad predstavlja medijanu. Ona zauzima središnji položaj u serji, što znači da na nju ne utiču krajnje vrednosti obeležja. Medijana zavisi od broja i redosleda vrednosti obeležjam pa za njeno odredjivanje nije neophodno raspolagati svim vrednostima ako su one poredjane po veličini.

*medijana se ne može ni odrediti kada otvoreni grupni interval sadrži više od polovine svij jedinica. Takvi slučajevi su retki, jer za ispravno grupisanje uslov da otvoreni grupni interval ima što manju frekvenciju. Medijana se nekad naziva drugim kvartilom, s obzirom na mogućnost podele jedne serije na četri jednaka dela.Ako se serija podataka rangiranih po veličini podeli u četiri jednaka dela , vrednosti obeležja, koje ih dele nazivaju se kvartilima. Prvi kvartili Q1 i drugi Q2 ili medijana i treći Q3. Ako seriju podelimo u 10 ili 100 jednakih delova, dobićemo decile, odnosno precentile.

Q1= L1+ *i

Q2=L1+ *i

Gde je L1 donja granica kvartilnog intervala, N ukupan broj jednica posmatranja, f1 suma frekvencija do kvratilnog intervala, fQ frekvencija kvartilnog intervala.

*Prvi kvartil (Q1) je vrednost obeležja od koje 25% elemenata skupa uredjenih po veličini ima manju ili jendaku vrednost tog obeležja. Sl. Treći kvartač Q3 se def. Kao ona vrednost obeležja od koje 75% elemenata skupa ima manju ili jendaku vrednost.

Page 19: Skripta Iz Statistike

Mere disperzijeSrednja vrednost karakteriše, u izvesnom smislu dati raspored kao mera centralne tendencije vrednosti obeležja, ali ona nije dovoljna karakteristika, jer drugi rasporedi mogu imati srednju vrednost a razl. Varijaciju(raspršenost ili disperziju). Stat. Opis skupa i uzroka iziskuje zato pored mera centralne tendencije, odnosno lokacije i odg. Mere varijacije ili disperzije. Za merenje disperzije jedne serije koristi se više mera, od kojih neke imaju apsolutni a neke relativni izraz.

Apsolutne mere disperzijeApsolutne mere disperzije iskazuju varijabilitet u apsolutnim iznosima onih mernih jednica u kojima su dati modaliteti posmatranog obeležja:u milionima dinara, hiljadama tona... Ove mere kao i mere lokacije, mogu biti pozicione i izračunate u odnosu na srednju vrendost (najčešće aritmetičku sredinu) skupa ili uzroka.

Od pozicionih mera varijacije najčešće se koristi razmak ili interval varijacije, koji predstavlja razliku najviše i najniže vrednosti obeležja u seriji.

*Interval varijacije i=Xmax-Xmin

Ova mera izračunava se jednostavno, ali daje približnu informaciju o disperziji serije, jer na nju utiču samo krajnje vrednosti posmatranog obeležja koje se mogu znatno razlikovati od ostalih vrednosti. Drugi nedostatak je u tome što je razlika maskimalna i minimalne vrednosti obeležja kod većih serija po pravilu veća, nego kod malih serija. Da bi se eliminisao uticaj ekstremnih vrednosti na iznos razmaka, odnosno intervala vari jacije, izračunava se kao dopunska mera interkvartilna razlika, tj. Razlika izmedju trećeg i prvog kvartila- iq=Q3-Q1

Ona isključuje 25%podataka sa najnižim vrednostima i 25% podataka sa najvišim vrednostima tog obeležja.

*Ako je razmak, odnosno interval varijacije veliki, a interkvartilna razlikamala znači da na krajevima rasporeda postoje ekstremne vrednosti , ali da ostali članove te serije ne pokazuju veliki varijabilitet. Kada je interkvartilna razlika velika, slika o varijabilitetu serije nije dovoljno jasna, tim što se i ova mera zasniva na razlici 2 ćlana serije. Algebarski zbir ovih odstupanja, zbog iznetog svojstva aritmetočke sredine biće jednak nuli. Zato se umesto algebarskih polazi od apsolutnih odstupanja aritmetičke sredineod vrednosti obeležja di=│xi-µ│

Čiji prosek predtsavlja meru varijabiliteta, poznatu kao srednje apsolutno odstupanje .

Za negurpisane podatke izračunavaju se

Page 20: Skripta Iz Statistike

d(sa crtom iznad)=1/N ∑fi│xi-µ│

a za grupisane podatke d(sa crtom iznad)=1/N ∑fi│xi-µ│ gde je N= f1+f2+.....fi+....fk

Standardna devijacija :

;

Relativne mere disperzijeU relativne mere disperzije ubrajaju se koeficijent varijacije, koeficijent interkvarttilne varijacije, i standardizovano odstupanje.

Odnos standardne devijacije i aritmetičke sredine nazivase Koeficijent varijacije :

KV ili V (Uvek se izražava u procentima!!! )

V= σ/M ;

Kada se odstupanje aritmetičke sredine od bilo koje vrednosti obeležja izražava u jedinicama standardne devijacije, dobija se normalizovano, tj. Standardno odstupanje :

Z = X-M/σ ;

Osnovni pojmovi Verovatnoće Pod statističkim, ili slučajnim eksperrimentom podrazumevamo svaki potpuno odredjeni proces posmatranja ili prikupljanja podataka koji mozemo neograničeno da ponavljamo u identičnim uslovima. (Primeri : Bacanje kocke, izvlačenje špila iz karata.. Kada pri eksperimentu sa bacanjem kocke dobijemo 7, takav ishod je nesiguran )

Rezultat slučajnog eksperimenta je ishod.Ishodi su medju sobom isključivi što znači da nijedna dva ishoda, ne mogu da se jave istovremeno.Pre izvodjenja eksperimenta ne znamo koji će se ishod javiti.

Ishodi slučajnog eksperimenta su dati numerički ili atributativno;Numerički ishod predstavlja rezultat nekog brojanja ili merenja,a inače je dat atributativno.

Ishodi slučajnih eksperimenata se zovu elementarni dogadjaji.