52
UNIVERZITET PRIVREDNA AKADEMIJA FAKULTET ZA OBRAZOVANJE DIPLOMIRANIH PRAVNIKA I DIPLOMIRANIH EKONOMISTA ZA RUKOVODEĆE KADROVE NOVI SAD STATISTIKA – SKRIPTA Dragana Trnavac

skripta statistika

Embed Size (px)

DESCRIPTION

statistika,skripta

Citation preview

Page 1: skripta statistika

UNIVERZITET PRIVREDNA AKADEMIJA

FAKULTET ZA OBRAZOVANJE DIPLOMIRANIH PRAVNIKA I DIPLOMIRANIH EKONOMISTA ZA

RUKOVODEĆE KADROVE NOVI SAD

STATISTIKA – SKRIPTA

Dragana Trnavac

2008. godina

Page 2: skripta statistika

Sadržaj

1. Pojam, predmet i zadaci statistike ............................................................... 2.

1.1 Prikazivanje statističkih podataka ................................................................. 5.1.1.1 Statističke tabele ........................................................................................ 5.1.1.2 Grafičko prikazivanje ................................................................................. 9.

2. Mere centralne tendencije ............................................................................ 12.

2.1 Aritmetička sredina ....................................................................................... 12.2.2 Harmonijska sredina ..................................................................................... 15.2.3 Geometrijska sredina ..................................................................................... 15.2.4 Medijana ........................................................................................................ 16.2.5 Modus ............................................................................................................ 17.2.6. Kvartili ......................................................................................................... 18.2.7 Percentili ....................................................................................................... 18.

3. Mere disperzije .............................................................................................. 18.

3.1 Apsolutne mere disperzije………………………………………………….. 19.3.1.1 Interval varijacije ....................................................................................... 19.3.1.2 Interkvartilna varijacija .......................................................................... 19.3.1.3 Srednje apsolutno odstupanje ................................................................. 19.3.1.4 Varijansa ................................................................................................. 20.3.1.5 Standardna devijacija .............................................................................. 20.

3.2 Relativne mere disperzije ………………………………………………… 21.

3.2.1 Koeficijent varijacije ………………………………………………… 21.3.2.2 Standardizovano (normalizovano) odstupanje ………………………. 22.

4. Zadaci za vežbu …………………………………………………………… 22.

Literatura ……………………………………………………………………… 33.

2

Page 3: skripta statistika

1. POJAM, PREDMET I ZADACI STATISTIKE

Statistika je nauka koja brojčanim metodama na naučni način istražuje društvene, ekonomske i prirodne pojave.

Pod statistikom se danas podrazumeva trostruki sadržaj. Pored statistike u užem smislu ili deskriptivne statistike, ona obuhvata statističku analizu i statističku teoriju.Statistika je nauka koja se bavi pitanjima prikupljanja, analize i interpretacije podataka.

Predmet statističkog istraživanja su masovne pojave, koje su po svojoj prirodi varijabilne, pa ih treba posmatrati na velikom broju slučajeva i na osnovu tih posmatranja doneti zaključke.Statistička metodologija se sastoji:

1. Posmatranja,2. Prikupljanja,3. Sređivanja,4. Grupisanja,5. Objavljivanja brojčanih podataka o masovnim pojavama i procesimaPojave su masovne kada ih čini veliki broj elemenata koji se javljaju u vremenu i

prostoru, tj. kada pokazuju veliku varijabilnost od slučaja do slučaja svoga ispoljavanja.Rezultati statističkih istraživanja pomenutih pojava objavljuju se u statističkim publikacijama kao što su na primer, statistički godišnjaci, mesečni

statistički pregledi, statistički bilteni, saopštenja I druge publikacije.Statistističkom istraživanju prethodi definisanje statističkog skupa ( šta, gde, kada)Pojmovno – odrediti

obeležja koja nužno mora da ima element da bi postao član skupa Prostorno – ograničiti prostor na kojem želimo da istražujemo Vremenski 1) skupovi koji mogu da se definišu u jednom trenutku; 2) skupovi koji mogu da se definišu u određenom vremenskom razdoblju.

ObeležjaObeležja su opšte karakteristike elemenata statističkog skupa po kojima jedni drugi su opšte karakteristike elemenata statističkog skupa po kojima jedni drugi nalikuju i po kojima se jedni od drugih razlikuju – variraju. Različiti vidovi u kojim asenalikuju i po kojima se jedni od drugih razlikuju – variraju. Različiti vidovi u kojim ase obeležje može javiti nazivaju se modalitetima tog obeležja.obeležje može javiti nazivaju se modalitetima tog obeležja.Obeležja se mogu deliti prema više kriterijuma, ali je najvažnija podela na atributivna iObeležja se mogu deliti prema više kriterijuma, ali je najvažnija podela na atributivna i numerička.numerička.

Karakteristike elemenata statističkog skupa ili obeležja dele se na: PojmovnaPojmovnaProstornaProstornaNumerička:Numerička:

1.1.prekidna (diskontinuiranaprekidna (diskontinuirana)) 2.2.nn eprekidna ( kontinuiranaeprekidna ( kontinuirana ) ) Vremenska obeležja Vremenska obeležja Podela statističkih

skupova: 1.1.       konačnekonačne – ukoliko možemo da prebrojimo elemente statističkog – ukoliko možemo da prebrojimo elemente statističkog skupaskupann2.2.       beskonačnebeskonačne – statistički skup sa nebrojivim brojem – statistički skup sa nebrojivim brojem elementaelementaGrupisanje mora da bude isključivo ( svaki element stat. skupa mora da nađe svoje mesto isključivo u jednoj od grupa)

iscrpno ili konačno ( svaki element stat. skupa mora da bude obuhvaćen nekom od formiranih grupa)sređeni i grupisani podaci u statističkim serijama brojčano

3

Page 4: skripta statistika

izražavaju pojavu po određenim karakteristikama i utvrđuju njihov značaj u pojavi.Rezultat grupisanja elemenata statističkog skupa prema pojmovnom ili atributivnom obeležju su atributivne statističke grupe. Česta su atributivna obeležja sa samo dva oblika npr. Pol: muški, ženski, vlasništvo društveno, privatno...ATRIBUTIVNA SERIJAATRIBUTIVNA SERIJAAtributivna serija se formira grupisanjem jedinica po atributivnom obeležju. Izražava strukturu posmatrane pojave po modalitetima datog obeležja.Tabela 1. Struktura zaposlenih prema polu u Srbiji

Pol Broj zaposlenih u hiljadama

Muški 1496Ženski 968Izvor: SGJ 1994.NUMERIČKE SERIJE ( SERIJE DISTRIBUCIJE FREKVENCIJE)Nastaju grupisanjem jedinica po vrednostima numeričkog obeležja. U zavisnosti od postupka grupisanja jedinica po numeričkom obeležju, poznate su sledeće mogućnosti formiranja serija distribucije frekvencija.ako je numeričko obeležje prekidno i ima samo nekoliko vrednosti, jedinice se grupišu po pojedinim vrednostima i formira se neintervalna serija distribucije frekvencije.

Tabela 2. Raspored s područja grada Beograda prema broju bioskora 1990. Broj smena Broj firmi

1 102 153 12

1. ako se numeričko obeležje ispolji u velikom broju različitih vrednosti podaci se grupišu po grupama vrednosti koji se nazivajugrupni intervali ( razredi ili klase vrednosti). Grupisanjem jedinica po intervalima vrednosti numeričkih obeležja nastaju intervalne serije distribucije frekvencije. Grupni interval nastaje grupisanjem nekoliko vrednosti obeležja po svojoj veličini.

Tabela 3. Živorođeni u SRJ 1998. god prema starosti majkeStarost majke Broj živorođenih

-15 5915-19 1025120-24 4280325-29 4100530-34 2248935-39 881140-44 176745-49 15850- 30

Kod kontinuiranih numeričkih obeležja gornja granica razreda označava se istim brojem kao i donja granica sledećeg razreda, dok kod diskretnih gornja granica razreda označava se brojem koji je za jednu jedinicu manji od donje granice razreda koji sledi.

4

Page 5: skripta statistika

Osnovne karakteristike numeričke serije:- obe kolone su brojčane- vednostiobeležja u i koloni variraju od najniže do najviše veličine i

nazivaju se varijantama x- grupisani podaci u II koloni su frekvencije ili učestalosti koje pokazuju

koliko se puta svaka vrednost pojavljuju, f- zbir frekvencija koji se naziva brojnost serije, predstavlja ukupan broj

jedinica posmatranja.

Rezultat grupisanja statističkih podataka prema prostornom ili geografskom obeležju biće prostorne ili geografske statističke grupe. One nastaju jednostavnim sabiranjem podataka koje se odnosi na određeno područje.

Tabela 4. Zaposleni na teritoriji SR Jugoslavije

Ako se statistički skup raščlani prema vremenskom obeležju dobijaju se vremenske grupe. Vremenska grupa je definisana jednim vremenskim razdobljem ili intervalom ( godina, polugodište, tromesečje, mesec dekada, sedmica, dan, ali I turistička sezona, školska godina).

Tabela 5. Zaključeni brakovi na teritoriji SR Jugoslavije u periodu od 1995 do 1998. godine

5

...Kosovo i Metohija

426978Vojvodina

1243889Centralna Srbija

1670866Srbija

115299Crna Gora

Broj zaposlenihRepublika

548221998

562031997

567191996

603251995

Zaključivanje brakova

Godina

Page 6: skripta statistika

Statistička serija se prikazuje u obliku tabele, najmanje u dva reda i dve kolone, gde je u prvoj koloni iskazana kvalitativna strana statističke mase, a u drugoj kvantitativna (brojčana) strana.

1.1 Prikazivanje statističkih podataka

1.1.1 Statističke tabele

Statistička tabela predstavlja uokvirenu površinu u koju se unosi statistička serija. Pri sastavljanju statističkih tabela treba se pridržavati određenih pravila. Pravila sastavljanja tabela treba da obezbede da svaka tabela služi svojoj nameni i da bude:

Razumljiva, Pregledna i Jedinstvena.

Razumljivost tabele postižemo ako se pridržavamo sledećih pravila: Svaka tabela mora da ima naziv koji treba, u kratkom i jasnom obliku da kaže

njen sadržaj, Modaliteti obeležja bilo da su dati opisno (atributivna obeležja), bilo numerička

ne smeju se u pretkoloni i zaglavlju skraćivati, Uz svaku tabelu treba navesti izvor podataka, i to u napomeni ispod tabele, Podaci kojima su potrebna objašnjenja prikazuju se na taj način što se uz njih

stavi cifra, a ispod naziva tabele pod istom cifrom daje se kratko objašnjenje.

Statistička tabela ima tekstualni i numerički deo.

6

Page 7: skripta statistika

Pravila sastavljanja tabela: Tabela treba da ima što manje redaka i stupaca Tačka ili zapeta stavlja se samo iza celog broja pri upisivanju brojeva u tabeli.

Počevši od decimalne tačke ulevo grupe od po tri broja odaljuju se razmakom radi lakšeg čitanja. Gde god je moguće brojevi se skraćuju i zaokružuju.

Ako se tabela sastoji od više stupaca potrebno ih je numerisati U tabeli nijedno polje ne sme da ostane prazno, to se postiže upotrebom niza

znakova ( - nema pojave, ... Ne raspolaže se podatom, 0 podatak je manji od 0.5 date jedinice, 123! Napomena, (123) nepotpun neproveren podatak, 123*ispravljen podatak)

Prema sadržaju, tabele mogu biti:•proste,•složene,•kombinovane.

Proste – služe za prikazivanje jedne pojave, sledi primer

Složene ili skupne – dobija se spajanjem više prostih tabela koji pokazuju različite statističke skupove, a pri tom su račšlanjene prema istom obeležju i u međusobnoj su sadržinskoj vezi.Kombinovane – služe za prikazivanje statističkih podataka sređenih prema najmanje dva obeležja zbirni red i zbirna kolona.

7

Page 8: skripta statistika

1.1.2 Grafičko prikazivanje

Pravila za crtanje grafikona: Grafikoni treba da budu razumljivi onoj kategoriji kojoj su namenjeni U grafikonu mora da su očigledni odnosi i strukture Grafikon ne sme da bude preopterećen podacima koji otežavaju razumevanje U grafikonu treba izbeći formalna preterivanja koja odvraćaju pažnju od

sadržaja

Vrste grafikona

Podela prema šablonu na kome se grafikon crta: Grafikoni u pravouglom koordinatnom sistemu Polarni grafikoni Grafikoni na geografskim kartama itd.

Zavisno od nastajanja grafikona, razlikujemo: Radne ili kontinuirane Završene grafikone.

Postoje, takođe i samostalni i ilustrativni.

Grafikoni se najčešće dele na sledeći način:•tačkasti (stigmogrami),•površinski,•prostorni,•linijski,•kartogrami.

8

Page 9: skripta statistika

Površinski grafikoni ili grafikoni upoređivanja

Grafikon u kome se upoređuju samo visine zove se grafikon sa stupcima. Ovom vrstom grafikona moguće je prikazivati samo atributivne i geografske (prostorne) statističke serije jer su veličine među njima međusobno nezavisne i vremenski nisu vezane.

Za prikazivanje strukture pojave prikladan je i krug. Njegova prednost je njegova zatvorena površina u koju se ne može ništa dodati, promena radijusa kruga ne utiče na strukturu.

9

Page 10: skripta statistika

Grafički prikaz distribucije frekvencije tj. numeričke serije jednostavnim stupcima zove se histogram. Histogramom se prikazuje statistički skup koji sadrži elemente sa numeričkim obeležjem različitog intenziteta

Tabela 5. Nepismeno stanovništvo u SRJ prema popisu 1991.

StarostBroj

nepismenih I fc10-15 9843 5 189715-20 11003 5 220120-30 22580 10 225830-40 27673 10 276740-50 36710 10 367150-60 119310 10 11931

Izvor: SGJ 1993. godine, str.62

10

Page 11: skripta statistika

Linijski grafikoni

Linijskim grafikonima prikazuju se numerički i vremenski statistički nizovi.Linijski grafikon za prikazivanje numeričkih statističkih nizova zove se poligon frekvencije. Poligon frekvencije nastaje spajanjem tačaka. Svaka tačka u grafikonu određena je parom vrednosti:

Na apscisi – sredinom klase Na ordinati – veličinom frekvencije

Kartogrami

Grafikoni na geografskim kartama nazivaju se kartogrami.Pojedini autori kartograme dele na:

1. Kartograme intenziteta mesta2. Kartograme intenziteta veza između pojedinih mesta i 3. Kartograme intenziteta pojava na određenim područjima.

Sa aspekta načina crtanja razlikujemo sl. vrste kartograma:1. Dijagramske karte2. Piktograme i 3. Statističke karte.

11

Page 12: skripta statistika

12

Page 13: skripta statistika

2. MERE CENTRALNE TENDENCIJE

Mere centralne tendencije otkrivaju pre svega, tendenciju grupisanja – koncentracije pojedinih vrednosti obeležja oko vrednosti karakteristične za posmatrani skup.U zavisnosti od načina određivanja centralne vrednosti obeležja skupa srednje vrednosti dele se na:

Svojstva pojedinih srednjih vrednosti određuju koja će od njih biti upotrebljena na konkretnoj statističkoj seriji. Svaka od nabrojanih srednjih vrednosti mora da ispuni sledeće uslove:

Da se utvrđuje objektivnim matematičkim postupkom, Da se njena vrednost nalazi između najniže i najviše vrednosti posmatranog

obeležja i Ukoliko su sve vrednosti obeležja međusobno jednake i srednja vrednost mora

biti jednaka toj vrednosti obeležja.

2.1 Aritmetička sredina

Simboli koji se koriste:Aritmetička sredina uzorka (čita se ''iks bar'')Aritmetička sredina osnovnog skupa čita se ''mi'')

Aritmetička sredina je poznata pod nazivom prosek. Izračunava se tako što se sve vrednosti numeričkog obeležja saberu, pa se zatim zbir podeli sa brojem podataka.

Prema tome da li su podaci grupisani ili ne, razlikuju se:•prosta aritmetička sredina,•ponderisana (složena, vagana) aritmetička sredina.

13

Page 14: skripta statistika

Označimo li vrednost numeričkog obeležja sax , x , x , ...., x

onda je aritmetička sredina za tih N vrednosti numeričkog obeležja N-ti deo totala.

ili

Primer 1.1. Ako na pet ekonomskih fakulteta broj upisanih u prvu godinu stidija iznosi 820, 830, 860, 880 i 910 prosečan broj upisanih studenata, odnosno, aritmetička sredina biće:

Objašnjenje: prosečan broj upisanih je 860 studenata.

Aritmetička sredina se iskazuje u onim jedinicama mere u kojima je iskazano i numeričko obeležje. I kada je izračunata za diskretno numeričko obeležje može da se izrazi u decimalnim brojevima, jer je aritmetička sredina izračunata srednja vrednosti.to je onaj jednaki deo vrednosti numeričkog obeležja koji otpada na jedan element skupa.Aritmetička sredina ima osobine koje je karakterišu kao srednju vrednost i izvesne osobine značajne za njenu primenu i izračunavanje.

1. Aritmetička sredina veća je od najmanje i manja od najveće vrednosti posmatranog obeležja

x < < x2. Zbir odstupanja aritmetičke sredine od pojedinih vrednosti obeležja jednak je

nuli:

3. zbir kvadrata odstupanja pojedinih originalnih vrednosti numeričkog obeležja od aritmetičke sredine je najmanji mogući zbir

14

Page 15: skripta statistika

Aritmetička sredina se iskazuje u onim jedinicama mere u kojima je iskazano i numeričko obeležje. Aritmetička sredina je jedna i ne zavisi od načina izračunavanja. Ako je izračunata iz grupisanih podataka aritmetička sredina se zove ponderisana ili vagana aritmetička sredina. Pri množenju frekvencija sa odgovarajućom vrednošću numeričkog obeležja, ta vrednost se ponderiše. Ponderisana aritmetička sredina

Ukoliko su intervalne numeričke serije izračunavanju aritmetičke srendine mora da prethodi:

Formiranje preciznih i pravih granica razreda Izračunavanje sredine razreda- reprezentativnih vrednosti numeričkog obeležja

za pojedine razrede i Izračunavanje totala u svakom od razreda ( subtotala).

Primer 1.2 za izračunavanje ponderisane aritmetičke sredine kod intervalnih numeričkih serija. Pri ispitivanju 172 ispitanika o godinama starosti dobijeni su sledeći rezultati

Godine starosti Broj ispitanika20-27 927-30 630-35 2135-40 3240-45 3145-50 3450-55 2255-65 17

Ukupno 172

Izračunati prosečnu starost ispitanika.

15

Page 16: skripta statistika

Godine starosti Broj ispitanika f

Sredina razreda x

fx

20-27 9 23.5 211.527-30 6 28.5 171.030-35 21 32.5 682.535-40 32 37.5 1200.040-45 31 42.5 1317.545-50 34 47.5 1615.050-55 22 52.5 1155.055-65 17 60.0 1020.0

Ukupno 172 7372.5

=

Tumačenje: Prosečna starost ispitanika je 42.86 godine.

2.2 Harmonijska sredina

Simbol: H

Harmonijska sredina je recipročna vrednost aritmetička sredina izračunata iz recipročnih vrednosti, za koje se sredina izračunava.Nevagana kod negrupisanih vrednosti

Harmonijsku sredinu ima smisla tražiti samo za ona obeležja koja surazličita od nule. Primenjuje se uglavnom za izračunavanje indeksnih brojeva, odnosno srednjeg indeksa i u slučajevima kada su obeležja statističkih jedinica izražene u obliku tzv. Recipročnih pokazatelja. Na primer, vreme utrošenu za izradu jedinice proizvoda je recipročna vrednost produktivnosti (što je vreme veće produktivnost je manja), brzina opticaja robe ili novca je recipročna vrednost vremena potrebnog za opticaj itd.

Primer 2.1 Ako jedan vozač automobila pređe razdaljinu od 240 km, vozeći brzinom od 120 km/h za dva sata, a zatim istu razdaljinu pređe za 3 sata vozeći brzinom 80

km/h, kolika je prosečna brzina.

H =

16

Page 17: skripta statistika

Objašnjenje: Prosečna brzina iznosi 96 km/h.

2.3 Geometrijska sredina

Simbol: G

Geometrijska sredina spada u izračunate srednje vrednosti koja se koristi kada u numeričkoj seriji obeležja pokazuju neke relativne pokazatelje (indekse) ili

karakteristike geometrijske progresije.Geometrijska sredina dobija se kada se iz proizvoda pojedinih vrednosti obeležja

date serije izvadi koren čiji je izložilac ravan broju svih članova serije.

G =

logG =

G = N

2.4 Medijana

Simbol: Me

Medijana je srednja vrednost numeričkog obeležja po položaju. Ona elemente numeričkog skupa deli u dva jednaka dela, tako da se u jednom delu nalaze elementi koji imaju vrednosti numeričkog obeležja jednaku ili manju od medijane, a u drugom se delu nalaze elementi koji imaju vrednost numeričkog obeležja jednaku ili veću od medijane.

Za neparne nizove negrupisanih podataka medijana se određuje jednostavno – traženjem središnog člana uređenog niza po veličini podataka. Za seriju negrupisanih podataka medijana se određuje na taj način što se ukupan broj članova serije, sređenih po veličini poveća za jedan (n+1) i podeli sa 2 tj,:

Me = x Ako je u seriji paran broj članova, tada ne postoji središnji element. Sredina je

između dva središnja elementa, tj. za medijanu se uzima aritmetička sredina tih članova.

Me =

Medijana može da se odredi i grafički uz pomoć kumulacija ispod i iznad.Primer 2.1 U odeljenju osnovne škole izabran je uzorak od 5 učenika i posmatrani su po broju opravdanih izostanaka34, 24, 27, 25, 30Izračunati medijanu.

17

Page 18: skripta statistika

Rešenje:24, 25, 27, 30, 34

Me = x = x = x =27Objašnjenje: Polovina učenika ima najmanje 27 izostanaka, dok druga polovina učenika ima najviše 27 izostanaka.

Primer 2.2 Ako u prethodnom primeru 3.1 u uzorku od 5 učenika dodamo još jednog učenika i zabeležimo njegove opravdane izostanke koji iznose 29 dobićemo paran broj negrupisanih podataka poređanih po veličini:24, 25, 27, 29, 30, 34.

Rešenje:S obzirom da imamo paran broj podataka u uzorku primenjujemo formulu:

Me = = =

Objašnjenje: 50% učenika ima najmanje 28 izostanaka, dok drugih 50% ima najviše 28 izostanaka.

Izračunavanje medijane, kada su jedinice grupisane u razrede, provodimo pomoću sledeće formule

Me= l

zbir kumulativne serije do medijalnog, ne uključujući frekvenciju medijalnog razredal donja granica medijalnog razreda

frekvencija medijalnog razreda veličina medijalnog razreda

Primer 2.3 na primeru 1.2 izračunati medijanu

Godine starosti Broj ispitanika Kumulativ ispod20-27 9 927-30 6 1530-35 21 3635-40 32 68

18

Page 19: skripta statistika

40-45 31 9945-50 34 13350-55 22 15555-65 17 172

Ukupno 172

Me= l

U primeru ispitanika prema godinama starosti to su sledeće veličine

l

Me = 40 + godina starosti

2.5 Modus

Simbol: MoModus je vrednost obeležja koja u posmatranoj seriji ima najveću frekvenciju –

najčešće se javlja. Kada je u jednoj seriji samo jedna vrednost obeležja sa najvećom frekvencijom kažemo da je unimodalna, a ako postoje dve serija je bimodalna, a ako postoje više multimodalna.

Za serije grupisanih podataka modus tražimo u intervalu sa najvećom frekvencijom, koji se naziva modalnim.

Modus se može utvrditi i na osnovu grafičkog prikaza!

Primer 5.1 Na kolokvijumu iz statistike u uzorku od 10 studenata dobili smo sledeće rezultate:6, 7, 7, 5, 8, 10, 5, 7, 9, 6.Izračunati modus.

Rešenje: 5, 5, 6, 6, 7, 7, 7, 8, 9, 10.Mo = 7Objašnjenje: najčešća ocena na kolokvijumu iz statistike je 7.

Ukoliko je serija sa prekidnim vrednostima obeležja modus se određuje jednostavno: vrednost obeležja čija je frekvencija najveća predstavlja modus.

19

Page 20: skripta statistika

Primer 5.2 odrediti modus za podatke prodaje muških košulja po velečini u toku januara 2000 godine, u jednoj robnoj kući u Beogradu

Veličina košulje Broj prodatih košulja

37 5038 5939 9440 10841 8542 5043 5

Ukupno 451

Mo = 40Vidimo da veličina (broj košulje) 40 ima najveću frekvenciju: prema tome modus je 40. to znači da je najviše prodato muških košulja veličine broj 40, odnosno da se ta veličina košulje najčešće kupuje.

Za preciznije određivanje modusa kod intervalnih serija grupisanih podataka polazi se od činjenice da se modus nalazi u intervalnoj grupi s najvećom frekvencijom, i to između donje i gornje granice tog intervala, pa se može odrediti pomoću obrasca:

Mo =

donja granica intervala ( interval s najvećom frekvencijom u kome se nalazi modus)b frekvencija modalnog razredaa frekvencija razreda ispod modalnogc frekvencija razreda iza modalnogi veličina modalnog razreda

Primer 5.3 za distribuciju frekvencije odredićemo modus polazeći od modalnog razreda

Godine starosti Broj ispitanika20-27 927-30 630-35 2135-40 32

20

Page 21: skripta statistika

40-45 a 3145-50 b 3450-55 c 2255-65 17

Ukupno 172

Mo =

Modalni interval je 45-50, zato što taj interval ima najveću frekvenciju.

Mo = 45 +

2.6 Kvartili

Simboli: Q1, Q2, Q3

Kvartili su srednje vrednosti po položaju koje dele statističku seriju na četiri jednaka dela kada su vrednosti obeležja poređane u rastući niz. Postoji ukupno tri kvartila

Prvi kvartil (Q1) je vrednost obeležja od koje 25% elemenata skupa uređenih po veličini ima manju ili jednaku vrednost tog obeležja. Drugi kvartil Q2 je medijana. Treći kvartil Q3, definiše se kao ona vrednost obeležja od koje 75% elemenata skupa ima manju ili jednaku vrednost.

2.7 Percentili

Simbol: P

21

Page 22: skripta statistika

Percentili su srednje vrednosti po položaju koje dele statističku seriju na sto jednakih delova.

3. MERE DISPERZIJE

Pokazatelji veličine odstupanja vrednosti obeležja od srednje vrednosti nazivaju se mere disperzije.

Odstupanje svake pojedine vrednosti obeležja od srednje vrednosti naziva se devijacija. Odstupanje svih vrednosti serije od srednje vrednosti pokazuje disperziju ili rasturenost serije.

Od veličine odstupanja pojedinih vrednosti obeležja od srednje vrednosti zavisi i veličina disperzije. Ukoliko su odstupanja veća utoliko je veća i disperzija.

Za merenje disperzije jedne serije koristi se više mera, od kojih neke imaju apsolutni a neke relativni izraz.

22

Page 23: skripta statistika

3.1 Apsolutne mere disperzije

Apsolutne mere disperzije iskazuju varijabilitet u apsolutnim iznosima onih mernih jedinica u kojima su dati modaliteti posmatranog obeležja: u milionima dinara, hiljadama tona, kilometrima, komadima itd.

3.1.1 Interval varijacije

Simbol: IInterval varijacije predstavlja razliku između najveće i najmanje vrednosti obeležja.

I = xOva mera koja ima smisla samo za konačne razmake, izračunava se jednostavno, ali ona daje približnu informaciju o disperziji serije, jer na nju utiču samo krajnje vrednosti posmatranog obeležja koje se mogu znatno razlikovati od ostalih vrednosti.Drugi njen nedostatak je u tome što je razlika maksimalne i minimalne vrednosti obeležja kod većih serija veća nego kod malih serija.

3.1.2 Interkvartilna varijacija

Interkvartilna varijacija je mera varijacije koja zanemaruje uticaj ekstremnih vrednosti obeležja i pokazuje razliku između prvog i trećeg kvartila u numeričkoj seriji.

IQ = Q3−Q1

Ona isključuje 25% podataka sa najnižim vrednostima i 25% podataka sa najvišim vrednostima obeležja.

3.1.3 Srednje apsolutno odstupanje

Srednje apsolutno odstupanje dobija se kada se zbir razlika originalnih vrednosti numeričkog obeležja od aritmetičke sredine, bez obzira na predznak, podeli sa brojem članova u seriji. Srazmerno svojoj veličini na ovu meru disperzije utiče svaki član serije.

3.1.4 Varijansa

Simbol: 2 (sigma na kvadrat)

23

Page 24: skripta statistika

Prosek kvadrata odstupanja pojedinačnih vrednosti obeležja od aritmetičke sredine ili medijane.Njena vrednost se nalazi u intervalu [0, +∞]

2 = (negrupisani podaci osnovni skup)

2= ( negrupisani podaci uzorak)

(grupisani podaci osnovni skup)

3.1.5 Standardna devijacija

Simbol: (sigma)Prosečno odstupanje pojedinačnih vrednosti obeležja od aritmetičke sredine, izraženo u jedinicama mere u kojima je izraženo i obeležje koje se posmatra.

za negrupisane podatke

za grupisane podatke

3.2 Relativne mere disperzije

3.2.3 Koeficijent varijacije

Simbol: V

24

Page 25: skripta statistika

Relativna mera varijacije koja pokazuje koliko procenata iznosi standardna devijacija od aritmetičke sredine.

Odnos standardne devijacije i aritmetičke sredine naziva se koeficijentom varijacije.

Što je koeficijent varijacije veći to je odstupanje veće. Za serije čiji su svi članovi jednaki, koeficijent varijacije biće jednak nuli. Koeficijent varijacije može se koristiti za poređenje raspršenosti serija čije merne jedinice nisu iste.

3.2.3 Standardizovano (normalizovano) odstupanje

Mera varijacije koja pokazuje odstupanje jedne vrednosti obeležja od aritmetičke sredine u standardnim devijacijama.

Z =

4. Zadaci za vežbu

1. Dati su sledeći podaci o broju prodatih kifli po satu u toku jednog radnog dana pekare:

8, 2, 4, 5, 4, 3, 9, 4, 5.Nađite aritmetičku sredinu, medijanu i modus.

Rešenje:2, 3, 4, 4, 4, 5, 5, 8, 9

Objašnjenje: Prosečan broj prodatih kifli po satu je 4.888 komada.

Me = x =x

2, 3, 4, 4, 4, 5, 5, 8, 9

Objašnjenje: U uzorku od devet elemenata, u jednoj polovini ima manje ili jednako 4 prodate kifle, a u drugoj polovini ima više od 4 prodate kifle.

Mo = 4

Objašnjenje: Najveći ( najčešći) broj prodatih kifli po satu je 4.

25

Page 26: skripta statistika

2. Dati su sledeći podaci

14, 9, 31, 60, 22, 3, 13, 33Nađite aritmetičku sredinu, medijanu.

Rešenje:

3, 9, 13, 14, 22, 31, 33, 60

3, 9, 13, 14, 22, 31, 33, 60

Me = = =

3. Menadžment prodaje '' Elektro Šumadije'' iz Kragujevca je na slučajan način izabrao 10 potrošača. Njihovi računi za utrošenu električnu energiju iznosili su (izraženo u evrima):

54, 48, 58, 50, 25, 54, 56, 35, 68, 47.Potrebno je izračuneti srednu vrednost potrošnje električne energije za razmatrani period, odrediti medijanu i modus.

Rešenje:25, 35, 47, 48, 50, 54, 54, 56, 58, 68

Prosečna vrednost potrošnje električne energije je 49.5 eur.

e = =

25, 35, 47, 48, 50, 54, 54, 56, 58, 68

Objašnjenje: 50% domaćinstva ima najmanji vrednost potrošnje električne energije od 52 eur, 50% domaćinstava ima najvišu vrednost potrošnje električne energije od 52 eur.

Mo=54Objašnjenje: najveća (najčešća) vrednost potrošnje električne energije je 54eur.

4. Broj pošta u opštinama Južno-banatskog okruga u 2001. godini:

6, 15, 4, 6, 6, 7, 4, 4, 4, 3, 1, 4, 6.

26

Page 27: skripta statistika

Izvor: Opštine u Srbiji u 2002. godini str.203

Izračunati aritmetičku sredinu, medijanu i modus.

Rešenje:

Objašnjenje: Prosečan broj pošta u opštinama Južno-banatskog okruga je 5.38.

1, 3, 4, 4, 4, 4, 4, 6, 6, 6, 6, 7, 15Me = 4

Objašnjenej: 50% opština Južno-banatskog okruga ima najmanje 4 pošte, 50% opština Južno-banatskog okruga ima najviše 4 pošte.

Mo = 4

Objašnjenje: Najviše (najčešći) broj pošta u opštinama Južno-banatskog okruga je 4.

5. Broj umrlih od zaraznih bolesti u opštinama Rasinskog okruga u 2001. godin

3, 1, 4, 3, 2, 2, 7, 4.Odrediti aritmetičku sredinu, medijanu i modus.

Rešenje:

1, 2, 2, 3, 3, 4, 4, 7

Me =

Mo1=2 Mo2 = 3 Mo3 = 4

6. Broj stranih turista u Rasinskom okrugu:

48. 283. 10. 992. 123. 196Izvor: Opštine u Srbiji u 2002. god str. 228

Odrediti prosek, medijanu i modus.

Rešenje:

27

Page 28: skripta statistika

Objašnjenje: prosečan broj stranih turista u Rasinskom okrugu je 275.33 turista.

10, 48, 123, 196, 283, 992

Me=

Objašnjenje: 50% poseta ima najviše 159.5 turista, a drugih 50% ima najmanje 159.5 turista.

Modusa nema.

7. U 11 okruga na slučajan način prijavljeno je trgovina na malo:

936, 401, 387, 775, 980, 857, 662, 412, 392, 249, 252.Na osnovu ovih podataka izračunati prosečan broj trgovina na malo, vrednost medijane, vrednosti kvartila.

Rešenje:

Objašnjenje. Prosečan broj trgovina na malo u uzorku od 11 okruga iznosi 573 prodavnica po okrugu.

249 252 387 392 401 412 662 775 857 936 980x x x x x x x x x x x

Me = x =x

Objašnjenje:u uzorku od 11 okruga, u jednoj polovini okruga ima manje ili jednako 412 trgovina na malo, a drugoj polovini okruga ima više od 387 trgovina na malo.

Q

Objašnjenje: u uzorku od 11 okruga, u jednoj četvrtini okruga ima manje ili jednako 387 trgovina na malo, a u tri četvrtine ima više od 387 trgovina na malo.

Q

Objašnjenje: u uzorku od 11 okruga, u tri četvrtine okruga ima manje ili jednako 857 trgovina na malo, a u jednoj četvrtini ima više od 857.

28

Page 29: skripta statistika

8. Broj posetilaca bioskopa na 100 stanovnika) u 13 opština grada Beograda u 2001. godini:

401, 13, 26, 58, 19, 129, 39, 7, 3, 331, 8, 1782, 39.

Izvor: Opštine u Srbiji u 2002. god,str. 303

Izračunati i objasniti aritmetičku sredinu, medijanu i modus.

Rešenje:

Me=39Mo=39

9. Broj lekara u 8 opština Mačvanskog okruga u 2001. godini:

27, 15, 11, 13, 179, 18, 6, 295

Izvor: Opštine u Srbiji u 2002. godini, str.307

Izračunati i objasniti opseg, interkvartil, varijansu, standardnu dvijaciju, koeficijent varijacije i koeficijent kvartilne devijacije.

Rešenje:6, 11, 13, 15, 18, 27, 179, 295OpsegI = x =295-6 = 289.

Objašnjenje: broj lekara varira u rasponu od 289.

Interkvartil:

I= Q

Q =

Objašnjenje: 25% opština Mačvanskog okruga ima najviše 12 lekara, a 75% opština ima najmanje 12 lekara.

Q

29

Page 30: skripta statistika

Objašnjenje: 75% opština ima najviše 103 lekara, a 25% opština ima najmanje 103 lekara.

I= Q = 103-12 = 91

Objašnjenje: 50% središnjih podataka varira u rasponu od 91.

Varijansa

2 =

6

2 = =

Objašnjenje: prosek kvadratnih odstupanja broja lekara svake opštine od prosečnog broja lekara iznosi 10124.75

Standardna devijacija:

Objašnjenje: prosečno odstupanje broja lekara svake opštine od prosečnog broja lekara (70.5) iznosi 100.62

Koeficijent varijacije

V=

Objašnjenje: disperzija svih podataka skupa je veoma velika, odnosno prosečno odstupanje broja lekara iznosi 143.74% aritmetičke sredine.

10. Broj žena odbornika skupština opština u opštinama Južno-banatskog okruga u 2000 godini:

3, 3, 4, 3, 6, 1, 12, 3

30

Page 31: skripta statistika

Izvor: Opštine u Srbiji u 2002, godini str. 23

Ispitati apsolutnu disperziju pomoću standardne devijacije i relativnu disperziju pomoću koeficijenta varijacije.

Rešenje:Standardna devijacija

2 =

3

2 = =

Objašnjenje: Prosečno odstupanje broja žena odbornika od proseka (4.375) je 3.159 odbornika.

V=

11. Broj prodavnica štampe u 6 opština u gradu A:

8, 10, 7, 12, 7, 12Ako je u 8 opština u gradu B prosečan broj prodavnica štampe 9 sa varijansom 10. ispitati da li je veće variranje prema prosečnom broju prodavnica štampe u opštinama grada A ili B?

Rešenje:

V =

2 =

31

Page 32: skripta statistika

8

2 = =

V = =

Prodavnica BN=8

=9

2=10 =

V = =

Objašnjenje: Prema prosečnom broju prodavnica veće je variranje u opštini grada B nego u opštini grada A (jer je 35.14%>23.04%).

12. Broj naselja u opštinama Kosovskog okruga u 2001. godini:

37, 42, 18, 70, 18, 78, 46, 46, 22, 16Izvor: Opštine u Srbiji u 2002. godini, str.18

Odrediti opseg, prvi, drugi i treći kvartil.

Rešenje:

QQQI=28

13. Prosečan dnevni promet u prodavnici A je 10.000 din. Sa varijansom 1.000.000, a u prodavnici B prosečan dnevni promet je 12.000 din, sa varijansom 1.562.500. Uporedite apsolutne i relativne disperzije dve prodavnice.

Rešenje:

32

Page 33: skripta statistika

Prodavnica A:=10000

2=1.000.000

V = =

Prodavnica B:=12000

2=1562500

V = =

14. 8 taksi vozača dalo je sledeće podatke o broju putnika u toku dana

5, 8, 7, 10, 12, 4, 13, 15

U kojoj meri od proseka odstupa taksi vozač koji preveze 11 putnika?

Rešenje:

Z =

X=11

2 =

2=

Z =

33

Page 34: skripta statistika

Objašnjenje: Vozač koji preveze 11 putnika od proseka odstupa za 0.48 standardnih devijacija.

15. U porodilištu u toku 24 časa rođeno je 12 bebe sa telesnom masom pri porođaju u kilogramima:

3.12; 4.02; 3.45; 2.98; 3.67; 3.18; 3.85; 3.72; 3.38; 3.95; 3.48; 3.56.

Na osnovu ovih podataka izračunati prosečnu telesnu masu novorođenih beba, medijanu, kvartile i osmi decil.

Rešenje:

Objašnjenje: prosečna telesna masa novorođenih beba iznosi 3.53 kilograma.

Rastući niz podataka (telesnih masa beba) je:

2.98 3.12 3.18 3.38 3.45 3.48 3.56 3.67 3.72 3.85 3.95 4.02x x x x x x x x x x x x

Q Me Q

e = =

Objašnjenje: u skupu od 12 novorođenih beba, 50% beba ima manje od 3.52 kilograma, a drugih 50% beba imala je telesnu masu veću od 3.52 kilograma.

Q =

Objašnjenje: u skupu od 12 novorođenih beba kod 25% beba telesna masa pri porođaju je bila manja od 3.28, a kod 75% telesna masa je bila veća od 3.28 kilograma.

Q

34

Page 35: skripta statistika

Objašnjenje: Kod 75% novorođenih bebe telesna masa pri porođaju bila je manja od 3.785, a kod 25% beba telesna masa je bila veća od 3.785 kilograma.

16. Domaćinstva Vojvodine prema broju članova, po popisu iz 1991 godine

Broj članova Broj domaćinstava (u 000)

1 122.92 177.73 139.24 163.35 49.86 22.87 6.1

8 i više 3.2Ukupno 685

Izvor: SCG 2000; dtr 53

Izračunati i objasniti aritmetičku sredinu, medijanu i modus.

17. Broj izgrađenih stanova u Vojvodini u 1999. godini prema veličini stana ( broju soba)

Veličina stana (broj soba)

Broj stanova

1 3152 5743 5214 i više 607Izvor: SGS 2000; str 245

Izračunati i objasniti aritmetičku sredinu i medijanu.

Rešenje: =2.7 Me = 3

18. Broj razvedenih brakova prema broju izdržavane dece u Centralnoj Srbiji 1991. godine

Broj izdržavane dece

Broj razvedenih brakova

35

Page 36: skripta statistika

0 20091 13862 10853 i više 163

Izvor: SGS 200.str 70

Izračunati i protumačiti aritmetičku sredinu i medijanu.

Rešenje: = 0.87 Me=1

18. Porodica Marić je u junu 2003. godine obavila 80 telefonskih razgovora sa sledećom dužinom trajanja:

Dužina razgovora (u minutima)

Broj razgovora

Do 5 205.1-10 2810.1-15 1615.1-20 11

20.1 i više 580

Izračunati i objasniti aritmetičku sredinu, medijanu i modus.

Rešenje:

Dužina razgovora (u minutima)

Broj razgovora X fx Kumulativ ispod

Do 5 20 2.5 50 205.1-10 28 7.5 210 4810.1-15 16 12.5 200 6415.1-20 11 17.5 192.5 75

20.1 i više 5 22.5 112.5 8080 765

=

Tumačenje: prosečna dužina razgovora je 9.56 minuta.

36

Page 37: skripta statistika

Me=

Me= l = 5+

Tumačenje: 50% razgovora traje najviše 8.57 minuta, a drugih 50% razgovora traje najmanje 8.57 minuta.

Najveća frekvencija je 28, to znači da je Mo: 5.1-10

Mo = = 5+

Tumačenje: jnajveći broj razgovora traje 7 minuta.

19. Zaključeni brakovi u Vojvodini prema starosti muža u 1998. godini:

Sstarost muža Broj brakovaDo 25 297425-29 344630-35 165435-40 79740-45 41045-50 30550i više 770

Izvor: SGS 2000. str 69

Izračunati i objasniti aritmetičku sredinu, modus i medijanu.

20. Dat je raspored 300 studenata jednog fakulteta prema visini:

Visina ( u cm) Broj studenataDo 165 70165.1-175 80175.1-185 60185.1-195 70195.1 i više 20

Izračunati opseg, varijansu, standardnu devijaciju, koeficijent varijacije.

Rešenje:

37

Page 38: skripta statistika

x f X fx fxDo 165 70 160 11200 1792000165.1-175 80 170 13600 2312000175.1-185 60 180 10800 1944000185.1-195 70 190 13300 2527000195.1 i više 20 200 4000 800000Ukupno 300 52900 9375000

Opseg: R = x

Varijansa:

=

Standardna devijacija:

Koeficijent varijacije:

V=

21. Dat je raspored 50 studenata prema prosečnoj oceni i prema broju položenih ispita

Da li studenti više variraju prema prosečnoj oceni ili prema broju položenih ispita.

Prosečna ocena

Broj studenata

6-7 107-8 158-9 20

9 i više 5 50

Broj položenih ispita

Broj studenata

10 812 1215 516 1018 15

50

38

Page 39: skripta statistika

Literatura:

[1] Ajduković, G., Poslovna statistika, Fakultet za trgovinu i bankarstvo “ Janićije i Danica Karić”, Beograd 2006. godine

[2] Žižić, M., Lovrić, M., Pavličić, D., Metodi statističke analize, Ekonomski fakultet,Beograd, 2005.

39