21
- 1 - Ekonomski fakultet, Univerzitet Beograd Seminarski rad: Statistička analiza prosečne visine aketiranih studenata Ekonomskog fakulteta Student: Bosiljčić Igor Beograd, 2001.

Bosiljčić igor seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

Embed Size (px)

Citation preview

Page 1: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 1 -

Ekonomski fakultet, Univerzitet Beograd

Seminarski rad:

Statistička analiza prosečne

visine aketiranih studenata

Ekonomskog fakulteta

Student:

Bosiljčić Igor

Beograd, 2001.

Page 2: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 2 -

1. Uvod 1.1. Osnovne karakteristike seminarskog rada Cilj ovog seminarskog rada je da objasni pojam, karakteristike, funkciju (primenu) parametara skupa. Rad obrađuje sve parametre sa 2 aspekta:

1. teorijski 2. prakticni.

Teorijska dimenzija ima zadatak da objasni pojam - teorijske postavke, karakteristike, primenu svakog parametra. Praktični deo ima za cilj da deaspraktizuje predhodnu dimenziju obrađivanjem 2 pojave. Podaci su dobijeni sprovođenjem ankete.

Odeljak br.2 ovog rada u početnom delu obrađuje sam pojam statističkih parametara, a kasnije ih nabraja, detaljnije objašnjava i ilustruje anketnim podacima.

Takođe, uz ovaj rad priložena je i disketa sa svim podacima u Majkrosoft Ekselu (Microsoft Excel) kao jedan vid dodatne ilustracije. Svi popunjeni anketni listovi kao i nepopunjeni anketni listić nalaze se u odeljku br.4. 1.2. Postupak sprovođenja ankete i njene osnovne karakteristike U anketi je učestvovalo 100 studenata prve godine Ekonomskog fakulteta(4,5. i 6. grupa) sredinom maja 2001. Na anketnom listiću se nalazi 10 pitanja, koja su formirana na osnovu nekoliko principa:

1. Neformalnost – nezvaničnost. Cilj ankete je bio da se dobiju ˝realni˝ podaci o određenoj pojavi kako bi se kasnije iskoristili, a ne da se sprovodi ˝ozbiljno˝ socio-statističko istraživanje.

2. Kratkoća, jasnost, dopadljivost, aktuelnost. Iskustvo je u mnogome delovalo na to da anketni listić bude kratak po sadržini, kako se ne bi odbili studenti. Primećeno je čak da zbog dopadljivosti i aktuelnosti anketni listić je delovao kao ˝intrigirajući faktor˝, pa su se studenti gotovo radovali anketi i nisu je prihvatali kao teret administracije, što je rezultiralo da broj neadekvatno odgovorenih pitanja, tj.neadekvatno popunjenih anketnih listića bude između 1-3% ukupnog skupa.

NAPOMENA: Veliki deo tereta sprovođenja ankete je pao na ramena Ivane Erić, kojoj želim da se ovom prilikom zahvalim.

Page 3: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 3 -

2. Parametri skupa Svako naučno istraživanje počinje sagledavanjem načina manifestovanja određene pojave. Tom prilikom naučnik pravi zapisnik gde zapisuje sve važne karakteristike. Nakon perioda posmatranja sledi faza obrade podataka. Obrada podataka se može izvesti na više načina, ali je ubedljivo najvažniji, najsigurniji i najinfomativniji statistički metod obrade podataka. Na osnovu zapisnika formiraju se statističke serije strukture odnosno vremenske serije u vidu tabela i određenih grafika. Tabele i grafici služe kao polazna tačka. Njihovim analiziranjem želimo da iz mora podataka izvučemo pravilnosti i zakonitosti njihovog ponašanja. Masa podataka uvek pričinjava teškoće prilikom analize. Zato mi težimo da seriju podataka zamenimo sa jednim ili većim brojem parametara, koje bi pružile što više informacija o skupu i reprezentovale sam skup. Postavlja se pitanje: Da li smemo uvek da primenimo takav pristup? Nisu sve pojave takve da se mogu predstaviti sa jednim ili sa dva parametra. U nekim slučajevima potrebno je i po nekoliko parametara, međutim, u globalu važi sledeća konstatacija: Gotovo uvek su vrednosti obeležija uglavnom raspoređene tako da se njihove frekvencije koncentrišu negde oko sredine, između minimalne i maksimalne vrednosti. Sa udaljavanjem od sredine frekvencije opadaju. Šta je parametar? Parametar je deskriptivna mera koja se odnosi na ceo skup. Parametre delimo u 3 velike grupe. Ovaj seminarski rad obuhvata:

MERE CENTRALNE TENDENCIJE (2.1.)

ARITMETIČKA SREDINA (2.1.1.)

GEOMETRIJSKA SREDINA (2.1.2.)

HARMONIJSKA SREDINA (2.1.3.)

MODUS (2.1.4.)

MEDIJANA (KVARTILI) (2.1.5.)

MERE DISPERZIJE (2.2.)

APSOLUTNE MERE DISPERZIJE (2.2.1.)

INTERVAL VARIJACIJE (2.2.1.1.)

INTERKVARTILNA RAZLIKA (2.2.1.2.)

SREDNJE APSOLUTNO ODSTUPANJE (2.2.1.3.)

VARIJANSA SKUPA (2.2.1.4.)

STANDARDNA DEVIJACIJA SKUPA (2.2.1.5.)

RELATIVNE MERE DISPERZIJE (2.2.2.)

KOEFICIJENT VARIJACIJE (2.2.2.1.)

KOEF. INTERKVARTILNE VARIJACIJE (2.2.2.2.)

STANDARDIZOVANO ODSTUPANJE (2.2.2.3.)

Page 4: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 4 -

2.1. Mere centralne tendencije Rasporedi frekvencija su izvori informacija o karakteristikama skupova. Rasporedi otkrivaju pre svega tendenciju grupisanja. Srednja vrednost treba da bude pokazatelj centralne tendencije. Ona predstavlja meru centralne tendencije i pokazuje lokaciju skupa. To je jedan od najznačajnijih pokazatelja numeričkih podataka. Srednja vrednost se koristi svuda u statistici. Ona se koristi za sažimanje strukture skupa i za praćenje njegove dinamike, tako i kao osnova za druge karakteristike. U zavisnosti od načina odrađivanja centralne vrednosti obeležija skupa, srednje vrednosti se dele na: 1. Izračunate, koje se izračunavaju na osnovu svih vrednosti obelezija. Razlikujemo:

1. Aritmetička sredina 2. Geometrijska sredina 3. Harmonijska sredina 4. Kvadratna sredina 5. Kubna sredina.

2. Pozicione, koje se određuju položajem u seriji: 1. Modus 2. Medijana

Koja će se srednja vrednost upotrebiti zavisi od: a) posmatrane pojave b) načina grupisanja u rasporedu frekvencija, c) svojstva samih srednjih vrednosti.

Zajednička svojstva srednjih vrednosti: 1. Utvđuje se objektivnim matematičkim postupkom 2. Njena vrednost se mora nalaziti ižmeđu maksimalne i

minimalne vrednosti (Xmin < sr.vr. < Xmax) 3. Ukoliko su te vrednosti obelezija međusobno jednake i

srednja vrednost mora biti jednaka toj vrednosti obeležija.

MERE OBLIKA RASPOREDA (2.3.)

MERE ASIMETRIJE (2.3.1.)

MERE SPLJOŠTENOSTI (2.3.2.)

RELATIVNA MERA ASIMETRIJE (2.3.1.1.)

PEARSON-OV KOEF. ASIMETRIJE (2.3.1.2.)

BOWLEY-EV KOEF. ASIMETRIJE (2.3.1.3.)

RELATIVNO UČEŠĆE (2.4.)

Page 5: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 5 -

2.1.1. Aritmetička sredina (prosek) Aritmetička sredina se dobija kad se zbir svih vrednosti obeležija podeli njihovim brojem.

∑=

=+++

=N

i

iN x

NN

xxx

1

21 1...µ

Gorenavedena formula služi za izračunavanje aritmetičke sredine kada se svaki podatak javlja samo jedanput, sa frekvenciom 1. U statističkim istraživanjima uglavnom se radi sa grupisanim podacima u vidu radporeda frekvencija. Tako da dobijamo formulu tzv.ponederisane aritmetičke sredine.

∑=

=+++

=k

i

iikk xf

NN

xfxfxf

1

2211 1...µ

Međutim, vrlo često se dešava da se pojava daje u grupnim intervalima. Izračunavanje aritmeričke sredine grupnih intervala polazi od pretpostavke da su vrednosti obeležija unutar intervala ravnomerno raspoređeni, što u praksi najčešće nije slučaj, pa dobijeni rezultati sistemacki odstupaju od aritmetičke sredine. Obim ostupanja zavisi od:

1. Širine grupnih intervala 2. Rasporeda unutar njih.

Da bismo izračunali aritmetičku sredinu grupnih intervala moramo doći do sredina grupnih intervala i množiti ih sa njihovim frekvencijama. L – granica intervala.

∑=

=+++

=

+=

k

i

iikk

DONJAGORNJAi

xfNN

xfxfxf

LLx

1

'''

22

'

11

'

1...

2

µ

Aritmetička sredina je srednja vrednost koja se najčešće koristi kao mera centralne tendencije – sintetički pokazatelj lokacije skupa ili uzorka. Ona se može podvrći daljim algebarskim operacijama (aritmetička sredina aritmetičkih sredina), što drugi ne mogu. Na njenu vrednost utiču sve vrednosti obeležija. Ona izravnava apsolutne varijacije vrednosti obeležija. Ako u skupu ima vrednosti koje odskaču, apsolutna sredina može dati iskrivljenu sliku. Za serije čije vrednosti znatno odstupaju od aritmetičke sredine kažemo da imaju veliku raspršenost ili disperziju. OSOBINE ARITMETIČKE VREDNOSTI:

1. Aritmetička vrednost je veća od minimuma i manja od maksimuma vrednosti nekog obeležija:

MAXMIN xx << µ 2. Aritmetička sredina se izjednačuje sa vrednostima obeležija, kada su one

međusobno jednake: µ======= .......21 constxxxx ki

3. Zbir odstupanja aritmetičke sredine od pojedinih vrednosti obeležija jednak je nuli:

∑=

=N

i

ix1

0 01

=∑=

k

i

ii xf

Page 6: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 6 -

4. Zbir kvadrata odstupanja aritmetičke sredine od pojedinih vrednosti obeležija manji je od zbira kvadrata odstupanja bilo koje vrednosti obeležija 0x (pa i drugih srednjih vrednosti, ako nisu jednake aritmetičkoj sredini) od ostalih vrednosti obeležija:

∑ ∑= =

−<−k

i

k

i

iiii xxfxf1 1

2

0

2 )()( µ

5. Ako su dva obeležija vezana linearnom funkcion, tada su i njihove aritmetičke sredine vezane tom istom linearnom funkciom:

xy bb

xbby

µµ 10

10

+=

+=

Aritmetička sredina najbolje reprezentuje one rasporede kod kojih najveću frekvenciju imaju one vrednosti koje su najbliže aritmetičkoj sredini. Ona se ne može računati za rasporede sa otvorenim grupnim intervalom, ako nisu poznate sredine tih intervala. Aritmetička sredina je često decimalan broj i kao takav može biti nelogičan (prosečan broj dece =2.4). Važna osobina je i da aritmetička sredina u najvećem broju slučajeva pogodnija od svih drugih srednjih vrednosti uzoraka za ocenu aritmetičke sredine skupa. Tabela 2.1.1.a Prosečna težina studenata (kg).

Interval if'

ix '

ii xf ⋅

40.1 - 51.1 11 45,6 501,6

52.2 - 62.2 27 56,7 1530,9

62.3 - 73.3 16 67,8 1084,8

73.4 - 84.4 14 78,9 1104,6

84.5 - 95.5 12 90,0 1080

95.6 - 106.6 12 101,1 1213,2

106.7 - 117.7 1 112,2 112,2

117.8 - 128.8 3 123,3 369,9

∑=

=k

i

if1

96 ∑=

=k

i

ii xf1

'6997,2

kg

f

xf

k

i

i

k

i

ii

8875007296

26997

1

1 ,,

'

===

=

Tabela 2.1.1.b Prosečna visina studenata (cm). Interval if

'

ix '

ii xf ⋅

145.1 - 152 1 148,5 148,5

152.1 - 159 4 155,5 622

159.1 - 166 10 162,5 1625

166.1 - 173 27 169,5 4576,5

173.1 - 180 19 176,5 3353,5

180.1 - 187 13 183,5 2385,5

187.1 - 194 13 190,5 2476,5

194.1 - 201 8 197,5 1580

201.1 - 208 1 204,5 204,5

∑=

=k

i

if1

96 ∑=

=k

i

ii xf1

'16972

cm

f

xf

k

i

i

k

i

ii

79166717696

16972

1

1 ,

'

===

=

Page 7: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 7 -

2.1.2. Geometrijska sredina Geometrijska sredina izravnjava relativne (proporcijalne) promene između vrednosti podataka.

⋅⋅⋅=

⋅⋅⋅=

=

k

i

i

k

ff

k

ff

NN

xxxG

xxxG

1 2121

21

...

...

Kao problem se ovde može javiti račun. Sve dok savremeni kalkulatori nisu postali dostupni široj populaciji bilo je veoma teško izračunati recimo

33258 584148542644, , . Tako da se gorenavedene formule mogu transformisati:

( )

=

=

=

=

+++=

⋅⋅⋅=

⋅⋅⋅=

⋅⋅⋅=

k

i

ii

N

i

i

N

N

NN

NN

xfN

G

xN

G

xxxN

G

xxxN

G

xxxG

xxxG

11010

11010

1021011010

211010

1

211010

1021

1

1

1

1

loglog

loglog

log...logloglog

)...(loglog

)...(loglog

log...

Zadnja formula se odnosi na grupisane, a pretposlednja na negrupisane podatke. Iz poslednje dve transformacije možemo izraziti G:

∑=

∑=

=

=

k

i

i

N

i

i

xfN

xN

G

G

1101

110

1

1

10

10

log

log

Ovaj vid izračunavanja G je računski jednostavniji. Važno je napomenuti da je geometrijska sredina obično manja od aritmetičke. OSOBINE GEOMETRIJSKE SREDINE:

1. Vrednost geometrijske sredine je uvek između minimalne i maksimalne vrednosti u seriji.

2. Geometrijska sredina se izjednačuje sa vrednostima obeležija, kada su one međusobno jednake:

Gconstxxxx ki ======= .......21 3. Ona izražava proporcijalne promene podataka. Proizvod odnosa

geometrijske sredine prema manjim vrednostima obeležija jednak je proizvodu odnosa većih vrednosti obeležija prema geometrijskoj sredini. Ovo svojstvo se koristi u izražavanju dinamike gde su važnije razlike u odnosima nego u apsolutnim veličinama.

Page 8: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 8 -

11

21

121

21

21

++

+

≤≤⋅⋅

⋅=

⋅⋅⋅

⋅⋅

⇔⋅⋅⋅⋅⋅=⋅⋅⋅⋅⋅

⇔⋅⋅⋅=

⇔⋅⋅⋅=

ii

Ni

i

Nii

N

iNi

N

N

NN

xGxGG

xx

xxx

GG

xxxxxGGGG

xxxG

xxxG

,...

...

...

...

............

...

...

444 3444 214342143421

U ekonomskim istraživanjima dinamike naročito je rasprostranjena upotreba geometrijske sredine za izračunavanje stope rasta na osnovu lančanih indeksa. Tabela 2.1.2.a Geometrijska sredina težina studenata (kg).

interval if'

ix if

ix'

40.1 - 51.1 11 45,6 1,772610E+18

52.2 - 62.2 27 56,7 2,221993E+47

62.3 - 73.3 16 67,8 1,993770E+29

73.4 - 84.4 14 78,9 3,623081E+26

84.5 - 95.5 12 90 2,824295E+23

95.6 - 106.6 12 101,1 1,140286E+24

106.7 - 117.7 1 112,2 112,2

117.8 - 128.8 3 123,3 1,874516E+06

∑=

=k

i

if1

96 ∏=

=k

i

f

iix

1

' 1,927148E+177

kgxG

k

i

ii

f k

i

f

i 261572701

1

,' =

∑= = ∏

=

Tabela 2.1.2.b Geometrijska sredina visina studenata (cm).

interval if'

ix if

ix'

145.1 - 152 1 148,5 1,485000E+02

152.1 - 159 4 155,5 5,846845E+08

159.1 - 166 10 162,5 1,283907E+22

166.1 - 173 27 169,5 1,540217E+60

173.1 - 180 19 176,5 4,876963E+42

180.1 - 187 13 183,5 2,674662E+29

187.1 - 194 13 190,5 4,351457E+29

194.1 - 201 8 197,5 2,314924E+18

201.1 - 208 1 204,5 2,045000E+02

∑=

=k

i

if1

96 =∏=

k

i

f

iix

1

'4,613674E+215

cmxG

k

i

ii

f k

i

f

i 4007751761

1

,' =

∑= = ∏

=

Page 9: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 9 -

2.1.3. Harmonijska sredina Harmonijska sredina je recipročna vrednost aritmetičke sredine recipročnih vrednosti obeležija. 0≠ix

=

=

=

+++

=

=

+++

=

k

i i

i

k

k

N

i iN

x

f

N

x

f

x

f

x

f

NH

x

N

xxx

NH

12

2

1

1

121

1111

...

...

Harmonijsku sredinu ima smisla tražiti samo za ona obeležija čije su sve vrednosti različite od nule. Osetljiva je na male veličine. Ima osobine srednje vrednosti. Primenjuje se uglavnom za računanje indeksnih brojeva – srednjeg indeksa i u slučajevima kada su obeležija statističkih jedinica izražena u obliku tzv.recipročnih pokazatelja. Tabela 2.1.3.a Harmonijska sredina težine studenata (kg).

interval if'

ix '

i

i

x

f

40.1 - 51.1 11 45,6 0,241228070

52.2 - 62.2 27 56,7 0,476190476

62.3 - 73.3 16 67,8 0,235988201

73.4 - 84.4 14 78,9 0,177439797

84.5 - 95.5 12 90 0,133333333

95.6 - 106.6 12 101,1 0,118694362

106.7 - 117.7 1 112,2 0,008912656

117.8 - 128.8 3 123,3 0,024330900

∑=

=k

i

if1

96 =∑=

k

i i

i

x

f

1'

1,416117796

kg

x

f

f

Hk

i i

i

k

i

i

79097067

1

1 ,

'

==

=

=

Tabela 2.1.3.b Harmonijska sredina visine strudenata (cm).

interval if'

ix '

i

i

x

f

145.1 - 152 1 148,5 0,006734007

152.1 - 159 4 155,5 0,025723473

159.1 - 166 10 162,5 0,061538462

166.1 - 173 27 169,5 0,159292035

173.1 - 180 19 176,5 0,107648725

180.1 - 187 13 183,5 0,070844687

187.1 - 194 13 190,5 0,068241470

194.1 - 201 8 197,5 0,040506329

201.1 - 208 1 204,5 0,004889976

∑=

=k

i

if1

96 =∑=

k

i i

i

x

f

1'

0,545419163

cm

x

f

f

Hk

i i

i

k

i

i

36014052

1

1 ,

'

==

=

=

Page 10: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 10 -

2.1.4. Modus Modus je vrednost obeležija koja u posmatranoj seriji ima najveću frekvenciju – najčešće se javlja i zato je najtipičnija vrednost u seriji. Za serije negrupisanih podataka utvrđuje se tako što se nađe onaj ko se najviše puta ponavlja – najveću frekvenciju. Razlikujemo više tipova modusa:

1. Unimodalni, jedna vrednost sa najvećom frekvencijom 2. Bimodalni, dve vrednosti sa najvećim frekvencijama 3. Multimodalni, više vrednosti sa najvećim frekvencijama

Sporedni modus je pojava kad nekoj vrednosti obeležija odgovara frekvencija veća od frekvencije obeležija neposredno ispred I iza nje. Takvih modusa može biti više. Može se desiti da modusa nema, tj ako svi elementi imaju istu frekvenciju. Za serije negrupisanih podataka se koristi formula:

ifff

ffLMo ⋅

−−

−+=

312

121 2

1L je donja granica modalnog intervala, i je dužina grupnog intervala, 1f , 2f ,

3f su frekvencije respektivno predmodalnog, modalnog I postmodalnog intervala.

Na veličinu modusa ne utiču promene frekvencija, pa ni ekstremne vrednosti. Modus možemo odrediti I kad frekvencije krajnjih obeležija nisu poznate, ali znamo da je frekvencija mala. Modus se može koristiti I kao mera centralne tenndencije atributnih serija. Na veličinu modusa utiče način grupisanja podataka. Promenom grupnih intervala ili granica menja se I modus. Modus se može naći na početku ili na kraju rasporeda kad ekstremne vrednosti imaju najveću frekvenciju kod recimo tzv.″L″ I ″J ″ rasporeda. U takvim slučajevima modus gubi svojstvo pokazatelja centralne tendencije. Tabela 2.1.4.a Modus rasporeda težina studenata (kg).

Interval if

40.1 - 51.1 11

52.2 - 62.2 27

62.3 - 73.3 16

73.4 - 84.4 14

84.5 - 95.5 12

95.6 - 106.6 12

106.7 - 117.7 1

117.8 - 128.8 3

Uviđamo da interval 52,2 – 62,2 ima najveću frekvenciju, pa je to modalni interval.

1f = 11; 2f = 27; 3f = 16;

i = 11,1;1L = 52,2;

kgifff

ffLMo

=⋅−−

−+= 758

2 312

121 ,

Tabela 2.1.4.b Modus rasporeda visina studenata (cm).

interval if

145.1 - 152 1

152.1 - 159 4

159.1 - 166 10

166.1 - 173 27

173.1 - 180 19

180.1 - 187 13

187.1 - 194 13

194.1 - 201 8

201.1 - 208 1

Uviđamo da interval 166,1 – 173 ima najveću frekvenciju, pa je to modalni interval. 1f = 10; 2f = 27; 3f = 19;

i = 11,1; 1L = 166.1;

cmifff

ffLMo 839285172

2 312

121 ,=⋅

−−

−+=

Page 11: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 11 -

2.1.5. Medijana Meddijana je ona vrednost obeležija koja se nalazi u sredini serije uređene po veličini obeležija, odnosno to je vrednost obeležija koja deli sumu svih frekvencija na dva jednaka dela. Razlikujemo 2 slučaja kada je broj članova N: a) neparan, b) paran. Ako je N neparan broj, tada središnji član deli ovaj niz na dva jdnaka dela. Ako je N paran broj, tada u njemu postoje dva srednja člana. Da bi to razrašili tražimo aritmetičku sredinu tih vrednosti. Za serije grupisanih podataka medjuanu dobijamo interpolaciom između donje i gornje granice intervala grupe u kojoj se medijana nalazi.

if

fN

LMeMe

⋅−

+=∑ 1

12

1L – je donja granica medijalnog intervala, N – je broj članova serije, ∑ 1f - zbir

frekvencija predmedijalnih intervala, Mef – frekvencija medijalnog intervala, i – dužina intervala medijalnog intervala. Ovaj metod se zasniva na ravnomernom rasporedu članova serije unutar svake intervalne grupe što nije uvek slučaj. Medijana se da i grafički odrediti. To je apcisa tačke preseka kumulante ispod i kumulante iznad. Medijana zauzima središnji položaj u seriji, što znači da na nju ne utiču krajnje vrednosti obeležija, pa za njeno određivanje i nije potrebno raspolagati tim obeležijima. Ona zavisi od broja i redosleda vrednosti obeležija. Čak u slučajevima kad je teško pribaviti egzaktne podatke za sve članove serije, ali ako se oni lako rangiraju moguće je naći središnji član i izmeriti njegovu numeričku vrednost. Medijana nije dobar pokazatelj tamo gde su ekzaktne vrednosti karakteristične za posmatranu pojavu. Medijana se ne može odrediti ni kada otvoreni interval sadrži više od pola jedinica. KVARTILI Ako se serija podataka rangiranih po veličini podeli na 4 jednaka dela, verdnosti obeležija koje ih dele nazivamo kvartilima. Prvi kvartil – Q1, drugi kvartil je ustvari medijana – Me, treći kvartil – Q3. Prvi kvartil je vrednost obeležija od koje 25% elemenata skupa uređenih po veličini ima manju ili jednaku vrednost. Treći kvartil je vrednost obeležija od koje 75% elemenata skupa uređenih po veličini ima manju ili jednaku vrednost.

if

fN

LQ

if

fN

LQ

Q

Q

⋅+

+=

⋅+

+=

3

1

1

13

1

11

43

4

Page 12: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 12 -

1L – donja granica kvartilnog intervala, N – ukupan broj jednica posmatranja,

∑ 1f - suma frekvencija predkvartilnog intervala, Qf – frekvencija kvartilnog

intervala, i – dužina intervala.

Tabela 2.1.5.a Medijana rasporeda težine studenata (kg)

interval if kum ispod

40.1 - 51.1 11 11

52.2 - 62.2 27 38

62.3 - 73.3 16 54

73.4 - 84.4 14 68

84.5 - 95.5 12 80

95.6 - 106.6 12 92

106.7 - 117.7 1 93

117.8 - 128.8 3 96

Uočavamo da je Q1 interval: 52,2 – 62,2; Me interval: 62,3 – 73,3; Q3 interval: 84,5 – 95,5. Dobijamo:

kgQ

kgMe

kgQ

=

=

=

3884

92562

68148152

3

1

,

,

,

Tabela 2.1.5.b Medijana rasporeda težine studenata (cm)

interval if kum ispod 145.1 - 152 1 1 152.1 - 159 4 5 159.1 - 166 10 15 166.1 - 173 27 42 173.1 - 180 19 61 180.1 - 187 13 74 187.1 - 194 13 87 194.1 - 201 8 95 201.1 - 208 1 96

Uočavamo da je Q1 interval: 166,1 – 173; Me interval: 173,1 – 180; Q3 interval: 180,1 - 187. Dobijamo:

cmQ

cmMe

cmQ

948154180

415789173

34166

3

1

,

,

,

=

=

=•

Page 13: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 13 -

XMIN XMAX Q1 Q3

iq

i

2.2. Mere disperzije Srednja vrednost nije uvek dovoljna da reperezentuje određeni raspored. Problem se javlja jer različiti rasporedi mogu imati istu srednju vrednost – što znači da oslanjajući se samo na srednju vrednost mi nismo u stanju da odredimo raspored određene pojave. Disperzija je mera koja nam govori kakve su razlike između elemenata određenog rasporeda. 2.2.1. Apsolutne mere disperzije Apsolutne mere disperzije iskazuju varibalitet u apsolutnim iznosima onih mernih jedinica u kojima su dati modaliteti posmatranog obeležija. Ove mere mogu biti:

1. Pozicione 2. Izračunate

Apsolutne mere disperzije su: 1. Interval varijacije i

2. Interkvartilna razlika qi

3. srednje apsolutno odstupanje d

4. varijansa skupa 2σ

5. standardna devijacija skupa σ . 2.2.1.1. Interval varijacije - razmak Od pozicionih razmak – interval varijacije se najčešće koristi. On predstavlja razliku između najviše i najniže vrednosti obeležija u seriji.

MINMAX XXi −= Ove mera ima smisla samo za konačne razmake i ne daje puno

informacija o disperziji serije. Ova razlika kod većih serija je veća nego kod manjih gotovo uvek.

Interval varijacije težine studenata je 84kg, a visine je 53cm. 2.2.1.2. Interkvartilna razlika Da bi se eleminisao uticaj ekstremnih vrednosti na iznos intervala varijacije računa se interkvartilna razlika.

13 QQiq −=

Ova mera isključuje po 25% podataka sa minimalnim i maksimalnim vrednostima obeležija.

Page 14: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 14 -

Ako je i velik, a qi mali, to znači da na krajevima postoje ekstremne

vrednosti, ali da ostali članovi ne pokazuju veliki varijabilitet. Ako su i i i qi veliki

to je slika o varijabilitetu nejasna. Interkvartilna razlika težina strudenata je 32,151852kg, a visina 14,512821cm. 2.2.1.3. Srednje apsolutno odstupanje Precizniju informaciju o varijabilitetu daje srednje apsolutno odstupanje.

=

=

−=

−=

k

i

ii

N

i

i

xfN

d

xN

d

1

1

1

1

µ

µ

Tabela 2.2.1.2.a Srednje apsolutno odstupanje individualnih težina od prosečne težine (kg)

interval if '

ix µ−'

ix µ−'

ii xf

40.1 - 51.1 11 45.6 27.2875 300.1625

52.2 - 62.2 27 56.7 16.1875 437.0625

62.3 - 73.3 16 67.8 5.0875 81.4000

73.4 - 84.4 14 78.9 6.0125 84.1750

84.5 - 95.5 12 90 17.1125 205.3500

95.6 - 106.6 12 101.1 28.2125 338.5500

106.7 - 117.7 1 112.2 39.3125 39.3125

117.8 - 128.8 3 123.3 50.4125 151.2375

∑=

k

i

if1

96 ∑=

−k

i

ii xf1

µ' 1637.2500

kg88750072,=µ

kg

f

xf

dk

i

i

k

i

ii

05468817

1

1 ,

'

=

=

=

=

µ

Tabela 2.2.1.2.b Srednje apsolutno odstupanje individualnih visina od prosečne visine (cm)

interval if '

ix µ−'

ix µ−'

ii xf

145.1 - 152 1 148.5 28.291667 28.291667

152.1 - 159 4 155.5 21.291667 85.166667

159.1 - 166 10 162.5 14.291667 142.916667

166.1 - 173 27 169.5 7.291667 196.875000

173.1 - 180 19 176.5 0.291667 5.541667

180.1 - 187 13 183.5 6.708333 87.208333

187.1 - 194 13 190.5 13.708333 178.208333

194.1 - 201 8 197.5 20.708333 165.666667

201.1 - 208 1 204.5 27.708333 27.708333

∑=

k

i

if1

96 ∑=

−k

i

ii xf1

µ' 917.583333

cm791667176,=µ

cm

f

xf

dk

i

i

k

i

ii

5581609

1

1 ,

'

=

=

=

=

µ

Page 15: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 15 -

2.2.1.4. Varijansa skupa Jedan od veoma često korišćenih parametara je varijansa skupa 2σ . Varijansa je prosečno kvadratno odstupanje elemenata skupa od srednje vrednosti skupa.

2

1

2

2

1

2

1

1

)(

)(

'

'

µσ

µσ

−=

−=

=

=

k

i

ii

N

i

i

xfN

xN

Prilikom računanja često se koristi I rezultat sledeće transformacije:

2

1

22

22

1

22

1

1

2

11

22

2

1

22

1

22

1

21

112

1

21

1

µσ

µµσ

µµσ

µµσ

µσ

µ

∑∑∑

=

=

===

=

=

−=

⇔+−=

⇔⋅+⋅−=

⇔+⋅−=

⇔−=

k

i

ii

k

i

ii

k

i

i

k

i

ii

k

i

ii

iii

k

i

ii

k

i

ii

xfN

xfN

fN

xfN

xfN

fxfxfN

xfN

'

'

''

''

'

)(

)(

4342143421

2.2.1.5. Standardna devijacija Ovo je najčešće korišćena apsolutna mera disperyije. Dobija se kao poyitivni koren varijanse. Ona je veća ya serije čije su vrednosti obeležija veća I obrnuto.

2

1

2

1

1

1

)(

)(

'

'

µσ

µσ

−=

−=

=

=

k

i

ii

N

i

i

xfN

xN

Tabela 2.2.1.4-5a Varijansa I standardna devijacija rasporeda težina studenata (kg)

interval if '

ix 2'

ix 2'

ii xf ⋅

40.1 - 51.1 11 45.6 2079.360 22872.96

52.2 - 62.2 27 56.7 3214.890 86802.03

62.3 - 73.3 16 67.8 4596.840 73549.44

73.4 - 84.4 14 78.9 6225.210 87152.94

84.5 - 95.5 12 90.0 8100.000 97200.00

95.6 - 106.6 12 101.1 10221.210 122654.52

106.7 - 117.7 1 112.2 12588.840 12588.84

117.8 - 128.8 3 123.3 15202.890 45608.67

∑=

k

i

if1

96 ∑=

⋅k

i

ii xf1

2' 548429.40

kg

f

xf

kg

f

xf

k

i

i

k

i

ii

k

i

i

k

i

ii

00546420

218594400

1

2

1

1

2

12

,

)(

,

)(

'

'

=

=

=

=

=

=

=

=

µ

σ

µ

σ

Page 16: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 16 -

Tabela 2.2.1.4-5b Varijansa I standardna decijacija rasporeda visina studenata (cm)

interval if '

ix 2'

ix 2'

ii xf ⋅

145.1 - 152 1 148.5 22052.25 22052.25

152.1 - 159 4 155.5 24180.25 96721.00

159.1 - 166 10 162.5 26406.25 264062.50

166.1 - 173 27 169.5 28730.25 775716.75

173.1 - 180 19 176.5 31152.25 591892.75

180.1 - 187 13 183.5 33672.25 437739.25

187.1 - 194 13 190.5 36290.25 471773.25

194.1 - 201 8 197.5 39006.25 312050.00

201.1 - 208 1 204.5 41820.25 41820.25

∑=

k

i

if1

96 ∑=

⋅k

i

ii xf1

2' 3013828

cm

f

xf

cm

f

xf

k

i

i

k

i

ii

k

i

i

k

i

ii

77914511

748264138

1

2

1

1

2

12

,

)(

,

)(

'

'

=

=

=

=

=

=

=

=

µ

σ

µ

σ

2.2.2. Relativne mere disperzije Za upoređenje raspršenosti dveju ili više serija sa različitim aritmetičkim sredinama ne mogu se koristiti apsolutne mere, jer one variraju sa veličinom orginalne pojave. Relativne mere su upravo to – relativne, odnosno bezdimenzione. Kao takve one omogućavaju da se upoređuju I kvalitativno najrazličitiji rasporedi. Poznajemo sledeće relativne mere disperzije:

1. koeficijen varijacije 2. keoficijen interkvartilne varijacije 3. standardizovano (normalizovano) odstupanje.

2.2.2.1. Koeficijent varijacije Dobija se kao količnik standardne devijacije I srednje vrednosti skupa. Sto je koeficijent veći odstupanje je veće. U serijama gde su svi članovi međusobno jednaki koeficient varijacije je 0. Njegova prednost je u tome što se može koristiti za poređenje raspršenosti serija čije jedinice nisu jednake.

µ

σ=V

Koeficient varijacije rasporeda težina studenata je 0,274470, a visina je 0,066627. 2.2.2.2. Interkvartilni koeficijent varijacije Ovaj koeficijent se koristi za upoređenje disperzije više skupova ili uzoraka. Ako je on veći disperzija je veća I obrnuto. On je posebno pogodan za takve rasporede gde elementi koji se nalaze ispod prvog kvartila I iznad trećeg imaju malo uticaja, pa se ovim koeficientom oni I zaobilaze. Ovaj koeficijent može imati vrednost od 0 do 1, tj.do 100%. Varijacija se može ocenjivati ne samo sa gledišta rasporeda frekvencija kao celine, nego I sa gledišta individualnih vrednosti.

13

13

QQ

QQVQ

+

−=

Page 17: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 17 -

Koeficient interkvertilne varijacije za raspored težina studenata je 0,233806, a za raspored visina je 0,041778. 2.2.2.3 Standardizovano (normalizovano) odstupanje Kd se odstupanje od aritmetičke sredine od bilo koj vrednosti izražava u jedinicama standardne devijacije dobijamo normalizovano ili standardizovano odstupanje. Ovo predstavlja opštu meru odstupanja individualnih podataka od aritmetičke sredine.

σ

µ−=

XZ

2.3. Mere oblika rasporeda Pored srednjih vrednosti I disperzija o rasporedu man govore I mere oblika raspored. Pri tom razlikujemo:

1. mere asimetrije 2. mere spljoštenosti

Pre nego što pređemo na navedene mere moraju se pomenuti centralni momenti rasporeda. Centralni momenti rasporeda mere prosečno odstupanje elemenata skupa od srednje vrednosti skupa diguti na odgovarajući stepen. Razlikujemo: nulti, prvi, drugi (varijansa), treći I četvrti momenat.

=

=

=

=

=

−=

−=

−==

=−=

=−=

k

i

ii

k

i

ii

k

i

ii

k

i

ii

k

i

ii

xfN

M

xfN

M

xfN

M

xfN

M

xfN

M

1

44

1

33

1

222

1

11

1

00

1

1

1

01

11

)(

)(

)(

)(

)(

µ

µ

µσ

µ

µ

Treći momenat – M3 - koristimo za merenje spljoštenosti, a četvrti – M4 - za merenje asimetrije. 2.3.1. Mere asimetrije Raspored je asimetričan kad elementi skupa pokazuju tendenciju grupisanja oko vrednosti obeležija iznad ili ispod srednje vrednosti. Razlikujemo više mera asimetričnosti:

1. Relativnu meru asimetrije 2. Pearson – ov koeficijen asimetrije 3. Bowley – ev keoficijent asimetrije

Page 18: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 18 -

2.3.1.1. Relativna mera asimetrije Relativna mera asimetrije je:

33

αM

=

Kod simetričnih rasporeda ovaj koeficijen je jednak 0, a kod asimetričnih je različit od nule. Kod pozitivne asimetrije (asimetirja udesno) koeficijent je veći od nule, a kod negativne asimetrije (asimetrija ulevo) manji od nule. Što koeficijent više raylikuje od 0 to je raspored više asimetričan. Raspored je umereno asimetričan ako je koeficijenu u intervalu (0,±0.5), sve preko toga se smatra izrazito asimetričnim. Kod simetričnog rasporeda vrednosti aritmetičke sredine, medijane i modusa su međusobno jednake MoMe ==µ . Kod pozitivne asimetrija stanje je

MoMe ffµ , a kod negativne MoMe ppµ .

Tabela 2.3.1.1.a Relativna mera asimetrije rasporeda težina studenata

interval if '

ix µ−'

ix 3)( ' µ−ix

3)( ' µ−⋅ ii xf 4)( ' µ−ix

4)( ' µ−⋅ ii xf

40.1 - 51.1 11 45.6 -27.2875 -20318.4814 -223503.2956 554440.5617 6098846.1792

52.2 - 62.2 27 56.7 -16.1875 -4241.6940 -114525.7404 68662.4231 1853885.4239

62.3 - 73.3 16 67.8 -5.0875 -131.6780 -2106.8482 669.9118 10718.5903

73.4 - 84.4 14 78.9 6.0125 217.3528 3042.9394 1306.8337 18295.6731

84.5 - 95.5 12 90 17.1125 5011.1843 60134.2127 85753.8929 1029046.7150

95.6 - 106.6 12 101.1 28.2125 22455.6027 269467.2326 633528.6917 7602344.3010

106.7 - 117.7 1 112.2 39.3125 60756.3937 60756.3937 2388485.7312 2388485.7312

117.8 - 128.8 3 123.3 50.4125 128119.3436 384358.0308 6458816.4105 19376449.2317

∑=

k

i

if1

96 ∑=

−⋅k

i

ii xf1

3)( ' µ 437622.9251 ∑=

−⋅k

i

ii xf1

4)( ' µ 38378071.8457

Tabela 2.3.1.1.b Relativna mera asimetrije rasporeda visina studenata interval if '

ix µ−'

ix 3)( ' µ−ix

3)( ' µ−⋅ ii xf 4)( ' µ−ix

4)( ' µ−⋅ ii xf

145.1 - 152 1 148.5 -28.2916 -22645.1706 -22645.1706 640669.6195 640669.6195

152.1 - 159 4 155.5 -21.2916 -9652.2591 -38609.0367 205512.6851 822050.7407

159.1 - 166 10 162.5 -14.2916 -2919.0977 -29190.9772 41718.7717 417187.7170

166.1 - 173 27 169.5 -7.2916 -387.6862 -10467.5292 2826.8790 76325.7344

173.1 - 180 19 176.5 -0.2916 -0.0248 -0.4714 0.0072 0.1374

180.1 - 187 13 183.5 6.7083 301.8866 3924.5264 2025.1562 26327.0312

187.1 - 194 13 190.5 13.7083 2576.0481 33488.6253 35313.3261 459073.2393

194.1 - 201 8 197.5 20.7083 8880.4595 71043.6765 183899.5167 1471196.1342

201.1 - 208 1 204.5 27.7083 21273.1210 21273.1210 589442.7283 589442.7283

96 ∑=

−⋅k

i

ii xf1

3)( ' µ 28816.7638 ∑=

−⋅k

i

ii xf1

4)( ' µ 4502273.0824

Na osnovu proračuna vidimo da je koeficijent asimetričnosti rasporeda težina studenata 0,569355, a visina 0,183668.

Page 19: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 19 -

2.3.1.2. Pearson-ov koeficijent asimetrije Pearson-ov koeficijent predstavlja odnos raylike aritmetičke sredine i modusa po standardnoj devijaciji.

σ

µ MoSK

−=

1

Zbog nedostataka modusa, a imajući u vidu da asimetrija nije velika dobijamo:

σ

µ )( MeSK

−=

32

Ako je ovaj Pearson-ov koeficijent jednak nuli to znači da je raspored simetričan, dok njegovo približavanje ka +3 odnosno –3 znači pozitivnu ili negativnu asimetriju rasporeda. Pearsonov koeficijent asimetrije rasporeda težina studenata je

29374821

,=KS i 49396712

,=KS . Raspored visina ima sledeće koeficijente:

716684121

,=KS i 85979302

,=KS .

2.3.1.3. Bowley-ev koeficient asimetrije Ova mera polazi od činjenice da je kod simetričnih rasporeda frekvencija razlika između trećeg kvartila i medijane jednaka razlici medijane i prvog kvartila, tj 13 QMeMeQ −=− .

13

31 2

QQ

MeQQSa

−+=

Vednosti ovog koeficijenta se kreću u intervalu ±1. Raspored je simetričan ako je ovaj koeficijent jednak nuli. Bowley-ev koeficijent rasporeda težina strudenata je 0,362804, a rasporeda visina 0,037753. 2.3.2. Mere spljoštenosti Odnos M4 i

4σ je koeficijent spljoštenosti. Ako koeficijent uzima vrednost 3 to je normalna spljoštenost. Ako raspored uzima vrednosti veće od 3 to je i oblik rasporeda ispupčeniji. Situacija je obrnuta kada ke koeficijen manji od tri, tada dolazi do izražaja spljoštenost rasporeda. Koeficijent spljoštenosti rasporeda težina studenata je 2,495844, a rasporeda visina studenata 2,436158.

Page 20: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 20 -

2.4. Relativno učešće Relativno učešće ili prorcija je veoma bitan parametar skupa. On prati elemente sa odgovarajućim karakteristikama. Da bismo sračunali proporciju π moramo ceo skup podeliti na uspeh i neuspeh. Proporcija je ustvari relativna frekvencija uspeha u skupu.

neuspehuspeh

uspeh

ukupno

uspeh

+==π

10 ≤≤ π Pertpostavka 1.: uspeh = težina u intervalu (µ ± 5%). Dobijamo da je proporcija: uspeh = 9 uspeh + neuspeh = 96 pa je relativno učešće π = 9,375% Pretpostavka 2.: uspeh = visina u intervalu (µ ± 5%). Dobijamo da je proporcija: uspeh = 54 uspeh + neuspeh = 96 pa je relativno učešće π = 56,25%

Page 21: Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

- 21 -

3. Literatura 1. Dr Mileva Žižić, Dr Miodrag lovrić, Dr Dubravka Pavličić; METODI STATISTIČKE ANALIZE, Beograd 2000.