37
ORGANIZOVANJE I PRIKAZIVANJE PODATAKA Osnove istraživanja u sportu i fizičkom vaspitanju Fakultet sporta i fizičkog vaspitanja Novi Sad dr Željko Krneta

ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Embed Size (px)

Citation preview

Page 1: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

ORGANIZOVANJE

I PRIKAZIVANJE

PODATAKA

Osnove istraživanja u sportu i

fizičkom vaspitanju

Fakultet sporta i fizičkog vaspitanja Novi Sad

dr Željko Krneta

Page 2: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Podaci prikupljeni u nekom procesu

merenja, sadrže veoma mnogo informacija

ali su one u izvornom obliku samo

potencijalno vredne.

Pre nego što dobijemo informacije iz tih

izvornih podataka, moramo ih organizovati

u neki logičan, čitljiv i koristan oblik.To

najčešće podrazumeva prikazivanje tabela i

kreiranje grafika.

Page 3: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Koriste se tri vrste tabela distribucije:

1) distribucija rangiranjem (rang

distribucija),

2) distribucija jednostavnih frekvencija i

3) distribucija grupnih frekvencija

(frekvencije po grupama).

Page 4: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Rang distribucija je slaganje (rangiranje)

podataka po veličini rezultata (vrednosti

podataka), po uzlaznoj ili po silaznoj

vrednosti podataka. Ona daje brzi pregled

raspona variranja podataka u grupi. Lako se

uočavaju ekstremne vrednosti, najveća i

najmanja.

Ova distribucija se koristi kada je mali broj

podataka (ne veći od 20), što je pregledno ako

stane na ekran monitora ili stranicu A4

formata.

Page 5: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Raspon (R) je rastojanje u numeričkoj

vrednosti od najvećeg (NV) do najmanjeg

(NM) podatka. Izračunava se jednostavnim

oduzimanjem vrednosti najmanjeg od

vrednosti najvećeg podatka, odnosno

R = NV - NM.

Raspon je veoma teško odrediti bez

rangiranja rezultata (rezultata merenja).

Page 6: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Na primer, ako je profesor fizičkog

vaspitanja testirao 15 učenika u svom

odeljenju motoričkim testom "Sklekovi

na tlu", dobio je sledeće originalne

podatke:

12, 10, 9, 8, 2, 5, 18, 15, 14, 17, 13, 12,

8, 9, 16.

Page 7: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Kada se ovi podaci slože od

najveće do najmanje

vrednosti, odnosno rangiraju,

onda ih je već lakše tumačiti.

X

18

17

16

15

14

13

12

12

10

9

9

8

8

5

2

Ovako distribuirane vrednosti

ukazuju na veliku razliku u

izvođenju sklekova. Raspon

je od 2 do 18 sklekova,

odnosno čak 16 sklekova.

Page 8: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Distribucija jednostavnih frekvencija

Kada se analizira veći broj ispitanika, veoma

je nepovoljno ređati njihove podatke

odvojeno, zbog toga što bi takva lista bila

veoma dugačka. Veći broj podataka može se

organizovati po frekvenciji pojavljivanja istih

podataka (f) u analiziranoj varijabli X.

Pretpostavimo da neki student našeg fakulteta

želi za svoj diplomski rad da analizira snagu

ruku i ramenog pojasa svih studenata prve

godine (npr. N=212).

Page 9: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Nakon testiranja motoričkim testom

"Sklekovi u paralelnom razboju", da bi

izbegao dugačku listu kada bi rezultate

uredio kao na prethodni način (rang

distribucijom), student je našao najveći i

najmanji rezultat, rangirao rezultate unutar

tog raspona, a za svaki rang naznačio

frekvenciju (učestalost) pojavljivanja

odgovarajućeg rezultata (f).

Page 10: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

N = 212

NV = 20

NM = 0

R = 20 - 0 = 20

Preporučuje se korišćenje

prikazivanja ovakve distribucije

uvek kada je N > 20, a raspon ≤ 20,

što omogućava preglednost tabele

na uobičajenom formatu hartije, ili

na ekranu monitra.

X f

20 2

19 0

18 3

17 6

16 8

15 10

14 17

13 21

12 25

11 24

10 26

9 19

8 16

7 12

6 10

5 4

4 3

3 2

2 1

1 2

0 1

212

Page 11: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Distribucija grupnih frekvencija

Prilično je lako organizovati podatke kao

distribuciju jednostavnih frekvencija ako je

raspon podataka najviše 20. Međutim, kada

je raspon mnogo više od 20 mernih jedinica,

to je daleko teže.

Page 12: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Na primer, profesor fizičkog vaspitanja je

analizirao aerobni kapacitet učenika na

osnovu testa "Trčanje 1500m“ (N=206), pa

je odredio najniži rezultat, odnosno najbrže

vreme, 302 sekundi, a najviše, odnosno

najsporije vreme, 595 sekundi - što daje

raspon od 293 sekundi (595 - 302 = 293).

Ako bi se rezultati sa ovakvim rasponom

predstavili jednostavnim frekvencijama, lista

bi bila nepraktična i dugačka. Zbog toga

treba grupisati postignute rezultate.

Page 13: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Distribucija grupnih frekvencija je

rangiranje rezultata u varijabli X prema

grupama podataka i prema frekvencijama

pojavljivanja rezultata ispitanika koji su ih

ostvarili (f). Kada je N > 20 i R > 20,

potrebno je koristiti ovaj način grupisanja

podataka.

Page 14: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Kada se pravi distribucija grupnih

frekvencija, prvo treba odlučiti koliko

grupa treba formirati.

To zavisi od raspona podataka i od

prirode varijable, odnosno koliko je zaista

logično i smisleno praviti broj grupa a da

se unutar grupe ne nalazi preveliki ili

premali broj frekvencija.

Page 15: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Ako je broj grupa manji od 10, može se

pojaviti u svakoj grupi preveliki broj

podataka, a ako je veći od 20 moguće je da

u nekoj grupi nebude podataka. Preporučuje

se da broj grupa bude neparan, kako bi se

podaci distribuirali simetrično ako zaista

imaju takvu distribuciju. Za veće uzorke se

uzima 11,13 ili15 grupa, a za manje uzorke

i 9 grupa. To zavisi i od prirode same

varijable.

Page 16: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Formiranje veličine grupe podataka za datu

varijablu, odnosno veličina intervala,

određuje se tako što se raspon podataka

podeli sa brojem grupa.

Na primeru u sledećoj tabeli distribucija

grupnih frekvencija u varijabli "Trčanje

1500m" to bi bilo, uz broj grupa 15,

i = R/15 = 293/15 = 19.53, što se

zaokružuje na 20.

Page 17: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

X f

580 - 599 3

560 - 579 9

540 -559 13

520 -539 15

500 - 519 17

480 - 499 21

460 - 479 19

440 - 459 25

420 - 439 23

400 - 419 18

380 - 399 15

360 - 379 12

340 - 359 9

320 - 339 5

300 - 319 2

N = 206

Page 18: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Dobra strana ovakvog prikazivanja

distribucije podataka je da daje globalne

informacije o distribuciji na malom prostoru.

Loša strana je što nemamo tačne informacije

o podacima unutar grupa.

Međutim, kada se analiziraju veće grupe

ispitanika, sasvim su dovoljne informacije

koje se dobijaju pregledom distribucija

grupnih frekvencija.

Page 19: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Tabelama prikazujemo podatke u obliku

redova i kolona.

Drugi način je prikazivanje pomoću

grafikona. Grafikon je figurativno ili

vizuelno predstavljanje podataka. Oni su

korisni za upoređivanje dva ili više skupova

podataka ili prikazivanje trendova. Međutim,

tabelarni prikaz je često precizniji.

Page 20: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Svaki grafikon treba da uključuje

najmanje tri karakteristike:

1. naslov,

2. oznaku na X-osi (apscisi) i

3. oznaku na Y-osi (ordinati).

Korisni grafikoni u kineziologiji su:

- histogram i

- krivulja distribucije podataka.

Page 21: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Jedan od najviše korišćenih grafikona je

histogram. On se konstruiše na osnovu

distribucije grupnih frekvencija, ali kod

manjih uzoraka ispitanika i na osnovu

distribucije jednostavnih frekvencija.

Page 22: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Drugi način prikazivanja distribucije

frekvencije podataka pomoću grafikona je

poligon frekvencija.To je linijski grafikon

rezultata i frekvencija, a dobija se tako što se

sredine vrhova svakog stupca u histogramu

povežu jednom izlomljenom linijom.

Page 23: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Na sledećoj slici je dat primer poligona

frekvencija u varijabli "Sklekovi u paralelnom

razboju" 212 ispitanika.

Page 24: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Treća vrsta grafikona koja se često koristi u

statistici je grafikon kumulativnih

frekvencija, odnosno krivulja kumulativnih

frekvencija.

Na apscisi su rezulati, obično grupisani po

nekom intervalu, a na ordinati su brojevi

ispitanika koji su postigli te rezultate ili

ispod njih.

Page 25: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Grafikon kumulativnih frekvencijea varijable

"Sklekovi u praralelnom razboju"

Page 26: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Distribucija grupnih frekvencija u varijabli

"Sklekovi u paralenom razboju"

X f Kum. f

34 - 36 2 130

31 - 33 4 128

28 - 30 5 124

25 - 27 7 119

22 - 24 9 112

19 - 21 15 103

16 - 18 19 88

13 - 15 20 69

10 - 12 18 49

7 - 9 15 31

4 - 6 10 16

1 - 3 6 6

N = 130

Kolona kumulativnih

frekvencija pokazuje

stanje svakog

ispitanika u poređenju

sa celokupnim

uzorkom ispitanika.

Page 27: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Krivulja je linija koja opisuje rezultate

(X-osa) koji su prikazani frekvencijama

(Y-osa) na grafikonu. Ona predstavlja

vizuelnu sliku trendova u podacima, koje

ne možemo lako uočiti kada posmatramo

te podatke u tabeli.

Oblik krivulje zavisi od distribucije

podataka, od toga kako su rezultati

raspoređeni i grupisani.

Page 28: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

1. krivulja normalne distribucije,

2. mezokurtične, leptokurtične i

platikurtične krivulje,

3. bimodalne krivulje i

4. skjunisne krivulje.

Najčešće krivulje koje se koriste u

statističkim analizama u kineziologiji su:

Page 29: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Krivulja normalne distribucije

Ova jedinstvena krivulja, koju je prvi opisao

matematičar Karl Gauss (1777 - 1855),

naziva se još i Gausova krivulja, ili zvonasta

krivulja (zbog svog zvonastog oblika).

Koncept normalne distribucije je osnova svih

statističkih analiza u istraživanjima u

kineziologiji, pošto se najveći broj pojava u

prirodi distribuira upravo na način koji

opisuje Gausova kriva.

Page 30: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Sve normalne krivulje su obostrano

simetrične i obično imaju zvonasti oblik.

Međutim, nisu sve simetrične krivulje

normalne.

Veliki broj varijabli dobijenih merenjima u

kineziologiji su relativno normalno

distribuirane, odnosno njihova distribucija

ne odstupa značajno od normalne

distribucije.

Page 31: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Kada većina rezultata pada u srednji

raspon a frekvencija rezultata se sužava

simetrično prema krajevima krivulje,

onda je to poznata zvonasta krivulja

koja se naziva mezokurtična (mezo -

srednji; kurtis - krivulja; kurtoza -

relativan stepen spljoštenosti).

To je slučaj kod normalne distribucije.

Page 32: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,
Page 33: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Ako je raspon grupe rezultata ograničen a

ekstremni rezultati su veoma blizu sredini,

sa većinom rezultata blizu prosečnoj

vrednosti (aritmetičkoj sredini), tada se

takva krivulja naziva leptokurtična, ili

šiljasta.

Suprotno leptokurtičnoj, platikurtična

krivulja ima veoma širok raspon rezultata sa

malom frekvencijom u srednjem rasponu.

Još se naziva i spljoštena krivulja.

Page 34: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

a) mezokurtična,

b) platikurtična i

c) leptokurtična krivulja

Page 35: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Bimodalna krivulja

Mod je rezultat sa najvećom frekvencijom.

Na normalnoj krivulji, mod je uvek u sredini, ali

neke distribucije podataka imaju dva ili više

moda, pa se nazivaju bimodalne ili multimodalne.

Page 36: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Skjunična krivulja

Ponekad distribucija podataka značajno

odstupa od normalne, pa krajevi krivulje

nisu simetrični. Kada je neproporcijalan

broj rezultata ispitanika prema jednom kraju

krivulje, onda je ona skjunična. Rzlikuju se

pozitivna i negativna skjunična distribucija.

Page 37: ORGANIZOVANJE I PRIKAZIVANJE PODATAKA - …krneta.in.rs/images/Fajlovi/Predavanja/Organizacija_i_prikaz... · Distribucija jednostavnih frekvencija Kada se analizira veći broj ispitanika,

Vrste skjuničnih krivulja