Upload
dinhhanh
View
229
Download
4
Embed Size (px)
Citation preview
ORGANIZOVANJE
I PRIKAZIVANJE
PODATAKA
Osnove istraživanja u sportu i
fizičkom vaspitanju
Fakultet sporta i fizičkog vaspitanja Novi Sad
dr Željko Krneta
Podaci prikupljeni u nekom procesu
merenja, sadrže veoma mnogo informacija
ali su one u izvornom obliku samo
potencijalno vredne.
Pre nego što dobijemo informacije iz tih
izvornih podataka, moramo ih organizovati
u neki logičan, čitljiv i koristan oblik.To
najčešće podrazumeva prikazivanje tabela i
kreiranje grafika.
Koriste se tri vrste tabela distribucije:
1) distribucija rangiranjem (rang
distribucija),
2) distribucija jednostavnih frekvencija i
3) distribucija grupnih frekvencija
(frekvencije po grupama).
Rang distribucija je slaganje (rangiranje)
podataka po veličini rezultata (vrednosti
podataka), po uzlaznoj ili po silaznoj
vrednosti podataka. Ona daje brzi pregled
raspona variranja podataka u grupi. Lako se
uočavaju ekstremne vrednosti, najveća i
najmanja.
Ova distribucija se koristi kada je mali broj
podataka (ne veći od 20), što je pregledno ako
stane na ekran monitora ili stranicu A4
formata.
Raspon (R) je rastojanje u numeričkoj
vrednosti od najvećeg (NV) do najmanjeg
(NM) podatka. Izračunava se jednostavnim
oduzimanjem vrednosti najmanjeg od
vrednosti najvećeg podatka, odnosno
R = NV - NM.
Raspon je veoma teško odrediti bez
rangiranja rezultata (rezultata merenja).
Na primer, ako je profesor fizičkog
vaspitanja testirao 15 učenika u svom
odeljenju motoričkim testom "Sklekovi
na tlu", dobio je sledeće originalne
podatke:
12, 10, 9, 8, 2, 5, 18, 15, 14, 17, 13, 12,
8, 9, 16.
Kada se ovi podaci slože od
najveće do najmanje
vrednosti, odnosno rangiraju,
onda ih je već lakše tumačiti.
X
18
17
16
15
14
13
12
12
10
9
9
8
8
5
2
Ovako distribuirane vrednosti
ukazuju na veliku razliku u
izvođenju sklekova. Raspon
je od 2 do 18 sklekova,
odnosno čak 16 sklekova.
Distribucija jednostavnih frekvencija
Kada se analizira veći broj ispitanika, veoma
je nepovoljno ređati njihove podatke
odvojeno, zbog toga što bi takva lista bila
veoma dugačka. Veći broj podataka može se
organizovati po frekvenciji pojavljivanja istih
podataka (f) u analiziranoj varijabli X.
Pretpostavimo da neki student našeg fakulteta
želi za svoj diplomski rad da analizira snagu
ruku i ramenog pojasa svih studenata prve
godine (npr. N=212).
Nakon testiranja motoričkim testom
"Sklekovi u paralelnom razboju", da bi
izbegao dugačku listu kada bi rezultate
uredio kao na prethodni način (rang
distribucijom), student je našao najveći i
najmanji rezultat, rangirao rezultate unutar
tog raspona, a za svaki rang naznačio
frekvenciju (učestalost) pojavljivanja
odgovarajućeg rezultata (f).
N = 212
NV = 20
NM = 0
R = 20 - 0 = 20
Preporučuje se korišćenje
prikazivanja ovakve distribucije
uvek kada je N > 20, a raspon ≤ 20,
što omogućava preglednost tabele
na uobičajenom formatu hartije, ili
na ekranu monitra.
X f
20 2
19 0
18 3
17 6
16 8
15 10
14 17
13 21
12 25
11 24
10 26
9 19
8 16
7 12
6 10
5 4
4 3
3 2
2 1
1 2
0 1
212
Distribucija grupnih frekvencija
Prilično je lako organizovati podatke kao
distribuciju jednostavnih frekvencija ako je
raspon podataka najviše 20. Međutim, kada
je raspon mnogo više od 20 mernih jedinica,
to je daleko teže.
Na primer, profesor fizičkog vaspitanja je
analizirao aerobni kapacitet učenika na
osnovu testa "Trčanje 1500m“ (N=206), pa
je odredio najniži rezultat, odnosno najbrže
vreme, 302 sekundi, a najviše, odnosno
najsporije vreme, 595 sekundi - što daje
raspon od 293 sekundi (595 - 302 = 293).
Ako bi se rezultati sa ovakvim rasponom
predstavili jednostavnim frekvencijama, lista
bi bila nepraktična i dugačka. Zbog toga
treba grupisati postignute rezultate.
Distribucija grupnih frekvencija je
rangiranje rezultata u varijabli X prema
grupama podataka i prema frekvencijama
pojavljivanja rezultata ispitanika koji su ih
ostvarili (f). Kada je N > 20 i R > 20,
potrebno je koristiti ovaj način grupisanja
podataka.
Kada se pravi distribucija grupnih
frekvencija, prvo treba odlučiti koliko
grupa treba formirati.
To zavisi od raspona podataka i od
prirode varijable, odnosno koliko je zaista
logično i smisleno praviti broj grupa a da
se unutar grupe ne nalazi preveliki ili
premali broj frekvencija.
Ako je broj grupa manji od 10, može se
pojaviti u svakoj grupi preveliki broj
podataka, a ako je veći od 20 moguće je da
u nekoj grupi nebude podataka. Preporučuje
se da broj grupa bude neparan, kako bi se
podaci distribuirali simetrično ako zaista
imaju takvu distribuciju. Za veće uzorke se
uzima 11,13 ili15 grupa, a za manje uzorke
i 9 grupa. To zavisi i od prirode same
varijable.
Formiranje veličine grupe podataka za datu
varijablu, odnosno veličina intervala,
određuje se tako što se raspon podataka
podeli sa brojem grupa.
Na primeru u sledećoj tabeli distribucija
grupnih frekvencija u varijabli "Trčanje
1500m" to bi bilo, uz broj grupa 15,
i = R/15 = 293/15 = 19.53, što se
zaokružuje na 20.
X f
580 - 599 3
560 - 579 9
540 -559 13
520 -539 15
500 - 519 17
480 - 499 21
460 - 479 19
440 - 459 25
420 - 439 23
400 - 419 18
380 - 399 15
360 - 379 12
340 - 359 9
320 - 339 5
300 - 319 2
N = 206
Dobra strana ovakvog prikazivanja
distribucije podataka je da daje globalne
informacije o distribuciji na malom prostoru.
Loša strana je što nemamo tačne informacije
o podacima unutar grupa.
Međutim, kada se analiziraju veće grupe
ispitanika, sasvim su dovoljne informacije
koje se dobijaju pregledom distribucija
grupnih frekvencija.
Tabelama prikazujemo podatke u obliku
redova i kolona.
Drugi način je prikazivanje pomoću
grafikona. Grafikon je figurativno ili
vizuelno predstavljanje podataka. Oni su
korisni za upoređivanje dva ili više skupova
podataka ili prikazivanje trendova. Međutim,
tabelarni prikaz je često precizniji.
Svaki grafikon treba da uključuje
najmanje tri karakteristike:
1. naslov,
2. oznaku na X-osi (apscisi) i
3. oznaku na Y-osi (ordinati).
Korisni grafikoni u kineziologiji su:
- histogram i
- krivulja distribucije podataka.
Jedan od najviše korišćenih grafikona je
histogram. On se konstruiše na osnovu
distribucije grupnih frekvencija, ali kod
manjih uzoraka ispitanika i na osnovu
distribucije jednostavnih frekvencija.
Drugi način prikazivanja distribucije
frekvencije podataka pomoću grafikona je
poligon frekvencija.To je linijski grafikon
rezultata i frekvencija, a dobija se tako što se
sredine vrhova svakog stupca u histogramu
povežu jednom izlomljenom linijom.
Na sledećoj slici je dat primer poligona
frekvencija u varijabli "Sklekovi u paralelnom
razboju" 212 ispitanika.
Treća vrsta grafikona koja se često koristi u
statistici je grafikon kumulativnih
frekvencija, odnosno krivulja kumulativnih
frekvencija.
Na apscisi su rezulati, obično grupisani po
nekom intervalu, a na ordinati su brojevi
ispitanika koji su postigli te rezultate ili
ispod njih.
Grafikon kumulativnih frekvencijea varijable
"Sklekovi u praralelnom razboju"
Distribucija grupnih frekvencija u varijabli
"Sklekovi u paralenom razboju"
X f Kum. f
34 - 36 2 130
31 - 33 4 128
28 - 30 5 124
25 - 27 7 119
22 - 24 9 112
19 - 21 15 103
16 - 18 19 88
13 - 15 20 69
10 - 12 18 49
7 - 9 15 31
4 - 6 10 16
1 - 3 6 6
N = 130
Kolona kumulativnih
frekvencija pokazuje
stanje svakog
ispitanika u poređenju
sa celokupnim
uzorkom ispitanika.
Krivulja je linija koja opisuje rezultate
(X-osa) koji su prikazani frekvencijama
(Y-osa) na grafikonu. Ona predstavlja
vizuelnu sliku trendova u podacima, koje
ne možemo lako uočiti kada posmatramo
te podatke u tabeli.
Oblik krivulje zavisi od distribucije
podataka, od toga kako su rezultati
raspoređeni i grupisani.
1. krivulja normalne distribucije,
2. mezokurtične, leptokurtične i
platikurtične krivulje,
3. bimodalne krivulje i
4. skjunisne krivulje.
Najčešće krivulje koje se koriste u
statističkim analizama u kineziologiji su:
Krivulja normalne distribucije
Ova jedinstvena krivulja, koju je prvi opisao
matematičar Karl Gauss (1777 - 1855),
naziva se još i Gausova krivulja, ili zvonasta
krivulja (zbog svog zvonastog oblika).
Koncept normalne distribucije je osnova svih
statističkih analiza u istraživanjima u
kineziologiji, pošto se najveći broj pojava u
prirodi distribuira upravo na način koji
opisuje Gausova kriva.
Sve normalne krivulje su obostrano
simetrične i obično imaju zvonasti oblik.
Međutim, nisu sve simetrične krivulje
normalne.
Veliki broj varijabli dobijenih merenjima u
kineziologiji su relativno normalno
distribuirane, odnosno njihova distribucija
ne odstupa značajno od normalne
distribucije.
Kada većina rezultata pada u srednji
raspon a frekvencija rezultata se sužava
simetrično prema krajevima krivulje,
onda je to poznata zvonasta krivulja
koja se naziva mezokurtična (mezo -
srednji; kurtis - krivulja; kurtoza -
relativan stepen spljoštenosti).
To je slučaj kod normalne distribucije.
Ako je raspon grupe rezultata ograničen a
ekstremni rezultati su veoma blizu sredini,
sa većinom rezultata blizu prosečnoj
vrednosti (aritmetičkoj sredini), tada se
takva krivulja naziva leptokurtična, ili
šiljasta.
Suprotno leptokurtičnoj, platikurtična
krivulja ima veoma širok raspon rezultata sa
malom frekvencijom u srednjem rasponu.
Još se naziva i spljoštena krivulja.
a) mezokurtična,
b) platikurtična i
c) leptokurtična krivulja
Bimodalna krivulja
Mod je rezultat sa najvećom frekvencijom.
Na normalnoj krivulji, mod je uvek u sredini, ali
neke distribucije podataka imaju dva ili više
moda, pa se nazivaju bimodalne ili multimodalne.
Skjunična krivulja
Ponekad distribucija podataka značajno
odstupa od normalne, pa krajevi krivulje
nisu simetrični. Kada je neproporcijalan
broj rezultata ispitanika prema jednom kraju
krivulje, onda je ona skjunična. Rzlikuju se
pozitivna i negativna skjunična distribucija.
Vrste skjuničnih krivulja