PRVI DEOMetode merenja i obrade
podataka
Dragan Mirkov
1/11/2007
Sadržaj
1. Šta je merenje2. Varijable i konstante3. Dizajn istraživanja i statistička analiza4. Statističko zaključivanje5. Organizacija podataka6. Prikaz podataka
Šta je merenje
1/11/2007
Šta je merenje (osnovni pojmovi)MERENJE: Upoređivanje određene vrednosti sa zadatim
(definisanim) standardom
PODATAK: Rezultat merenja
STATISTIKA: Skup matematičkih “tehnika” kojima se podaci organizuju, “tretiraju” i prikazuju za dalju interpretaciju i evaluaciju
EVALUACIJA: “Filozofski” koncept određivanja vrednosti, odnosno značaja dobijenih podataka
Osobine merenja
Svako merenje mora da bude precizno...►Validnost:
Da li rezutat merenja u saglasnosti sa onim što bi trebalo da meri...
►Pouzdanost:Mera ponovljivosti
►Objektivnost:Uticaj različitih faktora izbegnut ili kontrolisan
Osobine merenja
Više o validnosti i pouzdanosi možete saznati na:
1. “ A New View of Statistics”http://www.sportsci.org/recource/stats/index.
html
http://www.humankinetics.com
Deseto poglavlje
Cela knjiga
Merni postupak
Merni postupak
►Identifikacija objekta koji treba izmeriti►Standard (jedinica mere) ►Proces upoređivanja (MERENJE!)...►Kvantitativni zaključak...
Merni postupak
h = 1,85 mRezultat merenja
Oznaka veličine
Brojna vrednost
Oznaka merne jedinice
Kada rezultat merenja pridodamo odgovarajućoj ljudskoj osobini koju smo merili (recimo visini čoveka) rezultat “postaje” varijabla (promenljiva) vidi nastavak...
Varijable i konstante
Varijable i konstante
►Varijabla je karakteristika osobe, mesta, stvari ili procesa (dešavanja) koja može da ima više različtih vrednosti (promenljive)
►Konstante (parametri) su karakteristike koje se vremenom ne menjaju (nepromenljive)
Vrste i klasifikacija podataka
Rezultati merenja odgovarajućihvarijabli mogu se klasifikovati na više načina:
Prema objektivnosti merenja: • Kvantitativni rezultati (podaci)
• Kvalitativni rezultati (podaci)
Varijable: Kontinualne i diskretne
Prema skali merenja:• Nominalni (koje se prebrojavaju)• Ordinalni (redosled)• Intervalni (mogu imati negativne vrednosti)• Racionalni (ne mogu biti negativne)
Istraživački dizajn i statistička analiza
Testiranje hipoteze:
Istraživačka hipoteza (Hn)Nulta hipoteza (H0)
Ukoliko je H0 tačna, Hn je netačna i obrnuto...
Nezavisne i zavisne promenljiveU zavisnosti od “mogućnosti” da na njih
utičemo eksperimentalnim dizajnom...
►Nezavisne (prediktorske)
►Zavisne (kriterijumske)
Validnost eksperimenta
Eksperiment (kao deo istraživačkog dizajna) mora da poseduje i tzv. “unutrašnju”(internal) i tzv. “spoljašnju” (external) validnost.
Zaključivanje u statistici
Zaključivanje u statistici
►Populacija: ma koja grupa pojedinaca, mesta ili stvari koje imaju bar jednu zajedničku osobinu
►Uzorak: deo populacije, koji je predmet statističke “obrade”
Greška predviđanja je obrnuto srazmerna veličini uzorka
Odabir uzorka
Slučajnim odabirom: svaki član populacije ima jednake šanse da bude izabran
Stratifikovano “uzorkovanje”: prethodno populaciju delimo u odgovarajuće grupe (koje imaju nešto zajedničko...)
Odabir uzorka
Ukupan broj studentataUzorakUzorak (%)
100050
5.00%
I godina II godina III godina IV godina Broj studenata po godinamaUzorak
400 250 200 15020 13 10 8
Parametri i statistika
Parametarkarakteristika čitave populacije
StatistikaKarakteristika uzorka
Parametri i statistika
Svaka procena parametra na osnovu statistike uzorka ima izvesnu “grešku”
Vrednost “greške” se nikada na zna pouzdano ali se može proceniti na osnovu veličine i varijabiliteta uzorka
Prikaz podataka
Raspodele►Prikaz po redosledu►Raspodela po frekvencijama►Raspodela po grupnim frekvencijama
Organizovanje podataka
Opseg (R): Najveća vrednost (H) manje najmanja vrednost (L):
* Ukoliko se uračunaju i vrednosti na “krajevima”
R = H – L+1*R = H - L
Prikaz po redosledu
Primer: Prikazani su rezultati testiranja 15 dečaka (zgibovi sa dlanovima okrenutim ka “spolja”):
12, 10, 9, 8, 2, 5, 18, 15, 14, 17, 13, 12, 8, 9, 16
Prikaz po redosledu
Broj zgibova (dlanovi okrenuti ka unutra)
258899101212131415161718
N = 15H = 18 L= 2R = 16
Raspodela frekvencijama
Broj ponavljanja u testuLS30 (478 ispitanika)
Raspodela frekvencija
Poligon frekvencija
0
10
20
30
40
50
60
70
20 25 30 35 40 45
Broj ponavljanja
Frek
venc
ija
Poligon frekvencija
Raspodela frekvencija
Visine su “organizovane” u 13 razreda (klasnih intervala)“širine” 2 cm
Primer: Visine 66 dečaka (fudbalera)
Raspodela frekvencijama
Grupna raspodela frekvencija visina
0
2
4
6
8
10
12
166-167 168-169 170-171 172-173 174-175 176-177 178-179 180-181 182-183 184-185 186-187 188-189 190-191
Razredi (visina) (m)
Frek
venc
ija
Biće dopunjeno...
DRUGI DEODeskriptivna statistika
Dragan Mirkov
1/11/2007
Sadržaj
1. Mere centralne tendencije2. Mere disperzije3. Deskriptivna statistika u Excel-u4. Kriva normalne raspodele 5. Položaj pojedinačnog rezultata u
grupi
Mere centralne tendencije
1/11/2007
Mere centralne tendencijeMEDIJANA (Centralna vrednost)
MODUS (Najčešća vrednost)
SREDNJA VREDNOST (Aritmetička sredina)
Medijana
Podatke poređaj po rastućem redosledu:Odredi položaj (C) (koji je po redu) centralnog
podatka: C = (N+1)/2►za neparan broj podataka na tom (“C-tom”)
položaju se nalazi medijana. ► za paran broj podataka dva su rezutata u
sredini pa je medijana srednja vrednost ta dva “centralna” podatka
Medijana (paran broj podataka)
0,73 + 1,102
5,40 1,10 0,42 0,73 0,48 1,10
0,42 0,48 0,73 1,10 1,10 5,40
MEDIJANA je 0,915
Medijana (neparan broj podataka)5,40 1,10 0,42 0,73 0,48 1,10 0,66
0,42 0,48 0,66 0,73 1,10 1,10 5,40
MEDIJANA je 0,73
Modus
Modus je 1.10
Dvostruki modus - 27 &
55
Nema modusa
a. 5.40 1.10 0.42 0.73 0.48 1.10
b. 27 27 27 55 55 55 88 88 99
c. 1 2 3 6 7 8 9 10
Aritmetička sredina
Zbir svih podataka podeli brojem podataka
Nx
x i∑=_ x i - “i-ti” podatak, N-ukupan broj podataka
Aritmetička sredina (raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i odgovarajućih vrednosti podeli ukupnim brojem podataka
x i - “i-ti” podatak, fi -ukupan broj podatakaN=∑ fiN
xfx ii∑=−
Aritmetička sredina (grupna raspodela podataka prema
učestanosti)Sumu proizvoda učestanosti pojavljivanja i
srednjih vrednosti odgovarajućeg intervala podeli ukupnim brojem podataka
x mid - srednja vrednost “i-tog”
intervala fi -ukupan broj podatakaN=∑ fi
Nxf
x midi∑=−
Zajednička aritmetička sredina
Zbir proizvoda srednjih vrednosti podataka i njihovog broja podeli ukupnim brojem svih podataka
∑∑=
i
ii
NxN
x
__
Ni x i - proizvod “i-te” srednje vrednostii broja podataka iz kojeg je ta srednja vrednost izračunata
Aritmetička sredina (raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i odgovarajućih vrednosti podeli ukupnim brojem podataka
x i - “i-ti” podatak, fi -ukupan broj podatakaN=∑ fiN
xfx ii∑=−
Aritmetička sredina (grupna raspodela podataka prema
učestanosti)Sumu proizvoda učestanosti pojavljivanja i
srednjih vrednosti odgovarajućeg intervala podeli ukupnim brojem podataka
x mid - srednja vrednost “i-tog”
intervala fi -ukupan broj podatakaN=∑ fi
Nxf
x midi∑=−
Mere disperzije
Opseg (raspon)
Opseg (R): Najveća vrednost (H) manje najmanja vrednost (L):
* Ukoliko se uračunaju i vrednosti na “krajevima”
R = H – L+1*R = H - L
Kvartili
KVARTILI
1. Podaci se poređaju od najmanjeg do najvećeg.
2. Q1 - Određujemo kao medijanu prvih 50% podataka.
3. Q3 - Određujemo kao medijanu drugih 50%podataka.
Kvartili
Međukvartilni opseg:
I = Q3-Q1
Srednje odstupanje
N
xxi∑ −=
_
Srednje odstupanje
xi - “i-ti” podatakx – aritmetička sredinaN – broj podataka
Varijansa
► σ2 – varijansa► σ – standardna
devijacija► xi - “i-ti” podatak► x – aritmetička
sredinab d k
1
2_
2
−
⎟⎠⎞
⎜⎝⎛ −
=∑
N
xxi
σ
( )
1
22
2
−
−=∑ ∑
NNx
x ii
σ
Varijansa (raspodela podataka prema učestanosti)
► σ2 – varijansa► σ – standardna devijacija► xi - “i-ti” podatak► x – aritmetička sredina► fi – učestanost “i tog podatka
( )
1
22
2
−
−=∑ ∑
NNfx
fxσ
Standardna devijacija
2
Standardna devijacija: Kvadratni koren varijanse:
Deskriptivna statistika u Excelu
Može ovako, ako hoćete da računate korak po korak...
Deskriptivna statistika u Excelu
Deskriptivna statistika u Excelu
Deskriptivna statistika u Excelu
Deskriptivna statistika u Excelu
Kriva normalne raspodele
http://en.wikipedia.org/wiki/Normal_distribution
Kriva normalne raspodele
Crtanje standardne krive normalne raspodele u Excelu:www.tushar-mehta.com/.../ normal_distribution/
Kriva normalne raspodele
www.westgard.com/ lesson36.htmwww.statistics4u.info/.../ cc_distri_normal.htmlhttp://www.etfos.hr/~akolundzic/moderan%20nacin.htm#normalnahttp://www.gseis.ucla.edu/courses/help/dist1.htmlwww.hawcc.hawaii.edu/.../ Notes/Lesson431.htmhttp://www.stat.wmich.edu/s160/book/node38.htmlhttp://ripplestat.com/ripplestat/jobaid_cards.html#unihttp://psych.rice.edu/online_stat/chapter6/areas_normal.html
Neke od mnogobrojnih lekcija na internetu:
z vrednost (ili standardna vrednost)
koliko se standardnih devijacija dati rezultat razlikuje od srednje vrednosti
Mere položaja
Uzorak
z = x - xs
Mere položajaz vrednost
Uzorak
z = x - xs
Populacija
z = x - µσ
Mere položajaz vrednost
- 3 - 2 - 1 0 1 2 3
Z
Neuobičajenevrednosti
Neuobičajenevrednosti
Uobičajenevrednosti
Tumačenje Z vrednostiFIGURE 2-16
Mere položaja
Kvartili, Decili,Percentili
Q1, Q2, Q3
Kvartili
25% 25% 25% 25%
Q3Q2Q1
Kada se podaci poređaju po rastućem nizuKvartili taj niz dele na četiri (prema broju
članova) jednakih delova
Kvartili
25% 25% 25% 25%
Q3Q2Q1(minimum) (maksimum)
(medijana)
D1, D2, D3, D4, D5, D6, D7, D8, D9Kada se podaci poređaju po rastućem nizu
Kvartili taj niz dele na deset (prema broju članova) jednakih delova
Decili
D1, D2, D3, D4, D5, D6, D7, D8, D9
Kada se podaci poređaju po rastućem nizuKvartili taj niz dele na deset (prema broju članova)
jednakih delova
Decili
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1 D2 D3 D4 D5 D6 D7 D8 D9
99 Percentila
Percentili
Kvartili, Decili, Percentili
Fraktili
(Quantiles)Deli skup podatak poređanih po rastućem nizu
na jednak broj delova
“Izračunavanje”percentila
Percentil podatka x = • 100Broj podataka manjih od x
Ukupan broj podatataka
“Izračunavanje” rezultataKada je poznat percentil
n Ukupan broj podataka
k dati percentil
L Položaj na kome se nalazi tražena vrednost
Pk Vrednost k-tog percentil
L = • nk100
►Slajdovi 68 do 83:
Chapter 2. Section 2-6. Triola, Elementary Statistics, Eighth Edition. Copyright 2001. Addison Wesley Longman
Kriva normalne raspodele
Poglavlje 6: (od 67 do 85 strane)
TREĆI DEOKORELACIJE
Smisao i princip korelacije
Brojna vrednost (koeficijent) koji predstavlja u kojoj meri su dve varijable međusobnopovezane...
Koeficijent korelacije
Vrednosti od -1 do 1
Smisao i princip korelacije
Izračunavanje korelacionog koeficijenta
( )( )[ ]N
ZZr yx∑=
Zx i Zy predstavljaju Z vrednosti odgovarajućih varijabli
Prvo izračunamo srednje vrednosti standardne devijacije za obe varijable. Zatim svaki pojedinačan rezultat (za obe varijable)pretvorimo u Z vrednost. Pomnožimo odgovarajuće Z vrednosti.Izračunamo sumu svih proizvoda pa je podelimo sa brojem parova.
Vidi primer koji sledi...
Izračunavanje korelacionog koeficijenta
Da li su i u kojoj meri varijable x i y međusobno povezane ?
Izračunavanje korelacionog koeficijenta
Izračunavanje korelacionog koeficijenta
U slučaju većeg broja podataka u praksi se najčešće koristi sledeća formula (ko nema računar...):
Izračunavanje korelacionog koeficijenta
...Odnosno računar...
Značajnost korelacije
►Određen je brojem parova►Što je N manje to r mora biti veće da bi
korelacija bila značajna (i obrnuto)►Značajnost korelacija se određuje uz pomoć
tablica ili upotrebom komjuterskih programa:
Značajnost korelacije
Značajnost korelacije
http://www.stat.berkeley.edu/users/stark/Java/Html/Correlation.htm
Korisna Web adresa: Dobar “udžbenik” statistike sa lepim ilustracijama (JAVA applets).
Rang-korelacija
Ako su jedna ili obe varijable date u “rangu”(neki poredak), računa se tzv. rang-korelacija
Nije potrebno da varijable budu u linearnom odnosu. Rang korelaciija daje samo približnuIndikaciju “povezanosti” dve varijable
Bivarijantna regresija
Bivarijantna regresija
Kada je korelacija između dve varijable dovoljno “velika” (visoka), na osnovu rezultata varijable x (nezavisno promenljive) možemo predvideti rezultat varijable y(zavisno promenljive)...
Bivarijantna regresija
►To je od posebnog značaja u slučajevima kada nam je merenje varijable x znatno lakše nego merenje varijable y (Npr. procena indirektne potrošnje kiseonika...).
Bivarijantna regresija
Multipla regresija
►Ispituje uticaj dve ili više nezavisnih (prediktorskih) promenljivih na zavisnopromenljivu...
Y = a + b1*X1 + b2*X2 + ... + bp*Xp
Multipla regresija
PRIMER*:Posmatran je uticaj eksplozivne snage (x1) i brzine trčanja (x2) na skok u dalj iz zaleta y (10 studenata Fakulteta za fizičku kulturu...)
* Primer preuzet iz: Perić D, Operacionalizacija 2, FINE Graf, 1996
Multipla regresija
Y = 0.883271 + 0.6181*X1 – 0.1574*X2
ČETVRTI DEOTESTIRANJE RAZLIKA
Sadržaj
►t test►ANOVA►Neparametrijski testovi
t test (dva nezavisna uzorka)
►t test (dva nezavisna uzorka)PRIMER: Upoređene su visine vertikalnog
skoka (CMJ) sto studenata Medicnskog fakulteta i sto studenta DIF-a
t test (dva nezavisna uzorka)
t test (dva zavisna uzorka)
►t test (dva zavisna uzorka)PRIMER: Daljina šuta iz mesta u pre i
posttestu (18 fudbalera):
t test (dva zavisna uzorka)
ANOVA
Vidi dodatak (IV_deo_dodatak.pdf)
ANOVA
Ostali testovi biće prikazani direktno (primena statističkog softvera...)...
A slajdovi će vremenom biti dopunjavani, popravaljani...