PRVI DEO - University of Belgrademetodologija/Materijal_Met/Predavanja_met/Predavanja... ·...

Preview:

Citation preview

PRVI DEOMetode merenja i obrade

podataka

Dragan Mirkov

1/11/2007

Sadržaj

1. Šta je merenje2. Varijable i konstante3. Dizajn istraživanja i statistička analiza4. Statističko zaključivanje5. Organizacija podataka6. Prikaz podataka

Šta je merenje

1/11/2007

Šta je merenje (osnovni pojmovi)MERENJE: Upoređivanje određene vrednosti sa zadatim

(definisanim) standardom

PODATAK: Rezultat merenja

STATISTIKA: Skup matematičkih “tehnika” kojima se podaci organizuju, “tretiraju” i prikazuju za dalju interpretaciju i evaluaciju

EVALUACIJA: “Filozofski” koncept određivanja vrednosti, odnosno značaja dobijenih podataka

Osobine merenja

Svako merenje mora da bude precizno...►Validnost:

Da li rezutat merenja u saglasnosti sa onim što bi trebalo da meri...

►Pouzdanost:Mera ponovljivosti

►Objektivnost:Uticaj različitih faktora izbegnut ili kontrolisan

Osobine merenja

Više o validnosti i pouzdanosi možete saznati na:

1. “ A New View of Statistics”http://www.sportsci.org/recource/stats/index.

html

http://www.humankinetics.com

Deseto poglavlje

Cela knjiga

Merni postupak

Merni postupak

►Identifikacija objekta koji treba izmeriti►Standard (jedinica mere) ►Proces upoređivanja (MERENJE!)...►Kvantitativni zaključak...

Merni postupak

h = 1,85 mRezultat merenja

Oznaka veličine

Brojna vrednost

Oznaka merne jedinice

Kada rezultat merenja pridodamo odgovarajućoj ljudskoj osobini koju smo merili (recimo visini čoveka) rezultat “postaje” varijabla (promenljiva) vidi nastavak...

Varijable i konstante

Varijable i konstante

►Varijabla je karakteristika osobe, mesta, stvari ili procesa (dešavanja) koja može da ima više različtih vrednosti (promenljive)

►Konstante (parametri) su karakteristike koje se vremenom ne menjaju (nepromenljive)

Vrste i klasifikacija podataka

Rezultati merenja odgovarajućihvarijabli mogu se klasifikovati na više načina:

Prema objektivnosti merenja: • Kvantitativni rezultati (podaci)

• Kvalitativni rezultati (podaci)

Varijable: Kontinualne i diskretne

Prema skali merenja:• Nominalni (koje se prebrojavaju)• Ordinalni (redosled)• Intervalni (mogu imati negativne vrednosti)• Racionalni (ne mogu biti negativne)

Istraživački dizajn i statistička analiza

Testiranje hipoteze:

Istraživačka hipoteza (Hn)Nulta hipoteza (H0)

Ukoliko je H0 tačna, Hn je netačna i obrnuto...

Nezavisne i zavisne promenljiveU zavisnosti od “mogućnosti” da na njih

utičemo eksperimentalnim dizajnom...

►Nezavisne (prediktorske)

►Zavisne (kriterijumske)

Validnost eksperimenta

Eksperiment (kao deo istraživačkog dizajna) mora da poseduje i tzv. “unutrašnju”(internal) i tzv. “spoljašnju” (external) validnost.

Zaključivanje u statistici

Zaključivanje u statistici

►Populacija: ma koja grupa pojedinaca, mesta ili stvari koje imaju bar jednu zajedničku osobinu

►Uzorak: deo populacije, koji je predmet statističke “obrade”

Greška predviđanja je obrnuto srazmerna veličini uzorka

Odabir uzorka

Slučajnim odabirom: svaki član populacije ima jednake šanse da bude izabran

Stratifikovano “uzorkovanje”: prethodno populaciju delimo u odgovarajuće grupe (koje imaju nešto zajedničko...)

Odabir uzorka

Ukupan broj studentataUzorakUzorak (%)

100050

5.00%

I godina II godina III godina IV godina Broj studenata po godinamaUzorak

400 250 200 15020 13 10 8

Parametri i statistika

Parametarkarakteristika čitave populacije

StatistikaKarakteristika uzorka

Parametri i statistika

Svaka procena parametra na osnovu statistike uzorka ima izvesnu “grešku”

Vrednost “greške” se nikada na zna pouzdano ali se može proceniti na osnovu veličine i varijabiliteta uzorka

Prikaz podataka

Raspodele►Prikaz po redosledu►Raspodela po frekvencijama►Raspodela po grupnim frekvencijama

Organizovanje podataka

Opseg (R): Najveća vrednost (H) manje najmanja vrednost (L):

* Ukoliko se uračunaju i vrednosti na “krajevima”

R = H – L+1*R = H - L

Prikaz po redosledu

Primer: Prikazani su rezultati testiranja 15 dečaka (zgibovi sa dlanovima okrenutim ka “spolja”):

12, 10, 9, 8, 2, 5, 18, 15, 14, 17, 13, 12, 8, 9, 16

Prikaz po redosledu

Broj zgibova (dlanovi okrenuti ka unutra)

258899101212131415161718

N = 15H = 18 L= 2R = 16

Raspodela frekvencijama

Broj ponavljanja u testuLS30 (478 ispitanika)

Raspodela frekvencija

Poligon frekvencija

0

10

20

30

40

50

60

70

20 25 30 35 40 45

Broj ponavljanja

Frek

venc

ija

Poligon frekvencija

Raspodela frekvencija

Visine su “organizovane” u 13 razreda (klasnih intervala)“širine” 2 cm

Primer: Visine 66 dečaka (fudbalera)

Raspodela frekvencijama

Grupna raspodela frekvencija visina

0

2

4

6

8

10

12

166-167 168-169 170-171 172-173 174-175 176-177 178-179 180-181 182-183 184-185 186-187 188-189 190-191

Razredi (visina) (m)

Frek

venc

ija

Biće dopunjeno...

DRUGI DEODeskriptivna statistika

Dragan Mirkov

1/11/2007

Sadržaj

1. Mere centralne tendencije2. Mere disperzije3. Deskriptivna statistika u Excel-u4. Kriva normalne raspodele 5. Položaj pojedinačnog rezultata u

grupi

Mere centralne tendencije

1/11/2007

Mere centralne tendencijeMEDIJANA (Centralna vrednost)

MODUS (Najčešća vrednost)

SREDNJA VREDNOST (Aritmetička sredina)

Medijana

Podatke poređaj po rastućem redosledu:Odredi položaj (C) (koji je po redu) centralnog

podatka: C = (N+1)/2►za neparan broj podataka na tom (“C-tom”)

položaju se nalazi medijana. ► za paran broj podataka dva su rezutata u

sredini pa je medijana srednja vrednost ta dva “centralna” podatka

Medijana (paran broj podataka)

0,73 + 1,102

5,40 1,10 0,42 0,73 0,48 1,10

0,42 0,48 0,73 1,10 1,10 5,40

MEDIJANA je 0,915

Medijana (neparan broj podataka)5,40 1,10 0,42 0,73 0,48 1,10 0,66

0,42 0,48 0,66 0,73 1,10 1,10 5,40

MEDIJANA je 0,73

Modus

Modus je 1.10

Dvostruki modus - 27 &

55

Nema modusa

a. 5.40 1.10 0.42 0.73 0.48 1.10

b. 27 27 27 55 55 55 88 88 99

c. 1 2 3 6 7 8 9 10

Aritmetička sredina

Zbir svih podataka podeli brojem podataka

Nx

x i∑=_ x i - “i-ti” podatak, N-ukupan broj podataka

Aritmetička sredina (raspodela podataka prema učestanosti)

Sumu proizvoda učestanosti pojavljivanja i odgovarajućih vrednosti podeli ukupnim brojem podataka

x i - “i-ti” podatak, fi -ukupan broj podatakaN=∑ fiN

xfx ii∑=−

Aritmetička sredina (grupna raspodela podataka prema

učestanosti)Sumu proizvoda učestanosti pojavljivanja i

srednjih vrednosti odgovarajućeg intervala podeli ukupnim brojem podataka

x mid - srednja vrednost “i-tog”

intervala fi -ukupan broj podatakaN=∑ fi

Nxf

x midi∑=−

Zajednička aritmetička sredina

Zbir proizvoda srednjih vrednosti podataka i njihovog broja podeli ukupnim brojem svih podataka

∑∑=

i

ii

NxN

x

__

Ni x i - proizvod “i-te” srednje vrednostii broja podataka iz kojeg je ta srednja vrednost izračunata

Aritmetička sredina (raspodela podataka prema učestanosti)

Sumu proizvoda učestanosti pojavljivanja i odgovarajućih vrednosti podeli ukupnim brojem podataka

x i - “i-ti” podatak, fi -ukupan broj podatakaN=∑ fiN

xfx ii∑=−

Aritmetička sredina (grupna raspodela podataka prema

učestanosti)Sumu proizvoda učestanosti pojavljivanja i

srednjih vrednosti odgovarajućeg intervala podeli ukupnim brojem podataka

x mid - srednja vrednost “i-tog”

intervala fi -ukupan broj podatakaN=∑ fi

Nxf

x midi∑=−

Mere disperzije

Opseg (raspon)

Opseg (R): Najveća vrednost (H) manje najmanja vrednost (L):

* Ukoliko se uračunaju i vrednosti na “krajevima”

R = H – L+1*R = H - L

Kvartili

KVARTILI

1. Podaci se poređaju od najmanjeg do najvećeg.

2. Q1 - Određujemo kao medijanu prvih 50% podataka.

3. Q3 - Određujemo kao medijanu drugih 50%podataka.

Kvartili

Međukvartilni opseg:

I = Q3-Q1

Srednje odstupanje

N

xxi∑ −=

_

Srednje odstupanje

xi - “i-ti” podatakx – aritmetička sredinaN – broj podataka

Varijansa

► σ2 – varijansa► σ – standardna

devijacija► xi - “i-ti” podatak► x – aritmetička

sredinab d k

1

2_

2

⎟⎠⎞

⎜⎝⎛ −

=∑

N

xxi

σ

( )

1

22

2

−=∑ ∑

NNx

x ii

σ

Varijansa (raspodela podataka prema učestanosti)

► σ2 – varijansa► σ – standardna devijacija► xi - “i-ti” podatak► x – aritmetička sredina► fi – učestanost “i tog podatka

( )

1

22

2

−=∑ ∑

NNfx

fxσ

Standardna devijacija

2

Standardna devijacija: Kvadratni koren varijanse:

Deskriptivna statistika u Excelu

Može ovako, ako hoćete da računate korak po korak...

Deskriptivna statistika u Excelu

Deskriptivna statistika u Excelu

Deskriptivna statistika u Excelu

Deskriptivna statistika u Excelu

Kriva normalne raspodele

http://en.wikipedia.org/wiki/Normal_distribution

Kriva normalne raspodele

Crtanje standardne krive normalne raspodele u Excelu:www.tushar-mehta.com/.../ normal_distribution/

Kriva normalne raspodele

www.westgard.com/ lesson36.htmwww.statistics4u.info/.../ cc_distri_normal.htmlhttp://www.etfos.hr/~akolundzic/moderan%20nacin.htm#normalnahttp://www.gseis.ucla.edu/courses/help/dist1.htmlwww.hawcc.hawaii.edu/.../ Notes/Lesson431.htmhttp://www.stat.wmich.edu/s160/book/node38.htmlhttp://ripplestat.com/ripplestat/jobaid_cards.html#unihttp://psych.rice.edu/online_stat/chapter6/areas_normal.html

Neke od mnogobrojnih lekcija na internetu:

z vrednost (ili standardna vrednost)

koliko se standardnih devijacija dati rezultat razlikuje od srednje vrednosti

Mere položaja

Uzorak

z = x - xs

Mere položajaz vrednost

Uzorak

z = x - xs

Populacija

z = x - µσ

Mere položajaz vrednost

- 3 - 2 - 1 0 1 2 3

Z

Neuobičajenevrednosti

Neuobičajenevrednosti

Uobičajenevrednosti

Tumačenje Z vrednostiFIGURE 2-16

Mere položaja

Kvartili, Decili,Percentili

Q1, Q2, Q3

Kvartili

25% 25% 25% 25%

Q3Q2Q1

Kada se podaci poređaju po rastućem nizuKvartili taj niz dele na četiri (prema broju

članova) jednakih delova

Kvartili

25% 25% 25% 25%

Q3Q2Q1(minimum) (maksimum)

(medijana)

D1, D2, D3, D4, D5, D6, D7, D8, D9Kada se podaci poređaju po rastućem nizu

Kvartili taj niz dele na deset (prema broju članova) jednakih delova

Decili

D1, D2, D3, D4, D5, D6, D7, D8, D9

Kada se podaci poređaju po rastućem nizuKvartili taj niz dele na deset (prema broju članova)

jednakih delova

Decili

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%

D1 D2 D3 D4 D5 D6 D7 D8 D9

99 Percentila

Percentili

Kvartili, Decili, Percentili

Fraktili

(Quantiles)Deli skup podatak poređanih po rastućem nizu

na jednak broj delova

“Izračunavanje”percentila

Percentil podatka x = • 100Broj podataka manjih od x

Ukupan broj podatataka

“Izračunavanje” rezultataKada je poznat percentil

n Ukupan broj podataka

k dati percentil

L Položaj na kome se nalazi tražena vrednost

Pk Vrednost k-tog percentil

L = • nk100

►Slajdovi 68 do 83:

Chapter 2. Section 2-6. Triola, Elementary Statistics, Eighth Edition. Copyright 2001. Addison Wesley Longman

Kriva normalne raspodele

Poglavlje 6: (od 67 do 85 strane)

TREĆI DEOKORELACIJE

Smisao i princip korelacije

Brojna vrednost (koeficijent) koji predstavlja u kojoj meri su dve varijable međusobnopovezane...

Koeficijent korelacije

Vrednosti od -1 do 1

Smisao i princip korelacije

Izračunavanje korelacionog koeficijenta

( )( )[ ]N

ZZr yx∑=

Zx i Zy predstavljaju Z vrednosti odgovarajućih varijabli

Prvo izračunamo srednje vrednosti standardne devijacije za obe varijable. Zatim svaki pojedinačan rezultat (za obe varijable)pretvorimo u Z vrednost. Pomnožimo odgovarajuće Z vrednosti.Izračunamo sumu svih proizvoda pa je podelimo sa brojem parova.

Vidi primer koji sledi...

Izračunavanje korelacionog koeficijenta

Da li su i u kojoj meri varijable x i y međusobno povezane ?

Izračunavanje korelacionog koeficijenta

Izračunavanje korelacionog koeficijenta

U slučaju većeg broja podataka u praksi se najčešće koristi sledeća formula (ko nema računar...):

Izračunavanje korelacionog koeficijenta

...Odnosno računar...

Značajnost korelacije

►Određen je brojem parova►Što je N manje to r mora biti veće da bi

korelacija bila značajna (i obrnuto)►Značajnost korelacija se određuje uz pomoć

tablica ili upotrebom komjuterskih programa:

Značajnost korelacije

Značajnost korelacije

http://www.stat.berkeley.edu/users/stark/Java/Html/Correlation.htm

Korisna Web adresa: Dobar “udžbenik” statistike sa lepim ilustracijama (JAVA applets).

Rang-korelacija

Ako su jedna ili obe varijable date u “rangu”(neki poredak), računa se tzv. rang-korelacija

Nije potrebno da varijable budu u linearnom odnosu. Rang korelaciija daje samo približnuIndikaciju “povezanosti” dve varijable

Bivarijantna regresija

Bivarijantna regresija

Kada je korelacija između dve varijable dovoljno “velika” (visoka), na osnovu rezultata varijable x (nezavisno promenljive) možemo predvideti rezultat varijable y(zavisno promenljive)...

Bivarijantna regresija

►To je od posebnog značaja u slučajevima kada nam je merenje varijable x znatno lakše nego merenje varijable y (Npr. procena indirektne potrošnje kiseonika...).

Bivarijantna regresija

Multipla regresija

►Ispituje uticaj dve ili više nezavisnih (prediktorskih) promenljivih na zavisnopromenljivu...

Y = a + b1*X1 + b2*X2 + ... + bp*Xp

Multipla regresija

PRIMER*:Posmatran je uticaj eksplozivne snage (x1) i brzine trčanja (x2) na skok u dalj iz zaleta y (10 studenata Fakulteta za fizičku kulturu...)

* Primer preuzet iz: Perić D, Operacionalizacija 2, FINE Graf, 1996

Multipla regresija

Y = 0.883271 + 0.6181*X1 – 0.1574*X2

ČETVRTI DEOTESTIRANJE RAZLIKA

Sadržaj

►t test►ANOVA►Neparametrijski testovi

t test (dva nezavisna uzorka)

►t test (dva nezavisna uzorka)PRIMER: Upoređene su visine vertikalnog

skoka (CMJ) sto studenata Medicnskog fakulteta i sto studenta DIF-a

t test (dva nezavisna uzorka)

t test (dva zavisna uzorka)

►t test (dva zavisna uzorka)PRIMER: Daljina šuta iz mesta u pre i

posttestu (18 fudbalera):

t test (dva zavisna uzorka)

ANOVA

Vidi dodatak (IV_deo_dodatak.pdf)

ANOVA

Ostali testovi biće prikazani direktno (primena statističkog softvera...)...

A slajdovi će vremenom biti dopunjavani, popravaljani...

Recommended