Korelacija Regresija Ped

Preview:

DESCRIPTION

Korelacija Regresija Pedagodija

Citation preview

Korelacija i regresija

• Korelacijsko istraživanje je kvantitativna istraživačka metoda kojom se opisuje i prognozira ponašanje, osobine, situacije.

• Koncept razlika– Razlike između AS dvije ili više grupa

• Koncepti korelacije i regresije– Više vrijednosti (posmatranja) za svakog

ispitanika (N)

• Korelacija je statistička mjera povezanosti između dvije ili više varijabli.

• Korelacijom opisujemo odnos između dvije varijable: kakvog je oblika (linearan, kvadratičan, logaritamski, obrnuto U, itd.) i koliko iznosi.

• Konceptu korelacije, blizak je koncept regresije (tačnije, regresijske analize).

• Regresijskom analizom predviđamo vrijednosti jedne varijable, koju nazivamo kriterijska, na osnovu informacija koje imamo o drugoj varijabli, koju nazivamo prediktorska varijabla.

• Prema mnogim statističarima:– regresija se odnosi na situacije kada je varijabla X

fiksna ili specificirana od strane eksperimentatora prije prikupljanja podataka, a

– korelacija na situacije kada su obje varijable (X i Y) slučajne.

• Međutim, u praksi:– ako je cilj istraživanja predikcija Y na osnovu X

govorimo o regresiji, a– ako želimo statistički izraziti stepen povezanosti

između dvije varijable, govorimo o korelaciji.

Korelacija• U opisivanju povezanosti koristimo

grafičke i numeričke metode.

• Grafička metoda podrazumijeva grafičko prikazivanje povezanosti izmedu dvije varijable preko skater – dijagram.

Skaterdijagram• U skaterdijagramu svaki ispitanik predstavljen je tačkom u

dvo-dimenzionalnom prostoru. Koordinate tačke (x,y) su rezultati na varijablama X i Y.

ISPITANICI X Y

1 5 14

2 14 9

3 7 12

4 8 7

5 9 10

6 6 6

7 11 8

8 4 7

9 13 13

10 3 5

0123456789

101112131415

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

0123456789

101112131415

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

• U skater dijagramu nalazi se i pravac kojeg nazivamo “pravac regresija”.

• Stepen u kojem se tačke “okupljaju” oko pravca odražava korelaciju između X i Y

korelacijski oblak

• Povezanost između školskog uspjeha i inteligencije

ISP. IQ ŠU

1 102 2,75

2 108 4,00

3 109 2,25

4 118 3,00

5 79 1,67

6 88 2,25

7 100 2,50

8 92 3,50

9 131 3,75

10 83 2,75

11 115 4,00

12 92 2,23

13 95 3,00

14 90 2,50

15 106 2,75

16 85 2,75

17 95 2,75

18 97 2,67

19 93 2,00

20 81 2,00

21 111 3,00

22 95 1,50

23 106 3,75

24 83 0,67

25 81 1,50

26 112 3,00

27 85 1,75

28 115 3,75

29 86 1,00

30 85 2,50

IQ

140130120110100908070

SU

5,0

4,5

4,0

3,5

3,0

2,5

2,0

1,5

1,0

,5

0,0

• Karl Pearson razradio je računski postupak za izračunavanje stepena povezanosti (Pearsonov produkt-moment koeficijent korelacije).

• Kovariranje rezultata – kovarijansa: stepen u kojem dvije varijable zajedno variraju:

covxy = [(X – Mx)(Y – My)] / (N – 1)r = covxy / sx x sy

• Koeficijent korelacije izražen preko z – vrijednostir = (zx x zy) / N – 1

• Pearsonov koeficijent korelacije

2222

))((

YYNXXN

YXXYNrxy

rxy = Pearsonov koeficijent korelacije

X = rezultat varijable X

Y = rezultat varijable Y

N = broj parova rezultata (broj jedinica promatranja, ispitanika)

• Korelacija može biti pozitivna (porastu jedne odgovara porast druge varijable), negativna (porastu jedne odgovara opadanje druge varijable), maksimalna, perfektna (vece slaganje ne može postojati) i nulta (između dvije varijable ne postoji povezanost).

• Povezanosti izmešu ŠU i IQ:

r=0,702

• Oprez sa interpretacijom r!– Ne znači da je 70,2 % povezanosti između dvije

varijable!– Jednostavno, tačka na skali od -1 do 1. Što je

tačka bliže bilo kojem kraju skale snažnija je povezanost između varijabli.

Stepen povezanosti

0

Potpuna negativna korelacija

-1 1

Korelacija ne postoji

Potpuna pozitivna korelacija

Testiranje značajnosti r

• Vrijednost dobivenog koeficijenta korelacije mogla je biti rezultat slučaja.

• Logika testiranja značajnosti koeficijenta korelacije ista kao i kod testiranja značajnosti razlika između dvije AS.

• Distribucija koeficijenata korelacije.• t – vrijednost; graničnu t – vrijednost očitati iz tablice B;

ss = N – 2. • Određivanje granične vrijednosti r uz određeni broj

stupnjeva slobode (ss = N – 2); tablica D u dodatku

t r N

r

2

1 2

Preduslovi:

• Intervalna ili omjerna skala mjerenja• Normalna ili simetrična distribucija • Linearni odnos između varijabli

KOEFICIJENT DETERMINACIJE

• Postotak zajedničkih faktoraD = r2

• Koeficijent determinacije govori o proporciji varijance jedne varijable koja se može objasniti drugom varijablom.

• Primjer: Školski uspjeh i inteligencija

D = 0,493

49,3% zajedničkih faktora

• Psihološka interpretacija: koji su to zajednički faktori?

ŠU IQ

49,3%

KORELACIJA I UZROČNA VEZA

• Sama činjenica da između dvije pojave postoji povezanost ne daje nam za pravo da te pojave povežemo uzročnom vezom.

• Statistički «dokaz» da rode donose djecu: postoji visoka pozitivna korelacija između broja roda u selima i broja novorođene djece. Uzrok povezanosti je neki treći faktor.

• Uzročna veza između dvije pojave može se dokazati samo eksperimentom.

korelacija i uzročnost

X Y

Z

Y’ = a + bX

• Y’ – prognozirani rezultat• a - odsječak na osi Y

kada je X=0• b – nagib pravca • X - vrijednost prediktora

REGRESIJSKA ANALIZA

XYb

IQ

140130120110100908070

SU

5,0

4,5

4,0

3,5

3,0

2,5

2,0

1,5

1,0

,5

0,0

a

ΔY

ΔX

Y’ = a + bX

X Y

1.002.003.004.005.00

1.002.001.303.752.25

Primjer određivanja pravca regresije

b = r sy/sxa = My – b Mx

Mx=3 My=2,06sx=1,58 sy=1,07r=0,627

b = (0.627)(1.072)/1.581 = 0.425a = 2.06 - (0.425)(3)=0.785

Y' = 0.425X + 0.785

X = 1,Y' = (0,425)(1) + 0,785 = 1,21

X = 2,Y' = (0,425)(2) + 0,785 = 1,64

Y' = 0.425X + 0.785

Y‘ za X=1

Y‘ za X=2

Prognozirani rezultati

Najmanja suma kvadrata

Y' = 0.425X + 0.785

Samo je pravac opisan jednačinom Y' = 0.425X + 0.785 “najpošteniji” pravac jer za njega vrijedi da je suma kvadrata odstupanja rezultata Y od pravca regresije (tj. prognoziranog rezultata) najmanja.

Prognozirani rezultat

Y’ = a + bXY' = 0.425X + 0.785X = 1,Y' = (0,425)(1) + 0,785 = 1,21

X = 2,Y' = (0,425)(2) + 0,785 = 1,64

Prognozirani rezultati

Koji je najvjerovatniji školski uspjeh učenika koji na testu inteligencije postižerezultat X=100?

Mx=97,27 My=2,58sx=13,28 sy = 0,85

58,210027,9728,1385,0702,0'

Y

MyMxXss

rYx

y

'

45,2'Y

• Predikcija preko z-vrijednosti:

zy´ = r x zx

Pogreška prognoze

Y'

e

Y = Y‘ + e

Pogreška prognoze za individualni rezultat (rezidual) e = Y - Y‘

e (reziduali)

Standardna pogreška prognoze

2, Nrezxy sss

2

2

NYY

xys

21)1( 2

,

NNrss yxy

230130)702,01(85,0 2

,

xys

Koliko iznosi pogreška prognoze ako na osnovu rezultata koje učenici postignu na testu inteligencije (X) prognoziramo školski uspjeh (Y)?

616,0, xys

• Standardna pogreška prognoze interpretira se kao standardna devijacije!

• Interval pouzdanosti prognoziranog rezultata

2/,´_ tsYipouzdanostInterval xy

Ostale mjere povezanosti

Jedna varijablaDruga varijabla

nominalna ordinalna

nominalna koeficientTetrahorični koef.koeficijent kontingencije C

Kendallov

ordinalna Kendallov Spearmanov Kendallov

intervalna Point biserijalni koef.Biserijalni koef.

Spearmanov Kendallov

• Speaermanov koeficijent korelacije je Pearsonov produkt-moment koeficijent korelacije izračunat na rangiranim podacima:

• d=xi – yi (razlika između rangova)

Mat Fiz Rang (Mat)

Rang (Fiz) d d2

56 66 9 4 5 2575 70 3 2 1 145 40 10 10 0 071 60 4 7 3 962 65 6.5 5 1 164 56 5 9 4 1658 59 8 8 0 0

80 77 1 1 0 076 67 2 3 1 161 63 6.5 6 1 1