KORELACIJA
KORELACIJAKORELACIJA
Povezanost pojava ili svojstava koje se proučavaju
Procjenjuje stupanj variranja varijabliOdnosi se na intenzitet i smjerintenzitet i smjer povezanosti
varijabli u tom odnosu
Pozitivna povezanost
–
porastom vrijednosti jednoga svojstva rastu i pripadajuće vrijednosti drugog svojstva
Pozitivna povezanost
–
porastom vrijednosti jednoga svojstva rastu i pripadajuće vrijednosti drugog svojstva
visina i težina čovjekabrzina automobila i vrijeme potrebito za zaustavljanjebroj cvjetova i broj zametnutih plodovakoličina padalina i bujnost vegetacijekategorija hotela i cijena noćenjastarost osobe i visina krvnog tlakaefikasnost pesticida i prinossadržaj CO2 u zraku i zagađenje
Negativna povezanost
–
porastom vrijednosti jednoga svojstva opadaju pripadajuće vrijednosti
drugog svojstva
Negativna povezanost
–
porastom vrijednosti jednoga svojstva opadaju pripadajuće vrijednosti
drugog svojstva
Starost osobe i broj zdravih zubiVisina prinosa i kvalitetaPostotak šećera i sadržaj kiselina u sokuTemperatura zagrijavanja i postotak vlagePromjer cijevi za odvodnju i preostala količina vode u tluKoncentracija preparata i stupanj zaraženosti
Karl Pearson (1857. – 1936.)sir Francis Galton(1822. – 1911.)
( ) ( )
( ) ( )
( )n
yxyxSP
nyySS
nxxSS
SSSSSP
r
xy
22
y
22
x
yx
xy
∑ ∑⋅−∑ ⋅=
∑−∑=
∑−∑=
×=
Grafički prikaz dijagram rasipanja -
scatter
diagram
Grafički prikaz dijagram rasipanja -
scatter
diagram
ApcisaApcisa
––
nezavisna varijabla (samovoljno je mijenjamo ili biramo)nezavisna varijabla (samovoljno je mijenjamo ili biramo)OrdinataOrdinata
––
zavisna varijabla (istrazavisna varijabla (istražživanjem je ivanjem je žželimo ustanoviti)elimo ustanoviti)
ToToččkice predstavljaju parove vrijednosti x i y varijablekice predstavljaju parove vrijednosti x i y varijable
Praktičan savjet –
grafički prikaz, a zatim analiza!
Korelacije različitih smjerova i jačinaKorelacije različitih smjerova i jačina
npr. odnos između polumjera i opsega kruga
npr. odnos između vremena proteklog od ispaljivanja metka uvis i brzine tog metka
npr. odnos između visine i težine ljudi
npr. odnos između stupnja treniranosti i frekvencije pulsa u prvoj minuti oporavka (-0,5!!!)
npr. odnos između duljine kose i krvnog tlaka
Koeficijent
korelacije
•
Daje
odgovor
na
pitanje: ˇPostojiPostoji
lili
međumeđu
promatranimpromatranim
pojavamapojavama
nekaneka
funkcionalnafunkcionalna
vezaveza??ˇ
visina/težina
R=0,9836 –
vrlo
jaka
veza
između visine
i težine
--1 1 ≤≤
R R ≤≤
11
Korelacija može biti:
po smjeru: pozitivna ili negativna
po jačini: od vrlo slabe ili nikakve do potpune
00,1r00,1 +≤≤−
Roemer-Orphal-ova tablica
Testiranje opravdanosti korelacijskog koeficijenta
Testiranje opravdanosti korelacijskog koeficijenta
-
očitati na temelju n-2
slobodnih varijanata
2nr1s
srt
0r:H
2
r
rexp
0
−−
=
=
=
tabtza p = 5% i za p = 1%
Usporedba texp
i ttab
Usporedba texp
i ttab
texp
> ttab H0
se odbacuje
uz p = 5% ili p = 1%
texp
< ttab
H0 se prihvaća
Mogući razlozi pogrešne analize i interpretacije korelacije
Problem ekstremnih vrijednosti (outliers)
Važne napomene
Uz korelacijski koeficijent navesti granice x i y varijableKorelacijski koeficijent na temelju samo dva para podataka bit će uvijek + 1 ili -1Za nelinearne veze transformirati podatkeOdnos između dvije varijable je jednostavna ili ukupna korelacija
Istraživanje
ovisnosti
između
dvije
iliviše
varijabli
ne
podrazumjeva
automatski
postojanje
uzročnoposljedične
veze
između
njih. Kauzalnost
nije
statistički, već
eksperimentalni
i logički
problem.
REGRESIJA
REGRESIJAREGRESIJA
Funkcionalni odnos dva svojstvaY = f (x)Zavisna varijabla – promjena zavisi
o drugoj varijabliNezavisna varijabla – uzrok
promjeni prve varijable
REGRESIJA: y=xREGRESIJA: y=x
REGRESIJA: y=1/7 x ili y =0.143 xREGRESIJA: y=1/7 x ili y =0.143 x
REGRESIJA: y=1/7 x ili y =0.143 xREGRESIJA: y=1/7 x ili y =0.143 x
Y=1/7* x x = 5 danaY=1/7 * 5 = 0.71 cm
Y=1/7* x x = 10 danaY=1/7 * 10 = 1.43 cm
Y = a + bxY = a + bx
Pravac se može izraziti funkcijoma- odsječak na ordinatib- koeficijent smjera pravca ili
tanges kuta što ga pravac zatvara sa osi x (kvocijent nasuprotne i priležeće
katete)
Koeficijent b određuje nagib pravcaKoeficijent b određuje nagib pravca
Tanges kuta αTanges kuta α
Za funkciju y =x za: x = 2 ili x=5 ili x =7Tg
αα= 2/2 =1
Tg
α
= 5/5 =1Tg
α
= 7/7 =1
Tg
α
=1 ili b = 1
Tanges kuta alfaTanges kuta alfaZa funkciju y =1/7 xza: x = 2 ili x=5 ili x =7 y =2/7=0.28y =5/7 =0.71y =7/7 =1.0tg
α
2 = 0.28/2 = 0.143
tg
α
2 = 0.71/5 = 0.143tg
α
2 = 1.00/7 = 0.143
tg
α
2 = 0.143 ili b = 0.143
Tanges kuta alfaTanges kuta alfa•Za vrijednost x-a i y-a u bilo kojoj točki je ista vrijednost za tanges
kuta
što ga pravac zatvara sa x osi
•Za bilo koju promjenu vrijednosti x i y varijable tanges
kuta je:
tg
α
= Δy/ Δx
tg αtg α
za Δ x = 1 : b = tg α = Δ yza Δ x = 1 : b = tg α = Δ y
b-
regresijski koeficijentY =a + bx
–regresijska
jednadžbaY=0 + 1x = xY=0 + 0.143 x = 0.143 xa = 0
Jednadžba linearne regresijeJednadžba linearne regresije
Za bilo koju vrijednost x-a moguće je izračunati pripadajuću vrijednost y-aŶ
= a + bx
T ( )yx ,
xbay += xbya −=
)(ˆ xxbyy −+=
Regresijski koeficijentRegresijski koeficijent
∑∑ ∑
−=
=
nyxxySP
SSSP
bx
xy
)(
Kovarijanca-CovKovarijanca-Cov
1−=
nSP
Cov xy
Primjer 1. Duljina klipa kukuruza i broj zrna
Primjer 1. Duljina klipa kukuruza i broj zrna
15,3 24219,2 36516,5 26119,8 52420,3 47621,3 58917,4 39818,6 46320,6 53023,1 602
Primjer 2. % šećera i sadržaj kiselinaPrimjer 2. % šećera i sadržaj kiselina
15,7 8,5 15,4 8,45 13,2 9,2 16,3 8,25 15,0 9,05 16,4 8,9 13,8 10,3 17,4 7,35 15,6 8,95 14,9 9,35 16,2 9,8 15,5 9,95
Primjer 3.Primjer 3.
X-koncetracija
preparata Y-uginule larve
35 84,840 89,950 88,960 92,470 96,780 96,690 95,9
100 98,3
Primjer 4.Primjer 4.Broj sunčanih dana u godini Ukupni godišnji prihod od turizma
250 3.485
280 3.590
300 3.408
285 3.790
260 3.895
245 3.600
305 4.100
240 3.900
270 4.000
308 4.200
285 4.050
230 3.900
288 4.080295 4.250
Primjer 5. Ulaganje u marketing i god.profit
Red.br.agencije
Ulaganje u marketing(000
EUR) God.profit(000EUR)1. 15 80
2. 22 95
3. 25 100
4. 30 120
5. 40 110
6. 45 145
7. 50 130
8. 60 180
9. 70 210
10. 80 200
11. 95 280
12. 100 320
13. 120 350
14. 130 375
15. 150 480
Primjer 5.Primjer 5.
Duljina klipa kukuruza i broj zrna
y = 50,306x - 521,37R2 = 0,8666
0
100
200
300
400
500
600
700
0 5 10 15 20 25
duljina klipa kukuruza
broj
zrn
a
Duljina klipa kukuruza i broj zrna
DULJINA
242220181614
BRO
JZR
NA
700
600
500
400
300
200
% šećera i sadržaj kiselina
y = -0,4327x + 15,689
0
2
4
6
8
10
12
0 5 10 15 20% šećera
sadr
žaj k
isel
ina
ŠEÆER
181716151413
KISE
LIN
E10,5
10,0
9,5
9,0
8,5
8,0
7,5
7,0
y = 0,1857x + 80,75
8486889092949698
100102
0 20 40 60 80 100 120
koncentracija parationskog preparata
ugin
ule
larv
e re
pino
g m
oljc
a
y = 3,6201x + 2881,7
3.4003.5003.6003.7003.8003.9004.0004.1004.2004.300
200 220 240 260 280 300 320
Broj sunčanih dana u godini
Ukup
ni g
odiš
nji p
rihod
od
turiz
ma
y = 2,8396x + 16,299R2 = 0,9694
0
100
200
300
400
500
600
0 20 40 60 80 100 120 140 160
Ulaganje u marketing(000 EUR)
God
išnj
i pro
fit(0
00EU
R)