Korelacija 1

Preview:

DESCRIPTION

Korelacija 1

Citation preview

KORELACIJA

KORELACIJAKORELACIJA

Povezanost pojava ili svojstava koje se proučavaju

Procjenjuje stupanj variranja varijabliOdnosi se na intenzitet i smjerintenzitet i smjer povezanosti

varijabli u tom odnosu

Pozitivna povezanost

porastom vrijednosti jednoga svojstva rastu i pripadajuće vrijednosti drugog svojstva

Pozitivna povezanost

porastom vrijednosti jednoga svojstva rastu i pripadajuće vrijednosti drugog svojstva

visina i težina čovjekabrzina automobila i vrijeme potrebito za zaustavljanjebroj cvjetova i broj zametnutih plodovakoličina padalina i bujnost vegetacijekategorija hotela i cijena noćenjastarost osobe i visina krvnog tlakaefikasnost pesticida i prinossadržaj CO2 u zraku i zagađenje

Negativna povezanost

porastom vrijednosti jednoga svojstva opadaju pripadajuće vrijednosti

drugog svojstva

Negativna povezanost

porastom vrijednosti jednoga svojstva opadaju pripadajuće vrijednosti

drugog svojstva

Starost osobe i broj zdravih zubiVisina prinosa i kvalitetaPostotak šećera i sadržaj kiselina u sokuTemperatura zagrijavanja i postotak vlagePromjer cijevi za odvodnju i preostala količina vode u tluKoncentracija preparata i stupanj zaraženosti

Karl Pearson (1857. – 1936.)sir Francis Galton(1822. – 1911.)

( ) ( )

( ) ( )

( )n

yxyxSP

nyySS

nxxSS

SSSSSP

r

xy

22

y

22

x

yx

xy

∑ ∑⋅−∑ ⋅=

∑−∑=

∑−∑=

×=

sir Francis

Galton

Karl

Pearson

Grafički prikaz dijagram rasipanja -

scatter

diagram

Grafički prikaz dijagram rasipanja -

scatter

diagram

ApcisaApcisa

––

nezavisna varijabla (samovoljno je mijenjamo ili biramo)nezavisna varijabla (samovoljno je mijenjamo ili biramo)OrdinataOrdinata

––

zavisna varijabla (istrazavisna varijabla (istražživanjem je ivanjem je žželimo ustanoviti)elimo ustanoviti)

ToToččkice predstavljaju parove vrijednosti x i y varijablekice predstavljaju parove vrijednosti x i y varijable

Praktičan savjet –

grafički prikaz, a zatim analiza!

Korelacije različitih smjerova i jačinaKorelacije različitih smjerova i jačina

npr. odnos između polumjera i opsega kruga

npr. odnos između vremena proteklog od ispaljivanja metka uvis i brzine tog metka

npr. odnos između visine i težine ljudi

npr. odnos između stupnja treniranosti i frekvencije pulsa u prvoj minuti oporavka (-0,5!!!)

npr. odnos između duljine kose i krvnog tlaka

Koeficijent

korelacije

Daje

odgovor

na

pitanje: ˇPostojiPostoji

lili

međumeđu

promatranimpromatranim

pojavamapojavama

nekaneka

funkcionalnafunkcionalna

vezaveza??ˇ

visina/težina

R=0,9836 –

vrlo

jaka

veza

između visine

i težine

--1 1 ≤≤

R R ≤≤

11

Korelacija može biti:

po smjeru: pozitivna ili negativna

po jačini: od vrlo slabe ili nikakve do potpune

00,1r00,1 +≤≤−

Roemer-Orphal-ova tablica

Testiranje opravdanosti korelacijskog koeficijenta

Testiranje opravdanosti korelacijskog koeficijenta

-

očitati na temelju n-2

slobodnih varijanata

2nr1s

srt

0r:H

2

r

rexp

0

−−

=

=

=

tabtza p = 5% i za p = 1%

Usporedba texp

i ttab

Usporedba texp

i ttab

texp

> ttab H0

se odbacuje

uz p = 5% ili p = 1%

texp

< ttab

H0 se prihvaća

Mogući razlozi pogrešne analize i interpretacije korelacije

Problem ekstremnih vrijednosti (outliers)

Važne napomene

Uz korelacijski koeficijent navesti granice x i y varijableKorelacijski koeficijent na temelju samo dva para podataka bit će uvijek + 1 ili -1Za nelinearne veze transformirati podatkeOdnos između dvije varijable je jednostavna ili ukupna korelacija

Istraživanje

ovisnosti

između

dvije

iliviše

varijabli

ne

podrazumjeva

automatski

postojanje

uzročnoposljedične

veze

između

njih. Kauzalnost

nije

statistički, već

eksperimentalni

i logički

problem.

REGRESIJA

REGRESIJAREGRESIJA

Funkcionalni odnos dva svojstvaY = f (x)Zavisna varijabla – promjena zavisi

o drugoj varijabliNezavisna varijabla – uzrok

promjeni prve varijable

REGRESIJA: y=xREGRESIJA: y=x

REGRESIJA: y=1/7 x ili y =0.143 xREGRESIJA: y=1/7 x ili y =0.143 x

REGRESIJA: y=1/7 x ili y =0.143 xREGRESIJA: y=1/7 x ili y =0.143 x

Y=1/7* x x = 5 danaY=1/7 * 5 = 0.71 cm

Y=1/7* x x = 10 danaY=1/7 * 10 = 1.43 cm

Y = a + bxY = a + bx

Pravac se može izraziti funkcijoma- odsječak na ordinatib- koeficijent smjera pravca ili

tanges kuta što ga pravac zatvara sa osi x (kvocijent nasuprotne i priležeće

katete)

Koeficijent b određuje nagib pravcaKoeficijent b određuje nagib pravca

Tanges kuta αTanges kuta α

Za funkciju y =x za: x = 2 ili x=5 ili x =7Tg

αα= 2/2 =1

Tg

α

= 5/5 =1Tg

α

= 7/7 =1

Tg

α

=1 ili b = 1

Tanges kuta alfaTanges kuta alfaZa funkciju y =1/7 xza: x = 2 ili x=5 ili x =7 y =2/7=0.28y =5/7 =0.71y =7/7 =1.0tg

α

2 = 0.28/2 = 0.143

tg

α

2 = 0.71/5 = 0.143tg

α

2 = 1.00/7 = 0.143

tg

α

2 = 0.143 ili b = 0.143

Tanges kuta alfaTanges kuta alfa•Za vrijednost x-a i y-a u bilo kojoj točki je ista vrijednost za tanges

kuta

što ga pravac zatvara sa x osi

•Za bilo koju promjenu vrijednosti x i y varijable tanges

kuta je:

tg

α

= Δy/ Δx

tg αtg α

za Δ x = 1 : b = tg α = Δ yza Δ x = 1 : b = tg α = Δ y

b-

regresijski koeficijentY =a + bx

–regresijska

jednadžbaY=0 + 1x = xY=0 + 0.143 x = 0.143 xa = 0

Jednadžba linearne regresijeJednadžba linearne regresije

Za bilo koju vrijednost x-a moguće je izračunati pripadajuću vrijednost y-aŶ

= a + bx

T ( )yx ,

xbay += xbya −=

)(ˆ xxbyy −+=

Regresijski koeficijentRegresijski koeficijent

∑∑ ∑

−=

=

nyxxySP

SSSP

bx

xy

)(

Kovarijanca-CovKovarijanca-Cov

1−=

nSP

Cov xy

Primjer 1. Duljina klipa kukuruza i broj zrna

Primjer 1. Duljina klipa kukuruza i broj zrna

15,3 24219,2 36516,5 26119,8 52420,3 47621,3 58917,4 39818,6 46320,6 53023,1 602

Primjer 2. % šećera i sadržaj kiselinaPrimjer 2. % šećera i sadržaj kiselina

15,7 8,5 15,4 8,45 13,2 9,2 16,3 8,25 15,0 9,05 16,4 8,9 13,8 10,3 17,4 7,35 15,6 8,95 14,9 9,35 16,2 9,8 15,5 9,95

Primjer 3.Primjer 3.

X-koncetracija

preparata Y-uginule larve

35 84,840 89,950 88,960 92,470 96,780 96,690 95,9

100 98,3

Primjer 4.Primjer 4.Broj sunčanih dana u godini Ukupni godišnji prihod od turizma

250 3.485

280 3.590

300 3.408

285 3.790

260 3.895

245 3.600

305 4.100

240 3.900

270 4.000

308 4.200

285 4.050

230 3.900

288 4.080295 4.250

Primjer 5. Ulaganje u marketing i god.profit

Red.br.agencije

Ulaganje u marketing(000

EUR) God.profit(000EUR)1. 15 80

2. 22 95

3. 25 100

4. 30 120

5. 40 110

6. 45 145

7. 50 130

8. 60 180

9. 70 210

10. 80 200

11. 95 280

12. 100 320

13. 120 350

14. 130 375

15. 150 480

Primjer 5.Primjer 5.

Duljina klipa kukuruza i broj zrna

y = 50,306x - 521,37R2 = 0,8666

0

100

200

300

400

500

600

700

0 5 10 15 20 25

duljina klipa kukuruza

broj

zrn

a

Duljina klipa kukuruza i broj zrna

DULJINA

242220181614

BRO

JZR

NA

700

600

500

400

300

200

% šećera i sadržaj kiselina

y = -0,4327x + 15,689

0

2

4

6

8

10

12

0 5 10 15 20% šećera

sadr

žaj k

isel

ina

ŠEÆER

181716151413

KISE

LIN

E10,5

10,0

9,5

9,0

8,5

8,0

7,5

7,0

y = 0,1857x + 80,75

8486889092949698

100102

0 20 40 60 80 100 120

koncentracija parationskog preparata

ugin

ule

larv

e re

pino

g m

oljc

a

y = 3,6201x + 2881,7

3.4003.5003.6003.7003.8003.9004.0004.1004.2004.300

200 220 240 260 280 300 320

Broj sunčanih dana u godini

Ukup

ni g

odiš

nji p

rihod

od

turiz

ma

y = 2,8396x + 16,299R2 = 0,9694

0

100

200

300

400

500

600

0 20 40 60 80 100 120 140 160

Ulaganje u marketing(000 EUR)

God

išnj

i pro

fit(0

00EU

R)

Recommended