21
STATISTIKA STATISTIKA 4. 4. KORELACIJSKA I REGRESIJSKA ANALIZA KORELACIJSKA I REGRESIJSKA ANALIZA (DESKRIPTIVNI PRISTUP)

STATISTIKA 4

  • Upload
    lukas

  • View
    47

  • Download
    4

Embed Size (px)

DESCRIPTION

STATISTIKA 4. KORELACIJSKA I REGRESIJSKA ANALIZA (DESKRIPTIVNI PRISTUP). Korelacijska i regregresijska analiza proučavaju međusobne odnose dvije ili više pojava. Razlika između korelacije i regresije. - PowerPoint PPT Presentation

Citation preview

Page 1: STATISTIKA 4

STATISTIKA 4.STATISTIKA 4.KORELACIJSKA I REGRESIJSKA ANALIZAKORELACIJSKA I REGRESIJSKA ANALIZA

(DESKRIPTIVNI PRISTUP)

Page 2: STATISTIKA 4

Korelacijska i regregresijska analiza proučavaju međusobne odnose dvije ili više pojava.

Korelacijska analiza ustanovljava postojanje veze između pojava, njen oblik, jačinu i smjer ne ulazeći u to što je uzrok a što poslijedica.

Razlika između korelacije i regresije

Regresijska analiza utvrđuje analitički oblik veza između zavisne i nezavisnih pojava

Page 3: STATISTIKA 4

KORELACIJSKAKORELACIJSKA II

REGRESIJSKA ANALIZAREGRESIJSKA ANALIZA

KORELACIJAKORELACIJA REGRESIJAREGRESIJA

Oblik vezeSmjer vezeJakost veze

Analitički izraz veze(Algebarski model)

Page 4: STATISTIKA 4

VRSTE VRSTE VEZAVEZA

VRSTE VRSTE VEZAVEZA

PREMA JAKOSTIPREMA JAKOSTIPREMA JAKOSTIPREMA JAKOSTI PREMA OBLIKUPREMA OBLIKUPREMA OBLIKUPREMA OBLIKUPREMA BROJU PREMA BROJU

POJAVAPOJAVA PREMA BROJU PREMA BROJU

POJAVAPOJAVA

STOHASTIČKASTOHASTIČKA

FUNKCIONALNAFUNKCIONALNA

LINEARNALINEARNA

KRIVOLINIJSKAKRIVOLINIJSKA

JEDNOSTAVNAJEDNOSTAVNA

VIŠESTRUKAVIŠESTRUKA

Page 5: STATISTIKA 4

(A) Korelacijska analiza

1. Dijagram rasipanja

2. Jakost, smjer i oblik veze među pojavama

3. Pearsonov koeficijent linearne korelacije

4. Koeficijent korelacije ranga

Page 6: STATISTIKA 4

X

Y

Ne postoji veza Pozitivna jaka krivolinijska veza

Negativna jaka krivolinijska veza Pozitivna linearna veza

Funkcionalna veza

PRIMJERI DIJAGRAMA RASIPANJAPRIMJERI DIJAGRAMA RASIPANJA

Page 7: STATISTIKA 4

N

yyxxM

11

PEARSONOV KOEFICIJENT LINEARNE KORELACIJEPEARSONOV KOEFICIJENT LINEARNE KORELACIJE

4; 2

7; 3

8; 6

9; 4

11; 3

12; 7

14; 8

15; 7

0

1

2

3

4

5

6

7

8

9

0 2 4 6 8 10 12 14 16

0)( xx 0)( xx

0)( yy

0)( yy

0)( yy

0)( xx 0)( xx

0)( yy

X

Y

Page 8: STATISTIKA 4

N

yyxxM

N

iii

1

11

))((

N

yyxx

r

N

i y

i

x

i

1

)()(

N

yyxxN

iii

yx

1

))((1

yx

N

iii

N

yyxxr

1

))((

N

yy

N

xxN

yxxyyxyx

N

li

N

ii

N

iiiii

1

2

1

2

1

)()(

)(

NyN

N

y

NxN

N

xN

yxNyxNyxNyx

N

ii

N

ii

N

iii

21

22

1

2

1

N

ii

N

ii

N

iii

yNyxNx

yxNyxr

1

22

1

22

1

Page 9: STATISTIKA 4

Vrijednost koeficijenta korelacijeVrijednost r Jakost veze

-1 funkcionalna negativna veza

-1 < r < -0,8 jaka negativna veza

-0,8 ≤ f < -0,5 srednja negativna veza

-0,5 ≤ r < 0 slaba negativna veza

0 veza ne postoji

0 < r ≤ 0,5 slaba pozitivna veza

0,5 < r ≤ 0,8 srednja pozitivna veza

0,8 < r < 1 jaka pozitivna veza

1 funkcionalna pozitivna veza

Page 10: STATISTIKA 4

Primjer 1: Ispitajte postoji li veza među slijedećim varijablama

DIJAGRAM RASIPANJA

0102030405060708090

0 1 2 3 4 5 6 7 8 9 10 11 12 13

Cijena Ponuda

x(p) y(q)

5 44

12 68

7 60

10 70

4 32

6 36

8 62

12 84

   

N

ii

N

ii

N

iii

yNyxNx

yxNyxr

1

22

1

22

1

91612,0228866

356

r

Cijena Ponudaxy

x(p) y(q)

5 44 220

12 68 816

7 60 420

10 70 700

4 32 128

6 36 216

8 62 496

12 84 1008

64 456 4004

Cijena Ponudaxy x2 y2

x(p) y(q)

5 44 220 25 1936

12 68 816 144 4624

7 60 420 49 3600

10 70 700 100 4900

4 32 128 16 1024

6 36 216 36 1296

8 62 496 64 3844

12 84 1008 144 7056

64 456 4004 578 28280

Page 11: STATISTIKA 4

KOEFICIJENT KORELACIJE RANGAKOEFICIJENT KORELACIJE RANGASpearmanov koeficijent korelacije ranga mjeri stupanj povezanosti dvije varijable ranga.Uspjeh studenata na ispitu iz matematike i statistike dan je u slijedećoj tabeli: NN

dr

N

ii

s

3

1

261

Matematika Statistikaxi yi

1 55 502 40 453 60 70

4 80 605 70 606 35 457 20 408 65 60

Br. Stud.

Page 12: STATISTIKA 4

Kendallov koeficijent korelacije ranga mjeri stupanj korelacije od tri ili više varijabli ranga.

Sedam regija rangirano je prema tri pokazatelja dostignutog stupnja razvoja: P1 nacionalni dohodak po glavi stanovnika; P2 broj liječnika na tisuću stanovnika; P3 broj visokoobrazovanih na tisuću stanovnika.

NK

rR

K

RR

NN

RRW

N

i

K

kki

K

kki

i

N

ii

1 11

2

1

2

)1(

121

P1 P2 P3

r1i r2i r3i

A 2 3 2B 4 4 3C 1 2 1D 7 7 6E 3 1 4F 5 6 7G 6 5 5

Regija

Page 13: STATISTIKA 4

(B) Regresijska analiza

1. Model jednostavne linearne regresije

2. Ocjenjivanje nepoznatih parametara

3. Mjere disperzije i drugi analitički pokazatelji

4. Ispitivanjekvaliteta dobivenih rezultata (regresijska dijagnostika)

Page 14: STATISTIKA 4

REGRESIJSKA ANALIZAREGRESIJSKA ANALIZAJednostavna linearna regresijaJednostavna linearna regresija

024

68

101214

161820

0 1 2 3 4 5 6 7 8 9 10

iiiiiiii xyeyyexy ˆ ˆˆ ˆ

Page 15: STATISTIKA 4

Y

X

);( ii yx

ii xy ˆ

ii yy ˆ

)ˆ;( ii yx

minˆ 2ii yy

22 xnx

yxnxy

xy

min2 ii xy

N

i

N

i

N

iiiii

N

i

n

iii

yxxx

yxN

1 1 1

2

1 1

Page 16: STATISTIKA 4

ii xy ˆ

Značenje parametaraZnačenje parametara

“α” – konstantni član i nema praktično značenje. Pokazuje kolika bi bila pojava Y ako je X nula“β” – regresijski koeficijent; pokazuje za koliko se u prosjeku promjeni Y ako se X poveča za jedinicu

Nezavisna varijabla X u modelu naziva se regresor, a zavisna Y regresand

Page 17: STATISTIKA 4

Primjer 5: Ustanovite da li su pojave u slijedećoj tabeli povezane, i ako jesu izračunajte parametre regresijskog modela

02468

1012141618202224

0 1 2 3 4 5 6 7 8 9 10

xy 23ˆ Worksheet

Page 18: STATISTIKA 4

ANALIZA VARIJANCE ANALIZA VARIJANCE A N O V AA N O V A

ii yy ˆ

yy ˆ

yy

Worksheet

Worksheet

Page 19: STATISTIKA 4

TABELA ANALIZE VARIJANCE TABELA ANALIZE VARIJANCE A N O V AA N O V A

Source df SS MS

Regresion k

Residual n-k-1

Total n-1

22

2)(

yny

yy

2

10

ynxyy

yy

xyyy

yy

102

2 )ˆ(

k

yy 2ˆ

1

ˆ 2

kn

yy

1

2

n

yy

KOEFICIJENT DETERMINACIJEKOEFICIJENT DETERMINACIJE

2

2

yy

yyR Worksheet

Page 20: STATISTIKA 4

NEKI NELINEARNI MODELI KOJI SE MOGU LINEARIZIRATI

1010 logloglog)log( xYyyY x

xyyyxxxY logloglog)log;log( 1001

xyy

yx

Y 1010

1)

1(

1

Worksheet

Worksheet

Page 21: STATISTIKA 4

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,945571

R Square 0,894104

Adjusted R Square 0,8676

Standard Error 4,661627

Observations 6

ANOVA

df SS MS F Signifikance F

Regression 1 733,9103 733,9103 33,77286 0,004363

Residual 4 86,9230 21,73077

Total 5 820,8333

 Coeffici

entsStandard

Error t Stat P-value Lower 95% Upper 95%

Intercept -7,38 5,753054 -1,2836 0,268596 -23,3577 8,588424

X 0,823 0,14163 5,811442 0,004363 0,429848 1,216306

Koeficijent determinacije

Koeficijent korelacije

= 86,9230 / 4

Standardna devijacija regresije