Upload
lukas
View
47
Download
4
Embed Size (px)
DESCRIPTION
STATISTIKA 4. KORELACIJSKA I REGRESIJSKA ANALIZA (DESKRIPTIVNI PRISTUP). Korelacijska i regregresijska analiza proučavaju međusobne odnose dvije ili više pojava. Razlika između korelacije i regresije. - PowerPoint PPT Presentation
Citation preview
STATISTIKA 4.STATISTIKA 4.KORELACIJSKA I REGRESIJSKA ANALIZAKORELACIJSKA I REGRESIJSKA ANALIZA
(DESKRIPTIVNI PRISTUP)
Korelacijska i regregresijska analiza proučavaju međusobne odnose dvije ili više pojava.
Korelacijska analiza ustanovljava postojanje veze između pojava, njen oblik, jačinu i smjer ne ulazeći u to što je uzrok a što poslijedica.
Razlika između korelacije i regresije
Regresijska analiza utvrđuje analitički oblik veza između zavisne i nezavisnih pojava
KORELACIJSKAKORELACIJSKA II
REGRESIJSKA ANALIZAREGRESIJSKA ANALIZA
KORELACIJAKORELACIJA REGRESIJAREGRESIJA
Oblik vezeSmjer vezeJakost veze
Analitički izraz veze(Algebarski model)
VRSTE VRSTE VEZAVEZA
VRSTE VRSTE VEZAVEZA
PREMA JAKOSTIPREMA JAKOSTIPREMA JAKOSTIPREMA JAKOSTI PREMA OBLIKUPREMA OBLIKUPREMA OBLIKUPREMA OBLIKUPREMA BROJU PREMA BROJU
POJAVAPOJAVA PREMA BROJU PREMA BROJU
POJAVAPOJAVA
STOHASTIČKASTOHASTIČKA
FUNKCIONALNAFUNKCIONALNA
LINEARNALINEARNA
KRIVOLINIJSKAKRIVOLINIJSKA
JEDNOSTAVNAJEDNOSTAVNA
VIŠESTRUKAVIŠESTRUKA
(A) Korelacijska analiza
1. Dijagram rasipanja
2. Jakost, smjer i oblik veze među pojavama
3. Pearsonov koeficijent linearne korelacije
4. Koeficijent korelacije ranga
X
Y
Ne postoji veza Pozitivna jaka krivolinijska veza
Negativna jaka krivolinijska veza Pozitivna linearna veza
Funkcionalna veza
PRIMJERI DIJAGRAMA RASIPANJAPRIMJERI DIJAGRAMA RASIPANJA
N
yyxxM
11
PEARSONOV KOEFICIJENT LINEARNE KORELACIJEPEARSONOV KOEFICIJENT LINEARNE KORELACIJE
4; 2
7; 3
8; 6
9; 4
11; 3
12; 7
14; 8
15; 7
0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10 12 14 16
0)( xx 0)( xx
0)( yy
0)( yy
0)( yy
0)( xx 0)( xx
0)( yy
X
Y
N
yyxxM
N
iii
1
11
))((
N
yyxx
r
N
i y
i
x
i
1
)()(
N
yyxxN
iii
yx
1
))((1
yx
N
iii
N
yyxxr
1
))((
N
yy
N
xxN
yxxyyxyx
N
li
N
ii
N
iiiii
1
2
1
2
1
)()(
)(
NyN
N
y
NxN
N
xN
yxNyxNyxNyx
N
ii
N
ii
N
iii
21
22
1
2
1
N
ii
N
ii
N
iii
yNyxNx
yxNyxr
1
22
1
22
1
Vrijednost koeficijenta korelacijeVrijednost r Jakost veze
-1 funkcionalna negativna veza
-1 < r < -0,8 jaka negativna veza
-0,8 ≤ f < -0,5 srednja negativna veza
-0,5 ≤ r < 0 slaba negativna veza
0 veza ne postoji
0 < r ≤ 0,5 slaba pozitivna veza
0,5 < r ≤ 0,8 srednja pozitivna veza
0,8 < r < 1 jaka pozitivna veza
1 funkcionalna pozitivna veza
Primjer 1: Ispitajte postoji li veza među slijedećim varijablama
DIJAGRAM RASIPANJA
0102030405060708090
0 1 2 3 4 5 6 7 8 9 10 11 12 13
Cijena Ponuda
x(p) y(q)
5 44
12 68
7 60
10 70
4 32
6 36
8 62
12 84
N
ii
N
ii
N
iii
yNyxNx
yxNyxr
1
22
1
22
1
91612,0228866
356
r
Cijena Ponudaxy
x(p) y(q)
5 44 220
12 68 816
7 60 420
10 70 700
4 32 128
6 36 216
8 62 496
12 84 1008
64 456 4004
Cijena Ponudaxy x2 y2
x(p) y(q)
5 44 220 25 1936
12 68 816 144 4624
7 60 420 49 3600
10 70 700 100 4900
4 32 128 16 1024
6 36 216 36 1296
8 62 496 64 3844
12 84 1008 144 7056
64 456 4004 578 28280
KOEFICIJENT KORELACIJE RANGAKOEFICIJENT KORELACIJE RANGASpearmanov koeficijent korelacije ranga mjeri stupanj povezanosti dvije varijable ranga.Uspjeh studenata na ispitu iz matematike i statistike dan je u slijedećoj tabeli: NN
dr
N
ii
s
3
1
261
Matematika Statistikaxi yi
1 55 502 40 453 60 70
4 80 605 70 606 35 457 20 408 65 60
Br. Stud.
Kendallov koeficijent korelacije ranga mjeri stupanj korelacije od tri ili više varijabli ranga.
Sedam regija rangirano je prema tri pokazatelja dostignutog stupnja razvoja: P1 nacionalni dohodak po glavi stanovnika; P2 broj liječnika na tisuću stanovnika; P3 broj visokoobrazovanih na tisuću stanovnika.
NK
rR
K
RR
NN
RRW
N
i
K
kki
K
kki
i
N
ii
1 11
2
1
2
)1(
121
P1 P2 P3
r1i r2i r3i
A 2 3 2B 4 4 3C 1 2 1D 7 7 6E 3 1 4F 5 6 7G 6 5 5
Regija
(B) Regresijska analiza
1. Model jednostavne linearne regresije
2. Ocjenjivanje nepoznatih parametara
3. Mjere disperzije i drugi analitički pokazatelji
4. Ispitivanjekvaliteta dobivenih rezultata (regresijska dijagnostika)
REGRESIJSKA ANALIZAREGRESIJSKA ANALIZAJednostavna linearna regresijaJednostavna linearna regresija
024
68
101214
161820
0 1 2 3 4 5 6 7 8 9 10
iiiiiiii xyeyyexy ˆ ˆˆ ˆ
Y
X
);( ii yx
ii xy ˆ
ii yy ˆ
)ˆ;( ii yx
minˆ 2ii yy
22 xnx
yxnxy
xy
min2 ii xy
N
i
N
i
N
iiiii
N
i
n
iii
yxxx
yxN
1 1 1
2
1 1
ii xy ˆ
Značenje parametaraZnačenje parametara
“α” – konstantni član i nema praktično značenje. Pokazuje kolika bi bila pojava Y ako je X nula“β” – regresijski koeficijent; pokazuje za koliko se u prosjeku promjeni Y ako se X poveča za jedinicu
Nezavisna varijabla X u modelu naziva se regresor, a zavisna Y regresand
Primjer 5: Ustanovite da li su pojave u slijedećoj tabeli povezane, i ako jesu izračunajte parametre regresijskog modela
02468
1012141618202224
0 1 2 3 4 5 6 7 8 9 10
xy 23ˆ Worksheet
ANALIZA VARIJANCE ANALIZA VARIJANCE A N O V AA N O V A
ii yy ˆ
yy ˆ
yy
Worksheet
Worksheet
TABELA ANALIZE VARIJANCE TABELA ANALIZE VARIJANCE A N O V AA N O V A
Source df SS MS
Regresion k
Residual n-k-1
Total n-1
22
2)(
yny
yy
2
10
2ˆ
ynxyy
yy
xyyy
yy
102
2 )ˆ(
k
yy 2ˆ
1
ˆ 2
kn
yy
1
2
n
yy
KOEFICIJENT DETERMINACIJEKOEFICIJENT DETERMINACIJE
2
2
2ˆ
yy
yyR Worksheet
NEKI NELINEARNI MODELI KOJI SE MOGU LINEARIZIRATI
1010 logloglog)log( xYyyY x
xyyyxxxY logloglog)log;log( 1001
xyy
yx
Y 1010
1)
1(
1
Worksheet
Worksheet
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,945571
R Square 0,894104
Adjusted R Square 0,8676
Standard Error 4,661627
Observations 6
ANOVA
df SS MS F Signifikance F
Regression 1 733,9103 733,9103 33,77286 0,004363
Residual 4 86,9230 21,73077
Total 5 820,8333
Coeffici
entsStandard
Error t Stat P-value Lower 95% Upper 95%
Intercept -7,38 5,753054 -1,2836 0,268596 -23,3577 8,588424
X 0,823 0,14163 5,811442 0,004363 0,429848 1,216306
Koeficijent determinacije
Koeficijent korelacije
= 86,9230 / 4
Standardna devijacija regresije