View
159
Download
9
Category
Tags:
Preview:
DESCRIPTION
Statistička kontrola kvaliteta
Citation preview
1
Regresiona i korelaciona analizaRegresiona i korelaciona analiza
2
Relacije između varijabliRelacije između varijabli
Reprezentuju neke fenomeneReprezentuju neke fenomene Matematički modeli su matematički izrazi tih fenomenaMatematički modeli su matematički izrazi tih fenomena
Gauss-Markoff Gauss-Markoff pretpostavka za linearnu regresijupretpostavka za linearnu regresiju Formula za izračunavanje koeficijenata u regresiji je Formula za izračunavanje koeficijenata u regresiji je BLUEBLUE
((BBest est LLinear inear UUnbiased nbiased EEstimators)stimators) Best LinearBest Linear – najefikasniji model sa najmanjom varijansom – najefikasniji model sa najmanjom varijansom UnbiasedUnbiased EstimatorsEstimators – očekivane vrednosti zavisne varijable – očekivane vrednosti zavisne varijable
iste ili vrlo bliske populacionim vrednostimaiste ili vrlo bliske populacionim vrednostima
3
Regresiona analizaRegresiona analiza
Regresiona analizaRegresiona analiza se koristi da: se koristi da: objasni kakav efekat ima promena nezavisne objasni kakav efekat ima promena nezavisne
varijable na zavisnu varijabluvarijable na zavisnu varijablu predvidi vrednost zavisne varijable na osnovu predvidi vrednost zavisne varijable na osnovu
najmanje jedne nezavisne varijablenajmanje jedne nezavisne varijable
Zavisna varijabla:Zavisna varijabla: varijabla koju želimo da objasnimo varijabla koju želimo da objasnimo ili predvidimoili predvidimo
Nezavisna varijabla:Nezavisna varijabla: varijabla koju koristimo da varijabla koju koristimo da objasnimo zavisnu varijabluobjasnimo zavisnu varijablu
4
Regresioni modeliRegresioni modeli
Izražavaju se jednačinom u kojoj je:Izražavaju se jednačinom u kojoj je: 1 numeri1 numeričkačka zavisnazavisna ( (odgovorodgovor) vari) varijjablablaa 1 1 ili više numeričkih ili kategoričkih nezavisnih ili više numeričkih ili kategoričkih nezavisnih
varijablivarijabli
Prosta linearna regresijaProsta linearna regresija samo jedna nezavisna varijabla xsamo jedna nezavisna varijabla x
relacija između x i y izražena je linearnom relacija između x i y izražena je linearnom funkcijomfunkcijom
5
Prost linearni regresioni modelProst linearni regresioni model
• Relacija između varijabli je linearna funkcijaRelacija između varijabli je linearna funkcija• Prava linija najbolje “fituje” podatkePrava linija najbolje “fituje” podatke
ii10i xy
y intercept (konstanta)y intercept (konstanta)
nagibnagib
slučajna greškaslučajna greška
zavisna varijabla zavisna varijabla (odgovor)(odgovor)
nezavisna varijabla nezavisna varijabla (eksplanatorna)(eksplanatorna)
6
Populacioni linearni regresioni modelPopulacioni linearni regresioni model
= = slučajna greškaslučajna greška
yy
x
i10xy x
dobijena vrednostdobijena vrednost
dobijena dobijena vrednostvrednost
ii10i xy
7
Prost linearni regresioni modelProst linearni regresioni model
ii bxay
yyii - predviđena vrednost za zapažanje - predviđena vrednost za zapažanje ii
xxii - vrednost x za zapažanje - vrednost x za zapažanje ii
a - intercept za uzorak, koristi se za procenu populacionog a - intercept za uzorak, koristi se za procenu populacionog ββ00
b - nagib za uzorak, koristi se za procenu populacionog b - nagib za uzorak, koristi se za procenu populacionog ββ11
8
Linearna jednačinaLinearna jednačina
© 1984-1994 T/Maker Co.
yyy = a + bxy = a + bx
a = y-intercepta = y-intercept
xx
promena u ypromena u y
promena u xpromena u x
b = nagibb = nagib
9
Metoda najmanjih kvadrataMetoda najmanjih kvadrata
Kako povlačimo liniju između tačaka?Kako povlačimo liniju između tačaka? Kako procenjujemo koja linija najbolje obuhvata Kako procenjujemo koja linija najbolje obuhvata
podatke?podatke?
Metoda najmanjih kvadrataMetoda najmanjih kvadrata Najbolje slaganje (“fitovanje”) znači da jeNajbolje slaganje (“fitovanje”) znači da je razlika razlika između između
stvarne vrednosti y i izračunate vrednosti ystvarne vrednosti y i izračunate vrednosti y najmanjanajmanja Iz srednje vrednosti x možemo da izračunamo srednju Iz srednje vrednosti x možemo da izračunamo srednju
vrednost yvrednost y kada x odstupa od srednje vrednosti, možemo da očekujemo kada x odstupa od srednje vrednosti, možemo da očekujemo
i da y odstupa od svoje srednje vrednostii da y odstupa od svoje srednje vrednosti x “objašnjava” odstupanje y od srednje vrednostix “objašnjava” odstupanje y od srednje vrednosti
10
Metoda najmanjih kvadrata – grafički prikazMetoda najmanjih kvadrata – grafički prikaz
24
23
22
21
n
1i
2i eeee e
Metoda najmanjih kvadrata minimizuje sumu kvadriranih razlika Metoda najmanjih kvadrata minimizuje sumu kvadriranih razlika (grešaka = e) između stvarnih i pretpostavljenih vrednosti y(grešaka = e) između stvarnih i pretpostavljenih vrednosti y
e2
yy
xx
e1 e3
e4
222 ebxay
bxay
11
Koeficijenti u jednačini praveKoeficijenti u jednačini prave
xbya
xNx
yxNxyb
xbay
22
Regresiona jednačinaRegresiona jednačina
Nagib praveNagib prave
Odsečak na y-osiOdsečak na y-osi
12
Interpretacija koeficijenataInterpretacija koeficijenata
b - nagibb - nagib
Daje promenu Daje promenu yy (kao umnožak) za 1 jedinicu povećanja (kao umnožak) za 1 jedinicu povećanja xx
PrimerPrimer:: Ako je b = 2, onda je očekivano Ako je b = 2, onda je očekivano yy dva puta dva puta veće za svaku 1 jedinicu povećanja u veće za svaku 1 jedinicu povećanja u xx
a - odsečak na y-osia - odsečak na y-osi
Prosečna vrednost y kada jeProsečna vrednost y kada je xx = 0 = 0
13
Primer 1Primer 1
tt ((CC00)) uunnooššeennjjee vvooddee
((mmLL))
2244 448800
2288 660000
2299 775500
2299 881100
3333 996600
3366 11444400
3377 11444400
14
Primer 1 – grafički prikazPrimer 1 – grafički prikaz
0
200
400
600
800
1000
1200
1400
1600
0 5 10 15 20 25 30 35 40
t
mL
15
Primer 1Primer 1
tt ((00CC)) xx
vvooddaa ((mmLL)) yy
xx22 xxyy
2244 448800 557766 1111552200
2288 660000 778844 1166880000
2299 775500 884411 2211775500
2299 881100 884411 2233449900
3333 996600 11008899 3311668800
3366 11444400 11229966 5511884400
3377 11444400 11336699 5533228800
210360xy
6796x
714,9257
6480y
857,307
216x
2
16
Primer 1Primer 1
-1528,03530,85779,5197-925,714xbya
5197,79)857,30(76796
714,925857,307210360
xNx
yxNxyb
222
y = - 1528,03 + 79,52xy = - 1528,03 + 79,52x
mL = - 1528,03 + 79,52 tmL = - 1528,03 + 79,52 t
17
Evaluacija modelaEvaluacija modela
U kojoj meri model izražava relaciju između varijabliU kojoj meri model izražava relaciju između varijabli??
Približnost “najboljem slaganju”Približnost “najboljem slaganju”
Što su tačke bliže liniji to je slaganje boljeŠto su tačke bliže liniji to je slaganje bolje
Ispitivanje veličine varijacijeIspitivanje veličine varijacije
Značajnost izračunatih parametaraZnačajnost izračunatih parametara
Rezidualna analizaRezidualna analiza
bxay
18
Mere varijacije u regresijiMere varijacije u regresiji
SSSSTT = = Ukupna varijacija (ukupna suma kvadrata)Ukupna varijacija (ukupna suma kvadrata)
mera za varijaciju vrednosti mera za varijaciju vrednosti yy oko njihove srednje oko njihove srednje vrednostivrednosti
ukupna varijacija oko regresione prave jednaka je ukupna varijacija oko regresione prave jednaka je sumi kvadrata razlika između sumi kvadrata razlika između vrednosti yvrednosti y u svakom u svakom paru i paru i srednje vrednosti ysrednje vrednosti y
odgovara ukupnoj sumi kvadrata u ANOVIodgovara ukupnoj sumi kvadrata u ANOVI
2i )y(y
19
Mere varijacije u regresijiMere varijacije u regresiji
SSSSRR = = Varijacija za koju postoji objašnjenjeVarijacija za koju postoji objašnjenje
(r(regresionegresiona suma kvadrata)a suma kvadrata)
mera za varijaciju vezanu za relaciju između mera za varijaciju vezanu za relaciju između xx i i yy
objašnjiva varijacija jednaka je sumi kvadrata razlika između svake izračunate (iz jednačine) vrednosti y i srednje vrednosti y
odgovara sumi kvadrata između grupa u ANOVIodgovara sumi kvadrata između grupa u ANOVI
2i yy
20
Mere varijacije u regresijiMere varijacije u regresiji
SSSSEE = = Varijacija za koju ne postoji objašnjenje Varijacija za koju ne postoji objašnjenje
(s(sumuma kvadrata greške)a kvadrata greške)
mera za varijaciju koja potiče od drugih faktoramera za varijaciju koja potiče od drugih faktora varijacija za koju ne postoji objašnjenjevarijacija za koju ne postoji objašnjenje Neobjašnjiva varijacija jednaka je sumi kvadrata Neobjašnjiva varijacija jednaka je sumi kvadrata
razlika između razlika između vrednosti yvrednosti y u svakom paru i u svakom paru i odgovarajuće odgovarajuće izračunateizračunate (iz jednačine) (iz jednačine) vrednosti yvrednosti y
odgovara sumi kvadrata unutar grupa u ANOVIodgovara sumi kvadrata unutar grupa u ANOVI
2i )y(y
21
Mere varijacije u regresijiMere varijacije u regresiji
X
yy
xxxii
bxay
yyii
2iT )y(ySS
2iE )y(ySS
2R yySS
y
y
22
Koeficijent determinacijeKoeficijent determinacije
2i
2
T
R2
)y(y
)yy
SK
SK
varijacijaukupna
varijacijaobjašnjivar
0 0 rr 22 11
procenat varijacije u procenat varijacije u yy koji je posledica varijacije u koji je posledica varijacije u xx
23
rr22 - primeri - primeri
r2 = 0,81 r2 = 0,77
r2 = 0,42 r2 = 0,05
xx
yy
xx
yy
xx
yy
xx
yy
24
Primer 1Primer 1
9412,0r
)yy(
)yy(r
2
2i
22
94% varijacije u 94% varijacije u yy (mL vode) potiče od varijacije u (mL vode) potiče od varijacije u xx (temperatura) (temperatura)
25
Standardna greška regresione praveStandardna greška regresione prave
Mera za odstupanje dobijene vrednosti Mera za odstupanje dobijene vrednosti yy od izračunate od izračunate (iz jednačine) vrednosti y (iz jednačine) vrednosti y
Veličina greške utiče na:Veličina greške utiče na: tačnost predviđanjatačnost predviđanja značajnost parametaraznačajnost parametara
2N
xyb-yayS
2
yx
2N
)yy(
2N
SSS
2iE
yx
26
Primer 1Primer 1
7N
210360xy
6877800y
6480y
52,79b
03,1528a
2
tt ((00CC))
xx mmLL yy
yy22 xxyy
2244 448800 223300440000 1111552200
2288 660000 336600000000 1166880000
2299 775500 556622550000 2211775500
2299 881100 665566110000 2233449900
3333 996600 992211660000 3311668800
3366 11444400 22007733660000 5511884400
3377 11444400 22007733660000 5533228800
59,101Syx
27
Testiranje nagiba bTestiranje nagiba b
Da li postoji linearna relacija između Da li postoji linearna relacija između xx i i yy ?? HipotezeHipoteze
HH00: : ββ11 = = 00 ( (nema linearne relacijenema linearne relacije) )
HH11: : ββ11 00 ( (postoji linearna relacijapostoji linearna relacija))
b
1b22
yxb S
bt
xNx
SS
HH00 se prihvata ako je t se prihvata ako je tbb < t < tαα, N-2, N-2
zaključak: b = 0 (ne postoji linearna relacija)zaključak: b = 0 (ne postoji linearna relacija)
28
Primer 1Primer 1
SSbb = 8,8787 = 8,8787 ttbb = 8, 956 = 8, 956 t t0,05; 50,05; 5 = 2,571 = 2,571 ttbb > t > t0,05; 50,05; 5
HH00 se ne prihvata se ne prihvata
Zaključak:Zaključak: postoji linearna relacija između spoljašnje postoji linearna relacija između spoljašnje temperature i zapremine vode koju čovek popijetemperature i zapremine vode koju čovek popije
29
Testiranje odsečka aTestiranje odsečka a
Testira se ako postoji linearna relacija izmedju Testira se ako postoji linearna relacija izmedju xx i i yy HipotezeHipoteze
HH00: : ββ00 = 0= 0
HH11: : ββ00 ≠≠ 0 0
aa
22
2
xy,a
S
at
)xNx(N
xSS
HH00 se prihvata ako je t se prihvata ako je taa < t < tαα, N-2, N-2
zaključak:zaključak: a = 0 (nema sistematske greške)a = 0 (nema sistematske greške)
30
Primer 1Primer 1
SSaa = 277,008 = 277,008 ttaa = 5,516 = 5,516 t t0,05; 50,05; 5 = 2,571 = 2,571 ttaa > t > t0,05; 50,05; 5
HH00 se ne prihvata se ne prihvata
Zaključak:Zaključak: odsečak na y-osi je značajno različit od 0 odsečak na y-osi je značajno različit od 0
31
Intervali pouzdanosti za regresione koeficijente Intervali pouzdanosti za regresione koeficijente
Interval pouzdanosti za odsečak Interval pouzdanosti za odsečak aa za nivo značajnosti 95%: a za nivo značajnosti 95%: a ±± t t0,05; n-20,05; n-2(S(Saa) ) za nivo značajnosti 99%: za nivo značajnosti 99%: a a ±± t t0,01; n-20,01; n-2(S(Saa))
Primer 1: 95% IP za odsečak Primer 1: 95% IP za odsečak aa a = a = –– 1528,04 t 1528,04 t0,05; 50,05; 5 = 2,571 S = 2,571 Saa = 277,008 = 277,008 ––1528,04 1528,04 ±± 2,571 (277,008) = 2,571 (277,008) = ––1528,04 1528,04 ±± 712,19 712,19 95% IP: –2240,23 do –815,8595% IP: –2240,23 do –815,85
Primer 1: 99% IP za odsečak Primer 1: 99% IP za odsečak aa a = a = ––1528,04 t1528,04 t0,01; 50,01; 5 = 4,032 S = 4,032 Saa = 277,008 = 277,008 ––1528,04 1528,04 ±± 4,032 (277,008) = 4,032 (277,008) = ––1528,04 1528,04 ±± 1116,90 1116,90 99% IP: –2644,94 do –411,1499% IP: –2644,94 do –411,14
32
Intervali pouzdanosti za regresione koeficijente Intervali pouzdanosti za regresione koeficijente
Interval pouzdanosti za nagib Interval pouzdanosti za nagib bb za nivo značajnosti 95%: b za nivo značajnosti 95%: b ±± t t0,05; n-20,05; n-2(S(Sbb)) za nivo značajnosti 99%: za nivo značajnosti 99%: b b ±± t t0,01; n-20,01; n-2 (S (Sbb))
Primer 1: 95% IP za nagib Primer 1: 95% IP za nagib bb b = 79,52 tb = 79,52 t0,05; 50,05; 5 = 2,571 S = 2,571 Sbb = 8,8903 = 8,8903 79,52 79,52 ±± 2,571 (8,8903) = 79,52 2,571 (8,8903) = 79,52 ±± 22,86 22,86 95% IP: 56,66 do 102,3895% IP: 56,66 do 102,38
Primer 1: 99% IP za nagib Primer 1: 99% IP za nagib bb b = 79,52 tb = 79,52 t0,01; 50,01; 5 = 4,032 S = 4,032 Sbb = 8,8903 = 8,8903 79,52 79,52 ±± 4,032 (8,8903) = 79,52 4,032 (8,8903) = 79,52 ±± 35,85 35,85 99% IP: 43,67 do 115,3799% IP: 43,67 do 115,37
33
Rezidualna analizaRezidualna analiza
Uslovi za regresionu analizu:Uslovi za regresionu analizu: normalna raspodela greškenormalna raspodela greške konstantna varijansa greške za sve vrednosti x konstantna varijansa greške za sve vrednosti x
(homosedastičnost)(homosedastičnost) greške su nezavisne jedna od drugegreške su nezavisne jedna od druge
Odstupanje od ovih uslova se ispituje rezidualnom Odstupanje od ovih uslova se ispituje rezidualnom analizomanalizom
Rezidualna analizaRezidualna analiza: izračunavanje razlike između : izračunavanje razlike između dobijenih vrednosti dobijenih vrednosti yy i izračunatih (iz jednačine) i izračunatih (iz jednačine) vrednosti vrednosti yy
34
Uslovi za regresionu analizuUslovi za regresionu analizu
• normalna raspodela greškenormalna raspodela greške• konstantna varijansa greške za sve vrednosti x konstantna varijansa greške za sve vrednosti x (homosedastičnost)(homosedastičnost)
35
Primer 1 - rezidualiPrimer 1 - reziduali
t0C mL dobijeni mL izračunati reziduali
24 480 380,4 99,6
28 600 698,5 -98,5
29 750 778,0 -28,0
29 810 778,0 32,0
33 960 1096,1 -136,1
36 1440 1334,7 105,3
37 1440 1414,2 25,8
36
Primer 1 - rezidualiPrimer 1 - reziduali
t Residual Plot
-150
-100
-50
0
50
100
150
0 5 10 15 20 25 30 35 40
t
Res
idua
ls
37
Rezidualna analiza za homosedastičnostRezidualna analiza za homosedastičnostre
zidu
ali
Nekonstantna varijansa Konstantna varijansa
x x
Y
x x
Y
rezi
dual
i
38
Predviđanja uz pomoć regresione analizePredviđanja uz pomoć regresione analize
Vrste predviđanjaVrste predviđanja Predviđanje jedne vrednosti (u jednoj tački)Predviđanje jedne vrednosti (u jednoj tački) Predviđanje intervalaPredviđanje intervala
Šta se predviđaŠta se predviđa Populacioni prosečni odgovorPopulacioni prosečni odgovor ( (μμyxyx) ) za datoza dato xx
Tačka na populacionoj regresionoj linijiTačka na populacionoj regresionoj liniji Individualni odgovorIndividualni odgovor ( (yy) ) za datoza dato xx
39
Primer 1 – predviđanje yPrimer 1 – predviđanje y
y = - 1528,03 + 79,52x, r = 0,970 y = - 1528,03 + 79,52x, r = 0,970
mL = - 1528,03 + 79,52 mL = - 1528,03 + 79,52 tt00CC
mL = - 1528,03 + 79,52 x mL = - 1528,03 + 79,52 x 404000CC = = 1652,81652,8
mL = - 1528,03 + 79,52 x mL = - 1528,03 + 79,52 x 202000CC= = 62,4 (??)62,4 (??)
mL = - 1528,03 + 79,52 x mL = - 1528,03 + 79,52 x 101000CC = = -732,8 (??)-732,8 (??)
Predviđanje samo za raspon vrednosti x iz kojih je Predviđanje samo za raspon vrednosti x iz kojih je izračunata regresiona jednačina!izračunata regresiona jednačina!
40
Predviđanje yPredviđanje y
22
2p
yx2n,2/)x(nx
)xx(
n
1Sty
IntervalInterval predikcije predikcije IntervalInterval pouzdanosti pouzdanosti
Za predviđanje Za predviđanje jednejedne vrednosti y za dato xvrednosti y za dato x
Za predviđanje populacione Za predviđanje populacione prosečne vrednostiprosečne vrednosti y za dato x y za dato x
Interval pouzdanostiInterval pouzdanosti za y je uži od za y je uži od intervala predikcijeintervala predikcije za y za istu za y za istu datu vrednost x, jer je manja greška u predviđanju datu vrednost x, jer je manja greška u predviđanju prosečne prosečne vrednostivrednosti od greške u predviđanju od greške u predviđanju jedne vrednostijedne vrednosti
22
2p
yx2n,2/)x(nx
)xx(
n
11Sty
41
Interval pouzdanosti za yInterval pouzdanosti za y
t - 29t - 2900C y = 778 mL (izračunato)C y = 778 mL (izračunato) 95% Interval pouzdanosti 95% Interval pouzdanosti tt0,05, 50,05, 5 = 2,571 = 2,571
mL44,885mL56,670
44,107778)857,30(76796
)857,3029(
7
159,101571,2778
2
2
mL49,946mL51,609
49,168778)857,30(76796
)857,3029(
7
159,101032,4778
2
2
t - 29t - 2900C y = 778 mL (izračunato)C y = 778 mL (izračunato) 99% Interval pouzdanosti 99% Interval pouzdanosti tt0,01, 50,01, 5 = 4,032 = 4,032
42
Interval predikcije za yInterval predikcije za y
t - 29t - 2900C y = 778 mL (izračunato)C y = 778 mL (izračunato) 95% Interval predikcije 95% Interval predikcije tt0,05, 50,05, 5 = 2,571 = 2,571
mL42,1060mL58,495
42,282778)857,30(76796
)857,3029(
7
1159,101571,2778
2
2
mL91,1220mL09,335
91,442778)857,30(76796
)857,3029(
7
1159,101032,4778
2
2
t - 29t - 2900C y = 778 mL (izračunato)C y = 778 mL (izračunato) 99% Interval predikcije 99% Interval predikcije tt0,01, 50,01, 5 = 4,032 = 4,032
43
Interval pouzdanosti vs. interval predikcijeInterval pouzdanosti vs. interval predikcije
y
x
Interval predikcije za Interval predikcije za jednojedno y, y, za datoza dato x xpp
xp
y = by = b00 + b + b11xx
x
Interval Interval pouzdanosti za pouzdanosti za prosečnoprosečno y, y, za za datodato x xpp
44
Korelacioni modeliKorelacioni modeli
Daju odgovor na pitanje “Koliko je jaka linearna relacija Daju odgovor na pitanje “Koliko je jaka linearna relacija između dve varijable”između dve varijable”?’?’
Izražavaju se koeficijentom korelacijeIzražavaju se koeficijentom korelacije Populacioni koeficijent korelacije se označava saPopulacioni koeficijent korelacije se označava sa (rho) (rho) Vrednosti se kreću od Vrednosti se kreću od -1 to +1 -1 to +1 Izražava stepen asocijacijeIzražava stepen asocijacije
Koriste se uglavnom za razumevanje relacijaKoriste se uglavnom za razumevanje relacija
45
Koeficijent korelacijeKoeficijent korelacije
Pearson Pearson – ov koeficijent korelacije– ov koeficijent korelacije::
2222 yNyxNx
yxNxy
ijedeterminac tkoeficijenr
46
Vrednosti koeficijenta korelacijeVrednosti koeficijenta korelacije
potpuna negativna potpuna negativna korelacijakorelacija
-1.0-1.0 +1.0+1.000
potpuna pozitivna potpuna pozitivna korelacijakorelacija
povećanje stepena povećanje stepena negativne korelacijenegativne korelacije
--00.5.5 ++00.5.5
nema korelacijenema korelacije
povećanje stepena povećanje stepena pozitivne korelacijepozitivne korelacije
47
Koeficijent korelacijeKoeficijent korelacije
r = 0,8r = 0,8 r = 0,4r = 0,4
r = -0,8r = -0,8 r = -0,4r = -0,4 r = 1,0r = 1,0
r = 0,0r = 0,0
48
Tumačenje veličine koeficijenata korelacijeTumačenje veličine koeficijenata korelacije
do 0,20do 0,20 neznatna korelacija, gotovo ne postoji neznatna korelacija, gotovo ne postoji povezanost između varijablipovezanost između varijabli
od 0,20 do 0,40od 0,20 do 0,40 niska korelacija, postoji mala povezanost niska korelacija, postoji mala povezanost između varijabliizmeđu varijabli
od 0,40 do 0,70od 0,40 do 0,70 umjerena korelacija, bitna povezanost između umjerena korelacija, bitna povezanost između varijablivarijabli
od 0,70 do 0,90od 0,70 do 0,90 visoka korelacija, izrazita povezanost između visoka korelacija, izrazita povezanost između varijablivarijabli
od 0,90 do 1,00od 0,90 do 1,00 veoma visoka korelacija, veoma uska veoma visoka korelacija, veoma uska povezanost između varijablipovezanost između varijabli
49
Testiranje koeficijenta korelacijeTestiranje koeficijenta korelacije
Testira se da li postoji linearna korelacija između dve Testira se da li postoji linearna korelacija između dve varijablevarijable
HHipotezeipoteze HH00: : ρρ = 0 (= 0 (nema korelacijenema korelacije) )
HH11: : ρρ 0 ( 0 (postoji korelacijapostoji korelacija))
Izraz za izračunavanjeIzraz za izračunavanje
2r1
2Nrt
HH00 se prihvata ako je t < t se prihvata ako je t < tαα, N-2, N-2
zaključak:zaključak: nema korelacijenema korelacije
50
Primer 1Primer 1
rr22 = 0,9412 = 0,9412 r = 0,9702r = 0,9702
t = 8,95t = 8,95 tt0,05; 50,05; 5 = 2,571 = 2,571 t > tt > t0,05; 50,05; 5
HH00 se ne prihvata se ne prihvata
Zaključak: postoji značajna korelacijaZaključak: postoji značajna korelacija
51
Linearna regresija u MS-Excel-uLinearna regresija u MS-Excel-u
Tools, Data Analysis, RegressionTools, Data Analysis, Regression Input Y-rangeInput Y-range: obeležiti zavisnu promenljivu: obeležiti zavisnu promenljivu Input X-rangeInput X-range: obeležiti nezavisnu promenljivu: obeležiti nezavisnu promenljivu LabelsLabels: označiti: označiti Confidence LevelConfidence Level: 95% (ili 99%): 95% (ili 99%) označiti polje označiti polje Output range Output range i postaviti kursor na polje u Worksheetu i postaviti kursor na polje u Worksheetu
gde treba da se pojavi izveštajgde treba da se pojavi izveštaj ResidualsResiduals: označiti: označiti Residuals PlotsResiduals Plots: označiti: označiti Line Fit PlotsLine Fit Plots: označiti: označiti OKOK
52
Primer 1 - u MS-Excel-uPrimer 1 - u MS-Excel-uSUMMARY OUTPUT
Regression StatisticsMultiple R 0,97014R Square 0,94118Adjusted R Square 0,92942Standard Error 101,698Observations 7
ANOVAdf SS MS F Significance F
Regression 1 827458,76 827458,76 80,005429 0,0002911Residual 5 51712,66376 10342,533Total 6 879171,4286
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept -1528,034934 277,0080568 -5,516 0,0026802 -2240,11 -815,96temp 79,5197 8,8903 8,945 0,0002911 56,67 102,37
53
Interpretacija ANOVA rezultataInterpretacija ANOVA rezultata
F test testira nultu hipotezu da regresija ne objašnjava F test testira nultu hipotezu da regresija ne objašnjava značajnu proporciju varijacije u značajnu proporciju varijacije u yy
Stepeni slobode za F-test su 1 i n-2Stepeni slobode za F-test su 1 i n-2 U ovom primeru F = 80,1 sa 1 i 5 stepena slobodeU ovom primeru F = 80,1 sa 1 i 5 stepena slobode
t-test za b=0 je identičan F-testu za rt-test za b=0 je identičan F-testu za r22 = 0 = 0 vrednost vrednost tt za b = 0 je jednaka kvadratnom korenu iz F za b = 0 je jednaka kvadratnom korenu iz F
54
Linearna regresija u SPSS-uLinearna regresija u SPSS-u
Podaci se unose u dve kolone (nezavisna i zavisna promenljiva)Podaci se unose u dve kolone (nezavisna i zavisna promenljiva) Analyze, Regression, LinearAnalyze, Regression, Linear DependentDependent : mL : mL IndependentIndependent: t: t Statistics: Statistics:
Regression coefficients: Regression coefficients: označitioznačiti Estimates i Estimates i Confidence intervalsConfidence intervals
označitioznačiti Model Fit Model Fit ContinueContinue OKOK
55
Primer 1 - u SPSS-uPrimer 1 - u SPSS-u
Variables Entered/Removedb
Ta , EnterModel1
VariablesEntered
VariablesRemoved Method
All requested variables entered.a.
Dependent Variable: MLb.
Model Summaryb
,970a ,941 ,929 101,70Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), Ta.
Dependent Variable: MLb.
56
Primer 1 - u SPSS-uPrimer 1 - u SPSS-u
ANOVAb
827458,8 1 827458,765 80,005 ,000a
51712,664 5 10342,533
879171,4 6
Regression
Residual
Total
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Ta.
Dependent Variable: MLb.
Coefficientsa
-1528,035 277,008 -5,516 ,003 -2240,096 -815,974
79,520 8,890 ,970 8,945 ,000 56,667 102,372
(Constant)
T
Model1
B Std. Error
UnstandardizedCoefficients
Beta
Standardized
Coefficients
t Sig. Lower Bound Upper Bound
95% Confidence Interval for B
Dependent Variable: MLa.
y = - 1528,03 + 79,52x, r = 0,970 y = - 1528,03 + 79,52x, r = 0,970
57
Primer 1 - u SPSS-uPrimer 1 - u SPSS-u
Residuals Statisticsa
380,44 1414,19 925,71 371,36 7
-136,11 105,33 1,14E-13 92,84 7
-1,468 1,315 ,000 1,000 7
-1,338 1,036 ,000 ,913 7
Predicted Value
Residual
Std. Predicted Value
Std. Residual
Minimum Maximum Mean Std. Deviation N
Dependent Variable: MLa.
58
Primer 1 - Grafik u SPSSPrimer 1 - Grafik u SPSS
GraphsGraphs Scatter – Simple – DefineScatter – Simple – Define Y-axis: mLY-axis: mL X-axis: tX-axis: t OKOK Kliknuti na sliku 2 puta, da se otvori Chart EditorKliknuti na sliku 2 puta, da se otvori Chart Editor U Chart Editoru otvoriti Chart – Options – označiti Fit Line: Total, U Chart Editoru otvoriti Chart – Options – označiti Fit Line: Total,
OKOK Zatvoriti Chart EditorZatvoriti Chart Editor
59
Primer 1 - Grafik u SPSSPrimer 1 - Grafik u SPSS
T
383634323028262422
ML
1600
1400
1200
1000
800
600
400
60
Primer 2 – vežba na časuPrimer 2 – vežba na času
This dataset stems from a study concerning the preservation of ascorbic acid in This dataset stems from a study concerning the preservation of ascorbic acid in vegetables during drying and storing. The amount of acid preserved is the vegetables during drying and storing. The amount of acid preserved is the response (dependent) variable, while the percentage dry matter is the response (dependent) variable, while the percentage dry matter is the explanatory (independent) variable. explanatory (independent) variable.
% suve materije
% sačuvanog vit C
% suve materije
% sačuvanog vit C
10,0 66,7 10,0 70,9
10.2 77,2 8,9 74,0
11.2 83,8 8,9 58,6
11.2 67,9 9,2 80,6
10,0 88,9 7,8 69,4
10,7 69,0 10,1 76,0
10,3 69,8 9,0 66,4
12,9 86,0 8,2 50,9
11,8 79,9 9,5 61,9
14,9 88,2 10,8 65,2
12,5 74,2 11,1 77,2
12,3 83,1 11,2 89,6
61
Primer 2 – Izveštaj u MS ExceluPrimer 2 – Izveštaj u MS Excelu
SUMMARY OUTPUT
Regression StatisticsMultiple R 0,618229R Square 0,382207Adjusted R Square0,354125Standard Error8,052384Observations 24
ANOVAdf SS MS F Significance F
Regression 1 882,5254 882,5254 13,611 0,00128Residual 22 1426,5 64,84089Total 23 2309,025
CoefficientsStandard Error t Stat P-value Lower 95%Upper 95%Lower 95,0%Upper 95,0%Intercept 33,4819 11,0983 3,0168 0,0063 10,4653 56,4984 10,46535 56,49844% suve materije 3,8458 1,0424 3,6893 0,0013 1,6839 6,0077 1,683931 6,007677
% suve materije Line Fit Plot
0
50
100
0,00 10,00 20,00
% suve materije
% sačuvanog vit C
Predicted %sačuvanog vit C
62
Primer 2 – Grafički prikazPrimer 2 – Grafički prikaz
0
10
20
30
40
50
60
70
80
90
100
0 2 4 6 8 10 12 14 16
% suve materije
% s
aču
vano
g vi
t C
% sačuvanog vit C Linear (% sačuvanog vit C)
63
RezidualiReziduali% suve materije % dobijen % izračunat Residuals
10,0 66,7 71,94 -5,24
10,2 77,2 72,71 4,49
11,2 83,8 76,55 7,25
11,2 67,9 76,55 -8,65
10,0 88,9 71,94 16,96
10,7 69 74,63 -5,63
10,3 69,8 73,09 -3,29
12,9 86 83,09 2,91
11,8 79,9 78,86 1,04
14,9 88,2 90,78 -2,58
12,5 74,2 81,55 -7,35
12,3 83,1 80,79 2,31
10,0 70,9 71,94 -1,04
8,9 74 67,71 6,29
8,9 58,6 67,71 -9,11
9,2 80,6 68,86 11,74
7,8 69,4 63,48 5,92
10,1 76 72,32 3,68
9,0 66,4 68,09 -1,69
8,2 50,9 65,02 -14,12
9,5 61,9 70,02 -8,12
10,8 65,2 75,02 -9,82
11,1 77,2 76,17 1,03
11,2 89,6 76,55 13,05
64
Primer 2 - RezidualiPrimer 2 - Reziduali
Residuals
-20
-15
-10
-5
0
5
10
15
20
0 2 4 6 8 10 12 14 16
% suve materije
65
Primena regresione analize u analiticiPrimena regresione analize u analitici
Regresiona analiza se u analitici primenjuje u sledećim Regresiona analiza se u analitici primenjuje u sledećim slučajevimaslučajevima
Za izračunavanje jednačine standardne kriveZa izračunavanje jednačine standardne krive Za procenu tačnosti metoda i poređenje metodaZa procenu tačnosti metoda i poređenje metoda Za procenu tačnosti metoda na osnovu metode Za procenu tačnosti metoda na osnovu metode
standardnog dodatka (“recovery”)standardnog dodatka (“recovery”)
66
Primena regresione analize u analiticiPrimena regresione analize u analitici
Stupnjevi u primeni regresione i korelacione analize:Stupnjevi u primeni regresione i korelacione analize:
1.1. Izračunavanje koeficijenta korelacije rIzračunavanje koeficijenta korelacije r
za standardnu krivu r za standardnu krivu r 0,99 0,99
r2 = 0,98 = 98%
za tačnost i poredjenje metoda r za tačnost i poredjenje metoda r 0,9 0,9
r2 = 0,81 = 81%
67
Primena regresione analize u analiticiPrimena regresione analize u analitici
2.2. Izračunavanje jednačine praveIzračunavanje jednačine prave Odsečak a – sistematska greškaOdsečak a – sistematska greška Nagib b – sistematska (% greška)Nagib b – sistematska (% greška)
3.3. Testiranje koeficijenataTestiranje koeficijenata Za standardnu krivu:Za standardnu krivu: testiranje odsečka a testiranje odsečka a Za poredjenje metoda:Za poredjenje metoda: testiranje odsečka a i testiranje odsečka a i
nagiba bnagiba b Za “recovery” test:Za “recovery” test: testiranje nagiba b testiranje nagiba b
68
Tačnost metode – primer 3Tačnost metode – primer 3
r = 0,99995r = 0,99995
b = 1,037b = 1,037 a = -4,221a = -4,221
SSyxyx = 1,0486 = 1,0486
69
Tačnost metode – testiranje grešakaTačnost metode – testiranje grešaka
Testiranje značajnosti odsečka a (sistematske greške)Testiranje značajnosti odsečka a (sistematske greške) HH00: a = 0: a = 0 HH11: a : a 0 0
SSaa = 0,976 t = 0,976 taa = 4,324 = 4,324
tt0,05, 40,05, 4 = 2,776 = 2,776 ttaa > t > t0,050,05
Značajnost odsečka a: Značajnost odsečka a:
Prihvata se HPrihvata se H11: a : a 0 0
Zaključak: postoji negativna sistematska greška od Zaključak: postoji negativna sistematska greška od 4,22 mmol/L4,22 mmol/L
70
Tačnost metode – testiranje grešakaTačnost metode – testiranje grešaka
Testiranje značajnosti nagiba b (proporcionalne Testiranje značajnosti nagiba b (proporcionalne greške)greške)
HH00: b = 1: b = 1 H H11: b : b 1 1
SSbb = 0,005 t = 0,005 tb b = 7,43= 7,43
tt0,05, 40,05, 4 = 2,776 = 2,776 t tbb> t> t0,050,05
Značajnost nagiba b: Značajnost nagiba b:
Prihvata se HPrihvata se H11: b : b 1 1
Zaključak: postoji procentualna greška od 3,7% Zaključak: postoji procentualna greška od 3,7%
(b =1 ,037 = 103,7%)(b =1 ,037 = 103,7%)
Recommended