Upload
toni-kekez
View
232
Download
4
Embed Size (px)
DESCRIPTION
Regresija i korelacija
Citation preview
Regresija i korelacija
Regresija i korelacija
Neke masovne pojave su meusobno povezane i uvjetovane
Cilj istraivanja odnosa meu pojavama je utvrditi statistiku ovisnost i pokazatelje jakosti takve ovisnosti
Za to se koriste metode regresijske i korelacijske analize
Regresija = statistiki odnos meu pojavama
Korelacija = uzajamna ovisnost
Funkcionalne i statistike veze
Funkcionalna veza = odnos koji se izraava analitiki jednadbom Svakoj vrijednosti jedne pojave odgovara tono odreena vrijednost druge
pojave.
Statistika (stohastika) veza = slabija od funkcionalne Svakoj vrijednosti jedne pojava odgovara vie razliitih vrijednosti druge
pojave.
npr. Sve osobe iste visine nemaju i istu teinu
Regresijska analiza
Regresijska analiza sastoji se u primjeni metoda kojima se analitiki (jednadbom) objanjava statistika veza izmeu promatranih pojava
Istrauje se uzrono-posljedini karakter veze jedna varijabla je uzrok (nezavisna varijabla), a druga je posljedica (zavisna varijabla)
Temelji se na regresijskom modelu = jednadbi s parametrima i varijablama kojima se objanjava povezanost promatranih pojava
Ako imamo samo jednu nezavisnu varijablu = jednostavni regresijski model
Ako imamo vei broj nezavisnih varijabli = model multiple ili viestruke regresije
Za statistiku analizu potrebno je izabrati: Empirijske vrijednosti za varijable X i Y
Oblik modela, tj funkciju f(X)
Pomono sredstvo za izbor funkcije je dijagram rasipanja
Dijagram rasipanja
Dijagram rasipanja
Dijagram rasipanja
Dijagram rasipanja
Korelacija
Meuzavisnost ili povezanost varijabli
Po smjeru korelacija moe biti pozitivna ili negativna
Pozitivna = rast jedne varijable prati rast druge varijable
Negativna = rast jedne varijable prati pad druge varijable
Zadaa regresijske analize:
Pronai analitiko-matematiki oblik veze izmeu jedne ovisne ili regresand varijable i jedne ili vie neovisnih ili regresorskih varijabli.
Model jednostavne linearne regresije
Ako su u analizi prisutne samo dvije varijable, onda se radi o jednostavnoj regresiji.
Na temelju uzorka parova varijabli X i Y crta se dijagram rasipanja
Model jednostavne linearne regresije
Jednostavna linearna regresija predstavlja odnos izmeu dvije pojave i to takav da promjenu jedne pojave prati priblino linearna promjena druge pojave
= + ,
gdje je deterministika komponenta, a je sluajna pogreka.
Deterministiki dio modela glasi:
= +
Model jednostavne linearne regresije Povuemo li na dijagramu rasipanja pravac, on je oblika
= +
Svaka toka dijagrama rasipanja zadovoljava jednadbu = + +
Odnosno svaka toka Yi odstupa od linije pravca za
Model jednostavne linearne regresije
Regresijska analiza trai parametre a i b tako da pravac prolazi izmeu stvarnih toaka promatranih varijabli i da najbolje tumai vezu izmeu njih, tj. pravac mora biti takav da odstupanja budu minimalna
Parametri se ocjenjuju metodom najmanjih kvadrata
Regresijska funkcija
= +
a = oekivana vrijednost zavisne varijable kad je nezavisna varijabla jednaka 0
b = prosjena promjena zavisne varijable kad se nezavisna varijabla promijeni za jedinicu mjere
Regresijska funkcija
Moe se postaviti i suprotna ovisnost u modelu, tj. zamijeniti zavisna i nezavisna varijabla
= + +
Analiza se provodi na isti nain, osim to u metodi najmanjih kvadrata X i Y mijenjaju mjesta.
Procjena parametara modela
Imamo n vrijednosti X i Y. Model se moe tada zapisati kao:
= + + = + =
Kriterij za izbor procjene parametara metodom najmanjih kvadrata:
=1
( )2 =
Parametri modela
= =1
=1
2 2, =
Regresijska funkcija:
= +
Drugi regresijski model
Analogno, zamjenom X i Y, tj zavisne i nezavisne varijable, dobije se drugi regresijski model s parametrima
= =1
=1
2 2, =
Regresijski model:
= +
Reprezentativnost linearne regresije
Varijanca regresije aritmetika sredina kvadrata rezidualnih odstupanja
2 =
=1 ( )
2
Standardna devijacija regresije prosjeni stupanj varijacije stvarnih
vrijednosti ovisne varijable u odnosu na oekivane regresijske vrijednosti
= =1
( )2
Reprezentativnost linearne regresije
Relativni pokazatelj reprezentativnosti regresijskog modela je koeficijent varijacije regresije
=
100
Ako je koeficijent varijacije manji od 10%, model se smatra dobrim (reprezentativnim).
Reprezentativnost linearne regresije
Odstupanja protumaena modelom (SP=ST-SR)
= =0
( )2
Ukupna odstupanja
= =0
( )2
Neprotumaena odstupanja
= =0
( )2
Reprezentativnost linearne regresije
Koeficijent determinacije R2 = omjer protumaenih i ukupnih odstupanja
2 =
= 1
Model je reprezentativniji to je R2 blie 1.
Procjena koeficijenta korelacije
Najpoznatija mjera je Pearsonov koeficijent linearne korelacije (r)
Kree se u intervalu od -1 do 1
Procjena koeficijenta korelacije
Rauna se kao
= 2
Ili
= =1
VANO!
Prije donoenja zakljuka provjeriti koeficijent varijacije regresije (je li zaista rije o linearnoj funkciji)
Kod donoenja zakljuka treba tumaiti i koeficijent determinacije i koeficijent korelacije
Primjer