28
Regresija i korelacija

Regresija i Korelacija

Embed Size (px)

DESCRIPTION

Regresija i korelacija

Citation preview

  • Regresija i korelacija

  • Regresija i korelacija

    Neke masovne pojave su meusobno povezane i uvjetovane

    Cilj istraivanja odnosa meu pojavama je utvrditi statistiku ovisnost i pokazatelje jakosti takve ovisnosti

    Za to se koriste metode regresijske i korelacijske analize

    Regresija = statistiki odnos meu pojavama

    Korelacija = uzajamna ovisnost

  • Funkcionalne i statistike veze

    Funkcionalna veza = odnos koji se izraava analitiki jednadbom Svakoj vrijednosti jedne pojave odgovara tono odreena vrijednost druge

    pojave.

    Statistika (stohastika) veza = slabija od funkcionalne Svakoj vrijednosti jedne pojava odgovara vie razliitih vrijednosti druge

    pojave.

    npr. Sve osobe iste visine nemaju i istu teinu

  • Regresijska analiza

    Regresijska analiza sastoji se u primjeni metoda kojima se analitiki (jednadbom) objanjava statistika veza izmeu promatranih pojava

    Istrauje se uzrono-posljedini karakter veze jedna varijabla je uzrok (nezavisna varijabla), a druga je posljedica (zavisna varijabla)

    Temelji se na regresijskom modelu = jednadbi s parametrima i varijablama kojima se objanjava povezanost promatranih pojava

    Ako imamo samo jednu nezavisnu varijablu = jednostavni regresijski model

    Ako imamo vei broj nezavisnih varijabli = model multiple ili viestruke regresije

  • Za statistiku analizu potrebno je izabrati: Empirijske vrijednosti za varijable X i Y

    Oblik modela, tj funkciju f(X)

    Pomono sredstvo za izbor funkcije je dijagram rasipanja

  • Dijagram rasipanja

  • Dijagram rasipanja

  • Dijagram rasipanja

  • Dijagram rasipanja

  • Korelacija

    Meuzavisnost ili povezanost varijabli

    Po smjeru korelacija moe biti pozitivna ili negativna

    Pozitivna = rast jedne varijable prati rast druge varijable

    Negativna = rast jedne varijable prati pad druge varijable

  • Zadaa regresijske analize:

    Pronai analitiko-matematiki oblik veze izmeu jedne ovisne ili regresand varijable i jedne ili vie neovisnih ili regresorskih varijabli.

  • Model jednostavne linearne regresije

    Ako su u analizi prisutne samo dvije varijable, onda se radi o jednostavnoj regresiji.

    Na temelju uzorka parova varijabli X i Y crta se dijagram rasipanja

  • Model jednostavne linearne regresije

    Jednostavna linearna regresija predstavlja odnos izmeu dvije pojave i to takav da promjenu jedne pojave prati priblino linearna promjena druge pojave

    = + ,

    gdje je deterministika komponenta, a je sluajna pogreka.

    Deterministiki dio modela glasi:

    = +

  • Model jednostavne linearne regresije Povuemo li na dijagramu rasipanja pravac, on je oblika

    = +

    Svaka toka dijagrama rasipanja zadovoljava jednadbu = + +

    Odnosno svaka toka Yi odstupa od linije pravca za

  • Model jednostavne linearne regresije

    Regresijska analiza trai parametre a i b tako da pravac prolazi izmeu stvarnih toaka promatranih varijabli i da najbolje tumai vezu izmeu njih, tj. pravac mora biti takav da odstupanja budu minimalna

    Parametri se ocjenjuju metodom najmanjih kvadrata

  • Regresijska funkcija

    = +

    a = oekivana vrijednost zavisne varijable kad je nezavisna varijabla jednaka 0

    b = prosjena promjena zavisne varijable kad se nezavisna varijabla promijeni za jedinicu mjere

  • Regresijska funkcija

    Moe se postaviti i suprotna ovisnost u modelu, tj. zamijeniti zavisna i nezavisna varijabla

    = + +

    Analiza se provodi na isti nain, osim to u metodi najmanjih kvadrata X i Y mijenjaju mjesta.

  • Procjena parametara modela

    Imamo n vrijednosti X i Y. Model se moe tada zapisati kao:

    = + + = + =

    Kriterij za izbor procjene parametara metodom najmanjih kvadrata:

    =1

    ( )2 =

  • Parametri modela

    = =1

    =1

    2 2, =

    Regresijska funkcija:

    = +

  • Drugi regresijski model

    Analogno, zamjenom X i Y, tj zavisne i nezavisne varijable, dobije se drugi regresijski model s parametrima

    = =1

    =1

    2 2, =

    Regresijski model:

    = +

  • Reprezentativnost linearne regresije

    Varijanca regresije aritmetika sredina kvadrata rezidualnih odstupanja

    2 =

    =1 ( )

    2

    Standardna devijacija regresije prosjeni stupanj varijacije stvarnih

    vrijednosti ovisne varijable u odnosu na oekivane regresijske vrijednosti

    = =1

    ( )2

  • Reprezentativnost linearne regresije

    Relativni pokazatelj reprezentativnosti regresijskog modela je koeficijent varijacije regresije

    =

    100

    Ako je koeficijent varijacije manji od 10%, model se smatra dobrim (reprezentativnim).

  • Reprezentativnost linearne regresije

    Odstupanja protumaena modelom (SP=ST-SR)

    = =0

    ( )2

    Ukupna odstupanja

    = =0

    ( )2

    Neprotumaena odstupanja

    = =0

    ( )2

  • Reprezentativnost linearne regresije

    Koeficijent determinacije R2 = omjer protumaenih i ukupnih odstupanja

    2 =

    = 1

    Model je reprezentativniji to je R2 blie 1.

  • Procjena koeficijenta korelacije

    Najpoznatija mjera je Pearsonov koeficijent linearne korelacije (r)

    Kree se u intervalu od -1 do 1

  • Procjena koeficijenta korelacije

    Rauna se kao

    = 2

    Ili

    = =1

  • VANO!

    Prije donoenja zakljuka provjeriti koeficijent varijacije regresije (je li zaista rije o linearnoj funkciji)

    Kod donoenja zakljuka treba tumaiti i koeficijent determinacije i koeficijent korelacije

  • Primjer