Koleracija i Regresija

Embed Size (px)

Citation preview

1. KORELACIJA I REGRESIJA

Re regresija dospela je u statistiku kada je 1855.godine Fransis Galton objavio publikaciju u kojoj je analizirao visinu sinova u zavisnosti od visine oeva. Zakljuak ove studije bio je da sinovi ekstremno visokih oeva nisu toliko visoki, dakle regresiraju. Promena jednog obeleja statistikog skupa esto utie na promenu drugih obeleja zbog meusobne povezanosti. Povezanost izmeu obeleja moe se razlikovati i po smeru i po jaini povezanosti. Najjaa ili najua veza izmeu obeleja je funkcionalna veza, tj. Takva veza da svakoj vrednosti jednog obeleja odgovara tano odreena vrednost drugog. Labavija veza izmeu obeleja, koja su podlona manjim ili veim odstupanjima, naziva se korelativnom (ili stohastikom) vezom.Obino se jedna sluajno promenljiva identifikuje kao nezavisna (x), a druga kao zavisno sluajno promenljiva (y).Skup statistikih metoda kojima se prouavaju uzajamne veze statistikih obeleja i pojava (smer, jaina, oblik) naziva se teorijom korelacije, a osnovni pokazatelji korelacionih veza su jednaina regresije i koeficijent korelacije.Ispitivanje zavisnosti u statistikoj analizi ima dva osnovna pravca:1) Oblik zavisnosti koji ispituje regresiona analiza2) Jainu zavisnosti koju odreuje korealicona analiza

2. REGRESIONA ANALIZA

Regresiona analiza pokazuje oblik povezanosti izmeu dve promenljive pomou regresione linije.Odnos promenljive (y) prema promenljivoj (x) moe biti razliit, i zato je prvi korak ka otkrivanju oblika povezanosti ucrtati dijagram rasturanja ili dijagram disperzije izmeu dva obeleja. Da bi smo kvantifikovali priblinu linearnu vezu izmeu te dve veliine, moemo konstruisati pravac koji najbolje opisuje podatke(slika2). Intuitivno bi to uinili tako da je priblino jednak broj taaka iznad pravca i ispod njega.

Slika .1.Slika.2. Postoji egzaktan matematiki nain kojim se prikazuje najbolje prilagoen pravac linearne veze. Odreuje se iz uslova da je zbir kvadrata vertikalnih udaljenosti taaka od od pravca najmanja metoda najmanjih kvadrata. Tako odreen pravac povezanosti izmeu dve varijable prikazuje se regresionom linijom.Regresiona linija izraava se jednainom regresije:y = a + b x,y zavisno promenljiva, x - nezavisno promenljiva, a regresiona konstanta, b koeficijent regresije.

3. KORELACIONA ANALIZA

Korelaciona analiza pokazuje stepen zavisnosti izmeu promenljivih, odnosno korelacijom se meri jaina ve utvrene povezanosti izmeu dve promenljive.Stepen intenziteta povezanosti izmeu promenljivih, koje su u linearnom odnosu meri se:1) Kovarijansom kao apsolutnom merom intenziteta korelacije i2) Koeficijentom proste lenearne korelacije, kao relativnom merom intenziteta korelacione veze.Formula za kovarijansu:

gde je n veliina uzorka, odnosno, broj koreliranih parova vrednosti.Meutim, kovarijansa kao apsolutna mera stepena povezanosti nije pogodna za procenu, pa se pristupa izraunavanju relativne mere tj. izraunava se: koeficijent proste linearne korelacije.Koeficijent proste linearne korelacije ili Pearson-ov koeficijent predstavlja kovarijansu izraenu u jedinicama standardnih devijacija obeju varijabli. Izraunava se kao kolinik izmeu kovarijanse i proizvoda standardnih devijacija jedne i druge varijable, pa je njegova formula: