14
Fakultet za trgovinu i bankarstvo “Janićije i Danica KarićSeminarski rad: Metod najmanjeg kvadrata Student: Bosiljčić Igor, 429/03 Beograd, mart 2004

Bosiljčić igor seminarski rad - metod najmanjih kvadrata

Embed Size (px)

Citation preview

Page 1: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

Fakultet za trgovinu i bankarstvo

“Janićije i Danica Karić”

Seminarski rad:

Metod najmanjeg kvadrata

Student:

Bosiljčić Igor, 429/03

Beograd, mart 2004

Page 2: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

2

Sadržaj

U Uvod …………………………………………… 2

A.1. Deterministička i stohastička veza………….. 3 A.2. Prosta linearna regresija……………………... 3 A.3. Diagram raspršenosti………………………… 3 A.4. Prost linearni regresioni model……………… 4

B.1. Metod najmanjih kvadrata……………………. 5

C.1. Primena Excel-a na primeru…………………. 9 C.2. Opšta primena LINEST funkcije…………….. 10

Л Literatura………………………………………. 14

Uvod Kako je cilj ovog seminarskog rada Metod najmanjeg kvadrata i njegova primena u Excelu, smatrao sam da se taj metod mora staviti u širi kontekst. Pogledamo li situaciju sa druge strane videćemo da je Metod najmanjeg kvadrata stovren kako bi se rešio neki problem. Ovaj metod se primenjuje u većem broju situacija, pa sam izabrao najjednostavniju i najčešću situaciju sa kojom se sreće ekonomista prilikom kvantitativne obrade podtraka. Stoga sam odlučio da ovaj metod predstavim u kontekstu proste

linearne regersije. To je razlog što sam značajniji deo ovog seminarskog rada posvetio teoretskom razjašnjenju te teme. Kao što možete videti iz sadržaja samo telo seminarskog rada se sastoji iz tri dela A, B, C. U prvom (A) delu se pojašnjava linearna regersija kao jedan od osnovnih primenitelja metoda najmanjeg kvadrata. U drugom (B) delu se objašnjava sam metod, a u trećem (C) njegova primena u Excelu.

Page 3: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

3

A.1. Deterministička i stohastička veza

Međusobne veze između pojava možemo podeliti u dve grupe: determinističke i stohastičke.

Deterministička (naziva se još i funkcionalna ili egzaktna) veza javlja se u slučaju kada jednoj vrednosti nezavisne promenljive X odgovara samo jedna, tačno određena, vrednost zavisne promenljive Y. Determinističke veze retko možemo sresti u sferi ekonomije.

Na pojave u društvu i ekonomiji deluje veliki broj faktora i specifični nepredvidljivi uticaji psihološke prirode. Zbog toga nismo u stanju da na osnovu poznavanja pojedinih vrednosti nezavisne promenljive u potpunosti predvidimo vrednost zavisne promenljive. Veze koje se ovde javljaju su slabije od determinističkih i nazivaju se stohastičnim zavisnostima. Kod stohastičkih veza jednoj vrednosti nezavisne promenljive odgovara čitav niz mogućih vrednosti zavisne promenljive.

Suština stohastičkih veza jeste da između pojedinih vrednosti nezavisne promenljive X i prosečnih vrednosti zavisne promenljive Y postoji čvrsta, odnosno funkcionalna veza.

Kod stohastične veze individualne vrednosti Y mogu pokazivati znatna odstupanja od proseka i ta se pravilnost može otkriti tek ispitivanjem velikog broja podataka.

Veze kod kojih porastu (opadanju) vrednosti nezavisne promenljive X istovremeno odgovara porast (opadanje) zavisne promenljive Y nazivamo direktnim vezama. Sa druge strane, ako porastu jedne promenljive odgovara opadanje druge radi se o inverznim vezama.

A.2. Prosta linearna regresija

Regresiona analiza je jedan od najvažnijih i najčešće korišćenih statističkih metoda

i ima veliku primenu u ekonomiji i ostalim društvenim naukama. Termin regresija prvi je upotrebio engleski naučnik Francis Galton 1885.godine. O prostoj linearnoj regresiji govorimo kada posmatramo dve pojave između kojih postoji linearna (pravolinijska) povezanost.

A.3. Diagram raspršenosti Kao prvi korak u analizi zavisnosti dve pojave uobičajeno je da se empirijske serije parova podataka prikažu grafički. Nakon toga identifikovaćemo koje obeležije predstavlja nezavisnu promenljivu X, a koje zavisnu promenljivu Y. Grafički prikaz se konstruiše u pravougaonom kordinatnom sistemu pri čemu se na apcisnu osnu nanose jedinice pojave za koju predpostavljamo da je nezavisna promenljiva X, a na ordinatnu osu jedinice zavisne promenljive Y. Takav grafički prikaz naziva se diagramom raspršenosti.

)(xfY =

Page 4: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

4

Diagram raspršenosti, kao na slici levo, pokazuje da između varijacija posmatranih pojava postoji kvantitativno slaganje. Takođe, raspored tačaka se približno grupiše u vidu prave linije što nam govori da je u pitanju linearna veza. Međutim, sve tačke se ne nalaze na samoj pravoj liniji jer bi se onda radilo o funkcionalnom slaganju, što je izuzetno redak slučaj u ekonomiji. Ukoliko su tačke više raspršene u odnosu na pravu liniju,

utoliko je i slabija međuzavisnost dve pojave, i obrnuto. U slučaju kada je raspored tačaka sasvim raspršen zaključuje se da ne postoji nikakvo kvantitativno slaganje varijacija dve tačke.

A.4. Prost linearni regersioni model

Posmatrajući diagram raspršenosti postavlja se pitanje kako ostvariti osnovni cilj regresije, tj. predvideti vrednost zavisne promenljive Y za pojedine vrednosti nezavisne promenljive X. Kada bi se empirijski rasporedi tačaka nalazili na istom pravcu, odnosno postojala funkcionalna veza, tada bi se jednostavno odredila jednačina te prave i zamenom određene vrednosti X dobila željena vrednost za Y.

U stvarnosti, međutim, preovladavaju stohastičke veze i kao posledicu imamo manja ili veća odstupanja tačaka od prave. Stoga se kao moguće rešenje nameće prilagođavanje prave koja bi ucrtane tačke najbolje reprezentovala. Potrebno je povući onu pravu liniju koja bi bila što je moguće bliže svim empirijskim tačkama. Takva prava linija naziva se linijom regresije. Naš zadatak se svodi na nalaženje koeficijenta te prave linije, što će nam omogućiti da vršimo predviđanje. Jednačina prave linije izgleda:

Prava je u potpunosti definisana sa dva koeficijenta: ß0, koji pokazuje odsečak na Y osi (odnosno vrednost Y kada je X jednako 0) i ß1 ,koji se naziva koeficijent nagiba i pokazuje tangens ugla koji zaklapa prava sa pozitivnim krakom X ose; za ovaj koeficijent još kažemo da pokazuje promenu zavisne promenljive Y kada se nezavisna promenljiva X poveća za jednu svoju jedinicu.

Sada se javlja problem. Da su nama na raspolaganju svi podaci ponašanja neke pojave, mi bi jednostavnom matematikom došli do koeficijenata ß0, ß1. Međutim, nama nisu na raspolaganju svi podaci (ili rečeno terminologiom statistike, sve vrednosti skupa), nego se moramo zadovoljiti parcijanim podacima iz uzorka. Na osnovu tih parcijalnih podataka mi nismo u mogućnosti da dođemo do egzaktnih podataka za koeficijente ß0, ß1 već moramo vršiti procenu njihovih vrednosti. U takvoj situaciji jedino što možemo da uradimo jeste da dođemo do jednačine linije regresije uzorka.

Zbog stohastičke prirode pojave znajući liniju regresije uzorka gotovo nikad nećemo moći da prognoziramo egzaktnu vrednost zavisne promenljive već samo prosečnu ili najverovatniju. Znajući da konkretna vrednost zavisne promenljive uvek odstupa od projektovane vrednosti moramo definisati to odstupanje. Takvo odstupanje predstavlja za nas slučajnu promenljivu i naziva se stohastičkim članom, poremećejem ili često slučajnom greškom. Pa prost linearni regresioni model (skupa tj.čitave pojave) glasi:

Zavisna promenljiva Y

Nezavisna promenljiva X

XY 10 ββ +=

εββ ++= xY 10

Page 5: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

5

B.1. Metod najmanjih kvadrata (Least Squares Method)

Videli smo da se prva etapa analize svodi na grafičko prikazivanje podataka. Na osnovu diagrama odabraćemo tip krive koji najviše odgovara podacima. Tek kada nam on ukaže na linearnu zavisnost dveju pojava prelazimo na drugu etapu – ocenjivanje vrednosti nepoznatih parametara ß0, ß1 na osnovu našeg uzorka. Cilj je da se na osnovu uzorka dođe do najboljih mogućih procena o veličini tih koeficijenata. Znajući te ocenjene vrednosti možemo postaviti liniju regresije u uzorku:

Sa Ŷ je označena ona vrednost Y koja se tačno nalazi na najbolje prilagoćenoj liniji regresije, pa se naziva prilagođena vrednost Y.

Između tačaka na dijagramu raspršenosti teorijski je moguće povući beskonačno mnogo pravih linija. Sve one bi se, naravno, razlikovane po koeficijentima b0 i b1. Postavlja se sledeće pitanje: Kako između empirijskih tačaka povući onu pravu liniju koja ih najbolje reprezentuje? Ta prava bi trebalo da je istovremeno što je moguće bliža svim tačkama i time bi nam dala optimalne ocene nepoznatih parametara ß0, ß1.

Kao prvo rešenje namaće se grafički metod, tj.da se vizuelno odabere ona prava koja najviše odgovara opštoj tendenciji rasporeda tačaka. Nažalost, ovaj metod ima dve krupne slabosti: potpuno je subjektivne prirode i ne daje mogućnost određivanja greške ocene. Zbog toga je u statistici predloženo više objektivnih metoda za rešavanje ovog problema. Ipak najčešće se koristi metod najmanjih kvadrata.

Metod najmanjih kvadrata se zasniva na minimiziranju odstupanja svih empirijskih tačaka od regresione linije.

Poznato nam je da će zbog stohastičkog karaktera veze empirijske tačke pokazivati odstupanja od prave. Vertikalno odstupanje (razlika) između stvarne vrednosti i prilagođene vrednsti nazivamo rezidualom. Primetite da u indeksu reziduala imamo jedno i, ono nam govori o rezidualu kog člana govorimo. Pošto imamao puno članova uzorka svaki član ima svoj rezidual.

Rezidual ei = yi – ŷ = yi – (b0+b1xi)

ii xbby 10ˆ +=

Y

(Rezidual) ei = yi - ŷ

Stvarna Vrednost

Prilagođena Vrednost

xi X

ii xbby 10ˆ +=

Page 6: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

6

Može se sagledati da će rezidual biti pozitivan ako se empirijska tačka nalazi iznad ocenjene linije, negativan ako tačka leži ispod, i biće jednak nuli ako se stvarna vrednsot poklapa sa prilagođenom. U slučaju funkcionalne veze svi reziduali bi bili jednaki nuli. Jasno je da će prava dobro reprezentovati raspored tačaka ukoliko su vrednosti reziduala relativno male. Kriterijum prilagođenosti ne može biti minimiziranje sume reziduala, jer je ona jednaka nuli pošto se u zbiru pozitivni i negativni reziduali potiru. Nameće se da kao kriterijum koristimo sumu kvadrata odstupanja. Dakle, ideja metoda najmanjih kvadrata jeste da se od svih mogućih pravih linija odabere ona koja ima najmanju sumu kvadrata vertikalnih odstupanja (reziduala).

Matematički, znači da je potrebno potražiti minimum izraza:

U gornjem izrazu nepoznate su b0 i b1 (jer su vrednosti xi i yi tačaka nakon što je

odabran uzorak poznate). Postupak nalaženja minimuma gorenavedenog izraza se sprovodi nalaženjem parcijalnih izvoda istog i to po b0 i b1 i njihovim izjednačavanjem sa nulom. Na taj način dolazimo do sistema dve jednačine sa dve nepoznate.

Nalazimo izvod po b1

Dobili smo prvu jednačinu

Ceo izraz delimo sa 2

Nalazimo izvod po b0

Dve jednačine sa dve nepoznate

Ceo izraz delimo sa 2

n je veličina uzorka

( ) ( )[ ]∑ ∑ ∑= = =

+−=−=n

i

n

i

n

i

iiiii xbbyyy1 1 1

2

10

22 ˆε

( )[ ]

( ) ( )[ ]

( )∑∑

∑∑

∑∑

==

==

==

+++−−=

+++−=

+−=

n

i

iiiiii

n

i

i

n

i

iiii

n

i

i

n

i

i

n

i

i

xbxbbbxbybyy

xbbxbbyy

xbby

1

22

110

2

010

2

1

2

1

2

1010

2

1

2

1

2

110

1

2

222

2

ε

ε

ε

( )

∑∑∑

∑∑∑

===

===

=

+=

++−=

++−−=

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

ii

n

i

iiii

bxxbxy

bxxbxy

bxxbxy

1

1

2

1

0

1

1

1

2

1

0

1

1

1

2

0

2220

222000

( )

∑∑

∑∑∑

==

===

=

+=

++−=

+++−−=

n

i

i

n

i

i

n

i

i

n

i

n

i

i

n

i

ii

xbnby

xbby

xbby

1

10

1

1

1

1

0

1

1

10

2220

0220200

Dobili smo drugu jednačinu

∑∑

∑∑∑

==

===

+=

+=

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

xbnby

xbxbxy

1

10

1

1

2

1

1

0

1

n

xby

b

xbynb

n

i

i

n

i

i

n

i

i

n

i

i

∑∑

∑∑

==

==

=

−=

1

1

10

1

1

1

0Iz druge jednačine smo izrazili b0

Page 7: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

7

2

11

2

111

2

1

0

2

11

2

2

11

2

11111

2

1

0

2

11

2

2

1111

2

11

2

1

0

2

11

2

2

1111

1

0

2

11

2

11 1

11

0

1

1

1

0

1

1

1

−⋅

⋅=

+−

⋅=

+−

−⋅

⋅=

=

⋅−

=

=

∑∑

∑∑∑∑

∑∑

∑∑∑∑∑∑∑∑

∑∑

∑∑∑∑∑∑∑

∑∑

∑∑∑∑∑

∑∑

∑∑ ∑∑∑

∑∑

==

====

==

========

==

=======

==

====

=

==

== =

==

==

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

n

i

in

i

i

n

i

i

n

i

i

n

i

i

n

i

n

i

iiin

i

i

n

i

i

n

i

i

n

i

i

xxn

xyxxyn

nb

xxn

xyxyxyxnxyn

nb

xxn

xyxyxnxxny

nb

n

xxn

xyxyxn

y

b

n

xxn

xyxyn

xy

b

n

xby

b

Dobili smo vrednost b1, koju zamenjujemo u gornji izraz da bi dobili vrednost b0

Dobili smo vrednost b0

−+=

+⋅

=

+⋅

=

∑∑∑∑∑

∑∑∑∑∑

∑∑∑∑∑

=====

====

=

===

==

2

11

2

1

111

1

2

11

2

111

1

1

2

1

11

1

1

1

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

in

i

ii

n

i

i

n

i

i

n

i

n

i

i

n

i

i

ii

xxnbxyxyn

n

xnbbxxy

xy

xbxn

xby

xy

2

11

2

1111

=

∑∑

∑∑∑

==

===

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

xxn

xyxyn

b

2

11

2

111

2

1

0

=

∑∑

∑∑∑∑

==

====

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

xxn

xyxxy

b

Page 8: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

8

Pošto smo u stanju da odredimo parametre b0 i b1, ilustrovaćemo na primeru njihovu primenu. Za pojavu koju ćemo da proučavamno uzećemo vezu između dohodka i potrošnje, u ovom konkretnom slučaju potrošnje voća. Čista logika nam govori da veza ove dve kategorije (promenljive) je direktna, jer sa rastom dohodka raste i potrošnja voća. U nastavku navodimo primer u tabeli zajedno sa određenim izračunavanjiuma neophodnim za određivanje vrednosti parametara b0 i b1.

Domaćinstvo Dohodak po članu u

104 din X

Potrošnja voća po članu u 101 kg

Y xy x2 y2

A 2 4 8 4 16 B 3 3 9 9 9 C 3 5 15 9 25 D 4 6 24 16 36 E 5 7 35 25 49 F 5 8 40 25 64 G 6 9 54 36 81 H 7 12 84 49 144 I 8 10 80 64 100 J 10 14 140 100 196

Σ 53 78 489 337 720

Konačno na kraju, dobijamo izraz ocenjene regresione prave:

6578.05333710

4895333778

3476.15333710

785348910

22

11

2

111

2

10

22

11

2

1111

=−⋅

⋅−⋅=

=

=−⋅

⋅−⋅=

=

∑∑

∑∑∑∑

∑∑

∑∑∑

==

====

==

===

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

xxn

yxxxy

b

xxn

yxyxn

b

xxbby ii 3476.16578.0ˆ10

+=+=

Page 9: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

9

C.1. Primena Excel-a na primeru

Na kraju smo dobili jednačine naše prave koja najbolje definiše pojavu. Pomoću nje možemo da predviđamo kolika će biti potrošnja voća za određeni iznos dohodka.

Možemo primetiti jednu stvar. Predpostavimo li da je naš uzorak umesto 10 imao 100 ili 1000 članova videćemo da bi proces izračunavanja tekao satima i to na nekoliko desetina stranica. Da stvar bude još gora situacije iz prakse nam govore da se bilo koje kvalitetno izučavanje neke pojave ne može se zamisliti bez većih uzoraka.

Program Excel iz Mikrosoftovog programskog paketa Office, nam nudi veoma elegantno rešenje za problem velikih tabela. Na jednostavan način i za nekoliko minuta možemo dobiti jednačinu prave, ali i njen grafički prikaz.

Uzećemo isti primer koji smo obradili ranije. Dolaženje do krajnjeg režultata

ostvarujemo u nekoliko koraka:

KORAK 1:

Nakon pokretanja programa, najpre treba pristupiti unošenju podataka.

A B C D E

1 2 4 2 3 3 3 3 5 4 4 6 5 5 7 6 5 8 7 6 9 8 7 12 9 8 10

10 10 14 11 12 13 14

KORAK 2:

Izaberimo neku slobodnu ćeliju. Recimo, C5. kliknite na tu ćeliju i ukucajte sledeći tekst:

=LINEST(B1:B10,A1:A10,TRUE,TRUE) Nakon toga selektujte ćeliju C5 i ćeliju do nje D5. Pritisnite taster F2, a zatim

CTRL+SHIFT+ENTER. Ako ste sve uradili kako treba u ćeliji C5 će se pojaviti broj 1.347594, a u ćeliji D5 0.657754.

Problem je rešen. Dobili smo i koeficijent nagiba kao i odsečak na Y osi. Koristećii Chart Wizard možemo lako ubaciti grafik naše funkcije.

Page 10: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

10

Naš primer je krajnje jednostavan, međutim to nikako ne znači da funkcija LINEST se može jedino primenjivati u takvim slučajevima. Upravo suprotno, ova funkcija nam može dati vrednosti gotovo svih parametara vezanih za model proste i višestruke linearne regresije. Važno je znati da ako je u pitanju druga vrsta veze, a ne linearna, moramo koristiti druge funkcije (to se da videti u samom imenu funkcije, LINEST= LINear ESTimate). Excel nam omogućava kompletnu statističku analizu, tako da praktično ne postoji nešto što se radi u statistici, a da se ne može na neki način olakšati Excel-om.

C.2. Opšta primena LINEST funkcije U gornjem poglavlju smo razmatrali primenu LINEST funkcije, na naš primer. Cilj je bio pokazati da se u samo dva koraka može doći do traženih parametara. Međutim, LINEST funkcija ima mnogo više mogućnosti nego što je pokazano. Počnimo najpre sa sintaksom ove funkcije:

LINEST(poznata_Y,poznata _X,Konstanta,Statistike)

Vidimo da ova funkcija ima u sebi 4 parametra. Svaki od njih ima određeno značenje i može imati unapred utvrđene vrednosti.

y = 1.3476x + 0.6578

0123456789

101112131415

0 1 2 3 4 5 6 7 8 9 10 11

Dohodak po clanu

Po

tro

šn

ja v

oc

a p

o c

lan

u

Page 11: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

11

poznata_Y predstavlja set vrednosti Y zavisne promenljive. Na radnoj strani u Excel-u ona može biti u vertikalnom ili horizontalnom nizu. Ako je niz u jednoj koloni ili redu program uzima da svaka ćelija nosi jednu vrednost Y promenljive.

poznata _X

predstavlja set vrednosti X nezavisne promenljive. Kao i Y, poznata X može biti uneta kako u koloni tako i u redu. Ako govorimo o višestrukoj linearnoj regresiji tada će postojati više setova podataka, tj. nekoliko nezavisnih promenljivih. Količina podataka koji se mogu koristiti u X i Y promenljivoj je praktično beskonačna, ali je važno da ti setovi podataka budu istih dužina, tj.ako za promenljivu X imamo, recimo, 2654 člana isto toliko moramo imati i kod promenljive Y.

Konstanta

je parametar koji je logičke prirode. On nam govori da li da Excel prilikom izračunavanja regresionog modela, oblikuje takav model gde će član b0 biti jednak 0. Ako za vrednost ovog parametra odkucamo FALSE, program predpostavlja da je b0=0. Ako izostavimo ovaj parametar ili unesemo TRUE b0 će biti računat klasično.

Statistike

je, takođe, logički parametar. Ako unesemo za njegovu vrednost FALSE, to znači da će nam Excel prikazati samo vrednost parametra b1. Ako ukucamo TRUE, to znači da od Excela zahtevamo da nam prikaže i druge parametre. Koje parametri će biti prikazani to određujemo na drugi način.

Prvo navodimo modele proste i višestruke regresije:

Koje sve parametre LINEST funkcija može sračunati? To su: b1, b0, se1, seb, r2, sey, F, df, ssreg, ssresid. se1 – greška procene parametra b1. Kako kod višestruke regresije postoji nekoliko

promenljivih X to će za svaku promenljivu Xn postojati jedan parametar bn, a za svaki parametar bn greška njegovog proceljivanja sen.

seb – greška procene parametra b0. r2 – koeficijent determinacije. Ovaj koeficijent poredi stvarne i procenjene vrednosti za Y

i pokazuje u kojoj meri su te vrednosti slične ili različite. Vrednosti ovog parametra se kreće u opsegu od 0 do 1. r2= 0 znači da nema nikakvog podudaranja između stvarnih i procenjenih vrendosti, odnosno model linearne regresije nam nije niodkakve pomoći jer nije ustanovio kvantitativno slaganje. r2=1 znači da postoji potpuno podudaranje između stvarnih i procenenih vrednosti, tj. pojava je determinističkog tipa.

011222211

01

... bxbxbxbxbxby

bxby

nnnnnn +++++=

+=

−−−−

Page 12: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

12

sey – standardna greška procene vrenosti Y. F – vrednost F statistike tj. posmatrana F vrednost df – broj stepeni slobode. ssreg – regresiona suma kvadrata. Ssresid – rezidualna suma kvadrata. Kako određujemo koji će parametri biti prikazani? Pošto Excel u sebi ima programirane sve statističke principe on čak i kada sračunava samo jedan parametar, za svoje “interne” potrebe sračunava vrednosti niza drugih parametara. Pitanje je samo koje će od tih parametara Excel prikazati. Ako ste pažljivo posmatrali naš primer videli biste da smo kao rezultat LINEST funkcije dobili dve vrednosti, a da smo selektovali 2 ćelije. Zbog čega je to? Mi formulu unosimo u jednu ćeliju i ako tražimo samo jedan parametar on će biti upisan u tu ćeliju. Međutim, ako tražimo prikazivanje nekoliko parametara oni moraju negde biti prezentirani, zato je potrebno da selektujemo i više ćelija i to posebnim redosledom.

A B C D 1 b1 b0 2 se1 seb 3 r2 Sey 4 F df 5 ssreg Ssresid 6 7 8 9

Kada smo hteli da dobijemo vrednosti dva parametra selektovali smo ćeliju gde je upisana formula i ćeliju do nje (za parametar b0). Da recimo, hoćemo vrednosti ta dva parametra, ali i greške njihove procene mi bi selektovali 4 ćelije (C5,D5,C6,D6). Kao što vidimo iz tebele, za potrebe proste linearne regresije možemo dobiti čak 10 parametara. Njihovo prikazivanje mi omogućavamo selektovanjem odgovarajućeg broja ćelija. Važno je da zapamtite raspored željeneih parametara u odnosu na parametar b1. Parametar b1 je na onom mestu gde je napisana formula. Naravno, kao što je navedeno u KORAK 2, posle selektovanja željenih ćelija pritisnite taster F2, a onda CTRL+SHIFT+ENTER.

Page 13: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

13

Ako govorimo o višestrukoj regresiji, šablon prikazivanja parametara je minimalno izmenjen.

A B C D E F G 1 bn bn-1 … b2 b1 b0 2 sen Sen-1 … se2 se1 seb 3 r2 Sey 4 F df 5 ssreg Ssresid 6 7 8 9

U zavisnosti od toga koliko nezavisnih promenljivih X postoji toliko će biti i

odgovarajućih parametara, pa morate posebno voditi računa “širini” selekcije, tj.koliko je potrebno selektovati kolona da bi se dobili svi željeni podaci.

Page 14: Bosiljčić igor   seminarski rad - metod najmanjih kvadrata

14

Literatura: 1. Dr Mileva Žižić, Dr Miodrag Lovrić, Dr Dubravka Pavličić,

Metodi Statističke Analize, Beograd 2000.