Statisztika II

Dr. Szalka Éva, Ph.D. 1

Statisztika II.

VI.


Regresszióanalízis


Regresszióanalízis A regresszióanalízis során feltételezzük, hogy:

• y az x minden értékénél normális eloszlású, vagyis az i mérési hibák N(0,) normális eloszlásúak;

• Var(y) = konstans, illetve y-nak vagy x-nek ismert függvénye;• a különbözõ i mérési pontokban elkövetett mérési hibák

egymástól függetlenek;• Y(x) = f(x, ...) az ismert vagy feltételezett

függvénykapcsolat alakja, ahol a függvény konstansai (paraméterei).



A regressziószámítás célja:• Gazdasági, társadalmi folyamatok

– Modellként való kezelése– A jelenség statisztikai megfigyelése

• Tendenciák becslése– Hipotézisek tesztelése– A (megbízható) modell alkalmazása

• Hatásvizsgálat,• Előrejelzés


RegresszióanalízisA regressziószámítás során feltételezzük, hogy az eredményváltozónk (y) sztochasztikus kapcsolatban áll a magyarázó

változóval , amelyet a következőképpen jelölünk:

– Y=f(x1, x2,…,xn, )• Kétváltozós estben pedig:

– Y=f(x)


Regresszióanalízismeg kell határozni a regresszió típusát, ehhez

azonban szükséges az adott terület szakmai ismerete is. Az alábbi függvénykapcsolatokat használjuk a leggyakrabban:– lineáris regresszió: y=0+1*x– hatványkitevős (multiplikatív) regresszió: y=0*x1– exponenciális ) regresszió: y=0*1x– parabolikus regresszió: másodfokú egyenlet– hiperbolikus regresszió.– A függvény paramétereit a legkisebb négyzetek

módszere segítségével határozzuk meg, vagyis:• S=(yi-y’i)2 minimum.



Lineáris összefüggés esetén a függvényünk:y=0+1*x vagy y=a+b*x

Ezt behelyettesítve S-egyenletébe a következőt kapjuk:S=(yi-0-1*x)2

A függvénynek ott van minimuma, ahol a két együttható szerinti parciális differenciahányadosa egyenlő nullával. Az egyenlet levezetéséből azt kapjuk, hogy:

xy

xnx

yxnyx

xx

yyxx

i

ii

i

ii

*

*

****

10

2221


A lineáris függvények paramétereinek

konfidencia intervalluma

xx

xxn

x

i

i

i

1

2

2

0

*

*

2

2'

n

yy iie


A lineáris függvények paramétereinekkonfidencia intervalluma

•Ha nem ismerjük az alapsokaság szórását, akkor a reziduumok szórását használjuk a standard hiba kiszámításához:

2

2'

1

2

22'

0

2

*

*2

xx

n

yy

xxn

x

n

yy

i

ii

i

iii

2

2'

n

yy iie


A lineáris függvények paramétereinekkonfidencia intervalluma

• A valószínűségi intervallum pedig

12

111

02

100

*

*

t

t


Korreláció

• A lineáris kapcsolatok szorosságának legjellemzőbb mutató száma a korrelációs együttható (r).

22

*

*

yyxx

yyxx

r

ii

ii11 r


Hatványkitevős regresszió• y=0*x1

• Megoldásához linearizálni kell a regressziós függvényt.

• lgy=lg0+1*lgx• Vezessünk be új ismeretleneket:• lgy=Y; lgx=X; lg0=B• Így a függvényünk már lineáris:• Y=B+1*X• A regressziós együtthatók így már a tanultak

szerint számíthatók


Regresszióanalízis • Az eredményváltozó relatív változásának fontos szerepe van a

közgazdasági elemzésekben. A relatív változást fejezi ki a rugalmassági együttható:

• Az x-magyarázóváltozó adott értékének 1%-os növekedése átlagosan milyen változást eredményez az y-változó értékében. Ez az érték természetesen minden x-értékre kiszámítható:

0

0

y

x*

dx

dyE

i

i1

y

x*E


Választás a különböző regressziós egyenlet-típusok közül

• Ugyanarra az adatsorra kiszámolva mindhárom regressziós függvényt, felvetődik a kérdés, hogy melyik jellemzi legjobban a változók kapcsolatát. A függvények kiválasztáshoz az egyenletek illeszkedési módszerét, azaz a legkisebb eltérések-négyzetét használjuk. Az az egyenlet illeszkedik legjobban az adatokra, ahol az

• és az

• is a legkisebb, illetve ahol a kapcsolat szorosságát kifejező mutató a legnagyobb.

2ii )yy(

2ii )xx(

Documents

Statisztika II