Upload
viet
View
69
Download
0
Embed Size (px)
DESCRIPTION
Statisztika II. VI. Regresszióanalízis. Regresszióanalízis. A regresszióanalízis során feltételezzük, hogy: y az x minden értékénél normális eloszlású, vagyis az e i mérési hibák N (0, s 2 ) normális eloszlásúak; Var( y ) = konstans, illetve y -nak vagy x -nek ismert függvénye; - PowerPoint PPT Presentation
Citation preview
Dr. Szalka Éva, Ph.D. 1
Statisztika II.
VI.
Dr. Szalka Éva, Ph.D. 2
Regresszióanalízis
Dr. Szalka Éva, Ph.D. 3
Regresszióanalízis A regresszióanalízis során feltételezzük, hogy:
• y az x minden értékénél normális eloszlású, vagyis az i mérési hibák N(0,) normális eloszlásúak;
• Var(y) = konstans, illetve y-nak vagy x-nek ismert függvénye;• a különbözõ i mérési pontokban elkövetett mérési hibák
egymástól függetlenek;• Y(x) = f(x, ...) az ismert vagy feltételezett
függvénykapcsolat alakja, ahol a függvény konstansai (paraméterei).
Dr. Szalka Éva, Ph.D. 4
Regresszióanalízis
A regressziószámítás célja:• Gazdasági, társadalmi folyamatok
– Modellként való kezelése– A jelenség statisztikai megfigyelése
• Tendenciák becslése– Hipotézisek tesztelése– A (megbízható) modell alkalmazása
• Hatásvizsgálat,• Előrejelzés
Dr. Szalka Éva, Ph.D. 5
RegresszióanalízisA regressziószámítás során feltételezzük, hogy az eredményváltozónk (y) sztochasztikus kapcsolatban áll a magyarázó
változóval , amelyet a következőképpen jelölünk:
– Y=f(x1, x2,…,xn, )• Kétváltozós estben pedig:
– Y=f(x)
Dr. Szalka Éva, Ph.D. 6
Regresszióanalízismeg kell határozni a regresszió típusát, ehhez
azonban szükséges az adott terület szakmai ismerete is. Az alábbi függvénykapcsolatokat használjuk a leggyakrabban:– lineáris regresszió: y=0+1*x– hatványkitevős (multiplikatív) regresszió: y=0*x1– exponenciális ) regresszió: y=0*1x– parabolikus regresszió: másodfokú egyenlet– hiperbolikus regresszió.– A függvény paramétereit a legkisebb négyzetek
módszere segítségével határozzuk meg, vagyis:• S=(yi-y’i)2 minimum.
Dr. Szalka Éva, Ph.D. 7
Regresszióanalízis
Lineáris összefüggés esetén a függvényünk:y=0+1*x vagy y=a+b*x
Ezt behelyettesítve S-egyenletébe a következőt kapjuk:S=(yi-0-1*x)2
A függvénynek ott van minimuma, ahol a két együttható szerinti parciális differenciahányadosa egyenlő nullával. Az egyenlet levezetéséből azt kapjuk, hogy:
xy
xnx
yxnyx
xx
yyxx
i
ii
i
ii
*
*
****
10
2221
Dr. Szalka Éva, Ph.D. 8
A lineáris függvények paramétereinek
konfidencia intervalluma
xx
xxn
x
i
i
i
1
2
2
0
*
*
2
2'
n
yy iie
Dr. Szalka Éva, Ph.D. 9
A lineáris függvények paramétereinekkonfidencia intervalluma
•Ha nem ismerjük az alapsokaság szórását, akkor a reziduumok szórását használjuk a standard hiba kiszámításához:
2
2'
1
2
22'
0
2
*
*2
xx
n
yy
xxn
x
n
yy
i
ii
i
iii
2
2'
n
yy iie
Dr. Szalka Éva, Ph.D. 10
A lineáris függvények paramétereinekkonfidencia intervalluma
• A valószínűségi intervallum pedig
12
111
02
100
*
*
t
t
Dr. Szalka Éva, Ph.D. 11
Korreláció
• A lineáris kapcsolatok szorosságának legjellemzőbb mutató száma a korrelációs együttható (r).
22
*
*
yyxx
yyxx
r
ii
ii11 r
Dr. Szalka Éva, Ph.D. 12
Hatványkitevős regresszió• y=0*x1
• Megoldásához linearizálni kell a regressziós függvényt.
• lgy=lg0+1*lgx• Vezessünk be új ismeretleneket:• lgy=Y; lgx=X; lg0=B• Így a függvényünk már lineáris:• Y=B+1*X• A regressziós együtthatók így már a tanultak
szerint számíthatók
Dr. Szalka Éva, Ph.D. 13
Regresszióanalízis • Az eredményváltozó relatív változásának fontos szerepe van a
közgazdasági elemzésekben. A relatív változást fejezi ki a rugalmassági együttható:
• Az x-magyarázóváltozó adott értékének 1%-os növekedése átlagosan milyen változást eredményez az y-változó értékében. Ez az érték természetesen minden x-értékre kiszámítható:
0
0
y
x*
dx
dyE
i
i1
y
x*E
Dr. Szalka Éva, Ph.D. 14
Választás a különböző regressziós egyenlet-típusok közül
• Ugyanarra az adatsorra kiszámolva mindhárom regressziós függvényt, felvetődik a kérdés, hogy melyik jellemzi legjobban a változók kapcsolatát. A függvények kiválasztáshoz az egyenletek illeszkedési módszerét, azaz a legkisebb eltérések-négyzetét használjuk. Az az egyenlet illeszkedik legjobban az adatokra, ahol az
• és az
• is a legkisebb, illetve ahol a kapcsolat szorosságát kifejező mutató a legnagyobb.
2ii )yy(
2ii )xx(