14
Dr. Szalka Éva, Ph.D. 1 Statisztika II. VI.

Statisztika II

  • Upload
    viet

  • View
    69

  • Download
    0

Embed Size (px)

DESCRIPTION

Statisztika II. VI. Regresszióanalízis. Regresszióanalízis. A regresszióanalízis során feltételezzük, hogy: y az x minden értékénél normális eloszlású, vagyis az e i mérési hibák N (0, s 2 ) normális eloszlásúak; Var( y ) = konstans, illetve y -nak vagy x -nek ismert függvénye; - PowerPoint PPT Presentation

Citation preview

Page 1: Statisztika II

Dr. Szalka Éva, Ph.D. 1

Statisztika II.

VI.

Page 2: Statisztika II

Dr. Szalka Éva, Ph.D. 2

Regresszióanalízis

Page 3: Statisztika II

Dr. Szalka Éva, Ph.D. 3

Regresszióanalízis A regresszióanalízis során feltételezzük, hogy:

• y az x minden értékénél normális eloszlású, vagyis az i mérési hibák N(0,) normális eloszlásúak;

• Var(y) = konstans, illetve y-nak vagy x-nek ismert függvénye;• a különbözõ i mérési pontokban elkövetett mérési hibák

egymástól függetlenek;• Y(x) = f(x, ...) az ismert vagy feltételezett

függvénykapcsolat alakja, ahol a függvény konstansai (paraméterei).

Page 4: Statisztika II

Dr. Szalka Éva, Ph.D. 4

Regresszióanalízis

A regressziószámítás célja:• Gazdasági, társadalmi folyamatok

– Modellként való kezelése– A jelenség statisztikai megfigyelése

• Tendenciák becslése– Hipotézisek tesztelése– A (megbízható) modell alkalmazása

• Hatásvizsgálat,• Előrejelzés

Page 5: Statisztika II

Dr. Szalka Éva, Ph.D. 5

RegresszióanalízisA regressziószámítás során feltételezzük, hogy az eredményváltozónk (y) sztochasztikus kapcsolatban áll a magyarázó

változóval , amelyet a következőképpen jelölünk:

– Y=f(x1, x2,…,xn, )• Kétváltozós estben pedig:

– Y=f(x)

Page 6: Statisztika II

Dr. Szalka Éva, Ph.D. 6

Regresszióanalízismeg kell határozni a regresszió típusát, ehhez

azonban szükséges az adott terület szakmai ismerete is. Az alábbi függvénykapcsolatokat használjuk a leggyakrabban:– lineáris regresszió: y=0+1*x– hatványkitevős (multiplikatív) regresszió: y=0*x1– exponenciális ) regresszió: y=0*1x– parabolikus regresszió: másodfokú egyenlet– hiperbolikus regresszió.– A függvény paramétereit a legkisebb négyzetek

módszere segítségével határozzuk meg, vagyis:• S=(yi-y’i)2 minimum.

Page 7: Statisztika II

Dr. Szalka Éva, Ph.D. 7

Regresszióanalízis

Lineáris összefüggés esetén a függvényünk:y=0+1*x vagy y=a+b*x

Ezt behelyettesítve S-egyenletébe a következőt kapjuk:S=(yi-0-1*x)2

A függvénynek ott van minimuma, ahol a két együttható szerinti parciális differenciahányadosa egyenlő nullával. Az egyenlet levezetéséből azt kapjuk, hogy:

xy

xnx

yxnyx

xx

yyxx

i

ii

i

ii

*

*

****

10

2221

Page 8: Statisztika II

Dr. Szalka Éva, Ph.D. 8

A lineáris függvények paramétereinek

konfidencia intervalluma

xx

xxn

x

i

i

i

1

2

2

0

*

*

2

2'

n

yy iie

Page 9: Statisztika II

Dr. Szalka Éva, Ph.D. 9

A lineáris függvények paramétereinekkonfidencia intervalluma

•Ha nem ismerjük az alapsokaság szórását, akkor a reziduumok szórását használjuk a standard hiba kiszámításához:

2

2'

1

2

22'

0

2

*

*2

xx

n

yy

xxn

x

n

yy

i

ii

i

iii

2

2'

n

yy iie

Page 10: Statisztika II

Dr. Szalka Éva, Ph.D. 10

A lineáris függvények paramétereinekkonfidencia intervalluma

• A valószínűségi intervallum pedig

12

111

02

100

*

*

t

t

Page 11: Statisztika II

Dr. Szalka Éva, Ph.D. 11

Korreláció

• A lineáris kapcsolatok szorosságának legjellemzőbb mutató száma a korrelációs együttható (r).

22

*

*

yyxx

yyxx

r

ii

ii11 r

Page 12: Statisztika II

Dr. Szalka Éva, Ph.D. 12

Hatványkitevős regresszió• y=0*x1

• Megoldásához linearizálni kell a regressziós függvényt.

• lgy=lg0+1*lgx• Vezessünk be új ismeretleneket:• lgy=Y; lgx=X; lg0=B• Így a függvényünk már lineáris:• Y=B+1*X• A regressziós együtthatók így már a tanultak

szerint számíthatók

Page 13: Statisztika II

Dr. Szalka Éva, Ph.D. 13

Regresszióanalízis • Az eredményváltozó relatív változásának fontos szerepe van a

közgazdasági elemzésekben. A relatív változást fejezi ki a rugalmassági együttható:

• Az x-magyarázóváltozó adott értékének 1%-os növekedése átlagosan milyen változást eredményez az y-változó értékében. Ez az érték természetesen minden x-értékre kiszámítható:

0

0

y

x*

dx

dyE

i

i1

y

x*E

Page 14: Statisztika II

Dr. Szalka Éva, Ph.D. 14

Választás a különböző regressziós egyenlet-típusok közül

• Ugyanarra az adatsorra kiszámolva mindhárom regressziós függvényt, felvetődik a kérdés, hogy melyik jellemzi legjobban a változók kapcsolatát. A függvények kiválasztáshoz az egyenletek illeszkedési módszerét, azaz a legkisebb eltérések-négyzetét használjuk. Az az egyenlet illeszkedik legjobban az adatokra, ahol az

• és az

• is a legkisebb, illetve ahol a kapcsolat szorosságát kifejező mutató a legnagyobb.

2ii )yy(

2ii )xx(