52
1 第第第 误误误误误误 Serial Correlation

第七章 误差序列相关

Embed Size (px)

DESCRIPTION

第七章 误差序列相关. Serial Correlation. 本章主要内容. 第一节 误差序列相关的概念 第二节 误差序列相关 的后果 第三节 误差序列相关 的检验 第四节 误差序列相关 的 处理. 第一节 误差序列相关的概念. 在其他假设仍成立的条件下. 注意. 称为 一阶序列相关 ,或 自相关 ( autocorrelation )。这是最常见的一种序列相关问题。 自相关 往往可写成如下形式:. - PowerPoint PPT Presentation

Citation preview

Page 1: 第七章  误差序列相关

1

第七章 误差序列相关

Serial Correlation

Page 2: 第七章  误差序列相关

2

本章主要内容 第一节 误差序列相关的概念 第二节 误差序列相关的后果 第三节 误差序列相关的检验 第四节 误差序列相关的处理

Page 3: 第七章  误差序列相关

3

第一节 误差序列相关的概念

0 1 1 2 2

Cov( , )=0

对于模型 i =1, . . . , n

随机误差项互不相关的基本假设为: i j,i , j =1, . . . , n

如果对于不同的样本点,随机误差项不再是不相关的,而是存在某种相关性,则认为出现了序列相关性。

i i i k ik i

i j

y x x x

Page 4: 第七章  误差序列相关

4

在其他假设仍成立的条件下

2 2

1 1 1 1 1

12 2

1 1

2 21 1 1

2 21 1

( ) 0

( ) ( )

( ) ( )

( ) ( )

( ) ( )

T

序列相关意味着

( )

i j

n n

n

n n n n n

n n

n n n

E

E E

E NN E E

E E

E E

E E

2 2I

Page 5: 第七章  误差序列相关

5

注意

称为一阶序列相关,或自相关( autocorrelation )。这是最常见的一种序列相关问题。自相关往往可写成如下形式:

1( ) 0 如果仅存在: i =1, . . . , n-1i iE

其中:被称为自协方差系数( coefficient of autocovariance )或一阶自相关系数( first-order coefficient of autocorrelation )。

'1 1< <1 -i i i

Page 6: 第七章  误差序列相关

6

序列相关产生的原因 (1) 惯性 大多数经济时间数据都有一个明显的特点,就是

它的惯性。 GDP 、价格指数、生产、就业与失业等时间序列

都呈周期性,如周期中的复苏阶段,大多数经济序列均呈上升势,序列在每一时刻的值都高于前一时刻的值,似乎有一种内在的动力驱使这一势头继续下去,直至某些情况(如利率或课税的升高)出现才把它拖慢下来。

Page 7: 第七章  误差序列相关

7

序列相关产生的原因 ( 续 ) (2) 设定偏误:模型中遗漏了显著的变量 例如:如果对牛肉需求的正确模型应为

Yt=0+1Xt1+2Xt2+3Xt3+t

其中: Y= 牛肉需求量, X1= 牛肉价格, X2= 消费者收入, X3= 猪肉价格。

如果模型设定为:Yt= 0+1Xt1+2Xt2+vt

那么该式中的随机误差项实际上是: vt= 3X3t+t,

于是在猪肉价格影响牛肉消费量的情况下,这种模型设定的偏误往往导致随机项中有一个重要的系统性影响因素,使其呈序列相关性。

Page 8: 第七章  误差序列相关

8

序列相关产生的原因 ( 续 ) (3)设定偏误:不正确的函数形式 例如:如果边际成本模型应为: Yt= 0+1Xt+2Xt

2+t

其中: Y= 边际成本, X= 产出。 但建模时设立了如下模型: Yt= 0+1Xt+vt

因此,由于 vt= 2Xt2+t, ,包含了产出的平方

对随机项的系统性影响,随机项也呈现序列相关性。

Page 9: 第七章  误差序列相关

9

序列相关产生的原因 ( 续 ) (4) 蛛网现象 例如,农产品供给对价格的反映本身存在一

个滞后期: 供给 t= 0+1 价格 t-1+t

意味着,农民由于在年度 t 的过量生产(使该期价格下降)很可能导致在年度 t+1 时削减产量,因此不能期望随机干扰项是随机的,往往产生一种蛛网模式。

Page 10: 第七章  误差序列相关

10

序列相关产生的原因 ( 续 ) (5) “ ”数据的 编造 例如,季度数据来自月度数据的简单平均,

这种平均的计算减弱了每月数据的波动而引进了数据中的匀滑性,这种匀滑性本身就能使干扰项中出现系统性的因素,从而出现序列相关。

还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。

Page 11: 第七章  误差序列相关

11

第二节 误差序列相关的后果 1. 参数估计量非有效 2. 变量的 t 检验失去意义 3. 模型的预测失效

Page 12: 第七章  误差序列相关

12

1. 参数估计量非有效 OLS参数估计量仍然具有无偏性 OLS参数估计量不具有有效性。 OLS参数估计量仍然具有一致性。

Page 13: 第七章  误差序列相关

13

2. 变量的 t 检验失去意义 在关于变量的显著性检验中,当存在序列相

关时,参数的 OLS估计量的方差增大,标准差也增大,因此实际的 t 统计量变小,从而接受原假设 βi=0 的可能性增大, 检验就失去意义。

其它 t 检验也是如此。

Page 14: 第七章  误差序列相关

14

3. 模型的预测失效 区间预测与参数估计量的方差有关,在方差

有偏误的情况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。

Page 15: 第七章  误差序列相关

15

第三节 误差序列相关的检验 1. 残差序列图分析 2. 杜宾—瓦森检验 (DW 检验 )

Page 16: 第七章  误差序列相关

16

检验方法的基本思路 序列相关性检验方法有多种,但基本思路是相同的。 首先采用普通最小二乘法估计模型,以求得随机误

差项的“近似估计量”:

然后,通过分析这些“近似估计量”之间的相关性,以达到判断随机误差项是否具有序列相关性的目的。

ˆ( )i i i olse y y

Page 17: 第七章  误差序列相关

17

1. 残差序列图分析 由于残差项 ei 可以作为随机误差项 i 的估

计,因此如果随机误差项 i 存在序列相关,必然会由残差项 ei 反映出来,因此可利用残差项 ei 的变化图形来判断随机误差项的序列相关性。

Page 18: 第七章  误差序列相关

18

不存在序列相关

Se

i 0

ie

1ie

Page 19: 第七章  误差序列相关

19

正序列相关

0

ie

1ie

Se

i

Page 20: 第七章  误差序列相关

20

负序列相关

Se

i

ie

0 1ie

Page 21: 第七章  误差序列相关

21

2. 杜宾—瓦森检验 (DW 检验 ) DW检验是杜宾 (J.Durbin)和瓦森 (G.S.Watson)

于 1951 年提出的一种检验序列自相关的方法。 该方法的假定条件是:

(1)解释变量 X非随机; (2) 随机误差项 i 为一阶自回归形式: i = i-1+i’ (3)回归模型中不应含有滞后因变量作为解释变量,即不

应出现下列形式: Yi=0+1Xi1+kXik+Yi-1+ i (4)回归含有截距项; (5)没有缺落数据。

Page 22: 第七章  误差序列相关

22

DW检验的原理 对线性回归模型 如果误差项有一阶自回归问题,那么

其中的 , 是均值为 0 的独立同分布随机变量。

10

KK XXY 110

iii 1

i

Page 23: 第七章  误差序列相关

23

ˆ

21 1 1 1 1

2 21

1

2

11

2

i i

i i i i i i i i

i i

i i

i

n

i ii

ii

E E E E

E E

E

E

e e

e

根据 和 的性质,有

因此

Page 24: 第七章  误差序列相关

24

DW统计量

0

1

2

12

2

Durbin Watson

H : = 0

H : 0

i

i

n

i ii

ii

e eDW

e

和 假设:,即 不存在一阶自相关

,即 存在一阶自相关

并构造如下统计量:

Page 25: 第七章  误差序列相关

25

DW 统计量与 之间的关系

ˆ

2 21 1 1

2 2 2 22 2

22 2 2 1

n n n n

i i i i i ii i i i

i ii i

e e e e e eDW

e e

Page 26: 第七章  误差序列相关

26

DW统计量的分布与给定样本中的 X 值有复杂的关系,因此其精确的分布很难得到。

但是, Durbin和Watson 成功地导出了 ( 给定显著性水平 λ的 ) 临界值的下限 dλL和上限 dλU,且这些上下限只与样本的容量 n和解释变量的个数 k有关,而与解释变量 X 的取值无关。

检验步骤: ①计算该统计量的值; ②根据样本容量 n和解释变量数目 k查 DW分布表,得到临界值 dλL和 dλU ;

③按照下列准则考察计算得到的 DW值,以判断模型的自相关状态。

Page 27: 第七章  误差序列相关

27

检验误差序列自相关性— DW检验区域图

DW0 2 4Ud4 Ld4UdLd

一阶正自相关 无法判断 无一阶自相关性 无法判断 一阶负自相关

0 DW

DW

DW 4

4 DW 4

4 DW 4

l

l u

u u

u l

l

d

d d

d d

d d

d

若 , 则存在正自相关;

, 无法判断;

, 无自相关;

, 无法判断;

, 存在负自相关。

Page 28: 第七章  误差序列相关

28

可以看出,当 D.W.值在 2左右时,模型不存在一阶自相关。

如果存在完全一阶正相关,即 =1 , 则 DW 0 如果存在完全一阶负相关,即 =-1 , 则 DW 4 如果不存在一阶自相关,即 =0 , 则 DW2

ˆ

2 21 1 1

2 2 2 22 2

22 2 2 1

n n n n

i i i i i ii i i i

i ii i

e e e e e eDW

e e

Page 29: 第七章  误差序列相关

29

注意: (1)从判断准则看到,存在一个不能确定的 DW值区域,这是这种检验方法的一大缺陷。

(2)DW检验虽然只能检验一阶自相关,但在实际计量经济学问题中,一阶自相关是出现最多的一类序列相关;

(3) 经验表明,如果不存在一阶自相关,一般也不存在高阶序列相关。

所以在实际应用中,对于序列相关问题一般只进行 DW 检验。

Page 30: 第七章  误差序列相关

30

第四节 误差序列相关的处理 1. 一阶差分法 2. 广义差分法 3. 柯-奥迭代法 4. 杜宾两步法

Page 31: 第七章  误差序列相关

31

1. 一阶差分法

0 1

1

1 0 1 1 1

1 1 1 1

1

0

i i i

i

i i i

i i i

i i i i i i

Y X

Y X

Y Y X X

设线性回归模型 ,

已知 有很强的一阶正自相关性,即 ,

是期望为 的独立同分布,无自相关的随机变量。把滞后一期的观测值代入变量关系,得方程:

可得:

Page 32: 第七章  误差序列相关

32

1

1 1 1 1 1

1 1

1 1 1

1

1 1 0 1 0

1

ols

i i i

i i i i i i i

i i i i i i

i i i i i

i i i

Y Y X X

Y Y Y X X X

Y X

Y X

b b Y b X b

由于 ,因此有

令 , ,则有

因为 ,所以上式近似为

用 回归可得 的估计值 ,

这种克服序列相关的方法称为“ 一阶差

再由 可得 。

分法” 。

Page 33: 第七章  误差序列相关

33

变量的增长率与一阶差分有密切关系,用变量的增长率进行回归也能起到消除误差项强正自相关性的作用。

一阶差分模型在克服误差序列相关性方面的作用有较大的局限,只适用ρ接近 1 的一阶正自相关性,而且如果模型没有误差序列相关性、有负自相关性或只有轻微正自相关性,运用一阶差分模型反而会导致更强的误差序列相关性。

Page 34: 第七章  误差序列相关

34

2. 广义差分法0 1

1

1 0 1 1 1

1 0 0 1 1 1 1

0 1

0

i i i

i

i i i

i i i

i i i i i i

Y X

Y X

Y Y X X

设线性回归模型 ,

已知 有一阶自相关性,即

是期望为 的独立同分布,无自相关的随机变量。把滞后一期的观测值代入变量关系,得方程:

可得:

Page 35: 第七章  误差序列相关

35

*

*

* *

* *

,

1

1

1

0 1

0

1

1

1

ols

i i i

i i i

i i i

i i i

i i i

Y Y Y Y

X X X X

Y X

A

Y A X

我们称 为 的广义差分,

为 的广义差分,再根据

可得:

如果令 ,则上式变为

这种克服序列相关的方法称为“

可以广义

用 进行估计。差分法” 。

Page 36: 第七章  误差序列相关

36

应用广义差分法,必须已知不同样本点之间随机误差项的相关系数 ρ1,ρ2,…, ρi 。实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。

常用的方法有: 科 -奥 (Cochrane-Orcutt)迭代法。 杜宾 (durbin)两步法。

Page 37: 第七章  误差序列相关

37

3. 柯-奥迭代法 首先,采用 OLS法估计原模型 Yi=0+1Xi+i

得到的随机误差项的“近似估计值”,并以之作为观测值采用 OLS法估计下式 i=1 i-1+2 i-2+ +l i-l+i ’

得到, , , 1 2 l,作为随机误差项的相关系数 1 2, , , l的第一次估计值。

Page 38: 第七章  误差序列相关

38

其次,将上述 , , , 1 2 l代入广义差分模型

ililiillilii XXXYYY ’ )()1( 1111011

i l l n 1 2, , ,

并对之进行 OLS估计,得到 0

ˆ 、 1

ˆ 。

Page 39: 第七章  误差序列相关

39

再次,将 0

ˆ 、 1

ˆ 代回原模型,计算出原模型随机误

差项 i 的新的“近拟估计值”, 并以之作为模型 i i i l i l i 1 1 2 2

的样本观测值,采用 OLS 法估计该方程,得到

l ˆ,,ˆ,ˆ

21 ,作为相关系数 1 2, , , l 的第二次估计值 。

Page 40: 第七章  误差序列相关

40

类似地,可进行第三次、第四次迭代。

关于迭代的次数,可根据具体的问题来定。 一般是事先给出一个精度,当相邻两次 1 , 2 ,, l的估计值之差小于这一精度时,迭代终止。 实践中,有时只要迭代两次,就可得到较满意的结果。

Page 41: 第七章  误差序列相关

41

4. 杜宾两步法 我们直接从两变量模型的广义差分式

出发。如果我们对该式稍作调整,可得

这是一个带滞后变量的多元线性回归模型,其中 为均值为 0 的独立同分布随机变量。

1111001 iiiiii XXYY

iiiii XXYY 11110 1

i

Page 42: 第七章  误差序列相关

42

因此可直接用最小二乘法估计四个参数 、 、 和 的值。

但问题是原模型连 在内只有三个参数,因此通常会导致求解矛盾,无法解出原模型三个参数的估计值。

为此只能考虑分步解决问题。

10 1 1

Page 43: 第七章  误差序列相关

43

具体方法是只接受上述多元线性回归 的估计值 ,然后利用它对数据进行广义差分变换,再对广义差分模型

进行最小二乘估计,并根据回归结果计算原模型参数的估计 和 。

iii XAY *1

*

1ˆ0 Ab

1b

Page 44: 第七章  误差序列相关

44

案例 : 地区商品出口模型单位:万元

年份 出口Y

国内生产总值X

年份 出口Y

国内生产总值X

1967 4010 22418 1977 5628 290911968 3711 22308 1978 5736 294501969 4004 23319 1979 5946 307051970 4151 24180 1980 6501 323721971 4569 24893 1981 6549 331521972 4582 25310 1982 6705 337641973 4697 25799 1983 7104 344111974 4753 25886 1984 7609 354291975 5062 26868 1985 8100 362001976 5669 28134

某地区商品出口总值与国内生产总值的数据

Page 45: 第七章  误差序列相关

45

1 序列相关性检验 (残差序列图分析 )

-300

-200

-100

0

100

200

300

400

500

68 70 72 74 76 78 80 82 84

Y Residuals

Page 46: 第七章  误差序列相关

46

-300

-200

-100

0

100

200

300

400

500

-300 -200 -100 0 100 200 300

et-1

et

Page 47: 第七章  误差序列相关

47

1 序列相关性检验 (DW 检验 )

在 5%在显著性水平下, n=19 , k=2( 包含常数项 ) ,查表得 dL=1.18 , dU=1.40 , 由于 DW=0.9505<dL,故存在正自相关。

回归结果:

tt XY 28.083.2531ˆ

(-9.34) (30.11)

R2=0.9816, R2=0.9805 DW=0.9505-

Page 48: 第七章  误差序列相关

48

2 误差序列相关的处理 ( 一阶差分法 )

ttt XY 3185.0ˆ

(6.8098)

R2=0.4747, DW=1.8623

由于 DW>du=1.39( 注:样本容量为 18 个 ) ,已不存在自相关。

Page 49: 第七章  误差序列相关

49

2 误差序列相关的处理 (杜宾两步法 )

1)估计模型 11

*2

*11

*0 ttttt XXYY

得:11 2109.03348.05939.079.1334ˆ

tttt XXYY

(-1.86) (2.01) (3.41) (-1.53)

R 2=0.9862, R 2=0.9832, D.W.=1.6282-

Page 50: 第七章  误差序列相关

50

由于 DW>=1.39( 注:样本容量为 19-1=18 个 ) ,已不存在自相关。于是原模型估计式为:

tt XY 3083.079.3326ˆ

2) 将 =0.5939代入差分模型 ttttt XXYY )5939.0(5939.0 1

*1

*01

OLS法估计得:ttttt XXYY )5939.0(3083.001.13515939.0 11

(-5.53) (15.58)

R 2=0.9382, R 2=0.9343, DW=1.6570-

Page 51: 第七章  误差序列相关

51

2 误差序列相关的处理 (柯-奥迭代法 )

一阶广义差分的结果:

由于 DW>du=1.39( 注:样本容量为 18 个 ) ,已不存在自相关。

]1[6040.03092.072.3354ˆ ARXY tt

(-3.330) (9.417) (2.122)

R2=0.9861, R 2=0.9842, DW=1.6715-

Page 52: 第七章  误差序列相关

52

二阶广义差分的结果:

由于 DW>du=1.38( 注:样本容量为 19-2=17 个 ) ,已不存在自相关。

但由于 AR[2]前的系数的 t 值为 -0.15 ,在 5%的显著性水平下并不显著,说明随机干扰项不存在二阶序列相关性,模型中应去掉 AR[2]项。

]2[0542.0]1[6713.03025.094.3131ˆ ARARXY tt

(-2.41) (7.06) (2.07) (-0.15)

R2=0.9844, R2=0.9808, DW=1. 8411-

操作演示