第五章异方差性

1

第五章

异方差性

计量经济学

2

本章讨论四个问题： ●异方差的实质和产生的原因 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救

第五章异方差性

3

第一节异方差性的概念

本节基本内容： ●异方差性的实质 ●异方差产生的原因

4

一、异方差性的实质同方差的含义同方差性：对所有的有：（ 5.1 ）因为方差是度量被解释变量的观测值围绕回归线（ 5.2 ）的分散程度，因此同方差性指的是所有观测值的分散程度相同。

1 2 2 3 3E( ) ...i i i k kiY X X X

( 1, 2,..., )i i n2Var( ) =iu σ

Y

5

设模型为

如果对于模型中随机误差项有：

则称具有异方差性。进一步，把异方差看成是由于某个解释变量的变化而引起的，则

异方差性的含义

iu1 2 2 3 3 ... 1, 2,...,i i i k ki iY X X X u i n

2Var( ) , 1,2,3,...,i iu i n

2 2Var( ) ( )i i iu f X (5.4)

(5.3)

6

图形表示

X

Y

概率密度

7

（一）模型中省略了某些重要的解释变量假设正确的计量模型是：

假如略去，而采用当被略去的与有呈同方向或反方向变化的趋势时 , 随的有规律变化会体现在（ 5.5 ）式的中。

3iX

1 2 2 3 3i i i iY X X u

3iX*

1 2 2i i iY X u

3iX 2iX

*iu（ 5.5 ）

*iu

2iX

二、产生异方差的原因

8

（二）模型的设定误差模型的设定主要包括变量的选择和模型数学形式的确定。模

型中略去了重要解释变量常常导致异方差，实际就是模型设定问题。除此而外，模型的函数形式不正确，如把变量间本来为非线性的关系设定为线性，也可能导致异方差。

（三）数据的测量误差样本数据的观测误差有可能随研究范围的扩大而增加，或随时间的推移逐步积累，也可能随着观测技术的提高而逐步减小。

3iX*iu

9

（四）截面数据中总体各单位的差异通常认为，截面数据较时间序列数据更容易产生

异方差。这是因为同一时点不同对象的差异，一般说来会大于同一对象不同时间的差异。不过，在时间序列数据发生较大变化的情况下，也可能出现比截面数据更严重的异方差。

10

第二节异方差性的后果

本节基本内容： ●对参数估计统计特性的影响 ●对参数显著性检验的影响 ●对预测的影响

11

一、对参数估计统计特性的影响

（一）参数估计的无偏性仍然成立参数估计的无偏性仅依赖于基本假定中的零均值假定（即）。所以异方差的存在对无偏性的成立没有影响。（二）参数估计的方差不再是最小的同方差假定是 OLS 估计方差最小的前提条件，所以随机误差项是异方差时，将不能再保证最小二乘估计的方差最小。

E( ) 0iu

12

二、对参数显著性检验的影响

由于异方差的影响，使得无法正确估计参数的标准误差，导致参数估计的 t 统计量的值不能正确确定，所以，如果仍用 t 统计量进行参数的显著性检验将失去意义。

13

尽管参数的 OLS 估计量仍然无偏，并且基于此的预测也是无偏的，但是由于参数估计量不是有效的，从而对 Y的预测也将不是有效的。

三、对预测的影响

14

第三节异方差性的检验

常用检验方法 :●图示检验法● Goldfeld-Quanadt 检验● White 检验● ARCH 检验

15

一、图示检验法

（一）相关图形分析方差描述的是随机变量取值的（与其均值的）离散

程度。因为被解释变量与随机误差项有相同的方差，所以利用分析与的相关图形，可以初略地看到的离散程度与之间是否有相关关系。

如果随着的增加，的离散程度为逐渐增大（或减小）的变化趋势，则认为存在递增型（或递减型）的异方差。

u

Y

X

X

YY

X

Y

16

用 1998 年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据，绘制出消费支出对纯收入的散点图 ,其中用表示农村家庭消费支出，表示家庭纯收入。1Y 1X

图形举例

17

设一元线性回归模型为：运用 OLS 法估计 , 得样本回归模型为：

由上两式得残差：

绘制出对的散点图◆如果不随而变化，则表明不存在异方差；◆如果随而变化，则表明存在异方差。

（二）残差图形分析

1 2i i iY β β X u

1 2ˆ ˆ

i iY = β + β X

ˆ-i i ie Y Y

2ie iX

iu

iuiX

iX

18

二、 Goldfeld-Quanadt检验作用：检验递增性 (或递减性 )异方差。

基本思想：将样本分为两部分，然后分别对两个样本进行回归，并计算两个子样的残差平方和所构成的比，以此为统计量来判断是否存在异方差。

（一）检验的前提条件 1 、要求检验使用的为大样本容量。 2 、除了同方差假定不成立外，其它假定均满足。

19

（二）检验的具体做法

1.排序将解释变量的取值按从小到大排序。2. 数据分组将排列在中间的约 1/4的观察值删除掉，记为，再将剩余的分为两个部分，每部分观察值的个数为。3. 提出假设

2 2 2 2 20 1 1 2H : , = 1,2,..., ; H :i nσ = σ i n σ σ ... σ

( - ) / 2n c

c

20

4.构造 F统计量分别对上述两个部分的观察值求回归模型，由此得到的两个部分的残差平方为和。为前一部分样本回归产生的残差平方和，为后一部分样本回归产生的残差平方和。它们的自由度均为，为参数的个数。

22ie

[( - ) / 2] -n c k

21ie 2

2ie21ie

k

21

在原假设成立的条件下，因和自由度均为，分布，可导出：

（ 5.13）

[( - ) / 2] -n c k2χ

2 22 2

2211

[ ]2 ( )

2 2[ ]2

i i*

ii

n-ce / - k e n-c n-cF = = ~ F -k, - kn-c ee / - k

21ie 2

2ie

22

5.判断给定显著性水平，查 F分布表得临界值

计算统计量。

如果

则拒绝原假设，接受备择假设，即模型中的随机误差存在异方差。

- -( - , - )2 2

( )n c n ck kF *F

*- -( - , - )2 2

( )n c n ck kF F

23

●要求大样本

●异方差的表现既可为递增型，也可为递减型

●检验结果与选择数据删除的个数的大小有关

●只能判断异方差是否存在，在多个解释变量的情下，对哪一个变量引起异方差的判断存在局限。

c

（三）检验的特点

24

load d:\Eviews\test\ch5-1.wf1 vector(10) m ‘存放自由度、小样残差平方和、大样残差平

方和、 F检验值和 F检验的概率值 SORT X ' 按居民收入排序 SMPL 1958 1969 '小数据样本 m(1)=10 equation smleq.LS Y C X '得 RSS1

m(2)=@ssr SMPL 1977 1988 '大数据样本 equation lrgeq.LS Y C X '得 RSS2

m(3)=@ssr m(4)=m(3)/m(2) m(5)=@fdist(m(4),m(1),m(1)) show m

戈德菲尔德—匡特检验的程序

25

程序运行结果

26

R1 10.00000R2 162899.2R3 769899.2R4 4.726231R5 0.010965R6 0.000000R7 0.000000R8 0.000000R9 0.000000R10 0.000000

小概率

解释运行结果 H0:σ2

1= σ22 H1: σ2

1≠ σ22

RSS1= 162899.2 RSS2= 769899.2 df=(31-7)/2-2=12-2=10 F=(RSS2/df)/(RSS1/df)= 4.726231 F > Fo.o5(10,10)

则随机扰动项存在异方差

27

三、White检验（一）基本思想：

不需要关于异方差的任何先验信息，只需要在大样本的情况下，将 OLS 估计后的残差平方对常数、解释变量、解释变量的平方及其交叉乘积等所构成一个辅助回归，利用辅助回归建立相应的检验统计量来判断异方差性。

28

(二 )检验的特点

要求变量的取值为大样本

不仅能够检验异方差的存在性，同时在多变量的

情况下，还能判断出是哪一个变量引起的异方差。

29

（三）检验的基本步骤：以一个二元线性回归模型为例，设模型为：

并且，设异方差与的一般关系为

其中为随机误差项。

1 2 2 3 3t t t tY = β + β X + β X +u

2 3,t tX X

2 2 21 2 2 3 3 4 2 5 3 6 2 3t t t t t t t tσ = α +α X +α X +α X +α X +α X X +v

tv

30

1.求回归估计式并计算用 OLS 估计式（ 5.14），计算残差，并求残差的平方。2.求辅助函数用残差平方作为异方差的估计，并建立的辅助回归，即

（ 5.15 ）

2 2 21 2 2 3 3 4 2 5 3 6 2 3ˆ ˆ ˆ ˆ ˆ ˆ ˆt t t t t t te = α +α X +α X +α X +α X +α X X

ˆ-t t te Y Y2te

2tσ

2 22 3 2 3 2 3t t t t t tX ,X ,X ,X ,X X

2te

2te

31

3. 计算利用求回归估计式（ 5.15 ）得到辅助回归函数的可决系数，为样本容量。

4. 提出假设

0 2 6 1H 0, H 2,,3,...,6j: = ...= = : j （ = ）不全为零

2nR n

32

5. 检验在零假设成立下，有渐进服从自由度为 5 的分布。给定显著性水平 ,查分布表得临界值，如果 , 则拒绝原假设，表明模型中随机误差存在异方差。

2nR

2χ2 (5)χ

2χ

2 2 (5)nR χ

33

（一） ARCH 过程设 ARCH 过程为为 ARCH过程的阶数 , 并且为随机误差。（二）检验的基本思想在时间序列数据中，可认为存在的异方差性为 ARCH过程，并通过检验这一过程是否成立去判断时间序列是否存在异方差。

四、 ARCH检验

2 2 20 1 1t t - p t- p tσ = + σ +...+ σ +v

tv

0 0 1,2i> , > 0 i = ,..., p

p

34

1. 提出原假设 2. 参数估计并计算对原模型作 OLS 估计，求出残差，并计算残差平方序列，以分别作为对的估计。

2 2 2-1 -, ,...,t t t pe e e

2 2 21t t - t - pσ ,σ ,...,σ

0 1 2 1H : = = ... = = 0 ; H :p j 不全为零

te

（三） ARCH 检验的基本步骤

35

3.求辅助回归

（ 5.17）

4. 检验计算辅助回归的可决系数与的乘积。在成立时，基于大样本，渐进服从分布。给定显著性水平，查分布表得临界值，如果，则拒绝原假设，表明模型中得随机误差存在异方差。

2( )n - p R0H

2 ( )χ p

2R

2χ

2 2 20 1 -1 -ˆ ˆ ˆˆ ...t t p t pe e e

2 2( ) ( )αn - p R χ p2 ( )χ p

2( )n - p R

n p

36

●变量的样本值为大样本

●数据是时间序列数据

●只能判断模型中是否存在异方差，而不能诊断出哪一个变量引起的异方差。

（四）检验的特点

37

五、 Glejser 检验（一）检验的基本思想由 OLS 法得到残差，取得绝对值，然后将对某个解释变

量回归，根据回归模型的显著性和拟合优度来判断是否存在异方差。

（二）检验的特点不仅能对异方差的存在进行判断，而且还能对异方差随

某个解释变量变化的函数形式进行诊断。该检验要求变量的观测值为大样本。

38

（三）检验的步骤 1.建立模型并求

根据样本数据建立回归模型，并求残差序列

2.寻找与的最佳函数形式

用残差绝对值对进行回归，用各种函数

形式去试，寻找最佳的函数形式。

iX

ie

ˆi i ie = Y -Y

ie X

ie

39

3.判断根据选择的函数形式作对的回归，作为的替代变量，对所选函数形式回归。用回归所得到的、、等信息判断，若参数显著不为零，即认为存在异方差性。

F

X ie 2ie

β t β

40

格莱泽 (Glejser)检验

格莱泽检验类似于帕克检验。格莱泽建议 :在从 OLS 回归取得误差项后，使用 ei 的绝对值与被认为密切相关的解释变量再做 LS 估计，并使用如右的多种函数形式。若解释变量的系数显著，就认为存在异方差。

iii vXe 10|| bb

iii vXe 10|| bb

ii

i vX

e 1|| 10 bb

i

i

i vX

e 1|| 10 bb

iii vXe 10|| bb

iii vXe 210|| bb

41

用 Eviews 作格莱泽检验

(1) LS Y C X 作回归(2) GENR E1= resid 令残差序列为 E1(3) GENR E2=ABS(E1)生成残差绝对值序列 E2(4) GENR XH=X^h 生成变量 Xh 序列 (依次分别取 h=1,2,-1,0.5 …)(5) LS E2 C XH 重复第 (4) 步

42

第四节异方差性的补救措施

主要方法 : ●模型变换法 ● 加权最小二乘法 ● 模型的对数变换

43

以一元线性回归模型为例：

经检验存在异方差，且其中是常数，是的某种函数。

1 2i i iY X u

iu2 2var( ) ( )i i iu f X

2σ ( )if X iX

一、模型变换法

44

变换模型时，用除以模型的两端得：

记

则有：

( )if X

i i i12

i i i i

Y X uβ= + β +

f(X ) f(X ) f(X ) f(X )

* * * 11; ; ;

( ) ( ) ( ) ( )i i i

i i i

i i i i

Y X uY X v

f X f X f X f X

* * *1 2i i iY X v

45

随机误差项的方差为经变换的模型的随机误差项已是同方差，常见的设定形式及对应的情况

函数形式

20 1( )ia a X

iv

2

2

var( )iu iv var( )i

iX 2iX

i iu X

2iX

2 2iX

i iu X

2 20 1( )ia a X 0 1( )i iu a a X

21var( ) var( ) var( )

( )( )i

i iii

uv u

f Xf X

ii

i

uv =

f(X )

( )if Xiv

2

46

二、加权最小二乘法以一元线性回归模型为例：经检验存在异方差，且：

其中是常数，是的某种函数。

1 2i i iY X u

2 2var( ) ( )i i iu f X 2 ( )if X iX

iu

47

（一）加权最小二乘法的原理根据残差平方和最小建立起来的 OLS 法，在同方差下，将各个样本点提供的残差一视同仁是符合情理的。各个 ei提供信息的重要程度是一致的。但在异方差下，离散程度大的 ei对应的回归直线的位置很不精确，拟合直线时理应不太重视它们提供的信息。即 Xi对应的 ei偏离大的所提供的信息贡献应打折扣，而偏离小的所提供的信息贡献则应于重视。因此采用权数对残差提供的信息的重要程度作一番校正，以提高估计精度。这就是WLS （加权最小二乘法）的思路。

48

加权最小二乘法（WLS ）的原理

以递增型为例。设权数Wi与异方差的变异趋势相反。Wi=1/2

i。Wi使异方差经受了“压缩”和“扩张”变为同方差。

X

Y

49

基本思路区别对待不同的。对较小的 , 给予较大的权数，对较大的给予较小的权数，从而使更好地反映对残差平方和的影响。 2

iσ

2ie

2ie2

ie

2iσ

50

（二）具体做法 1. 选取权数并求出加权的残差平方和通常取权数，当越小时，越大。当越大时，越小。将权数与残差平方相乘以后再求和，得到加权的残差平方和：

\

iw21 ( 1,2,..., )i iw i n

iw

2 * * 21 2( )i i i i iw e w Y X

2i

iw 2i

51

2.求使满足的根据最小二乘原理，若使得加权残差平方和最小，则：其中：

iw

2min i iw e *i

* *1 2

2 2

ˆ ˆ

( )( )ˆ( )

* *

* *i i i*

*i i

β = Y - β X

w X - X Y -Yβ =

w X - X

i i i i* *

i i

w X wYX = , Y =

w w

52

采用加权最小二乘法克服异方差 GENR W=1/X 生成权数序列w

重新设定方程 EQ1 ，单击 OPTION选项按钮

因为残差与收入的平方 xi2 项关系密切，所以采用平方项的开方的倒数 1/x 做权数。

Var(ui)=2Xi2 从中选择加权最小二

乘法，指定权数序列名称 w

53

估计选项

54

三、模型的对数变换在经济意义成立的情况下，如果对模型：

作对数变换，其变量和分别用和代替，即：

对数变换后的模型通常可以降低异方差性的影响： ◆运用对数变换能使测定变量值的尺度缩小。 ◆经过对数变换后的线性模型，其残差表示相对误差往往比绝对误差有较小的差异。注意：对变量取对数虽然能够减少异方差对模型的影响，但应注意取对数后变量的经济意义。

ln iX1 2i i iY = b +b X +u

iY iX ln iY

1 2ln lni i iY = b +b X +u

55

第五章小结1. 异方差性是指模型中随机误差项的方差不是常量，而且它的变化与解释变量的变动有关。

2. 产生异方差性的主要原因有：模型中略去的变量随解释变量的变化而呈规律性的变化、变量的设定问题、截面数据的使用，利用平均数作为样本数据等。3. 存在异方差性时对模型的 OLS 估计仍然具有无偏性，

但最小方差性不成立，从而导致参数的显著性检验失效和预测的精度降低。

56

4. 检验异方差性的方法有多种，常用的有图形法、Goldfeld-Qunandt检验、 White检验、 ARCH检验以及Glejser检验，运用这些检验方法时要注意它们的假设条件。

5. 异方差性的主要方法是加权最小二乘法，也可以用变量变换法和对数变换法。变量变换法与加权最小二乘法实际是等价的。

57

第五章结束了！

Documents

第五章 异 方 差 性

第五章异方差性