第二章

第二章

多元线性回归

§2.1多元线性回归模型

为了研究 y与 1, , tx x 之间的关系，首先必须收集n组独立

观测数据,

),,,( 1 iiti yxx ， ni ,,2,1

并假定它们之间有如下关系式：

0 1 12

1,2, ,

(0, )i i t it i

i

y x x i n

N

各相互独立且同分布服从

为了方便起见，多元回归分析常采用矩阵形式来表示，并通过矩阵的性质来研究参数及其他性质。记:

ny

y

y

Y2

1

t

1

0

nt

t

t

n x

x

x

x

x

x

Y 2

1

1

21

11

1

1

1

n

2

1

则模型可表示为

),0(~ 2nIN

XY

称Y 为随机变量的观测向量，为未知参数向量，X 为结

构矩阵，为随机误差向量， nI 为单位矩阵。显然，由假

设可知：

),(~ 2nIXNY

§2.2 参数的最小二乘估计和一元线性回归一样，仍采用最小二乘法去估计参数

t ,,, 10 。令：

20 1 1

1

( ) ( )

( ) '( )

n

i i t iti

Q y x x

Y X Y X

则各的 LS估计，满足

ˆ( )Q =min ( ) min( ) '( )Q Y X Y X

根据微积分原理，

ˆˆ| ' ' ( ' ' ) 0

QX Y X Y X X X X

整理可得正规方程组：

ˆ' 'X X X Y

当1)( XX 存在时，的最小二乘估计为：

YXXX 1)(

为了方便,我们定义:

XXA 为正规方程组的系数矩阵，为 )1( t 阶方阵；

YXB 为正规方程的常数项矩阵，为 1t 维向量矩阵；

11 )( XXAC 为相关矩阵，为 )1( t 阶方阵。

例 2. 1 用矩阵形式写出如下一元线性回归模型：

),0(~..~ 210

Ndii

xy

i

iii ni ,,2,1

并用矩阵形式求出 10 , 的最小二乘估计。

解：记：

ny

y

y

Y2

1

1

0

nx

x

x

X2

1

1

1

1

n

2

1

则可记为 :

),0(~ 2nIN

XY

,并且有：

XXA

2ii

i

xx

xn YXB

ii

i

yx

y

1AC

nxn

xnx

nlnxn

xnx

xnxni

xx

i

i

22

22

1

)(

1

故：

CB

xxxyii

i

xx ll

xy

yx

yn

nxn

xnx

nl /

ˆ1 12

例 2 . 2 下面的模型称为 t 元中心化线性回归模型：

0 1 1 12

( ) ( )

~ ( 0 , )i i t i t t i

i

y x x x x

i i d N

各

ni ,,2,1

写出模型相应的矩阵 , , , ,X Y A B C ，并求出模型参数的最小二

乘估计。

记：

ny

y

y

Y2

1

t

1

0

tnt

tt

tt

n xx

xx

xx

xx

xx

xx

X 2

1

11

121

111

1

1

1

n

2

1

则模型可写为

),0(~ 2nIN

XY

XXA

ttt

t

ll

ll

n

1

111

0

0

00

，

其中： jkkj ll

n

ikikjij xxxx

1

))(( , tkj ,,2,1, 。

YXB

ty

y

l

l

yn

1 ，

其中： jyl

n

iijij yyxx

1

))(( , tj ,,2,1 。

记： L

ttt

t

t

ll

lll

lll

......

........

........

......

.

1

22221

11211

1L

tttt

t

t

lll

lll

lll

..

.....

.....

..

..

21

22221

11211

则

11)( ACXX

10

01

Ln

ty

y

y

ty

y

t l

l

l

L

y

l

l

yn

Ln

2

1

11

1

1

0

0

01

ˆ

ˆˆ

ˆ

即： y0 ，

ty

y

y

tl

l

l

L2

1

12

1

ˆ

ˆ

ˆ

由此可得 t ˆ,,ˆ1 为下列方程的解：

11 1 1 1

21 1 2 2

1

10 1

ˆ ˆ

ˆ ˆ

ˆ ˆ

ˆ ˆ ˆ

t t y

t t y

tt tt t ty

tt

l l l

l l l

l l l

y x x

例子，见 p38-41

参数估计的性质

记： HYYXXXXXY ˆ)(ˆˆ 1

为拟合向量。其中： XXXXH 1)( 为方阵，其元素记为

}{ ijh ，显然，H是对称并且幂等矩阵。

ˆ ( )e Y Y I H Y 为残差向量。

ˆ ˆ( ) ( ) ( )SSE Y Y Y Y Y I H Y 为残差平方和。

下面几个性质除性质 6 之外，对随机误差假定

0E ， 2nVar I 。

性质一是的线性无偏估计，且 2 1ˆ ( )Var X X

证明：因 YXXX 1)( 是Y 的线性函数，故为线性估计。

又： XXXXEYXXXE 11 )()(ˆ ，即：为的

无偏估计。

1 2 1ˆ ( ) ( ) ( )Var X X X DYX X X X X

性质二 0Ee , 2 (1 )Vare H

证明：由于 YHe )1( ,故有：

0)1()1( XHEYHEe

2 2(1 ) (1 ) (1 ) (1 )Vare H VarY H H H

从上述性质可知，残差向量的各分量之间一般也是相关的。

并且当为正态时， ))1(,0(~ 2HNe

性质三 0)ˆ,( eCov

证明：

))(,)1(()ˆ,( 1 YXXXYHCoveCov

XXXDYH 1)()1( 0

这一性质说明残差向量 e与的最小二乘估计之间不相

关。在为正态分布时，由于e与均服从正态分布，故e与

独

立。并由此可知SSE与独立。

A是 k k 的方阵，那么，矩阵迹1

[ ]k

iii

tr A a

[ ] [ ]tr aA atr A ；

[ ] [ ]tr A tr A

[ ] [ ] [ ]tr A B tr A tr B

[ ] [ ]tr AB tr BA

性质四 2( ) ( 1)E SSE n t

证明：利用矩阵迹的性质及 ( ) 0I H X 可知

( ) ( ( ) )E SSE E Y I H Y

( ) ( )( )E Y X I H Y X

= [( )( )( ) ]Etr I H Y X Y X

DYHtr )1(

)1(2 Htr

2 1[ ( ( ) )]trI tr X X X X

))])(([ 12 XXXXtrn

)( 12

ttrIn

)1(2 tn

注：由这一性质可知：1

2

tn

SSEs 是

2 的无偏估计。

性质五（高斯-马尔可夫定理）

在假设 XEY ， nIDY 2 下，的任一线性函数的最

小方差线性无偏估计为 ˆ ，其中是任一不为零的 1t 维向量，是

最小二乘估计。

证明：（1） YXXX 1)(ˆ 是Y 的线性函数，所以是线性估计。

（2） )()()ˆ( 1 YEXXXE XXXX 1)(

故 ˆ 是的无偏估计。

（3）为证 ˆ 是的一切线性无偏估计中的方差最小者，可设 Yl 为

的一个线性无偏估计，即对一切有 XlYlE , 从而必

要： Xl , 又

122 )()ˆ()( XXllDYlD ])([ 12 lXXXXlll

由于 )1(2 H 是 e的协方差矩阵，故必要为非负定矩阵，从而对一切n

维向量 l有 0)1( lHl , 即 ˆ 是的一切线性无偏估计中方差最

小者。

注：这一性质决定了最小二乘估计在线性无偏估计意义下的优越性。

下面一个性质在假定 ),(~ 2nn IXNY 条件下讨论。

性质六当 2~ ( , )n nY N X I ，则

（1） 2 1ˆ ~ ( , ( ) )N X X

（2） SSE与独立；

（3） 22 ~ ( 1)SSE n t

证明：（1）与（2）在前面已说明。下面证明性质（3）。

由于 ))(1()()1( XYHXYYHYSSE ，

XXXXH 1)( 是一个非负定矩阵，其秩为 X 的秩 1t 。所以

必存在正交阵C使

00

01tJCCH 其中：

1

1

1

t

tJ

0i , 1,,2,1 ti 。由 CCHCCHCCHCCH 2 ,

知： 111 ttt JJJ

所以 1i 1,,2,1 ti

令： )( XYCZ ，则有：

0)( XEYCEZ

2( ) nVarY CVar Y X C I

由 ),(~ 2nn IXNY 的假设知 ),0(~ 2

nn INZ ，所以

ZCHCZSSE )1( ZJ

ZZZ t

00

01

n

i

t

iii zz

1

1

1

22

n

tiiz

2

2

因此， )1(~ 22

tnxSSE

。

§2.3 回归方程的显著性检验

在实际问题中，随机变量 y与一般变量 txxx 21 之间究竟是否存

在线性相关关系呢？如果Ey不随 txxx ,,, 21 的变化而变化，则应有：

01 t 。否则 Ey应随 txxx ,,, 21 的变化而作变化，所以

有必要对回归方程作显著性检验。即：

:oH 021 t

为了找出上述假设检验的统计量，可采用平方和分解的方法，

SSRSSEyyyyyySSTn

ii

n

iii

n

ii

1

2

1

2

1

2 )ˆ()ˆ()(

和一元线性回归一样，SST称为总的平方和；SSE称为残差平方和；SSR

称回归平方和。

由上一节性质 6的证明可知： )1(~ 22

tnSSE

。当 0H 为

真时，多元线性模型可改写为：

).0(~.. 20

Ndii

y

i

ii

即 ),(~ 20 Nyi 为 dii .. 的正态随机变量，所以，由数理统计

中的知识可知： )1(~ 22

nSST

，所以，当 0H 为真时，

)(~ 22

tSSR

，并且 SSR与 SSE独立。由上述讨论构造检验统

计量：

( 1)

SSR tF

SSE n t

当 0H 为真时， )1,(~ tntFF 。

2

2

1 1 1

2 2

2 2

1 1 1 1 1

( ) ( ) ( )

( ) ( ) ( 1) ( )

n n t

i j ij j ii i j

n t n n t

j ij j i j ij ji j i i j

SST y y x x

x x n x x

2

1 1

2 )(

n

i

t

jjijj xxtSSR

当 0H 为真时， 0j tj ,,2,1 ，即 2tSSR 。而对一般情

形， 2tSSR 。故，我们对给定的显著水平给出拒绝域如下：

)1,(1 tntFFW

方差分析表

来源平方和自由度均方和 F比

回归 SSR t t

SSR

残差 SSE 1 tn ( 1)

SSEn t

F=( 1)

SSR t

SSE n t

总和 SST 1n )1,(1 tntF

1

ˆ

-

t

jy jj

SSR l

SSE SST SSR

§2.4 回归系数的显著性检验

当回归方程的显著性检验得出拒绝 0H 时，我们并不能说明所有的

ix 均与 y有线性相关关系，而只仅仅说明至少有一个 ix 与 y有线性相

关关系，而对有些 0j 时，说明相应的的变量 jx 与 y的变化无关，

即不会引起Ey的线性变化，为了使方程简单明了，我们应把 jx 从方程

中去掉。所以在进行了回归方程的显著性检验后，还应对每个 j

)2,1( tj 进行检验。

0:0: 10 jjjj HH

当数据中心化时，有：

t

ˆ

ˆˆ 1

，相应的相关矩阵为

10

01

LnC ，由此可知：

11 2

ˆ

t

Var L

记 ttjjlL

1 即 j ， ˆjVar 的方差为 2jjl 。

由此可给出检验 0:0 jjH 统计量为：

sltn

SSE

lt

jj

jjj

jj

ˆ

1

ˆ

2

其中：1

tn

SSEs

在模型误差为正态的假设下， 2ˆ ~ ( , )jjj jN l ，并

且与 SSE独立。所以，当 jH 0 为真时， )1(~ tntt j 。

对给定的显著水平，给出检验假设的拒绝域为：

)1(2/1 tnttW j

接例 2. 3，对 0: 101 H 的检验

981.4563.3

818.1

563.364

1

18.1ˆ1

1

sl

tjj

经查表得 0.05 0.9751

2

(16 3 1) (12) 2.1788t t

，所以拒绝

01H ，即 1x 变量是显著的。

§2.5 回归系数的置信区间

由上一节的讨论知：

)1(~),,(~ˆ 22

2 tnSSE

lN jjjj

故有： )1(~ˆ

tntsl jjjj

，即 j 的置信水平为 1 的置

信区间为：

))1(ˆ,)1(ˆ(2

12

1sltntsltnt jj

jjj

j

§2.6 预测

通过回归方程，当给定 ),,( 002010 txxxx 时，可求出 0y

)ˆˆˆˆ1

01

000 j

t

jjj

t

jjj xxyxy

（

0y 相应可作为 0Ey 或 0y 的点估计，并且是 0Ey 的无偏估计。下

面给出 0Ey 和 0y 区间估计。

（1） 0Ey 的区间估计

由于 y与 j 之间是不相关的，故有：

0

0 0 01 1

2 20 0

1 1

2 2ˆ0 0

1 1

ˆˆ ( )( ) cov( , )

1( )( )

1( )( )

t t

j j k k j kj k

t tjk

j j k kj k

t tjk

j j k k yj k

Vary Vary x x x x

x x x x ln

x x x x ln

当随机误差为正态的假设条件下有， ),(~ˆ0ˆ

200 yEyNy ，又

)1(~ 22

tnSSE

且与 0y 独立，故可知 0Ey 的置信水平为

1 的置信区间为

)ˆ,ˆ( 00 yy

其中： 2

0 011 1

1( )( )

t tjk

j j k kj k

t s x x x x ln

(2) 0y 的区间估计

0y 也同时为 0y 的无偏估计，并且 0y 与 0y 独立(请读者自己

说明理由)，故当随机误差为正态的假设条件下有

),0(~ˆ0ˆ

2200 yNyy

0y 的概率为 1 的预测区间为： )ˆ,ˆ( 00 yy

其中：

t

j

t

k

jkkkjj lxxxx

nstnt

1 1001

))((1

1)1(2

当 n充分大，且 0x 与 x 较接近时， 0y 的概率为 1

的近似预测区间为：

)ˆ,ˆ(2

10

21

0 sZysZy

当 05.0 时： )2ˆ,2ˆ( 00 sysy

当 01.0 时： )3ˆ,3ˆ( 00 sysy

加权最小二乘法

加权最小二乘是在下列数学模型下面提出的

20 n n

Y X e

Ee Vare G

其中G是一个已知的、正定对称矩阵。

若 n 1 之间是方差不等或相关的，则 nyyy 21 , 之间也

是方差不等或相关的。 ˆ 作为的最小二乘估计就不一定

是 BLUE，如不是，那么又如何来找 ˆ 的 BLUE呢？

（1） ˆ 也不一定是 BLUE

由于 X 是 )1( tn 矩阵，且一般有 1 tn ，因此存在一个b

（ 0b ），使 Xb =0。取

YbYl ˆ

其中：为任意常数，为的最小二乘估计。

因 XbYlE ，故 Yl 是的无偏估计。

1 1

1 2

ôv( , ) ov( ( ) , ) ( ) ( )

( )

C b Y C X X X Y b Y X X X Var Y b

X X X Gb

一般情况下 ôv( , ) 0C b Y ，取ôv( , )

( )

C b Y

Var b Y

2ˆ( ) ( ) ( )

ˆ2 ov( , )

Var l Y Var Var b Y

C b Y

2

2

2

ôv( , )ˆ Var( ) ( )( )

ˆ[ ov( , )]2

( )

ˆ[ ov( , )]ˆ ˆ( ) ( )( )

C b YVar b Y

Var b Y

C b Y

Var b Y

C b YVar Var

Var b Y

即存在 Yl 为的线性无偏估计，但 ˆ( )Varl Y Var 。故 ˆ 不再是 BLUE。

（2）求模型的 BLUE

由假设G是正定对称矩阵，存在 2

1

G 使 2

1

2

1

GGG ，

若记 12

1

2

1

)( GG ，

令1

2Z G Y

，则

1 1 1 12 22 2 2 2

nVarZ G VarYG G GG I

模型可改写为：

2n

EZ U

VarZ I

其中： XGU 2

1

模型满足误差方差独立及齐性的条件，由前面讨论的结果知

YGXXGX

YGGXXGXGZUUU111

2

1

2

112

1

2

11

)(

)()(~

为的 BLUE。

所以的 BLUE为：

YGXXGX 111 )(~

一般我们称 ~为的加权最小二乘估计。

当 IG 时， ~

当

nw

w

G

0

01

时，可取 i

i

i yw

Z1

ni 2,1 。

例 2.3 的 SAS 实现data example2;

input x1 x2 y;

cards;

…..

;

run;

proc reg;

model y=x1 x2/p r clm cli;

run;

方差分析 The REG Procedure Model: MODEL1 Dependent Variable: y Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 2 2.33292 1.16646 127.71 <.0001 Error 25 0.22834 0.00913 Corrected Total 27 2.56127

Root MSE 0.09557 R-Square 0.9108 Dependent Mean 3.78893 Adj R-Sq 0.9037 Coeff Var 2.52237

参数估计

去掉 x2

data example2;

input x1 x2 y;

cards;

…..

;

run;

proc reg;

model y=x1 /p r clm cli;

run;

方差分析

参数估计

上机作业

Page 68-69: 2.8;2.9.

Documents

第二章