59
第第第 多多多多多多

第二章

  • Upload
    kuri

  • View
    46

  • Download
    1

Embed Size (px)

DESCRIPTION

第二章. 多元线性回归. §2.1 多元线性回归模型. §2.2 参数的最小二乘估计. 参数估计的性质. §2.3 回归方程的显著性检验. §2.4 回归系数的显著性检验. §2.5 回归系数的置信区间. §2.6 预测. 加权最小二乘法. 例 2.3 的 SAS 实现. data example2; input x1 x2 y; cards; ….. ; run ; proc reg ; model y=x1 x2/p r clm cli; run ;. 方差分析. The REG Procedure - PowerPoint PPT Presentation

Citation preview

Page 1: 第二章

第二章

多元线性回归

Page 2: 第二章

§2.1多元线性回归模型

为了研究 y与 1, , tx x 之间的关系,首先必须收集n组独立

观测数据,

),,,( 1 iiti yxx , ni ,,2,1

并假定它们之间有如下关系式:

0 1 12

1,2, ,

(0, )i i t it i

i

y x x i n

N

各 相互独立且同分布服从

Page 3: 第二章

为了方便起见,多元回归分析常采用矩阵形式来表示,并通过矩阵的性质来研究参数及其他性质。记:

ny

y

y

Y2

1

t

1

0

nt

t

t

n x

x

x

x

x

x

Y 2

1

1

21

11

1

1

1

n

2

1

Page 4: 第二章

则模型可表示为

),0(~ 2nIN

XY

称Y 为随机变量的观测向量, 为未知参数向量,X 为结

构矩阵, 为随机误差向量, nI 为单位矩阵。显然,由假

设可知:

),(~ 2nIXNY

Page 5: 第二章

§2.2 参数的最小二乘估计 和一元线性回归一样,仍采用最小二乘法去估计参数

t ,,, 10 。令:

20 1 1

1

( ) ( )

( ) '( )

n

i i t iti

Q y x x

Y X Y X

则各 的 LS估计 ,满足

ˆ( )Q =min ( ) min( ) '( )Q Y X Y X

Page 6: 第二章

根据微积分原理,

ˆˆ| ' ' ( ' ' ) 0

QX Y X Y X X X X

整理可得正规方程组:

ˆ' 'X X X Y

当1)( XX 存在时, 的最小二乘估计为:

YXXX 1)(

Page 7: 第二章

为了方便,我们定义:

XXA 为正规方程组的系数矩阵,为 )1( t 阶方阵;

YXB 为正规方程的常数项矩阵,为 1t 维向量矩阵;

11 )( XXAC 为相关矩阵,为 )1( t 阶方阵。

Page 8: 第二章

例 2. 1 用矩阵形式写出如下一元线性回归模型:

),0(~..~ 210

Ndii

xy

i

iii ni ,,2,1

并用矩阵形式求出 10 , 的最小二乘估计。

Page 9: 第二章

解:记:

ny

y

y

Y2

1

1

0

nx

x

x

X2

1

1

1

1

n

2

1

则可记为 :

),0(~ 2nIN

XY

,并且有:

Page 10: 第二章

XXA

2ii

i

xx

xn YXB

ii

i

yx

y

1AC

nxn

xnx

nlnxn

xnx

xnxni

xx

i

i

22

22

1

)(

1

故:

CB

xxxyii

i

xx ll

xy

yx

yn

nxn

xnx

nl /

ˆ1 12

Page 11: 第二章

例 2 . 2 下 面 的 模 型 称 为 t 元 中 心 化 线 性 回 归 模 型 :

0 1 1 12

( ) ( )

~ ( 0 , )i i t i t t i

i

y x x x x

i i d N

ni ,,2,1

写 出 模 型 相 应 的 矩 阵 , , , ,X Y A B C , 并 求 出 模 型 参 数 的 最 小 二

乘 估 计 。

Page 12: 第二章

记:

ny

y

y

Y2

1

t

1

0

tnt

tt

tt

n xx

xx

xx

xx

xx

xx

X 2

1

11

121

111

1

1

1

n

2

1

则模型可写为

),0(~ 2nIN

XY

Page 13: 第二章

XXA

ttt

t

ll

ll

n

1

111

0

0

00

其中: jkkj ll

n

ikikjij xxxx

1

))(( , tkj ,,2,1, 。

YXB

ty

y

l

l

yn

1 ,

其中: jyl

n

iijij yyxx

1

))(( , tj ,,2,1 。

Page 14: 第二章

记 : L

ttt

t

t

ll

lll

lll

......

........

........

......

.

1

22221

11211

1L

tttt

t

t

lll

lll

lll

..

.....

.....

..

..

21

22221

11211

11)( ACXX

10

01

Ln

Page 15: 第二章

ty

y

y

ty

y

t l

l

l

L

y

l

l

yn

Ln

2

1

11

1

1

0

0

01

ˆ

ˆˆ

ˆ

即: y0 ,

ty

y

y

tl

l

l

L2

1

12

1

ˆ

ˆ

ˆ

Page 16: 第二章

由此可得 t ˆ,,ˆ1 为下列方程的解:

11 1 1 1

21 1 2 2

1

10 1

ˆ ˆ

ˆ ˆ

ˆ ˆ

ˆ ˆ ˆ

t t y

t t y

tt tt t ty

tt

l l l

l l l

l l l

y x x

例子,见 p38-41

Page 17: 第二章

参数估计的性质

记: HYYXXXXXY ˆ)(ˆˆ 1

为拟合向量。其中: XXXXH 1)( 为方阵,其元素记为

}{ ijh ,显然,H是对称并且幂等矩阵。

ˆ ( )e Y Y I H Y 为残差向量。

ˆ ˆ( ) ( ) ( )SSE Y Y Y Y Y I H Y 为残差平方和。

Page 18: 第二章

下面几个性质除性质 6 之外,对随机误差假定

0E , 2nVar I 。

性质一 是 的线性无偏估计,且 2 1ˆ ( )Var X X

证明:因 YXXX 1)( 是Y 的线性函数,故为线性估计。

又: XXXXEYXXXE 11 )()(ˆ ,即: 为 的

无偏估计。

1 2 1ˆ ( ) ( ) ( )Var X X X DYX X X X X

Page 19: 第二章

性质二 0Ee , 2 (1 )Vare H

证明:由于 YHe )1( ,故有:

0)1()1( XHEYHEe

2 2(1 ) (1 ) (1 ) (1 )Vare H VarY H H H

从上述性质可知,残差向量的各分量之间一般也是相关的。

并且当为正态时, ))1(,0(~ 2HNe

Page 20: 第二章

性质三 0)ˆ,( eCov

证明:

))(,)1(()ˆ,( 1 YXXXYHCoveCov

XXXDYH 1)()1( 0

这一性质说明残差向量 e与 的最小二乘估计 之间不相

关。在 为正态分布时,由于e与 均服从正态分布,故e与

立。并由此可知SSE与 独立。

Page 21: 第二章

A是 k k 的方阵,那么,矩阵迹1

[ ]k

iii

tr A a

[ ] [ ]tr aA atr A ;

[ ] [ ]tr A tr A

[ ] [ ] [ ]tr A B tr A tr B

[ ] [ ]tr AB tr BA

Page 22: 第二章

性质四 2( ) ( 1)E SSE n t

证明:利用矩阵迹的性质及 ( ) 0I H X 可知

( ) ( ( ) )E SSE E Y I H Y

( ) ( )( )E Y X I H Y X

= [( )( )( ) ]Etr I H Y X Y X

Page 23: 第二章

DYHtr )1(

)1(2 Htr

2 1[ ( ( ) )]trI tr X X X X

))])(([ 12 XXXXtrn

)( 12

ttrIn

)1(2 tn

注:由这一性质可知:1

2

tn

SSEs 是

2 的无偏估计。

Page 24: 第二章

性质五(高斯-马尔可夫定理)

在假设 XEY , nIDY 2 下, 的任一线性函数 的最

小方差线性无偏估计为 ˆ ,其中是任一不为零的 1t 维向量, 是

最小二乘估计。

证明:(1) YXXX 1)(ˆ 是Y 的线性函数,所以是线性估计。

(2) )()()ˆ( 1 YEXXXE XXXX 1)(

故 ˆ 是 的无偏估计。

Page 25: 第二章

(3)为证 ˆ 是 的一切线性无偏估计中的方差最小者,可设 Yl 为

的一个线性无偏估计,即对一切 有 XlYlE , 从而必

要: Xl , 又

122 )()ˆ()( XXllDYlD ])([ 12 lXXXXlll

由于 )1(2 H 是 e的协方差矩阵,故必要为非负定矩阵,从而对一切n

维向量 l有 0)1( lHl , 即 ˆ 是 的一切线性无偏估计中方差最

小者。

注:这一性质决定了最小二乘估计在线性无偏估计意义下的优越性。

Page 26: 第二章

下面一个性质在假定 ),(~ 2nn IXNY 条件下讨论。

性质六 当 2~ ( , )n nY N X I ,则

(1) 2 1ˆ ~ ( , ( ) )N X X

(2) SSE与 独立;

(3) 22 ~ ( 1)SSE n t

Page 27: 第二章

证明:(1)与(2)在前面已说明。下面证明性质(3)。

由 于 ))(1()()1( XYHXYYHYSSE ,

XXXXH 1)( 是一个非负定矩阵,其秩为 X 的秩 1t 。所以

必存在正交阵C使

00

01tJCCH 其中:

1

1

1

t

tJ

0i , 1,,2,1 ti 。由 CCHCCHCCHCCH 2 ,

知: 111 ttt JJJ

所以 1i 1,,2,1 ti

Page 28: 第二章

令: )( XYCZ ,则有:

0)( XEYCEZ

2( ) nVarY CVar Y X C I

由 ),(~ 2nn IXNY 的假设知 ),0(~ 2

nn INZ ,所以

ZCHCZSSE )1( ZJ

ZZZ t

00

01

n

i

t

iii zz

1

1

1

22

n

tiiz

2

2

因此, )1(~ 22

tnxSSE

Page 29: 第二章

§2.3 回归方程的显著性检验

在实际问题中,随机变量 y与一般变量 txxx 21 之间究竟是否存

在线性相关关系呢?如果Ey不随 txxx ,,, 21 的变化而变化,则应有:

01 t 。否则 Ey应随 txxx ,,, 21 的变化而作变化,所以

有必要对回归方程作显著性检验。即:

:oH 021 t

Page 30: 第二章

为了找出上述假设检验的统计量,可采用平方和分解的方法,

SSRSSEyyyyyySSTn

ii

n

iii

n

ii

1

2

1

2

1

2 )ˆ()ˆ()(

和一元线性回归一样,SST称为总的平方和;SSE称为残差平方和;SSR

称回归平方和。

Page 31: 第二章

由上一节性质 6的证明可知: )1(~ 22

tnSSE

。当 0H 为

真时,多元线性模型可改写为:

).0(~.. 20

Ndii

y

i

ii

即 ),(~ 20 Nyi 为 dii .. 的正态随机变量,所以,由数理统计

中的知识可知: )1(~ 22

nSST

,所以,当 0H 为真时,

)(~ 22

tSSR

,并且 SSR与 SSE独立。由上述讨论构造检验统

计量:

( 1)

SSR tF

SSE n t

Page 32: 第二章

当 0H 为真时, )1,(~ tntFF 。

2

2

1 1 1

2 2

2 2

1 1 1 1 1

( ) ( ) ( )

( ) ( ) ( 1) ( )

n n t

i j ij j ii i j

n t n n t

j ij j i j ij ji j i i j

SST y y x x

x x n x x

2

1 1

2 )(

n

i

t

jjijj xxtSSR

Page 33: 第二章

当 0H 为真时, 0j tj ,,2,1 ,即 2tSSR 。而对一般情

形, 2tSSR 。故,我们对给定的显著水平给出拒绝域如下:

)1,(1 tntFFW

Page 34: 第二章

方差分析表

来源 平方和 自由度 均方和 F比

回归 SSR t t

SSR

残差 SSE 1 tn ( 1)

SSEn t

F=( 1)

SSR t

SSE n t

总和 SST 1n )1,(1 tntF

1

ˆ

-

t

jy jj

SSR l

SSE SST SSR

Page 35: 第二章

§2.4 回归系数的显著性检验

当回归方程的显著性检验得出拒绝 0H 时,我们并不能说明所有的

ix 均与 y有线性相关关系,而只仅仅说明至少有一个 ix 与 y有线性相

关关系,而对有些 0j 时,说明相应的的变量 jx 与 y的变化无关,

即不会引起Ey的线性变化,为了使方程简单明了,我们应把 jx 从方程

中去掉。所以在进行了回归方程的显著性检验后,还应对每个 j

)2,1( tj 进行检验。

0:0: 10 jjjj HH

Page 36: 第二章

当数据中心化时,有:

t

ˆ

ˆˆ 1

,相应的相关矩阵为

10

01

LnC ,由此可知:

11 2

ˆ

t

Var L

记 ttjjlL

1 即 j , ˆjVar 的方差为 2jjl 。

Page 37: 第二章

由此可给出检验 0:0 jjH 统计量为:

sltn

SSE

lt

jj

jjj

jj

ˆ

1

ˆ

2

其中:1

tn

SSEs

Page 38: 第二章

在模型误差为正态的假设下, 2ˆ ~ ( , )jjj jN l ,并

且与 SSE独立。所以,当 jH 0 为真时, )1(~ tntt j 。

对给定的显著水平,给出检验假设的拒绝域为:

)1(2/1 tnttW j

Page 39: 第二章

接例 2. 3,对 0: 101 H 的检验

981.4563.3

818.1

563.364

1

18.1ˆ1

1

sl

tjj

经查表得 0.05 0.9751

2

(16 3 1) (12) 2.1788t t

,所以拒绝

01H ,即 1x 变量是显著的。

Page 40: 第二章

§2.5 回归系数的置信区间

由上一节的讨论知:

)1(~),,(~ˆ 22

2 tnSSE

lN jjjj

故有: )1(~ˆ

tntsl jjjj

,即 j 的置信水平为 1 的置

信区间为:

))1(ˆ,)1(ˆ(2

12

1sltntsltnt jj

jjj

j

Page 41: 第二章

§2.6 预测

通过回归方程,当给定 ),,( 002010 txxxx 时,可求出 0y

)ˆˆˆˆ1

01

000 j

t

jjj

t

jjj xxyxy

0y 相应可作为 0Ey 或 0y 的点估计,并且是 0Ey 的无偏估计。下

面给出 0Ey 和 0y 区间估计。

Page 42: 第二章

(1) 0Ey 的区间估计

由于 y与 j 之间是不相关的,故有:

0

0 0 01 1

2 20 0

1 1

2 2ˆ0 0

1 1

ˆˆ ( )( ) cov( , )

1( )( )

1( )( )

t t

j j k k j kj k

t tjk

j j k kj k

t tjk

j j k k yj k

Vary Vary x x x x

x x x x ln

x x x x ln

Page 43: 第二章

当随机误差为正态的假设条件下有, ),(~ˆ0ˆ

200 yEyNy ,又

)1(~ 22

tnSSE

且与 0y 独立,故可知 0Ey 的置信水平为

1 的置信区间为

)ˆ,ˆ( 00 yy

其中: 2

0 011 1

1( )( )

t tjk

j j k kj k

t s x x x x ln

Page 44: 第二章

(2) 0y 的区间估计

0y 也同时为 0y 的无偏估计,并且 0y 与 0y 独立(请读者自己

说明理由),故当随机误差为正态的假设条件下有

),0(~ˆ0ˆ

2200 yNyy

0y 的概率为 1 的预测区间为: )ˆ,ˆ( 00 yy

其中:

t

j

t

k

jkkkjj lxxxx

nstnt

1 1001

))((1

1)1(2

Page 45: 第二章

当 n充分大,且 0x 与 x 较接近时, 0y 的概率为 1

的近似预测区间为:

)ˆ,ˆ(2

10

21

0 sZysZy

当 05.0 时: )2ˆ,2ˆ( 00 sysy

当 01.0 时: )3ˆ,3ˆ( 00 sysy

Page 46: 第二章

加权最小二乘法

加权最小二乘是在下列数学模型下面提出的

20 n n

Y X e

Ee Vare G

其中G是一个已知的、正定对称矩阵。

若 n 1 之间是方差不等或相关的,则 nyyy 21 , 之间也

是方差不等或相关的。 ˆ 作为 的最小二乘估计就不一定

是 BLUE,如不是,那么又如何来找 ˆ 的 BLUE呢?

Page 47: 第二章

(1) ˆ 也不一定是 BLUE

由于 X 是 )1( tn 矩阵,且一般有 1 tn ,因此存在一个b

( 0b ),使 Xb =0。取

YbYl ˆ

其中:为任意常数, 为 的最小二乘估计。

Page 48: 第二章

因 XbYlE ,故 Yl 是 的无偏估计。

1 1

1 2

ˆov( , ) ov( ( ) , ) ( ) ( )

( )

C b Y C X X X Y b Y X X X Var Y b

X X X Gb

一般情况下 ˆov( , ) 0C b Y ,取ˆov( , )

( )

C b Y

Var b Y

Page 49: 第二章

2ˆ( ) ( ) ( )

ˆ2 ov( , )

Var l Y Var Var b Y

C b Y

2

2

2

ˆov( , )ˆ Var( ) ( )( )

ˆ[ ov( , )]2

( )

ˆ[ ov( , )]ˆ ˆ( ) ( )( )

C b YVar b Y

Var b Y

C b Y

Var b Y

C b YVar Var

Var b Y

即存在 Yl 为 的线性无偏估计,但 ˆ( )Varl Y Var 。故 ˆ 不再是 BLUE。

Page 50: 第二章

(2)求模型的 BLUE

由假设G是正定对称矩阵,存在 2

1

G 使 2

1

2

1

GGG ,

若记 12

1

2

1

)( GG ,

令1

2Z G Y

,则

1 1 1 12 22 2 2 2

nVarZ G VarYG G GG I

Page 51: 第二章

模型可改写为:

2n

EZ U

VarZ I

其中: XGU 2

1

模型满足误差方差独立及齐性的条件,由前面讨论的结果知

YGXXGX

YGGXXGXGZUUU111

2

1

2

112

1

2

11

)(

)()(~

为 的 BLUE。

Page 52: 第二章

所以 的 BLUE为:

YGXXGX 111 )(~

一般我们称 ~为 的加权最小二乘估计。

当 IG 时, ~

nw

w

G

0

01

时,可取 i

i

i yw

Z1

ni 2,1 。

Page 53: 第二章

例 2.3 的 SAS 实现data example2;

input x1 x2 y;

cards;

…..

;

run;

proc reg;

model y=x1 x2/p r clm cli;

run;

Page 54: 第二章

方差分析 The REG Procedure Model: MODEL1 Dependent Variable: y Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 2 2.33292 1.16646 127.71 <.0001 Error 25 0.22834 0.00913 Corrected Total 27 2.56127

Root MSE 0.09557 R-Square 0.9108 Dependent Mean 3.78893 Adj R-Sq 0.9037 Coeff Var 2.52237

Page 55: 第二章

参数估计

Page 56: 第二章

去掉 x2

data example2;

input x1 x2 y;

cards;

…..

;

run;

proc reg;

model y=x1 /p r clm cli;

run;

Page 57: 第二章

方差分析

Page 58: 第二章

参数估计

Page 59: 第二章

上机作业

Page 68-69: 2.8;2.9.