32
数数数数数数 1 数数数数数 ( 数数数数数数数数数数数数数数 数数数数数

数理統計学 ( 第四回) 分散の性質と重要な法則

Embed Size (px)

DESCRIPTION

数理統計学 ( 第四回) 分散の性質と重要な法則. 浜田知久馬. 分散についての性質. V[X+Y] = E[(X+Y - μ x - μ Y ) 2 ] = E[(X - μ x ) 2 +(Y - μ x ) 2 +2 (X - μ Y ) (Y - μ Y ) ] = E[(X - μ x ) 2 ]+ E[(Y - μ Y ) 2 ] +2E[(X - μ x ) (Y - μ Y )] = V[X]+V[Y]+2 ・ Cov[X,Y ] 独立のときは , V[X+Y] = V[X]+V[Y]. 分散についての性質. aは定数 - PowerPoint PPT Presentation

Citation preview

Page 1: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 1

数理統計学 ( 第四回)分散の性質と重要な法則

浜田知久馬

Page 2: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 2

分散についての性質

V[X+Y] = E[(X+Y - μx - μY)2]

= E[(X - μx)2+(Y - μx)2 +2 (X - μY) (Y - μY) ]

= E[(X - μx)2]+ E[(Y - μY)2]

   +2E[(X - μx) (Y - μY)]

= V[X]+V[Y]+2 ・ Cov[X,Y ]独立のときは ,

V[X+Y] = V[X]+V[Y]

Page 3: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 3

分散についての性質aは定数V[a+X] = E[(a+X - a - μx)2] = V[X]

V[aX] = E[(aX - aμx)2]

    = E[a(X - μx)2]

    = a2E[(X - μx)2]       = a2 V[X]

E[a+X] = a+E[X],   E[aX] = a ・ E[X],

Page 4: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 4

分散についての性質Z= a1X1+ a2X2+ ・・・ + apXp

V[ Z ] = ΣΣaiajCov [ Xi,X j ]

= Σai2 V[Xi]+ΣΣ2aiajCov[Xi, X j ]

               i < j

X1, X2, ・・・ ,Xp が互いに独立の場合

V[ Z ] = Σai2 V[Xi]

= a12V[X1]+a2

2V[X2]+ ・・・ + a p2V[X p ]

(分散の加法性)

Page 5: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 5

分散についての性質

Z= a1X1+ a2X2

V[ Z ] = V[a1X1+ a2X2]

= E[(a1X1+ a2X2 - a1μ1 - a2μ2)2]

= E[(a1X1 - a1μ1 + a2X2 - a1μ2)2]

= E[(a1X1 - a1μ1)2 ] + E[(a2X2 - a2μ2)2 ]

+2E[(a1X1 - a1μ1)(a2X2 - a2μ2) ]

= a12V[X1]+a2

2V[X2] +2a1a2Cov[X1, X2]

Page 6: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 6

分散・共分散行列3 変数の場合  V[X1]     Cov[X1, X2]   Cov[X1, X3]

V= Cov[X2, X1]   V[X2]      Cov[X2, X3]

Cov[X3, X1] Cov[X3, X2]   V[X3]

一般にp変数ある場合,分散・共分散行列はp × pの対称行列になる .

Page 7: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 7

行列表現a T=[a1, a2,・・・, ap]   a:p行のベクト

ルx T=[X1, X2,・・・, Xp]  x:p行のベクトル

V :分散・共分散行列 ( p × p )  Z =a TxV[ Z ] =a T VaZ= a1X1+ a2X2+ a3X3

の場合についてV[ Z ] を書き下せ.

Page 8: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 8

Z= a1X1+ a2X2+ a3X3 の分散

Z= a1X1+ a2X2+ a3X3

V[ Z ] =a T Va= a1

2V[X1]+ a1a2Cov[X1,X2]+ a1a3Cov[X1,X3]

+a2a1Cov[X2,X 1 ]+ a22V[X2]+a2a3Cov[X2,X3]

+a3a1Cov[X3,X1]+ a3a2Cov[X3,X2]+ a32V[X3]

Page 9: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 9

共分散の計算Z 1 = a1X1+ a2X2+ ・・・ +a3X3 =a T xZ 2 =b 1X1+ b 2X2+ ・・・ + b 3X3 =b T xのときCov[ Z 1, Z 2] = Cov[ a T x , b T x ]

= ΣaibjCov [ Xi,X j ]

=a T VbV[ Z 1] = Cov[ a T x , a T x ] =a T Va

Page 10: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 10

共分散の計算

Z 1 = a1X1+ a2X2+ a3X3

Z 1 = b1X1+ b2X2+ b3X3

Cov[ Z 1, Z 2] =a T Vb= a1b1V[X1]+ a1b2Cov[X1,X2]+ a1b3Cov[X1,X3]

+a2b1Cov[X2,X 1 ]+ a2b2V[X2]+a2b3Cov[X2,X3]

+a3b1Cov[X3,X1]+ a3b2Cov[X3,X2]+ a3b3V[X3]

Page 11: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 11

分散の加法性の応用平均値の分散は?X1, X2, ・・・ ,Xn が互いに独立に分散 σ2 の

分布にしたがうとき

nn

n

n

nn

n

XXXVXV

n

i

n

2

2

2

12

2

2

2

2

2

21][

Page 12: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 12

分散の加法性の応用E[X] = 0,V[X]=32=9

E[Y] = 0,V[Y]=42=16

でかつ X と Y が独立のときX+Y の期待値と分散は?X - Y の期待値と分散は?

Page 13: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 13

乱数による確認実験data data;do i=1 to 1000;x=3*rannor(5963);y=4*rannor(5963);z1=x+y;z2=x-y;output;end;proc means mean var std maxdec=2;run;

Page 14: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 14

要約統計量変数 平均値 分散 標準偏差---------------------------------x 0.05 8.72 2.95y -0.05 16.07 4.01z1 0.01 25.95 5.09z2 0.10 23.65 4.86----------------------------------

Page 15: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 15

演習問題

X 1 ,X 2 ,・・・,X 6 が確率変数でそれぞれ独立に正規分布N (μ , σ2) に従っているとき,1)~7)の期待値と分散を示せ.0) X i: 解答例 期待値 μ ,分散 σ2

321

654321

2)3

)23

)1

XXX

XXXXXX

X i

 

 

   

Page 16: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 16

演習問題

4321

21

21

11

33)722

)6

22)5

22)4

XXXX

XX

XX

XX

   

   

   

   

Page 17: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 17

中心極限定理Central Limit Theorem

多くの分布が一山分布になるのはなぜだろうか?

例)センター入試,身長,血圧中心 : 分布の中心 , 平均値は極限:nを大きくすると正規分布にしたがう .

「和や平均値の分布は山型の分布にしたがう」

Page 18: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 18

平均値の2つの性質と SE

1)平均値の分散 ( バラツキ ) は生データの1/N,標準偏差に直せば1/√Nになる.

2)Nがある程度大きくなれば,平均値の分布は正規分布になる.

Page 19: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 19

乱数実験A)0,1の一様分布 (0 ~ 1 の間を等しい確率でとる ) にしたがう乱数を1万個発生さる.

B)一様分布にしたがう乱数を4万個発生させ,4個づつ組にして平均値を計1万個計算する .

C)一様分布にしたがう乱数を9万個発生させ,9個づつ組にして1万個の平均値を計算する .

Page 20: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 20

生データのヒストグラム  A

0.00 0.30 0.60 0.90

Y1

0

200

400

度数

Page 21: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 21

4 個の平均のヒストグラム B

0.00 0.30 0.60 0.90

Y4

0

500

1000

度数

Page 22: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 22

9 個の平均のヒストグラム C

0.00 0.30 0.60 0.90

Y9

0

500

1000

1500

度数

Page 23: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 23

実験結果のまとめ

        平均値 標準偏差 分散A)生データ 0.499 0.289  

0.0838B)4個の平均 0.499   0.144

0.0206C)9個の平均 0.500 0.095

0.00906

Page 24: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 24

大数の法則 (law of large numbers)  

平均値はnを大きくすると,真の値に収束する .

平均値→ E(X) = μ  (n→∞)limP ( | 平均値- μ| ε≧ )= 0n→∞

マルコフの不等式 (Markov’s   inequality)

チェビシェフの不等式 (Chebyshev’s inequality)

Page 25: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 25

マルコフの不等式X 0≧ :非負の確率変数 c> 0 :正の定数P ( X ≧ c)≦ E ( X )/c例)交通事故による死亡が 10 を越える確率は?Y = 0   if   X <c    c   if   X ≧ c常に Y X≦ なので→ E ( Y )≦ E ( X )E ( Y )= 0×P(Y=0)+ c ×P(Y=c) =c ×P(X ≧

c )E ( Y )=c ×P(X ≧ c ) E≦ ( X )P ( X ≧ c)≦ E ( X )/c

Page 26: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 26

マルコフの不等式

X

Y

c0

Y=X

Page 27: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 27

マルコフの不等式の応用宝くじで1等2億円が当たる確率は?X :宝くじの賞金金額P ( X ≧ 2億円)E ( X )= 150 円 , c= 2億円P ( X ≧ c)≦ E ( X )/c= 150 円/ 2億円= 1/133 万正確な確率は 1/500 万

Page 28: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 28

チェビシェフの不等式

E ( X )= μ,V ( X )= σ2

P ( |X - μ| ≧ c)≦ σ2 /c 2

Y =( X - μ ) 2 とおいてマルコフの不等式を適用

P ( Y ≧ c 2 )≦ E ( Y )/c 2 = σ2 /c 2

Y ≧ c 2 ⇔ |X - μ| ≧ c なのでP ( Y ≧ c 2 ) = P ( |X - μ| ≧ c)

Page 29: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 29

チェビシェフの不等式の意味σ2= 1のときc  チェビシェフの上限  正規分布1       1            

0.32  2       0.25(1/22)        0.05

3       0.11(1/32)        0.003

4       0.06(1/42)       <0.0001

Page 30: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 30

日本人身長の例 ( 浜田世代)男性 平均: 170.1   SD : 5.6  単位

(cm)

平均 ±SD : 164.5 ~ 175.7

平均 ±2SD : 158.9 ~ 181.3

平均 ±3SD : 153.3 ~ 186.9

平均 ±4SD : 147.7 ~ 192.5

平均 ±5SD : 142.1 ~ 198.1

Page 31: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 31

日本人身長の例 ( 浜田世代)女性 平均: 157.3   SD : 5.0  単位

(cm)

平均 ±SD : 152.3 ~ 162.3

平均 ±2SD : 147.3 ~ 167.3

平均 ±3SD : 142.3 ~ 172.3

平均 ±4SD : 137.3 ~ 177.3

平均 ±5SD : 132.3 ~ 182.3

Page 32: 数理統計学 ( 第四回) 分散の性質と重要な法則

数理統計学第4回 32

大数の法則

  にチェビシェフの不等式を適用すると

n→∞のとき右辺は 0 に収束するから

2

2

2

)(

][,][

nXP

nXVXE

0)(lim

XPn

X

X