18
自自自自自自自自 2.2 自 自自自自自 自自 2016.05.14 自自 自自

自然科学の統計学2.2 slideshare

Embed Size (px)

Citation preview

Page 1: 自然科学の統計学2.2 slideshare

自然科学の統計学

2.2 節 最小二乗法

輪講  2016.05.14担当 和田

Page 2: 自然科学の統計学2.2 slideshare

2.2.1 最小二乗法の原理

線形モデル

      (2.9) 観測地のベクトル 未知母数のベクトル  : 既知係数行列 / 計画行列 design matrix

2/16

Page 3: 自然科学の統計学2.2 slideshare

線形推定量未知母数 の任意の係数 による線形結合

の線形推定量

例 1) 多項式モデル (2.8) の母数例 2) 説明変数の値についての予測値

3/16

の選び方により様々なモデルになる

Page 4: 自然科学の統計学2.2 slideshare

最小二乗法の原理

データ とその期待値の二乗和

を最小にする解 を求め、単に とする

例 1) 繰り返し測定モデル:

例 2) 一元配置モデル  :

例 3) 多項式モデル  

4/16

ガウス・マルコフの定理

2.1.4 節で紹介したものよりも簡単な BLUE の求め方

Page 5: 自然科学の統計学2.2 slideshare

2.2.2 正規方程式

線形モデル についての正規方程式

これを満たす は、偏差二乗和 を最小にする。

 例 2.3 多項式モデル : 曇り点データ

5/16

  Sθ      

𝑆 ( �̂� )

Page 6: 自然科学の統計学2.2 slideshare

例 2.3 多項式モデル : 曇り点データx <- c(0,1,2,3,4,5,6,7,8,0,2,4,6,8,10,0,3,6,9)   y <- c(22.1, 24.5, 26, 26.8, 28.2, 28.9, 30, 30.4, 31.4, 21.9, 26.1, 28.5, 30.3, 31.5, 33.1, 22.8, 27.3, 29.8, 31.8)   X <- cbind(rep(1, length(x)), x, diag(x %*% t(x)))    solve(t(X) %*% X)# x # 0.253355906 -0.097147349 0.0079029365#x -0.097147349 0.063003809 -0.0062664006# 0.007902936 -0.006266401 0.0006840397  solve(t(X) %*% X) %*% t(X) %*% y# [,1]# 22.56123063#x 1.66802044# -0.06795836

6/16

Page 7: 自然科学の統計学2.2 slideshare

推定可能関数

の各要素とその線形結合全体

 ※ ただし、一元配置モデルの や は推定可能であるが、 と は単独で推定可能ではない。

7/16

Page 8: 自然科学の統計学2.2 slideshare

2.2.3 ガウス - マルコフの定理

 線形モデル の任意の推定関数 について、 が一意に BLUE 。 ここで、 は、正規方程式 を満たす任意の最小二乗解。  X がフルランクの場合、任意の線形関数も 自体も推定可能で、正規方程式も一意な最小二乗解 を持つ。

8/16

Page 9: 自然科学の統計学2.2 slideshare

証明 (1)任意の線形式 に対し、

 次に、 とは別の線形不偏推定量 との差を次のように定義する。

 このとき、不偏性から、全ての について となるべきで、

が任意の で成り立つので、

9/16

<= 不偏

Page 10: 自然科学の統計学2.2 slideshare

証明 (2)

10/16

二つの確率変数 X, Y に対して

であるから、 の分散は、

一方、誤差 ε が無相関で等分散の仮定 (2.14) を満たせば、 2 つの確率変数

の共分散は、

よって、 ゆえに、

は任意の線形不偏推定量なので、 は BLUE

0

Page 11: 自然科学の統計学2.2 slideshare

X がランク落ちするときの計算方法

① 正規方程式 の不定解を のように表し、 の代数的な性質を使って証明する

② データを直交変換により扱いやすい標準形に変換して証明する

11/16

Page 12: 自然科学の統計学2.2 slideshare

例 2.5  繰り返し測定のモデル :飲料製品中のエキス含有量 [ 表 2.1] p.33

y <- c(37.55, 37.74, 37.69, 37.71, 37.73, 37.81, 37.53, 37.58, 37.74)

j <- rep(1, length(y))solve(t(j) %*% j) %*% t(j) %*% y

# 37.67556 <- 1/length(y) * sum(y)

# 37.67556

12/16

Page 13: 自然科学の統計学2.2 slideshare

例 2.6’  単回帰データ : コンクリートの養生の温度条件と圧縮強度の関係[表 2.4 ] p.45

x <- c(2.62, 2.75, 2.85, 2.92, 2.92, 3.05, 3.14, 3.15, 3.23, 3.26, 3.36, 3.44, 3.66, 3.74, 4.04)

y <- c(209, 237, 273, 316, 283, 317, 321, 356, 404, 368, 405, 429, 413, 440, 439)

X <- cbind(rep(1, length(x)), x)(t1 <- as.vector(solve(t(X) %*% X) %*% t(X) %*%

y))# [1] -217.9524 176.1747plot(x, y); abline(as.vector(t1), col="red")

13/16

Page 14: 自然科学の統計学2.2 slideshare

例 2.7  一元配置モデル : 脂肪の種類に対する吸収量[表 2.2 ] p.34

theta <- c(64, 72, 68, 77, 56, 95, 78, 91, 97, 82, 85, 77, 75, 93, 78, 71, 63, 76, 55, 66, 49, 64, 70, 68)

(X <- matrix(c(rep(1, length(theta)), rep(1, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6)), nc=5))

(t1 <- as.vector(solve(t(X) %*% X) %*% t(X) %*% theta))# 以下にエラー solve.default(t(X) %*% X) : # Lapack routine dgesv: システムは正確に特異です : U[5,5] =

0 require(MASS) # for ginv()(t1 <- as.vector(ginv(t(X) %*% X) %*% t(X) %*% theta))# [1] 59 13 26 17 3 # mu=59, α1=13, α2=26, α3=17, α4=3.

14/16

Page 15: 自然科学の統計学2.2 slideshare

2.2.4 最小二乗法と制約式★  例 2.7 に、 mu=0 という制約をつけて解いてみる(X2 <- matrix(c(rep(1, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6)), nc=4))(t2 <- as.vector(solve(t(X2) %*% X2) %*% t(X2) %*% theta))#[1] 72 85 76 62 ★  例 2.7 に、 という制約をつけてみる require(MASS)# for ginv()(X3 <- matrix(c(rep(1, length(theta)), rep(0, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6)), nc=5))(t3 <- as.vector(ginv(t(X3) %*% X3) %*% t(X3) %*% theta))# [1] 7.200000e+01 -3.478067e-15 1.300000e+01 4.000000e+00 -1.000000e+01

15/16

Page 16: 自然科学の統計学2.2 slideshare

★  例 2.7 に、 という制約をつけるtheta <- c(64, 72, 68, 77, 56, 95, 78, 91, 97, 82, 85,

77, 75, 93, 78, 71, 63, 76, 55, 66, 49, 64, 70, 68)(X4 <- matrix(c(rep(1, length(theta)), rep(1, 6),

rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6)), nc=5))   # 通常の計画行列

X4[19:24,] <- c(rep(1, 6), rep(-1, 18), rep(0, 6))X4(t4 <- as.vector(ginv(t(X4) %*% X4) %*% t(X4) %*%

theta))# [1] 73.75 -1.75 11.25 2.25 0.00# mu= 73.75, α1= -1.75, α2=11.25, α3= 2.25,# α4=-(α1 + α2+ α3 )=-11.75 # -sum(t4[2:4])

16/16

Page 17: 自然科学の統計学2.2 slideshare

おまけMS Office の数式エディタは、 TeX のような入力が可能

例 ) y_i = \beta_0 + \beta_1 x_i + \beta_2 x_i^2 + \varepsilon_i

※  ただし、完全に入力が互換というわけではない。

Page 18: 自然科学の統計学2.2 slideshare

おわり

@ 足利フラワーパーク