Upload
wada-kazumi
View
183
Download
2
Embed Size (px)
Citation preview
自然科学の統計学
2.2 節 最小二乗法
輪講 2016.05.14担当 和田
2.2.1 最小二乗法の原理
線形モデル
(2.9) 観測地のベクトル 未知母数のベクトル : 既知係数行列 / 計画行列 design matrix
2/16
線形推定量未知母数 の任意の係数 による線形結合
の線形推定量
例 1) 多項式モデル (2.8) の母数例 2) 説明変数の値についての予測値
3/16
の選び方により様々なモデルになる
最小二乗法の原理
データ とその期待値の二乗和
を最小にする解 を求め、単に とする
例 1) 繰り返し測定モデル:
例 2) 一元配置モデル :
例 3) 多項式モデル
4/16
ガウス・マルコフの定理
2.1.4 節で紹介したものよりも簡単な BLUE の求め方
2.2.2 正規方程式
線形モデル についての正規方程式
これを満たす は、偏差二乗和 を最小にする。
例 2.3 多項式モデル : 曇り点データ
5/16
Sθ
𝑆 ( �̂� )
例 2.3 多項式モデル : 曇り点データx <- c(0,1,2,3,4,5,6,7,8,0,2,4,6,8,10,0,3,6,9) y <- c(22.1, 24.5, 26, 26.8, 28.2, 28.9, 30, 30.4, 31.4, 21.9, 26.1, 28.5, 30.3, 31.5, 33.1, 22.8, 27.3, 29.8, 31.8) X <- cbind(rep(1, length(x)), x, diag(x %*% t(x))) solve(t(X) %*% X)# x # 0.253355906 -0.097147349 0.0079029365#x -0.097147349 0.063003809 -0.0062664006# 0.007902936 -0.006266401 0.0006840397 solve(t(X) %*% X) %*% t(X) %*% y# [,1]# 22.56123063#x 1.66802044# -0.06795836
6/16
推定可能関数
の各要素とその線形結合全体
※ ただし、一元配置モデルの や は推定可能であるが、 と は単独で推定可能ではない。
7/16
2.2.3 ガウス - マルコフの定理
線形モデル の任意の推定関数 について、 が一意に BLUE 。 ここで、 は、正規方程式 を満たす任意の最小二乗解。 X がフルランクの場合、任意の線形関数も 自体も推定可能で、正規方程式も一意な最小二乗解 を持つ。
8/16
証明 (1)任意の線形式 に対し、
次に、 とは別の線形不偏推定量 との差を次のように定義する。
このとき、不偏性から、全ての について となるべきで、
が任意の で成り立つので、
9/16
<= 不偏
証明 (2)
10/16
二つの確率変数 X, Y に対して
であるから、 の分散は、
一方、誤差 ε が無相関で等分散の仮定 (2.14) を満たせば、 2 つの確率変数
の共分散は、
よって、 ゆえに、
は任意の線形不偏推定量なので、 は BLUE
0
X がランク落ちするときの計算方法
① 正規方程式 の不定解を のように表し、 の代数的な性質を使って証明する
② データを直交変換により扱いやすい標準形に変換して証明する
11/16
例 2.5 繰り返し測定のモデル :飲料製品中のエキス含有量 [ 表 2.1] p.33
y <- c(37.55, 37.74, 37.69, 37.71, 37.73, 37.81, 37.53, 37.58, 37.74)
j <- rep(1, length(y))solve(t(j) %*% j) %*% t(j) %*% y
# 37.67556 <- 1/length(y) * sum(y)
# 37.67556
12/16
例 2.6’ 単回帰データ : コンクリートの養生の温度条件と圧縮強度の関係[表 2.4 ] p.45
x <- c(2.62, 2.75, 2.85, 2.92, 2.92, 3.05, 3.14, 3.15, 3.23, 3.26, 3.36, 3.44, 3.66, 3.74, 4.04)
y <- c(209, 237, 273, 316, 283, 317, 321, 356, 404, 368, 405, 429, 413, 440, 439)
X <- cbind(rep(1, length(x)), x)(t1 <- as.vector(solve(t(X) %*% X) %*% t(X) %*%
y))# [1] -217.9524 176.1747plot(x, y); abline(as.vector(t1), col="red")
13/16
例 2.7 一元配置モデル : 脂肪の種類に対する吸収量[表 2.2 ] p.34
theta <- c(64, 72, 68, 77, 56, 95, 78, 91, 97, 82, 85, 77, 75, 93, 78, 71, 63, 76, 55, 66, 49, 64, 70, 68)
(X <- matrix(c(rep(1, length(theta)), rep(1, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6)), nc=5))
(t1 <- as.vector(solve(t(X) %*% X) %*% t(X) %*% theta))# 以下にエラー solve.default(t(X) %*% X) : # Lapack routine dgesv: システムは正確に特異です : U[5,5] =
0 require(MASS) # for ginv()(t1 <- as.vector(ginv(t(X) %*% X) %*% t(X) %*% theta))# [1] 59 13 26 17 3 # mu=59, α1=13, α2=26, α3=17, α4=3.
14/16
2.2.4 最小二乗法と制約式★ 例 2.7 に、 mu=0 という制約をつけて解いてみる(X2 <- matrix(c(rep(1, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6)), nc=4))(t2 <- as.vector(solve(t(X2) %*% X2) %*% t(X2) %*% theta))#[1] 72 85 76 62 ★ 例 2.7 に、 という制約をつけてみる require(MASS)# for ginv()(X3 <- matrix(c(rep(1, length(theta)), rep(0, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6)), nc=5))(t3 <- as.vector(ginv(t(X3) %*% X3) %*% t(X3) %*% theta))# [1] 7.200000e+01 -3.478067e-15 1.300000e+01 4.000000e+00 -1.000000e+01
15/16
★ 例 2.7 に、 という制約をつけるtheta <- c(64, 72, 68, 77, 56, 95, 78, 91, 97, 82, 85,
77, 75, 93, 78, 71, 63, 76, 55, 66, 49, 64, 70, 68)(X4 <- matrix(c(rep(1, length(theta)), rep(1, 6),
rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6), rep(0, 24), rep(1, 6)), nc=5)) # 通常の計画行列
X4[19:24,] <- c(rep(1, 6), rep(-1, 18), rep(0, 6))X4(t4 <- as.vector(ginv(t(X4) %*% X4) %*% t(X4) %*%
theta))# [1] 73.75 -1.75 11.25 2.25 0.00# mu= 73.75, α1= -1.75, α2=11.25, α3= 2.25,# α4=-(α1 + α2+ α3 )=-11.75 # -sum(t4[2:4])
16/16
おまけMS Office の数式エディタは、 TeX のような入力が可能
例 ) y_i = \beta_0 + \beta_1 x_i + \beta_2 x_i^2 + \varepsilon_i
※ ただし、完全に入力が互換というわけではない。
おわり
@ 足利フラワーパーク