Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
.
.
. ..
.
.
数学特別講義(現代保険リスク理論)第 3回:複合リスクの統計的推測
清水 泰隆
早稲田大学 理工学術院
集中講義@京大 数学教室 2016年 1月 4–8日
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 1 / 33
Part I
.
.
. ..
.
.
統計的推測の基礎概念
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 2 / 33
推定量の漸近的性質
X1, . . . ,Xn:分布 Fθ0(密度関数 fθ0)からの標本に対し,θ0 の推定量 θn を作ったとする.
θn →p θ: (弱)一致推定量 (consistent estimator)
θn → θ a.s.: 強一致推定量
ある非確率的な数列 φn で φn → ∞ (n → ∞)を満たすものが存在して
φn
(θn − θ
)→d N(0, σ2), n → ∞
漸近正規性 (asymptotic normality)
漸近正規し,σ2 = I−1(θ0)となるもの:漸近有効性 (asymptotic efficienty)
I (θ) = Eθ
[(∂θ log fθ(X1))
2]
Fisher情報量
= −Eθ
[∂2θ log fθ(X1)
](微分と積分の順序交換が可能なら...)
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 3 / 33
パラメトリック法 vs. ノンパラメトリック法
分布 F からの観測 X1, . . . ,Xn を得たとき,未知量 θ = θ(F )に対する推定法
パラメトリック法: F に対して,パラメータに依存する分布族PΘ := Fθ(x) | θ ∈ Θ(パラメトリック・モデル)を与えておき,データから母数 θを推定することにより F を特定する方法.⇒ ex. 最尤推定,モーメント法,最小2乗法...
ノンパラメトリック法: F にモデルを仮定せず,データから直接 F (x)の曲線の形を推定する方法.⇒ ex. 経験推定,カーネル推定,スプライン法,
それぞれの利点・欠点?
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 4 / 33
最尤推定法,MLE
無作為標本 X1,X2, . . . ,Xn ∼ Fθ0,母数 θ0 ∈ Rは未知.この θ0 の推定のために,母数 θ を持つような分布族 (or 確率密度関数の族)
PΘ := Fθ (or fθ) | θ ∈ Θ, Θ ⊂ R
を考える.Θを母数空間 (parameter space)という.
.
最尤法の思想
.
.
.
. ..
. .
データ X1,X2, . . . ,Xn が得られたのは,それが最も出やすいデータであったからだ.その確率は
Ln(θ) =n∏
i=1
fθ(Xi ) 「尤度 (likelihood): 尤もらしさの度合い」
に依存するのだから,これを最大にする θ が最も真値 θ0 に近いはず:
最尤推定量 (MLE) θn := arg supθ∈Θ
ℓn(θ), ℓn(θ) =1
n
n∑i=1
log fθ(Xi )
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 5 / 33
MLEの漸近的性質1:一致性
.
Theorem
.
.
.
. ..
.
.
以下の (i)–(iii)の仮定の下でMLE θn は一致推定量である:
(i) Θは有界な開集合で θ0 ∈ Θ,また fθ(x)は任意の x ∈ Rで Θ上連続とする.
(ii) fθ(x) = fθ0(x) x-a.e.ならば θ = θ0.(識別性条件)
(iii) ℓ(θ) := E[log fθ(X1)] < ∞とし,supθ∈Θ
|ℓn(θ)− ℓ(θ)| P−→ 0 (対数尤度の一様収束)
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 6 / 33
識別性の意味
.
Lemma (情報量不等式)
.
.
.
. ..
.
.
Kullback-Leibler情報量 KL(fθ0 , fθ):∀ θ ∈ Θに対して,
KL(fθ0 , fθ) :=
∫Rfθ0(x) log
fθ0(x)
fθ(x)dx ≥ 0,
等号は fθ = fθ0 a.e.のときに限る.
.
Proof.
.
.
.
. ..
.
.
凸関数 φ(x) = − log x に Jensenの不等式を用いる:
KL(fθ0 , fθ) = E[φ
(fθ(X1)
fθ0(X1)
)]≥ φ
(E[fθ(X1)
fθ0(X1)
])= φ
(∫Rfθ(x) dx
)= 0
つまり,(ii)識別性の下では,θ = θ0 は ℓ(θ)の一意な最大点:
KL(fθ0 , fθ) = ℓ(θ0)− ℓ(θ) ≥ 0, ∀ θ ∈ Θ
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 7 / 33
対数尤度の一様収束
.
Lemma
.
.
.
. ..
.
.
以下の (a)–(c)を仮定する:
(a) Θ ⊂ Rは有界.(b) ある関数 L(x)が存在して,任意の θ1, θ2 ∈ Θに対して
|log fθ1(x)− log fθ2(x)| ≤ L(x)|θ1 − θ2|.
(c) ある定数 C > 0が存在して,任意の θ ∈ Θに対して
E[L(X1)] + E [| log fθ(X1)|] ≤ C .
このとき,supθ∈Θ
|ℓn(θ)− ℓ(θ)| → 0 a.s.
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 8 / 33
MLEの漸近的性質2:漸近正規性簡単の為に,θn ∈ Θ (開集合)とすると
∂θℓn(θn) = 0
Taykorの公式:θ∗n = ∃ρθ0 + (1− ρ)θn
∂θℓn(θn)− ∂θℓn(θ0) = ∂2θℓn(θ
∗n )(θn − θ0)
⇔√n(θn − θ0) = −
√n∂θℓn(θ0)
∂2θℓn(θ
∗n )
= −1√n
∑ni=1 ∂θ log fθ0(Xi )
1n
∑ni=1 ∂
2θ log fθ∗n (Xi )
大数の法則 +連続写像定理: n → ∞,
1
n
n∑i=1
∂2θ log fθ∗n (Xi ) → E
[∂2θ log fθ0(Xi )
]= I (θ0) (Fisher情報量)
中心極限定理: n → ∞,
1√n
n∑i=1
∂θ log fθ0(Xi )D−→ N(0, I (θ0))
√n(θn − θ0)
D−→ N(0, I−1(θ0)) ⇒ 漸近有効!
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 9 / 33
MLEは漸近有効推定量
.
Theorem
.
.
.
. ..
.
.
MLE θn が θ0 の一致推定量とする.さらに以下の (i)–(iv)を仮定する:
(i) Θ ⊂ Rは凸開集合で θ0 ∈ Θ.
(ii) 任意の x ∈ Rに対して θ 7→ fθ(x)は C 2-級.
(iii) ∂kθ =
(∂∂θ
)k(k = 1, 2)に対して,
∂kθEθ0 [log fθ(X1)] = Eθ0
[∂kθ log fθ(X1)
](iv) ∂2
θℓ(θ)は Θ上連続で,|I (θ0)| > 0.
(v) supθ∈Θ
∣∣∣∂2θℓn(θ)− ∂2
θℓ(θ)∣∣∣ P−→ 0.
このとき, √n(θn − θ0
)D−→ N(0, I−1
1 (θ0)).
となり,したがって θn は漸近有効推定量である.
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 10 / 33
Z -推定法
最尤推定において,もし θn が Θ内部に値をとるとすれば,MLEを求めることは
∂θ ℓn(θ) = 0
なる θ を求めるのと同値である.
一般に,標本に基づく θ の関数 Ψn(θ) := Ψ(θ;X)に対して
Ψn(θ) = 0
を満たす推定量を Z -推定量 (Z -estimator)と呼ぶ.
ex. モーメント推定: k 次の標本積率と理論的な k 次の積率を合わせる:
θn :
∫Rxk Fθn
(dx) =1
n
n∑i=1
X ki
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 11 / 33
Z -推定量の一致性
.
Theorem
.
.
.
. ..
.
.
Θ ⊂ Rを開集合とする.θ0 ∈ Θはある非確率的な関数 Ψ : Θ → Rに対して
Ψ(θ0) = 0
で決まるとし,ランダムな関数列 Ψn : Ω×Θ → Rに対して,
Ψn(θn) = 0
なる θn が存在するとする.以下を仮定する:任意の ϵ > 0に対して,
supθ∈Θ
|Ψn(θ)−Ψ(θ)| P−→ 0; infθ∈Θ
|θ−θ0|>ϵ
|Ψ(θ)| > 0 = |Ψ(θ0)|.
このとき,Z-推定量 θn は一致性をもつ:θnP−→ θ0.
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 12 / 33
Z -推定量の漸近正規性
Ψn(θ) =1
n
n∑i=1
ψθ(Xi ) − rn
ただし,ψθ(x) は非確率的,rn は θ に依存しない確率変数列で rnP−→ r ∈ R.
.
Theorem
.
.
.
. ..
.
.
前の定理と同じ条件を仮定し,さらに以下を仮定する.
(i) Θ は凸集合.
(ii) ある関数 L : R → R が存在して,任意の θ1, θ2 ∈ Θ と任意の x ∈ R に対して,∣∣∣∂kθψθ1
(x) − ∂kθψθ2
(x)∣∣∣ ≤ L(x)|θ1 − θ2|, k = 0, 1.
(iii) E[L(X1)] + E[ψ2
θ0(X1)
]< ∞.
(iv) 各 x ∈ R に対して θ 7→ ψθ(x) は C 2 級で,
∂θE[ψθ0(X1)] = E[∂θψθ0
(X1)] = Vθ0∈ (0,∞).
このとき,n → ∞ とすると,
√n(θn − θ0
)D−→ N
(0,E
[ψθ0
(X1) − r2]V−2θ0
)清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 13 / 33
複合リスクの推定
i 年目のクレーム件数を Ni とし,それぞれのクレーム額を Ui,1,Ui,2, . . . ,Ui,Ni .
Si =
Ni∑k=1
Ui,k (i 年目の累積クレーム)
m年間で得られるデータ:
1年目のデータ N1; (U1,1,U1,2, . . . ,U1,N1); S1
2年目のデータ N2; (U2,1,U2,2, . . . ,U2,N2); S2
......
n年目のデータ Nm; (Um,1,Um,2, . . . ,Um,Nm ); Sm
N1,N2, . . . ,Nm ∼ Ge(p) (IID)
Ui,j らも IIDとし,その総数を仮に nとして記号を書き直し,
(U1,1,U1,2, . . . ,U2,1,U2,2, . . . ,Um,1,Um,2, . . . ,Um,Nm ) = (V1,V2, . . . ,Vn) ∼ FU (IID)
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 14 / 33
Part II
.
.
. ..
.
.
小規模災害下でのリスク推定
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 15 / 33
複合リスクの裾関数に対する Lundberg近似
複合幾何リスク S =∑N
i=1 Ui の VaR:
F S(x) ∼1− p
γp ·m′U(γ)e
−γx, x → ∞ (Lundberg近似)
より,x = VaRα(S)として
VaRα(S) ∼ − 1
γlog
[1− α
1− pγp ·m′
U(γ)
], α → 1
ただし,γ > 0は
mU(γ)−1
p= 0
推定すべき未知量: p, γ, m′U(γ)
p: MLE
γ: Z -推定
m′U(γ): パラメトリック or ノンパラメトリック
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 16 / 33
TVaR
ρα := VaRα(S)とおくと,
TVaRα(S) =1
1− α
∫ 1
α
F−1S (z) dz
=1
1− α
∫ ∞
ρα
(z − ρα + ρα)FS(dz)
= ρα +
∫∞ρα
F S(z) dz
F S(ρα)
ここで Lunberg近似: F S(x) ∼ Ce−γx により
TVaRα(S) ∼ ρα +
∫∞ρα
e−γz dz
e−γρα= ρα +
1
γ
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 17 / 33
N1, . . . ,Nm ∼ Ge(p)
に対して,対数尤度関数は
m · ℓm(p) =m∑i=1
log(1− p)pNi = m log(1− p) +mNm log p,
母数空間を十分小さな ϵ > 0に対して
Θϵ = (ϵ, 1− ϵ)
のようにとれば真値 p について p ∈ Θϵ を仮定してもよいだろう.
MLE: pm =1
1 + Nm
.
Remark
.
.
.
. ..
.
.
母数空間を Θ = (0, 1)のようにとることは,実際上はよいが,理論上は好ましくない.このとき ℓn(0)などが定義できなくなり,ℓn の Θ = [0, 1]上での一様収束などが成り立たない.
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 18 / 33
調整係数 γの推定
γ : Ψ(r) := mU(r)−1
p= 0
方程式の推定量:クレームデータ
Ψn(r) :=1
n
n∑i=1
erVi − 1
pn= 0
ただし,pn := pm, m = m(n) ↑ ∞.
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 19 / 33
(演習) 以下の定理を証明せよ
.
Theorem
.
.
.
. ..
.
.
ある t0 > 0 とある ϵ > 0 に対して
1
p< mU (t0) < mU (t0 + ϵ) < ∞
を仮定する.また,ランダムな方程式
Ψn(r) = mU (r) −1
pn= 0
が [0, t0] において解 γn を持つとする.このとき,調整係数 γ > 0 は一意に存在して,
γnP−→ γ, n → ∞.
.
Theorem
.
.
.
. ..
.
.
上記 Theorem の条件を仮定し,さらにmU (2t0) < ∞
とする.√n (γn − γ)
D−→ N
(0,
mU (2γ) − mU (γ)
m′U (γ)
), n → ∞.
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 20 / 33
Part III
.
.
. ..
.
.
大規模災害下でのリスク推定
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 21 / 33
VaR ,TVaRの評価
.
Theorem (再掲)
.
.
.
. ..
.
.
前述の複合幾何リスク S において,クレーム分布 FU に対して以下を仮定する:
FU(x) ∈ R−κ, κ > 1.
また,xFU = ∞とする.このとき以下が成り立つ:α → 1のとき,
VaRα(S) ∼ VaRβ(U);
TVaRα(S) ∼κ
κ− 1VaRβ(U);
ESα(S) ∼1− α
κ− 1VaRβ(U).
ただし,β = 1− (1− p)(1− α)/p である.
⇒ VaRβ(U)の推定が重要!
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 22 / 33
経験推定法
クレームデータ V1,V2, . . . ,Vn を用いて手っ取り早く分布関数を推定
Fn(x) :=1
n
n∑i=1
1Vi≤x
これを VaRの定義に代入することによって,
VaRβ(U) = infx ∈ R | Fn(x) ≥ β := F−1n (β)
として VaRβ(U)を推定できる経験推定量 (empirical estimator).特に,
β ∈(k − 1
n,k
n
]⇒ VaRU(β) = V(k)
ただし,V(1) ≤ V(2) ≤ · · · ≤ V(n) は順序統計量である.
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 23 / 33
VaR経験推定の漸近的性質
.
Theorem
.
.
.
. ..
.
.
強一致性 VaRβ(U)の経験推定量は強一致推定量である:
VaRβ(U) → VaRβ(U) a.s., n → ∞
(演習) 次項に述べる Lemmaを用いて上記の定理を証明せよ.
.
Theorem
.
.
.
. ..
.
.
漸近正規性分布関数 FU が確率密度関数 fU を持つとする.このとき,
√n(VaRβ(U)− VaRβ(U)
)D−→ N
(0,
β(1− β)
f 2U (VaRβ(U))
), n → ∞
※ この証明は少し難しい.興味のある人は van der Vaart (1998),Chapter 21など.
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 24 / 33
一致性の証明には以下を用いよ
.
Lemma
.
.
.
. ..
.
.
F , Fn を確率分布とする.このとき,以下は同値である.
(a) F の任意の連続点 x ∈ R について Fn(x) → F (x) (Fn → F weakly と同値)
(b) F−1 の任意の連続点 β ∈ (0, 1) に対して F−1n (β) → F−1(β)
.
Proof.
.
.
.
. ..
.
.
(a)⇒(b): F は分布関数であるから不連続点の集合 D は高々可算である.そこで Z ∼ N(0, 1) とすると,P(Z ∈ D) = 0 であり,したがって,
Fn(Z) → F (Z) a.s.
標準正規分布の分布関数を Φ とすると,F−1 の連続点 β に対して
Φ(F−1n (β)) = P(Fn(Z) ≤ β) → P(F (Z) ≤ β) = Φ(F−1(β))
となり,Φ−1 の連続性により F−1n → F a.e を得る.
(b)⇒(a): U ∼ U(0, 1) とすると,上記と同様に
F−1n (U) → F−1(U) a.s. ⇒ F−1
n (U)D−→ F−1(U)
である.ここで,F−1n (U) ∼ Fn,かつ F−1(U) ∼ F となっていることに注意すると,分布収束と分布関数の (連
続点における) 収束の同値性により (a) が得られる.
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 25 / 33
経験推定の問題点
Xi := |Yi |; Yi ∼ Cauchy(0, 1)
上の図では VaR0.99(X ) ≈ 180
150を超えるような大クレームが,“もし起こっていなければ”,
VaR0.99(X ) ≈ 25
未経験の怖さ....
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 26 / 33
パラメトリックモデルで裾を外挿?
どんなモデルがよいのか?
.
Theorem (Pickands-Balkema-de Hann)
.
.
.
. ..
.
.
確率分布 F が与えられたとき,ある κ > 0が存在して F ∈ R−κ となるとなるための必要十分条件は,ある正値関数 aが存在して,
limu→∞
sup0<x<∞
|F (x |u)− Gξ,a(u)(x)| = 0
となることである.ただし,F (x |u) := P(X − u ≤ x |X > u)であり,
Gξ,σ(x) = 1−(1 +
ξ
σx
)−1/ξ
, ξ = 1/κ > 0 x > 0
ある “大きな”閾値 u をうまく選べば条件 F ∈ R−κ (κ > 0)の下で,ある σ > 0が存在して
FU(·|u) ≈ Gξ,σ(·) (パレート分布!)
閾値 u はどう選ぶのか??(実はかなりの難題です)
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 27 / 33
POT法 (Peaks-Over-Threshold method)
閾値 u の決め方?
.
Lemma
.
.
.
. ..
.
.
ξ < 1, σ > 0に対して,確率変数 X が分布 Gξ,σ に従うとき,
e(u) := E[X − u|X > u] =σ + ξu
1− ξ, β + uξ > 0.
この e(u)を平均超過関数 (mean excess function)という.
つまり,e(u)の経験推定量
en(u) =1
Nu
∑i∈∆n(u)
(Xi − u)
ただし,Nu := #∆n(u) := i |Vi > u,は u に関して線形.
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 28 / 33
e(u)のプロット例: パレート分布
(左図) パレート分布 G1/3,2 に従う 1000個の乱数の正規 QQプロット.(右図) (経験)平均超過関数 en(u)のプロット:理論上は直線 y = x/2 + 3に沿うはず.
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 29 / 33
e(u)のプロット例 (実データ)
(左図) デンマーク火災保険クレーム.(右図) その (経験)平均超過関数 en(u)のプロット.
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 30 / 33
閾値 u がうまく決定されたとしよう.ここからは,
Vi (i ∈ ∆n(u)) ∼ Gξ,σ, ξ = 1/κ > 0
なる無作為標本と考えてパラメータ ξ, σ を推定.
対数尤度
ℓn(ξ, σ; u) = −Nu log σ −(1
ξ+ 1
) ∑i∈∆n(u)
log
(1 +
ξ
σVi
)
陽には求まらないので,数値的に求める.
理論上は,ξ > −1/2のとき,Fisher情報行列 I が存在して
I =σ2
(2ξ + 1)(1 + ξ)
(2/σ2 1/σ1/σ 1 + ξ
)Nu → ∞という状況が許されるなら,
√Nu
(ξ − ξ, σ − σ
)D−→ N2(0, I
−1), Nu → ∞
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 31 / 33
VaRβ(U)の推定
仮に FU(x |u)“=”Gξ,σ(x)とすると,
FU(x) = FU(u)FU(x)− FU(u)
FU(u)+ FU(u)
= FU(x)FU(x − u|u) + FU(u)
“=”FU(u)Gξ,σ(x − u) + FU(u)
簡単の為に FU は連続であるとし ρβ := VaRβ(U)とおくと,FU(ρβ) = β より
β = FU(u)Gξ,σ(ρβ − u) + FU(u)
G−1ξ,σ(y) =
σξ
[(1− y)−ξ − 1
]に注意して,
VaRβ(U) = ρβ = u + G−1ξ,σ
(1− 1− β
FU(u)
)= u +
σ
ξ
[(FU(u)
1− β
)ξ
− 1
]X ∼ Gξ,σ ⇒ X − u′|X > u′ ∼ Gξ,σ+ξu(確認せよ)より
TVaRβ(U) = CTEβ(U) = E[U − ρβ |U > ρβ ] + ρβ
=σ + ξ(ρβ − u)
1− ξ+ ρβ =
ρβ + σ − ξu
1− ξ
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 32 / 33
Bibliography I
[1] Embrechts, P.; Kluppelberg, C. and Mikosch, T. (2003). Modelling Extremal Events for Insurance andFinance, Springer-Verlag, Berlin.
[2] Klugman, S. A.; Panjer, H. H. and Willmot, G. E. (2008). Loss models. From data to decisions. Thirdedition. Wiley Series in Probability and Statistics. John Wiley & Sons, Hoboken, NJ.
[3] Resnick, S. I. (2008). Extreme values, regular variation and point processes. Springer, New York.
[4] van der Vaart, A. W. (1998). Asymptotic statistics. Cambridge University Press, Cambridge.
清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 33 / 33