w Á Ê u ` i » ã Û ¯ X N j - æ3 ñ F ¡ X N Ì v I ª数学特別講義（現代保険リスク理論）第3 回：複合リスクの統計的推測清水泰隆早稲田大学

.

.

. ..

.

.

数学特別講義（現代保険リスク理論）第 3回：複合リスクの統計的推測

清水泰隆

早稲田大学　理工学術院

集中講義＠京大数学教室　 2016年 1月 4–8日

清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 1 / 33

Part I

.

.

. ..

.

.

統計的推測の基礎概念


推定量の漸近的性質

X1, . . . ,Xn：分布 Fθ0(密度関数 fθ0)からの標本に対し，θ0 の推定量 θn を作ったとする．

θn →p θ: (弱)一致推定量 (consistent estimator)

θn → θ a.s.: 強一致推定量

ある非確率的な数列 φn で φn → ∞ (n → ∞)を満たすものが存在して

φn

(θn − θ

)→d N(0, σ2), n → ∞

漸近正規性 (asymptotic normality)

漸近正規し，σ2 = I−1(θ0)となるもの：漸近有効性 (asymptotic efficienty)

I (θ) = Eθ

[(∂θ log fθ(X1))

2]

Fisher情報量

= −Eθ

[∂2θ log fθ(X1)

](微分と積分の順序交換が可能なら．．．)


パラメトリック法 vs. ノンパラメトリック法

分布 F からの観測 X1, . . . ,Xn を得たとき，未知量 θ = θ(F )に対する推定法

パラメトリック法： F に対して，パラメータに依存する分布族PΘ := Fθ(x) | θ ∈ Θ(パラメトリック・モデル)を与えておき，データから母数 θを推定することにより F を特定する方法．⇒ ex. 最尤推定，モーメント法，最小２乗法．．．

ノンパラメトリック法： F にモデルを仮定せず，データから直接 F (x)の曲線の形を推定する方法．⇒ ex. 経験推定，カーネル推定，スプライン法，

それぞれの利点・欠点？


最尤推定法，MLE

無作為標本 X1,X2, . . . ,Xn ∼ Fθ0，母数 θ0 ∈ Rは未知．この θ0 の推定のために，母数 θ を持つような分布族 (or 確率密度関数の族)

PΘ := Fθ (or fθ) | θ ∈ Θ, Θ ⊂ R

を考える．Θを母数空間 (parameter space)という．

.

最尤法の思想

.

.

.

. ..

. .

データ X1,X2, . . . ,Xn が得られたのは，それが最も出やすいデータであったからだ．その確率は

Ln(θ) =n∏

i=1

fθ(Xi ) 「尤度 (likelihood): 尤もらしさの度合い」

に依存するのだから，これを最大にする θ が最も真値 θ0 に近いはず:

最尤推定量 (MLE) θn := arg supθ∈Θ

ℓn(θ), ℓn(θ) =1

n

n∑i=1

log fθ(Xi )


MLEの漸近的性質１：一致性

.

Theorem

.

.

.

. ..

.

.

以下の (i)–(iii)の仮定の下でMLE θn は一致推定量である：

(i) Θは有界な開集合で θ0 ∈ Θ，また fθ(x)は任意の x ∈ Rで Θ上連続とする．

(ii) fθ(x) = fθ0(x) x-a.e.ならば θ = θ0．(識別性条件)

(iii) ℓ(θ) := E[log fθ(X1)] < ∞とし，supθ∈Θ

|ℓn(θ)− ℓ(θ)| P−→ 0 (対数尤度の一様収束)


識別性の意味

.

Lemma (情報量不等式)

.

.

.

. ..

.

.

Kullback-Leibler情報量 KL(fθ0 , fθ)：∀ θ ∈ Θに対して，

KL(fθ0 , fθ) :=

∫Rfθ0(x) log

fθ0(x)

fθ(x)dx ≥ 0,

等号は fθ = fθ0 a.e.のときに限る．

.

Proof.

.

.

.

. ..

.

.

凸関数 φ(x) = − log x に Jensenの不等式を用いる：

KL(fθ0 , fθ) = E[φ

(fθ(X1)

fθ0(X1)

)]≥ φ

(E[fθ(X1)

fθ0(X1)

])= φ

(∫Rfθ(x) dx

)= 0

つまり，(ii)識別性の下では，θ = θ0 は ℓ(θ)の一意な最大点：

KL(fθ0 , fθ) = ℓ(θ0)− ℓ(θ) ≥ 0, ∀ θ ∈ Θ


対数尤度の一様収束

.

Lemma

.

.

.

. ..

.

.

以下の (a)–(c)を仮定する：

(a) Θ ⊂ Rは有界．(b) ある関数 L(x)が存在して，任意の θ1, θ2 ∈ Θに対して

|log fθ1(x)− log fθ2(x)| ≤ L(x)|θ1 − θ2|.

(c) ある定数 C > 0が存在して，任意の θ ∈ Θに対して

E[L(X1)] + E [| log fθ(X1)|] ≤ C .

このとき，supθ∈Θ

|ℓn(θ)− ℓ(θ)| → 0 a.s.


MLEの漸近的性質２：漸近正規性簡単の為に，θn ∈ Θ (開集合)とすると

∂θℓn(θn) = 0

Taykorの公式：θ∗n = ∃ρθ0 + (1− ρ)θn

∂θℓn(θn)− ∂θℓn(θ0) = ∂2θℓn(θ

∗n )(θn − θ0)

⇔√n(θn − θ0) = −

√n∂θℓn(θ0)

∂2θℓn(θ

∗n )

= −1√n

∑ni=1 ∂θ log fθ0(Xi )

1n

∑ni=1 ∂

2θ log fθ∗n (Xi )

大数の法則 +連続写像定理: n → ∞,

1

n

n∑i=1

∂2θ log fθ∗n (Xi ) → E

[∂2θ log fθ0(Xi )

]= I (θ0) (Fisher情報量)

中心極限定理: n → ∞,

1√n

n∑i=1

∂θ log fθ0(Xi )D−→ N(0, I (θ0))

√n(θn − θ0)

D−→ N(0, I−1(θ0))　⇒ 漸近有効!


MLEは漸近有効推定量

.

Theorem

.

.

.

. ..

.

.

MLE θn が θ0 の一致推定量とする．さらに以下の (i)–(iv)を仮定する：

(i) Θ ⊂ Rは凸開集合で θ0 ∈ Θ．

(ii) 任意の x ∈ Rに対して θ 7→ fθ(x)は C 2-級．

(iii) ∂kθ =

(∂∂θ

)k(k = 1, 2)に対して，

∂kθEθ0 [log fθ(X1)] = Eθ0

[∂kθ log fθ(X1)

](iv) ∂2

θℓ(θ)は Θ上連続で，|I (θ0)| > 0．

(v) supθ∈Θ

∣∣∣∂2θℓn(θ)− ∂2

θℓ(θ)∣∣∣ P−→ 0．

このとき， √n(θn − θ0

)D−→ N(0, I−1

1 (θ0)).

となり，したがって θn は漸近有効推定量である．


Z -推定法

最尤推定において，もし θn が Θ内部に値をとるとすれば，MLEを求めることは

∂θ ℓn(θ) = 0

なる θ を求めるのと同値である．

一般に，標本に基づく θ の関数 Ψn(θ) := Ψ(θ;X)に対して

Ψn(θ) = 0

を満たす推定量を Z -推定量 (Z -estimator)と呼ぶ．

ex. モーメント推定： k 次の標本積率と理論的な k 次の積率を合わせる：

θn :

∫Rxk Fθn

(dx) =1

n

n∑i=1

X ki


Z -推定量の一致性

.

Theorem

.

.

.

. ..

.

.

Θ ⊂ Rを開集合とする．θ0 ∈ Θはある非確率的な関数 Ψ : Θ → Rに対して

Ψ(θ0) = 0

で決まるとし，ランダムな関数列 Ψn : Ω×Θ → Rに対して，

Ψn(θn) = 0

なる θn が存在するとする．以下を仮定する：任意の ϵ > 0に対して，

supθ∈Θ

|Ψn(θ)−Ψ(θ)| P−→ 0; infθ∈Θ

|θ−θ0|>ϵ

|Ψ(θ)| > 0 = |Ψ(θ0)|.

このとき，Z-推定量 θn は一致性をもつ：θnP−→ θ0．


Z -推定量の漸近正規性

Ψn(θ) =1

n

n∑i=1

ψθ(Xi ) − rn

ただし，ψθ(x) は非確率的，rn は θ に依存しない確率変数列で rnP−→ r ∈ R．

.

Theorem

.

.

.

. ..

.

.

前の定理と同じ条件を仮定し，さらに以下を仮定する．

(i) Θ は凸集合．

(ii) ある関数 L : R → R が存在して，任意の θ1, θ2 ∈ Θ と任意の x ∈ R に対して，∣∣∣∂kθψθ1

(x) − ∂kθψθ2

(x)∣∣∣ ≤ L(x)|θ1 − θ2|, k = 0, 1.

(iii) E[L(X1)] + E[ψ2

θ0(X1)

]< ∞．

(iv) 各 x ∈ R に対して θ 7→ ψθ(x) は C 2 級で，

∂θE[ψθ0(X1)] = E[∂θψθ0

(X1)] = Vθ0∈ (0,∞).

このとき，n → ∞ とすると，

√n(θn − θ0

)D−→ N

(0,E

[ψθ0

(X1) − r2]V−2θ0

)清水泰隆 (早大理工) Modern Actuarial Risk Theory 第 3 回 13 / 33

複合リスクの推定

i 年目のクレーム件数を Ni とし，それぞれのクレーム額を Ui,1,Ui,2, . . . ,Ui,Ni .

Si =

Ni∑k=1

Ui,k (i 年目の累積クレーム)

m年間で得られるデータ：

1年目のデータ N1; (U1,1,U1,2, . . . ,U1,N1); S1

2年目のデータ N2; (U2,1,U2,2, . . . ,U2,N2); S2

......

n年目のデータ Nm; (Um,1,Um,2, . . . ,Um,Nm ); Sm

N1,N2, . . . ,Nm ∼ Ge(p) (IID)

Ui,j らも IIDとし，その総数を仮に nとして記号を書き直し，

(U1,1,U1,2, . . . ,U2,1,U2,2, . . . ,Um,1,Um,2, . . . ,Um,Nm ) = (V1,V2, . . . ,Vn) ∼ FU (IID)


Part II

.

.

. ..

.

.

小規模災害下でのリスク推定


複合リスクの裾関数に対する Lundberg近似

複合幾何リスク S =∑N

i=1 Ui の VaR：

F S(x) ∼1− p

γp ·m′U(γ)e

−γx, x → ∞ (Lundberg近似)

より，x = VaRα(S)として

VaRα(S) ∼ − 1

γlog

[1− α

1− pγp ·m′

U(γ)

], α → 1

ただし，γ > 0は

mU(γ)−1

p= 0

推定すべき未知量： p, γ, m′U(γ)

p: MLE

γ: Z -推定

m′U(γ): パラメトリック or ノンパラメトリック


TVaR

ρα := VaRα(S)とおくと，

TVaRα(S) =1

1− α

∫ 1

α

F−1S (z) dz

=1

1− α

∫ ∞

ρα

(z − ρα + ρα)FS(dz)

= ρα +

∫∞ρα

F S(z) dz

F S(ρα)

ここで Lunberg近似: F S(x) ∼ Ce−γx により

TVaRα(S) ∼ ρα +

∫∞ρα

e−γz dz

e−γρα= ρα +

1

γ


N1, . . . ,Nm ∼ Ge(p)

に対して，対数尤度関数は

m · ℓm(p) =m∑i=1

log(1− p)pNi = m log(1− p) +mNm log p,

母数空間を十分小さな ϵ > 0に対して

Θϵ = (ϵ, 1− ϵ)

のようにとれば真値 p について p ∈ Θϵ を仮定してもよいだろう．

MLE: pm =1

1 + Nm

.

Remark

.

.

.

. ..

.

.

母数空間を Θ = (0, 1)のようにとることは，実際上はよいが，理論上は好ましくない．このとき ℓn(0)などが定義できなくなり，ℓn の Θ = [0, 1]上での一様収束などが成り立たない．


調整係数 γの推定

γ : Ψ(r) := mU(r)−1

p= 0

方程式の推定量：クレームデータ

Ψn(r) :=1

n

n∑i=1

erVi − 1

pn= 0

ただし，pn := pm, m = m(n) ↑ ∞.


(演習) 以下の定理を証明せよ

.

Theorem

.

.

.

. ..

.

.

ある t0 > 0 とある ϵ > 0 に対して

1

p< mU (t0) < mU (t0 + ϵ) < ∞

を仮定する．また，ランダムな方程式

Ψn(r) = mU (r) −1

pn= 0

が [0, t0] において解 γn を持つとする．このとき，調整係数 γ > 0 は一意に存在して，

γnP−→ γ, n → ∞.

.

Theorem

.

.

.

. ..

.

.

上記 Theorem の条件を仮定し，さらにmU (2t0) < ∞

とする．√n (γn − γ)

D−→ N

(0,

mU (2γ) − mU (γ)

m′U (γ)

), n → ∞.


Part III

.

.

. ..

.

.

大規模災害下でのリスク推定


VaR ,TVaRの評価

.

Theorem (再掲)

.

.

.

. ..

.

.

前述の複合幾何リスク S において，クレーム分布 FU に対して以下を仮定する：

FU(x) ∈ R−κ, κ > 1.

また，xFU = ∞とする．このとき以下が成り立つ：α → 1のとき，

VaRα(S) ∼ VaRβ(U);

TVaRα(S) ∼κ

κ− 1VaRβ(U);

ESα(S) ∼1− α

κ− 1VaRβ(U).

ただし，β = 1− (1− p)(1− α)/p である.

⇒ VaRβ(U)の推定が重要！


経験推定法

クレームデータ V1,V2, . . . ,Vn を用いて手っ取り早く分布関数を推定

Fn(x) :=1

n

n∑i=1

1Vi≤x

これを VaRの定義に代入することによって，

VaRβ(U) = infx ∈ R | Fn(x) ≥ β := F−1n (β)

として VaRβ(U)を推定できる経験推定量 (empirical estimator)．特に，

β ∈(k − 1

n,k

n

]⇒ VaRU(β) = V(k)

ただし，V(1) ≤ V(2) ≤ · · · ≤ V(n) は順序統計量である．


VaR経験推定の漸近的性質

.

Theorem

.

.

.

. ..

.

.

強一致性 VaRβ(U)の経験推定量は強一致推定量である：

VaRβ(U) → VaRβ(U) a.s., n → ∞

(演習) 次項に述べる Lemmaを用いて上記の定理を証明せよ．

.

Theorem

.

.

.

. ..

.

.

漸近正規性分布関数 FU が確率密度関数 fU を持つとする．このとき，

√n(VaRβ(U)− VaRβ(U)

)D−→ N

(0,

β(1− β)

f 2U (VaRβ(U))

), n → ∞

※ この証明は少し難しい．興味のある人は van der Vaart (1998)，Chapter 21など．


一致性の証明には以下を用いよ

.

Lemma

.

.

.

. ..

.

.

F , Fn を確率分布とする．このとき，以下は同値である．

(a) F の任意の連続点 x ∈ R について Fn(x) → F (x) (Fn → F weakly と同値)

(b) F−1 の任意の連続点 β ∈ (0, 1) に対して F−1n (β) → F−1(β)

.

Proof.

.

.

.

. ..

.

.

(a)⇒(b): F は分布関数であるから不連続点の集合 D は高々可算である．そこで Z ∼ N(0, 1) とすると，P(Z ∈ D) = 0 であり，したがって，

Fn(Z) → F (Z) a.s.

標準正規分布の分布関数を Φ とすると，F−1 の連続点 β に対して

Φ(F−1n (β)) = P(Fn(Z) ≤ β) → P(F (Z) ≤ β) = Φ(F−1(β))

となり，Φ−1 の連続性により F−1n → F a.e を得る．

(b)⇒(a): U ∼ U(0, 1) とすると，上記と同様に

F−1n (U) → F−1(U) a.s. ⇒ F−1

n (U)D−→ F−1(U)

である．ここで，F−1n (U) ∼ Fn，かつ F−1(U) ∼ F となっていることに注意すると，分布収束と分布関数の (連

続点における) 収束の同値性により (a) が得られる．


経験推定の問題点

Xi := |Yi |; Yi ∼ Cauchy(0, 1)

上の図では VaR0.99(X ) ≈ 180

150を超えるような大クレームが，“もし起こっていなければ”，

VaR0.99(X ) ≈ 25

未経験の怖さ．．．．


パラメトリックモデルで裾を外挿？

どんなモデルがよいのか？

.

Theorem (Pickands-Balkema-de Hann)

.

.

.

. ..

.

.

確率分布 F が与えられたとき，ある κ > 0が存在して F ∈ R−κ となるとなるための必要十分条件は，ある正値関数 aが存在して，

limu→∞

sup0<x<∞

|F (x |u)− Gξ,a(u)(x)| = 0

となることである．ただし，F (x |u) := P(X − u ≤ x |X > u)であり，

Gξ,σ(x) = 1−(1 +

ξ

σx

)−1/ξ

, ξ = 1/κ > 0 x > 0

ある “大きな”閾値 u をうまく選べば条件 F ∈ R−κ (κ > 0)の下で，ある σ > 0が存在して

FU(·|u) ≈ Gξ,σ(·) (パレート分布!)

閾値 u はどう選ぶのか？？(実はかなりの難題です)


POT法 (Peaks-Over-Threshold method)

閾値 u の決め方？

.

Lemma

.

.

.

. ..

.

.

ξ < 1, σ > 0に対して，確率変数 X が分布 Gξ,σ に従うとき，

e(u) := E[X − u|X > u] =σ + ξu

1− ξ, β + uξ > 0.

この e(u)を平均超過関数 (mean excess function)という．

つまり，e(u)の経験推定量

en(u) =1

Nu

∑i∈∆n(u)

(Xi − u)

ただし，Nu := #∆n(u) := i |Vi > u，は u に関して線形．


e(u)のプロット例: パレート分布

(左図) パレート分布 G1/3,2 に従う 1000個の乱数の正規 QQプロット．(右図) (経験)平均超過関数 en(u)のプロット：理論上は直線 y = x/2 + 3に沿うはず．


e(u)のプロット例 (実データ)

(左図) デンマーク火災保険クレーム．(右図) その (経験)平均超過関数 en(u)のプロット．


閾値 u がうまく決定されたとしよう．ここからは，

Vi (i ∈ ∆n(u)) ∼ Gξ,σ, ξ = 1/κ > 0

なる無作為標本と考えてパラメータ ξ, σ を推定．

対数尤度

ℓn(ξ, σ; u) = −Nu log σ −(1

ξ+ 1

) ∑i∈∆n(u)

log

(1 +

ξ

σVi

)

陽には求まらないので，数値的に求める．

理論上は，ξ > −1/2のとき，Fisher情報行列 I が存在して

I =σ2

(2ξ + 1)(1 + ξ)

(2/σ2 1/σ1/σ 1 + ξ

)Nu → ∞という状況が許されるなら，

√Nu

(ξ − ξ, σ − σ

)D−→ N2(0, I

−1), Nu → ∞


VaRβ(U)の推定

仮に FU(x |u)“=”Gξ,σ(x)とすると，

FU(x) = FU(u)FU(x)− FU(u)

FU(u)+ FU(u)

= FU(x)FU(x − u|u) + FU(u)

“=”FU(u)Gξ,σ(x − u) + FU(u)

簡単の為に FU は連続であるとし ρβ := VaRβ(U)とおくと，FU(ρβ) = β より

β = FU(u)Gξ,σ(ρβ − u) + FU(u)

G−1ξ,σ(y) =

σξ

[(1− y)−ξ − 1

]に注意して，

VaRβ(U) = ρβ = u + G−1ξ,σ

(1− 1− β

FU(u)

)= u +

σ

ξ

[(FU(u)

1− β

)ξ

− 1

]X ∼ Gξ,σ ⇒ X − u′|X > u′ ∼ Gξ,σ+ξu(確認せよ)より

TVaRβ(U) = CTEβ(U) = E[U − ρβ |U > ρβ ] + ρβ

=σ + ξ(ρβ − u)

1− ξ+ ρβ =

ρβ + σ − ξu

1− ξ


Bibliography I

[1] Embrechts, P.; Kluppelberg, C. and Mikosch, T. (2003). Modelling Extremal Events for Insurance andFinance, Springer-Verlag, Berlin.

[2] Klugman, S. A.; Panjer, H. H. and Willmot, G. E. (2008). Loss models. From data to decisions. Thirdedition. Wiley Series in Probability and Statistics. John Wiley & Sons, Hoboken, NJ.

[3] Resnick, S. I. (2008). Extreme values, regular variation and point processes. Springer, New York.

[4] van der Vaart, A. W. (1998). Asymptotic statistics. Cambridge University Press, Cambridge.


Documents

w Á Ê u ` i » ã Û ¯ X N j - æ3 ñ F ¡ X N Ì v I ª数学特別講義（現代保険リスク理論） 第3 回：複合リスクの統計的推測 清水泰隆 早稲田大学

w Á Ê u ` i » ã Û ¯ X N j - æ3 ñ F ¡ X N Ì v I ª数学特別講義（現代保険リスク理論）第3 回：複合リスクの統計的推測清水泰隆早稲田大学