Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
2003年11月8日 1
ノンパラメトリック回帰分析と
生命表
慶應義塾大学 総合政策学部
小暮 厚之
日本保険・年金リスク学会第1回大会共催:慶應義塾大学 政策・メディア研究科
21世紀COE「日本・アジアにおける総合政策学」
金融工学による保険・保証の分析 プロジェクト
2
はじめに
• 「生命表」は,特定の人口集団の死亡確率を表すもので
あり,生命保険の料率や年金の計算基礎を与える.
それは,各年齢に対して「1年以内に死亡する確率」を与える.
• 生命表は,基礎データからの単純な「粗死亡率」を「補整」することによって得られる.
• 本報告では,「生保標準生命表1996」を例にとって,ノンパラメトリック回帰の観点から「補整」を考察する.
3
生命表(1)「生保標準生命表1996」(男子) より
3.48 491.44 390.84 291.15 190.17 9
3.21 481.33 380.84 281.09 180.19 8
2.96 471.22 370.85 270.94 170.21 7
2.73 461.13 360.85 260.73 160.22 6
2.51 451.05 350.86 250.52 150.22 5
2.29 440.98 340.88 240.34 140.24 4
2.08 430.92 330.92 230.22 130.33 3
1.88 420.88 320.99 220.15 120.50 2
1.71 410.85 311.07 210.14 110.76 1
1.56 400.84 301.14 200.15 101.10 0
1000qxx1000qxx1000qxx1000qxx1000qxx
死亡率年齢死亡率年齢死亡率年齢死亡率年齢死亡率年齢
4age(years)
mor
talit
y R
ate(
perm
ills)
0 10 20 30 40 50
12
3
生保標準生命表死亡率
粗死亡率
生命表(2)生保標準死亡率と粗死亡率
5
<定義>x歳になったばかりの人が1年以内に死亡する確率
ただし,Tx = x 歳の人の余命年数(確率変数)
生命表(3)死亡率
6
生命表(4)死亡率のパラメトリック・モデル
• Weibull法則
•Makeham-Gompertz法則
参考:荒井 昭 (2001) 「生命表に関する一考察:生命関数の数式近似」
アクチュアリー会会報 No.54(第2分冊)
7
生命表(5)補整(Graduation)
• 基礎データ(粗死亡率)は,既存のパラメトリック・モデルにうまくあてはまらない
• パラメトリック・モデルをフィットさせる代わりに,基礎データをノンパラメトリックに平滑化して,真の死亡率を推定する.これを「補整」(graduation)という.
8
基礎データと粗死亡率(1)生保標準生命表(男子)
• 生保22社の契約者のデータ
• 観察年数
15歳以上:1989-1991年(有審査)
14歳以下:1986-1991年(有無審査)
9
基礎データと粗死亡率(2)Lexis Diagram
観測期間
X歳
X+1歳
10
粗死亡率
• ex=経過契約件数
=Lexi Diagramの各線分の縦方向の長さの和• dx=死亡数
=Lexi Diagramで観測される死亡数
基礎データと粗収益(3)粗死亡率
その他の定義
11
生保標準生命表の補整(1)3段階の補整
• 1次補整
「数学的危険論」による補整
• 2次補整
Grevilleの補整=移動平均による平滑化
• 3次補整
52歳以上の粗死亡率データにMakeham-Gompertz法則をあてはめる
いわゆる補整(Graduation)
12
生保標準生命表の補整(2)第1次補整値
ここで
は N(μ, σ2)の密度関数
なぜ400万件か⇒想定保険会社の契約件数?第1次補整値=「想定保険会社」にとっての死亡率の上限(上側2.5%点)
粗死亡率
13
生保標準生命表の補整(3)第2次補整:移動平均
Grevilleの3次13項式
ここで
14
j
aj
-6 -4 -2 0 2 4 6
0.0
0.05
0.10
0.15
0.20
0.25
Grevilleの3次13項
移動平均
の加重
3次の移動
平均の性質
生保標準生命表の補整(4)第2次補整:移動平均の性質
15
平滑化の意味(1)第2次補整値
2次補整値
1次補整値
これを考える!
16
平滑化の意味(2)粗死亡率データの構造
• データ
• 構造
真の死亡率 誤差項
年齢
粗死亡率
17
平滑化の意味(3)
移動平均の期待値
xの近傍で成立,qが3次関数ならば厳密に成立
3次の移動
平均の性質
18
平滑化の意味(4)
移動平均の分散
もしも誤差分散が一定ならば,分散は5分の1に減少!
19
ノンパラメトリック回帰 (1)基本モデル
被説明変数:粗死亡率説明変数:年齢
誤差分散
基準化誤差項
に関する統計的推測補整とは ⇒
20
ノンパラメトリック回帰(2)様々な補整法
• カーネル法いわゆるカーネル法の応用
(c.f. Copas, J and Haberman,1983) 「漸近理論」が主体,境界問題
• 局所回帰法通常の回帰分析の拡張としてモデリング
「有限標本理論」
• 局所尤度法通常の一般化線形モデルの拡張としてモデリング
21
カーネル法としての移動平均補整Nadaraya-Watsonカーネル推定量
ここで K:カーネル関数, h:バンド幅(>0)
もしも とおくと
ただし
22
カーネル法としての移動平均補整(2) カーネル関数の形状
Kernel functions
z
K(z
)
-1.0 -0.5 0.0 0.5 1.0
0.0
0.5
1.0
1.5Triweight:K(z)=(32/35)(1-z2)3
4次オーダー
23
カーネル法としての移動平均補整(3)
Grevilleの3次13項式移動平均(生保標準生命表)は
1. 4次オーダーカーネル推定量
2. 13項式は,最近傍の13個の観測値を用いる
バンド幅に対応する
と理解できる
移動平均をカーネル平滑化の特殊ケースと考えることによって,
カーネル法の理論を用いることができる.
24
カーネル法としての移動平均補整(4)カーネル法の問題点
• 補整の境界問題xが境界0に近いとき,カーネル推定量はバイアスが大きくなる(境界問題).境界に近い点では,通常のカーネルと異なる「境界修正カーネル関数」を用いる (Gabin,Haberman and Verrall, 1995).
⇒より統一的な平滑化が望まれる.
• カーネル法は特殊?カーネル法は,他の一般的統計手法(回帰分析や最尤法)とは異質(?),漸近理論が主体
⇒通常の統計手法に近い方法が望まれる.
25
局所回帰モデル(1)
• 点xにおける平均死亡関数q(x)のテイラー近似
局所最小2乗法(移動最小2乗法)
局所回帰推定値
26Age (years)
Mor
talit
y R
ate
(per
mills
)
0 10 20 30 40 50
0.0
0.5
1.0
1.5
2.0
2.5
3.0
o
o
o
oo
o o o o o o o o o oo
o
oo o o
o o o o o o o o o o o o o oo
o o oo
oo
oo
o
o
o o
o
o
Local Cubic Estimator with h=NN(0.5)
局所回帰モデル(2)3種類の選択:(K=カーネル関数, p=次数, h=バンド幅,)
•K=Triweight•p=3•h=最近傍の
50%の観測値
LocfitBy
Clive (Catherine)Loader
27
局所回帰モデル(3)通常の線形モデルとの類似
• 局所最小2乗推定量
ここで被説明変数
ベクトル射影行列
28
局所回帰モデル(4)残差と自由度
•回帰ベクトル
•ハット行列
•残差ベクトル
•自由度 「パラメータの個数」
の一般化
29
局所回帰モデル(5)クロスバリデーション
• クロスバリデーション
ここで, は i番目の観測値を除いた残りの
(n-1)個の観測値からの の推定値
30
Degree= 1
Fitted DF
GC
V
3 4 5 6 7 8 9
0.02
0.06
0.10
0.14
Degree= 2
Fitted DF
GC
V
4 6 8 10 12 14 16
0.02
0.04
0.06
Degree= 3
Fitted DF
GC
V
4 6 8 10 12 14 16
0.02
0.03
0.04
Degree= 4
Fitted DF
GC
V
5 10 15 20
0.01
50.
020
0.02
5
局所回帰モデル(6)GCVによる次数の選択(a)
• 自由度mは,異なるバンド 幅hに
対応.
• hは,最近傍の観測値の20%から100%まで(5%刻み)
自由度m
•h↑⇒ m↑
31
Degree= 5
Fitted DF
GC
V
10 15 20
0.01
20.
016
0.02
0Degree= 6
Fitted DF
GC
V
10 15 20 25 30
0.02
0.04
0.06
0.08
Degree= 7
Fitted DF
GC
V
10 15 20 25 30
0.02
0.04
0.06
0.08
Degree= 8
Fitted DF
GC
V
15 20 25 30 35 40
0.0
0.1
0.2
0.3
0.4
局所回帰モデル(7)GCVによる次数の選択(b)
こ
れ
を
選
択
32
局所回帰モデル(8)GCVによるカーネル関数の選択
Epanecnikov
Fitted DF
GC
V
10 15 20
0.01
20.
016
0.02
0
Rectangular
Fitted DF
GC
V
6 8 10 12 14 16 18 20
0.01
20.
016
0.02
0
Triweight
Fitted DF
GC
V
10 15 20 25
0.01
20.
016
0.02
0
Gaussian
Fitted DFG
CV
8 10 12 14 16 18 20
0.01
20.
016
0.02
0
33
局所回帰モデル(9)選択されたモデル
Age (years)
Mor
talit
y R
ate
(per
mill)
0 10 20 30 40 50
0.0
0.5
1.0
1.5
2.0
2.5
3.0
o
o
o
oo
o o o o o o o o o oo
o
oo o o
o o o o o o o o o o o o o oo
o o oo
oo
oo
o
o
o o
o
o
Age (years)
Res
idua
ls (p
erm
ill)
0 10 20 30 40 50
-0.4
-0.2
0.0
0.2
推定式 残差
K=Epanchnikov, p=5,h=NN(0.65))
34
局所回帰モデル(10)標準生命表死亡率 VS 局所回帰補整値
Age (years)
Mor
talit
yRat
e (p
erm
ill)
0 10 20 30 40 50
12
3
生保標準生命表
局所回帰補整値
35
加重局所回帰法(1)
死亡率データは,
は試行回数が , 成功確率が
の2項分布に従うと考えれば
死亡数 契約数
36
加重局所回帰法 (2)粗死亡率の標準偏差
Age (years)
Sta
ndar
d D
evia
tion
0 10 20 30 40 50
02*
10^-
84*
10^-
86*
10^-
88*
10^-
810
^-7
Standard Deviations of Crude Mortality Rates
37
⇒
加重局所回帰法(3)分散安定化変換
38Age (years)
Mor
talit
y R
ate
(per
mill)
0 10 20 30 40 50
0.0
0.5
1.0
1.5
2.0
2.5
3.0
K=Epanechnikov, p=4, h=NW(0.8)
加重局所回帰モデル
加重局所最小2乗法(4)選択されたモデル
通常の局所回帰モデル
39
加重局所回帰法 (5)生保標準生命表死亡率VS加重局所回帰補整値
Age (years)
Mor
talit
yRat
e (p
erm
ill)
0 10 20 30 40 50
12
3
生保標準生命表死亡率
加重局所回帰補整値
40
局所尤度モデル(1)死亡率データの尤度
• diが試行回数 ei,成功(死亡)確率 q(xi) の2項
確率分布に従うとき,死亡率の対数尤度は
ただし
(ロジスティック・リンク)
41
局所尤度モデル(2)
対数尤度
局所尤度推定量
42
局所尤度モデル (3)クロスバリデーション
ここで, は i番目の観測値を除いた残りの
n-1個の観測値からの の推定値
通常の最尤推定量 局所尤度法による推定量
•
•
•
43
局所尤度モデル(4)選択されたモデル
Age (years)
Mor
talit
y R
ate
(per
mill
)
0 10 20 30 40 50
0.5
1.0
1.5
2.0
2.5
3.0
局所尤度
加重局所回帰
K=Epanecnhikov, p=3, h=NN(0.6))
44
局所尤度モデル(5)生保標準生命表死亡率 VS局所尤度補整値
Age (years)
Mor
talit
yRat
e (p
erm
ill)
0 10 20 30 40 50
12
3
生保標準生命表
局所尤度法補整値
45
粗死亡率データ を2項分布以外の分布で
モデル化する方が適切かもしれない.
局所尤度モデル(6)将来の課題
「ポアソン分布」+「ガンマ分布」
• dxが平均が のポアソン分布に従う.
ここで はx+0.5歳の死力
• exがパラメータが
のガンマ分布に従う.
例えば:
46
まとめ
• ノンパラメトリック回帰の考え方を利用することにより,より「客観的」で「アカウンタブル」な補整(graduation) が可能となる.
• 特に,現行の生保標準生命表の補整(Grevilleの移動平均)では,バンド幅が短すぎることが示唆される.
• 将来,様々な(より細分化された)人口集団に対する保険を考えるとき,ノンパラメトリック回帰はさらに有用な生命表作成の手段を提供すると期待される.
47
参考文献
二見 隆 「生命保険数学」 上巻 (1992) 生命保険文化研究所
Copas, J and Haberman (1983) “Non-parametric Graduation Using Kernel Methods,” Journal of the Institute of Actuaries, 118, 135-156.
Fan J. and Gijbels, I (1996) Local Polynomial Modelling and Its Applications, Chapman and Hall.
Gavin, G., Haberman, S. and Verrall, R. (1995): "Graduation by Kernel and Adaptive Kernel Methods with a Boundary Correction," Transactions of Society of Actuaries, 47, 173-209
Gerber, H.(1991) Life Insurance Mathematics, Springer.