ノンパラメトリック回帰分析と生命表JARIP.pdf2 はじめに • 「生命表」は，特定の人口集団の死亡確率を表すものであり，生命保険の料率や年金の計算基礎を与える．

２００３年１１月８日 1

ノンパラメトリック回帰分析と

生命表

慶應義塾大学総合政策学部

小暮厚之

[email protected]

日本保険・年金リスク学会第１回大会共催：慶應義塾大学政策・メディア研究科

２１世紀ＣＯＥ「日本・アジアにおける総合政策学」

金融工学による保険・保証の分析プロジェクト

2

はじめに

• 「生命表」は，特定の人口集団の死亡確率を表すもので

あり，生命保険の料率や年金の計算基礎を与える．

それは，各年齢に対して「1年以内に死亡する確率」を与える．

• 生命表は，基礎データからの単純な「粗死亡率」を「補整」することによって得られる．

• 本報告では，「生保標準生命表１９９６」を例にとって，ノンパラメトリック回帰の観点から「補整」を考察する．

3

生命表(1)「生保標準生命表1996」（男子）より

3.48 491.44 390.84 291.15 190.17 9

3.21 481.33 380.84 281.09 180.19 8

2.96 471.22 370.85 270.94 170.21 7

2.73 461.13 360.85 260.73 160.22 6

2.51 451.05 350.86 250.52 150.22 5

2.29 440.98 340.88 240.34 140.24 4

2.08 430.92 330.92 230.22 130.33 3

1.88 420.88 320.99 220.15 120.50 2

1.71 410.85 311.07 210.14 110.76 1

1.56 400.84 301.14 200.15 101.10 0

1000qxx1000qxx1000qxx1000qxx1000qxx

死亡率年齢死亡率年齢死亡率年齢死亡率年齢死亡率年齢

4age(years)

mor

talit

y R

ate(

perm

ills)

0 10 20 30 40 50

12

3

生保標準生命表死亡率

粗死亡率

生命表(2)生保標準死亡率と粗死亡率

5

<定義>x歳になったばかりの人が1年以内に死亡する確率

ただし，Tx = x 歳の人の余命年数（確率変数）

生命表(3)死亡率

6

生命表(4)死亡率のパラメトリック・モデル

• Weibull法則

•Makeham-Gompertz法則

参考：荒井昭 (2001) 「生命表に関する一考察：生命関数の数式近似」

アクチュアリー会会報 No.54（第2分冊）

7

生命表(5)補整(Graduation)

• 基礎データ（粗死亡率）は，既存のパラメトリック・モデルにうまくあてはまらない

• パラメトリック・モデルをフィットさせる代わりに，基礎データをノンパラメトリックに平滑化して，真の死亡率を推定する．これを「補整」(graduation)という．

8

基礎データと粗死亡率（１）生保標準生命表（男子）

• 生保２２社の契約者のデータ

• 観察年数

１５歳以上：1989-1991年（有審査）

１４歳以下：1986-1991年（有無審査）

9

基礎データと粗死亡率(2)Lexis Diagram

観測期間

X歳

X+1歳

10

粗死亡率

• ex=経過契約件数

=Lexi Diagramの各線分の縦方向の長さの和• dx=死亡数

=Lexi Diagramで観測される死亡数

基礎データと粗収益（３）粗死亡率

その他の定義

11

生保標準生命表の補整(1)３段階の補整

• １次補整

「数学的危険論」による補整

• ２次補整

Grevilleの補整=移動平均による平滑化

• ３次補整

５２歳以上の粗死亡率データにMakeham-Gompertz法則をあてはめる

いわゆる補整（Graduation）

12

生保標準生命表の補整(2)第１次補整値

ここで

は N(μ, σ2)の密度関数

なぜ400万件か⇒想定保険会社の契約件数?第1次補整値=「想定保険会社」にとっての死亡率の上限（上側2.5％点）

粗死亡率

13

生保標準生命表の補整(3)第２次補整：移動平均

Grevilleの３次１３項式

ここで

14

j

aj

-6 -4 -2 0 2 4 6

0.0

0.05

0.10

0.15

0.20

0.25

Grevilleの3次13項

移動平均

の加重

3次の移動

平均の性質

生保標準生命表の補整(4)第２次補整：移動平均の性質

15

平滑化の意味(1)第２次補整値

２次補整値

１次補整値

これを考える！

16

平滑化の意味(2)粗死亡率データの構造

• データ

• 構造

真の死亡率誤差項

年齢

粗死亡率

17

平滑化の意味（3）

移動平均の期待値

xの近傍で成立，qが３次関数ならば厳密に成立

3次の移動

平均の性質

18

平滑化の意味（4）

移動平均の分散

もしも誤差分散が一定ならば，分散は５分の１に減少！

19

ノンパラメトリック回帰 (1)基本モデル

被説明変数：粗死亡率説明変数：年齢

誤差分散

基準化誤差項

に関する統計的推測補整とは ⇒

20

ノンパラメトリック回帰(2)様々な補整法

• カーネル法いわゆるカーネル法の応用

（c.f. Copas, J and Haberman,1983) 「漸近理論」が主体，境界問題

• 局所回帰法通常の回帰分析の拡張としてモデリング

「有限標本理論」

• 局所尤度法通常の一般化線形モデルの拡張としてモデリング

21

カーネル法としての移動平均補整Nadaraya-Watsonカーネル推定量

ここで K：カーネル関数, h：バンド幅(>0)

もしもとおくと

ただし

22

カーネル法としての移動平均補整(2) カーネル関数の形状

Kernel functions

z

K(z

)

-1.0 -0.5 0.0 0.5 1.0

0.0

0.5

1.0

1.5Triweight:K(z)=(32/35)(1-z2)3

４次オーダー

23

カーネル法としての移動平均補整(3)

Grevilleの３次１３項式移動平均（生保標準生命表）は

1. ４次オーダーカーネル推定量

2. １３項式は，最近傍の１３個の観測値を用いる

バンド幅に対応する

と理解できる

移動平均をカーネル平滑化の特殊ケースと考えることによって，

カーネル法の理論を用いることができる．

24

カーネル法としての移動平均補整(4)カーネル法の問題点

• 補整の境界問題xが境界0に近いとき，カーネル推定量はバイアスが大きくなる（境界問題）．境界に近い点では，通常のカーネルと異なる「境界修正カーネル関数」を用いる (Gabin,Haberman and Verrall, 1995)．

⇒より統一的な平滑化が望まれる．

• カーネル法は特殊？カーネル法は，他の一般的統計手法（回帰分析や最尤法）とは異質（？），漸近理論が主体

⇒通常の統計手法に近い方法が望まれる．

25

局所回帰モデル(1)

• 点xにおける平均死亡関数q(x)のテイラー近似

局所最小2乗法（移動最小2乗法）

局所回帰推定値

26Age (years)

Mor

talit

y R

ate

(per

mills

)

0 10 20 30 40 50

0.0

0.5

1.0

1.5

2.0

2.5

3.0

o

o

o

oo

o o o o o o o o o oo

o

oo o o

o o o o o o o o o o o o o oo

o o oo

oo

oo

o

o

o o

o

o

Local Cubic Estimator with h=NN(0.5)

局所回帰モデル(2)３種類の選択：（K=カーネル関数, p=次数, h=バンド幅,）

•K=Triweight•p=3•h=最近傍の

50%の観測値

LocfitBy

Clive (Catherine)Loader

27

局所回帰モデル(3)通常の線形モデルとの類似

• 局所最小２乗推定量

ここで被説明変数

ベクトル射影行列

28

局所回帰モデル(4)残差と自由度

•回帰ベクトル

•ハット行列

•残差ベクトル

•自由度「パラメータの個数」

の一般化

29

局所回帰モデル(5)クロスバリデーション

• クロスバリデーション

ここで，は i番目の観測値を除いた残りの

（n-1）個の観測値からのの推定値

30

Degree= 1

Fitted DF

GC

V

3 4 5 6 7 8 9

0.02

0.06

0.10

0.14

Degree= 2

Fitted DF

GC

V

4 6 8 10 12 14 16

0.02

0.04

0.06

Degree= 3

Fitted DF

GC

V

4 6 8 10 12 14 16

0.02

0.03

0.04

Degree= 4

Fitted DF

GC

V

5 10 15 20

0.01

50.

020

0.02

5

局所回帰モデル(6)GCVによる次数の選択(a)

• 自由度mは，異なるバンド幅hに

対応．

• hは，最近傍の観測値の20%から100%まで（5%刻み）

自由度m

•h↑⇒ m↑

31

Degree= 5

Fitted DF

GC

V

10 15 20

0.01

20.

016

0.02

0Degree= 6

Fitted DF

GC

V

10 15 20 25 30

0.02

0.04

0.06

0.08

Degree= 7

Fitted DF

GC

V

10 15 20 25 30

0.02

0.04

0.06

0.08

Degree= 8

Fitted DF

GC

V

15 20 25 30 35 40

0.0

0.1

0.2

0.3

0.4

局所回帰モデル(7)GCVによる次数の選択(b)

こ

れ

を

選

択

32

局所回帰モデル(8)GCVによるカーネル関数の選択

Epanecnikov

Fitted DF

GC

V

10 15 20

0.01

20.

016

0.02

0

Rectangular

Fitted DF

GC

V

6 8 10 12 14 16 18 20

0.01

20.

016

0.02

0

Triweight

Fitted DF

GC

V

10 15 20 25

0.01

20.

016

0.02

0

Gaussian

Fitted DFG

CV

8 10 12 14 16 18 20

0.01

20.

016

0.02

0

33

局所回帰モデル(9)選択されたモデル

Age (years)

Mor

talit

y R

ate

(per

mill)

0 10 20 30 40 50

0.0

0.5

1.0

1.5

2.0

2.5

3.0

o

o

o

oo

o o o o o o o o o oo

o

oo o o

o o o o o o o o o o o o o oo

o o oo

oo

oo

o

o

o o

o

o

Age (years)

Res

idua

ls (p

erm

ill)

0 10 20 30 40 50

-0.4

-0.2

0.0

0.2

推定式残差

K=Epanchnikov, p=5，h=NN(0.65))

34

局所回帰モデル(10)標準生命表死亡率 VS 局所回帰補整値

Age (years)

Mor

talit

yRat

e (p

erm

ill)

0 10 20 30 40 50

12

3

生保標準生命表

局所回帰補整値

35

加重局所回帰法(1)

死亡率データは，

は試行回数が , 成功確率が

の２項分布に従うと考えれば

死亡数契約数

36

加重局所回帰法 (2)粗死亡率の標準偏差

Age (years)

Sta

ndar

d D

evia

tion

0 10 20 30 40 50

02*

10^-

84*

10^-

86*

10^-

88*

10^-

810

^-7

Standard Deviations of Crude Mortality Rates

37

⇒

加重局所回帰法(3)分散安定化変換

38Age (years)

Mor

talit

y R

ate

(per

mill)

0 10 20 30 40 50

0.0

0.5

1.0

1.5

2.0

2.5

3.0

K=Epanechnikov, p=4, h=NW(0.8)

加重局所回帰モデル

加重局所最小２乗法(4)選択されたモデル

通常の局所回帰モデル

39

加重局所回帰法 (5)生保標準生命表死亡率VS加重局所回帰補整値

Age (years)

Mor

talit

yRat

e (p

erm

ill)

0 10 20 30 40 50

12

3

生保標準生命表死亡率

加重局所回帰補整値

40

局所尤度モデル(1)死亡率データの尤度

• diが試行回数 ei，成功（死亡）確率 q(xi) の2項

確率分布に従うとき，死亡率の対数尤度は

ただし

（ロジスティック・リンク）

41

局所尤度モデル(2)

対数尤度

局所尤度推定量

42

局所尤度モデル (3)クロスバリデーション

ここで，は i番目の観測値を除いた残りの

n-1個の観測値からのの推定値

通常の最尤推定量局所尤度法による推定量

•

•

•

43

局所尤度モデル(4)選択されたモデル

Age (years)

Mor

talit

y R

ate

(per

mill

)

0 10 20 30 40 50

0.5

1.0

1.5

2.0

2.5

3.0

局所尤度

加重局所回帰

K=Epanecnhikov, p=3, h=NN(0.6))

44

局所尤度モデル(5)生保標準生命表死亡率 VS局所尤度補整値

Age (years)

Mor

talit

yRat

e (p

erm

ill)

0 10 20 30 40 50

12

3

生保標準生命表

局所尤度法補整値

45

粗死亡率データを２項分布以外の分布で

モデル化する方が適切かもしれない．

局所尤度モデル(6)将来の課題

「ポアソン分布」+「ガンマ分布」

• dxが平均がのポアソン分布に従う．

ここではx+0.5歳の死力

• exがパラメータが

のガンマ分布に従う．

例えば：

46

まとめ

• ノンパラメトリック回帰の考え方を利用することにより，より「客観的」で「アカウンタブル」な補整（graduation) が可能となる．

• 特に，現行の生保標準生命表の補整（Grevilleの移動平均）では，バンド幅が短すぎることが示唆される．

• 将来，様々な（より細分化された）人口集団に対する保険を考えるとき，ノンパラメトリック回帰はさらに有用な生命表作成の手段を提供すると期待される．

47

参考文献

二見隆「生命保険数学」上巻 (1992) 生命保険文化研究所

Copas, J and Haberman (1983) “Non-parametric Graduation Using Kernel Methods,” Journal of the Institute of Actuaries, 118, 135-156.

Fan J. and Gijbels, I (1996) Local Polynomial Modelling and Its Applications, Chapman and Hall.

Gavin, G., Haberman, S. and Verrall, R. (1995): "Graduation by Kernel and Adaptive Kernel Methods with a Boundary Correction," Transactions of Society of Actuaries, 47, 173-209

Gerber, H.(1991) Life Insurance Mathematics, Springer.

Documents

ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は，特定の人口集団の死亡確率を表すもので あり，生命保険の料率や年金の計算基礎を与える．

ノンパラメトリック回帰分析と生命表JARIP.pdf2 はじめに • 「生命表」は，特定の人口集団の死亡確率を表すものであり，生命保険の料率や年金の計算基礎を与える．