Mémoire présenté devant l’Institut de Science Financière ......50 Avenue Tony Garnier ... Kuo et al. [13] ont identifié trois dangers pour l’assureur qui découlent de ce

Mémoire présenté devant l’Institut de Science Financière et d’Assurances pour l’obtention du diplôme d’Actuaire de l’Université de Lyon

le 22/03/2013

Par : Nicolas Ladias Titre: Analyse des causes de rachats sur des contrats d’assurance vie

Confidentialité : NON OUI (Durée : 1 an 2 ans)

Membre du jury de l’Institut des Actuaires Entreprise :

Prévoir Membres du jury I.S.F.A. Directeur de mémoire en entreprise : M. Jean Claude AUGROS Bruno Devictor M. Alexis BIENVENÜE M. Areski COUSIN Invité : Mme Diana DOROBANTU Mme Anne EYRAUDLOISEL M. Nicolas LEBOISNE M. Stéphane LOISEL Autorisation de mise en ligne sur

un site de diffusion de documents actuariels (après expiration de l’éventuel délai de confidentialité)

Mlle Esterina MASIELLO Mme Véronique MAUMEDESCHAMPS M. Frédéric PLANCHET M. François QUITTARDPINON Mme M.

Béatrice REYFOURNIER Pierre RIBEREAU

Signature du responsable entreprise

M. ChristianYann ROBERT M. M.

Didier RULLIERE Pierre THEROND

Secrétariat Signature du candidat Mme MarieClaude MOUCHON Bibliothèque : Mme Michèle SONNIER

50 Avenue Tony Garnier 69366 Lyon Cedex 07

Université Claude Bernard – Lyon 1

INSTITUT DE SCIENCE FINANCIERE ET D'ASSURANCES

Institut de Sciences Financière et d’Assurances (ISFA)

A N A L YSE D ES C A USES D E R A C H A TS SUR D ES C O N T R A TS D’ASSURANCE VIE

Mémoire présenté par M. Ladias Nicolas, Pour l’obtention du diplôme d’actuaire Sous la direction de M. Devictor Bruno

Paris, Septembre 2012

3

Résumé

Il est important, pour une entreprise d’assurance, de connaître et pouvoir anticiper le

comportement de ses assurés afin de pouvoir piloter au mieux son activité. Dans ce but, ce

mémoire analyse les rachats de contrats d’assurance vie, plus précisément un portefeuille de

contrats vie entière et un portefeuille de contrats d’épargne.

Cette étude doit permettre de déterminer un ensemble de caractères propres à l’assuré, à la

situation économique ou encore aux contrats, qui peut donner de l’information sur le

comportement de rachat de l’assuré. Ces éléments peuvent ensuite servir de critères de

segmentation lors de la construction des lois de rachats.

Actuellement, au sein de l’entreprise Prévoir, les lois de rachats sont utilisées pour le calcul

de l’embedded value, du taux de rendement interne, et bientôt pour les provisions sous

Solvabilité 2. Elles sont calculées en fonction de l’ancienneté du contrat et de l’âge de l’assuré

pour les contrats vie entière, et en fonction de l’ancienneté du contrat et de la provision pour

l’épargne.

Pour permettre de vérifier la construction de ces lois et afin de mieux connaître ces

comportements de rachats, l’étude s’appuie sur les modèles de régression logistique. Ces

modèles permettent d’analyser et de quantifier les effets des variables retenues pour expliquer

les raisons des sorties anticipées. Les variables étudiées sont nombreuses, conjoncturelles ou

structurelles, mais ne peuvent être toutes prises en compte.

Les résultats obtenus ne nous permettent pas de dégager un effet conjoncturel, mais font

ressortir certains éléments. Les variables classiques (ancienneté, âge et provision) jouent

effectivement un rôle prépondérant et permettent d’expliquer en grande partie les choix des

assurés. On remarque aussi que certaines caractéristiques propres aux types de contrats ou à

l’entreprise ont une importance non négligeable. Ainsi, par exemple, on peut retrouver un lien

entre le réseau de distribution des contrats et les phénomènes de rachats.

Cette étude permet de valider les choix de modélisation qui ont été faits, mais la précision de

ces lois de rachats pourrait être améliorée en prenant en compte certains critères. Aussi,

l’absence d’influence conjoncturelle pendant la période étudiée ne nous permet pas de tirer de

conclusions.

Mots clés : Rachats, Modèle de régression logistique, assurance vie, Logit

4

Abstract

It is important for an insurance company to know and be able to anticipate the

behavior of its policyholders in order to drive the activity. To this end, this paper analyzes the

surrenders of life insurance, especially in whole life contract portfolio and a portfolio of

savings contracts.

This study must determine a unique set of characteristics specific of the insured, the economic

situation or of contracts which can provide information on the repurchase behavior of the

insured. These elements can then be used as segmentation when modeling the portfolio.

Currently, in the company Prévoir the surrender laws are used for the calculation of the

embedded value, the internal rate of return, and soon for the provisions under Solvency 2.

They are calculated according to seniority under the contract and the age of the insured for

whole life contract, and depending on the age of the contract and the provision for savings

contracts.

In order to verify the construction of these probabilities, so as to better know these surrender

behaviors, the study is based on logistic regression models. These models allow to analyze

and quantify the effects of variables used to explain the reasons for early exit. The variables

studied are cyclical or structural, but can not all be taken into account.

The results do not allow us to highlight a cyclical effect, but highlight some elements.

Classical variables (age, age provision) do play a role and can explain many of the choices

made by the insured. We also note that characteristics relating to types of contracts or

business have a significant importance. For example, one can find a link between the

distribution networks of contracts and repurchase phenomena.

This study helps to validate the modeling choices that were made, but the accuracy of the

modeling of surrenders behavior could be improved by taking into account some other

criteria. Also, the absence of cyclicality during the study period did not allow us to draw

conclusions.

Key words: Surrender, logistic model, logit model

5

Sommaire

Introduction ................................................................................................................................. 7

Partie 1‐ Sorties anticipées et importance de la modélisation des lois de comportement ............... 9

1) Cadre de l’étude .......................................................................................................................... 9

2) Situation future ......................................................................................................................... 12

a) QIS5, Solvabilité 2 .................................................................................................................. 12

b) Fiabilisation de la modélisation ............................................................................................. 13

3) Portefeuilles de données étudiés et méthodes ........................................................................ 16

a) Objectifs du mémoire ............................................................................................................ 16

b) Types de contrats analysés .................................................................................................... 16

c) Statistiques sur les portefeuille ............................................................................................. 19

Partie 2‐ Méthodologie ............................................................................................................... 25

1) Le modèle de régression logistique ........................................................................................... 25

a) Présentation .......................................................................................................................... 25

b) Formalisation mathématique ................................................................................................ 26

c) Estimation .............................................................................................................................. 28

d) Validation du modèle ............................................................................................................ 29

2‐ les modèles Logit multinomial et Logit emboité ........................................................................... 30

a) Logit multinomial................................................................................................................... 30

b) Logit emboité ........................................................................................................................ 32

c) Choix du modèle .................................................................................................................... 34

2) Choix et transformation des variables ...................................................................................... 35

a) Choix des variables ................................................................................................................ 35

b) Regroupement des variables ................................................................................................. 36

c) Interactions ........................................................................................................................... 37

3‐le test de Hosmer et Lemeshow .................................................................................................... 39

Partie 3‐ analyse des causes de sorties anticipées des contrats vie entière .................................. 41

1) Préparation et sélection des données ....................................................................................... 41

a) Données disponibles ............................................................................................................. 42

b) Choix des variables ................................................................................................................ 43

2) Spécification du modèle et résultats ......................................................................................... 49

a) Spécification du modèle ........................................................................................................ 49

b) Résultats et commentaires .................................................................................................... 49

3) Validation et Backtesting ........................................................................................................... 52

6

4) Conclusion ................................................................................................................................. 55

Partie 4‐ analyse des causes de sorties anticipées des contrats d’épargne ................................... 57

1) Préparation et sélection des données ....................................................................................... 57

a) Données disponibles ............................................................................................................. 57

b) Choix des variables ................................................................................................................ 58

2) Spécification du modèle et résultats ......................................................................................... 60

a) variables explicatives des modèles ....................................................................................... 60

3) Résultats et commentaires ........................................................................................................ 65

a) Sans distinction entre rachats totaux et partiels .................................................................. 65

b) Avec distinction entre rachats totaux et partiels .................................................................. 69

4) Backtesting ................................................................................................................................ 75

Conclusion ................................................................................................................................. 76

7

Introduction

La connaissance des flux futurs du passif à toujours été fondamentale pour le

pilotage de l’activité d’assurance. Afin de piloter l’équilibre de ses ressources, l’assureur doit

comprendre les comportements de sa clientèle pour pouvoir les modéliser, en évaluer les

impacts, et se couvrir contres les risques identifiés.

Ces différents risques sont nombreux, et dans le contexte actuel de baisse des rendements des

contrats d’assurance vie, il est important de pouvoir anticiper les comportements des assurés.

De plus, dans une entreprise qui distribue ses contrats en utilisant un réseau « debout », c'est-

à-dire des commerciaux qui se déplacent chez le client pour vendre leurs contrats, il est

nécessaire de prendre en compte la durée des contrats pour ajuster la rémunération du réseau.

Cette rémunération ne doit pas détériorer la rentabilité du produit tout en incitant les

conseillers à vendre le produit.

Prévoir fait partie des entreprises utilisant un réseau « debout », et pratique l’escompte de

commission.

Pour piloter l’activité d’assurance, pour fixer les rémunérations, lors de la création des

produits, la connaissance des lois de comportement est indispensable.

L’étude des comportements des assurés, dans un secteur concurrentiel et en perpétuelle

évolution, prend toute son importance au vu des éléments énumérés précédemment.

Une analyse plus fine du risque de rachat s’inscrit dans ce contexte, En effet, le

rachat est un des risques majeurs auquel est soumise une compagnie d’assurance-vie.

L’objet de ce mémoire est d’améliorer la connaissance de ce risque.

Ce mémoire s’articule autour de la recherche des causes de rachat et de

résiliation : quels facteurs peuvent influencer le comportement de l’assuré, et de quelle

manière ?

L’étude de deux différents types de contrat, d’épargne à versement libres et de prévoyance

(vie entière) permet aussi d’analyser les différentes causes de rachat, liées ou non au type de

contrat.

Il existe différents types de sorties anticipées. Dans notre étude, les contrats

peuvent être rachetés, c'est-à-dire que lorsque l’assuré décide de mettre fin à son contrat, il

reçoit une somme d’argent : la provision mathématique du contrat. Cette provision correspond

au montant des engagements de l’assureur à l’égard de l’assuré. Le rachat est prévu par le

code des assurances. Pour les contrats d’épargne, l’assuré peut choisir de retirer seulement

8

une partie de sa provision, ce qui ne met pas fin au contrat, dans ce cas, on parle de rachat

partiel.

Dans les années 80, grâce à un environnement fiscal favorable, les contrats

d’épargne ont connu un très fort développement, le risque de rachat est devenu un risque

majeur pour les sociétés d’assurance. Plusieurs travaux portent sur ce risque. Kuo et al. [13]

ont identifié trois dangers pour l’assureur qui découlent de ce phénomène. Le premier est que

les frais d’acquisition d’un contrat sont amortis durant les premières années ; si le contrat sort

prématurément du portefeuille, l’assureur n’amortira pas ces coûts. Ensuite, les « mauvais

risques », c'est-à-dire les assurés qui sont en mauvaise santé pour des contrats vie entière, sont

moins enclins à racheter leur contrat, ce qui peut impacter la sinistralité du portefeuille pour

les contrats vie entière. Enfin, l’assureur peut rencontrer un risque de liquidité lorsqu’il est

contraint de revendre ses actifs pour payer les sommes dues aux assurés. Ces trois risques

peuvent mettre l’assureur en péril s’ils ne sont pas bien connus, il est donc de son intérêt de

pouvoir anticiper au plus juste ces comportements.

La problématique de ce mémoire est la suivante : Quelles variables explicatives

peuvent améliorer notre connaissance des sorties prématurées ? Comment utiliser au mieux

les données disponibles pour avoir la vision du futur la plus juste possible ?

Le mémoire est organisé en quatre parties. Dans une première partie, un bref

panorama de l’assurance-vie en France et du contexte actuel sera réalisé. Cette première partie

sera complétée par une description des produits analysés.

Ensuite, une description des principales méthodes statistiques utilisées dans les différentes

parties sera faite. La principale technique utilisée étant la régression logistique.

Dans la troisième partie, on s’intéressera à la recherche des causes de rachat ou de résiliation

pour des contrats vie entière. Enfin, dans la dernière partie, nous nous intéresserons aux

phénomènes de rachat sur des contrats d’épargne.

9

Partie 1 Sorties anticipées et importance de la modélisation

des lois de comportement

1) Cadre de l’étude

Le marché de l’assurance-vie en France est très développé : en effet, selon la FFSA

(Fédération Française des Sociétés d’Assurance), l’assurance-vie représentait 69 % des

placements financiers des ménages en 2010, soit 112.8 milliards d’euros. Plusieurs types de

contrats existent, adaptés à chaque type d’assuré.

Dans cette étude nous analysons des contrats versant un capital en cas de décès de l’assuré,

quel que soit l’âge atteint par ce dernier (contrats vie-entière), ainsi que des contrats d’épargne

à versements libres.

Une des caractéristiques des contrats relatifs à l’assurance de personnes et aux opérations de

capitalisation est que le Code des Assurances prévoit une valeur de rachat à tout moment.

L’article L. 132-21 du Code des Assurances permet d'interrompre son contrat avant le terme

initialement prévu et d'obtenir de l'assureur le versement de la provision mathématique

constituée à la date dudit rachat. Le Code des Assurances prévoit aussi la possibilité

d’appliquer dans certains cas des pénalités en cas de rachat avant l’échéance.

Pour les contrats vie entière, la sortie anticipée du contrat peut se faire par un rachat, dans ce

cas, l’assuré interrompt son contrat et touche le montant de la provision mathématique alors

constituée. Ce type de contrat peut aussi être réduit : lorsque l’assuré cesse de payer ses

primes, ses garanties sont diminuées, et le montant du capital versé au bénéficiaire désigné en

cas de décès est moindre que le capital initialement prévu. Contrairement au rachat, la

réduction n’entraine pas une sortie du portefeuille du contrat.

Pour les contrats d’épargne, l’assuré peut choisir de racheter son contrat, dans ce cas, il

récupère la provision mathématique de son contrat, qui représente la somme que l’assureur

doit mettre en réserve pour faire face aux engagements futurs pris à l’égard de l’assuré. Cette

provision est égale aux sommes versées par l’assuré nettes de frais, et des intérêts acquis à la

date donnée. Le rachat peut être total ou partiel : si le rachat est total, l’assuré récupère la

totalité de sa provision mathématique et met ainsi un terme au contrat. Si l’assuré choisit de

10

racheter partiellement son contrat, il ne récupère qu’une partie de sa provision mathématique,

et son contrat reste en portefeuille.

Ce phénomène de sortie anticipée dépend en grande partie des motivations initiales de

l’assuré. Pour les contrats d’épargne, si l’assuré cherche à faire fructifier un capital déjà

constitué, il sera plus sensible aux évolutions de la rentabilité du contrat, et pourrait par

exemple racheter son contrat et placer l’argent ainsi obtenu sur les marchés (ou sur un autre

contrat, ou encore sur un autre support) si les conditions y sont plus avantageuses. Ce type de

contrat a fait l’objet de nombreuses études, Kaltwasser et P. Le Moine [9], X. Milhaud, M.P.

Gonon et S. Loisel [14] par exemple, qui démontrent l’influence importante des paramètres

conjoncturels. Si l’assuré a pour motivation de transmettre un patrimoine, sa sensibilité au

marché financier sera bien moindre, et un rachat de cet assuré aurait plus de chances d’avoir

pour origine un besoin immédiat de liquidité, qui pourrait par exemple être dû à un accident,

une perte de revenu, ou à d’autres raisons qui lui sont propres.

Les causes de rachat peuvent donc être multiples, désirs personnels de l’assuré, que l’on peut

analyser en étudiant ses caractéristiques personnelles, mais aussi les caractéristiques du

contrat, comme l’ancienneté, le capital qui doit être versé en cas de décès, ou encore le

contexte économique et financier.

On peut aussi se poser la question des différences qui peuvent exister entre les motivations

des rachats des contrats d’épargne, et celles des contrats vie entière.

Il est important pour l’assureur de savoir modéliser au mieux ces taux de rachat : en effet,

généralement, l’assureur supporte des frais d’acquisition durant les premières années de la vie

du contrat, alors qu’il amortit ses coûts sur la durée du contrat ; une sortie prématurée peut

donc être néfaste à sa rentabilité. Aussi, un rachat massif des contrats peut aussi mettre

l’assureur dans une situation difficile, s’il n’est pas prévu, l’assureur devra alors vendre ses

actifs prématurément pour pouvoir rembourser ses assurés, il supportera donc un risque de

liquidité. Enfin, l’assureur est soumis à un risque de sélection adverse, si les personnes en

bonne santé ont plus tendance à racheter leur contrat, l’assureur se retrouvera avec des

« mauvais » risques au sein de son portefeuille. Une bonne connaissance des causes des

sorties anticipées pourrait donc permettre à l’assureur de construire des produits permettant de

mieux contrôler les rachats, par des pénalités de rachat, ou des conditions qui peuvent inciter

l’assuré à conserver son contrat. De par cette connaissance accrue de son portefeuille,

l’assureur pourra alors se protéger contre ce risque.

11

On considère que deux types de rachat sont observés, les rachats structurels et les rachats

conjoncturels, les rachats structurels étant ceux observés dans un contexte économique

normal, généralement ce sont ceux qui surviennent pour des raisons propres à l’assuré,

comme un besoin de liquidité pouvant trouver sa cause dans une maladie, la perte d’emploi,

ou d’autres raisons.

Au contraire les rachats conjoncturels dépendent de facteurs exogènes, à l’instar des taux des

marchés : pour ces types de rachat, l’assuré retire son argent dans le but de le réinvestir

ailleurs, à de meilleures conditions. Ce type de rachat à fait l’objet de plusieurs études. On

peut retrouver par exemple dans Kaltwasser et P. Le Moine [9] une étude du rachat comme

une différence de flux entre l’engagement de l’assureur vis-à-vis de l’assuré et l’actif auquel il

est adossé. Aussi, dans l’article de X. Milhaud, M.P. Gonon et S. Loisel [14], on retrouve une

étude de l’impact de crises de corrélation entre les assurés, induites par un contexte

économique difficile.

Actuellement, les études d’impact faites par le Comité européen des contrôleurs de

l'assurance et des pensions professionnelles (EIOPA, ex CEIOPS), présentées dans la partie

suivante, conseillent de modéliser ces taux en fonction de l’écart entre les taux servis par

l’assureur et les taux moyens des emprunts d’états (TME). Lorsque le TME est supérieur au

taux servi, le rachat conjoncturel est très élevé, puis il diminue au fur et à mesure que l’écart

entre le TME et le taux servi se réduit.

Pour connaitre ce phénomène, les lois de comportement sont calculées chaque année afin

d’appréhender au mieux les sorties du portefeuille dans le futur. Ces lois sont des lois

d’expérience, calculées à l’aide des observations sur les années précédentes, dans le but de

simuler les résultats des années à venir.

Ces lois d’expérience sont actuellement utilisées pour le calcul d’Embedded Value (E.V.)

(mais aussi du taux de rendement interne (T.R.I), de la PGG provision globale de gestion).

Dans les années à venir, les provisions devront être calculées en best estimate, ce qui amènera

à utiliser ces lois de comportement pour le calcul des risques aucquel est soumise la

compagnes d’assurance.

Le « best estimate » est défini par les deux extraits suivants :

12

« La meilleure estimation est égale à la moyenne pondérée par leur probabilité des flux de

trésorerie futurs, compte tenu de la valeur temporelle de l’argent (valeur actuelle probable des

flux de trésorerie futurs), déterminée à partir de la courbe des taux sans risque pertinente. »

« Le calcul de la meilleure estimation est fondé sur des informations actuelles crédibles et des

hypothèses réalistes et il fait appel à des méthodes actuarielles et des techniques statistiques

adéquates. »

Ce phénomène de rachat est un élément important à prendre en compte dans la gestion des

compagnies d’assurance. Dans la structure actuelle de la formule standard, le rachat est l’un

des sept risques à prendre en compte dans le calcul du capital requis pour assurer la

solvabilité, pour la branche vie.

2) Situation future

a) QIS5, Solvabilité 2

Le 1er janvier 2013 de nouvelles réglementations s’appliqueront au monde de

l’assurance. Le but de cette réforme est d’encourager les assureurs et réassureurs à mettre en

place une gestion globale des risques inhérents à leurs activités, afin de mieux les

comprendre.

Cette réforme sera organisée en trois « piliers ».

Le premier pilier est lié à l’exigence quantitative de fonds propres. Il définit des niveaux

minimum de fonds propres que l’assureur doit détenir pour couvrir ses risques. On parle alors

de « Solvency Capital Requirement » (SCR).

Le second pilier définit le suivi des risques et les modalités d’intervention de l’autorité de

contrôle. Enfin, le troisième et dernier pilier concerne la communication, il définit un

ensemble de documents à présenter à l’autorité de contrôle.

Dans ce cadre, des études ont été réalisées pour évaluer l’impact de ces réformes.

A la suite de ces réformes, les calculs de provisions devront être réalisés de la même façon

que les calculs d’Embedded Value, c'est-à-dire en best estimate . L’expérience du portefeuille

devra être prise en compte. On retrouve dans le QIS5 (« Quantitative Impact Studies 5 »), une

étude d’impact faite par le CEIOPS la remarque suivante :

13

« Pour la modélisation des rachats structurels, les participants doivent utiliser des lois

d’expérience si celles-ci sont conformes aux observations passées, ou à défaut des données de

marché. »

Les assureurs devront ainsi utiliser leurs lois d’expérience pour la modélisation des rachats

structurels. Il est aussi spécifié que le choix des paramètres pris en compte dans la

modélisation est laissé libre à l’assureur, qui devra néanmoins pouvoir justifier ses choix.

b) Fiabilisation de la modélisation Dans ce contexte, et comme spécifié dans le pilier 3 les données et hypothèses sur

lesquelles sont basées les calculs devront être spécifiées, ce qui s’inscrit dans l’objectif d’une

meilleure compréhension des risques.

Jusqu’ici au sein du groupe Prévoir, l’étude sur les lois de comportement est actualisée

chaque année, en suivant la méthode décrite ci après. Dans cette étude, les lois de

comportement concernent les rachats, les résiliations, les stabilisations, les remplacements, les

sans effet/renonciations, les réductions, les versements supplémentaires et les rachats partiels.

La période d‘observation que nous utilisons dans le calcul de ces lois est l’année civile. Cela

convient à l’utilisation qui en est faite dans les logiciels de modélisation.

Les données utilisées sont issues des bases de gestion de l’entreprise et concernent les trois

dernières années civiles. Cette longueur de l’intervalle d’observation de 3 ans a été choisie

comme compromis pour lisser d’éventuelles périodes atypiques. En effet, utiliser une seule

année d’observation peut induire une plus forte variabilité des lois d’une année sur l’autre,

cela peut être préjudiciable à l’objectif visé dans la plupart des modèles utilisant ces lois en

input (TRI, EV…). L’utilisation des 3 dernières années permet aussi de dégager assez rapide

les tendances (les rachats observés il y a 10 ans dans un contexte radicalement différent ne

sont pas forcément de bons estimateurs du futur).

En utilisant les données disponibles sur cette période de 3 ans, on peut alors calculer un taux

de chute de la forme suivante :

14

Nous cherchons donc à déterminer la probabilité qu’un contrat de caractéristiques C1, C2,

…Cn chute totalement.

De nombreux facteurs peuvent expliquer les chutes. mais en pratique, seuls deux critères sont

utilisés : l’ancienneté du contrat et l’âge de l’assuré lors de la souscription du contrat,

Le choix de ces facteurs est un choix historique, qui provient d’observation, mais n’a jamais

été validé empiriquement, ce qui est un des objectifs de ce mémoire.

Les calculs ci-dessous sont effectués sur chaque sous ensemble d’âge.

La probabilité à estimer est la suivante : Probabilité [Contrat d’ancienneté K-1 chute

totalement en K].

Cette probabilité est notée Chute[K], on a alors :

Par exemple, pour estimer la loi de rachat, les observations des données historiques sur une

période donnée sont utilisées.

Les notations suivantes sont utilisées :

Si l’on observe les contrats sur une période de temps de longueur T années et que l’on

souhaite que chaque année rentre dans le calcul pour une part égale à 1t , on utilise

l’estimateur de la loi empirique de rachat suivant :

15

Avec

et

Dans les traitements, la pondération de chaque année est proportionnelle à l’effectif exposé de

l’année sur l’effectif total de l’ensemble des années prises en compte, soit :

T=3

Il vient donc :

Ces calculs sont réalisés pour chaque tranche d’âge à la souscription de l’assuré, d’où la

nécessité d’avoir un effectif suffisant pour obtenir des résultats statistiquement significatifs.

Lorsque le produit étudié ne dispose pas de l’ancienneté suffisante pour que toute la loi soit

déterminée à l’aide de son historique propre, l’expérience acquise sur un produit similaire du

portefeuille est utilisée.

Enfin, pour tenir compte des spécificités propres aux retraits partiels sur le produit en primes

uniques, des lois en montants sont calculées pour ce produit.

L’objet de ce mémoire est d’étudier les comportements de rachat, et pouvoir ainsi valider ou

infirmer les choix de modélisation faits par le passé. Ces travaux ont aussi pour objectif de

proposer un modèle plus pertinent à mettre en place lors de la création des lois de

comportements.

Une fois ces lois calculées et validées, elles sont utilisées dans le logiciel de modélisation afin

de déterminer les flux futurs (primes, prestations…) pour des calculs d’embedded value, de

provision globale de gestion, ou tout autre calcul nécessitant une modélisation.

16

3) Portefeuilles de données étudiés et méthodes

a) Objectifs du mémoire

Les travaux déjà effectués sur les phénomènes de rachat portent généralement sur des

contrats d’épargne. Plusieurs approches différentes de ce phénomène ont été adoptées.

Tout d’abord l’approche financière : le rachat y est vu comme une opportunité d’arbitrage et

on considère qu’il survient lorsqu’il est plus intéressant pour l’assuré de racheter son contrat

car il peut trouver de meilleures conditions sur le marché. Cette approche permet de valoriser

l’option de rachat dans les contrats d’épargne.

Une seconde approche, collective, consiste à utiliser les données de portefeuille de l’assuré

pour calibrer une fonction de rachat, qui permet d’estimer les rachats futurs.

On retrouve dans le mémoire « Analyse des rachats d’un portefeuille vie individuelle,

approche théorique et application pratique », de Fauvel S. et Le Pévédic M. [6], une approche

plus économique, qui utilise la théorie de l’utilité espérée. Ce mémoire analyse le rachat

comme besoin immédiat de liquidité et compare les avantages et inconvénients du rachat et

d’un emprunt, du point de vue de l’assuré.

Enfin une dernière approche plus probabiliste utilise les modèles linéaires généralisés et

d’autres techniques pour segmenter le portefeuille en classes de risque. Les techniques

utilisées sont décrites dans l’article « Surrender triggers in life insurance : classification and

risk predictions » de Milhaud, Loisel et Maume-Deschamps [15]. Cette étude analyse plus

spécifiquement les rachats structurels, de même que l’article « Modeling insurance surrenders

by the négative binomial model » [10], qui à l’aide d’une méthode spécifique détermine des

facteurs de risque en segmentant le portefeuille.

Le but du travail était de mener une étude permettant de mieux connaitre les facteurs

influençant le risque de sortie anticipée. Nous allons utiliser des techniques permettant de

segmenter le portefeuille pour faire ressortir des facteurs de risque.

b) Types de contrats analysés

i. Contrats vie entière

Le premier portefeuille étudié se compose de contrats versant un capital en cas de

décès de l’assuré, ce sont des contrats vie entière, qui ont une valeur de rachat, comme prévu

par le Code des Assurances. Un montant que le bénéficiaire recevra en cas de décès est défini

17

à la souscription de ce contrat, nommé Prévoir Quiétude (que l’on notera PQ par la suite), et

en fonction de ce montant, l’assuré paie en contrepartie des primes, essentiellement

mensuelles dans notre portefeuille.

Nous étudions un évènement : le rachat, qui correspond au versement à l’assuré du montant

de la provision mathématique de son contrat. La réduction, qui correspond à une diminution

du capital que le bénéficiaire reçoit en cas de décès lorsque l’assuré ne paye plus ses primes

n’est pas étudiée. On considère que les causes de la réduction ne sont pas les mêmes que

celles d’un rachat, qui à une contrepartie immédiate.

De par sa finalité, ce type de contrat est moins soumis à la conjoncture que les contrats

d’épargne, ainsi les facteurs pouvant expliquer les rachats ne sont pas nécessairement les

mêmes.

Aussi, il est nécessaire de bien décrire le réseau de distribution de ces contrats : il constitue

une des particularités des sociétés distribuant leur contrats à l’aide d’un réseau debout, telles

que la société Prévoir. Contrairement à beaucoup d’autres assureurs ou bancassureurs de

grande taille, Prévoir ne dispose pas de guichets et vend ses contrats via un réseau de

distribution debout, c'est-à-dire que les conseillers se déplacent directement chez le client ce

réseau est divisé en régions commerciales, elles-mêmes scindées en inspections, dirigées par

des inspecteurs, dont dépendent plusieurs employés qui assurent la distribution des contrats.

Ces commerciaux vendent les contrats directement chez le client. Leur rémunération dépend

majoritairement de leur performance, c’est-à-dire le nombre, le type de contrats vendus et les

nouvelles primes encaissées. La commission reçue par le conseiller commercial est séparée en

deux parties : une commission d’acquisition et une commission de qualité.

Une commission est calculée en fonction des primes encaissées, et du type de produit vendu.

la commission d’acquisition représente 55 % de cette commission, les 45 % restants

représentent la commission de qualité.

La commission d’acquisition est versée à l’émission du contrat, mais, en cas de chute du

contrat avant le 12ème mois, cette reprise est faite en totalité durant les trois premiers mois et

au prorata-temporis du 4ème au 12ème mois.

La commission de qualité est versée mensuellement du 13ième mois au 36ième mois tant que le

contrat est en cours. Il n’y a pas de reprise de cette commission en cas de chute du contrat,

mais elle n’est alors plus versée.

18

Il est important de bien comprendre les spécificités du réseau de distribution, qui peuvent,

dans certains cas, avoir une influence sur les différents évènements observés durant la vie du

contrat.

ii. Contrats d’épargne

Un second portefeuille de contrats d’épargne est aussi analysé. Ce portefeuille contient

deux contrats d’épargne : Prévilibre et PrévoirEpargne. Ce sont des contrats d’épargne à

versement libres. L’assuré effectue un versement initial, un taux minimal est garanti par

l’assureur ; tous les versements, ainsi que les intérêts générés constituent un capital. En cas de

vie, l’assuré récupère ce capital lorsqu’il décide de mettre un terme à son contrat. En cas de

décès, la provision mathématique est transmise au bénéficiaire désigné.

A tout moment, l’assuré peut choisir de racheter son contrat, c'est-à-dire de retirer la provision

mathématique disponible, soit en totalité, soit partiellement. C’est ce phénomène qui à été

étudié dans le mémoire.

Pour mieux appréhender ce phénomène, il faut prendre en compte la taxation des plus-values,

qui intervient lors de chaque rachat de contrat. Pour chaque rachat, le montant de la somme

prélevé dépend de l’assiette et du taux de prélèvement.

En cas de rachat total, l’assiette taxable correspond à la différence entre les fonds rachetés et

le montant des versements, si le rachat est partiel, l’assiette de l’impôt est calculée comme :

Avec RP le montant du rachat partiel, V le montant total des versements, E le montant de

l’épargne acquise au moment du rachat partiel, et PI le produit imposable.

A cette assiette on applique ensuite un taux, qui dépend du mode d’imposition choisi par

l’assuré : intégration de la plus-value à son impôt sur le revenu ou paiement d’ un

prélèvement libératoire lors de son retrait.

Si l’assuré choisit la première solution, le taux qui s’applique est alors son taux marginal

d’imposition, qui dépend de son revenu, ou celui de son foyer, mais aussi du nombre de parts

du foyer. Actuellement, le taux marginal d’imposition est de 0 % si le foyer un revenu par

part inférieur à 5963 €, 5,5 % si le revenu par part est inférieur à 11896 €, 14 % jusqu'à 26420

19

€, 30 % jusqu'à 70830 € et 41 % ensuite.si l’assuré choisit cette solution, la somme due sera

payée au moment de son imposition et non lors du rachat.

Si l’assuré choisit le prélèvement libératoire, la plus-value est imposée à un taux dépendant

uniquement de l’ancienneté, 35 % lorsque l’ancienneté du contrat est inférieure a 4 ans, 15 %

lorsque le contrat à entre 4 et 8 ans et 7,5 % ensuite.

Dans les deux méthodes, au bout de 8 ans, l’assuré dispose d’un abattement de 4600 € pour

une personne seule et 9200 € pour un couple, pour l’ensemble de ses contrats.

Un assuré avec des revenus élevés aura donc intérêt à choisir le prélèvement libératoire, et

inversement.

Comme les contrats précédents, ces contrats d’épargne sont distribués par le même réseau, les

conditions de commissionnement diffèrent, en effet, la commission est versée en une fois, et

dépend du versement initial de l’assuré.

c) Statistiques sur les portefeuille

i. Portefeuille vie entière

Ce portefeuille est composé de produits vie entière : la garantie principale prévoit le

versement un capital en cas de décès de l'assuré quel que soit son âge de décès. Ce type de

contrat est l'un des plus vendu chez Prévoir, qui est actuellement 25ème sur le marché de la

prévoyance.

Au 31/12/2012, Prévoir a plus de 150 000 contrats de ce type encore en gestion, pour un

montant total de provision mathématique d’environ 250 millions d'euros. Quelques

statistiques permettent de caractériser plus précisément ce portefeuille qui sera étudié dans les

parties suivantes.

Tout d'abord, ce contrat est ouvert à la souscription de 50 à 80 ans. L'âge moyen de

souscription est de 62,66 ans, avec un écart type de 7,08 ans. Les pics de souscription aux

âges 60 ans et 65 ans que l'on peut observer ci dessous (Fig 1.1) ont pour cause la visite du

conseiller commercial programmée lors de l'échéance des contrats retraite.

20

Fig. 1.1 : Répartition des âges à la souscription

On remarque aussi que les souscriptions après 75 ans sont peu fréquentes, cela est du au fait

que ce portefeuille regroupe 3 générations de contrats, et l'assuré peut souscrire après 75 ans

seulement sur les deux dernières générations de contrats,. Les principales différences sur ces

trois générations de contrats sont détaillées dans le tableau 1.1 ci-dessous :

1ière génération 2ème génération 3ième génération

Date de vente Décembre 1990 ‐

Janvier 2006

Février 2006 –

Novembre 2007

Décembre 2007 –

Décembre 2009

Ages de souscription 50 ‐ 75 ans 50 – 80 ans 50 – 80 ans

Période de carence 2 ans 2 ans 2 ans

Capital minimum 2 400 € 3 000 € 3 000 €

Tab 1-1

Lors de la souscription, l'assuré doit aussi choisir le capital qui sera versé au bénéficiaire du

contrat en cas de décès de l’assuré. Ce capital est limité à 32 000 €. Aussi, afin de simplifier la

gestion de ce contrat, il n’est pas permis d’augmenter ce capital au cours de la vie du contrat,

mais un assuré peut souscrire jusqu'à 3 contrats. Cette solution permet aussi d’éviter en partie

l’anti-sélection, ce contrat n’a pas de sélection médicale.

0%

1%

2%

3%

4%

5%

6%

7%

8%

9%

10%

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

50 55 60 65 70 75 80

âge de souscription

Répartition des âges à la souscription

Fréquences Fréquence cumulées

21

En observant le portefeuille, on remarque que la plupart des capitaux souscrits sont

relativement faibles. Le capital par contrat moyen est de 5,2 k €, et les montants sont assez

regroupés : l'écart type est seulement de 3,24 k€, et le 3ième quantile est situé à 6 k€. On peut

voir l’illustration de cette répartition des capitaux sur le graphique ci-dessous représentant la

fonction de répartition des capitaux souscrits.

Fig. 1.2 : Répartition des capitaux souscrits

De plus, l'assuré pouvant souscrire plusieurs contrats, le capital assuré par tête est légèrement

plus élevé : alors que 94% des contrats ont un capital inférieur à 10 k€, seulement 74% des

assurés ont un capital total à 10 k€.

Ces observations correspondent à la clientèle de groupe Prévoir, qui historiquement, est plutôt

à faibles revenus.

Enfin, l'ancienneté moyenne du portefeuille étudié est de 6,25 ans, avec un écart type de 4,23

ans.

0%

5%

10%

15%

20%

25%

30%

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

1 6 11 16 21 26 31

Capital initial (k€)

Répartition des capitaux souscrits

Fréquence Fréquence cumulé

22

Fig. 1.3: Ancienneté du portefeuille vie entière

On voit sur la figure ci-dessus (Figure 1.3) la fréquence des anciennetés du portefeuille de

contrat vie entière

iii. Portefeuille épargne en primes uniques

Le deuxième portefeuille étudié est constitué de contrats d'épargne en primes uniques.

Ce sont des contrats en euros, l'assuré dépose un montant qui est capitalisé à un taux

minimum défini lors de la souscription du contrat, augmenté de la participation aux bénéfices.

La souscription de ces contrats est ouverte jusqu'à 80 ans, mais la moyenne d'âge des assurés

est assez élevée : 53,9 ans. On peut toujours observer sur la figure ci dessous les pics à 60 et

65 ans, et dans une moindre mesure des pics à 50 et 55 ans. Ces pics de souscriptions

représentent des versements issus des contrats retraite.

0%

1%

2%

3%

4%

5%

6%

7%

8%

9%

0 2 4 6 8 10 12 14

Fréq

uence

Ancienneté (années)

Ancienneté du portefeuille vie entière

23

Fig. 1.4 : Ages de souscription portefeuille épargne

L’écart type de l'âge est de 17,1. On a des âges bien plus variés que sur le portefeuille

précédent, la cible de ce type de contrat est en effet bien plus large.

Par ailleurs, sur ce portefeuille on retrouve 45% de femmes, et 55% d’hommes.Le montant du

compte épargne moyen sur ces contrats est de 10,4 k€ pour un écart type de 29 k€, le montant

des comptes épargne est assez faible pour la plupart des contrats, avec 75% des contrats ayant

moins de 11,7 k€ sur leur compte épargne, et une médiane à 4,7 k€. Les montants des

comptes épargne sont donc regroupés et sont relativement bas, mais la moyenne est tirée vers

le haut par un petit nombre de contrats avec des provisions assez élevés.

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,1

18 23 28 33 38 43 48 53 58 63 68 73 78

Age de souscription

Ages à la souscription

fréquence Fréquence cumulée

24

F ig. 1.5 : montants des comptes épargne

Ces contrats ont souvent une fonction d’épargne de précaution pour une partie des assurés.

Pour pouvoir faire face à des dépenses imprévues, sans toucher à l'épargne placée à long

terme et sans mettre en danger l'avenir financier du foyer, il importe d'avoir des capitaux à

disposition immédiate.

Après avoir présenté les enjeux principaux de ce sujet, et détaillé l’objectif de cette étude, les

méthodes utilisées vont être décrites dans la partie suivante.

0%

10%

20%

30%

40%

50%

60%

70%

80%

Montant du compte épargne (en €)

Montant des comptes épargnes

fréquence % cumulé de l'épargne

25

Partie 2 Méthodologie

Dans cette partie, nous allons expliquer en détail la mise en place d’une méthode qui

pourra permettre d’analyser les phénomènes étudiés, c'est-à-dire les sorties anticipées et les

rachats partiels survenant dans les différents portefeuilles.

Pour cela, le principal outil utilisé est issu des modèles linéaires généralisés, qui sont une

généralisation du modèle de régression. Ils ont été décrits par John Nelder et Robert

Wedderburn en 1972.

Ces modèles permettent d’étudier le lien entre une variable, dite variable à expliquer, et un

ensemble de variables, pouvant aussi bien être qualitatives que quantitatives, appelées

variables explicatives.

La variable à expliquer doit suivre une loi appartenant à la famille exponentielle, qui contient

un grand nombre de loi usuelles telles que la loi binomiale, la loi normale, la loi exponentielle

ainsi que d’autres lois. Cette variable est reliée aux variables explicatives à travers une

fonction de lien. Cette fonction fait donc dépendre la variable à expliquer de la combinaison

linéaire des variables explicatives. Une des caractéristiques de cette fonction est qu’elle doit

être strictement monotone, donc inversible.

Le modèle de régression logistique est un modèle qui semble bien correspondre à notre

situation : la variable dépendante, ou variable à expliquer peut être exprimée sous forme

binaire ; dans la situation étudiée : présence ou absence de rachat au cours de l’année. Ce

modèle de régression logistique permet de déterminer les variables importantes pour

expliquer la présence ou l’absence de rachat.

1) Le modèle de régression logistique

a) Présentation

Le modèle de régression permet d’exprimer sous forme de probabilité la relation entre

une variable dichotomique, dite variable dépendante ou expliquée, et des variables

explicatives, quantitatives ou qualitatives. Dans notre cas, on cherchera à exprimer la

26

probabilité que l’individu rachète son contrat au cours de l’année en connaissant les

caractéristiques de cet individu.

L’utilisation de ce modèle est largement répandue en médecine par exemple, pour isoler

les facteurs qui séparent les individus sains des individus malades, il est aussi utilisé dans le

monde bancaire pour, par exemple, détecter les populations à risque lors de la souscription de

crédits.

Un tel modèle permet d’analyser plus précisément l’impact de chaque variable explicative

retenue, et de pouvoir quantifier cette relation.

Une lecture rapide des résultats peut se faire grâce aux rapports des chances, qui permettent

de quantifier l’impact du changement d’une variable explicative sur la probabilité de rachat.

Un exemple d’application peut se trouver dans Scoring et anticipation de défaillance

des entreprises : une approche par la régression logistique [4]. Dans cet article les auteurs

classent les entreprises en fonction de leur risque de défaillance, à l’aide du modèle de

régression logistique et selon un certain nombre de critères. Les résultats obtenus à l’aide de

cette méthode permettent de détecter 87% des entreprises défaillantes.

b) Formalisation mathématique La régression logistique nous permet donc d’exprimer la probabilité que l’évènement

se réalise en fonction des variables explicatives, à l’aide de la fonction Logit. Cette fonction

est la suivante :

Cette fonction est la fonction qui est à la base de la régression logistique. Lorsque p varie dans

]0;1[, la fonction Logit prend ses valeurs dans l’intervalle ]-∞;+∞[ tout entier.

27

Fig. 2-1. Représentation de la fonction logit

La formulation mathématique de la régression logistique est la suivante :

(1)

représente les variables explicatives, qui peuvent être qualitatives ou

quantitatives, et qui doivent permettre de caractériser le phénomène étudié.

Y est la variable à expliquer qualitative valant 1 si un rachat est observé sur le contrat au

cours de l’année et 0 sinon. On note alors p(1|X) la distribution conditionnelle de X sachant la

valeur prise par Y, ce qui nous donne la relation suivante :

Avec X représentant les variables explicatives et les étant les coefficients de la régression à

estimer. Les coefficients permettent donc de mesurer l’influence de chaque variable et ainsi

de déterminer les plus discriminantes.

28

Les rapports de chances

Les rapports des chances permettent de mesurer l’intensité de la relation entre des variables

aléatoires qualitatives.

Il permet de comparer la probabilité de survenance d’un évènement dans deux populations

différentes.

Si la probabilité qu'un événement arrive dans le groupe A est p, et q dans le groupe B, le

rapport des chances est :

Dans le cas de la régression logistique, en modifiant la valeur d’une variable qualitative, on

peut voir l’influence de cette dernière.

Si on veut mesurer l’influence de la variable numéro j, on calcule ce rapport de chances entre

une population présentant la modalité et une autre présentant la modalité . La probabilité

de survenance de l’évènement dans la population présentant la modalité est la suivante :

p= d’où

De même

q= d’où

Donc le rapport des chances vaut :

c) Estimation Les coefficients du modèle Logit ne peuvent être estimés directement à l’aide de la

technique du maximum de vraisemblance utilisé habituellement. En effet, le système

d’équations à résoudre pour maximiser la log-vraisemblance du modèle, que l’on notera l,

s’écrit comme :

29

Avec la fonction définie par :

C’est un système de p+1 variables explicatives, non fermé.

Pour pallier à cet inconvénient, on utilise l’algorithme de Newton-Raphson qui est la méthode

implémentée sous R, logiciel qui a été utilisé pour mener les études.

Pour utiliser cette méthode, nous avons besoin de la dérivée seconde de cette log-

vraisemblance en fonction des coefficients β. Cet algorithme utilise la relation suivante :

On fixe un β= ( au départ, et l’algorithme s’arrête lorsque la différence entre

est suffisamment faible.

d) Validation du modèle Une fois les coefficients estimés en utilisant l’algorithme de Newton-Raphson présenté

dans la partie précédente, des tests sont faits pour valider le modèle. Pour chaque coefficient

du modèle on teste sa significativité grâce au test de Wald.

L’hypothèse nulle de ce test est la suivante : « le coefficient est nul »

Sous cette hypothèse, la quantité suit une loi normale centrée réduite, ce qui nous

permet d’accepter ou de rejeter l’hypothèse nulle. Si une variable n’est pas considérée comme

significative, elle est alors retirée du modèle.

Le choix du nombre de paramètres du modèle se fait ensuite avec le critère d’information

d’Akoike (AIC). Il est calculé comme :

30

k étant le nombre de paramètres du modèle et L la vraisemblance de ce modèle. Ce critère est

un compromis entre le biais (qui diminue avec le nombre de paramètres) et la parcimonie

(nécessité de décrire les données avec le plus petit nombre de paramètres possible). Il nous

permet de choisir le nombre de paramètres du modèle, on compare l’AIC entre modèles

emboités et on choisit celui qui minimise cette quantité.

Un autre test plus général, qui sera aussi utilisé pour valider le modèle, le test de Hosmer

et Lemeshow qui évalue statistiquement la qualité de prévision du modèle. Ce test est décrit

dans la suite du document.

2 les modèles Logit multinomial et Logit emboité

Comme pour le modèle de régression logistique simple, les modèles de Logit multinomial

et de Logit emboité peuvent être utilisés comme outils d’analyse discriminante dans le but de

mettre en évidence les traits distinctifs d’une catégorie de personnes. Ces deux modèles sont

des prolongements du modèle de régression logistique simple décrit précédemment.

a) Logit multinomial

i. Présentation

Ce type de modèle à été introduit par McFadden en 1968, il permet d’étudier les

situations où l’individu doit faire un choix parmi plusieurs modalités.

Ce modèle est utilisé comme outil d’analyse discriminante dans le but de mettre en

évidence les traits distinctifs de chaque catégorie.

ii. Formalisation mathématique

Soient n individus distincts, répartis en J catégories, décrits par un ensemble de K

caractéristiques. On note alors la probabilité que l’individu i fasse le choix j, étant

donné ses caractéristiques. ( On a alors :

31

Les conditions sur la fonction G doivent permettre de modéliser une probabilité, pour cela, on

prend :

De cette manière, la quantité est bien toujours comprise entre 0 et 1 d’une part, et de

plus, de cette façon, on a bien la somme des probabilités égale à 1.

Il faut aussi imposer une restriction pouvant permettre l’identification des paramètres β. Pour

cela, la règle retenue est d’imposer la nullité de tous les paramètres relatifs à une catégorie de

référence. Si on fixe la catégorie de référence comme la catégorie J, on a alors tous les

sont nuls. Le modèle s’écrit donc :

Lorsque J le nombre d’alternative vaut 2, on retrouve le modèle de régression logistique

simple.

iii. Estimation

L’estimation des coefficients de ce modèle peut se faire par la technique du maximum

de vraisemblance. La vraisemblance s’écrit de la façon suivante :

Avec si l’individu i à choisi l’alternative j, 0 sinon.

La log-vraisemblance peut donc s’écrire de la façon suivante :

32

McFadden (1973) a montré que cette fonction admet un maximum qui vérifie la condition

suivante :

Les paramètres β sont retrouvés par des algorithmes de maximisation implémentés dans

différents logiciels, notamment celui de Newton Raphson.

iv. Interprétation

L’interprétation des coefficients n’est pas directe, il est plus aisé de calculer les

probabilités d’occurrence des modalités pour analyser l’effet des variables étudiées. Les

coefficients estimés sont propres à chaque variable ainsi qu’à chaque modalité. Un négatif

indique que la présence de la variable correspondante diminue la probabilité d’occurrence de

la modalité j, et inversement.

b) Logit emboité

i. Présentation

Ce modèle a été créé pour palier à un inconvénient du Logit multinomial : l’hypothèse

de l’indépendance des alternatives non pertinentes (IIA pour « Independance of Irrevelant

Alternatives »). Soit en effet et deux alternatives, l’hypothèse de l’IIA affirme que le

rapport des probabilités entre ces deux choix ne dépend pas des autres alternatives offertes à

cet individu. Cette hypothèse est trop restrictive pour modéliser un certain nombre de

comportements.

Par exemple considérons un individu qui a le choix entre deux moyens de transport pour se

rendre à son lieu de travail, une voiture et un bus bleu. On note la probabilité que l’individu

choisisse la voiture et la probabilité qu’il choisisse le bus bleu. Si l’individu n’a pas de

préférence pour la voiture ou le bus, on a

Si maintenant le même individu a le choix entre un bus bleu, un bus rouge, et la voiture, et

qu’il est indifférent à la couleur du bus, on à donc .

33

D’où la seule solution est que , donc on voit que l’introduction de

l’alternative « bus rouge » a modifié les préférences de l’individu, l’hypothèse d’IIA ne tient

pas.

Lorsque l’on se trouve dans des cas ou l’hypothèse d’IIA n’est pas tenable, d’autres modèles

peuvent être construits pour analyser les choix de l’individu. C’est le cas du Logit emboité.

Dans ce type de modèle, on modélise les choix de l’individu en plusieurs étapes, pour

reprendre l’exemple précédent, l’individu pourra choisir dans un premier temps le mode de

transport, voiture ou bus, puis dans un second temps il choisira la couleur du bus.

ii. Formalisation mathématique et estimation du modèle

Fig. 2.2 : représentation du Logit emboité

Soit :

‐ L le nombre de groupes résultant de la partition de l’espace des choix

‐ le nombre de choix possible dans le groupe l

‐ le nombre total de choix possibles

‐ X le vecteur des caractéristiques de l’individu, décomposé en x’, caractéristiques

qui influencent le choix au niveau 2 et x’’ les caractéristiques qui influencent le

choix au niveau 1

On notera j(l) le choix j du groupe l.

La probabilité de faire le choix j(l) peut s’écrire :

Ou :

34

‐ est la probabilité de choisir le groupe l, connaissant les caractéristiques x’

‐ est la probabilité de choisir l’alternative j, sachant qu’elle fait partie du

groupe l et connaissant les caractéristiques de l’assuré x’’

Avec cette décomposition, on modélise le choix de j(l) au sein du groupe l par un Logit

multinomial, on a alors :

De la même façon, le choix du groupe est modélisé par un Logit multinomial. On a donc :

Avec

Grâce à la décomposition faite ci-dessus, on voit qu’il est possible d’estimer ce modèle en

deux étapes, dans un premier temps, les modèles de niveau 1 sont estimés, puis on calcule la

variable d’inclusion et enfin on estime le modèle de choix de groupe après avoir introduit la

variable d’inclusion. L’estimation de ce modèle revient en fait à faire deux estimations de

logit multinomial successives.

Dans certains cas, le modèle peut être partiellement dégénéré, c'est-à-dire qu’au moins un

groupe ne comporte qu’un choix, la variable d’inclusion est alors indéterminée.

Ce modèle est intéressant, mais il est nécessaire que des variables caractéristiques des choix

de chaque niveau soient disponibles.

c) Choix du modèle Le modèle choisi pour étudier les données doit être celui qui correspond le mieux à nos

données, le modèle multinomial est bien plus simple à mettre en œuvre, mais il faut tout

d’abord contrôler que l’hypothèse des alternatives non pertinentes est vérifiée, de même, pour

un Logit emboité, les choix de l’individu doivent être regroupés correctement.

Pour vérifier si l’hypothèse d’IIA est vraisemblable, un test statistique à été proposé par

Hausman et McFadden (1984). Le test se base sur la propriété que si l’hypothèse de l’IIA est

35

vérifiée, alors, les paramètres des modèles logit estimés sur différents sous ensembles de

l’espace total des choix ne doivent pas être statistiquement différents.

Soit C l’ensemble des choix possibles, A un sous ensemble de C, et les valeurs des

coefficients de la régression sur C et A, et les matrices de variances covariance des

modèles.

Sous l’hypothèse d’indépendance des alternatives non pertinentes, les estimateurs et

sont des estimateurs convergents, de plus, - est définie positive ; la statistique du test

(notée S) est la suivante :

Sous l’hypothèse d’IIA, S suit une loi du chi-deux avec un nombre de degrés de liberté égal

au rang de la matrice .

Si l’hypothèse d’IIA est rejetée, le modèle multinomial n’est pas applicable aux données, et il

faut alors étudier les données avec d’autres techniques, telles que le modèle logistique

emboîté par exemple.

2) Choix et transformation des variables

a) Choix des variables Le but du modèle est de décrire l’effet des variables sur la décision de racheter son

contrat, pour cela, les variables explicatives doivent donc être corrélées avec la variable à

expliquer. De plus, un autre problème se pose avec les variables quantitatives. Il faut se poser

la question de l’influence de la variable : est elle linéaire, y-a-t-il des effets de seuil ?

Dans un premier temps, on teste l’existence d’une liaison entre la variable à expliquer et les

variables explicatives. Pour cela, on utilisera principalement le test du khi et le test du rhô de

Spearman. Ces deux tests ont la même hypothèse nulle : « les deux variables sont

indépendantes », mais le test de Spearman est plus intéressant pour des échantillons de faible

importance car il se base sur les rangs et non sur la valeur des variables.

36

Une fois la liaison confirmée, les variables quantitatives peuvent être intégrées de

différentes façons au modèle ; en effet, contrairement aux variables qualitatives, les variables

quantitatives peuvent intervenir de plusieurs manières :

-l’influence de la variable explicative sur la variable à expliquer peut être linéaire, dans ce

cas-là, la variable sera utilisée telle quelle dans le modèle de régression logistique.

-l’influence de la variable peut se faire par seuil, dans ce cas-là, il faudra discrétiser la

variable et elle sera prise en compte comme une variable qualitative.

Il est important de se poser la question de cette influence, car intégrer la variable sous forme

continue dans le modèle implique de faire l’hypothèse de la linéarité de son influence, ce qui

n’est pas nécessairement vérifié, et peut donc conduire à une mauvaise interprétation des

résultats.

b) Regroupement des variables Les variables qualitatives qui présentent trop de modalités sont regroupées pour les

rendre plus significatives et simplifier le modèle. Il faut donc les regrouper sans altérer leur

sens. Pour cela, nous utilisons les techniques de classification ascendante hiérarchique. Ces

méthodes sont basées sur le concept d’inertie, comme définit ci-dessous.

Soit des groupes d’individus, le nombre d’individu de chaque groupe, et

les barycentres de ces groupes, G l’inertie du nuage notons l’inertie Intra-classe

et l’inertie inter classe. Ces deux quantités sont définies de la façon suivante :

Les méthodes de classification ascendante hiérarchique (CAH) ont pour but de regrouper les

individus en minimisant l’inertie intra-classe et en maximisant l’inertie interclasse. La CAH

se déroule de la façon suivante :

Initialisation : les classes initiales sont les n singletons individus.

37

Calculer la matrice de leurs distances deux à deux

- Itérer les deux étapes suivantes jusqu’à l’agrégation en une seule classe :

- Regrouper les deux éléments (classes) les plus proches au sens de la distance entre

groupes choisie

- Mettre à jour le tableau de distances en remplaçant les deux classes regroupées

par la nouvelle et en calculant sa distance avec chacune des autres classes

Il faut donc définir une distance entre deux groupes. Plusieurs distances peuvent être utilisées,

telles que la distance minimum ou maximum, ou encore, et c’est la méthode que l’on a

utilisée, la distance de Ward. La distance de Ward se calcule comme :

Avec d ( . , . ) la distance euclidienne.

Cette méthode est la plus couramment utilisée, elle consiste à faire les regroupements qui font

le moins augmenter l’inertie intra-classe.

En utilisant cette méthode sur certaines de nos variables qualitatives, on pourra en construire

de plus significatives, et ainsi simplifier le modèle en ne perdant pas ou peu d’information.

c) Interactions Les modèles purement additifs, c'est-à-dire ne prenant pas en compte les interactions,

ne sont généralement pas satisfaisants. Certaines variables peuvent en effet interagir avec

d’autres. On parle d’interaction lorsque les effets des variables ne s’ajoutent pas. Lors de

l’étude d’un phénomène, il faut prendre en compte cet effet entre les variables, pour ne pas

être induit en erreur.

Un exemple permet de mieux comprendre ce phénomène. On considère le cas ou la variable à

expliquer est le fait de faire ou non de la couture.

Notons Y la variable à expliquer. Y=1 si l’individu fait de la couture et 0 sinon.

Les variables explicatives considérées sont l’âge, quantitatif, et le sexe de l’individu,

qualitatif.

38

Le modèle additif s’écrit comme

Un modèle spécifié de cette façon revient à faire l’hypothèse que l’on se trouve dans la

situation représenté dans la figure 2.3

Fig. 2.3 : en fonction de l’âge pour le modèle additif

Cette spécification du modèle n’est clairement pas adaptée à la réalité : les hommes ne font de

la couture que très rarement. La prise en compte de l’interaction permet d’avoir des résultats

qui sont plus adaptés à la situation réelle.

Le modèle avec interaction s’écrit de la façon suivante :

La courbe du logit en fonction de l’âge pour les hommes et les femmes aurait alors une pente

différente.

0

2

4

6

8

10

30 40 50 60 70 80

logit(p(âge))

Age

Logit(p(x)) en fonction de l'âge modèle additif

Femme Homme

39

Fig. 2.4 : en fonction de l’âge pour le modèle avec interactions

La mise en application de ces différentes méthodes nous permettra d’analyser nos données, de

dégager certaines tendances, que l’on pourra ensuite analyser et interpréter.

3le test de Hosmer et Lemeshow

Le test de Hosmer et Lemeshow (2000) est un test qui a pour but d’évaluer la qualité

d’un modèle. Ce test permet d’avoir un indicateur statistique permettant d’accepter ou de

rejeter le modèle.

Le modèle estimé permet pour chaque observation d’obtenir un score, qui est en fait la

probabilité de survenance de l’événement. La statistique du test est calculée sur un

échantillon servant seulement à la validation du modèle.

Sous l’hypothèse nulle H0, les observations sont issues de la loi calculée par le modèle.

Dans un premier temps, on calcule les scores des individus, puis on subdivise l’échantillon

d’estimation en G groupes de même taille selon les scores.

Soit donc :

0

2

4

6

8

10

30 40 50 60 70 80

Logit(p(Age))

Age

logit(p(x)) en fonction de l'âge, modèle avec interaction

Femme Homme

40

‐ le score, ou probabilité de survenance de l’événement étudié, de l’individu

‐ g=1…G le groupe auquel appartient l’individu, on utilise les quantiles des scores

pour définir les groupes.

‐ l’effectif du groupe g

‐ le nombre de positifs observés

‐ le nombre de négatifs observés

‐ la somme des scores des observations du groupe g, c’est la

fréquence théorique des positifs dans le groupe g

‐ la fréquence des négatifs

‐ la moyenne des scores observés dans le groupe g

La statistique du test se calcule de la façon suivante :

Sous l’hypothèse nulle, C suit approximativement une loi du à (G-1) degrés de liberté.

On considère que le modèle est acceptable lorsque la p-value du test est plus grande que le

risque choisi.

41

Partie 3 analyse des causes de sorties anticipées des

contrats vie entière

La constitution de la base de données utilisée pour l’estimation du modèle LOGIT va être

décrite, puis on pourra comparer et analyser les résultats de cette estimation. Le choix des

contrats étudiés et les calculs ont été effectués de façon à permettre la comparaison avec les

lois de comportement calculées chaque année.

Dans le but d’analyser les causes des rachats, une régression logistique a été faite sur un

portefeuille contenant les contrats ayant pris effet entre 1991 et 2011.

Les contrats présents dans le portefeuille analysé sont des contrats vie entière (Prévoir

Quiétude) versant un capital en cas de décès. Ces contrats ne se comportent pas comme les

contrats d’épargne car ils n’ont pas même finalité, et ne s’adressent généralement pas à la

même population. L’évènement étudié est le suivant :

- le rachat total : l’assuré met fin à son contrat et reçoit alors le montant de la provision

mathématique constituée par l’assureur. Ce type de sortie doit être possible pour les contrats

vie entière, on ne retrouve pas ce genre de clause pour les contrats décès temporaire.

Dans un premier temps, il avait été envisagé d’étudier conjointement la réduction du contrat,

mais cette alternative n’a pas été retenue, car contrairement à la résiliation, ou le rachat total,

lors d’une réduction, le contrat reste dans le portefeuille, et l’assuré ne reçoit rien.

1) Préparation et sélection des données

Les variables pouvant influencer la décision de racheter ou non son contrat sont

nombreuses, et les bases de données sur les assurés ne peuvent pas recenser toutes les

informations. Pour cela, nous avons choisi un nombre important de variables et essayé de

déterminer leur influence sur la décision de l’assuré de sortir prématurément du portefeuille.

Ces variables peuvent êtres classées en deux catégories. D’une part les variables propres à

l’assuré, qui peuvent expliquer le rachat structurel, c'est-à-dire le rachat de son contrat par

42

l’assuré pour des raisons personnelles, indépendamment de l’évolution des marchés. On les

appellera variables structurelles.

D’autre part, le rachat conjoncturel survient lorsque l’assuré retire sa provision pour

l’investir dans des placements plus rémunérateurs. Les variables pouvant expliquer ce rachat

seront appelés variables conjoncturelles.

a) Données disponibles Les données utilisées pour l’estimation ainsi que la validation du modèle concernent

les années 2006 à 2009, années les plus récentes et recensant le plus d’informations. Sur ces

contrats, 75 % ont été réservés à l’estimation du modèle ; les 25 % restants servent à la

validation de ce modèle.

Les données disponibles concernant l’assuré sont : le sexe, le code postal, le revenu du foyer,

la charge mensuelle (qui correspond à la somme des primes des contrats Prévoir de l’assuré),

la date d’effet du contrat, l’inspection et la région commerciale dont dépend l’assuré, la

situation familiale de l’assuré.

Les données propres au contrat sont l’âge de l’assuré lors de la souscription, le capital initial

du contrat, le montant de la prime versée par l’assuré et la périodicité de la prime.

Le fait de prendre en compte les données concernant le revenu du foyer et la charge mensuelle

amène à n’utiliser que 60 % des données (le reste n’étant pas renseigné pour ces variables), et

introduit un biais car la plupart des contrats non pris en compte sont des contrats sortis. Nous

n’utilisons donc pas ces variables.

Les informations concernant la situation familiale de l’assuré et la périodicité des primes ne

seront pas non plus prises en compte : en effet, la plupart des assurés ont la même modalité,

périodicité mensuelle et couple marié, ce qui est peu intéressant pour le modèle.

Enfin, la prime mensuelle n’est pas prise en compte, il est préférable de prendre le capital

initial et l’âge de souscription, qui à eux deux déterminent complètement cette prime.

43

b) Choix des variables Les variables décrites ci-dessous sont celles qui ont étés retenues pour modéliser les

rachats dans notre portefeuille. Pour toutes ces variables, un test d’indépendance avec la

variable à expliquer a été réalisé, et ce test nous a donné, pour les variables retenues, des p-

values permettant de rejeter l’hypothèse d’indépendance au niveau de 5 %.

i. Variables structurelles

On a pu voir dans certains autres travaux sur le même sujet que l’ancienneté, le capital

initial, le sexe, l’âge de souscription la périodicité des primes sont des variables qui peuvent

avoir de l’influence ( surrender trigger in life insurance : classification and risk predictions,

Milhaud, Loisel , Maume-Deschamps [15] ) .

Au sein du portefeuille étudié, une grande majorité (plus de 95 %) des assurés paye des

primes mensuelles, il nous est donc difficile de détecter l’influence de cette variable, c’est

pourquoi elle n’est pas retenue.

Aussi, un assuré pouvant souscrire plusieurs contrats, il a été choisi d’utiliser le nombre de

contrats (vie entière uniquement) souscrits précédemment par l’assuré au moment de la

souscription du contrat étudié.

Les variables structurelles étudiées sont au nombre de six :

L’ancienneté du contrat

L’ancienneté du contrat lors de l’année étudiée est calculée comme la différence entre

l’année d’étude et la date d’effet diminuée de 1 pour les contrats en cours, et comme la

troncature de pour les contrats qui ont été résiliés ou rachetés au

cours de l’année. Il apparaît que l’ancienneté du contrat joue un rôle prédominant dans les

rachats, et que le nombre de rachats observé n’est pas fonction linéaire de l’ancienneté. Cette

variable sera donc considérée en tant que facteur, et non comme une variable continue. De

plus, les anciennetés supérieures à 15 ne sont pas prises en compte, car les contrats dans cette

situation sont trop peu nombreux dans le portefeuille étudié: seulement 6 % des contrats se

trouvent dans ce cas de figure.

L’inspection

44

Le réseau de distribution est organisé en inspections, qui sont elles-mêmes regroupées

par régions commerciales. Dans un premier modèle, le regroupement des assurés par région

commerciale a été préféré. Ensuite, une comparaison des résultats avec le regroupement des

inspections en fonction de leur taux de rachat sur les années précédentes a montré que ce

regroupement produisait de meilleurs résultats.

Il est intéressant de noter que le regroupement des inspections ne recoupe absolument

pas le regroupement en régions commerciales (ou en régions géographiques). Cela implique

que les critères propres à la région ont moins d’importance, pour notre portefeuille, que le

réseau de distribution de ces contrats.

La variable inspection a deux modalités, les inspections où le nombre de rachats est

normal, celles où le nombre de rachats est élevé. Dans le modèle la modalité de référence est

le groupe d’inspection avec un nombre élevé de rachat.

Le sexe

Le sexe de l’assuré peut avoir des effets non négligeables sur le choix de racheter, en

effet les femmes ont une plus faible probabilité de décès mais la prime calculée du produit sur

lequel a été mené l’étude est unisexe. Les femmes payent donc plus que les hommes en

comparaison de leur risque, ce qui pourrait être une cause de rachat.

Le nombre de souscriptions précédentes

Cette quantité représente le nombre de contrats vie entière de l’assuré en cours à la

souscription du contrat ; en théorie, ce nombre est limité à deux, car l’assuré ne peut avoir

plus de trois contrats Prévoir Quiétude. Cette variable est conservée telle quelle, sur le

graphique ci-dessous, on peut voir les taux de rachats selon le nombre souscriptions

précédentes.

45

Fig. 3.1 : Taux de rachats en fonction du nombre de souscriptions antérieures

Ces taux sont calculés sur la population qui servira à l’estimation de notre modèle.

Ce graphique nous permet de voir qu’il est raisonnable de faire l’hypothèse de l’influence

linéaire de la variable, elle pourra donc être conservée telle quelle dans le modèle.

Le capital initial

Il s’agit du capital défini à la souscription du contrat versé lors du décès de l’assuré.

Le bénéficiaire reçoit ce capital si le souscripteur a payé toutes ses primes. Ce capital peut

aller jusqu’à 32000€ sur les contrats du portefeuille, mais 74 % des assurés ont moins de

10000€ de capital initial. Comme pour la variable précédente, nous avons représenté

l’évolution des taux de rachat en fonction du capital initial, calculé sur la population

d’estimation.

Fig. 3.2 : Taux de rachats en fonction du capital initial (en k€)

3,50%

3,75%

4,00%

4,25%

4,50%

4,75%

0 1 2

taux de rachat

nombre de souscriptions antérieures

taux de rachat

0,00%

2,00%

4,00%

6,00%

<3 4‐5 6‐7 8‐9 10‐11 12‐13

Taux de rachat

Capital initial (k€)

taux de rachat en fonction du capital

46

Comme pour la variable précédente, la tendance semble linéaire. Une régression linéaire sur

les taux de rachat en fonction du capital initial nous donne un coefficient de détermination

(R ) de 0,7901. Les pics observés pour les tranches 5 000 €- 6 000€ et 8 000 €- 9 000 € n’ont

pas d’explication particulière, et l’on choisit de conserver l’hypothèse de linéarité, dans un

souci de simplicité du modèle.

L’âge à la souscription

Les assurés peuvent souscrire à un contrat à condition d’avoir entre 50 et 80 ans. Cette

variable est quantitative et comme pour les deux précédentes, on a ci-dessous le taux de rachat

en fonction de l’âge à la souscription.

Fig. 3.3 : Taux de rachats en fonction de l’âge à la souscription

Les assurés aux âges extrêmes ont tendance à plus racheter que les autres, et l’on voit ici que

l’influence de cette variable n’est pas linéaire. On va donc regrouper les âges en fonction de

leur taux de rachat.

A l’aide de la Classification ascendante hiérarchique, en utilisant la distance de Ward, les

observations précédentes sont confirmées, on regroupe les âges extrêmes dans un groupe, et

les âges intermédiaires dans l'autre. Les âges extrêmes sont les âges entre 50 et 59 ans inclus

et ceux entre 75 ans et 80 ans inclus.

0,00%

1,00%

2,00%

3,00%

4,00%

5,00%

6,00%

50 54‐56 60‐62 66‐68 72‐74 78‐80

taux de rachat

Age de souscription

Taux de rachat en fonction de l'âge

47

Cette variable sera donc transformée en variable binaire, valant 0 si l’âge lors de la

souscription du contrat est dans l’intervalle [60 ; 74] et 1 dans le cas contraire.

Remarque : le revenu avait dans un premier temps été considéré, mais il présentait une

forte corrélation avec le capital initial du contrat et était souvent mal ou non renseigné dans

nos données. Comme les contrats pour lesquels les données étaient manquantes étaient

majoritairement rachetés, prendre en compte cette donnée aurait introduit un biais.

ii. Variables conjoncturelles

Pour prendre en compte l’effet conjoncturel des rachats, les liens entre le taux de rachat et

plusieurs variables conjoncturelles sont étudiés. Dans un premier temps la variation du taux

de chômage, puis dans un second temps avec des variables spécifiques au domaine de

l’assurance.

Comme les variables comparées sont annuelles, les données sont peu nombreuses : on met

alors en œuvre le test du rhô de Spearman décrit ci dessous.

Ce test étudie non pas la valeur des observations, mais la liaison entre leurs rangs. Pour

cette raison, il est bien adapté aux échantillons de petite taille. De plus, il permet de détecter

les liaisons qui ne sont pas linéaires ce que d’autres tests, non basés sur les rangs, ne

pourraient pas repérer.

L’hypothèse nulle du test est : « il n’y a pas de corrélation des rangs » La statistique du

test se calcule par la formule suivante :

Avec la différence des rangs au niveau de l’observation i, et n le nombre d’observations.

Sous l’hypothèse nulle, on doit se reporter à la table des valeurs critiques du rhô de Spearman

pour avoir la significativité du test. Lorsque n est supérieur à 10, on considère que

suit une loi de Student à n-2 degrés de liberté.

48

Variation du taux de chômage

Fig. 3.4 : taux de rachat annuel et variation du chômage

Le lien entre cette variation du taux de chômage et les taux de rachats n’est pas confirmé par

le test de Spearman qui nous donne un p-value bien trop importante (0,8943) pour rejeter

l’hypothèse d’indépendance, ce qui se voit sur le graphique ci-dessus. Ce résultat était assez

prévisible, le contrat étudié s’adresse à des assurés ayant plus de 50 ans, et l’âge moyen des

assurés en portefeuille est de plus de 65 ans. Les assurés sont donc pour la plupart des

retraités, et donc peu affectés par le chômage.

Chiffres propres au secteur assurantiel

Les tests de Spearman ont aussi été réalisés sur le nombre de contrats en cours, nombre

d’affaires nouvelles et cotisations dans la branche. Ces chiffres propres au secteur auraient pu

avoir un lien avec le nombre de rachats observés. Cependant, comme précédemment, le test

de Spearman n’a pas été concluant ; il a donc été choisi de ne pas conserver ces variables.

Ce type de contrat est moins sensible à la situation conjoncturelle que les contrats d’épargne

car leur but premier n’est pas de faire fructifier un patrimoine, ce qui peut expliquer le fait

qu’aucune des variables conjoncturelles n’ait été retenue.

Les variables explicatives du modèle sont donc au nombre de 6 : l’ancienneté, la classe d’âge

à la souscription l’inspection, le nombre de contrats vie entière précédemment souscrits et le

sexe de l’assuré.

‐2

0

2

4

6

8

Taux de rachat et variation du taux de chômage

Varitation du taux de chomage taux de rachat

49

2) Spécification du modèle et résultats

Après avoir choisi et étudié les variables pouvant expliquer les phénomènes de rachat, un

modèle de régression logistique est mis en place pour permettre de mieux capturer les effets

des variables ; 75 % des données ont été sélectionnées pour permettre l’estimation du modèle,

et 25 % pour valider le modèle.

a) Spécification du modèle Le modèle mis en place est un modèle de régression logistique, avec comme variable à

expliquer le choix de racheter ou non le contrat, et comme variables explicatives, détaillées

dans la partie précédente, l’âge, l’ancienneté du contrat, le nombre de souscriptions

précédentes, le capital initial, le sexe de l’assuré et enfin l’inspection dont dépend le contrat.

Pour la variable qualitative « sexe », la modalité de référence est « féminin» ; pour la

variable inspection, la modalité de référence est « inspection à taux de rachat élevé » et enfin,

la modalité de référence pour l’âge lors de la souscription du contrat est la classe d’âge

intermédiaire.

Au départ, le modèle est complet, c'est-à-dire qu’il prend en compte toutes les variables

explicatives. Puis les variables qui ne sont pas significatives (détectées grâce au test de Wald)

sont enlevées du modèle. Enfin, le modèle choisi est celui qui minimise le critère

d’information d’Akoike, comme expliqué dans la partie précédente. Le modèle retenu est

donc un modèle ayant des variables toutes significatives et qui est le meilleur possible au sens

de l’AIC.

b) Résultats et commentaires Les résultats de l’estimation du modèle sont détaillés ci-dessous, seules les variables

significatives au niveau 5 % ont été conservées :

Coefficients

constante -2,69

Groupe d’âge 0,211

50

Souscription antérieures 0,0580

Ancienneté

0 Référence

1 -0,238

2 -0,457

3 -0,652

4 -0,684

5 -0,730

6 -0,682

7 -0,729

8 -0,810

9 -0,899

10 -0,950

11 -1,06

12 -1,18

13 -1,08

14 -1,23

15 -1,27

Sexe Masculin -0,177

Inspection normale -0,275

Capital initial 0,0000278

Tableau 3.1 : Résultats de la régression logistique sous R

Pour interpréter l’effet des coefficients, on calcule les rapports des chances, qui

permettent de comparer les probabilités entre elles.

Après calcul, les âges extrêmes ont une probabilité de sortie plus élevée de 23 % que

les individus souscrivant entre 60 et 74 ans.

L’effet des inspections d’origine est plus prononcé. En effet, un individu venant d’une

inspection classée parmi celles ayant des taux de sorties élevés aura une probabilité de sortie

1,32 fois plus élevée que si ce même individu venait d’une inspection à taux de sortie normal.

51

Enfin l’ancienneté du contrat a un effet important sur le rachat. Durant les premières

années, les taux de rachat sont élevés, puis diminuent de façon bien plus modérée ensuite.

Plus le contrat vieillit, plus il est dans l’intérêt de l’assuré de conserver son contrat.

F ig3.5 rapport de chance des anciennetés

On remarque que l’effet de l’ancienneté n’est en effet pas linéaire : il y a une

décroissance rapide des taux de rachats au début, jusqu'à 3 ans d’ancienneté, puis sur les

anciennetés suivantes, on observe toujours une décroissance, mais qui est bien plus modérée.

Le graphique 3.5 nous permet de visualiser ces observations. On y retrouve les rapports de

chances des anciennetés par rapport à la modalité de référence : un contrat avec une

ancienneté de 0.

Observations

Durant les premières années de vie du contrat, la décision est très influencée par le

suivi du contrat, en effet, la différence importante entre les premières années et les suivantes

trouve son explication dans le suivi du contrat assuré par le commercial dont le rôle n’est pas

seulement de vendre les contrats mais aussi d’en assurer le suivi. Il est dans l’intérêt de ce

dernier, qui perçoit la majeure partie de son salaire sous forme de commission, que le contrat

ne chute pas au cours des 12 premiers mois, pour acquérir définitivement les 45 % de

commissions au bout de la première année. On peut supposer que certaines inspections

s'orientent plus vers la prospection, tandis que d'autres semblent privilégier le suivi des

contrats. Durant les années suivantes, le réseau commercial garde son importance : en effet,

0%

20%

40%

60%

80%

100%

120%

0 2 4 6 8 10 12 14

ancienneté

rapport de chances de l'ancienneté

52

les différences de comportement des assurés sont fortement influencées par les inspections

dont ils dépendent.

D’autres paramètres influencent l’assuré. Tels que le capital initial, montant versé au

bénéficiaire en cas de décès défini lors de la réalisation du contrat. Il en va de même pour le

nombre de souscriptions de l’assuré, ces deux variables déterminent les cotisations que

l’assuré devra payer à Prévoir, plus il a de contrats avec des capitaux élevés, plus le montant

de sa prime sera élevé, et cela pourra l’inciter à racheter ses contrats. Cette affirmation est

confirmée par le fait que les coefficients estimés pour ces deux variables sont bien positifs.

Quelle que soit l’ancienneté du contrat, les femmes ont toujours plus tendance à racheter leur

contrat.

Un autre effet semble se dégager, les assurés soit très jeunes, soit très vieux (relativement à

l’âge de souscription autorisé pour le contrat étudié) ont une probabilité de rachat plus grande

que ceux souscrivant à des âges intermédiaires.

Les taux de rachat élevés des assurés souscrivant à des âges élevés (75 ans ou plus) peut

s’expliquer par le fait que le prix des contrats à des âges élevés augmente assez vite, les

assurés souscrivant tard payent donc une prime bien plus élevée, à capital égal, que les

assurés souscrivant plus jeunes, ils sont donc plus enclins à racheter leur contrat.

3) Validation et Backtesting

La validation de ce modèle est faite à l’aide d’un test de Hosmer et Lemeshow, sur les

données initiales n’ayant pas été utilisées dans la phase d’estimation du modèle.

L’hypothèse nulle de ce test est que les données générées par le modèle sont

conformes aux données observées.

La p-value de ce test sur nos données est supérieure au seuil critique de 0,05, elle est ici de

0,24, on ne peut donc pas rejeter l’hypothèse nulle, le modèle prédit est considéré comme

prédisant les données avec une précision acceptable.

Après avoir calibré le modèle sur les données de 2006 à 2009 et vérifié que le modèle est

valable sur un échantillon de validation provenant de la même période on se pose la question

53

de la stabilité des coefficients estimés. En effet, comme les données des années précédentes

servent à modéliser celle de la génération en cours, il est important que le modèle estimé

permette de prévoir avec précision les sorties futures.

Dans le but de tester la robustesse du modèle estimé, on utilise donc les coefficients du

modèle logit précédent pour calculer les probabilités de rachat sur les données de l’année

suivante, l’année 2010. Les résultats du modèle peuvent ensuite être comparés avec ce qui à

été observé cette même année afin d’évaluer la robustesse du modèle.

On se sert des données de l’année 2010 afin d’évaluer le pouvoir prédictif du modèle. La

probabilité que le contrat soit racheté au cours de l’année est donc estimé en fonction des

caractéristiques retenues lors de l’estimation, c'est-à-dire l’ancienneté du contrat, le sexe de

l’assuré, le capital initial souscrit du contrat, l’âge de souscription, le nombre de souscriptions

précédentes et enfin le profil de l’inspection dont dépend le contrat.

En notant les coefficients estimés associés aux caractères , la probabilité que le contrat

soit racheté au cours de l’année est calculée de la façon suivante :

En plus d’une estimation ponctuelle, le modèle permet aussi de faire des prévisions par

intervalles de confiance. En effet, soit :

‐ le vecteur des coefficients estimés par le modèle.

‐ les caractéristiques de l’individu

Notons

La variance du modèle s’écrit alors :

L’intervalle de confiance du modèle au niveau 1- est défini par :

Avec un fractile de la loi normale centré réduite, et .

54

Le graphique ci-dessous permet de voir les taux de rachats sur le portefeuille vie entière en

2010, ainsi que les intervalles de confiance, au niveau 90% estimés par le modèle logistique

construit dans les parties précédentes.

Fig. 3.6 Prévisions du modèle

Ont peut voir que le profil de rachat est dans l’ensemble assez stable, avec un fort taux de

rachats les premières années qui décroit rapidement pour se stabiliser ensuite. Les

explications des profils de ces différentes courbes peuvent se retrouver dans les parties

précédentes.

Le profil des assurés étant présent dans le portefeuille est lui-même assez stable, la clientèle

ne change pas significativement d’une année sur l’autre, et comme les caractères détectés

comme influençant la décision étant pour la plupart des paramètres structurels, il est normal

d’observer une certaine stabilité dans les comportements des assurés. L’échantillon utilisé

pour le backtesting ne présente par contre que peu de contrats avec des anciennetés élevées et

un rachat observé peut faire rapidement dévier le résultat. En effet sur l’échantillon utilisé sur

le backtesting, on observe seulement 13 contrats rachetés en 2010 avec l’ancienneté 15. D’où

le décrochage avec les prévisions.

0%

1%

2%

3%

4%

5%

6%

7%

8%

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Taux de rachats

ancienneté (an)

Prévisions du modèle

Borne inf IC 90% Borne sup IC 90% Taux réels

55

4) Conclusion

Les travaux effectués permettent de se rendre compte de l’influence de certaines

variables, propres à l’assuré, comme le sexe et le capital initial. Le réseau de distribution des

contrats prend une importance toute particulière et peut expliquer certains comportements des

assurés, comme le pic de rachat observés lorsque le contrat atteint une ancienneté de 12 mois,

ou encore l’importance de l’inspection dont dépend le contrat dans le choix de racheter ou non

son contrat prise par l’assuré.

Les résultats se basent sur l’hypothèse que les rachats totaux, et les résiliations de contrat

surviennent pour des raisons communes, les résultats de cette étude sont donc à prendre en

compte sous la réserve de justesse de cette hypothèse. De plus, l’étude de certaines variables

n’a pas pu être faite. La cause principale étant la fiabilité et disponibilité des données. Aussi,

aucune variable conjoncturelle n’a pu être retenue dans l’étude.

Ces résultats ne peuvent être généralisés sans précautions : en effet, l’entreprise dans

laquelle cette étude à été faite dispose d’un réseau de distribution particulier, et les raisons des

rachats sont très liées au fonctionnement de ce dernier. De plus les contrats étudiés ont

certaines spécificités : capitaux assez faibles, limite d’âge à la souscription, pas de

questionnaire médical à l’entrée,

Quelques autres pistes semblent être intéressantes à développer, par exemple, certains

critères semblent indiquer que les gens qui rachètent leur contrat sont des gens en bonne

santé, cela se traduirait par une mortalité plus élevée pour les clients encore dans le

portefeuille que ceux étant sortis, cette hypothèse a pu être confirmée statistiquement grâce à

un test du khi mais les observations sont malgré tout peu nombreuses. Pour illustrer cette

hypothèse, on peut voir sur la figure 3.7 les courbes de mortalité du portefeuille PQ, et celle

des personnes ayant racheté leur contrat, mais étant encore client chez Prévoir.

56

Fig. 3.7 mortalité comparée sur contrats rachetés et portefeuille PQ

Cette analyse a permis de se rendre compte de l’influence de paramètres autres que

l’ancienneté sur la décision de rachat de l’assuré, certains de ces paramètres pourraient être

directement pris en compte pour les calculs des lois de comportement pour permettre une

segmentation plus fine. D’autres, comme l’état de santé de l’assuré, ne sont connus qu’a

posteriori et ne peuvent servir à la création des lois de rachat.

On peut se poser la question de l’influence des mêmes facteurs sur des contrats

différents provenant de la même entreprise, tels que les contrats d’épargne. Les rachats sont

ils influencés par les mêmes facteurs dans ces deux différents types de contrat?

0,000%

2,000%

4,000%

6,000%

8,000%

10,000%

12,000%

14,000%

16,000%

51 61 71 81

qx

âge

Mortalité comparée portefeuille et contrats rachetés

mortalité des personnes rachetant leur PQ mortalité du portefeuille PQ

57

Partie 4 analyse des causes de sorties anticipées des

contrats d’épargne

Dans la partie précédente, les contrats vie entière ont été analysés et certains facteurs

pouvant influencer le rachat ont été dégagés. Des contrats d’épargne ont été étudiés à l’aide

des mêmes techniques que dans la partie précédente, dans le même but : rendre compte de ce

qui peut influencer l’assuré lors du rachat de son contrat. Une meilleure connaissance

pourrait, par exemple, permettre une segmentation différente du portefeuille pour le calcul des

lois en montant.

1) Préparation et sélection des données

Les données disponibles sont nombreuses, et nombre de variables peuvent influencer

l’assuré, dans un sens ou dans l’autre. Certaines sont des variables permettant de capter

l’influence de la conjoncture, d’autres des variables structurelles, propres à l’assuré.

a) Données disponibles Parmi les contrats étudiés, le contrat le plus ancien à été souscrit le 1er novembre 1990, le

plus récent le 1er septembre 2011. La base de données est constituée de 133 797 contrats.

Parmi tous ces contrats, à la date d’extraction, 28538 contrats avaient été rachetés.

Pour ces types de contrat, l’assuré a la possibilité de souscrire même s’il est mineur, dans

ce cas, il doit être représenté par une personne majeure. L’âge moyen de souscription est de

53 ans, avec la répartition ci-dessous.

58

Fig.4.1 : Distribution de l’âge à la souscription

Géographiquement, la plupart des assurés du portefeuille sont situés dans les régions du

nord de la France, on retrouve en effet 60 % des assurés dans les régions nord-est, nord-ouest

et nord (découpage des régions en annexe).

D’autres données sont disponibles, telles que l’ancienneté du contrat, le montant de la

provision mathématique au début de chaque année où le contrat est en cours, le revenu du

foyer, le sexe de l’assuré, le montant total des cotisations de l’assuré versées à Prévoir, sur

l’ensemble des contrats qu’il détient, ainsi que d’autres variables. Il convient donc de faire un

choix quant aux variables à conserver et à étudier pour comprendre la décision de l’assuré.

b) Choix des variables Toutes les variables ne sont pas conservées et analysées, seules certaines présentent un

intérêt. Les variables propres à l’assuré qui sont étudiées sont par exemple le sexe et l‘âge de

l’assuré à la souscription du contrat, ainsi que le classement de l’inspection par laquelle le

contrat de l’assuré est géré. L’inspection dont dépend le contrat est en fait une zone

géographique. Des variables propres au contrat sont aussi prises en compte telles que

l’ancienneté de ce dernier, ou encore le montant de la provision mathématique.

Pour analyser ce phénomène de rachat, il faut aussi prendre en compte l’effet des variables

conjoncturelles. Dans le cadre du QIS 4 (étude d’impact quantifié), des paramètres standard

ont été fournis pour le traitement des rachats conjoncturels. Le taux de rachat conjoncturel est

0

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97

âge à la souscription

59

modélisé, dans le cadre du QIS, comme fonction de l’écart entre le taux servi R et le taux

moyen des emprunts d’Etat, c’est-à-dire le taux de rendement sur le marché secondaire des

emprunts d'État à taux fixe de maturité supérieure à 7 ans. (TME) observé. Notons RC(R) ce

taux, qui doit être rajouté au taux de rachat structurel. On a alors :

La formulation précédente permet d’interpréter les paramètres.

‐ α est le seuil en-deçà duquel les rachats conjoncturels sont constants et fixés à .

Ce n’est plus l’écart de taux qui explique le comportement des assurés.

‐ β et γ sont respectivement les seuils d’indifférence à la baisse et à la hausse du taux

servi. Entre ces 2 seuils, le comportement de l’assuré n’est pas modifié.

‐ δ est le seuil au-delà duquel la diminution du taux de rachat conjoncturel est constant

fixée a

Cette modélisation est confirmée dans le QIS 5, où il est précisé que la modélisation des

rachats doit tenir comptes des différents facteurs économiques (TP.2.108.).

Actuellement, le taux utilisé dans cette modélisation n’est pas le TME, mais un taux

concurrentiel moyen servi sur le marché, issu des données de la FFSA. Il est donc naturel

d’utiliser la différence de taux servi entre les contrats étudiés et la moyenne de taux servis sur

le marché comme une des variables explicatives du phénomène de rachat.

D’autres variables ont été aussi testées, mais n’ont pas été conservées car elles ne semblaient

pas présenter de lien avec le phénomène. Cette absence de lien a été confirmée à l’aide de

tests statistiques de la même façon que dans la partie précédente. Parmi ces variables, on peut

citer notamment le taux de chômage ainsi que l’évolution des taux du livret A.

Aussi, pour mieux comprendre l’influence de l’ancienneté, il est nécessaire de connaître les

modalités d’imposition des plus values des contrats d’épargne, que l’on peut retrouver dans la

première partie de ce mémoire.

60

Pour nous permettre d’avoir un portefeuille varié, et comme les comportements changent avec

le temps, nous allons étudier les données pour une période allant de 2005 à 2009 ; de plus, si

la période est trop ancienne, on ne pourra pas observer toutes les modalités de la variable

ancienneté, qui est une variable qui influence fortement la décision de l’assuré pour ce type de

contrat.

2) Spécification du modèle et résultats

Dans un premier temps, les rachats ont été analysés sans faire la distinction entre le rachat

partiel du contrat et le rachat total, puis ensuite en différenciant ces deux possibilités.

a) variables explicatives des modèles Les variables explicatives sélectionnées sont au nombre de neuf, trois sont propres à

l’assuré : son sexe, l’inspection dont il dépend et l’âge de l’assuré à la souscription du

contrat, quatre sont propres au contrat étudié : le montant de la provision mathématique,

l’ancienneté du contrat, la tranche de versement initial, et le nombre de rachats partiels déjà

survenus sur ledit contrat. Les dernières variables ont pour but de rendre compte des facteurs

conjoncturels : la différence de taux servi entre Prévoir et la moyenne du marché, et

l’évolution du CAC sur la période.

Ces variables semblent chacune avoir une influence sur la décision de racheter. Des

hypothèses sont faites sur l’influence de ces variables, puis sont validées, on non, par l’emploi

d’un modèle de régression logistique.

- le sexe

Lors des travaux faits sur les contrats vie entière, on s’est rendu compte que les femmes

rachetaient plus que les hommes. Les contrats d’épargne ont des caractéristiques différentes

que celles des précédents, mais il est tout de même intéressant de se poser la question et de

valider ou non l’influence de cette variable.

‐ l’âge à la souscription du contrat

Il semble se dégager une tendance selon laquelle, plus l’assuré est âgé, moins il a de

chance de racheter. Cette variable est conservée telle quelle, c'est-à-dire qu’elle est incorporée

61

dans le modèle en tant que variable continue, et on suppose que son effet sur la décision de

racheter est linéaire. Cette hypothèse permet de simplifier le modèle, et le coefficient de

détermination étant de 0,80, elle paraît raisonnable. La figure 4.2 nous permet d’observer les

taux de rachats des contrats en fonction de l’âge de l’assuré à la souscription.

Fig. 4.2 : Taux de rachats observés en fonction de l’âge à la souscription

‐ Le classement de l’inspection dont dépend la variable.

La construction de cette variable est détaillée dans la partie portant sur les contrats vie

entière. Et les inspections commerciales classées élevées l’année précédentes doivent avoir

des taux de rachats plus élevés que celles qui sont dans la moyenne.

Cette variable montre l’importance de la gestion des contrats dans la décision de

racheter, on voit qu’elle n’est pas liée avec la région géographique de l’assuré. En effet, un

test d’indépendance du khi ne permet pas de rejeter l’hypothèse nulle d’indépendance, la p-

value obtenue est très élevée : 0,72.

On peut voir sur le tableau ci-dessous, la répartition des inspections par région

géographique.

0,00%

4,00%

8,00%

12,00%

16,00%

20,00%

0‐20 31‐30 31‐40 41‐50 51‐60 61‐70 71‐80 81‐90

Taux de rachat

Age de souscription

Taux de rachat par tranche d'âge

62

région Classement Répartition

Bretagne élevé 41%

normal 59%

Centre‐Est élevé 63%

normal 38%

Centre‐ Ouest élevé 48%

normal 52%

Ile‐de‐France élevé 44%

normal 56%

Nord élevé 58%

normal 42%

Nord‐Est élevé 62%

normal 38%

Nord‐Ouest élevé 49%

normal 51%

Sud‐Est élevé 60%

normal 40%

Sud‐Ouest élevé 40%

normal 60%

Tableau 4.1 : Répartition des inspections par région géographique

Sur les années 2005 à 2009, le classement des inspections réalisé est relativement

stable. En effet, une inspection a 79,8 % de chances de rester dans la même catégorie d’une

année sur l’autre.

L’absence de lien avec la région géographique montre bien que cette variable rend

plus compte de la politique commerciale que d’une situation propre à l’ensemble de la zone.

D’autres variables plus spécifiques aux contrats sont étudiées, parmi celles-ci, on

retrouve le nombre de rachats partiels déjà survenus sur le contrat, l’ancienneté du contrat, la

provision mathématique du contrat en début d’année et enfin la tranche de versement initiale

du contrat.

63

‐ nombre de rachats partiels déjà survenus sur le contrat

Cette variable semble avoir une grande importance sur le contrat, il semble qu’un

assuré ayant déjà effectué des rachats partiels sur son contrat aura bien plus de chances d’en

refaire que quelqu’un qui n’en à jamais réalisé.

Fig. 4.3 : taux de rachats observés en fonction du nombre de rachats déjà survenus

Le graphique ci-dessus permet de voir les taux de rachat annuels sur des contrats selon

le nombre de rachats partiels. L’influence de cette variable peut être considérée comme

linéaire, le coefficient de détermination de la régression linéaire faite sur le taux de rachat en

fonction du nombre de rachats partiels survenus sur le contrat est de 0,9938 ce qui confirme

les précédentes observations.

‐ L’ancienneté du contrat

L’ancienneté est la durée qui s’est écoulée depuis la date d’effet du contrat. Ce paramètre

est celui qui a généralement le plus d’importance pour ce type de contrat. En effet,

l’ancienneté détermine la façon dont les rachats sont taxés. Pour un contrat avec moins de 4

ans d’ancienneté, le prélèvement libératoire sur les plus-values se fait au taux de 35 %, 15 %

si le retrait à lieu lorsque le contrat a entre 4 et 8 ans d’ancienneté et enfin 7,5 % lorsque le

contrat a plus de 8 ans d’ancienneté, avec un abattement dont le montant dépend de la

situation de l’assuré. L’assuré peut aussi choisir d’intégrer ses plus values dans son revenu, ce

qu’il fait dans la plupart des cas des contrats étudiés. Elles sont alors taxées au taux marginal

d’imposition, comme décrit dans la première partie.

R² = 0,9938

0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

30,00%

35,00%

40,00%

45,00%

0 1 2 3 ou plus

taux de rachat

nombre de rachat partiels survenus

taux de rachats en fonction du nombre de rachat précédents

taux de rachats

Linéaire (taux de rachats)

64

Pour les contrats d’épargne les taux de rachats sont généralement assez faibles les années

précédant le terme du contrat (8 ans), et on observe un pic de rachat lorsque le contrat atteint

une ancienneté de 8 ans, puis ensuite, une stabilisation à un niveau relativement faible. Ces 8

ans correspondent à la durée initiale du contrat et l’assuré peut bénéficier de conditions

fiscales avantageuses à ce moment là.

Cette variable ne peut donc pas être étudiée comme influençant les rachats de façon

linéaire : on va donc la prendre en compte comme un facteur à une modalité pour chaque

ancienneté, jusqu'à 10. Les anciennetés supérieures à 10 seront regroupées dans la modalité

10 : en effet, le comportement durant ces années reste assez stable.

‐ La provision mathématique du contrat en début d’année

La provision mathématique représente le montant à la disposition de l’assuré, ce

montant est récupéré en début d’année. On observe des taux de rachats plus élevés sur les

contrats ayant une faible provision (moins de 2 000€) ou lorsque cette provision est élevée

(plus de 25 000€).

‐ La tranche de versement initial

Lors de la réalisation du contrat, l’assuré dépose un montant, qui doit forcément dépasser un

montant défini. Lors de la réalisation des lois en montant (versement et rachat), cette variable

est utilisée pour segmenter le portefeuille, on choisit donc d’étudier son influence.

Deux autres variables rendant compte de la conjoncture sont ajoutées, ces deux

variables sont l’évolution annuelle du CAC 40, ainsi que la différence de taux servi entre

Prévoir et la moyenne du marché sur les contrats en euros.

‐ l’écart de taux servi entre Prévoir et la moyenne du marché

Cette variable permet d’introduire un effet conjoncturel sur les rachats, quand on retrouve

un écart important entre le taux servi par l’assureur et le taux prévalant sur les marchés, ou le

taux moyen servi des contrats en euros de la concurrence, l’assuré peut être amené à retirer

son placement pour l’investir dans des contrats plus rémunérateurs.

Cette variable est calculée de la façon suivante :

65

Lorsque cette variable augmente, cela veut dire que les taux servis sur les contrats étudiés sont

plus performants que la moyenne du marché, ce qui implique que les rachats qui sont

observés doivent donc diminuer, et inversement.

De plus, comme les assurés ne disposent généralement d’aucune information sur la rentabilité

espérée de leur contrat, on observe en pratique qu’ils considèrent le passé comme la meilleure

prévision de l’avenir, qu’il s’agisse de leur contrat ou d’une forme d’épargne concurrente.

Pour appréhender cet effet sur l’année n, il faut donc comparer les rendements servis l’année

n-1.

‐ Evolution annuelle du CAC 40

De la même façon que la variable précédente, cette variable est calculée comme

Si on suppose que l’assuré considère le passé comme la meilleure prévision de l’avenir, plus

cette évolution est élevée, plus l’assuré pense avoir intérêt à racheter son contrat et à placer le

montant obtenu sur des contrats en unités de compte, par exemple.

Une des difficultés de la prise en compte de ces deux dernières variables est qu’elles peuvent

influencer l’assuré de plusieurs façons, et à des moments différents. En effet, un assuré qui

suit la situation économique quotidiennement sera bien plus réactif qu’un individu ne s’y

intéressant que très peu.

Aussi, un assuré n’ayant qu’un intérêt modéré pour l’économie pourrait prendre plusieurs

mois pour réagir à une variation des marchés, alors qu’un assuré se tenant au courant au jour

le jour pourrait réagir immédiatement.

3) Résultats et commentaires

a) Sans distinction entre rachats totaux et partiels Dans un premier temps, les phénomènes de rachats totaux et partiels sont considérés

comme ayant des causes identiques, 70 % des données sont utilisés pour estimer le modèle,

30 % pour valider nos observations. Pour choisir les variables explicatives qui ont du sens, on

commence par estimer le modèle complet, c'est-à-dire le modèle qui prend en compte toutes

66

les variables explicatives, ainsi que toutes les interactions entres ces variables, puis les

variables les moins significatives sont éliminées une à une en sélectionnant le modèle qui

maximise le critère d’AIC. Dans le tableau 4.5 on peut voir les coefficients de la régression

logistique qui ont été estimés à l’aide du logiciel R (on pourra retrouver les sorties de R en

annexe pour plus de détails)

:

Tableau. 4.2 : Résultats de l’estimation du modèle sur les rachats totaux et partiels

Variable (significativité) modalité coeff

cste (***) ‐1,485633rachat antérieur (***) 0,322205Ancien (***) 0 (Réf.)

1 ‐0,3256252 ‐0,4967873 ‐0,6285934 ‐0,8211285 ‐0,9856626 ‐1,1940757 ‐1,5366058 ‐0,0564789 ‐0,91568310 ‐1,006199

PM (***) <2000 (Réf.)entre 2000 et 25000 ‐0,222423>25000 ‐0,002366

classement inspection (***) normal ‐0,2031élevé (Réf.)

CAC (*) 0,189465Ancien :rachat antérieur(***)0 (Réf.)

1 0,981322 0,5894233 0,4067534 0,2880985 0,1985036 0,2651857 0,2244718 ‐0,1412259 0,09453210

PM2:rachat antérieur(***) <2000 (Réf.)entre 2000 et 25000 0,415921>25000 0,513148

67

La déviance standardisée, qui vaut 46447 est faible devant le nombre de degrés de liberté

(68974). Le modèle est considéré comme pertinent.

Le test de Wald nous indique que certains coefficients ne sont pas significatifs, ces tests

portent sur l’occurrence de la variable, et non sur la variable elle-même, une ANOVA permet

de confirmer que la variable ancienneté est bien significative. Ainsi que toutes les autres, à

l’exception de la variable différence de taux.

Pour valider le modèle, on se sert des 30 % de données qui n’ont pas servi lors de la

phase d’estimation. On peut observer que les pourcentages de rachats prévus par le modèle,

en fonction de l’ancienneté et ceux observés sont proches.

Fig.4.4 : taux de rachats observés et prévus en fonction de l’ancienneté

Le modèle semble donc donner des résultats satisfaisants. Afin de valider les observations, on

réalise un test de Hosmer et Lemeshow, décrit dans la partie précédente. La p-value de ce test

est de 37 %, on ne rejette donc pas l’hypothèse nulle qui affirme que les deux échantillons

proviennent de la même loi, et on considère donc que la précision du modèle est acceptable.

Parmi les variables précédemment décrites, quatre ont été écartées, car non

significatives au seuil de 5 % et ne semblent pas avoir d’influence sur le choix de l’assuré. Ce

5%

7%

9%

11%

13%

15%

17%

19%

21%

23%

25%

0 1 2 3 4 5 6 7 8 9 10

Taux de rachat

Anciennetée (années)

Résultats du modèle et observations

68

sont le sexe, l’âge lors de la souscription du contrat, la tranche de versement initial et enfin la

différence de taux servi avec la concurrence.

Contrairement aux contrats PQ précédemment étudiés, la santé des assurés ne semble

pas influencer le rachat ou non du contrat : en effet, les femmes vivent plus longtemps, et on

avait pu remarquer que ces dernières avaient plus tendance à racheter pour les contrats vie

entière, ce qui n’est pas le cas ici, il en va de même pour les assurés « jeunes ».

Aussi, l’effet de la tranche de versement initial n’est pas retenu. Dans les lois en

montant, on remarque que cette variable a une influence sur la loi de versement, mais pas sur

la loi de rachat, on lui préférera la PM du début d’année du contrat.

Parmi toutes les variables étudiées qui se sont révélés significatives, la variable la plus

discriminante est le nombre de rachats antérieurs survenant sur le contrat. Une fois que

l’assuré rachète partiellement son contrat, le risque que ce comportement se reproduise

augmente considérablement. Par exemple, un contrat ayant subi un rachat partiel durant sa

première année aura 4,6 fois plus de chances de racheter tout ou partie de la provision de son

contrat qu’un contrat n’ayant pas subi de rachat durant sa première année.

Cet effet s’atténue au cours du temps, le même rapport pour un contrat de 9 ans d’ancienneté

est seulement de 2. Il est donc important de prendre en compte l’interaction entre le nombre

de rachats antérieurs et l’ancienneté du contrat.

Les coefficients du modèle peuvent être interprétés à l’aide du calcul de rapport de chances

(ou odds ratio). On voit dans un premier temps, que l’ancienneté est un facteur très

discriminant, le rapport de chances entre les anciennetés 7 et 8 est de 2,3, c'est-à-dire qu’un

contrat qui a atteint 8 ans d’ancienneté en début d’année a une probabilité de se faire racheter

130 % plus élevé qu’un même contrat ayant un an de moins d’ancienneté. Le risque de rachat

diminue jusqu'à 7 ans d’ancienneté, puis un grand nombre de contrats sont rachetés la 8ième

année. Le pic à 8 ans et la forte décroissance pour les années précédentes peuvent être

expliqués par les conditions fiscales qui s’appliquent à ces contrats. En effet, plus les assurés

se rapprochent de l’échéance de leur contrats (8 ans) plus ils ont intérêt à attendre jusqu'à

l’échéance pour bénéficier de conditions fiscales avantageuses : un abattement sur

l’imposition des plus-values.

On voit aussi que l’inspection dont dépend l’assuré joue un rôle toujours aussi important, les

assurés provenant d’une inspection classée « élevé » l’année précédente ont un risque 39 %

69

plus élevé de racheter que ceux qui proviennent d’une inspection classé « normale ».Les

commerciaux qui distribuent les contrats sont dirigés par des inspecteurs, qui gèrent donc

chacun une inspection. On voit bien que cette variable a une influence conséquente sur la

décision de l’assuré. De plus, l’absence de lien entre cette variable et la région géographique

nous permet de supposer que cette variable rend compte de l’influence du réseau de

distribution.

Ce premier modèle nous montre bien le caractère fortement discriminant de l’ancienneté,

d’autres variables jouent aussi un rôle important, par exemple l’inspection, mais aussi et

surtout le nombre de rachat déjà survenus sur le contrat.

Cette analyse s’appuie sur l’hypothèse que les rachats, autant partiels que totaux, surviennent

pour les mêmes raisons. Une différentiation du choix de racheter totalement ou partiellement

son contrat est faite dans la partie suivante.

b) Avec distinction entre rachats totaux et partiels Les rachats totaux et partiels de contrat peuvent être séparés, dans le but de déterminer

quels facteurs peuvent pousser l’assuré à racheter totalement son contrat, et quels facteurs

peuvent au contraire l’amener à retirer seulement une partie de sa provision.

Pour analyser l’influence des variables sur les trois choix qui s’offrent à l’assuré, la méthode

du modèle logistique n’est plus adaptée, il faut donc utiliser d’autres techniques. Tout d’abord

le premier choix qui pourrait s’imposer est le modèle logistique multinomial, avec comme

variable à expliquer la variable qui décrit le comportement de l’assuré : soit il conserve son

contrat au cours de l’année, soit il le rachète partiellement, soit totalement.

L’intérêt d’analyser le comportement de l’assuré de cette façon est de pouvoir déterminer

quelles variables peuvent influencer l’assuré dans un sens plutôt qu’un autre.

Le modèle logistique multinomial permet de modéliser une telle prise de décision, sous

l’hypothèse de l’indépendance des alternatives non pertinentes. Il est donc nécessaire de

vérifier que cette hypothèse est réaliste. Pour cela, on réalise le test de Hausman et McFadden

dont la mise en place est détaillée ci dessous :

Soit donc C l’espace total des choix, on a alors :

70

C= racheter totalement ; racheter partiellement ; ne pas racheter

Soit A inclus dans C

A= racheter totalement ; racheter partiellement

Si l’hypothèse nulle d’indépendance des alternatives non pertinentes est vérifiée, alors S la

statistique du test, dont le calcul est décrit dans la partie 2. Doit suivre une loi du khi dont le

nombre de degrés de liberté est le rang de la différence entre les matrices de variance-

covariance des modèles estimés sur A et C.

La p-value de ce test, c'est-à-dire la probabilité sous l’hypothèse nulle que la statistique du test

soit supérieure ou égale à la valeur calculée, est inférieure à 2,2×10-16 l’hypothèse d’IIA est

donc assez largement rejetée, le modèle logistique multinomial n’est donc clairement pas

adapté à la situation étudiée.

Pour pallier à cet inconvénient, une alternative possible est l’utilisation du modèle logistique

emboité. Dans ce dernier, on structure la décision de l’assuré en groupes.

Ce type de modèle est particulièrement adapté aux situations où les choix offerts à l’individu

peuvent être regroupés selon leurs ressemblances, c'est-à-dire de sorte que tous les choix d’un

même groupe partagent une qualité que l’on ne retrouve pas dans les autres groupes.

Dans la situation étudiée, on regroupe les choix de la façon suivante dans un premier temps,

l’assuré choisit de racheter ou non ; puis dans un second temps, l’assuré, s’il a décidé de

racheter, choisit si son rachat est un rachat partiel, ou total.

Cette décision ne se passe pas nécessairement en deux temps pour l’assuré, mais elle est

modélisée de cette façon.

On voit sur la figure 4.5 la représentation schématique des choix de l’assuré.

71

Fig. 4.5 : processus décision de l’assuré

Le modèle est donc un modèle logistique emboité à deux niveaux, et partiellement dégénéré.

Si le rachat est total, l’assuré retire la totalité de sa provision, et son contrat se termine. Si le

rachat est partiel seulement une partie de la provision est retirée et le contrat reste en

portefeuille.

La spécification de ce modèle, et le regroupement des choix rachat total et rachat partiel

semblent évident, il n’en va pas de même pour définir à quel niveau les variables influencent

l’assuré.

On considérera que le choix de racheter ou non de l’assuré est motivé par l’ancienneté de son

contrat, l’inspection dont il dépend, et enfin le niveau du CAC. Ces paramètres ont une

influence réelle sur le choix de l’assuré, influence qui a été vérifié dans la partie précédente.

Seul le montant de la provision mathématique influencera l’assuré dans son choix entre un

rachat partiel ou un rachat total.

L’estimation du modèle se déroule en plusieurs étapes, dans un premier temps, on estime le

modèle correspondant à la situation ou un rachat est survenu et l’assuré doit encore choisir

entre un rachat partiel ou total. A la fin de cette première étape, on a donc le coefficient .

Dans un second temps, on calcule, sur toutes les variables de l’échantillon d’estimation, la

valeur de la variable d’inclusion VI, avec

Enfin, on estime le Logit qui modélise la décision de racheter ou non tout ou partie du contrat.

72

Les probabilités des évènements étudiés s’écrivent comme :

Et de plus,

Aussi

Avec x le vecteur des variables explicatives qui interviennent au premier niveau (ancienneté,

âge, groupe de l’inspection, différence de taux avec la moyenne du marché), et les

variables explicatives qui interviennent au deuxième niveau (PM et sexe). est le

coefficient qui correspond à la variable d’inclusion.

L’estimation du modèle donne les résultats suivants, avec les variables définies

précédemment :

Coefficient

Constante 0,13

PM

Inférieure à 2000€ Référence

Entre 2000 et 25000€ -1,53

Supérieur à 25000€ -2,82

Tableau 4.3 : coefficients du Logit emboité niveau inférieur

73

Coefficient

Constante -1,80

Classement inspection élevé Référence

Classement inspection normale -0,30

Ancienneté

0 Référence

1 -0.090

2 -0.091

3 -0.15

4 -0.22

5 -0.49

6 -0.43

7 -0.65

8 0.14

9 -0.37

10 et plus -0.48

Variable d’inclusion 1 0

Variable d’inclusion 2 -0,23

Tableau 4.4 : coefficients du Logit emboité niveau supérieur

Le coefficient correspondant à la variable d’inclusion mesure le degré de corrélation des choix

d’un même groupe, plus le coefficient correspondant à cette variable d’inclusion est élevé,

moins les choix du groupe correspondant sont corrélés.

Comme la première branche est dégénérée, elle représente le choix de ne pas racheter, la

variable d’inclusion 1 est fixée à 1.

La seconde variable d’inclusion est calculée à l’aide du modèle décrivant le choix entre le

rachat partiel et le rachat total. Le coefficient estimé correspondant à cette variable

d’inclusion est de -0,23, ce qui implique qu’il y a une forte corrélation entre les choix de

racheter totalement et partiellement son contrat.

Le modèle ne peut pas être considéré comme satisfaisant : en effet, il ne semble pas que l’on

puisse trouver des variables propres à chaque choix, et le choix de la provision comme seule

variable différenciant le rachat partiel du rachat total n’est pas le meilleur possible.

74

On peut tout de même remarquer que le montant de la PM semble grandement influencer le

choix entre rachat total et partiel. Comme le montre les coefficients que l’on a estimés et que

l’on retrouve en figure 4.7.

Cette hypothèse est aussi confirmée par l’observation du montant de la PM selon si le contrat

a été racheté partiellement ou totalement au cours de l’année. On observe sur la figure 4.9 la

fonction de répartition de la PM suivant la situation du contrat.

Fig. 4.6 Fonction de répartition de la PM du contrat (en k€)

On remarque que le montant de la provision des contrats rachetés totalement est bien plus

faible que ce montant pour les contrats rachetés partiellement, à titre d’exemple, 24 % des

contrats rachetés partiellement ont une provision en début d’année inférieure à 2000 €, ce

pourcentage monte à 42 % pour les contrats rachetés totalement au cours de l’année.

Cette partie a permis de montrer que d’autres paramètres que l’ancienneté pouvaient

influencer l’assuré lors de son choix. Tels que le nombre de rachats antérieurs, le montant de

la provision mathématique, ou encore le groupe d’inspection, ces valeurs rendent compte du

comportement passé de l’assuré, de l’influence du réseau de distribution. On voit aussi que ce

portefeuille n’est pas tellement influencé par les variables conjoncturelles. On peut aussi

supposer que les effets conjoncturels aient une influence seulement sur certains contrats ceux

avec des montants de provisions élevés par exemple, et n’influence pas le comportement des

assurés détenant des petits contrats. Dans ce cas, cet effet serait plus difficilement détectable.

0%

20%

40%

60%

80%

100%

2 12 22 32

Montant de la PM (k€)

Fonction de la répartition de la PM selon la situation du contrat

75

4) Backtesting

Le premier modèle estimé, qui permet d’analyser certaines causes de rachat avait été

étalonné avec les données de 2006 à 2009.

De la même façon que pour le modèle sur les contrats de type vie entière, on peut backtester

le modèle sur l’année 2010, dont les paramètres ont été estimés à partir des années

précédentes. Afin de conforter les observations faites précédemment.

Le modèle nous permet donc d’avoir des intervalles de confiance des estimateurs des taux de

rachats à l’aide de la méthode détaillé dans la partie 4-3-a.

Fig. 4.7 prévisions du modèle

Ces intervalles de confiance sont calculés au niveau 90%. On peut voir sur le graphique 4.7

ces intervalles. L’amplitude de ces intervalles est bien plus importante que sur le portefeuille

vie entière, ou les comportements étaient bien plus prévisibles. On voit ici que les taux de

rachat pour les anciennetés 7 et 8 sont relativement élevés, au niveau supérieur de l’intervalle

de confiance à 90% des prévisions. Sur les années ayant servi à l’estimation, on observait un

0,000%

5,000%

10,000%

15,000%

20,000%

25,000%

0 1 2 3 4 5 6 7 8 9 10

Taux de rachats

ancienneté (an)

Prévisions du modèle

Borne inf IC 90% Borne sup IC 90% Taux réels

76

taux de rachat moyen de 20,2% la 8ième année de vie du contrat, alors qu’ils s’élèvent à

21,08 % sur l’an 2010.

Conclusion

Ces différents travaux effectués dans le cadre du mémoire d’actuaire avaient pour but

d’améliorer la connaissance des comportements des assurés, en analysant l’influence de

différents facteurs sur ces comportements.

L’étude de deux portefeuille, contrats vie entière et contrats d’épargne, ont permis de

dégager certaines tendances.

Tout d’abord, quel que soit le type de contrat, les comportements de rachats dépendent

fortement de l’ancienneté du contrat, qui reste le paramètre permettant d’expliquer au mieux

les choix de l’assuré. Aussi, cette étude a permis de rendre compte de l’influence non

négligeable du réseau de distribution de ces contrats. On remarque en effet que les

portefeuilles dépendant de certaines équipes subissent des rachats à une fréquence plus élevée.

Une explication possible serait qu’une équipe assurant un suivi des contrats aura plus

tendance à satisfaire ses clients et ainsi diminuer les rachats observés sur le portefeuille,

qu’une équipe qui serait orienté vers la prospection de clients.

Mais on remarque aussi que chaque portefeuille a ses caractéristiques propres.

Concernant le portefeuille vie entière, Kuo et al. [13] ont identifié le rachat de contrats comme

une source de risque pour l’assureur, car il peut être sujet au risque d’anti sélection, c'est-à-

dire que les assurés en mauvaise santé sont plus enclins à conserver leur contrat. Les

observations faites sur notre portefeuille vont dans ce sens et on peut affirmer que les

comportements de rachat détériorent effectivement la mortalité du portefeuille vie entière.

D’autres études telles que celle de Kiensenbauer [11] se concentrent sur les liens existants

entre les comportements de rachats et la situation économique. On ne retrouve pas cet aspect-

là dans l’étude des deux portefeuilles. Les comportements observés ne présentent pas de lien

avec les variables conjoncturelles classiques dans les portefeuilles étudiés.

Actuellement, dans l’entreprise, les lois de comportement sont calculées en fonction

de l’âge et de l’ancienneté des contrats. Au vu des résultats de l’étude, ces deux paramètres

77

permettent effectivement de bien capter les tendances. La précision de ces lois pourrait malgré

tout être améliorée en utilisant d’autres paramètres propres au type de contrats. Aussi, lors de

la détermination des lois de comportements, ces dernières sont déterminées à partir de

données issues de chacun des produits. Cependant, lorsque le produit ne dispose pas d’effectif

ou de l’ancienneté suffisante pour que toute la loi soit déterminée à partir de son historique

propre, l’expérience acquise sur un produit similaire du portefeuille est utilisé. Le choix du

produit qui servira donc à prolonger la loi peut être affiné si les causes de rachats sont

connues sur chaque produit.

Concernant l’influence de la situation économique, il pourrait sembler qu’il n’y a pas

eu d’influence de la conjoncture sur les comportements des assurés. La question reste posée

en cas de choc conséquent sur les marchés d’une ampleur n’ayant pas été observé

précédemment. Y a-t-il un seuil à partir duquel les comportements de assurés seraient

affectés, et de quelle manière ?

78

Bibliographie [1] AFSA ESSAFI, C., Les modèles logit polytomiques non ordonnés : théorie et

applications, Série des Documents de Travail Méthodologie Statistique N° 0301

[2] ALBIZZATI, M.O. , GEMAN, H. (1994), Interest Rate Risk Management and Valuation of the Surrender Option in Life Insurance Policies. The Journal of Risk and Insurance, N°4, 616-637.

[3] AUTORITE DE CONTROLE PRUDENTIEL (2010) Orientations Nationales

Complémentaires aux Spécifications Techniques, Solvabilité 2 – 5ème étude d’impact (QIS5).

[4] BOISSELIER, P. ,DUFOUR, D. (2003). Scoring et anticipation de défaillance des

entreprises : une approche par la régression logistique. Identification et maîtrise des risques : enjeux pour l'audit, la comptabilité et le contrôle de gestion

[5] CHERIF T. , PRAS I. (1997) Evaluation de l’option de rachat anticipé dans les

contrats d’assurance-vie. Publication pour l’Association Française de Finance (AFFI)

[6] FAUVEL S., LE PEVEDIC M. (2007), Analyse des rachats d'un portefeuille vie individuelle : Approche théorique et Application pratique disponible sur http://www.ressources-actuarielles.net/

[7] HOSMER D.,LEMESHOW S. (2000) Applied logistic regression, Second edition,

John Wiley & Sons, Inc.

[8] INSEE (2000), Présentation et mise en oeuvre de modèles de régression qualitatifs, Les modèles univariés à résidus logistiques ou normaux (LOGIT, PROBIT), disponible sur http://www.institutosondage.com.br/textos_pdf/texto_123.pdf

[9] KALTWASSER, P., LE MOINE, P. (2004), Modèles de risque et solvabilité en

assurance-vie, Commission de Contrôle des Assurances, des Mutuelles et des Institutions de Prévoyance (CCAMIP).

[10] KAGRAOKA Y. (2005), Modeling insurance surrenders by the negative binomial model, Working paper

[11] KIENSENBAUER D. (2011), Main determinants of lapse in the German life insurance industry, disponible sur http://www.uni-ulm.de/fileadmin/website_uni_ulm/mawi/forschung/PreprintServer/2011/Lapse.pdf

[12] KIM, C. 2005. Modeling Surrender and Lapse Rates with Economic Variables.

North American Actuarial Journal, 9(4):56–70.

79

[13] KUO, W., TSAI, C., and CHEN, W.-K. (2003). An Empirical Study on the Lapse Rate: The Cointegration Approach. Journal of Risk and Insurance, 70(3):489–508.

[14] MILHAUD, X., GONON, M.P., LOISEL S. (2010) Les comportements de

rachat en assurance vie en régime de croisière et en période de crise, Risques, Vol 83, 76-81

[15] MILHAUD, X., LOISEL, S., MAUME-DESCHAMPS, ( 2010). Surrender

triggers in life insurance: classification and risk predictions. Bulletin Français d'Actuariat

http://www.institutdesactuaires.com/bfa/

http://www.institutdesactuaires.com/bfa/

80

Annexes

variables nom dans le modèle logit description

groupe d'âge grp_age 0: entre 60 et 74 inclus 1 : complémentaire sexe sexe 0: Féminin 1: Masculin

nombre de souscriptions précédentes nb_scr nombre de souscription antérieures de l'assuré chez prévoir, continue

capital initial cap_init capital initial du contrat, continue

ancienneté ancien temps en année depuis la souscription

inspection groupe d.inspection normal ou élevé

Table A-1, Définition des variables explicatrices du modèle Prévoir Quiétude

81

variables modalité nombre d'occurrences

groupe d'âge 0 61% 1 39% sexe 0: Féminin 51% 1: Masculin 49% nombre de souscriptions précédentes 0 70% 1 24% 2 7% capital initial 3000-5000 59% 5000-10000 34%

10000-15000 5%

15000-32000 3%

ancieneté 0-3 33% 4-7 30% 8-11 23% 11-15 14% inspection normal 52% élevé 48%

Table A-2, Observations par attributs, Portefeuille Prévoir Quiétude

82

Fig. A-1 : Régression logistique Prévoir Quiétude, sortie R

83

Variables nom dans le modèle logit description

Provision mathématique PM 0: inférieure à 2000 €

1 : entre 2000 et 2 000 € 2 : supérieur à 25000€

nombre de rachat survenus les années précédentes rach_ant

nombre de rachat survenus les années précédentes sur le

contrat, 0 1 2 et 3 ou plus

Evolution annuelle de l’indice CAC CAC Evolution annuelle de l’indice CAC sur l’année précédente

Ancienneté ancien temps en année depuis la souscription

Inspection groupe normal ou élevé

Table A-3, Définition des variables explicatrices du modèle d’épargne

84

variables modalité nombre d'occurrences

PM 0 24 %

1 60 % 2 16 % nombre de rachat survenus les années précédentes 0 75 %

1 13 %

2 5 % 3 7 % Année étudié 2005 20 % 2006 20 % 2007 20 %

2008 20 % 2009 20 % ancienneté 0-3 32 % 4-7 20 % 8 et plus 48 % inspection normal 40 % élevé 60 %

Table A-4, Observations par attributs, Portefeuille Prévilibre

85

Fig. A-2. Régression logistique contrats d’épargne, sortie R

86

Fig. A-3 découpage en région commerciales

Fig. A-4 taux du livret A et taux de rachats (centrés réduits) sur contrats d’épargne

‐2

‐1,5

‐1

‐0,5

0

0,5

1

1,5

2

2,5

2000 2002 2004 2006 2008

tx livret A

taux