Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
Mémoire présenté devant l’Institut de Science Financière et d’Assurances pour l’obtention du diplôme d’Actuaire de l’Université de Lyon
le 22/03/2013
Par : Nicolas Ladias Titre: Analyse des causes de rachats sur des contrats d’assurance vie
Confidentialité : NON OUI (Durée : 1 an 2 ans)
Membre du jury de l’Institut des Actuaires Entreprise :
Prévoir Membres du jury I.S.F.A. Directeur de mémoire en entreprise : M. Jean Claude AUGROS Bruno Devictor M. Alexis BIENVENÜE M. Areski COUSIN Invité : Mme Diana DOROBANTU Mme Anne EYRAUDLOISEL M. Nicolas LEBOISNE M. Stéphane LOISEL Autorisation de mise en ligne sur
un site de diffusion de documents actuariels (après expiration de l’éventuel délai de confidentialité)
Mlle Esterina MASIELLO Mme Véronique MAUMEDESCHAMPS M. Frédéric PLANCHET M. François QUITTARDPINON Mme M.
Béatrice REYFOURNIER Pierre RIBEREAU
Signature du responsable entreprise
M. ChristianYann ROBERT M. M.
Didier RULLIERE Pierre THEROND
Secrétariat Signature du candidat Mme MarieClaude MOUCHON Bibliothèque : Mme Michèle SONNIER
50 Avenue Tony Garnier 69366 Lyon Cedex 07
Université Claude Bernard – Lyon 1
INSTITUT DE SCIENCE FINANCIERE ET D'ASSURANCES
Institut de Sciences Financière et d’Assurances (ISFA)
A N A L YSE D ES C A USES D E R A C H A TS SUR D ES C O N T R A TS D’ASSURANCE VIE
Mémoire présenté par M. Ladias Nicolas, Pour l’obtention du diplôme d’actuaire Sous la direction de M. Devictor Bruno
Paris, Septembre 2012
3
Résumé
Il est important, pour une entreprise d’assurance, de connaître et pouvoir anticiper le
comportement de ses assurés afin de pouvoir piloter au mieux son activité. Dans ce but, ce
mémoire analyse les rachats de contrats d’assurance vie, plus précisément un portefeuille de
contrats vie entière et un portefeuille de contrats d’épargne.
Cette étude doit permettre de déterminer un ensemble de caractères propres à l’assuré, à la
situation économique ou encore aux contrats, qui peut donner de l’information sur le
comportement de rachat de l’assuré. Ces éléments peuvent ensuite servir de critères de
segmentation lors de la construction des lois de rachats.
Actuellement, au sein de l’entreprise Prévoir, les lois de rachats sont utilisées pour le calcul
de l’embedded value, du taux de rendement interne, et bientôt pour les provisions sous
Solvabilité 2. Elles sont calculées en fonction de l’ancienneté du contrat et de l’âge de l’assuré
pour les contrats vie entière, et en fonction de l’ancienneté du contrat et de la provision pour
l’épargne.
Pour permettre de vérifier la construction de ces lois et afin de mieux connaître ces
comportements de rachats, l’étude s’appuie sur les modèles de régression logistique. Ces
modèles permettent d’analyser et de quantifier les effets des variables retenues pour expliquer
les raisons des sorties anticipées. Les variables étudiées sont nombreuses, conjoncturelles ou
structurelles, mais ne peuvent être toutes prises en compte.
Les résultats obtenus ne nous permettent pas de dégager un effet conjoncturel, mais font
ressortir certains éléments. Les variables classiques (ancienneté, âge et provision) jouent
effectivement un rôle prépondérant et permettent d’expliquer en grande partie les choix des
assurés. On remarque aussi que certaines caractéristiques propres aux types de contrats ou à
l’entreprise ont une importance non négligeable. Ainsi, par exemple, on peut retrouver un lien
entre le réseau de distribution des contrats et les phénomènes de rachats.
Cette étude permet de valider les choix de modélisation qui ont été faits, mais la précision de
ces lois de rachats pourrait être améliorée en prenant en compte certains critères. Aussi,
l’absence d’influence conjoncturelle pendant la période étudiée ne nous permet pas de tirer de
conclusions.
Mots clés : Rachats, Modèle de régression logistique, assurance vie, Logit
4
Abstract
It is important for an insurance company to know and be able to anticipate the
behavior of its policyholders in order to drive the activity. To this end, this paper analyzes the
surrenders of life insurance, especially in whole life contract portfolio and a portfolio of
savings contracts.
This study must determine a unique set of characteristics specific of the insured, the economic
situation or of contracts which can provide information on the repurchase behavior of the
insured. These elements can then be used as segmentation when modeling the portfolio.
Currently, in the company Prévoir the surrender laws are used for the calculation of the
embedded value, the internal rate of return, and soon for the provisions under Solvency 2.
They are calculated according to seniority under the contract and the age of the insured for
whole life contract, and depending on the age of the contract and the provision for savings
contracts.
In order to verify the construction of these probabilities, so as to better know these surrender
behaviors, the study is based on logistic regression models. These models allow to analyze
and quantify the effects of variables used to explain the reasons for early exit. The variables
studied are cyclical or structural, but can not all be taken into account.
The results do not allow us to highlight a cyclical effect, but highlight some elements.
Classical variables (age, age provision) do play a role and can explain many of the choices
made by the insured. We also note that characteristics relating to types of contracts or
business have a significant importance. For example, one can find a link between the
distribution networks of contracts and repurchase phenomena.
This study helps to validate the modeling choices that were made, but the accuracy of the
modeling of surrenders behavior could be improved by taking into account some other
criteria. Also, the absence of cyclicality during the study period did not allow us to draw
conclusions.
Key words: Surrender, logistic model, logit model
5
Sommaire
Introduction ................................................................................................................................. 7
Partie 1‐ Sorties anticipées et importance de la modélisation des lois de comportement ............... 9
1) Cadre de l’étude .......................................................................................................................... 9
2) Situation future ......................................................................................................................... 12
a) QIS5, Solvabilité 2 .................................................................................................................. 12
b) Fiabilisation de la modélisation ............................................................................................. 13
3) Portefeuilles de données étudiés et méthodes ........................................................................ 16
a) Objectifs du mémoire ............................................................................................................ 16
b) Types de contrats analysés .................................................................................................... 16
c) Statistiques sur les portefeuille ............................................................................................. 19
Partie 2‐ Méthodologie ............................................................................................................... 25
1) Le modèle de régression logistique ........................................................................................... 25
a) Présentation .......................................................................................................................... 25
b) Formalisation mathématique ................................................................................................ 26
c) Estimation .............................................................................................................................. 28
d) Validation du modèle ............................................................................................................ 29
2‐ les modèles Logit multinomial et Logit emboité ........................................................................... 30
a) Logit multinomial................................................................................................................... 30
b) Logit emboité ........................................................................................................................ 32
c) Choix du modèle .................................................................................................................... 34
2) Choix et transformation des variables ...................................................................................... 35
a) Choix des variables ................................................................................................................ 35
b) Regroupement des variables ................................................................................................. 36
c) Interactions ........................................................................................................................... 37
3‐le test de Hosmer et Lemeshow .................................................................................................... 39
Partie 3‐ analyse des causes de sorties anticipées des contrats vie entière .................................. 41
1) Préparation et sélection des données ....................................................................................... 41
a) Données disponibles ............................................................................................................. 42
b) Choix des variables ................................................................................................................ 43
2) Spécification du modèle et résultats ......................................................................................... 49
a) Spécification du modèle ........................................................................................................ 49
b) Résultats et commentaires .................................................................................................... 49
3) Validation et Backtesting ........................................................................................................... 52
6
4) Conclusion ................................................................................................................................. 55
Partie 4‐ analyse des causes de sorties anticipées des contrats d’épargne ................................... 57
1) Préparation et sélection des données ....................................................................................... 57
a) Données disponibles ............................................................................................................. 57
b) Choix des variables ................................................................................................................ 58
2) Spécification du modèle et résultats ......................................................................................... 60
a) variables explicatives des modèles ....................................................................................... 60
3) Résultats et commentaires ........................................................................................................ 65
a) Sans distinction entre rachats totaux et partiels .................................................................. 65
b) Avec distinction entre rachats totaux et partiels .................................................................. 69
4) Backtesting ................................................................................................................................ 75
Conclusion ................................................................................................................................. 76
7
Introduction
La connaissance des flux futurs du passif à toujours été fondamentale pour le
pilotage de l’activité d’assurance. Afin de piloter l’équilibre de ses ressources, l’assureur doit
comprendre les comportements de sa clientèle pour pouvoir les modéliser, en évaluer les
impacts, et se couvrir contres les risques identifiés.
Ces différents risques sont nombreux, et dans le contexte actuel de baisse des rendements des
contrats d’assurance vie, il est important de pouvoir anticiper les comportements des assurés.
De plus, dans une entreprise qui distribue ses contrats en utilisant un réseau « debout », c'est-
à-dire des commerciaux qui se déplacent chez le client pour vendre leurs contrats, il est
nécessaire de prendre en compte la durée des contrats pour ajuster la rémunération du réseau.
Cette rémunération ne doit pas détériorer la rentabilité du produit tout en incitant les
conseillers à vendre le produit.
Prévoir fait partie des entreprises utilisant un réseau « debout », et pratique l’escompte de
commission.
Pour piloter l’activité d’assurance, pour fixer les rémunérations, lors de la création des
produits, la connaissance des lois de comportement est indispensable.
L’étude des comportements des assurés, dans un secteur concurrentiel et en perpétuelle
évolution, prend toute son importance au vu des éléments énumérés précédemment.
Une analyse plus fine du risque de rachat s’inscrit dans ce contexte, En effet, le
rachat est un des risques majeurs auquel est soumise une compagnie d’assurance-vie.
L’objet de ce mémoire est d’améliorer la connaissance de ce risque.
Ce mémoire s’articule autour de la recherche des causes de rachat et de
résiliation : quels facteurs peuvent influencer le comportement de l’assuré, et de quelle
manière ?
L’étude de deux différents types de contrat, d’épargne à versement libres et de prévoyance
(vie entière) permet aussi d’analyser les différentes causes de rachat, liées ou non au type de
contrat.
Il existe différents types de sorties anticipées. Dans notre étude, les contrats
peuvent être rachetés, c'est-à-dire que lorsque l’assuré décide de mettre fin à son contrat, il
reçoit une somme d’argent : la provision mathématique du contrat. Cette provision correspond
au montant des engagements de l’assureur à l’égard de l’assuré. Le rachat est prévu par le
code des assurances. Pour les contrats d’épargne, l’assuré peut choisir de retirer seulement
8
une partie de sa provision, ce qui ne met pas fin au contrat, dans ce cas, on parle de rachat
partiel.
Dans les années 80, grâce à un environnement fiscal favorable, les contrats
d’épargne ont connu un très fort développement, le risque de rachat est devenu un risque
majeur pour les sociétés d’assurance. Plusieurs travaux portent sur ce risque. Kuo et al. [13]
ont identifié trois dangers pour l’assureur qui découlent de ce phénomène. Le premier est que
les frais d’acquisition d’un contrat sont amortis durant les premières années ; si le contrat sort
prématurément du portefeuille, l’assureur n’amortira pas ces coûts. Ensuite, les « mauvais
risques », c'est-à-dire les assurés qui sont en mauvaise santé pour des contrats vie entière, sont
moins enclins à racheter leur contrat, ce qui peut impacter la sinistralité du portefeuille pour
les contrats vie entière. Enfin, l’assureur peut rencontrer un risque de liquidité lorsqu’il est
contraint de revendre ses actifs pour payer les sommes dues aux assurés. Ces trois risques
peuvent mettre l’assureur en péril s’ils ne sont pas bien connus, il est donc de son intérêt de
pouvoir anticiper au plus juste ces comportements.
La problématique de ce mémoire est la suivante : Quelles variables explicatives
peuvent améliorer notre connaissance des sorties prématurées ? Comment utiliser au mieux
les données disponibles pour avoir la vision du futur la plus juste possible ?
Le mémoire est organisé en quatre parties. Dans une première partie, un bref
panorama de l’assurance-vie en France et du contexte actuel sera réalisé. Cette première partie
sera complétée par une description des produits analysés.
Ensuite, une description des principales méthodes statistiques utilisées dans les différentes
parties sera faite. La principale technique utilisée étant la régression logistique.
Dans la troisième partie, on s’intéressera à la recherche des causes de rachat ou de résiliation
pour des contrats vie entière. Enfin, dans la dernière partie, nous nous intéresserons aux
phénomènes de rachat sur des contrats d’épargne.
9
Partie 1 Sorties anticipées et importance de la modélisation
des lois de comportement
1) Cadre de l’étude
Le marché de l’assurance-vie en France est très développé : en effet, selon la FFSA
(Fédération Française des Sociétés d’Assurance), l’assurance-vie représentait 69 % des
placements financiers des ménages en 2010, soit 112.8 milliards d’euros. Plusieurs types de
contrats existent, adaptés à chaque type d’assuré.
Dans cette étude nous analysons des contrats versant un capital en cas de décès de l’assuré,
quel que soit l’âge atteint par ce dernier (contrats vie-entière), ainsi que des contrats d’épargne
à versements libres.
Une des caractéristiques des contrats relatifs à l’assurance de personnes et aux opérations de
capitalisation est que le Code des Assurances prévoit une valeur de rachat à tout moment.
L’article L. 132-21 du Code des Assurances permet d'interrompre son contrat avant le terme
initialement prévu et d'obtenir de l'assureur le versement de la provision mathématique
constituée à la date dudit rachat. Le Code des Assurances prévoit aussi la possibilité
d’appliquer dans certains cas des pénalités en cas de rachat avant l’échéance.
Pour les contrats vie entière, la sortie anticipée du contrat peut se faire par un rachat, dans ce
cas, l’assuré interrompt son contrat et touche le montant de la provision mathématique alors
constituée. Ce type de contrat peut aussi être réduit : lorsque l’assuré cesse de payer ses
primes, ses garanties sont diminuées, et le montant du capital versé au bénéficiaire désigné en
cas de décès est moindre que le capital initialement prévu. Contrairement au rachat, la
réduction n’entraine pas une sortie du portefeuille du contrat.
Pour les contrats d’épargne, l’assuré peut choisir de racheter son contrat, dans ce cas, il
récupère la provision mathématique de son contrat, qui représente la somme que l’assureur
doit mettre en réserve pour faire face aux engagements futurs pris à l’égard de l’assuré. Cette
provision est égale aux sommes versées par l’assuré nettes de frais, et des intérêts acquis à la
date donnée. Le rachat peut être total ou partiel : si le rachat est total, l’assuré récupère la
totalité de sa provision mathématique et met ainsi un terme au contrat. Si l’assuré choisit de
10
racheter partiellement son contrat, il ne récupère qu’une partie de sa provision mathématique,
et son contrat reste en portefeuille.
Ce phénomène de sortie anticipée dépend en grande partie des motivations initiales de
l’assuré. Pour les contrats d’épargne, si l’assuré cherche à faire fructifier un capital déjà
constitué, il sera plus sensible aux évolutions de la rentabilité du contrat, et pourrait par
exemple racheter son contrat et placer l’argent ainsi obtenu sur les marchés (ou sur un autre
contrat, ou encore sur un autre support) si les conditions y sont plus avantageuses. Ce type de
contrat a fait l’objet de nombreuses études, Kaltwasser et P. Le Moine [9], X. Milhaud, M.P.
Gonon et S. Loisel [14] par exemple, qui démontrent l’influence importante des paramètres
conjoncturels. Si l’assuré a pour motivation de transmettre un patrimoine, sa sensibilité au
marché financier sera bien moindre, et un rachat de cet assuré aurait plus de chances d’avoir
pour origine un besoin immédiat de liquidité, qui pourrait par exemple être dû à un accident,
une perte de revenu, ou à d’autres raisons qui lui sont propres.
Les causes de rachat peuvent donc être multiples, désirs personnels de l’assuré, que l’on peut
analyser en étudiant ses caractéristiques personnelles, mais aussi les caractéristiques du
contrat, comme l’ancienneté, le capital qui doit être versé en cas de décès, ou encore le
contexte économique et financier.
On peut aussi se poser la question des différences qui peuvent exister entre les motivations
des rachats des contrats d’épargne, et celles des contrats vie entière.
Il est important pour l’assureur de savoir modéliser au mieux ces taux de rachat : en effet,
généralement, l’assureur supporte des frais d’acquisition durant les premières années de la vie
du contrat, alors qu’il amortit ses coûts sur la durée du contrat ; une sortie prématurée peut
donc être néfaste à sa rentabilité. Aussi, un rachat massif des contrats peut aussi mettre
l’assureur dans une situation difficile, s’il n’est pas prévu, l’assureur devra alors vendre ses
actifs prématurément pour pouvoir rembourser ses assurés, il supportera donc un risque de
liquidité. Enfin, l’assureur est soumis à un risque de sélection adverse, si les personnes en
bonne santé ont plus tendance à racheter leur contrat, l’assureur se retrouvera avec des
« mauvais » risques au sein de son portefeuille. Une bonne connaissance des causes des
sorties anticipées pourrait donc permettre à l’assureur de construire des produits permettant de
mieux contrôler les rachats, par des pénalités de rachat, ou des conditions qui peuvent inciter
l’assuré à conserver son contrat. De par cette connaissance accrue de son portefeuille,
l’assureur pourra alors se protéger contre ce risque.
11
On considère que deux types de rachat sont observés, les rachats structurels et les rachats
conjoncturels, les rachats structurels étant ceux observés dans un contexte économique
normal, généralement ce sont ceux qui surviennent pour des raisons propres à l’assuré,
comme un besoin de liquidité pouvant trouver sa cause dans une maladie, la perte d’emploi,
ou d’autres raisons.
Au contraire les rachats conjoncturels dépendent de facteurs exogènes, à l’instar des taux des
marchés : pour ces types de rachat, l’assuré retire son argent dans le but de le réinvestir
ailleurs, à de meilleures conditions. Ce type de rachat à fait l’objet de plusieurs études. On
peut retrouver par exemple dans Kaltwasser et P. Le Moine [9] une étude du rachat comme
une différence de flux entre l’engagement de l’assureur vis-à-vis de l’assuré et l’actif auquel il
est adossé. Aussi, dans l’article de X. Milhaud, M.P. Gonon et S. Loisel [14], on retrouve une
étude de l’impact de crises de corrélation entre les assurés, induites par un contexte
économique difficile.
Actuellement, les études d’impact faites par le Comité européen des contrôleurs de
l'assurance et des pensions professionnelles (EIOPA, ex CEIOPS), présentées dans la partie
suivante, conseillent de modéliser ces taux en fonction de l’écart entre les taux servis par
l’assureur et les taux moyens des emprunts d’états (TME). Lorsque le TME est supérieur au
taux servi, le rachat conjoncturel est très élevé, puis il diminue au fur et à mesure que l’écart
entre le TME et le taux servi se réduit.
Pour connaitre ce phénomène, les lois de comportement sont calculées chaque année afin
d’appréhender au mieux les sorties du portefeuille dans le futur. Ces lois sont des lois
d’expérience, calculées à l’aide des observations sur les années précédentes, dans le but de
simuler les résultats des années à venir.
Ces lois d’expérience sont actuellement utilisées pour le calcul d’Embedded Value (E.V.)
(mais aussi du taux de rendement interne (T.R.I), de la PGG provision globale de gestion).
Dans les années à venir, les provisions devront être calculées en best estimate, ce qui amènera
à utiliser ces lois de comportement pour le calcul des risques aucquel est soumise la
compagnes d’assurance.
Le « best estimate » est défini par les deux extraits suivants :
12
« La meilleure estimation est égale à la moyenne pondérée par leur probabilité des flux de
trésorerie futurs, compte tenu de la valeur temporelle de l’argent (valeur actuelle probable des
flux de trésorerie futurs), déterminée à partir de la courbe des taux sans risque pertinente. »
« Le calcul de la meilleure estimation est fondé sur des informations actuelles crédibles et des
hypothèses réalistes et il fait appel à des méthodes actuarielles et des techniques statistiques
adéquates. »
Ce phénomène de rachat est un élément important à prendre en compte dans la gestion des
compagnies d’assurance. Dans la structure actuelle de la formule standard, le rachat est l’un
des sept risques à prendre en compte dans le calcul du capital requis pour assurer la
solvabilité, pour la branche vie.
2) Situation future
a) QIS5, Solvabilité 2
Le 1er janvier 2013 de nouvelles réglementations s’appliqueront au monde de
l’assurance. Le but de cette réforme est d’encourager les assureurs et réassureurs à mettre en
place une gestion globale des risques inhérents à leurs activités, afin de mieux les
comprendre.
Cette réforme sera organisée en trois « piliers ».
Le premier pilier est lié à l’exigence quantitative de fonds propres. Il définit des niveaux
minimum de fonds propres que l’assureur doit détenir pour couvrir ses risques. On parle alors
de « Solvency Capital Requirement » (SCR).
Le second pilier définit le suivi des risques et les modalités d’intervention de l’autorité de
contrôle. Enfin, le troisième et dernier pilier concerne la communication, il définit un
ensemble de documents à présenter à l’autorité de contrôle.
Dans ce cadre, des études ont été réalisées pour évaluer l’impact de ces réformes.
A la suite de ces réformes, les calculs de provisions devront être réalisés de la même façon
que les calculs d’Embedded Value, c'est-à-dire en best estimate . L’expérience du portefeuille
devra être prise en compte. On retrouve dans le QIS5 (« Quantitative Impact Studies 5 »), une
étude d’impact faite par le CEIOPS la remarque suivante :
13
« Pour la modélisation des rachats structurels, les participants doivent utiliser des lois
d’expérience si celles-ci sont conformes aux observations passées, ou à défaut des données de
marché. »
Les assureurs devront ainsi utiliser leurs lois d’expérience pour la modélisation des rachats
structurels. Il est aussi spécifié que le choix des paramètres pris en compte dans la
modélisation est laissé libre à l’assureur, qui devra néanmoins pouvoir justifier ses choix.
b) Fiabilisation de la modélisation Dans ce contexte, et comme spécifié dans le pilier 3 les données et hypothèses sur
lesquelles sont basées les calculs devront être spécifiées, ce qui s’inscrit dans l’objectif d’une
meilleure compréhension des risques.
Jusqu’ici au sein du groupe Prévoir, l’étude sur les lois de comportement est actualisée
chaque année, en suivant la méthode décrite ci après. Dans cette étude, les lois de
comportement concernent les rachats, les résiliations, les stabilisations, les remplacements, les
sans effet/renonciations, les réductions, les versements supplémentaires et les rachats partiels.
La période d‘observation que nous utilisons dans le calcul de ces lois est l’année civile. Cela
convient à l’utilisation qui en est faite dans les logiciels de modélisation.
Les données utilisées sont issues des bases de gestion de l’entreprise et concernent les trois
dernières années civiles. Cette longueur de l’intervalle d’observation de 3 ans a été choisie
comme compromis pour lisser d’éventuelles périodes atypiques. En effet, utiliser une seule
année d’observation peut induire une plus forte variabilité des lois d’une année sur l’autre,
cela peut être préjudiciable à l’objectif visé dans la plupart des modèles utilisant ces lois en
input (TRI, EV…). L’utilisation des 3 dernières années permet aussi de dégager assez rapide
les tendances (les rachats observés il y a 10 ans dans un contexte radicalement différent ne
sont pas forcément de bons estimateurs du futur).
En utilisant les données disponibles sur cette période de 3 ans, on peut alors calculer un taux
de chute de la forme suivante :
14
Nous cherchons donc à déterminer la probabilité qu’un contrat de caractéristiques C1, C2,
…Cn chute totalement.
De nombreux facteurs peuvent expliquer les chutes. mais en pratique, seuls deux critères sont
utilisés : l’ancienneté du contrat et l’âge de l’assuré lors de la souscription du contrat,
Le choix de ces facteurs est un choix historique, qui provient d’observation, mais n’a jamais
été validé empiriquement, ce qui est un des objectifs de ce mémoire.
Les calculs ci-dessous sont effectués sur chaque sous ensemble d’âge.
La probabilité à estimer est la suivante : Probabilité [Contrat d’ancienneté K-1 chute
totalement en K].
Cette probabilité est notée Chute[K], on a alors :
Par exemple, pour estimer la loi de rachat, les observations des données historiques sur une
période donnée sont utilisées.
Les notations suivantes sont utilisées :
Si l’on observe les contrats sur une période de temps de longueur T années et que l’on
souhaite que chaque année rentre dans le calcul pour une part égale à 1t , on utilise
l’estimateur de la loi empirique de rachat suivant :
15
Avec
et
Dans les traitements, la pondération de chaque année est proportionnelle à l’effectif exposé de
l’année sur l’effectif total de l’ensemble des années prises en compte, soit :
T=3
Il vient donc :
Ces calculs sont réalisés pour chaque tranche d’âge à la souscription de l’assuré, d’où la
nécessité d’avoir un effectif suffisant pour obtenir des résultats statistiquement significatifs.
Lorsque le produit étudié ne dispose pas de l’ancienneté suffisante pour que toute la loi soit
déterminée à l’aide de son historique propre, l’expérience acquise sur un produit similaire du
portefeuille est utilisée.
Enfin, pour tenir compte des spécificités propres aux retraits partiels sur le produit en primes
uniques, des lois en montants sont calculées pour ce produit.
L’objet de ce mémoire est d’étudier les comportements de rachat, et pouvoir ainsi valider ou
infirmer les choix de modélisation faits par le passé. Ces travaux ont aussi pour objectif de
proposer un modèle plus pertinent à mettre en place lors de la création des lois de
comportements.
Une fois ces lois calculées et validées, elles sont utilisées dans le logiciel de modélisation afin
de déterminer les flux futurs (primes, prestations…) pour des calculs d’embedded value, de
provision globale de gestion, ou tout autre calcul nécessitant une modélisation.
16
3) Portefeuilles de données étudiés et méthodes
a) Objectifs du mémoire
Les travaux déjà effectués sur les phénomènes de rachat portent généralement sur des
contrats d’épargne. Plusieurs approches différentes de ce phénomène ont été adoptées.
Tout d’abord l’approche financière : le rachat y est vu comme une opportunité d’arbitrage et
on considère qu’il survient lorsqu’il est plus intéressant pour l’assuré de racheter son contrat
car il peut trouver de meilleures conditions sur le marché. Cette approche permet de valoriser
l’option de rachat dans les contrats d’épargne.
Une seconde approche, collective, consiste à utiliser les données de portefeuille de l’assuré
pour calibrer une fonction de rachat, qui permet d’estimer les rachats futurs.
On retrouve dans le mémoire « Analyse des rachats d’un portefeuille vie individuelle,
approche théorique et application pratique », de Fauvel S. et Le Pévédic M. [6], une approche
plus économique, qui utilise la théorie de l’utilité espérée. Ce mémoire analyse le rachat
comme besoin immédiat de liquidité et compare les avantages et inconvénients du rachat et
d’un emprunt, du point de vue de l’assuré.
Enfin une dernière approche plus probabiliste utilise les modèles linéaires généralisés et
d’autres techniques pour segmenter le portefeuille en classes de risque. Les techniques
utilisées sont décrites dans l’article « Surrender triggers in life insurance : classification and
risk predictions » de Milhaud, Loisel et Maume-Deschamps [15]. Cette étude analyse plus
spécifiquement les rachats structurels, de même que l’article « Modeling insurance surrenders
by the négative binomial model » [10], qui à l’aide d’une méthode spécifique détermine des
facteurs de risque en segmentant le portefeuille.
Le but du travail était de mener une étude permettant de mieux connaitre les facteurs
influençant le risque de sortie anticipée. Nous allons utiliser des techniques permettant de
segmenter le portefeuille pour faire ressortir des facteurs de risque.
b) Types de contrats analysés
i. Contrats vie entière
Le premier portefeuille étudié se compose de contrats versant un capital en cas de
décès de l’assuré, ce sont des contrats vie entière, qui ont une valeur de rachat, comme prévu
par le Code des Assurances. Un montant que le bénéficiaire recevra en cas de décès est défini
17
à la souscription de ce contrat, nommé Prévoir Quiétude (que l’on notera PQ par la suite), et
en fonction de ce montant, l’assuré paie en contrepartie des primes, essentiellement
mensuelles dans notre portefeuille.
Nous étudions un évènement : le rachat, qui correspond au versement à l’assuré du montant
de la provision mathématique de son contrat. La réduction, qui correspond à une diminution
du capital que le bénéficiaire reçoit en cas de décès lorsque l’assuré ne paye plus ses primes
n’est pas étudiée. On considère que les causes de la réduction ne sont pas les mêmes que
celles d’un rachat, qui à une contrepartie immédiate.
De par sa finalité, ce type de contrat est moins soumis à la conjoncture que les contrats
d’épargne, ainsi les facteurs pouvant expliquer les rachats ne sont pas nécessairement les
mêmes.
Aussi, il est nécessaire de bien décrire le réseau de distribution de ces contrats : il constitue
une des particularités des sociétés distribuant leur contrats à l’aide d’un réseau debout, telles
que la société Prévoir. Contrairement à beaucoup d’autres assureurs ou bancassureurs de
grande taille, Prévoir ne dispose pas de guichets et vend ses contrats via un réseau de
distribution debout, c'est-à-dire que les conseillers se déplacent directement chez le client ce
réseau est divisé en régions commerciales, elles-mêmes scindées en inspections, dirigées par
des inspecteurs, dont dépendent plusieurs employés qui assurent la distribution des contrats.
Ces commerciaux vendent les contrats directement chez le client. Leur rémunération dépend
majoritairement de leur performance, c’est-à-dire le nombre, le type de contrats vendus et les
nouvelles primes encaissées. La commission reçue par le conseiller commercial est séparée en
deux parties : une commission d’acquisition et une commission de qualité.
Une commission est calculée en fonction des primes encaissées, et du type de produit vendu.
la commission d’acquisition représente 55 % de cette commission, les 45 % restants
représentent la commission de qualité.
La commission d’acquisition est versée à l’émission du contrat, mais, en cas de chute du
contrat avant le 12ème mois, cette reprise est faite en totalité durant les trois premiers mois et
au prorata-temporis du 4ème au 12ème mois.
La commission de qualité est versée mensuellement du 13ième mois au 36ième mois tant que le
contrat est en cours. Il n’y a pas de reprise de cette commission en cas de chute du contrat,
mais elle n’est alors plus versée.
18
Il est important de bien comprendre les spécificités du réseau de distribution, qui peuvent,
dans certains cas, avoir une influence sur les différents évènements observés durant la vie du
contrat.
ii. Contrats d’épargne
Un second portefeuille de contrats d’épargne est aussi analysé. Ce portefeuille contient
deux contrats d’épargne : Prévilibre et PrévoirEpargne. Ce sont des contrats d’épargne à
versement libres. L’assuré effectue un versement initial, un taux minimal est garanti par
l’assureur ; tous les versements, ainsi que les intérêts générés constituent un capital. En cas de
vie, l’assuré récupère ce capital lorsqu’il décide de mettre un terme à son contrat. En cas de
décès, la provision mathématique est transmise au bénéficiaire désigné.
A tout moment, l’assuré peut choisir de racheter son contrat, c'est-à-dire de retirer la provision
mathématique disponible, soit en totalité, soit partiellement. C’est ce phénomène qui à été
étudié dans le mémoire.
Pour mieux appréhender ce phénomène, il faut prendre en compte la taxation des plus-values,
qui intervient lors de chaque rachat de contrat. Pour chaque rachat, le montant de la somme
prélevé dépend de l’assiette et du taux de prélèvement.
En cas de rachat total, l’assiette taxable correspond à la différence entre les fonds rachetés et
le montant des versements, si le rachat est partiel, l’assiette de l’impôt est calculée comme :
Avec RP le montant du rachat partiel, V le montant total des versements, E le montant de
l’épargne acquise au moment du rachat partiel, et PI le produit imposable.
A cette assiette on applique ensuite un taux, qui dépend du mode d’imposition choisi par
l’assuré : intégration de la plus-value à son impôt sur le revenu ou paiement d’ un
prélèvement libératoire lors de son retrait.
Si l’assuré choisit la première solution, le taux qui s’applique est alors son taux marginal
d’imposition, qui dépend de son revenu, ou celui de son foyer, mais aussi du nombre de parts
du foyer. Actuellement, le taux marginal d’imposition est de 0 % si le foyer un revenu par
part inférieur à 5963 €, 5,5 % si le revenu par part est inférieur à 11896 €, 14 % jusqu'à 26420
19
€, 30 % jusqu'à 70830 € et 41 % ensuite.si l’assuré choisit cette solution, la somme due sera
payée au moment de son imposition et non lors du rachat.
Si l’assuré choisit le prélèvement libératoire, la plus-value est imposée à un taux dépendant
uniquement de l’ancienneté, 35 % lorsque l’ancienneté du contrat est inférieure a 4 ans, 15 %
lorsque le contrat à entre 4 et 8 ans et 7,5 % ensuite.
Dans les deux méthodes, au bout de 8 ans, l’assuré dispose d’un abattement de 4600 € pour
une personne seule et 9200 € pour un couple, pour l’ensemble de ses contrats.
Un assuré avec des revenus élevés aura donc intérêt à choisir le prélèvement libératoire, et
inversement.
Comme les contrats précédents, ces contrats d’épargne sont distribués par le même réseau, les
conditions de commissionnement diffèrent, en effet, la commission est versée en une fois, et
dépend du versement initial de l’assuré.
c) Statistiques sur les portefeuille
i. Portefeuille vie entière
Ce portefeuille est composé de produits vie entière : la garantie principale prévoit le
versement un capital en cas de décès de l'assuré quel que soit son âge de décès. Ce type de
contrat est l'un des plus vendu chez Prévoir, qui est actuellement 25ème sur le marché de la
prévoyance.
Au 31/12/2012, Prévoir a plus de 150 000 contrats de ce type encore en gestion, pour un
montant total de provision mathématique d’environ 250 millions d'euros. Quelques
statistiques permettent de caractériser plus précisément ce portefeuille qui sera étudié dans les
parties suivantes.
Tout d'abord, ce contrat est ouvert à la souscription de 50 à 80 ans. L'âge moyen de
souscription est de 62,66 ans, avec un écart type de 7,08 ans. Les pics de souscription aux
âges 60 ans et 65 ans que l'on peut observer ci dessous (Fig 1.1) ont pour cause la visite du
conseiller commercial programmée lors de l'échéance des contrats retraite.
20
Fig. 1.1 : Répartition des âges à la souscription
On remarque aussi que les souscriptions après 75 ans sont peu fréquentes, cela est du au fait
que ce portefeuille regroupe 3 générations de contrats, et l'assuré peut souscrire après 75 ans
seulement sur les deux dernières générations de contrats,. Les principales différences sur ces
trois générations de contrats sont détaillées dans le tableau 1.1 ci-dessous :
1ière génération 2ème génération 3ième génération
Date de vente Décembre 1990 ‐
Janvier 2006
Février 2006 –
Novembre 2007
Décembre 2007 –
Décembre 2009
Ages de souscription 50 ‐ 75 ans 50 – 80 ans 50 – 80 ans
Période de carence 2 ans 2 ans 2 ans
Capital minimum 2 400 € 3 000 € 3 000 €
Tab 1-1
Lors de la souscription, l'assuré doit aussi choisir le capital qui sera versé au bénéficiaire du
contrat en cas de décès de l’assuré. Ce capital est limité à 32 000 €. Aussi, afin de simplifier la
gestion de ce contrat, il n’est pas permis d’augmenter ce capital au cours de la vie du contrat,
mais un assuré peut souscrire jusqu'à 3 contrats. Cette solution permet aussi d’éviter en partie
l’anti-sélection, ce contrat n’a pas de sélection médicale.
0%
1%
2%
3%
4%
5%
6%
7%
8%
9%
10%
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
50 55 60 65 70 75 80
âge de souscription
Répartition des âges à la souscription
Fréquences Fréquence cumulées
21
En observant le portefeuille, on remarque que la plupart des capitaux souscrits sont
relativement faibles. Le capital par contrat moyen est de 5,2 k €, et les montants sont assez
regroupés : l'écart type est seulement de 3,24 k€, et le 3ième quantile est situé à 6 k€. On peut
voir l’illustration de cette répartition des capitaux sur le graphique ci-dessous représentant la
fonction de répartition des capitaux souscrits.
Fig. 1.2 : Répartition des capitaux souscrits
De plus, l'assuré pouvant souscrire plusieurs contrats, le capital assuré par tête est légèrement
plus élevé : alors que 94% des contrats ont un capital inférieur à 10 k€, seulement 74% des
assurés ont un capital total à 10 k€.
Ces observations correspondent à la clientèle de groupe Prévoir, qui historiquement, est plutôt
à faibles revenus.
Enfin, l'ancienneté moyenne du portefeuille étudié est de 6,25 ans, avec un écart type de 4,23
ans.
0%
5%
10%
15%
20%
25%
30%
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
1 6 11 16 21 26 31
Capital initial (k€)
Répartition des capitaux souscrits
Fréquence Fréquence cumulé
22
Fig. 1.3: Ancienneté du portefeuille vie entière
On voit sur la figure ci-dessus (Figure 1.3) la fréquence des anciennetés du portefeuille de
contrat vie entière
iii. Portefeuille épargne en primes uniques
Le deuxième portefeuille étudié est constitué de contrats d'épargne en primes uniques.
Ce sont des contrats en euros, l'assuré dépose un montant qui est capitalisé à un taux
minimum défini lors de la souscription du contrat, augmenté de la participation aux bénéfices.
La souscription de ces contrats est ouverte jusqu'à 80 ans, mais la moyenne d'âge des assurés
est assez élevée : 53,9 ans. On peut toujours observer sur la figure ci dessous les pics à 60 et
65 ans, et dans une moindre mesure des pics à 50 et 55 ans. Ces pics de souscriptions
représentent des versements issus des contrats retraite.
0%
1%
2%
3%
4%
5%
6%
7%
8%
9%
0 2 4 6 8 10 12 14
Fréq
uence
Ancienneté (années)
Ancienneté du portefeuille vie entière
23
Fig. 1.4 : Ages de souscription portefeuille épargne
L’écart type de l'âge est de 17,1. On a des âges bien plus variés que sur le portefeuille
précédent, la cible de ce type de contrat est en effet bien plus large.
Par ailleurs, sur ce portefeuille on retrouve 45% de femmes, et 55% d’hommes.Le montant du
compte épargne moyen sur ces contrats est de 10,4 k€ pour un écart type de 29 k€, le montant
des comptes épargne est assez faible pour la plupart des contrats, avec 75% des contrats ayant
moins de 11,7 k€ sur leur compte épargne, et une médiane à 4,7 k€. Les montants des
comptes épargne sont donc regroupés et sont relativement bas, mais la moyenne est tirée vers
le haut par un petit nombre de contrats avec des provisions assez élevés.
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,1
18 23 28 33 38 43 48 53 58 63 68 73 78
Age de souscription
Ages à la souscription
fréquence Fréquence cumulée
24
F ig. 1.5 : montants des comptes épargne
Ces contrats ont souvent une fonction d’épargne de précaution pour une partie des assurés.
Pour pouvoir faire face à des dépenses imprévues, sans toucher à l'épargne placée à long
terme et sans mettre en danger l'avenir financier du foyer, il importe d'avoir des capitaux à
disposition immédiate.
Après avoir présenté les enjeux principaux de ce sujet, et détaillé l’objectif de cette étude, les
méthodes utilisées vont être décrites dans la partie suivante.
0%
10%
20%
30%
40%
50%
60%
70%
80%
Montant du compte épargne (en €)
Montant des comptes épargnes
fréquence % cumulé de l'épargne
25
Partie 2 Méthodologie
Dans cette partie, nous allons expliquer en détail la mise en place d’une méthode qui
pourra permettre d’analyser les phénomènes étudiés, c'est-à-dire les sorties anticipées et les
rachats partiels survenant dans les différents portefeuilles.
Pour cela, le principal outil utilisé est issu des modèles linéaires généralisés, qui sont une
généralisation du modèle de régression. Ils ont été décrits par John Nelder et Robert
Wedderburn en 1972.
Ces modèles permettent d’étudier le lien entre une variable, dite variable à expliquer, et un
ensemble de variables, pouvant aussi bien être qualitatives que quantitatives, appelées
variables explicatives.
La variable à expliquer doit suivre une loi appartenant à la famille exponentielle, qui contient
un grand nombre de loi usuelles telles que la loi binomiale, la loi normale, la loi exponentielle
ainsi que d’autres lois. Cette variable est reliée aux variables explicatives à travers une
fonction de lien. Cette fonction fait donc dépendre la variable à expliquer de la combinaison
linéaire des variables explicatives. Une des caractéristiques de cette fonction est qu’elle doit
être strictement monotone, donc inversible.
Le modèle de régression logistique est un modèle qui semble bien correspondre à notre
situation : la variable dépendante, ou variable à expliquer peut être exprimée sous forme
binaire ; dans la situation étudiée : présence ou absence de rachat au cours de l’année. Ce
modèle de régression logistique permet de déterminer les variables importantes pour
expliquer la présence ou l’absence de rachat.
1) Le modèle de régression logistique
a) Présentation
Le modèle de régression permet d’exprimer sous forme de probabilité la relation entre
une variable dichotomique, dite variable dépendante ou expliquée, et des variables
explicatives, quantitatives ou qualitatives. Dans notre cas, on cherchera à exprimer la
26
probabilité que l’individu rachète son contrat au cours de l’année en connaissant les
caractéristiques de cet individu.
L’utilisation de ce modèle est largement répandue en médecine par exemple, pour isoler
les facteurs qui séparent les individus sains des individus malades, il est aussi utilisé dans le
monde bancaire pour, par exemple, détecter les populations à risque lors de la souscription de
crédits.
Un tel modèle permet d’analyser plus précisément l’impact de chaque variable explicative
retenue, et de pouvoir quantifier cette relation.
Une lecture rapide des résultats peut se faire grâce aux rapports des chances, qui permettent
de quantifier l’impact du changement d’une variable explicative sur la probabilité de rachat.
Un exemple d’application peut se trouver dans Scoring et anticipation de défaillance
des entreprises : une approche par la régression logistique [4]. Dans cet article les auteurs
classent les entreprises en fonction de leur risque de défaillance, à l’aide du modèle de
régression logistique et selon un certain nombre de critères. Les résultats obtenus à l’aide de
cette méthode permettent de détecter 87% des entreprises défaillantes.
b) Formalisation mathématique La régression logistique nous permet donc d’exprimer la probabilité que l’évènement
se réalise en fonction des variables explicatives, à l’aide de la fonction Logit. Cette fonction
est la suivante :
Cette fonction est la fonction qui est à la base de la régression logistique. Lorsque p varie dans
]0;1[, la fonction Logit prend ses valeurs dans l’intervalle ]-∞;+∞[ tout entier.
27
Fig. 2-1. Représentation de la fonction logit
La formulation mathématique de la régression logistique est la suivante :
(1)
représente les variables explicatives, qui peuvent être qualitatives ou
quantitatives, et qui doivent permettre de caractériser le phénomène étudié.
Y est la variable à expliquer qualitative valant 1 si un rachat est observé sur le contrat au
cours de l’année et 0 sinon. On note alors p(1|X) la distribution conditionnelle de X sachant la
valeur prise par Y, ce qui nous donne la relation suivante :
Avec X représentant les variables explicatives et les étant les coefficients de la régression à
estimer. Les coefficients permettent donc de mesurer l’influence de chaque variable et ainsi
de déterminer les plus discriminantes.
28
Les rapports de chances
Les rapports des chances permettent de mesurer l’intensité de la relation entre des variables
aléatoires qualitatives.
Il permet de comparer la probabilité de survenance d’un évènement dans deux populations
différentes.
Si la probabilité qu'un événement arrive dans le groupe A est p, et q dans le groupe B, le
rapport des chances est :
Dans le cas de la régression logistique, en modifiant la valeur d’une variable qualitative, on
peut voir l’influence de cette dernière.
Si on veut mesurer l’influence de la variable numéro j, on calcule ce rapport de chances entre
une population présentant la modalité et une autre présentant la modalité . La probabilité
de survenance de l’évènement dans la population présentant la modalité est la suivante :
p= d’où
De même
q= d’où
Donc le rapport des chances vaut :
c) Estimation Les coefficients du modèle Logit ne peuvent être estimés directement à l’aide de la
technique du maximum de vraisemblance utilisé habituellement. En effet, le système
d’équations à résoudre pour maximiser la log-vraisemblance du modèle, que l’on notera l,
s’écrit comme :
29
Avec la fonction définie par :
C’est un système de p+1 variables explicatives, non fermé.
Pour pallier à cet inconvénient, on utilise l’algorithme de Newton-Raphson qui est la méthode
implémentée sous R, logiciel qui a été utilisé pour mener les études.
Pour utiliser cette méthode, nous avons besoin de la dérivée seconde de cette log-
vraisemblance en fonction des coefficients β. Cet algorithme utilise la relation suivante :
On fixe un β= ( au départ, et l’algorithme s’arrête lorsque la différence entre
est suffisamment faible.
d) Validation du modèle Une fois les coefficients estimés en utilisant l’algorithme de Newton-Raphson présenté
dans la partie précédente, des tests sont faits pour valider le modèle. Pour chaque coefficient
du modèle on teste sa significativité grâce au test de Wald.
L’hypothèse nulle de ce test est la suivante : « le coefficient est nul »
Sous cette hypothèse, la quantité suit une loi normale centrée réduite, ce qui nous
permet d’accepter ou de rejeter l’hypothèse nulle. Si une variable n’est pas considérée comme
significative, elle est alors retirée du modèle.
Le choix du nombre de paramètres du modèle se fait ensuite avec le critère d’information
d’Akoike (AIC). Il est calculé comme :
30
k étant le nombre de paramètres du modèle et L la vraisemblance de ce modèle. Ce critère est
un compromis entre le biais (qui diminue avec le nombre de paramètres) et la parcimonie
(nécessité de décrire les données avec le plus petit nombre de paramètres possible). Il nous
permet de choisir le nombre de paramètres du modèle, on compare l’AIC entre modèles
emboités et on choisit celui qui minimise cette quantité.
Un autre test plus général, qui sera aussi utilisé pour valider le modèle, le test de Hosmer
et Lemeshow qui évalue statistiquement la qualité de prévision du modèle. Ce test est décrit
dans la suite du document.
2 les modèles Logit multinomial et Logit emboité
Comme pour le modèle de régression logistique simple, les modèles de Logit multinomial
et de Logit emboité peuvent être utilisés comme outils d’analyse discriminante dans le but de
mettre en évidence les traits distinctifs d’une catégorie de personnes. Ces deux modèles sont
des prolongements du modèle de régression logistique simple décrit précédemment.
a) Logit multinomial
i. Présentation
Ce type de modèle à été introduit par McFadden en 1968, il permet d’étudier les
situations où l’individu doit faire un choix parmi plusieurs modalités.
Ce modèle est utilisé comme outil d’analyse discriminante dans le but de mettre en
évidence les traits distinctifs de chaque catégorie.
ii. Formalisation mathématique
Soient n individus distincts, répartis en J catégories, décrits par un ensemble de K
caractéristiques. On note alors la probabilité que l’individu i fasse le choix j, étant
donné ses caractéristiques. ( On a alors :
31
Les conditions sur la fonction G doivent permettre de modéliser une probabilité, pour cela, on
prend :
De cette manière, la quantité est bien toujours comprise entre 0 et 1 d’une part, et de
plus, de cette façon, on a bien la somme des probabilités égale à 1.
Il faut aussi imposer une restriction pouvant permettre l’identification des paramètres β. Pour
cela, la règle retenue est d’imposer la nullité de tous les paramètres relatifs à une catégorie de
référence. Si on fixe la catégorie de référence comme la catégorie J, on a alors tous les
sont nuls. Le modèle s’écrit donc :
Lorsque J le nombre d’alternative vaut 2, on retrouve le modèle de régression logistique
simple.
iii. Estimation
L’estimation des coefficients de ce modèle peut se faire par la technique du maximum
de vraisemblance. La vraisemblance s’écrit de la façon suivante :
Avec si l’individu i à choisi l’alternative j, 0 sinon.
La log-vraisemblance peut donc s’écrire de la façon suivante :
32
McFadden (1973) a montré que cette fonction admet un maximum qui vérifie la condition
suivante :
Les paramètres β sont retrouvés par des algorithmes de maximisation implémentés dans
différents logiciels, notamment celui de Newton Raphson.
iv. Interprétation
L’interprétation des coefficients n’est pas directe, il est plus aisé de calculer les
probabilités d’occurrence des modalités pour analyser l’effet des variables étudiées. Les
coefficients estimés sont propres à chaque variable ainsi qu’à chaque modalité. Un négatif
indique que la présence de la variable correspondante diminue la probabilité d’occurrence de
la modalité j, et inversement.
b) Logit emboité
i. Présentation
Ce modèle a été créé pour palier à un inconvénient du Logit multinomial : l’hypothèse
de l’indépendance des alternatives non pertinentes (IIA pour « Independance of Irrevelant
Alternatives »). Soit en effet et deux alternatives, l’hypothèse de l’IIA affirme que le
rapport des probabilités entre ces deux choix ne dépend pas des autres alternatives offertes à
cet individu. Cette hypothèse est trop restrictive pour modéliser un certain nombre de
comportements.
Par exemple considérons un individu qui a le choix entre deux moyens de transport pour se
rendre à son lieu de travail, une voiture et un bus bleu. On note la probabilité que l’individu
choisisse la voiture et la probabilité qu’il choisisse le bus bleu. Si l’individu n’a pas de
préférence pour la voiture ou le bus, on a
Si maintenant le même individu a le choix entre un bus bleu, un bus rouge, et la voiture, et
qu’il est indifférent à la couleur du bus, on à donc .
33
D’où la seule solution est que , donc on voit que l’introduction de
l’alternative « bus rouge » a modifié les préférences de l’individu, l’hypothèse d’IIA ne tient
pas.
Lorsque l’on se trouve dans des cas ou l’hypothèse d’IIA n’est pas tenable, d’autres modèles
peuvent être construits pour analyser les choix de l’individu. C’est le cas du Logit emboité.
Dans ce type de modèle, on modélise les choix de l’individu en plusieurs étapes, pour
reprendre l’exemple précédent, l’individu pourra choisir dans un premier temps le mode de
transport, voiture ou bus, puis dans un second temps il choisira la couleur du bus.
ii. Formalisation mathématique et estimation du modèle
Fig. 2.2 : représentation du Logit emboité
Soit :
‐ L le nombre de groupes résultant de la partition de l’espace des choix
‐ le nombre de choix possible dans le groupe l
‐ le nombre total de choix possibles
‐ X le vecteur des caractéristiques de l’individu, décomposé en x’, caractéristiques
qui influencent le choix au niveau 2 et x’’ les caractéristiques qui influencent le
choix au niveau 1
On notera j(l) le choix j du groupe l.
La probabilité de faire le choix j(l) peut s’écrire :
Ou :
34
‐ est la probabilité de choisir le groupe l, connaissant les caractéristiques x’
‐ est la probabilité de choisir l’alternative j, sachant qu’elle fait partie du
groupe l et connaissant les caractéristiques de l’assuré x’’
Avec cette décomposition, on modélise le choix de j(l) au sein du groupe l par un Logit
multinomial, on a alors :
De la même façon, le choix du groupe est modélisé par un Logit multinomial. On a donc :
Avec
Grâce à la décomposition faite ci-dessus, on voit qu’il est possible d’estimer ce modèle en
deux étapes, dans un premier temps, les modèles de niveau 1 sont estimés, puis on calcule la
variable d’inclusion et enfin on estime le modèle de choix de groupe après avoir introduit la
variable d’inclusion. L’estimation de ce modèle revient en fait à faire deux estimations de
logit multinomial successives.
Dans certains cas, le modèle peut être partiellement dégénéré, c'est-à-dire qu’au moins un
groupe ne comporte qu’un choix, la variable d’inclusion est alors indéterminée.
Ce modèle est intéressant, mais il est nécessaire que des variables caractéristiques des choix
de chaque niveau soient disponibles.
c) Choix du modèle Le modèle choisi pour étudier les données doit être celui qui correspond le mieux à nos
données, le modèle multinomial est bien plus simple à mettre en œuvre, mais il faut tout
d’abord contrôler que l’hypothèse des alternatives non pertinentes est vérifiée, de même, pour
un Logit emboité, les choix de l’individu doivent être regroupés correctement.
Pour vérifier si l’hypothèse d’IIA est vraisemblable, un test statistique à été proposé par
Hausman et McFadden (1984). Le test se base sur la propriété que si l’hypothèse de l’IIA est
35
vérifiée, alors, les paramètres des modèles logit estimés sur différents sous ensembles de
l’espace total des choix ne doivent pas être statistiquement différents.
Soit C l’ensemble des choix possibles, A un sous ensemble de C, et les valeurs des
coefficients de la régression sur C et A, et les matrices de variances covariance des
modèles.
Sous l’hypothèse d’indépendance des alternatives non pertinentes, les estimateurs et
sont des estimateurs convergents, de plus, - est définie positive ; la statistique du test
(notée S) est la suivante :
Sous l’hypothèse d’IIA, S suit une loi du chi-deux avec un nombre de degrés de liberté égal
au rang de la matrice .
Si l’hypothèse d’IIA est rejetée, le modèle multinomial n’est pas applicable aux données, et il
faut alors étudier les données avec d’autres techniques, telles que le modèle logistique
emboîté par exemple.
2) Choix et transformation des variables
a) Choix des variables Le but du modèle est de décrire l’effet des variables sur la décision de racheter son
contrat, pour cela, les variables explicatives doivent donc être corrélées avec la variable à
expliquer. De plus, un autre problème se pose avec les variables quantitatives. Il faut se poser
la question de l’influence de la variable : est elle linéaire, y-a-t-il des effets de seuil ?
Dans un premier temps, on teste l’existence d’une liaison entre la variable à expliquer et les
variables explicatives. Pour cela, on utilisera principalement le test du khi et le test du rhô de
Spearman. Ces deux tests ont la même hypothèse nulle : « les deux variables sont
indépendantes », mais le test de Spearman est plus intéressant pour des échantillons de faible
importance car il se base sur les rangs et non sur la valeur des variables.
36
Une fois la liaison confirmée, les variables quantitatives peuvent être intégrées de
différentes façons au modèle ; en effet, contrairement aux variables qualitatives, les variables
quantitatives peuvent intervenir de plusieurs manières :
-l’influence de la variable explicative sur la variable à expliquer peut être linéaire, dans ce
cas-là, la variable sera utilisée telle quelle dans le modèle de régression logistique.
-l’influence de la variable peut se faire par seuil, dans ce cas-là, il faudra discrétiser la
variable et elle sera prise en compte comme une variable qualitative.
Il est important de se poser la question de cette influence, car intégrer la variable sous forme
continue dans le modèle implique de faire l’hypothèse de la linéarité de son influence, ce qui
n’est pas nécessairement vérifié, et peut donc conduire à une mauvaise interprétation des
résultats.
b) Regroupement des variables Les variables qualitatives qui présentent trop de modalités sont regroupées pour les
rendre plus significatives et simplifier le modèle. Il faut donc les regrouper sans altérer leur
sens. Pour cela, nous utilisons les techniques de classification ascendante hiérarchique. Ces
méthodes sont basées sur le concept d’inertie, comme définit ci-dessous.
Soit des groupes d’individus, le nombre d’individu de chaque groupe, et
les barycentres de ces groupes, G l’inertie du nuage notons l’inertie Intra-classe
et l’inertie inter classe. Ces deux quantités sont définies de la façon suivante :
Les méthodes de classification ascendante hiérarchique (CAH) ont pour but de regrouper les
individus en minimisant l’inertie intra-classe et en maximisant l’inertie interclasse. La CAH
se déroule de la façon suivante :
Initialisation : les classes initiales sont les n singletons individus.
37
Calculer la matrice de leurs distances deux à deux
- Itérer les deux étapes suivantes jusqu’à l’agrégation en une seule classe :
- Regrouper les deux éléments (classes) les plus proches au sens de la distance entre
groupes choisie
- Mettre à jour le tableau de distances en remplaçant les deux classes regroupées
par la nouvelle et en calculant sa distance avec chacune des autres classes
Il faut donc définir une distance entre deux groupes. Plusieurs distances peuvent être utilisées,
telles que la distance minimum ou maximum, ou encore, et c’est la méthode que l’on a
utilisée, la distance de Ward. La distance de Ward se calcule comme :
Avec d ( . , . ) la distance euclidienne.
Cette méthode est la plus couramment utilisée, elle consiste à faire les regroupements qui font
le moins augmenter l’inertie intra-classe.
En utilisant cette méthode sur certaines de nos variables qualitatives, on pourra en construire
de plus significatives, et ainsi simplifier le modèle en ne perdant pas ou peu d’information.
c) Interactions Les modèles purement additifs, c'est-à-dire ne prenant pas en compte les interactions,
ne sont généralement pas satisfaisants. Certaines variables peuvent en effet interagir avec
d’autres. On parle d’interaction lorsque les effets des variables ne s’ajoutent pas. Lors de
l’étude d’un phénomène, il faut prendre en compte cet effet entre les variables, pour ne pas
être induit en erreur.
Un exemple permet de mieux comprendre ce phénomène. On considère le cas ou la variable à
expliquer est le fait de faire ou non de la couture.
Notons Y la variable à expliquer. Y=1 si l’individu fait de la couture et 0 sinon.
Les variables explicatives considérées sont l’âge, quantitatif, et le sexe de l’individu,
qualitatif.
38
Le modèle additif s’écrit comme
Un modèle spécifié de cette façon revient à faire l’hypothèse que l’on se trouve dans la
situation représenté dans la figure 2.3
Fig. 2.3 : en fonction de l’âge pour le modèle additif
Cette spécification du modèle n’est clairement pas adaptée à la réalité : les hommes ne font de
la couture que très rarement. La prise en compte de l’interaction permet d’avoir des résultats
qui sont plus adaptés à la situation réelle.
Le modèle avec interaction s’écrit de la façon suivante :
La courbe du logit en fonction de l’âge pour les hommes et les femmes aurait alors une pente
différente.
0
2
4
6
8
10
30 40 50 60 70 80
logit(p(âge))
Age
Logit(p(x)) en fonction de l'âge modèle additif
Femme Homme
39
Fig. 2.4 : en fonction de l’âge pour le modèle avec interactions
La mise en application de ces différentes méthodes nous permettra d’analyser nos données, de
dégager certaines tendances, que l’on pourra ensuite analyser et interpréter.
3le test de Hosmer et Lemeshow
Le test de Hosmer et Lemeshow (2000) est un test qui a pour but d’évaluer la qualité
d’un modèle. Ce test permet d’avoir un indicateur statistique permettant d’accepter ou de
rejeter le modèle.
Le modèle estimé permet pour chaque observation d’obtenir un score, qui est en fait la
probabilité de survenance de l’événement. La statistique du test est calculée sur un
échantillon servant seulement à la validation du modèle.
Sous l’hypothèse nulle H0, les observations sont issues de la loi calculée par le modèle.
Dans un premier temps, on calcule les scores des individus, puis on subdivise l’échantillon
d’estimation en G groupes de même taille selon les scores.
Soit donc :
0
2
4
6
8
10
30 40 50 60 70 80
Logit(p(Age))
Age
logit(p(x)) en fonction de l'âge, modèle avec interaction
Femme Homme
40
‐ le score, ou probabilité de survenance de l’événement étudié, de l’individu
‐ g=1…G le groupe auquel appartient l’individu, on utilise les quantiles des scores
pour définir les groupes.
‐ l’effectif du groupe g
‐ le nombre de positifs observés
‐ le nombre de négatifs observés
‐ la somme des scores des observations du groupe g, c’est la
fréquence théorique des positifs dans le groupe g
‐ la fréquence des négatifs
‐ la moyenne des scores observés dans le groupe g
La statistique du test se calcule de la façon suivante :
Sous l’hypothèse nulle, C suit approximativement une loi du à (G-1) degrés de liberté.
On considère que le modèle est acceptable lorsque la p-value du test est plus grande que le
risque choisi.
41
Partie 3 analyse des causes de sorties anticipées des
contrats vie entière
La constitution de la base de données utilisée pour l’estimation du modèle LOGIT va être
décrite, puis on pourra comparer et analyser les résultats de cette estimation. Le choix des
contrats étudiés et les calculs ont été effectués de façon à permettre la comparaison avec les
lois de comportement calculées chaque année.
Dans le but d’analyser les causes des rachats, une régression logistique a été faite sur un
portefeuille contenant les contrats ayant pris effet entre 1991 et 2011.
Les contrats présents dans le portefeuille analysé sont des contrats vie entière (Prévoir
Quiétude) versant un capital en cas de décès. Ces contrats ne se comportent pas comme les
contrats d’épargne car ils n’ont pas même finalité, et ne s’adressent généralement pas à la
même population. L’évènement étudié est le suivant :
- le rachat total : l’assuré met fin à son contrat et reçoit alors le montant de la provision
mathématique constituée par l’assureur. Ce type de sortie doit être possible pour les contrats
vie entière, on ne retrouve pas ce genre de clause pour les contrats décès temporaire.
Dans un premier temps, il avait été envisagé d’étudier conjointement la réduction du contrat,
mais cette alternative n’a pas été retenue, car contrairement à la résiliation, ou le rachat total,
lors d’une réduction, le contrat reste dans le portefeuille, et l’assuré ne reçoit rien.
1) Préparation et sélection des données
Les variables pouvant influencer la décision de racheter ou non son contrat sont
nombreuses, et les bases de données sur les assurés ne peuvent pas recenser toutes les
informations. Pour cela, nous avons choisi un nombre important de variables et essayé de
déterminer leur influence sur la décision de l’assuré de sortir prématurément du portefeuille.
Ces variables peuvent êtres classées en deux catégories. D’une part les variables propres à
l’assuré, qui peuvent expliquer le rachat structurel, c'est-à-dire le rachat de son contrat par
42
l’assuré pour des raisons personnelles, indépendamment de l’évolution des marchés. On les
appellera variables structurelles.
D’autre part, le rachat conjoncturel survient lorsque l’assuré retire sa provision pour
l’investir dans des placements plus rémunérateurs. Les variables pouvant expliquer ce rachat
seront appelés variables conjoncturelles.
a) Données disponibles Les données utilisées pour l’estimation ainsi que la validation du modèle concernent
les années 2006 à 2009, années les plus récentes et recensant le plus d’informations. Sur ces
contrats, 75 % ont été réservés à l’estimation du modèle ; les 25 % restants servent à la
validation de ce modèle.
Les données disponibles concernant l’assuré sont : le sexe, le code postal, le revenu du foyer,
la charge mensuelle (qui correspond à la somme des primes des contrats Prévoir de l’assuré),
la date d’effet du contrat, l’inspection et la région commerciale dont dépend l’assuré, la
situation familiale de l’assuré.
Les données propres au contrat sont l’âge de l’assuré lors de la souscription, le capital initial
du contrat, le montant de la prime versée par l’assuré et la périodicité de la prime.
Le fait de prendre en compte les données concernant le revenu du foyer et la charge mensuelle
amène à n’utiliser que 60 % des données (le reste n’étant pas renseigné pour ces variables), et
introduit un biais car la plupart des contrats non pris en compte sont des contrats sortis. Nous
n’utilisons donc pas ces variables.
Les informations concernant la situation familiale de l’assuré et la périodicité des primes ne
seront pas non plus prises en compte : en effet, la plupart des assurés ont la même modalité,
périodicité mensuelle et couple marié, ce qui est peu intéressant pour le modèle.
Enfin, la prime mensuelle n’est pas prise en compte, il est préférable de prendre le capital
initial et l’âge de souscription, qui à eux deux déterminent complètement cette prime.
43
b) Choix des variables Les variables décrites ci-dessous sont celles qui ont étés retenues pour modéliser les
rachats dans notre portefeuille. Pour toutes ces variables, un test d’indépendance avec la
variable à expliquer a été réalisé, et ce test nous a donné, pour les variables retenues, des p-
values permettant de rejeter l’hypothèse d’indépendance au niveau de 5 %.
i. Variables structurelles
On a pu voir dans certains autres travaux sur le même sujet que l’ancienneté, le capital
initial, le sexe, l’âge de souscription la périodicité des primes sont des variables qui peuvent
avoir de l’influence ( surrender trigger in life insurance : classification and risk predictions,
Milhaud, Loisel , Maume-Deschamps [15] ) .
Au sein du portefeuille étudié, une grande majorité (plus de 95 %) des assurés paye des
primes mensuelles, il nous est donc difficile de détecter l’influence de cette variable, c’est
pourquoi elle n’est pas retenue.
Aussi, un assuré pouvant souscrire plusieurs contrats, il a été choisi d’utiliser le nombre de
contrats (vie entière uniquement) souscrits précédemment par l’assuré au moment de la
souscription du contrat étudié.
Les variables structurelles étudiées sont au nombre de six :
L’ancienneté du contrat
L’ancienneté du contrat lors de l’année étudiée est calculée comme la différence entre
l’année d’étude et la date d’effet diminuée de 1 pour les contrats en cours, et comme la
troncature de pour les contrats qui ont été résiliés ou rachetés au
cours de l’année. Il apparaît que l’ancienneté du contrat joue un rôle prédominant dans les
rachats, et que le nombre de rachats observé n’est pas fonction linéaire de l’ancienneté. Cette
variable sera donc considérée en tant que facteur, et non comme une variable continue. De
plus, les anciennetés supérieures à 15 ne sont pas prises en compte, car les contrats dans cette
situation sont trop peu nombreux dans le portefeuille étudié: seulement 6 % des contrats se
trouvent dans ce cas de figure.
L’inspection
44
Le réseau de distribution est organisé en inspections, qui sont elles-mêmes regroupées
par régions commerciales. Dans un premier modèle, le regroupement des assurés par région
commerciale a été préféré. Ensuite, une comparaison des résultats avec le regroupement des
inspections en fonction de leur taux de rachat sur les années précédentes a montré que ce
regroupement produisait de meilleurs résultats.
Il est intéressant de noter que le regroupement des inspections ne recoupe absolument
pas le regroupement en régions commerciales (ou en régions géographiques). Cela implique
que les critères propres à la région ont moins d’importance, pour notre portefeuille, que le
réseau de distribution de ces contrats.
La variable inspection a deux modalités, les inspections où le nombre de rachats est
normal, celles où le nombre de rachats est élevé. Dans le modèle la modalité de référence est
le groupe d’inspection avec un nombre élevé de rachat.
Le sexe
Le sexe de l’assuré peut avoir des effets non négligeables sur le choix de racheter, en
effet les femmes ont une plus faible probabilité de décès mais la prime calculée du produit sur
lequel a été mené l’étude est unisexe. Les femmes payent donc plus que les hommes en
comparaison de leur risque, ce qui pourrait être une cause de rachat.
Le nombre de souscriptions précédentes
Cette quantité représente le nombre de contrats vie entière de l’assuré en cours à la
souscription du contrat ; en théorie, ce nombre est limité à deux, car l’assuré ne peut avoir
plus de trois contrats Prévoir Quiétude. Cette variable est conservée telle quelle, sur le
graphique ci-dessous, on peut voir les taux de rachats selon le nombre souscriptions
précédentes.
45
Fig. 3.1 : Taux de rachats en fonction du nombre de souscriptions antérieures
Ces taux sont calculés sur la population qui servira à l’estimation de notre modèle.
Ce graphique nous permet de voir qu’il est raisonnable de faire l’hypothèse de l’influence
linéaire de la variable, elle pourra donc être conservée telle quelle dans le modèle.
Le capital initial
Il s’agit du capital défini à la souscription du contrat versé lors du décès de l’assuré.
Le bénéficiaire reçoit ce capital si le souscripteur a payé toutes ses primes. Ce capital peut
aller jusqu’à 32000€ sur les contrats du portefeuille, mais 74 % des assurés ont moins de
10000€ de capital initial. Comme pour la variable précédente, nous avons représenté
l’évolution des taux de rachat en fonction du capital initial, calculé sur la population
d’estimation.
Fig. 3.2 : Taux de rachats en fonction du capital initial (en k€)
3,50%
3,75%
4,00%
4,25%
4,50%
4,75%
0 1 2
taux de rachat
nombre de souscriptions antérieures
taux de rachat
0,00%
2,00%
4,00%
6,00%
<3 4‐5 6‐7 8‐9 10‐11 12‐13
Taux de rachat
Capital initial (k€)
taux de rachat en fonction du capital
46
Comme pour la variable précédente, la tendance semble linéaire. Une régression linéaire sur
les taux de rachat en fonction du capital initial nous donne un coefficient de détermination
(R ) de 0,7901. Les pics observés pour les tranches 5 000 €- 6 000€ et 8 000 €- 9 000 € n’ont
pas d’explication particulière, et l’on choisit de conserver l’hypothèse de linéarité, dans un
souci de simplicité du modèle.
L’âge à la souscription
Les assurés peuvent souscrire à un contrat à condition d’avoir entre 50 et 80 ans. Cette
variable est quantitative et comme pour les deux précédentes, on a ci-dessous le taux de rachat
en fonction de l’âge à la souscription.
Fig. 3.3 : Taux de rachats en fonction de l’âge à la souscription
Les assurés aux âges extrêmes ont tendance à plus racheter que les autres, et l’on voit ici que
l’influence de cette variable n’est pas linéaire. On va donc regrouper les âges en fonction de
leur taux de rachat.
A l’aide de la Classification ascendante hiérarchique, en utilisant la distance de Ward, les
observations précédentes sont confirmées, on regroupe les âges extrêmes dans un groupe, et
les âges intermédiaires dans l'autre. Les âges extrêmes sont les âges entre 50 et 59 ans inclus
et ceux entre 75 ans et 80 ans inclus.
0,00%
1,00%
2,00%
3,00%
4,00%
5,00%
6,00%
50 54‐56 60‐62 66‐68 72‐74 78‐80
taux de rachat
Age de souscription
Taux de rachat en fonction de l'âge
47
Cette variable sera donc transformée en variable binaire, valant 0 si l’âge lors de la
souscription du contrat est dans l’intervalle [60 ; 74] et 1 dans le cas contraire.
Remarque : le revenu avait dans un premier temps été considéré, mais il présentait une
forte corrélation avec le capital initial du contrat et était souvent mal ou non renseigné dans
nos données. Comme les contrats pour lesquels les données étaient manquantes étaient
majoritairement rachetés, prendre en compte cette donnée aurait introduit un biais.
ii. Variables conjoncturelles
Pour prendre en compte l’effet conjoncturel des rachats, les liens entre le taux de rachat et
plusieurs variables conjoncturelles sont étudiés. Dans un premier temps la variation du taux
de chômage, puis dans un second temps avec des variables spécifiques au domaine de
l’assurance.
Comme les variables comparées sont annuelles, les données sont peu nombreuses : on met
alors en œuvre le test du rhô de Spearman décrit ci dessous.
Ce test étudie non pas la valeur des observations, mais la liaison entre leurs rangs. Pour
cette raison, il est bien adapté aux échantillons de petite taille. De plus, il permet de détecter
les liaisons qui ne sont pas linéaires ce que d’autres tests, non basés sur les rangs, ne
pourraient pas repérer.
L’hypothèse nulle du test est : « il n’y a pas de corrélation des rangs » La statistique du
test se calcule par la formule suivante :
Avec la différence des rangs au niveau de l’observation i, et n le nombre d’observations.
Sous l’hypothèse nulle, on doit se reporter à la table des valeurs critiques du rhô de Spearman
pour avoir la significativité du test. Lorsque n est supérieur à 10, on considère que
suit une loi de Student à n-2 degrés de liberté.
48
Variation du taux de chômage
Fig. 3.4 : taux de rachat annuel et variation du chômage
Le lien entre cette variation du taux de chômage et les taux de rachats n’est pas confirmé par
le test de Spearman qui nous donne un p-value bien trop importante (0,8943) pour rejeter
l’hypothèse d’indépendance, ce qui se voit sur le graphique ci-dessus. Ce résultat était assez
prévisible, le contrat étudié s’adresse à des assurés ayant plus de 50 ans, et l’âge moyen des
assurés en portefeuille est de plus de 65 ans. Les assurés sont donc pour la plupart des
retraités, et donc peu affectés par le chômage.
Chiffres propres au secteur assurantiel
Les tests de Spearman ont aussi été réalisés sur le nombre de contrats en cours, nombre
d’affaires nouvelles et cotisations dans la branche. Ces chiffres propres au secteur auraient pu
avoir un lien avec le nombre de rachats observés. Cependant, comme précédemment, le test
de Spearman n’a pas été concluant ; il a donc été choisi de ne pas conserver ces variables.
Ce type de contrat est moins sensible à la situation conjoncturelle que les contrats d’épargne
car leur but premier n’est pas de faire fructifier un patrimoine, ce qui peut expliquer le fait
qu’aucune des variables conjoncturelles n’ait été retenue.
Les variables explicatives du modèle sont donc au nombre de 6 : l’ancienneté, la classe d’âge
à la souscription l’inspection, le nombre de contrats vie entière précédemment souscrits et le
sexe de l’assuré.
‐2
0
2
4
6
8
Taux de rachat et variation du taux de chômage
Varitation du taux de chomage taux de rachat
49
2) Spécification du modèle et résultats
Après avoir choisi et étudié les variables pouvant expliquer les phénomènes de rachat, un
modèle de régression logistique est mis en place pour permettre de mieux capturer les effets
des variables ; 75 % des données ont été sélectionnées pour permettre l’estimation du modèle,
et 25 % pour valider le modèle.
a) Spécification du modèle Le modèle mis en place est un modèle de régression logistique, avec comme variable à
expliquer le choix de racheter ou non le contrat, et comme variables explicatives, détaillées
dans la partie précédente, l’âge, l’ancienneté du contrat, le nombre de souscriptions
précédentes, le capital initial, le sexe de l’assuré et enfin l’inspection dont dépend le contrat.
Pour la variable qualitative « sexe », la modalité de référence est « féminin» ; pour la
variable inspection, la modalité de référence est « inspection à taux de rachat élevé » et enfin,
la modalité de référence pour l’âge lors de la souscription du contrat est la classe d’âge
intermédiaire.
Au départ, le modèle est complet, c'est-à-dire qu’il prend en compte toutes les variables
explicatives. Puis les variables qui ne sont pas significatives (détectées grâce au test de Wald)
sont enlevées du modèle. Enfin, le modèle choisi est celui qui minimise le critère
d’information d’Akoike, comme expliqué dans la partie précédente. Le modèle retenu est
donc un modèle ayant des variables toutes significatives et qui est le meilleur possible au sens
de l’AIC.
b) Résultats et commentaires Les résultats de l’estimation du modèle sont détaillés ci-dessous, seules les variables
significatives au niveau 5 % ont été conservées :
Coefficients
constante -2,69
Groupe d’âge 0,211
50
Souscription antérieures 0,0580
Ancienneté
0 Référence
1 -0,238
2 -0,457
3 -0,652
4 -0,684
5 -0,730
6 -0,682
7 -0,729
8 -0,810
9 -0,899
10 -0,950
11 -1,06
12 -1,18
13 -1,08
14 -1,23
15 -1,27
Sexe Masculin -0,177
Inspection normale -0,275
Capital initial 0,0000278
Tableau 3.1 : Résultats de la régression logistique sous R
Pour interpréter l’effet des coefficients, on calcule les rapports des chances, qui
permettent de comparer les probabilités entre elles.
Après calcul, les âges extrêmes ont une probabilité de sortie plus élevée de 23 % que
les individus souscrivant entre 60 et 74 ans.
L’effet des inspections d’origine est plus prononcé. En effet, un individu venant d’une
inspection classée parmi celles ayant des taux de sorties élevés aura une probabilité de sortie
1,32 fois plus élevée que si ce même individu venait d’une inspection à taux de sortie normal.
51
Enfin l’ancienneté du contrat a un effet important sur le rachat. Durant les premières
années, les taux de rachat sont élevés, puis diminuent de façon bien plus modérée ensuite.
Plus le contrat vieillit, plus il est dans l’intérêt de l’assuré de conserver son contrat.
F ig3.5 rapport de chance des anciennetés
On remarque que l’effet de l’ancienneté n’est en effet pas linéaire : il y a une
décroissance rapide des taux de rachats au début, jusqu'à 3 ans d’ancienneté, puis sur les
anciennetés suivantes, on observe toujours une décroissance, mais qui est bien plus modérée.
Le graphique 3.5 nous permet de visualiser ces observations. On y retrouve les rapports de
chances des anciennetés par rapport à la modalité de référence : un contrat avec une
ancienneté de 0.
Observations
Durant les premières années de vie du contrat, la décision est très influencée par le
suivi du contrat, en effet, la différence importante entre les premières années et les suivantes
trouve son explication dans le suivi du contrat assuré par le commercial dont le rôle n’est pas
seulement de vendre les contrats mais aussi d’en assurer le suivi. Il est dans l’intérêt de ce
dernier, qui perçoit la majeure partie de son salaire sous forme de commission, que le contrat
ne chute pas au cours des 12 premiers mois, pour acquérir définitivement les 45 % de
commissions au bout de la première année. On peut supposer que certaines inspections
s'orientent plus vers la prospection, tandis que d'autres semblent privilégier le suivi des
contrats. Durant les années suivantes, le réseau commercial garde son importance : en effet,
0%
20%
40%
60%
80%
100%
120%
0 2 4 6 8 10 12 14
ancienneté
rapport de chances de l'ancienneté
52
les différences de comportement des assurés sont fortement influencées par les inspections
dont ils dépendent.
D’autres paramètres influencent l’assuré. Tels que le capital initial, montant versé au
bénéficiaire en cas de décès défini lors de la réalisation du contrat. Il en va de même pour le
nombre de souscriptions de l’assuré, ces deux variables déterminent les cotisations que
l’assuré devra payer à Prévoir, plus il a de contrats avec des capitaux élevés, plus le montant
de sa prime sera élevé, et cela pourra l’inciter à racheter ses contrats. Cette affirmation est
confirmée par le fait que les coefficients estimés pour ces deux variables sont bien positifs.
Quelle que soit l’ancienneté du contrat, les femmes ont toujours plus tendance à racheter leur
contrat.
Un autre effet semble se dégager, les assurés soit très jeunes, soit très vieux (relativement à
l’âge de souscription autorisé pour le contrat étudié) ont une probabilité de rachat plus grande
que ceux souscrivant à des âges intermédiaires.
Les taux de rachat élevés des assurés souscrivant à des âges élevés (75 ans ou plus) peut
s’expliquer par le fait que le prix des contrats à des âges élevés augmente assez vite, les
assurés souscrivant tard payent donc une prime bien plus élevée, à capital égal, que les
assurés souscrivant plus jeunes, ils sont donc plus enclins à racheter leur contrat.
3) Validation et Backtesting
La validation de ce modèle est faite à l’aide d’un test de Hosmer et Lemeshow, sur les
données initiales n’ayant pas été utilisées dans la phase d’estimation du modèle.
L’hypothèse nulle de ce test est que les données générées par le modèle sont
conformes aux données observées.
La p-value de ce test sur nos données est supérieure au seuil critique de 0,05, elle est ici de
0,24, on ne peut donc pas rejeter l’hypothèse nulle, le modèle prédit est considéré comme
prédisant les données avec une précision acceptable.
Après avoir calibré le modèle sur les données de 2006 à 2009 et vérifié que le modèle est
valable sur un échantillon de validation provenant de la même période on se pose la question
53
de la stabilité des coefficients estimés. En effet, comme les données des années précédentes
servent à modéliser celle de la génération en cours, il est important que le modèle estimé
permette de prévoir avec précision les sorties futures.
Dans le but de tester la robustesse du modèle estimé, on utilise donc les coefficients du
modèle logit précédent pour calculer les probabilités de rachat sur les données de l’année
suivante, l’année 2010. Les résultats du modèle peuvent ensuite être comparés avec ce qui à
été observé cette même année afin d’évaluer la robustesse du modèle.
On se sert des données de l’année 2010 afin d’évaluer le pouvoir prédictif du modèle. La
probabilité que le contrat soit racheté au cours de l’année est donc estimé en fonction des
caractéristiques retenues lors de l’estimation, c'est-à-dire l’ancienneté du contrat, le sexe de
l’assuré, le capital initial souscrit du contrat, l’âge de souscription, le nombre de souscriptions
précédentes et enfin le profil de l’inspection dont dépend le contrat.
En notant les coefficients estimés associés aux caractères , la probabilité que le contrat
soit racheté au cours de l’année est calculée de la façon suivante :
En plus d’une estimation ponctuelle, le modèle permet aussi de faire des prévisions par
intervalles de confiance. En effet, soit :
‐ le vecteur des coefficients estimés par le modèle.
‐ les caractéristiques de l’individu
Notons
La variance du modèle s’écrit alors :
L’intervalle de confiance du modèle au niveau 1- est défini par :
Avec un fractile de la loi normale centré réduite, et .
54
Le graphique ci-dessous permet de voir les taux de rachats sur le portefeuille vie entière en
2010, ainsi que les intervalles de confiance, au niveau 90% estimés par le modèle logistique
construit dans les parties précédentes.
Fig. 3.6 Prévisions du modèle
Ont peut voir que le profil de rachat est dans l’ensemble assez stable, avec un fort taux de
rachats les premières années qui décroit rapidement pour se stabiliser ensuite. Les
explications des profils de ces différentes courbes peuvent se retrouver dans les parties
précédentes.
Le profil des assurés étant présent dans le portefeuille est lui-même assez stable, la clientèle
ne change pas significativement d’une année sur l’autre, et comme les caractères détectés
comme influençant la décision étant pour la plupart des paramètres structurels, il est normal
d’observer une certaine stabilité dans les comportements des assurés. L’échantillon utilisé
pour le backtesting ne présente par contre que peu de contrats avec des anciennetés élevées et
un rachat observé peut faire rapidement dévier le résultat. En effet sur l’échantillon utilisé sur
le backtesting, on observe seulement 13 contrats rachetés en 2010 avec l’ancienneté 15. D’où
le décrochage avec les prévisions.
0%
1%
2%
3%
4%
5%
6%
7%
8%
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Taux de rachats
ancienneté (an)
Prévisions du modèle
Borne inf IC 90% Borne sup IC 90% Taux réels
55
4) Conclusion
Les travaux effectués permettent de se rendre compte de l’influence de certaines
variables, propres à l’assuré, comme le sexe et le capital initial. Le réseau de distribution des
contrats prend une importance toute particulière et peut expliquer certains comportements des
assurés, comme le pic de rachat observés lorsque le contrat atteint une ancienneté de 12 mois,
ou encore l’importance de l’inspection dont dépend le contrat dans le choix de racheter ou non
son contrat prise par l’assuré.
Les résultats se basent sur l’hypothèse que les rachats totaux, et les résiliations de contrat
surviennent pour des raisons communes, les résultats de cette étude sont donc à prendre en
compte sous la réserve de justesse de cette hypothèse. De plus, l’étude de certaines variables
n’a pas pu être faite. La cause principale étant la fiabilité et disponibilité des données. Aussi,
aucune variable conjoncturelle n’a pu être retenue dans l’étude.
Ces résultats ne peuvent être généralisés sans précautions : en effet, l’entreprise dans
laquelle cette étude à été faite dispose d’un réseau de distribution particulier, et les raisons des
rachats sont très liées au fonctionnement de ce dernier. De plus les contrats étudiés ont
certaines spécificités : capitaux assez faibles, limite d’âge à la souscription, pas de
questionnaire médical à l’entrée,
Quelques autres pistes semblent être intéressantes à développer, par exemple, certains
critères semblent indiquer que les gens qui rachètent leur contrat sont des gens en bonne
santé, cela se traduirait par une mortalité plus élevée pour les clients encore dans le
portefeuille que ceux étant sortis, cette hypothèse a pu être confirmée statistiquement grâce à
un test du khi mais les observations sont malgré tout peu nombreuses. Pour illustrer cette
hypothèse, on peut voir sur la figure 3.7 les courbes de mortalité du portefeuille PQ, et celle
des personnes ayant racheté leur contrat, mais étant encore client chez Prévoir.
56
Fig. 3.7 mortalité comparée sur contrats rachetés et portefeuille PQ
Cette analyse a permis de se rendre compte de l’influence de paramètres autres que
l’ancienneté sur la décision de rachat de l’assuré, certains de ces paramètres pourraient être
directement pris en compte pour les calculs des lois de comportement pour permettre une
segmentation plus fine. D’autres, comme l’état de santé de l’assuré, ne sont connus qu’a
posteriori et ne peuvent servir à la création des lois de rachat.
On peut se poser la question de l’influence des mêmes facteurs sur des contrats
différents provenant de la même entreprise, tels que les contrats d’épargne. Les rachats sont
ils influencés par les mêmes facteurs dans ces deux différents types de contrat?
0,000%
2,000%
4,000%
6,000%
8,000%
10,000%
12,000%
14,000%
16,000%
51 61 71 81
qx
âge
Mortalité comparée portefeuille et contrats rachetés
mortalité des personnes rachetant leur PQ mortalité du portefeuille PQ
57
Partie 4 analyse des causes de sorties anticipées des
contrats d’épargne
Dans la partie précédente, les contrats vie entière ont été analysés et certains facteurs
pouvant influencer le rachat ont été dégagés. Des contrats d’épargne ont été étudiés à l’aide
des mêmes techniques que dans la partie précédente, dans le même but : rendre compte de ce
qui peut influencer l’assuré lors du rachat de son contrat. Une meilleure connaissance
pourrait, par exemple, permettre une segmentation différente du portefeuille pour le calcul des
lois en montant.
1) Préparation et sélection des données
Les données disponibles sont nombreuses, et nombre de variables peuvent influencer
l’assuré, dans un sens ou dans l’autre. Certaines sont des variables permettant de capter
l’influence de la conjoncture, d’autres des variables structurelles, propres à l’assuré.
a) Données disponibles Parmi les contrats étudiés, le contrat le plus ancien à été souscrit le 1er novembre 1990, le
plus récent le 1er septembre 2011. La base de données est constituée de 133 797 contrats.
Parmi tous ces contrats, à la date d’extraction, 28538 contrats avaient été rachetés.
Pour ces types de contrat, l’assuré a la possibilité de souscrire même s’il est mineur, dans
ce cas, il doit être représenté par une personne majeure. L’âge moyen de souscription est de
53 ans, avec la répartition ci-dessous.
58
Fig.4.1 : Distribution de l’âge à la souscription
Géographiquement, la plupart des assurés du portefeuille sont situés dans les régions du
nord de la France, on retrouve en effet 60 % des assurés dans les régions nord-est, nord-ouest
et nord (découpage des régions en annexe).
D’autres données sont disponibles, telles que l’ancienneté du contrat, le montant de la
provision mathématique au début de chaque année où le contrat est en cours, le revenu du
foyer, le sexe de l’assuré, le montant total des cotisations de l’assuré versées à Prévoir, sur
l’ensemble des contrats qu’il détient, ainsi que d’autres variables. Il convient donc de faire un
choix quant aux variables à conserver et à étudier pour comprendre la décision de l’assuré.
b) Choix des variables Toutes les variables ne sont pas conservées et analysées, seules certaines présentent un
intérêt. Les variables propres à l’assuré qui sont étudiées sont par exemple le sexe et l‘âge de
l’assuré à la souscription du contrat, ainsi que le classement de l’inspection par laquelle le
contrat de l’assuré est géré. L’inspection dont dépend le contrat est en fait une zone
géographique. Des variables propres au contrat sont aussi prises en compte telles que
l’ancienneté de ce dernier, ou encore le montant de la provision mathématique.
Pour analyser ce phénomène de rachat, il faut aussi prendre en compte l’effet des variables
conjoncturelles. Dans le cadre du QIS 4 (étude d’impact quantifié), des paramètres standard
ont été fournis pour le traitement des rachats conjoncturels. Le taux de rachat conjoncturel est
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97
âge à la souscription
59
modélisé, dans le cadre du QIS, comme fonction de l’écart entre le taux servi R et le taux
moyen des emprunts d’Etat, c’est-à-dire le taux de rendement sur le marché secondaire des
emprunts d'État à taux fixe de maturité supérieure à 7 ans. (TME) observé. Notons RC(R) ce
taux, qui doit être rajouté au taux de rachat structurel. On a alors :
La formulation précédente permet d’interpréter les paramètres.
‐ α est le seuil en-deçà duquel les rachats conjoncturels sont constants et fixés à .
Ce n’est plus l’écart de taux qui explique le comportement des assurés.
‐ β et γ sont respectivement les seuils d’indifférence à la baisse et à la hausse du taux
servi. Entre ces 2 seuils, le comportement de l’assuré n’est pas modifié.
‐ δ est le seuil au-delà duquel la diminution du taux de rachat conjoncturel est constant
fixée a
Cette modélisation est confirmée dans le QIS 5, où il est précisé que la modélisation des
rachats doit tenir comptes des différents facteurs économiques (TP.2.108.).
Actuellement, le taux utilisé dans cette modélisation n’est pas le TME, mais un taux
concurrentiel moyen servi sur le marché, issu des données de la FFSA. Il est donc naturel
d’utiliser la différence de taux servi entre les contrats étudiés et la moyenne de taux servis sur
le marché comme une des variables explicatives du phénomène de rachat.
D’autres variables ont été aussi testées, mais n’ont pas été conservées car elles ne semblaient
pas présenter de lien avec le phénomène. Cette absence de lien a été confirmée à l’aide de
tests statistiques de la même façon que dans la partie précédente. Parmi ces variables, on peut
citer notamment le taux de chômage ainsi que l’évolution des taux du livret A.
Aussi, pour mieux comprendre l’influence de l’ancienneté, il est nécessaire de connaître les
modalités d’imposition des plus values des contrats d’épargne, que l’on peut retrouver dans la
première partie de ce mémoire.
60
Pour nous permettre d’avoir un portefeuille varié, et comme les comportements changent avec
le temps, nous allons étudier les données pour une période allant de 2005 à 2009 ; de plus, si
la période est trop ancienne, on ne pourra pas observer toutes les modalités de la variable
ancienneté, qui est une variable qui influence fortement la décision de l’assuré pour ce type de
contrat.
2) Spécification du modèle et résultats
Dans un premier temps, les rachats ont été analysés sans faire la distinction entre le rachat
partiel du contrat et le rachat total, puis ensuite en différenciant ces deux possibilités.
a) variables explicatives des modèles Les variables explicatives sélectionnées sont au nombre de neuf, trois sont propres à
l’assuré : son sexe, l’inspection dont il dépend et l’âge de l’assuré à la souscription du
contrat, quatre sont propres au contrat étudié : le montant de la provision mathématique,
l’ancienneté du contrat, la tranche de versement initial, et le nombre de rachats partiels déjà
survenus sur ledit contrat. Les dernières variables ont pour but de rendre compte des facteurs
conjoncturels : la différence de taux servi entre Prévoir et la moyenne du marché, et
l’évolution du CAC sur la période.
Ces variables semblent chacune avoir une influence sur la décision de racheter. Des
hypothèses sont faites sur l’influence de ces variables, puis sont validées, on non, par l’emploi
d’un modèle de régression logistique.
- le sexe
Lors des travaux faits sur les contrats vie entière, on s’est rendu compte que les femmes
rachetaient plus que les hommes. Les contrats d’épargne ont des caractéristiques différentes
que celles des précédents, mais il est tout de même intéressant de se poser la question et de
valider ou non l’influence de cette variable.
‐ l’âge à la souscription du contrat
Il semble se dégager une tendance selon laquelle, plus l’assuré est âgé, moins il a de
chance de racheter. Cette variable est conservée telle quelle, c'est-à-dire qu’elle est incorporée
61
dans le modèle en tant que variable continue, et on suppose que son effet sur la décision de
racheter est linéaire. Cette hypothèse permet de simplifier le modèle, et le coefficient de
détermination étant de 0,80, elle paraît raisonnable. La figure 4.2 nous permet d’observer les
taux de rachats des contrats en fonction de l’âge de l’assuré à la souscription.
Fig. 4.2 : Taux de rachats observés en fonction de l’âge à la souscription
‐ Le classement de l’inspection dont dépend la variable.
La construction de cette variable est détaillée dans la partie portant sur les contrats vie
entière. Et les inspections commerciales classées élevées l’année précédentes doivent avoir
des taux de rachats plus élevés que celles qui sont dans la moyenne.
Cette variable montre l’importance de la gestion des contrats dans la décision de
racheter, on voit qu’elle n’est pas liée avec la région géographique de l’assuré. En effet, un
test d’indépendance du khi ne permet pas de rejeter l’hypothèse nulle d’indépendance, la p-
value obtenue est très élevée : 0,72.
On peut voir sur le tableau ci-dessous, la répartition des inspections par région
géographique.
0,00%
4,00%
8,00%
12,00%
16,00%
20,00%
0‐20 31‐30 31‐40 41‐50 51‐60 61‐70 71‐80 81‐90
Taux de rachat
Age de souscription
Taux de rachat par tranche d'âge
62
région Classement Répartition
Bretagne élevé 41%
normal 59%
Centre‐Est élevé 63%
normal 38%
Centre‐ Ouest élevé 48%
normal 52%
Ile‐de‐France élevé 44%
normal 56%
Nord élevé 58%
normal 42%
Nord‐Est élevé 62%
normal 38%
Nord‐Ouest élevé 49%
normal 51%
Sud‐Est élevé 60%
normal 40%
Sud‐Ouest élevé 40%
normal 60%
Tableau 4.1 : Répartition des inspections par région géographique
Sur les années 2005 à 2009, le classement des inspections réalisé est relativement
stable. En effet, une inspection a 79,8 % de chances de rester dans la même catégorie d’une
année sur l’autre.
L’absence de lien avec la région géographique montre bien que cette variable rend
plus compte de la politique commerciale que d’une situation propre à l’ensemble de la zone.
D’autres variables plus spécifiques aux contrats sont étudiées, parmi celles-ci, on
retrouve le nombre de rachats partiels déjà survenus sur le contrat, l’ancienneté du contrat, la
provision mathématique du contrat en début d’année et enfin la tranche de versement initiale
du contrat.
63
‐ nombre de rachats partiels déjà survenus sur le contrat
Cette variable semble avoir une grande importance sur le contrat, il semble qu’un
assuré ayant déjà effectué des rachats partiels sur son contrat aura bien plus de chances d’en
refaire que quelqu’un qui n’en à jamais réalisé.
Fig. 4.3 : taux de rachats observés en fonction du nombre de rachats déjà survenus
Le graphique ci-dessus permet de voir les taux de rachat annuels sur des contrats selon
le nombre de rachats partiels. L’influence de cette variable peut être considérée comme
linéaire, le coefficient de détermination de la régression linéaire faite sur le taux de rachat en
fonction du nombre de rachats partiels survenus sur le contrat est de 0,9938 ce qui confirme
les précédentes observations.
‐ L’ancienneté du contrat
L’ancienneté est la durée qui s’est écoulée depuis la date d’effet du contrat. Ce paramètre
est celui qui a généralement le plus d’importance pour ce type de contrat. En effet,
l’ancienneté détermine la façon dont les rachats sont taxés. Pour un contrat avec moins de 4
ans d’ancienneté, le prélèvement libératoire sur les plus-values se fait au taux de 35 %, 15 %
si le retrait à lieu lorsque le contrat a entre 4 et 8 ans d’ancienneté et enfin 7,5 % lorsque le
contrat a plus de 8 ans d’ancienneté, avec un abattement dont le montant dépend de la
situation de l’assuré. L’assuré peut aussi choisir d’intégrer ses plus values dans son revenu, ce
qu’il fait dans la plupart des cas des contrats étudiés. Elles sont alors taxées au taux marginal
d’imposition, comme décrit dans la première partie.
R² = 0,9938
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%
35,00%
40,00%
45,00%
0 1 2 3 ou plus
taux de rachat
nombre de rachat partiels survenus
taux de rachats en fonction du nombre de rachat précédents
taux de rachats
Linéaire (taux de rachats)
64
Pour les contrats d’épargne les taux de rachats sont généralement assez faibles les années
précédant le terme du contrat (8 ans), et on observe un pic de rachat lorsque le contrat atteint
une ancienneté de 8 ans, puis ensuite, une stabilisation à un niveau relativement faible. Ces 8
ans correspondent à la durée initiale du contrat et l’assuré peut bénéficier de conditions
fiscales avantageuses à ce moment là.
Cette variable ne peut donc pas être étudiée comme influençant les rachats de façon
linéaire : on va donc la prendre en compte comme un facteur à une modalité pour chaque
ancienneté, jusqu'à 10. Les anciennetés supérieures à 10 seront regroupées dans la modalité
10 : en effet, le comportement durant ces années reste assez stable.
‐ La provision mathématique du contrat en début d’année
La provision mathématique représente le montant à la disposition de l’assuré, ce
montant est récupéré en début d’année. On observe des taux de rachats plus élevés sur les
contrats ayant une faible provision (moins de 2 000€) ou lorsque cette provision est élevée
(plus de 25 000€).
‐ La tranche de versement initial
Lors de la réalisation du contrat, l’assuré dépose un montant, qui doit forcément dépasser un
montant défini. Lors de la réalisation des lois en montant (versement et rachat), cette variable
est utilisée pour segmenter le portefeuille, on choisit donc d’étudier son influence.
Deux autres variables rendant compte de la conjoncture sont ajoutées, ces deux
variables sont l’évolution annuelle du CAC 40, ainsi que la différence de taux servi entre
Prévoir et la moyenne du marché sur les contrats en euros.
‐ l’écart de taux servi entre Prévoir et la moyenne du marché
Cette variable permet d’introduire un effet conjoncturel sur les rachats, quand on retrouve
un écart important entre le taux servi par l’assureur et le taux prévalant sur les marchés, ou le
taux moyen servi des contrats en euros de la concurrence, l’assuré peut être amené à retirer
son placement pour l’investir dans des contrats plus rémunérateurs.
Cette variable est calculée de la façon suivante :
65
Lorsque cette variable augmente, cela veut dire que les taux servis sur les contrats étudiés sont
plus performants que la moyenne du marché, ce qui implique que les rachats qui sont
observés doivent donc diminuer, et inversement.
De plus, comme les assurés ne disposent généralement d’aucune information sur la rentabilité
espérée de leur contrat, on observe en pratique qu’ils considèrent le passé comme la meilleure
prévision de l’avenir, qu’il s’agisse de leur contrat ou d’une forme d’épargne concurrente.
Pour appréhender cet effet sur l’année n, il faut donc comparer les rendements servis l’année
n-1.
‐ Evolution annuelle du CAC 40
De la même façon que la variable précédente, cette variable est calculée comme
Si on suppose que l’assuré considère le passé comme la meilleure prévision de l’avenir, plus
cette évolution est élevée, plus l’assuré pense avoir intérêt à racheter son contrat et à placer le
montant obtenu sur des contrats en unités de compte, par exemple.
Une des difficultés de la prise en compte de ces deux dernières variables est qu’elles peuvent
influencer l’assuré de plusieurs façons, et à des moments différents. En effet, un assuré qui
suit la situation économique quotidiennement sera bien plus réactif qu’un individu ne s’y
intéressant que très peu.
Aussi, un assuré n’ayant qu’un intérêt modéré pour l’économie pourrait prendre plusieurs
mois pour réagir à une variation des marchés, alors qu’un assuré se tenant au courant au jour
le jour pourrait réagir immédiatement.
3) Résultats et commentaires
a) Sans distinction entre rachats totaux et partiels Dans un premier temps, les phénomènes de rachats totaux et partiels sont considérés
comme ayant des causes identiques, 70 % des données sont utilisés pour estimer le modèle,
30 % pour valider nos observations. Pour choisir les variables explicatives qui ont du sens, on
commence par estimer le modèle complet, c'est-à-dire le modèle qui prend en compte toutes
66
les variables explicatives, ainsi que toutes les interactions entres ces variables, puis les
variables les moins significatives sont éliminées une à une en sélectionnant le modèle qui
maximise le critère d’AIC. Dans le tableau 4.5 on peut voir les coefficients de la régression
logistique qui ont été estimés à l’aide du logiciel R (on pourra retrouver les sorties de R en
annexe pour plus de détails)
:
Tableau. 4.2 : Résultats de l’estimation du modèle sur les rachats totaux et partiels
Variable (significativité) modalité coeff
cste (***) ‐1,485633rachat antérieur (***) 0,322205Ancien (***) 0 (Réf.)
1 ‐0,3256252 ‐0,4967873 ‐0,6285934 ‐0,8211285 ‐0,9856626 ‐1,1940757 ‐1,5366058 ‐0,0564789 ‐0,91568310 ‐1,006199
PM (***) <2000 (Réf.)entre 2000 et 25000 ‐0,222423>25000 ‐0,002366
classement inspection (***) normal ‐0,2031élevé (Réf.)
CAC (*) 0,189465Ancien :rachat antérieur(***)0 (Réf.)
1 0,981322 0,5894233 0,4067534 0,2880985 0,1985036 0,2651857 0,2244718 ‐0,1412259 0,09453210
PM2:rachat antérieur(***) <2000 (Réf.)entre 2000 et 25000 0,415921>25000 0,513148
67
La déviance standardisée, qui vaut 46447 est faible devant le nombre de degrés de liberté
(68974). Le modèle est considéré comme pertinent.
Le test de Wald nous indique que certains coefficients ne sont pas significatifs, ces tests
portent sur l’occurrence de la variable, et non sur la variable elle-même, une ANOVA permet
de confirmer que la variable ancienneté est bien significative. Ainsi que toutes les autres, à
l’exception de la variable différence de taux.
Pour valider le modèle, on se sert des 30 % de données qui n’ont pas servi lors de la
phase d’estimation. On peut observer que les pourcentages de rachats prévus par le modèle,
en fonction de l’ancienneté et ceux observés sont proches.
Fig.4.4 : taux de rachats observés et prévus en fonction de l’ancienneté
Le modèle semble donc donner des résultats satisfaisants. Afin de valider les observations, on
réalise un test de Hosmer et Lemeshow, décrit dans la partie précédente. La p-value de ce test
est de 37 %, on ne rejette donc pas l’hypothèse nulle qui affirme que les deux échantillons
proviennent de la même loi, et on considère donc que la précision du modèle est acceptable.
Parmi les variables précédemment décrites, quatre ont été écartées, car non
significatives au seuil de 5 % et ne semblent pas avoir d’influence sur le choix de l’assuré. Ce
5%
7%
9%
11%
13%
15%
17%
19%
21%
23%
25%
0 1 2 3 4 5 6 7 8 9 10
Taux de rachat
Anciennetée (années)
Résultats du modèle et observations
68
sont le sexe, l’âge lors de la souscription du contrat, la tranche de versement initial et enfin la
différence de taux servi avec la concurrence.
Contrairement aux contrats PQ précédemment étudiés, la santé des assurés ne semble
pas influencer le rachat ou non du contrat : en effet, les femmes vivent plus longtemps, et on
avait pu remarquer que ces dernières avaient plus tendance à racheter pour les contrats vie
entière, ce qui n’est pas le cas ici, il en va de même pour les assurés « jeunes ».
Aussi, l’effet de la tranche de versement initial n’est pas retenu. Dans les lois en
montant, on remarque que cette variable a une influence sur la loi de versement, mais pas sur
la loi de rachat, on lui préférera la PM du début d’année du contrat.
Parmi toutes les variables étudiées qui se sont révélés significatives, la variable la plus
discriminante est le nombre de rachats antérieurs survenant sur le contrat. Une fois que
l’assuré rachète partiellement son contrat, le risque que ce comportement se reproduise
augmente considérablement. Par exemple, un contrat ayant subi un rachat partiel durant sa
première année aura 4,6 fois plus de chances de racheter tout ou partie de la provision de son
contrat qu’un contrat n’ayant pas subi de rachat durant sa première année.
Cet effet s’atténue au cours du temps, le même rapport pour un contrat de 9 ans d’ancienneté
est seulement de 2. Il est donc important de prendre en compte l’interaction entre le nombre
de rachats antérieurs et l’ancienneté du contrat.
Les coefficients du modèle peuvent être interprétés à l’aide du calcul de rapport de chances
(ou odds ratio). On voit dans un premier temps, que l’ancienneté est un facteur très
discriminant, le rapport de chances entre les anciennetés 7 et 8 est de 2,3, c'est-à-dire qu’un
contrat qui a atteint 8 ans d’ancienneté en début d’année a une probabilité de se faire racheter
130 % plus élevé qu’un même contrat ayant un an de moins d’ancienneté. Le risque de rachat
diminue jusqu'à 7 ans d’ancienneté, puis un grand nombre de contrats sont rachetés la 8ième
année. Le pic à 8 ans et la forte décroissance pour les années précédentes peuvent être
expliqués par les conditions fiscales qui s’appliquent à ces contrats. En effet, plus les assurés
se rapprochent de l’échéance de leur contrats (8 ans) plus ils ont intérêt à attendre jusqu'à
l’échéance pour bénéficier de conditions fiscales avantageuses : un abattement sur
l’imposition des plus-values.
On voit aussi que l’inspection dont dépend l’assuré joue un rôle toujours aussi important, les
assurés provenant d’une inspection classée « élevé » l’année précédente ont un risque 39 %
69
plus élevé de racheter que ceux qui proviennent d’une inspection classé « normale ».Les
commerciaux qui distribuent les contrats sont dirigés par des inspecteurs, qui gèrent donc
chacun une inspection. On voit bien que cette variable a une influence conséquente sur la
décision de l’assuré. De plus, l’absence de lien entre cette variable et la région géographique
nous permet de supposer que cette variable rend compte de l’influence du réseau de
distribution.
Ce premier modèle nous montre bien le caractère fortement discriminant de l’ancienneté,
d’autres variables jouent aussi un rôle important, par exemple l’inspection, mais aussi et
surtout le nombre de rachat déjà survenus sur le contrat.
Cette analyse s’appuie sur l’hypothèse que les rachats, autant partiels que totaux, surviennent
pour les mêmes raisons. Une différentiation du choix de racheter totalement ou partiellement
son contrat est faite dans la partie suivante.
b) Avec distinction entre rachats totaux et partiels Les rachats totaux et partiels de contrat peuvent être séparés, dans le but de déterminer
quels facteurs peuvent pousser l’assuré à racheter totalement son contrat, et quels facteurs
peuvent au contraire l’amener à retirer seulement une partie de sa provision.
Pour analyser l’influence des variables sur les trois choix qui s’offrent à l’assuré, la méthode
du modèle logistique n’est plus adaptée, il faut donc utiliser d’autres techniques. Tout d’abord
le premier choix qui pourrait s’imposer est le modèle logistique multinomial, avec comme
variable à expliquer la variable qui décrit le comportement de l’assuré : soit il conserve son
contrat au cours de l’année, soit il le rachète partiellement, soit totalement.
L’intérêt d’analyser le comportement de l’assuré de cette façon est de pouvoir déterminer
quelles variables peuvent influencer l’assuré dans un sens plutôt qu’un autre.
Le modèle logistique multinomial permet de modéliser une telle prise de décision, sous
l’hypothèse de l’indépendance des alternatives non pertinentes. Il est donc nécessaire de
vérifier que cette hypothèse est réaliste. Pour cela, on réalise le test de Hausman et McFadden
dont la mise en place est détaillée ci dessous :
Soit donc C l’espace total des choix, on a alors :
70
C= racheter totalement ; racheter partiellement ; ne pas racheter
Soit A inclus dans C
A= racheter totalement ; racheter partiellement
Si l’hypothèse nulle d’indépendance des alternatives non pertinentes est vérifiée, alors S la
statistique du test, dont le calcul est décrit dans la partie 2. Doit suivre une loi du khi dont le
nombre de degrés de liberté est le rang de la différence entre les matrices de variance-
covariance des modèles estimés sur A et C.
La p-value de ce test, c'est-à-dire la probabilité sous l’hypothèse nulle que la statistique du test
soit supérieure ou égale à la valeur calculée, est inférieure à 2,2×10-16 l’hypothèse d’IIA est
donc assez largement rejetée, le modèle logistique multinomial n’est donc clairement pas
adapté à la situation étudiée.
Pour pallier à cet inconvénient, une alternative possible est l’utilisation du modèle logistique
emboité. Dans ce dernier, on structure la décision de l’assuré en groupes.
Ce type de modèle est particulièrement adapté aux situations où les choix offerts à l’individu
peuvent être regroupés selon leurs ressemblances, c'est-à-dire de sorte que tous les choix d’un
même groupe partagent une qualité que l’on ne retrouve pas dans les autres groupes.
Dans la situation étudiée, on regroupe les choix de la façon suivante dans un premier temps,
l’assuré choisit de racheter ou non ; puis dans un second temps, l’assuré, s’il a décidé de
racheter, choisit si son rachat est un rachat partiel, ou total.
Cette décision ne se passe pas nécessairement en deux temps pour l’assuré, mais elle est
modélisée de cette façon.
On voit sur la figure 4.5 la représentation schématique des choix de l’assuré.
71
Fig. 4.5 : processus décision de l’assuré
Le modèle est donc un modèle logistique emboité à deux niveaux, et partiellement dégénéré.
Si le rachat est total, l’assuré retire la totalité de sa provision, et son contrat se termine. Si le
rachat est partiel seulement une partie de la provision est retirée et le contrat reste en
portefeuille.
La spécification de ce modèle, et le regroupement des choix rachat total et rachat partiel
semblent évident, il n’en va pas de même pour définir à quel niveau les variables influencent
l’assuré.
On considérera que le choix de racheter ou non de l’assuré est motivé par l’ancienneté de son
contrat, l’inspection dont il dépend, et enfin le niveau du CAC. Ces paramètres ont une
influence réelle sur le choix de l’assuré, influence qui a été vérifié dans la partie précédente.
Seul le montant de la provision mathématique influencera l’assuré dans son choix entre un
rachat partiel ou un rachat total.
L’estimation du modèle se déroule en plusieurs étapes, dans un premier temps, on estime le
modèle correspondant à la situation ou un rachat est survenu et l’assuré doit encore choisir
entre un rachat partiel ou total. A la fin de cette première étape, on a donc le coefficient .
Dans un second temps, on calcule, sur toutes les variables de l’échantillon d’estimation, la
valeur de la variable d’inclusion VI, avec
Enfin, on estime le Logit qui modélise la décision de racheter ou non tout ou partie du contrat.
72
Les probabilités des évènements étudiés s’écrivent comme :
Et de plus,
Aussi
Avec x le vecteur des variables explicatives qui interviennent au premier niveau (ancienneté,
âge, groupe de l’inspection, différence de taux avec la moyenne du marché), et les
variables explicatives qui interviennent au deuxième niveau (PM et sexe). est le
coefficient qui correspond à la variable d’inclusion.
L’estimation du modèle donne les résultats suivants, avec les variables définies
précédemment :
Coefficient
Constante 0,13
PM
Inférieure à 2000€ Référence
Entre 2000 et 25000€ -1,53
Supérieur à 25000€ -2,82
Tableau 4.3 : coefficients du Logit emboité niveau inférieur
73
Coefficient
Constante -1,80
Classement inspection élevé Référence
Classement inspection normale -0,30
Ancienneté
0 Référence
1 -0.090
2 -0.091
3 -0.15
4 -0.22
5 -0.49
6 -0.43
7 -0.65
8 0.14
9 -0.37
10 et plus -0.48
Variable d’inclusion 1 0
Variable d’inclusion 2 -0,23
Tableau 4.4 : coefficients du Logit emboité niveau supérieur
Le coefficient correspondant à la variable d’inclusion mesure le degré de corrélation des choix
d’un même groupe, plus le coefficient correspondant à cette variable d’inclusion est élevé,
moins les choix du groupe correspondant sont corrélés.
Comme la première branche est dégénérée, elle représente le choix de ne pas racheter, la
variable d’inclusion 1 est fixée à 1.
La seconde variable d’inclusion est calculée à l’aide du modèle décrivant le choix entre le
rachat partiel et le rachat total. Le coefficient estimé correspondant à cette variable
d’inclusion est de -0,23, ce qui implique qu’il y a une forte corrélation entre les choix de
racheter totalement et partiellement son contrat.
Le modèle ne peut pas être considéré comme satisfaisant : en effet, il ne semble pas que l’on
puisse trouver des variables propres à chaque choix, et le choix de la provision comme seule
variable différenciant le rachat partiel du rachat total n’est pas le meilleur possible.
74
On peut tout de même remarquer que le montant de la PM semble grandement influencer le
choix entre rachat total et partiel. Comme le montre les coefficients que l’on a estimés et que
l’on retrouve en figure 4.7.
Cette hypothèse est aussi confirmée par l’observation du montant de la PM selon si le contrat
a été racheté partiellement ou totalement au cours de l’année. On observe sur la figure 4.9 la
fonction de répartition de la PM suivant la situation du contrat.
Fig. 4.6 Fonction de répartition de la PM du contrat (en k€)
On remarque que le montant de la provision des contrats rachetés totalement est bien plus
faible que ce montant pour les contrats rachetés partiellement, à titre d’exemple, 24 % des
contrats rachetés partiellement ont une provision en début d’année inférieure à 2000 €, ce
pourcentage monte à 42 % pour les contrats rachetés totalement au cours de l’année.
Cette partie a permis de montrer que d’autres paramètres que l’ancienneté pouvaient
influencer l’assuré lors de son choix. Tels que le nombre de rachats antérieurs, le montant de
la provision mathématique, ou encore le groupe d’inspection, ces valeurs rendent compte du
comportement passé de l’assuré, de l’influence du réseau de distribution. On voit aussi que ce
portefeuille n’est pas tellement influencé par les variables conjoncturelles. On peut aussi
supposer que les effets conjoncturels aient une influence seulement sur certains contrats ceux
avec des montants de provisions élevés par exemple, et n’influence pas le comportement des
assurés détenant des petits contrats. Dans ce cas, cet effet serait plus difficilement détectable.
0%
20%
40%
60%
80%
100%
2 12 22 32
Montant de la PM (k€)
Fonction de la répartition de la PM selon la situation du contrat
75
4) Backtesting
Le premier modèle estimé, qui permet d’analyser certaines causes de rachat avait été
étalonné avec les données de 2006 à 2009.
De la même façon que pour le modèle sur les contrats de type vie entière, on peut backtester
le modèle sur l’année 2010, dont les paramètres ont été estimés à partir des années
précédentes. Afin de conforter les observations faites précédemment.
Le modèle nous permet donc d’avoir des intervalles de confiance des estimateurs des taux de
rachats à l’aide de la méthode détaillé dans la partie 4-3-a.
Fig. 4.7 prévisions du modèle
Ces intervalles de confiance sont calculés au niveau 90%. On peut voir sur le graphique 4.7
ces intervalles. L’amplitude de ces intervalles est bien plus importante que sur le portefeuille
vie entière, ou les comportements étaient bien plus prévisibles. On voit ici que les taux de
rachat pour les anciennetés 7 et 8 sont relativement élevés, au niveau supérieur de l’intervalle
de confiance à 90% des prévisions. Sur les années ayant servi à l’estimation, on observait un
0,000%
5,000%
10,000%
15,000%
20,000%
25,000%
0 1 2 3 4 5 6 7 8 9 10
Taux de rachats
ancienneté (an)
Prévisions du modèle
Borne inf IC 90% Borne sup IC 90% Taux réels
76
taux de rachat moyen de 20,2% la 8ième année de vie du contrat, alors qu’ils s’élèvent à
21,08 % sur l’an 2010.
Conclusion
Ces différents travaux effectués dans le cadre du mémoire d’actuaire avaient pour but
d’améliorer la connaissance des comportements des assurés, en analysant l’influence de
différents facteurs sur ces comportements.
L’étude de deux portefeuille, contrats vie entière et contrats d’épargne, ont permis de
dégager certaines tendances.
Tout d’abord, quel que soit le type de contrat, les comportements de rachats dépendent
fortement de l’ancienneté du contrat, qui reste le paramètre permettant d’expliquer au mieux
les choix de l’assuré. Aussi, cette étude a permis de rendre compte de l’influence non
négligeable du réseau de distribution de ces contrats. On remarque en effet que les
portefeuilles dépendant de certaines équipes subissent des rachats à une fréquence plus élevée.
Une explication possible serait qu’une équipe assurant un suivi des contrats aura plus
tendance à satisfaire ses clients et ainsi diminuer les rachats observés sur le portefeuille,
qu’une équipe qui serait orienté vers la prospection de clients.
Mais on remarque aussi que chaque portefeuille a ses caractéristiques propres.
Concernant le portefeuille vie entière, Kuo et al. [13] ont identifié le rachat de contrats comme
une source de risque pour l’assureur, car il peut être sujet au risque d’anti sélection, c'est-à-
dire que les assurés en mauvaise santé sont plus enclins à conserver leur contrat. Les
observations faites sur notre portefeuille vont dans ce sens et on peut affirmer que les
comportements de rachat détériorent effectivement la mortalité du portefeuille vie entière.
D’autres études telles que celle de Kiensenbauer [11] se concentrent sur les liens existants
entre les comportements de rachats et la situation économique. On ne retrouve pas cet aspect-
là dans l’étude des deux portefeuilles. Les comportements observés ne présentent pas de lien
avec les variables conjoncturelles classiques dans les portefeuilles étudiés.
Actuellement, dans l’entreprise, les lois de comportement sont calculées en fonction
de l’âge et de l’ancienneté des contrats. Au vu des résultats de l’étude, ces deux paramètres
77
permettent effectivement de bien capter les tendances. La précision de ces lois pourrait malgré
tout être améliorée en utilisant d’autres paramètres propres au type de contrats. Aussi, lors de
la détermination des lois de comportements, ces dernières sont déterminées à partir de
données issues de chacun des produits. Cependant, lorsque le produit ne dispose pas d’effectif
ou de l’ancienneté suffisante pour que toute la loi soit déterminée à partir de son historique
propre, l’expérience acquise sur un produit similaire du portefeuille est utilisé. Le choix du
produit qui servira donc à prolonger la loi peut être affiné si les causes de rachats sont
connues sur chaque produit.
Concernant l’influence de la situation économique, il pourrait sembler qu’il n’y a pas
eu d’influence de la conjoncture sur les comportements des assurés. La question reste posée
en cas de choc conséquent sur les marchés d’une ampleur n’ayant pas été observé
précédemment. Y a-t-il un seuil à partir duquel les comportements de assurés seraient
affectés, et de quelle manière ?
78
Bibliographie [1] AFSA ESSAFI, C., Les modèles logit polytomiques non ordonnés : théorie et
applications, Série des Documents de Travail Méthodologie Statistique N° 0301
[2] ALBIZZATI, M.O. , GEMAN, H. (1994), Interest Rate Risk Management and Valuation of the Surrender Option in Life Insurance Policies. The Journal of Risk and Insurance, N°4, 616-637.
[3] AUTORITE DE CONTROLE PRUDENTIEL (2010) Orientations Nationales
Complémentaires aux Spécifications Techniques, Solvabilité 2 – 5ème étude d’impact (QIS5).
[4] BOISSELIER, P. ,DUFOUR, D. (2003). Scoring et anticipation de défaillance des
entreprises : une approche par la régression logistique. Identification et maîtrise des risques : enjeux pour l'audit, la comptabilité et le contrôle de gestion
[5] CHERIF T. , PRAS I. (1997) Evaluation de l’option de rachat anticipé dans les
contrats d’assurance-vie. Publication pour l’Association Française de Finance (AFFI)
[6] FAUVEL S., LE PEVEDIC M. (2007), Analyse des rachats d'un portefeuille vie individuelle : Approche théorique et Application pratique disponible sur http://www.ressources-actuarielles.net/
[7] HOSMER D.,LEMESHOW S. (2000) Applied logistic regression, Second edition,
John Wiley & Sons, Inc.
[8] INSEE (2000), Présentation et mise en oeuvre de modèles de régression qualitatifs, Les modèles univariés à résidus logistiques ou normaux (LOGIT, PROBIT), disponible sur http://www.institutosondage.com.br/textos_pdf/texto_123.pdf
[9] KALTWASSER, P., LE MOINE, P. (2004), Modèles de risque et solvabilité en
assurance-vie, Commission de Contrôle des Assurances, des Mutuelles et des Institutions de Prévoyance (CCAMIP).
[10] KAGRAOKA Y. (2005), Modeling insurance surrenders by the negative binomial model, Working paper
[11] KIENSENBAUER D. (2011), Main determinants of lapse in the German life insurance industry, disponible sur http://www.uni-ulm.de/fileadmin/website_uni_ulm/mawi/forschung/PreprintServer/2011/Lapse.pdf
[12] KIM, C. 2005. Modeling Surrender and Lapse Rates with Economic Variables.
North American Actuarial Journal, 9(4):56–70.
79
[13] KUO, W., TSAI, C., and CHEN, W.-K. (2003). An Empirical Study on the Lapse Rate: The Cointegration Approach. Journal of Risk and Insurance, 70(3):489–508.
[14] MILHAUD, X., GONON, M.P., LOISEL S. (2010) Les comportements de
rachat en assurance vie en régime de croisière et en période de crise, Risques, Vol 83, 76-81
[15] MILHAUD, X., LOISEL, S., MAUME-DESCHAMPS, ( 2010). Surrender
triggers in life insurance: classification and risk predictions. Bulletin Français d'Actuariat
80
Annexes
variables nom dans le modèle logit description
groupe d'âge grp_age 0: entre 60 et 74 inclus 1 : complémentaire sexe sexe 0: Féminin 1: Masculin
nombre de souscriptions précédentes nb_scr nombre de souscription antérieures de l'assuré chez prévoir, continue
capital initial cap_init capital initial du contrat, continue
ancienneté ancien temps en année depuis la souscription
inspection groupe d.inspection normal ou élevé
Table A-1, Définition des variables explicatrices du modèle Prévoir Quiétude
81
variables modalité nombre d'occurrences
groupe d'âge 0 61% 1 39% sexe 0: Féminin 51% 1: Masculin 49% nombre de souscriptions précédentes 0 70% 1 24% 2 7% capital initial 3000-5000 59% 5000-10000 34%
10000-15000 5%
15000-32000 3%
ancieneté 0-3 33% 4-7 30% 8-11 23% 11-15 14% inspection normal 52% élevé 48%
Table A-2, Observations par attributs, Portefeuille Prévoir Quiétude
82
Fig. A-1 : Régression logistique Prévoir Quiétude, sortie R
83
Variables nom dans le modèle logit description
Provision mathématique PM 0: inférieure à 2000 €
1 : entre 2000 et 2 000 € 2 : supérieur à 25000€
nombre de rachat survenus les années précédentes rach_ant
nombre de rachat survenus les années précédentes sur le
contrat, 0 1 2 et 3 ou plus
Evolution annuelle de l’indice CAC CAC Evolution annuelle de l’indice CAC sur l’année précédente
Ancienneté ancien temps en année depuis la souscription
Inspection groupe normal ou élevé
Table A-3, Définition des variables explicatrices du modèle d’épargne
84
variables modalité nombre d'occurrences
PM 0 24 %
1 60 % 2 16 % nombre de rachat survenus les années précédentes 0 75 %
1 13 %
2 5 % 3 7 % Année étudié 2005 20 % 2006 20 % 2007 20 %
2008 20 % 2009 20 % ancienneté 0-3 32 % 4-7 20 % 8 et plus 48 % inspection normal 40 % élevé 60 %
Table A-4, Observations par attributs, Portefeuille Prévilibre
85
Fig. A-2. Régression logistique contrats d’épargne, sortie R
86
Fig. A-3 découpage en région commerciales
Fig. A-4 taux du livret A et taux de rachats (centrés réduits) sur contrats d’épargne
‐2
‐1,5
‐1
‐0,5
0
0,5
1
1,5
2
2,5
2000 2002 2004 2006 2008
tx livret A
taux