19
Détection de la défaillance des entreprises tunisiennes par la régression logistique semi paramétrique et les réseaux de neurones Abdeljelil Farhat Unité de recherche EAS-Mahdia Faculté des sciences économiques et de gestion de Mahdia, Université de Monastir, Tunisie. Sami Mestiri Unité de recherche EAS-Mahdia Faculté des sciences économiques et de gestion de Mahdia, Université de Monastir, Tunisie. Manel Hamdi Unité de recherche IFGT-Tunisia Faculté des sciences économiques et de gestion de Tunis, Université El Manar , Tunisie. Résumé : L’objectif de cet article est de comparer deux techniques de clas- sification des entreprises : la régression logistique semi paramétrique et les réseaux de neurones dans le but de prévoir le risque la défaillance des entre- prises tunisiennes. L’échantillon utilisé comporte 528 firmes tunisiennes de différents secteurs d’activités dont nous disposons des bilans et des comptes financiers des exercices 1999-2006. Une différence a été constatée entre le modèle de régression logistique et celui reposant sur un réseau de neurones artificiels en termes de performance de distinction entre les entreprises saines et les entreprises en détresse financière. En fait, nous avons démontré que les modèles basés sur les réseaux de neurones donnent des résultats des prévi- sions de la défaillance financière en terme de bon classement ainsi que par les résultats obtenus de la courbe ROC.. Mots clés : Prévision ; Risque de crédit ; Régression logistique semi paramé- trique ; Réseaux de neurones ; Courbe ROC. Abstract : The aim of this paper is to compare two different forecasting models : the semi parametric logistic model versus the neural networks in order to predict the credit risk of banks in Tunisia. The sample includes 528 Tunisian firms from different sectors of activities that we have balance sheets and income statements for fiscal years 1999-2006. There was performance 1

Détection de la défaillance des entreprises tunisiennes ...mestirisami2013.e-monsite.com/medias/files/article-2-de-detresse... · financiers des exercices ... modèle de régression

Embed Size (px)

Citation preview

Détection de la défaillance desentreprises tunisiennes par la régression

logistique semi paramétrique et lesréseaux de neurones

Abdeljelil Farhat

Unité de recherche EAS-MahdiaFaculté des sciences économiques et de gestion de Mahdia,

Université de Monastir, Tunisie.

Sami Mestiri

Unité de recherche EAS-MahdiaFaculté des sciences économiques et de gestion de Mahdia,

Université de Monastir, Tunisie. Manel Hamdi

Unité de recherche IFGT-TunisiaFaculté des sciences économiques et de gestion de Tunis,

Université El Manar , Tunisie.

Résumé : L’objectif de cet article est de comparer deux techniques de clas-sification des entreprises : la régression logistique semi paramétrique et lesréseaux de neurones dans le but de prévoir le risque la défaillance des entre-prises tunisiennes. L’échantillon utilisé comporte 528 firmes tunisiennes dedifférents secteurs d’activités dont nous disposons des bilans et des comptesfinanciers des exercices 1999-2006. Une différence a été constatée entre lemodèle de régression logistique et celui reposant sur un réseau de neuronesartificiels en termes de performance de distinction entre les entreprises saineset les entreprises en détresse financière. En fait, nous avons démontré que lesmodèles basés sur les réseaux de neurones donnent des résultats des prévi-sions de la défaillance financière en terme de bon classement ainsi que parles résultats obtenus de la courbe ROC..Mots clés : Prévision ; Risque de crédit ; Régression logistique semi paramé-trique ; Réseaux de neurones ; Courbe ROC.

Abstract : The aim of this paper is to compare two different forecastingmodels : the semi parametric logistic model versus the neural networks inorder to predict the credit risk of banks in Tunisia. The sample includes 528Tunisian firms from different sectors of activities that we have balance sheetsand income statements for fiscal years 1999-2006. There was performance

1

difference between models based on logistic regression and an artificial neuralnetwork for differentiating the financial health firm and firm default. Theresults obtained show that the use of artificial neural network improves thequality of model predictions in terms of good classification as well as by theROC curve result.Key words :Forecasting ; Logistic semi parametric model ; Neural networks ;Curve ROC.

1 IntroductionLa prévision de la détresse financière d’entreprises est une procédure très

importante pour ceux qui y sont impliqués (actionnaires, gestionnaires, sala-riés, prêteurs, fournisseurs, clients et surtout l’État). Les modèles de prévisionservent comme "système d’alerte " pour les gestionnaires d’entreprises quipeuvent entreprendre des actions de prévention contre le risque de faillite(par exemple, opération de rachat, de liquidation, de redressement, etc.).D’autre part, ces modèles peuvent aussi être utiles pour les professionnelsdes établissements financiers dans l’évaluation et la sélection des entreprisesauxquelles ils prêtent des crédits. En partant de ces considérations et devantl’ampleur du phénomène, diverses études et recherches ont été menées dansce sens durant ces trente dernières années. Elles visaient à mettre en évi-dence les principaux indicateurs permettant de prévoir à temps les difficultéséprouvées par les entreprises. Nous pouvons citer parmi les premiers travaux,à titre d’exemple, ceux de Beaver (1966) et Altman(1968).

Depuis cette période et jusqu’à nos jours, le nombre d’études sur l’éva-luation des risques de faillite et la prévision de la détresse financière desentreprises ne cesse d’accroître. Il suffit de citer Bardos et Zhu (1997), Chavaet Jarrow (2004) et Hillegeist (2004). La grande majorité de ces recherchess’appuie sur des outils d’analyse statistique de grandeurs comptables et deratios financiers pour discriminer les entreprises saines des entreprises dé-faillantes. Ces études ont abouti à une fonction de score qui est un indicateurde synthèse censé de donner en un chiffre, le degré de défaillance possibled’une entreprise.

Dans une étude relative à des entreprises américaines, Press et Wilson(1978) ont utilisé des données en coupe transversale des ratios financierspour déterminer les ratios les plus déterminants de la faillite des entreprisesà partir du modèle de la régression logistique. Une caractéristique importantede ce modèle est que la moyenne conditionnelle de la variable expliquée est

2

liée paramétriquement aux variables explicatives.

Cependant, la considération que la forme fonctionnelle entre les variablesest linéaire n’est pas souvent appropriée surtout lorsque le phénomène étu-dié est compliqué. Pour contourner cette lacune, Zhang et Lin (2003) ontproposé une modélisation plus flexible des variables explicatives ou le pré-dicteur linéaire dans le modèle de régression est remplacé par des fonctionsnon paramétriques. Le nouveau modèle est nommé par "Modèle de régres-sion logistique semi paramétrique". L’intérêt principal de ce modèle est qu’ilpermet de distinguer les relations linéaires et non linéaires au sein d’un mêmemodèle.

D’un autre côte, pour améliorer la prise de décision du banquier, Tam etKiang (1992) et Altman (1994) ont intégré les progrès enregistrés en matièred’intelligence artificielles pour la construction des modèles de prévision de ladétresse financière des firmes. Des autres chercheurs ont proposé l’emploi demodèles basés sur les réseaux de neurones, on cite à titre d’exemple (Perez,2006 ; Chih-Fong et Jhen-Wei, 2008 ;Tilmont, 1998 ; Bardos et Zhu, 1997).Les modèles développés sont non linéaires et non paramétriques et tiennentcompte des avancées effectuées en matière de reproduction artificielle desréseaux de neurones et de génétique.

Ce papier s’intègre dans le cadre de comparaison deux techniques de clas-sification des entreprises : la régression logistique semi paramétrique et lesréseaux de neurones, en utilisant un processus de validation. Ce processussert à estimer les performances du modèle qui vient d’être construit sur unjeu de données. Notre démarche empirique se base sur le calcul des taux demauvaise classement et élaboration de la courbe de ROC pour chacun dumodèle de score construits.

L’article est organisé comme suit : Dans la section 1, nous présenteronsla structure des données de notre étude. Dans la section 2, la régression lo-gistique semi paramétrique sera appliquer pour la prévision de la détressefinancière. La troisième section sera réserver à la présentation et à l’appli-cation de la technique des réseaux de neurones artificiels. Dans la section4, nous étudierons la validation des fonctions de scores établies. Ce papiers’achèvera par l’analyse de quelques conclusions et commentaires.

3

2 La structure des données

2.1 L’échantillon

La source d’information qui a été utilisée pour cette étude est la Banquecentrale de Tunis. Une série de données financières a été collectée à partirdes documents de synthèse (bilans et comptes de résultats) sur la période(1999-2006). Notre base de données est constituée d’un échantillon de 528entreprises appartenant à différents secteurs d’activité.

2.2 Les variables explicatives

Les ratios financiers sont des variables les plus souvent utilisées dansle modèle de prévision du risque. Comme il existe des dizaines de ratios,le choix de ces variables indépendantes est un problème fondamental dansl’élaboration d’un modèle de prédiction de défaillance.

Dans notre application, nous avons choisi de retenir des ratios liés auxdifférentes dimensions de l’analyse financière et qui représentent les différentscritères d’appréciation de la bonne santé d’une entreprise. Les thèmes sont lastructure financière, rotation, rentabilité, charges financières, la solvabilitéet la liquidité. Les variables explicatives de l’étude sont récapitulées dans letableau de l’annexe 1. La batterie des variables de l’étude comporte 26 ratios.

2.3 La variable expliquée

Le critère de classification retenu pour la détermination de la variableexpliquée a priori est l’état juridique de l’entreprise. Ce critère est jugé bon dufait qu’il reflète la solvabilité des entreprises. La structure de cet échantillonest décrite sous deux classes juridiques : saines ou défectueuses. La variableexpliquée Y peut être écrite par des valeurs binaires :

Y =

{1 pour les entreprises en détresse

0 pour les entreprises saines (1)

En adoptant ces critères de classement, nous avons pu décomposer a prioril’échantillon en deux sous-groupes. Le premier groupe est composé par 448entreprises saines et le second groupe est composé par 80 entreprises en si-tuation de détresse.

4

3 L’analyse par le modèle de régression logis-tique semi paramétrique

3.1 Présentation générale du modèle

D’après la figure (1), Les nuages des points les données des ratios enfonction des rapports de chances correspondants (figure 1) montre que lesvariables R7, R9, R10, R20, R23 ont une liaison linéaire avec leurs rapports dechances tandis que les données de la variable R21 a une relation non linéaire.Sur la base de ces constats tirées a partir de la figure 1, il est intéressant deconsidérer une modification de la variable R21 dans le modèle de régression.Ainsi, le modèle de régression logistique semi paramétrique s’écrit sous laforme suivante :

log

(pi

1− pi

)= β1R7,i + β3R9,i + β4R10,i + β4R14,i

+β5R15,i + β6R20,i + f(R21,i) (2)

Avec pi = P (yi = 1|Ri), pour(i = 1, ..., n) est la probabilité a poste-riori d’appartenance au groupe d’entreprises en détresse, β est un coefficientinconnu et f est une fonction de lissage inconnue.

3.2 Présentation économétrique du modèle

D’après les nuages des points de la variable R21, il semble que la relationentre cette variable et les rapports de chances prend une forme quadratique.Par conséquent, nous proposons d’approximer la fonction de lissage f pardes bases de fonctions puissances tronquées du seconde degré :

f(R21,i) = δ0 + δ1R21,i + δ2R221,i +

K∑k=1

bk(R21,i − κk)2+ (3)

où κ1, ..., κK est un ensemble de noeuds distincts tirés des observations dela variable R21 et X+ = max(0; X). Le nombre de noeuds K est assez grand(d’ordre K ≥ 30) pour assurer l’exigibilité de la courbe.

5

En suivant l’approche de Wand et Ngo (2004), le modèle de régressionlogistique semi paramétrique s’écrit sous la forme du modèle de régressionlogistique à effets aléatoires. En effet, en remplaçant l’équation (2) dans (3),on obtient le modèle suivant :

log

(pi

1− pi

)= δ0 + δ1R21,i + δ2(R21,i)

2 + β1R7,i + β3R9,i

+β4R14,i + β5R20,i +K∑

k=1

bk(R21,i − κk)+ (4)

Pour écrire le modèle (4) sous la forme matricielle, nous désignons par :

a)X =

1 R21,1 (R21,1)2 .. R20,1

: : : :1 R21,n (R21,n)2 .. R20,n

est une matrice composée par les

variables explicatives,

b) Z =

(R21 − κ1)+ ... (R21 − κK)+

: :(R2n − κ1)+ ... (R2n − κK)+

est une matrice (n,K) com-

posée par les bases,c) β = (δ0, δ1, δ2, β1, β3, β4, β5)

′est un vecteur des paramètres inconnus,

d) b = (b1, ..., bK)′

est un vecteur composé par les coefficient associés à lamatrice Z etf) P = (P (y1 = 1), ..., P (yn = 1))

′est le vecteur des probabilités a posteriori.

Le modèle (4) admet une représentation matricielle sous la forme sui-vante :

log

(P

1− P

)= Xβ + Zb (5)

En supposant que le vecteur des effets aléatoires b normalement distribuésN(0, Gθ), l’estimation du modèle de régression logistique semi paramétrique(5) revient à estimer le modèle de régression logistique à effets aléatoires .

L’estimation des paramètres β et θ peut être réalisé par la méthode deQuasi-Vraisemblance Pénalisée (PQL) développée par Breslow et Clayton

6

(1993). L’application de la méthode PQL consiste à définir le vecteur fonc-tionnel par Y ∗ = Xβ + Zb + ∆(Y −P ) avec ∆ = diag{pi(1− pi)} et aussi lamatrice fonctionnelle de poids par Σ = W−1 + ZGθZ

′, avec W = diag{pi}.

3.3 Les résultats d’estimation du modèle

La table (1) rapporte les résultats d’estimation du modèle (5) pour lesdonnées de notre échantillon.

Les ratios Valeurs estimés Pouv. discrim. t value p value(cst) -2.0467 -18.687 0.0000

R7 : Rotation de l’actif 0.2795 0.0017 3.846 0.0001R9 : Rentabilité économique 9.8834 0.5277 8.164 0.0000

R10 : Rentabilité des capitaux -12.4510 0.4674 -8.210 0.0000R14 : Taux de rentabilité des capitaux 0.03277 0.0000 1.742 0.0815

R15 : Rotation des capitaux -0.19147 0.0000 -4.691 0.0000R23 :Ratio de charges financières -0.83057 0.0031 -2.538 0.0112

Tab. 1 – les estimateurs du modèle de régression logistique semi paramétrique

Le pouvoir discriminant du ratio Rk est défini par le rapport : σ2kα2

k∑σ2

kα2k

avecσk est l’écart type du ratio Rk. Il exprime l’influence du ratio dans la fonctionde score. D’après la table (1), les ratios R9 et R10 jouent un rôle capital dansla formation de la fonction de score des entreprises puisque ces ratios ont unpouvoir discriminant de l’ordre de 99%. D’après la table (1), nous remarquonsque l’effet estimé de la variable R9 (la rentabilité économique) a un signepositif. Cela signifie que l’augmentation des frais financiers fait diminuer larentabilité économique ce qui explique l’accroissement de la probabilité d’êtreen détresse. Par contre la variable R10 (la rentabilité des capitaux investis)présente un signe négatif ce qui induit que l’augmentation des résultats netimplique une augmentation de risque de défaillance.

La fonction de lissage dans le modèle de régression logistique semipara-métrique (2) permet de détecter un effet de seuil de ratios sur la probabilitéd’etre en détresse. Aprés l’estimation des composantes du modèle par la mé-thode PQL nous avons obtenu la courbe de la fonction f(R21) estimée de lavariable capacité d’endettement à long terme avec son intervalle de confianceà 95%. D’après ce graphe (2), pour un seuil inférieur à 1, la probabilité de

7

détresse est une fonction décroissante de la capacité d’endettement à longterme et pour un seuil supérieur à 1, elle devient croissante.

4 Les réseaux de neuronesDans le paragraphe précédent, nous avons vu que l’analyse par le modèle

de régression logistique semi paramétrique est une procédure économétriquecaractérisés par deux étapes (la création d’un modèle suivie par l’estimationde ses paramètres).Cependant, les réseaux de neurones appartiennent a unecatégorie différente d’outils d’analyse des données. Comme leur nom le sug-gère, les réseaux de neurones ont eu comme point de départ les connaissancesbiologiques et plus précisément neuro-physiologiques à propos du cerveau hu-main.

4.1 Présentation générale du réseaux de neurones

Le développement de la technique des réseaux de neurones artificiels dé-coule d’une imitation de certains mécanismes du cerveau humain. Un ré-seau de neurone est un ensemble d’unités interconnectées qui disposent d’unegrande capacité d’apprentissage et de traitement de l’information. Il s’agiten fait d’un algorithme mathématique qui permet de traiter parfaitement lesconnaissances relatives à la relation entre les valeurs d’entrées et de sorties,afin de classer correctement les situations.

Un réseau de neurones est généralement formé d’une couche d’entrée re-présentant les neurones d’entrées (variables d’input), d’une couche de sortiereprésentent le vecteur des variables d’outputs permettant de transférer lesinformations en dehors du réseau, et d’une ou de plusieurs couches cachéesprésentant l’ensemble des noeuds cachés ayant des connexions entrantes quiproviennent des neurones d’entrée.

Ces unités n’ont pas d’interaction directe avec l’environnement. Elles per-mettent au réseau d’apprendre des tâches complexes en exploitant, progressi-vement, les caractéristiques les plus significatives des neurones d’entrées. Unpoids est attribué à chaque connexion du réseau, et l’ensemble correspondau schéma de pondérations de la figure

Le recours aux réseaux de neurones artificiels a débuté avec le travailpionnier de McCulloch et Pitts (1943) lors de la mise au point de l’algorithmede rétropropagation des erreurs, qui a fait naître l’espoir de pouvoir tirer

8

partie des phénomènes présents pour la prévision des phénomènes futurs.Cet algorithme, développé par la suite par Rumelhart, Hinton et Williams(1985), comprend deux phases : une phase de forward propagation et unephase de backward propagation. La procédure de calibration du réseau deneurones est une méthode de calcul de poids optimaux. L’algorithme le plusutilise dans ce but est l’algorithme de rétropropagation,( Backpropagation),qui peut être utilisé pour l’apprentissage surveillé.

Dans la propagation forward, chaque neurone de la couche d’entrée reçoitun signal externe, le traite et l’émet aux neurones de la couche cachée. A ceniveau l’entrée globale, que reçoit chaque neurone caché, est donnée par lasomme pondérée de tous les entrées.

aj =N∑

i=0

w(1)ij xi (6)

Ou xi est le neurone de rang i de la couche d’entrée, qui en contient N .wij est la pondération du signal émis par le neurone xi, de la couche d’entrée,vers le neurone hj de la couche cachée.aj est le signal total reçu par le neurone hjde la couche cachée, qui en contientm.

Les neurones de cette dernière couche, agrègent les signaux émis par lacouche d’entrée, sur la base de la fonction d’activation et gênèrent des si-gnaux de sortie. La fonction d’activation calcule la transformation de l’étatd’activation à l’instant k + 1 à partir de l’état d’activation à l’instant k.

hj = g1(aj) (7)

Ces signaux seront transférés, après traitement, à la couche suivante qui subitles mêmes transformations pour obtenir enfin la sortie calculée par le réseau :

ak =m∑

j=0

w(2)kj hj (8)

La fonction de sortie calcule la valeur de sortie d’un neurone en fonction deson état d’activation.

yk = g2

[m∑

j=0

w(2)kj g1

(N∑

i=0

w(1)ij xi

)](9)

9

Le choix de la fonction d’activation dépend du type de l’application.Dans certaines applications, on utilise souvent des sigmoïdes comme fonc-tions d’activation. Dans d’autres exemples on utilise la fonction logit ou latangente hyperbolique. Un réseau de neurones artificiels composé de couchessuccessives et avec des fonctions d’activation sigmoïdales s’appelle perceptronmulti-couche (Multilayer-Perzeptron - MLP).

4.2 Procédure d’apprentissage : l’algorithme de rétro-propagation

La seconde phase "Backward" détermine la direction et le degré d’ajuste-ment aux pondérations de connexions individuelles. Le processus d’appren-tissage peut être considéré comme un problème de minimisation avec unefonction objectif E définie dans l’espace de pondérations W.

L’apprentissage surveillé est un apprentissage par correction des erreurs.Ainsi, il faut d’abord définir une fonction d’erreur. Cette fonction pourraitêtre par exemple l’erreur moyenne quadratique :

E (w) =1

N

N∑i=1

m∑j=1

(yi,j − y∗i,j)2 (10)

Ou N représente le nombre de couples (xi, yi) utilisés pour l’apprentissage,m est le nombre de neurones dans la couche de sortie et y∗i est la réponse duréseau pour l’entrée xi.

L’algorithme de rétropropagation peut être appliqué pour n’import queltype de fonction d’erreur. La fonction d’erreur dépend de tous le poids duréseau et doit être minimisée. A cause de la non-linéarité du réseau on nepeut pas trouver un minimum global par une méthode analytique. C’est pourcette raison qu’on cherche un minimum local par une méthode itérative parune descente de gradient recursive.

L’algorithme d’optimisation le plus utilisé est celui de rétropropagationdu gradient basé sur l’idée suivante : en tout point w, le vecteur gradientde E (w) pointe dans la direction de l’erreur croissante. Pour faire décroîtreE (w) il suffit donc de se déplacer en sens contraire. Il s’agit d’un algorithmeitératif modifiant les poids de chaque neurone selon :

10

wij(t) = wij(t− 1) + ∆wij(t) (11)

Les ajustements des poids sont déterminés dans le chemin de propagationà chaque niveau et ce en évaluant les dérivées partielles de cette fonction Epar rapport aux poids synaptiques. L’ajustement du poids de chaque peutêtre calculé comme suit :

∆wij (t) = − ∆E

∆wij

ε (12)

Ou ε est le taux d’apprentissage.Après l’interaction de large nombre de cycles, l’erreur est réduite au ni-

veau acceptable, et le processus s’arrête.

Le réseau de l’étude a été entraîné sur tout l’ensemble d’apprentissagecorrespondant aux 8 ratios calculés. Pour chaque configuration à tester, leréseau de neurones essaie de déterminer l’ensemble des pondérations opti-males des inputs.

5 La validation des fonctions de score de la dé-tresse

Après avoir déterminé des fonctions de score de la détresse, il faut en éva-luer leurs efficacités. Nous pouvons le faire par les tests du pouvoir discrimi-nant et les tests du pouvoir prédictif. Ainsi, nous allons calculer le taux d’er-reur de classement et tracer la courbe de ROC "Receiver Operating Curve"en calculant les indices associés tels que l’aire sous la courbe de ROC.

Étant donné que les modèles de réseaux de neurones se construisent parapprentissage à partir d’un certain nombre d’observations. Tout au long decette application, nous avons utilisé uniquement 80% des observations pourla Formation (Apprentissage) et le 20% restant pour le Test afin de tester lacapacité prédictive réelle du réseau.

Pour évaluer la capacité à bien classer le modèle, nous pourrons construireune colonne prédiction Y . Étant choisi 0,5 le seuil de coupure (césure de

11

classement), chaque firme est classée saine si sa probabilité de défaut estinférieur à 0,5 et vulnérable sinon. Il est plus judicieux de construire ce quel’on appelle une matrice de confusion (la table 2). Elle confronte toujours lesvaleurs observées de la variable dépendante avec celles qui sont prédites, puiscomptabilise les bonnes et les mauvaises prédictions. L’intérêt de la matricede confusion est qu’elle permet à la fois d’appréhender le taux d’erreur et dese rendre compte de la structure de l’erreur (la manière de se tromper dumodèle).

Y = 1 Y = 0 TotalY = 1 n11 n10 n1

Y = 0 n01 n00 n0

Tab. 2 – Matrice de confusion

Nous rappelons que le taux d’erreur de classement est égal au nombre demauvais classement rapporté à l’effectif total.

La table 3 présente les taux d’erreur de classement. Le taux d’erreur declassement égale à 14% pour le modèle de la régression logistique semi para-métrique et 12.8% pour les réseaux des neurones c.à.d une amélioration deprédiction de 1.2%. Ce qui prouve que la technique des réseaux des neuronesest une méthode plus efficace pour calculer de risque de la détresse.

De même dans le but de comparer le modèle de la régression logis-tique semi paramétrique et les réseaux des neurones, nous présentons lacourbe ROC de chaque modèle. Ce courbe est un outil graphique qui per-met d’évaluer et de comparer globalement le comportement des fonctions descores (Pepe(2000). La courbe ROC met en relation le taux de vrais positifs(TV P = n11/n1) (la sensibilité) qui indique la capacité du modèle à retrou-ver les positifs et le taux de faux positifs (TFP = n10/n0) qui correspondà la proportion de négatifs qui ont été classés positifs, dans un graphiquede nuage de points. Habituellement, nous comparons p à un seuil s = 0.5pour effectuer une prédiction Y . Nous pouvons ainsi construire la matrice de

Le réseaux de neurones La régre. logistique semiY = 1 Y = 0 Total Y = 1 Y = 0 Total

Y = 1 24 14 38 6 3 9Y = 0 65 510 575 83 521 604

Le taux d’erreur 0.128 0.140

Tab. 3 – Matrice de confusion des modèles estimés pour l’échantillon test

12

confusion et en extraire les 2 indicateurs précités. La courbe ROC généralisecette idée en faisant varier s pour toutes les valeurs possibles entre 0 et 1.Pour chaque configuration, nous construisons la matrice de confusion et nouscalculons le TVP et le TFP.

Dans la pratique, il n’est pas nécessaire de construire explicitement lamatrice de confusion, nous procédons de la manière suivante :

1. Calculer le score p de chaque individu à l’aide du modèle de prédiction.2. Trier le fichier selon un score décroissant.3. Considérons qu’il n’y a pas d’ex-aequo. Chaque valeur du score peut êtrepotentiellement un seuil s. Pour toutes les observations dont le score estsupérieur ou égal à s, les individus dans la partie haute du tableau, nouspouvons comptabiliser le nombre de positifs n11(s) et le nombre de négatifsn10(s). Nous en déduisons (TV P = n11(s)/n1) et (TFP = n10(s)/n0).4. La courbe ROC correspond au graphique nuage de points qui relie lescouples (TVP, TFP). Le premier point est forcément (0,0), le dernier est(1,1). La procédure de calcul du nuages des points de la courbe ROC a étéeffectué en utilisant le logiciel R.

D’après la courbe ROC,(la figure (4)), il est évident que la règle de classi-fication basée sur les réseaux de neurones est plus performante que celle baséesur la régression logistique semi paramétrique. Ceci nous amène à conclureque la validité de la fonction de score issue du modèle de réseaux de neuronesest meilleure que celle obtenue à partir du modèle de régression logistiquesemi paramétrique.

Il est possible de caractériser numériquement la courbe ROC en calculantla surface située sous la courbe. C’est le critère d’aire sous la courbe (AUC,pour Area Under Curve). Elle exprime la probabilité de placer un individupositif devant un négatif. Ainsi, dans le cas d’une discrimination parfaiteAUC = 1, les positifs sont sûrs d’être placés devant les négatifs. Au contraire,si AUC = 0.5 le classificateur attribue des scores au hasard, il y a autant dechances de placer un positif devant un négatif que l’inverse. La courbe ROCse confond avec la première bissectrice. C’est la situation de référence, notreclassificateur doit faire mieux.

L’aire sous la courbe ROC mesure la qualité de discrimination du modèleet traduit la probabilité qu’une entreprise saine ait un score supérieur au

13

score d’une entreprise en détresse, ceux-ci étant tirés au hasard. L’aire sousla courbe ROC du modèle de régression logistique semi paramétrique estégale à 0.61 par contre l’aire sous la courbe ROC de réseaux de neurones estégale à 0.709 ; ces deux valeurs sont très proches de un.

6 ConclusionsLa gestion de risque de crédit présente un intérêt primordial pour tous

les organismes et institutions financières. Ainsi, la nécessité de prédiction derisque devient un enjeu important. Dans ce contexte plusieurs chercheurs ontdéveloppé des outils statistiques dans le but de prévoir la détresse financièredes entreprises.

Dans ce papier, nous avons réalisé une recherche exploratoire des nou-velles relations fonctionnelles entre les ratios et la probabilité de la détresse.Ces relations fonctionnelles ont été estimées à travers le modèle de régres-sion logistique semi paramétrique. D’un autre coté, nous avons appliqué latechnique des réseaux de neurones artificiels à la prévision de la détressefinancière des firmes tunisiennes.

Une fois le modèle de score est élaboré, nous avons montré que la méthodede prévision basée sur le réseau des neurones admet un pouvoir discriminantet prédictif plus que la méthode basée sur le modèle de régression logistiquesemiparamétrique en utilisant un processus de validation.

En conclusion, dans ce papier nous avons de montrer que les réseaux deneurones artificiels est un outil de prévision puissant en matière de détressefinancière des firmes. D’autre part nous avons attirer l’attention sur l’aspectnon linéaire des relations entre les ratios et la probabilité de la détresse.

14

Bibliographie[1] Altman, E. I. (1968). Financial ratios, discriminant analysis and the pre-diction of corporate bankruptcy. The Journal of Finance, 23(4) :589-609.[2] Altman E.I, Marco G. and Varetto F. (1994), Corporate distress diagno-sis : comparisons using linear discriminant analysis and neural networks : theItalian experience, Journal of banking and finance, vol. 18 n 3, pp. 505-529.[3] Bardos, M. and Zhu, W. H. (1997). Comparaison de l’analyse discri-minante linéaire et des réseaux de neurones. application à la détection dedéfaillance d’entreprises. Revue Statistique Appliquée.[4] Beaver, W. H. (1966). Financial ratios as predictors of failure. Journal ofAccounting Research, 4 :71-111.[5] Breslow, N. and Clayton, D. G. (1993). Approximate Inference in Genera-lized Linear Mixed Models. Journal of the American Statistical Association88 :9 - 25.[6] Chava, S. and Jarrow, R. A. (2004). Bankruptcy Prediction with IndustryEffects. Review of Finance, 8(4) :537-569.[7] Tam K.Y.et Kiang M.Y. (1992), Managerial application of neural net-works : the case of bank failure predictions, Management science, vol.38 n 7,pp.926-947.[8] Ngo, L. and Wand, M. (2003). Smoothing with mixed model software.Journal of Statistical Software, 4(1) :1-54.[9] Pepe, M. S. (2000). Receiver operating characteristic methodology. Jour-nal of the American Statistical Association, 95(449) :308-311.[10] Press, S. J. and Wilson, S. (1978). Choosing between logistic regressionand discriminant analysis. Journal of the American Statistical Association,73(364) :699-705.[11] S. Hillegeist, E. Keating, D. C. and Lundstedt, K. (2004). Assessing theprobability of bankruptcy. Review of Accounting Studies, 9 :5-34.[12] Zhang, D. and Lin, X. (2003). Hypothesis testing in semi parametricadditive mixed models.Biostat, 4(1) :57-74.

15

1.pdf

0 500 1000 1500 2000

−6

−2

02

4

datapq$R15

logi

t

0e+00 1e+06 2e+06 3e+06

−6

−2

02

4

datapq$R20

logi

t

−60 −40 −20 0 20

−6

−2

02

4

datapq$R21

logi

t

0 1000 2000 3000 4000

−6

−2

02

4

datapq$R23

logi

t

Fig. 1 – Les nuages des points des variables explicatives et de leurs logits

16

2.pdf

−1.0 −0.5 0.0 0.5 1.0 1.5 2.0

−5

05

1015

X2

s(X

2,2)

Fig. 2 – La courbe de la fonction estiméef(R21)

17

3.pdf

−1.9

8263

−0.2

4546

sect

1.39616

0.41

784

R23

0.858330.10

275

R21

0.06347

−8.4

9821

R20

0.12845

−0.00108

R15

0.09071

0.02057R14

−62.07954

−31.43555R10

56.70602

22.60393

R9

−0.583610.91872

R7

−0.34755

0.43627

y

−2.1198

1.90433

1

0.10021

1

Error: 145.755384 Steps: 5479

Fig. 3 – Les estimations des réseaux de neurones

18

4.pdf

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

1−spécificité

sens

ibili

La courbe ROC de semi param. (AUC=0.684)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

1−spécificité

sens

ibili

La courbe ROC des réseaux (AUC=0.709)

Fig. 4 – Les courbes ROC des modèles établis

19