Download pdf - Modelagem de Risco de Crédito · (PD, EAD, LGD) Acompanhar a performance dos modelos Sugerir ações que mantenham o risco dentro dos limites ... 390 426 441 454 467 480 493 506

Modelagem de Risco de Crédito

Douglas Beserra Pinheiro

23/02/2017

Agenda

Papel da Área de Risco de Crédito

Exemplo de desenvolvimento de um modelo de previsão de inadimplência

Perfil dos profissionais da área

Referências

Papel da Área de Risco de Crédito

Modelagem de Risco de Crédito◦ Estimar os parâmetros de risco que compõem a perda esperada

(PD, EAD, LGD)

◦ Acompanhar a performance dos modelos

◦ Sugerir ações que mantenham o risco dentro dos limites

definidos pela instituição

Políticas de Crédito◦ Determina os limites de exposição nos diferentes produtos e

acompanha tanto a inadimplência como a rentabilidade dos

mesmos.

Modelo de PD

O objetivo do modelo de PD (Probability of Default) é o de estimar a probabilidade de um cliente não pagar a dívida, ou seja, inadimplir.

O modelo pode ser apresentado na forma de classificação de risco (rating) ou pontuação (score).

As metodologias são classificadas em:

Massificado

Julgamental

Base de Dados - Períodos

Definição de Performance

Análise Descritiva

Segmentação

Amostras de Desenvolvimento e Validação

Tratamento das Variáveis

Estimação dos Modelos

Verificação da Qualidade dos Modelos

Resultados Finais

Aplicação dos Modelos

Modelo de PDModelo de Concessão de Cartão de Crédito PF

Modelo de PD

Mês 0

com base em informações do

perfil do cliente na contratação,

informações de

utilização após a

contratação do

produto para

classificar o cliente em

BOM ou RUIM

informações

cadastrais e de

restrições na data da

contratação do

produto para

caracterizar o PERFIL

DO CLIENTE

Mês 12

prever o

comportamento futuro

utilizando o Escore

Base de Dados-Períodos

Modelos Concessão vs Manutenção

Modelo de PD Definição de Performance

Exclusões◦ Cartão Fraudado, Roubado/Perdido, Não ativado, Desistente.

Ruins◦ Cartão com mais de 90 dias de atraso.

Indeterminados◦ Cartão com atraso entre 31 e 90 dias.

Experiência Insuficiente◦ Menos de 6 meses de ativação na janela, inativo posteriormente.

Bons◦ Cartão sem atraso acima de 31 dias.

Modelo de PD Análise Descritiva

Número de Dependen tes Ru ins Bons %B ons /% Ru ins

0 3818 3576 0 ,94

1 272 184 0 ,68

2 300 212 0 ,71

3 106 72 0 ,68

4 17 11 0 ,65

5 4 0 0 ,00

miss ing 483 945 1 ,96

Total 5000 5000

Núm e ro de De pende ntes Ruins Bons %Bons /% Ruins

0 3818 3576 0,94

ma ior 1 699 479 0,69

m iss ing 483 945 1,96

Tot al 5000 5000

Nú mero de D epend en te s Ruin s Bon s % Bon s/% Ruin s

0 413 9 378 7 0 ,9 1

1 27 9 20 4 0 ,7 3

2 7 0 4 6 0 ,6 6

3 2 5 1 6 0 ,6 4

4 2 2 1 ,0 0

5 2 0 0 ,0 0

Miss in g 48 3 94 5 1 ,9 6

Total 500 0 500 0

Nú m ero de D epend en te s Ruin s Bon s % Bon s/% Ruin s

0 413 9 378 7 0 ,9 1

m aior 1 37 8 26 8 0 ,7 1

M iss in g 48 3 94 5 1 ,9 6

Total 500 0 500 0

Balanceamento da amostra

Análise de observações sem informação (missing)

Quantidade de Dependentes Menores

Quantidade de Dependentes Maiores

Modelo de PD Segmentação

SEGMENTAÇÃO

Técnicas: CHAID, Árvore de decisão

Modelo de PD Segmentação

Exemplo de Variáveis Candidatas

Número de

DependentesPorcentagem

Nenhum 20,3

Um ou mais 5,1

Missing 74,7

Estado Civil Porcentagem

Casado 34,2

Outros 28,5

Missing 37,2

Escolaridade Porcentagem

1º grau

(incompleto/completo)20,1

2º grau, superior ou pós

(incompleto/completo)37,8

Missing 42,1

Telefone próprio Porcentagem

Não 6,7

Sim 14,1

Missing 79,2

Residência própria Porcentagem

Não 10,2

Sim 15,2

Missing 74,6

Segmentação de Variáveis vs Modelo

Ex. Região Geográfica, Produto por Faixa de Renda

Modelo de PD População Total

Amostra de

Exploraçãopara definição da

performance e

segmentação

Amostra de

Desenvolvimentopara construção do modelo

50% de

Ruins

50 % de

Bons Amostra de

Validaçãopara validação

dos passos de

desenvolvimento

do modelo

Tempo ou

aleatória

Amostra de Desenvolvimento e Validação

Modelo de PD Tratamento das variáveis

Tratamento das Variáveis

Categorização Estabilidade

Conceitos Dummy

Dummy: Variáveis binárias (categóricas), eficientes nos casos de falta de preenchimento, outliers, não linearidade com a resposta


Idade Bons Ruins % Bons(a)

% Ruins(b)

% Bons/%Ruins (c)

WoE(d)=ln (c)

IV(a-b)*d

0-22 124 272 2% 5% 0,46 -0,786 0,023

23-26 161 249 3% 5% 0,65 -0,436 0,008

27-31 248 339 5% 7% 0,73 -0,313 0,006

32-33 350 374 7% 7% 0,94 -0,066 0,000

34-38 384 382 8% 8% 1,01 0,005 0,000

39-41 428 447 9% 9% 0,96 -0,043 0,000

42-46 647 593 13% 12% 1,09 0,087 0,001

47-52 752 717 15% 14% 1,05 0,048 0,000

53-60 862 671 17% 13% 1,28 0,250 0,010

>60 1044 956 21% 19% 1,09 0,088 0,002

Total 5000 5000 100% 100% 0,049

Information Value : Medida usada pela Fair Isaac (FICO) para determinar a importância

da variável. Quanto maior o Information Value, maior é o poder de discriminação e a

importância da variável para o modelo.

Ele também dá um indicativo da segmentação ótima da variável.


IDADE BONS %B RUINS %R%B - %R

(a)

%B / %R

(b)

log(b)

(c)(a) * (c)

Até 35 anos 2.000 40% 2.000 40% 0,00 1,00 0,00 0,00

35 anos ou mais 3.000 60% 3.000 60% 0,00 1,00 0,00 0,00

Total 5.000 100% 5.000 100%

Information Value:

0,00 + 0,00 = 0,00


(a)

%B / %R

(b)

log(b)

(c)(a) * (c)

Até 35 anos 2.000 40% 3.000 60% -0,20 0,67 -0,41 0,08

35 anos ou mais 3.000 60% 2.000 40% 0,20 1,50 0,41 0,08

Total 5.000 100% 5.000 100%

Information Value:

0,08 + 0,08 = 0,16


(a)

%B / %R

(b)

log(b)

(c)(a) * (c)

Até 35 anos 2.000 40% 4.000 80% -0,40 0,50 -0,69 0,28

35 anos ou mais 3.000 60% 1.000 20% 0,40 3,00 1,10 0,44

Total 5.000 100% 5.000 100%

Information Value:

0,28 + 0,44 = 0,72

Po

der d

e D

iscrim

inação

-

+


Idade

21

22

23

.

.

.

84

85

86

.

.

.

Idade (Categorizada)

Categ1 - 21 a 25

Categ2 - 26 a 30

Categ3 - 31 a 35

.

.

.

Categ n - 61 a 65

Categ n+1 - 66 a 70

Categ n+2 - 70 a 75

.

.

.

Idade (Dummy)

Dummy1 = 1 se idade está em (21 a 25)

Dummy1 = 0 Caso Contrário

Dummy2 = 1 se idade está em (26 a 30)

Dummy2 = 0 Caso Contrário

.

.

.

Dummy n = 1 se idade está em (61 a 65)

Dummy n = 0 Caso Contrário

.

.

.

Exemplo de construção de variáveis binárias.

Modelo de PD Estimação dos modelos

Todas as variáveis

disponíveis para o

estudo que não foram

excluídas na análise

descritiva

Variáveis Estáveis e com

Alto Poder Preditivo

(escolhidas a priori)

Variáveis Selecionadas

via procedimento

estatístico (Stepwise)

Variáveis Não

Selecionadas via

procedimento estatístico

M

o

d

e

l

o

F

i

n

a

l

Técnicas estatísticasRegressão Logística, árvore de decisão, redes neurais, etc.

Modelo de PD

No exemplo:

Média Bons = 635

Variância Bons =

2885

e

Média Ruins = 530

Variância Ruins =

3530

Portanto,

IV = 3,44

Verificação da qualidade dos modelos

Modelo de PD Verificação da qualidade dos modelos

O valor do K-S é obtido a partir da distância

máxima entre as curvas dos Clientes Bons e

dos Clientes Ruins

Gráfico da Distribuição Acumulada de Bons e Ruins

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

390426

441454

467480

493506

519532

545558

571584

597610

623636

649662

675688

%Bons %Ruins

K-S=64,6%

Modelo de PD Resultados Finais

Bad Rate: Taxa de Ruins entre os aprovados pelo modelo

Estratégias:

manter aprovação e aumentar qualidade

manter qualidade e aumentar aprovação

SITUAÇÃO ATUAL:80% de aprovação

4,2% de inadimplência

FaixaNúmero

ClientesBons Ruins

Taxa

Aprovação

Bad

Rate Acum

Bad

Rate Marg

<390 4 0 4 100% 8,1% 100,0%

391-540 23189 13961 9228 100% 8,1% 39,8%

541-566 22896 19316 3580 90% 4,4% 15,6%

567-684 22545 20093 2452 79% 3,0% 10,9%

585-599 21634 20414 1220 69% 1,8% 5,6%

600-614 23685 23043 642 60% 1,2% 2,7%

615-626 22758 22396 362 49% 0,8% 1,6%

627-637 22249 22008 241 39% 0,6% 1,1%

638-647 21649 21479 170 29% 0,5% 0,8%

648-660 21544 21442 102 19% 0,4% 0,5%

661-694 21452 21400 52 10% 0,2% 0,2%

>694 85 85 0 0% 0,0% 0,0%

Total 223690 205637 18053

Modelo de PD Aplicação dos Modelos

Concessão de Crédito

Cobrança

Fraude

Renovação de limites

Segmentação de produtos e canais de

atendimento

Sinistralidade de seguros


Críticos e curiosos

Habilidade com ferramentas de programação e estatística

Mão na massa

Provenientes de diversas áreas, do conhecimento, entre elas, Matemática, Estatística, Administração, Economia, Física, Contabilidade, Engenharia...


Big Data

Localização

Mobile

Informações

Públicas

Softwares

SAS, SPSS, R, Stata,

Orange, Matlab,

etc.

Referências

Lima, Jorge Claudio C.O. “Importância de Conhecer a Perda Esperada”

Revista do BNDES, Rio de Janeiro, V. 15, N. 30, P. 271-302, dez. 2008

Apesar de focar em modelagem corporate, apresenta de forma simples os conceitos

relacionados à perda esperada.

The Credit Scoring Toolkit: Theory and Practice for Retail Credit Risk

Management and Decision Automation. Raymond Anderson.

https://www.datacamp.com/courses/introduction-to-credit-risk-modeling-

in-r

Ótimo curso online, apesar do conteúdo resumido, detalha bem a parte de tratamento de dados

e validação de modelos.

https://www.datacamp.com/courses/introduction-to-credit-risk-modeling-in-r

Obrigado!

[email protected]