FUNDAÇÃO GETÚLIO VARGAS ESCOLA DE PÓS-GRADUAÇÃO EM

FUNDAÇÃO GETÚLIO VARGAS

ESCOLA DE PÓS-GRADUAÇÃO EM ECONOMIA

ARTHUR MOREIRA SAÚDE

METODOLOGIA DE PREVISÃO DE RECESSÕES:

UM ESTUDO ECONOMÉTRICO COM APLICAÇÕES

DE MODELOS DE RESPOSTA BINÁRIA

Rio de janeiro

2017

ARTHUR MOREIRA SAÚDE

METODOLOGIA DE PREVISÃO DE RECESSÕES:

UM ESTUDO ECONOMÉTRICO COM APLICAÇÕES

DE MODELOS DE RESPOSTA BINÁRIA

Dissertação para obtenção do grau de mestre

apresentada à Escola de Pós-Graduação em

Economia.

Área de concentração: Econometria.

Orientador: Dr. Eduardo Lima Campos

Rio de janeiro

2017

Ficha catalográfica elaborada pela Biblioteca Mario Henrique Simonsen/FGV

Saúde, Arthur Moreira

Metodologia de previsão de recessões: um estudo econométrico com aplicações de modelos de resposta binária / Arthur Moreira Saúde. – 2017.

35 f.

Dissertação (mestrado) - Fundação Getulio Vargas, Escola de Pós-Graduação em Economia. Orientador: Eduardo Lima Campos. Inclui bibliografia. 1. Recessão (Economia). 2. Ciclos econômicos. 3. Modelos econométricos. 4. Probit. 5. Logit. I. Campos, Eduardo Lima. II. Fundação Getulio Vargas. Escola de Pós-Graduação em Economia. III. Título. CDD – 338.5

Resumo

Este trabalho visa desenvolver um modelo econométrico capaz de antecipar,

com um ano de antecedência, recessões na economia dos Estados Unidos,

utilizando não só variáveis dos mercados monetários, que já são indicadores

antecedentes bastante utilizados por economistas, mas também dos

mercados de capitais. Utilizando-se dados de 1959 a 2016, pode-se observar

que o spread de juros de longo e curto prazo continua sendo uma variável

explicativa com excelente poder preditivo sobre recessões. Também

surgiram evidências de novas variáveis que possuem altíssimas

significâncias estatísticas, e que oferecem valiosas contribuições para as

regressões. Foram conduzidos testes fora da amostra que sugerem que as

recessões passadas teriam sido previstas com acurácia substancialmente

superior, caso o modelo Probit proposto tivesse sido utilizado no lugar do

modelo mais difundido na literatura econômica. Essa acurácia é evidente não

só na qualidade preditiva, mas também na redução do número de falsos

positivos e falsos negativos da regressão, e na robustez dos testes fora da

amostra.

Palavras-chave: Recessões. Ciclos Econômicos. Econometria. Modelos de

Resposta Binária. Probit. Logit.

Abstract

This paper aims to create an econometric model capable of anticipating

recessions in the United States economy, one year in advance, using not

only monetary market variables that are already used by economists, but also

capital market variables. Using a data span from 1959 to 2016, it was

observed that the yield spread continues to be an explanatory variable with

excellent predictive power over recessions. Evidence has also emerged of

new variables that have very high statistical significance, and which offer

valuable contributions to the regressions. Out-of-sample tests have been

conducted which suggest that past recessions would have been predicted

with substantially higher accuracy if the proposed Probit model had been

used instead of the most widespread model in the economic literature. This

accuracy is evident not only in the predictive quality, but also in the reduction

of the number of false positives and false negatives in the regression, and in

the robustness of the out-of-sample tests.

Keywords: Recessions. Economic Cycles. Econometrics. Binary Response

Models. Probit. Logit.

Sumário 1 Introdução ................................................................................................... 8

2 Metodologia .............................................................................................. 10

2.1 Modelos de Resposta Binária ............................................................. 10

2.2 Método Stepwise Backward ............................................................... 12

2.3 Testes de Aderência Aplicados a Modelos de Resposta Binária ....... 13

2.3.1 Pseudo-R2 ...................................................................................... 13

2.3.2 Percentage of Correct Predictions .................................................. 13

2.3.3 Teste Hosmer-Lemeshow............................................................... 13

2.4 Testes de Estacionariedade ............................................................... 14

2.4.1 Augmented Dickey-Fuller ............................................................... 14

2.4.2 KPSS .............................................................................................. 17

3 Dados e Análise Exploratória .................................................................... 19

3.1 Testes de Estacionariedade ............................................................... 23

4 Estimações ............................................................................................... 26

4.1 Regressões ........................................................................................ 26

4.2 Comparação dos modelos .................................................................. 27

4.2.1 Efeitos parciais ............................................................................... 30

4.2.2 Testes fora da amostra ................................................................... 31

5 Conclusão ................................................................................................. 33

6 Referências Bibliográficas......................................................................... 34

8

1 Introdução Recessões são períodos que trazem mal-estar a diversas partes interessadas.

A previsibilidade desses eventos já é estudada por economistas há algum tempo, não

só pelo efeito prejudicial que possuem sobre o produto de um país, mas também por

outros fatores negativos, como o desemprego e queda de renda.

A National Bureau of Economic Research (2010) define recessão com as

seguintes palavras:

“A recession is a period of falling economic activity spread across the economy,

lasting more than a few months, normally visible in real GDP, real income,

employment, industrial production, and wholesale-retail sales.”

(National Bureau of Economic Research, 2010)

Os Estados Unidos possuem forte influência econômica internacional, e crises

nesse país podem afetar o mundo inteiro. Por esse motivo, é de interesse não só de

economistas americanos, mas de diversas nacionalidades, prever recessões nessa

economia. Muitos trabalhos acadêmicos têm sido publicados com o objetivo de

investigar a previsibilidade de recessões.

Croushore e Marsten (2014) argumentam que a habilidade que os economistas

têm de prever recessões é limitada, pois normalmente são causadas por choques que

não podem ser antecipados. Por outro lado, Estrella e Mishkin (1996) elaboraram um

modelo Probit que utiliza a inclinação da estrutura a termo dos juros do tesouro

americano para prever recessões com poder preditivo satisfatório.

Rudebusch e Williams (2009) concluíram que um modelo que utilizasse somente

o spread de juros de longo e curto prazo teria previsto recessões com acurácia

superior à do Survey of Professional Forecasters1. Esses resultados foram replicados

por Croushore e Marsten (2014), que afirmam ter achado robustez em diversas

dimensões.

A relação encontrada entre o spread de juros e recessões sugere que os agentes

refletem suas expectativas sobre o futuro da economia no mercado monetário. Por

1 O Survey of Professional Forecasters é uma pesquisa de projeções macroeconômicas, realizada trimestralmente com economistas. A mesma é conduzida pelo Federal Reserve Bank of Philadelphia.

9

meio das decisões que tomam, os mesmos afetam as taxas de juros de longo e curto

prazo, o que explica o fato do spread de juros ter poder explicativo sobre recessões.

Barro e Ursúa (2009) utilizaram dados de longo prazo de 30 países diferentes,

com o objetivo de investigar se quebras de bolsas de valores estão correlacionadas

com depressões, que são definidas como declínios macroeconômicos de 10% ou

mais. Esses autores concluem que quebras de bolsas de valores possuem um poder

de previsão substancial para depressões.

Essa relação parece indicar que o mercado de capitais, assim como o mercado

monetário, também pode possuir indicadores antecedentes a recessões.

Nyberg (2010) propõe um modelo Probit dinâmico com indicadores de retorno

do mercado financeiro, e afirma ter encontrado previsões fora da amostra mais

precisas para as recessões de 2001 e 2008.

O objetivo do presente trabalho é especificar e estudar modelos Probit e Logit

para tentar prever a probabilidade da economia dos Estados Unidos entrar em

recessão no ano seguinte. Pretende-se ainda investigar o poder explicativo de

variáveis defasadas relacionadas a bolsas de valores, combinadas com a estrutura a

termo das taxas de juros do tesouro americano e outras variáveis, visando aprimorar

o modelo proposto por Estrella e Mishkin (1996), a partir dos resultados encontrados

por Barro e Ursúa (2009). Foi utilizado o software Matlab para todos os cálculos e

regressões.

10

2 Metodologia

2.1 Modelos de Resposta Binária Modelos de Resposta binária são adequados para previsão de variáveis binárias

com distribuição Bernoulli, e pertencem à família exponencial na forma canônica,

seguindo relações não lineares.

Wooldridge (2012) generaliza a classe de modelos de resposta binária da

seguinte forma:

�� = 1|�� = �� + � +⋯+�� (2.1)

y é a variável binária dependente.

� , ��, … , �� é o vetor de variáveis explicativas.

, �, … , � é o vetor de coeficientes da regressão, com 0 < G(z) < 1, ∀ z ∈ ℝ.

Wooldridge (2012) aponta que os modelos Logit e Probit são as funções de

ligação não lineares mais utilizadas em modelos de resposta binária. O mesmo autor

apresenta a função logística, também conhecida como logito, da seguinte forma:

�� = ��1 +�� (2.2)

O modelo probit é especificado pela função distribuição acumulada normal,

conforme mostrado na equação 2.3:

�� = � ��²�

√2!�

"#$� (2.3)

Wooldridge (2012) afirma que as estimativas desses modelos não podem ser

feitas via Mínimos Quadrados Ordinários, devido às não linearidades dos mesmos.

Esse mesmo autor recomenda que seja utilizado o método de Máxima

Verossimilhança, que consiste na maximização da equação de log-verossimilhança:

11

%�� = & �' ()*+��'�, + �1 − �'�()*+1 − ��'�,.'/

(2.4)

x é o vetor de variáveis explicativas.

β é o vetor de coeficientes.

G(.) é a função distribuição do modelo de resposta binária.

n é o tamanho da amostra.

Os desvios padrões assintóticos dos coeficientes de regressão podem ser

calculados a partir da matriz de variâncias assintóticas da Equação 2.5. Considerando

que β é um vetor de k x 1 parâmetros, incluindo o intercepto, temos uma matriz de

variâncias k x k, em que as raízes quadradas dos elementos da diagonal principal

correspondem aos desvios padrões assintóticos.

01234567 = �& +*5�'67,²�'′�'5�'67+1 − 5�'67,�

.

'/

" (2.5)

A partir do vetor de coeficientes 6estimado por máxima verossimilhança, e do

vetor de desvios padrão assintóticos, pode-se calcular a estatística t de cada

coeficiente, o que permite testar sua significância estatística.

Além da significância estatística, também estamos interessados em saber o

quanto cada variável explicativa influencia a probabilidade. No entanto, como estamos

trabalhando com funções não lineares, as derivadas das probabilidades, com relação

à determinada variável explicativa, dependerão do nível em que a função se encontra.

Por exemplo, para uma função distribuição �� = 1|�� = �9�, o efeito parcial de um

coeficiente : será: �9��;<;=>�. Para efeitos de simplificação, foram calculados os

efeitos parciais para �9� = 1%, 25%, 50%, 75% e 99%.

12

2.2 Método Stepwise Backward Draper e Smith (1998) descrevem o Stepwise como um procedimento

automatizado de seleção de variáveis para um modelo de regressão, que baseia-se

em métodos pré-determinados. O método Stepwise Backward inicia a simulação

utilizando o modelo com todas as variáveis candidatas, e analisa a cada etapa uma

possível exclusão de variável. Caso os requisitos definidos sejam satisfeitos, a

variável é retirada, caso contrário o teste continua até que restem apenas as variáveis

escolhidas pelo método.

A Deviance é um dos fatores mais utilizados para testes stepwise, e também é

o padrão da função do Software Matlab. Dobson (2002) define a Deviance de um

modelo da seguinte forma:

? = 2+()* %�@ , �� − ()* %�@ABC, ��, (2.6)

@ é o vetor de parâmetros estimados para o modelo em questão.

@ABC é o vetor de parâmetros estimados para o modelo saturado.

O modelo saturado consiste em um modelo com o número máximo de

parâmetros que possa ser estimado, com o melhor poder explicativo possível. O

modelo saturado possui a mesma distribuição e função de ligação do modelo testado.

Dobson (2002) sugere que quando pretende-se encontrar a Deviance entre dois

modelos, podemos subtrair a Deviance do modelo 2 da Deviance do modelo 1:

D � = 2+log L�b , y� − log L�bKLM, y�, − 2+log L�b�, y� − log L�bKLM, y�, = 2+()* %�@ , �� − ()* %�@�, ��, (2.7)

? � tem distribuição assintótica Qui-quadrado, com graus de liberdade iguais a

diferença entre o número de parâmetros estimados nos modelos 1 e 2.

Em cada etapa do processo, é avaliado se há alguma variável capaz de trazer

um aumento estatisticamente significante de Deviance. O processo é repetido até que

sobrem apenas variáveis cujas exclusões não podem trazer melhorias ao modelo.

13

2.3 Testes de Aderência Aplicados a Modelos

de Resposta Binária Existem métodos específicos para teste da aderência de modelos de resposta

binária. Dentre eles, estão:

2.3.1 Pseudo-R2 O Pseudo-R2, proposto por McFadden (1974), é calculado pela equação 2.8:

NO�P$)Q2 = 1 −%A%� (2.8)

%A é a Log-verossimilhança do modelo estimado.

%� é a Log verossimilhança de um modelo estimado apenas com o intercepto.

2.3.2 Percentage of Correct Predictions O Percentage of Correct Predictions é descrito pela equação:

�R� = ∑ ��' == 1T'/ ��ŷ' ≥ W�+��' == 0��ŷ' < W�Z (2.9)

y[ é a variável binária de recessão observada.

ŷ[ é a probabilidade de recessão estimada.

N é o tamanho de ŷ[. W é o ponto de corte, onde ŷ' ≥ Wsignifica que o modelo está prevendo recessão

um ano à frente, e ŷ' < W indicará o contrário. Esse parâmetro será estimado de

maneira a maximizar o PCP do modelo, com o objetivo de obter melhores resultados

preditivos.

2.3.3 Teste Hosmer-Lemeshow Hosmer e Lemeshow (1980) propuseram um teste com o propósito de avaliar o

quão bem um modelo de resposta binária consegue aderir aos dados observados. O

teste consiste em ordenar as observações por probabilidades preditas, da maior para

a menor, e separá-las em grupos. Os mesmos autores sugerem a separação em 10

14

decis. É conduzido um teste cuja hipótese nula é que os valores esperados das

probabilidades preditas são iguais aos valores esperados observados, em cada grupo.

A estatística de teste está apresentada na equação 2.10. A mesma segue

distribuição qui-quadrado, com g-2 graus de liberdade.

Ĉ = & �^� − _�̀!̅��_�̀!b��1 − !̅��

c

�/ (2.10)

_�̀ é o número total de observações do k-ésimo grupo.

^� = ∑ �:de:/ corresponde ao número de respostas positivas observadas.

!̅� = ∑ A>f̂h.ei

de:/ é a probabilidade estimada média.

2.4 Testes de Estacionariedade Serão utilizados os testes Augmented Dickey-Fuller (Dickey e Fuller, 1979), mais

conhecido como ADF, e Kwiatkowski, Phillips, Schmidt and Shin (1992), mais

conhecido como KPSS, para testar as estacionariedades das séries de dados.

2.4.1 Augmented Dickey-Fuller O teste ADF é uma evolução do teste Dickey-Fuller tradicional, e consiste em

testar a hipótese nula de que γ = 0, ou seja, há raiz unitária, contra a hipótese

alternativa de que γ> 0, ou seja, não há raiz unitária. Para executar o teste ADF deve-

se primeiramente determinar se o modelo possuirá uma constante e se haverá a

presença de uma tendência determinística.

∆�k =l�k" +&'∆�k"'m +nko

'/� (2.11)

15

∆�k =2� + l�k" +&'∆�k"'m +nko

'/� (2.12)

∆�k =2� + l�k" + 2�p +&'∆�k"'m +nko

'/� (2.13)

As equações 2.11, 2.12 e 2.13 foram extraídas do exemplo apresentado por

Enders (2004). A primeira representa a equação de teste para o modelo sem drift e

sem tendência determinística, enquanto que a segunda representa o modelo com drift

e sem tendência determinística. A equação 2.13 apresenta o modelo mais completo,

onde há presença de constante e de tendência determinística.

Dickey e Fuller (1979) apontam que processos não estacionários não podem ser

avaliados com testes t tradicionais, uma vez que as distribuições dos mesmos não

são normais. Dessa forma, o procedimento Dickey e Fuller (1979) utiliza simulações

de Monte Carlo para obtenção dos valores críticos a serem utilizados. Cada uma das

três equações expostas anteriormente possui diferentes valores críticos para teste,

que também variam de acordo com o tamanho da amostra.

Campbell e Perron (1991) argumentam que, quando o modelo estimado utiliza

variáveis determinísticas que não estão presentes no processo real, perde-se poder

no teste, o que pode causar viés no coeficiente γ estimado. Os mesmos autores

também afirmam que o poder do teste é afetado quando uma variável determinística

que está no processo gerador de dados é omitida da regressão.

É necessário conhecer previamente se a série estudada possui tendência

determinística e constante em seu processo gerador para evitar as perdas de poder

mencionadas anteriormente. Porém, como na maior parte dos casos o processo

gerador não é conhecido, Enders (2004) modificou um procedimento originalmente

proposto por Dolado, Jenkinson e Sosvilla-Rivero (1990), representado na figura 1.

Esse procedimento tem o objetivo de criar uma metodologia para testar a presença

de raízes unitárias, utilizando o teste ADF, quando não se conhece a natureza do

processo gerador de dados da série em questão.

16

Figura 1

Antes de iniciar o procedimento, deve-se decidir qual será o tamanho k do vetor

, … , � a ser considerado no processo gerador. Será utilizado o valor de k que

minimiza o Coeficiente Bayesiano de Informação (BIC), para 0 ≤ k ≤ 100, que é

representado da seguinte maneira:

BIC = ln�n� k − 2ln�Ľ� (2.14)

Ľ é o valor máximo da equação de log-verossimilhança.

n é o número de observações.

k é o número de parâmetros presentes no modelo.

O primeiro passo é estimar a equação 2.13, que contém drift e tendência

determinística. Esse é o modelo com menor poder dos três, e por esse motivo, caso

w� seja rejeitada, pode-se concluir que não há raiz unitária. Caso w� não seja rejeitada,

17

deve-se testar se 2� e γ são conjuntamente iguais a zero, utilizando a estatística F de

uma regressão restrita a γ = 2� = 0. Se o teste não concluir que γ = 2� = 0, então se

deve testar γ = 0, utilizando-se a distribuição normal. A rejeição de w�, nesse último

teste, leva a conclusão que não há raiz unitária, enquanto que a não rejeição indica a

presença da mesma.

Caso o teste F conclua que 2� = 0|γ = 0, deve-se descartar a presença de uma

tendência determinística, e regredir a equação 2.12. Assim como no passo anterior, a

rejeição de w�fornece evidências de que não há raiz unitária. Caso não se rejeite w�,

deve-se testar a presença do intercepto, por meio de um teste F, a partir de uma

regressão restrita a γ = 2� = 0. Caso o teste tenha resultado negativo, a mesma

regressão deve ser repetida, utilizando-se a distribuição normal. Se γ for

estatisticamente igual a zero, conclui-se que há evidências sobre a presença da raiz

unitária e, caso contrário, que não há.

Se o passo anterior concluir que 2� = 0|γ = 0, o modelo deve ser especificado

sem o intercepto e sem a tendência determinística, como na equação 2.11. Nessa

etapa, a rejeição de w� implicará na conclusão de que não há evidências de raiz

unitária, enquanto que a não rejeição indica que há evidências de raiz unitária.

2.4.2 KPSS O teste KPSS, proposto por Kwiatkowski, Phillips, Schmidt e Shin em 1992, tem

o objetivo de fornecer evidências sobre estacionariedade em nível ou na tendência,

dependendo de como o modelo for formulado.

A equação 2.14 representa o modelo de teste com tendência, onde 3k =3k" +yk, e yk é uma variável aleatória independente e identicamente distribuída (i.i.d.), com

média 0 e variância z{�. Assume-se que nk é i.i.d. N(0,z|�).

�k = }p + 3k + nk (2.15)

A hipótese de estacionariedade é z{� = 0, que pode ser descrita como

estacionariedade em nível, quando assume-se } = 0, ou estacionariedade na

tendência, caso contrário.

18

Os resultados do teste KPSS serão utilizados para confirmar as conclusões dos

testes ADF. Ou seja, sempre que o teste ADF apontar para estacionariedade em nível,

ou na tendência, a mesma hipótese será colocada à prova no teste KPSS.

19

3 Dados e Análise Exploratória Foram utilizados dados de 1959 até 2016. As recessões são representadas por

uma variável dependente binária, que será construída a partir dos dados publicados

pelo National Bureau of Economic Research (2017), que identifica os períodos

correspondentes a todas as recessões ocorridas nos Estados Unidos desde 1854.

O Comitê de Datação de Ciclos Econômicos (CODACE), organizado Instituto

Brasileiro de Economia (IBRE), é uma iniciativa que tem por objetivo estabelecer

datações de referência para os ciclos econômicos do Brasil, e representa uma

alternativa de dados para obter-se datações de recessões na economia brasileira.

As variáveis explicativas consideradas foram:

A diferença entre a taxa de juros do tesouro americano de 10 anos e de 3 meses,

conforme proposto por Estrella e Mishkin (1996), extraída do Federal Reserve

Economic Data (2017) e denominada “Spread”. Havia dados de 01/04/1953 a

01/12/2016 disponíveis para o tesouro de 10 anos, e 01/01/1934 a 01/12/2016 para o

de 3 meses. Foram calculadas as diferenças utilizando as taxas de 01/04/1953 a

01/12/2016.

Alavancagem de investidores no mercado de capitais, medida pelo volume

financeiro total de operações short efetuadas na New York Stock Exchange (NYSE),

sobre o volume total de ativos comprados em margem, denominada “PctShort”. Os

dados foram obtidos do site oficial da NYSE (2017), e estavam disponíveis para o

período de 01/01/1959 a 01/12/2016. Não havia dados para a variável “Credit Balance

in Margin Accounts” no ano de 1966, as mesmas foram estimadas a partir de uma

interpolação linear dos dados de 01/12/1965 e 01/01/1967.

Retornos acumulados e volatilidades do prêmio de risco do CRSP, obtidos na

base de dados de French (2017), denominadas como “RetCRSP6a0m”,

“RetCRSP12a6m”, “RetCRSP18a12m”, “RetCRSP24a18m”, “VolCRSP6a0m”,

“VolCRSP12a6m”, “VolCRSP18a12m” e “VolCRSP24a18m”, onde “RetCRSP6a0m

corresponde ao retorno acumulado do último semestre, “VolCRSP6a0m” corresponde

à volatilidade acumulada do último semestre, e assim por diante.

20

Inflação acumulada dos Estados Unidos: medida pela variação do Consumer

Price Index (CPI), obtido da base de dados do Federal Reserve Economic Data (2017),

denominada como “Inf6a0m”, “Inf12a6m”, “Inf18a12m” e “Inf24a18m.

A tabela 1 apresenta a disponibilidade de dados de cada variável dependente

escolhida. Pode-se observar que há diferentes números de observações para cada

variável.

Tabela 1

21

Gráfico 1 - Spread

Gráfico 2 - PctShort

22

Gráfico 3 – Inflação acumulada de 6 meses

Gráfico 4 – Retorno acumulado CRSP dos últimos 6 meses

23

Gráfico 5 – Volatilidade acumulada CRSP dos últimos 6 meses

Os gráficos 1, 2, 3, 4 e 5 apresentam o comportamento de cada variável

explicativa candidata no modelo inicial, onde as zonas cinzas representam períodos

recessivos, conforme informação da NBER. Esse gráficos nos permite observar, por

inspeção visual, que algumas das séries podem ter seu comportamento afetado

quando estão próximas do acontecimento de recessões, o que é um bom sinal com

relação aos seus poderes explicativos.

3.1 Testes de Estacionariedade Para os testes de estacionariedade, serão utilizados todos os dados disponíveis

para cada variável, uma vez que os testes são feitos separadamente, com o objetivo

de aumentar sua robustez. Caso necessário, serão feitas transformações nas séries

para que tornem-se estacionárias.

Conforme sugerido pela Figura 1, começou-se estimando a equação 2.13, que

corresponde ao modelo Trend-Stationary (TS) no Matlab. Para definir o número de

lags a serem considerados, foram simulados 101 diferentes cenários para cada

modelo TS de cada variável, de 0 a 100 lags, e calculados os valores correspondentes

24

ao Coeficiente Bayesiano de Informação (BIC). Escolheu-se o número de lags que

minimiza esse coeficiente em cada variável, e então o teste ADF foi conduzido.

Tabela 2

A tabela 2 mostra que apenas a variável PctShort não teve a hipótese nula de

raiz unitária rejeitada. Foi efetuada uma regressão restrita a γ = 2� = 0 com essa

variável. A tabela 3 mostra que a hipótese nula de que γ = 2� = 0 não foi rejeitada, o

que sugere que as variáveis não são conjuntamente significantes ao nível de 5%.

Tabela 3

Seguindo o modelo proposto, a variável PctShort foi testada pelo ADF, utilizando

a equação 2.12, referenciada como "ARD" no Matlab. A tabela 4 mostra que a hipótese

nula de raiz unitária não foi rejeitada.

Tabela 4

Foi efetuado um novo teste F, agora utilizando a equação 2.11, para testar se γ

= 2� = 0. A tabela 5 mostra que as variáveis são estatisticamente insignificantes

conjuntamente.

25

Tabela 5

Foi efetuada uma última regressão com a variável PctShort, com a equação sem

tendência determinística e sem constante. O resultado do teste ADF foi de não rejeitar

a hipótese nula de raiz unitária.

Tabela 6

As mesmas variáveis foram submetidas ao teste KPSS. A tabela 7 mostra que

os resultados encontrados pelo KPSS, em sua maior parte, foram compatíveis com os

resultados do teste ADF. A variável PctShort mostrou-se não estacionária nos dois

modelos. Os mesmos modelos também tiveram a mesma conclusão, de

estacionariedade, para as demais variáveis, com exceção dos dados de volatilidade,

que foram apontados como estacionários no modelo ADF e não estacionários no

modelo KPSS.

Tabela 7

Foi tomada a primeira diferença da variável PctShort, com o objetivo de testar

sua estacionariedade novamente. A tabela 8 mostra que, após a diferenciação da

variável PctShort, quase todas as variáveis são apontadas como estacionárias pelos

26

métodos Augmented Dickey-Fuller e KPSS. Apesar das divergências encontradas nas

conclusões referentes às variáveis de volatilidade, será priorizado o resultado obtido

no ADF, considerando-se as mesmas como estacionárias.

Tabela 8

4 Estimações

4.1 Regressões As catorze variáveis explicativas e a variável dependente foram inicialmente

regredidas nos modelos Probit e Logit, sendo submetidas ao método Stepwise

Backward. O modelo proposto por Estrella e Mishkin (1996) também foi regredido com

os dados disponíveis.

27

Tabela 9

Pode-se observar que os Pseudo R2 e PCPs dos modelos Probit e Logit desse

trabalho são significantemente superiores ao modelo original proposto por Estrella e

Mishkin (1996). Foram obtidos Valores de Pseudo-R2 de 30,92% e 30,18%,

respectivamente, nos modelos Probit e Logit propostos, e 25,57% no modelo de

Estrella. Os PCPs dos modelos Probit e Logit, de 89,17% e 89,30% respectivamente,

também foram superiores o valor de PCP de 88,18% do modelo de Estrella.

Em todos os modelos, não houve evidências aos níveis usuais de significância

para rejeitar a hipótese nula do teste Hosmer-Lemeshow: as proporções observadas

e preditas são iguais em todos os decis considerados.

Obteve-se significâncias estatísticas de 1% em quase todos os coeficientes,

excetuando-se apenas a volatilidade dos prêmios de risco do CRSP, que é significante

a 5%.

4.2 Comparação dos modelos A tabela 10 exibe os dados utilizados para os testes Hosmer-Lemeshow de cada

modelo.

28

Tabela 10

A coluna “Nº Obs” exibe o número de observações presentes no decil, enquanto

que as colunas “Estimado” e “Observado” informam os números de recessões

estimadas e observadas, respectivamente, no decil correspondente.

O gráfico 6 mostra os desempenhos do modelo Probit sugerido, em laranja, e o

modelo de Estrela e Mishkin (1996), em azul. Por inspeção visual, pode-se perceber

que o primeiro modelo, em média, apresenta uma probabilidade maior em períodos

que antecedem recessões, e uma probabilidade menor nos outros casos.

O modelo proposto por Estrella possui uma probabilidade média de recessão de

32,73% em períodos que antecedem recessões, enquanto que o modelo probit

proposto pelo presente artigo apresenta 36,87%. Já em períodos que não antecedem

recessões, as probabilidades são, respectivamente, 10,51% e 9,84%. Essas são

características essenciais para um modelo de previsão, uma vez que se deseja prever

recessões com probabilidades altas, e ao mesmo tempo evitar falsos positivos.

29

Gráfico 6 – Probit Arthur e Probit Estrella

As principais diferenças dos modelos Probit podem ser observadas nas

recessões iniciadas em 1990, 2000 e 2007. É possível observar que o modelo probit

do referente trabalho fornece probabilidades substancialmente superiores às

probabilidades apresentadas no modelo de Estrella e Mishkin (1996), o que facilita a

antecipação desses eventos.

Na década de 1960 o modelo de Estrella e Mishkin (1996) apresenta um período

com probabilidade de quase 50%, em um momento que não antecedia recessões, o

que está bem próximo de ser um falso positivo. Por outro lado, o modelo Probit

proposto não apresenta esse overshoot, com probabilidades mais baixas. Essa é mais

uma característica positiva do segundo modelo, pois também há interesse de

minimizar falsos positivos.

30

Gráfico 7 – Logit Arthur e Probit Estrella

O gráfico 7 apresenta a comparação dos modelos Logit desenvolvido nesse

trabalho e o Probit de Estrella. Os resultados são bem parecidos com os do gráfico 6,

uma vez que a única diferença dos dois modelos é a função resposta.

4.2.1 Efeitos parciais As tabelas 11, 12 e 13 mostram os efeitos parciais dos modelos Probit, Logit e

Estrella, respectivamente. As mesmas exibem o efeito marginal do acréscimo de uma

unidade da variável independente em questão na probabilidade de recessão, quando

a mesma encontra-se em 1%, 25%, 50%, 75% e 99%.

Pode-se observar que os efeitos marginais de 1% e 99% são significativamente

inferiores aos demais. Isso sugere que, quando a probabilidade de recessão da

economia é demasiadamente alta ou baixa, o movimento isolado de uma variável

independente faz uma diferença menor que em outros casos.

31

Tabela 11 – Efeitos Parciais no modelo Probit

Tabela 12 – Efeitos Parciais no modelo Logit

Tabela 13 – Efeitos Parciais no modelo de Estrella

4.2.2 Testes fora da amostra O objetivo de um teste fora da amostra é testar a robustez de longo prazo do

modelo, e mostrar quais teriam sido os resultados das previsões, caso o mesmo

tivesse sido utilizado no passado.

Foram utilizados os 20 primeiros anos da amostra para calcular os coeficientes

de regressão iniciais de cada modelo. Esses coeficientes foram utilizados para prever

o próximo período, e então estimados novamente utilizando mais uma observação.

Repetiu-se esse processo até chegar-se à observação mais recente da amostra.

Também foram estimadas regressões fora da amostra com um modelo com

somente um intercepto, com o objetivo de apurar sua Log-verossimilhança, e utilizá-

la para cálculo dos Pseudo-R2 das demais regressões.

32

Tabela 14

A tabela 14 mostra que o modelo Probit proposto apresentou uma robustez maior de

longo prazo, com Pseudo R2 e PCP maiores nos testes fora da amostra. Os

PseudoR2 obtidos nesse teste são significativamente superiores aos obtidos nas

regressões originais. Esse resultado mostra que, apesar dos modelos testados terem

sua acurácia afetada nesse teste, o modelo comparativo que utiliza um intercepto, por

ser espúrio, foi ainda mais afetado.

Gráfico 8

O gráfico 8 mostra o desempenho de ambos os modelos nos testes fora da

amostra, onde a série laranja representa o Probit proposto por este trabalho, e o azul

o modelo proposto por Estrella e Mishkin (1996).

33

5 Conclusão

Os resultados econométricos apresentados sugerem que a relação entre spread

de juros e a probabilidade de recessão na Economia dos Estados Unidos, encontrada

por Estrella e Mishkin (1996), ainda é altamente significativa. Essa relação sugere que

o mercado monetário afeta diretamente as expectativas dos agentes econômicos com

relação ao output futuro da economia.

Com a extensão dos modelos propostos nesse trabalho, pode-se observar que

há evidências que essas expectativas também são refletidas no mercado de capitais,

representado pela alavancagem de investidores no mercado financeiro e a volatilidade

dos prêmios de risco de ações negociadas nas bolsas de valores dos Estados Unidos.

Essas relações são intuitivas no sentido econômico. Se os agentes percebem

que a economia produzirá PIBs menores no futuro, os mesmos tomarão decisões

levando em conta que as taxas de juros de longo prazo serão menores, o que afetará

o spread de longo e curto prazo. Adicionalmente, também haverá mais operações a

short nos mercados de capitais, em razão de uma possível retração na economia, que

pode afetar negativamente as bolsas de valores. No entanto, a relação negativa da

volatilidade dos prêmios de risco, apesar de estatisticamente significante, não parece

ser intuitiva no sentido macroeconômico.

Também encontrou-se uma significativa relação entre a probabilidade de

recessão e a taxa de inflação. Esse resultado é compatível com a literatura

macroeconômica, uma vez que taxas de inflação altas podem aumentar a

probabilidade da autoridade monetária adotar uma política monetária contracionista,

o que pode afetar negativamente o crescimento econômico da economia.

A previsibilidade de contrações econômicas sempre foi um desafio, e os

resultados apresentados são úteis para se obter previsões mais precisas, com um

menor número de Erros do tipo 1 e do tipo 2. Também abriu-se portas para novos

trabalhos acadêmicos, com o objetivo de construir modelos macroeconômicos que

sejam capazes de representar os mecanismos que estejam por trás das relações

apresentadas.

34

6 Referências Bibliográficas

BARRO, R. J.; URSUA, J. F. Stock-market crashes and depressions. NBER

Working paper 14760, 2009.

BOX, G. E. P.; PIERCE, D. A. Distribution of Residual Autocorrelations in

Autoregressive-Integrated Moving Average Time Series Models. Journal of the

American Statistical Association, 1970.

CAMPBELL J. Y; PERRON P. Pitfalls and opportunities: What

Macroeconomists Should Know about Unit Roots. NBER Macroeconomics

Annual, 1991.

CHAUVET, M.; POTTER, S. Forecasting Recessions Using the Yield Curve.

Federal Reserve Bank of New York, 2001.

CROUSHORE, D.; MARSTEN, K. The continuing power of theyield spread

in forecasting recessions. Research Department, Federal Reserve Bank of

Philadelphia, 2014.

DICKEY, D. A.,; FULLER, W. A. Distributionsofthe Estimators for

Autoregressive Time Series witha Unit Root. Journal of the American Statistical

Association, 1979.

DOBSON, J. A. An Introduction to Generalized Linear Models : second

edition. New York: Chapman & Hall, 2002.

DOLADO, J. J.; JENKINSON, T.; SOSVILLA-RIVERO, S. Cointegration and

Unit Roots. Journal of Economic Surveys, vol 4, nº 3, 1990.

DRAPER, N. R.; SMITH, H. Applied Regression Analysis . Wiley Interscience,

1998.

ENDERS, W. Applied Econometric Time Series. John Wiley & Sons, 2nd

edition, 2004.

ESTRELLA, A., & MISHKIN, F. S. The Yield Curve as a Predictor of U.S.

Recessions. Federal Reserve Bank of New York Current Issues in Economics and

Finance 2, 1996.

35

FEDERAL RESERVE ECONOMIC DATA. Consumer Price Index for All

Urban Consumers: All Items. Disponível em: <https://research.stlouisfed.org>

FRENCH, K. Current Research Returns. Disponível em: <

http://mba.tuck.dartmouth.edu/pages/faculty/ken.french/data_library.html>

HOSMER, D. W.; LEMESHOW, S. A goodness-of-fit test for the multiple

logistic regression model . Communications in Statistics, 1980.

KWIATKOWSKI, D.; PHILLIPS, P. C. B.; SCHMIDT, P. & SHIN, Y. Testing the

Null Hypothesis of Stationarity against the Alternative of a Unit Root: How Sure

Are We That Economic Time Series Have a Unit Root? Journal of Econometrics,

1992.

LIU, W.; MOENCH, E. What Predicts U.S. Recessions? Federal Reserve

Bank of New York. Staff Report No. 691, 2014.

MCFADDEN, D. L. Conditional Logit Analysis of Qualitative Choice

Behavior. New York: Academic Press, 1974.

NATIONAL BUREAU OF ECONOMIC RESEARCH. Business Cycle Dating

Committee . Cambridge, 2010.

NEW YORK STOCK EXCHANGE MARKET DATA. Securities market credit.

Disponível em: < http://www.nyxdata.com >

NYBERG, H. Dynamic Probit Models and Financial Variables in Re cession

Forecasting. Journal of Forecasting, 2010.

RUDEBUSCH, G. D. & WILLIAMS, J. C. Forecasting Recessions: The Puzzle

of the Enduring Power of the Yield Curve. Journal of Business and Economic

Statistics 27, no. 4: 492–503, 2009.

STOCK, J.; WATSON, M, Introduction to Econometrics, Prentice Hall, 3rd

edition, 2011.

THE NATIONAL BUREAU OF ECONOMICS RESEARCH. US Business Cycle

Expansions and Contractions. Disponível em: <http://www.nber.org/cycles.html>

VERBEEK, M. A Guide to Modern Econometrics. John Wiley and Sons,

2ndedition, 2004.

36

WOOLDRIDGE, J. Introductory Econometrics: A modern approach. South-

Western Cengage Learning, 5th edition, 2012.

WRIGHT, J. H. The Yield Curve and Predicting Recessions. Federal

Reserve Board, Washington, D.C. Divisions of Research & Statistics and Monetary

Affairs. Finance and Economics Discussion Series, 2006.

Documents

FUNDAÇÃO GETÚLIO VARGAS ESCOLA DE PÓS-GRADUAÇÃO EM