ECONOMETRIApmbortolon.wdfiles.com/local--files/home/Econometria... · 2018-05-16 · Modelos de escolha qualitativa • Quando Y é quantitativo, através dos modelos de regressão

ECONOMETRIA

Prof. Patricia Maria Bortolon, D. Sc.

Modelos de Escolha Qualitativa

Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.

Rio de Janeiro. Elsevier- Campus, 2006

Modelos de escolha qualitativa

• Variável dependente: binária

• Variável independente: métricas ou binárias

• Exemplos:

– Probabilidade de falência

– Probabilidade de sinistro

– Probabilidade de aderir a segmento diferenciado de

governança corporativa

– Probabilidade de abrir capital

Modelos de escolha qualitativa

• Quando Y é quantitativo, através dos modelos de

regressão linear estimamos o valor esperado ou

valor médio, dados os valores das variáveis

independentes

• Quando Y é qualitativo, o objetivo é encontrar a

probabilidade de que algo aconteça

• Modelos de Probabilidade

),...,,( 21 kiiii XXXYE

O que vamos estudar:

• Como estimar modelos de escolha qualitativa?

Podemos usar MQO?

• Há problemas especiais de inferência?

• Como medir a qualidade do ajustamento?

Podemos usar o R2?

• Como interpretar os coeficientes do modelo?

O que não vamos estudar...

• ... mas são extensões do assunto:

– Dados contáveis ou eventos raros como variável dependente =

processos de probabilidade de Poisson. ex.: no. de artigos

publicados por um docente, no. de patentes registradas por uma

empresa, etc...

– Modelos logit e probit ordinais. Ex.: quando a variável dependente

é nível de escolaridade, ou variáveis em termos de escala do tipo

Likert (“concordo totalmente” a “discordo totalmente”)

– Modelos logit e probit multinomiais: quando a variável de resposta

tem mais de duas categorias mas não são ordenadas ou

hierarquizadas.

– Modelos de duração: ex.: o que determina a duração de uma

lâmpada; a sobrevivência de micro-empresas. Esses casos são

tratados em Análise de Sobrevivência.

Modelos de Escolha Qualitativa

• Há três abordagens para formular um modelo

probabilístico para uma variável de escolha

binária:

– O modelo de probabilidade linear

– O modelo logit

– O modelo probit

Modelo de Probabilidade Linear

iii uXY 21

1 = tem casa própria

0 = c. c.

Renda familiar

É um modelo linear de probabilidade porque:

iiii XYXYE |1Pr

Modelo de Probabilidade Linear

• Supondo E(ui)=0, para obter estimadores não

tendenciosos. A variância de Yi tem a seguinte distribuição

de probabilidade:

Yi Prob.

0 1 – Pi

1 Pi

Total 1

Se Pi = probabilidade de que Yi = 1

Dist. de Probabilidade Binomial

(np ; np(1-p))

1)|(0 ii XYE

Podemos usar MQO?

Modelo de probabilidade linear

Problemas na utilização de MQO

1. Ausência de normalidade dos termos de erro ui. Porque

assim como Yi, ui também assumem dois valores:

Yi ui Prob.

Qdo. Yi = 1 1 – β1 – β2Xi Pi

Qdo. Yi = 0 – β1 – β2Xi 1 - Pi

iii XYu 21

Também segue distribuição binomial

=> ui não se distribuem normalmente



• Entretanto, lembre que a medida que o tamanho

da amostra aumenta a distribuição binomial

converge para a Normal.

• Portanto, no caso de grandes amostras, a

inferência estatística dos modelos de

probabilidade linear segue os procedimentos

habituais de MQO sob premissa de normalidade.



2. Variâncias heterocedásticas dos termos de erro.

• Como ui segue distribuição binomial com média Pi e variância

igual a Pi(1-Pi), vemos que a variância depende da média

• A variância de ui depende, em última instância, dos valores de X e,

portanto, não é homocedástica.

• Estimadores de MQO não tendenciosos, porém não são

eficientes.

• Solução: mínimos quadrados ponderados (MQP)

iiii

iii

XXYEP

PPu

21)|(

)1()var(

iiii

i

i

i

i

ii

i

PXXw

w

u

w

X

ww

Y

1P )|E(Y1)|E(Y onde iii

21



3. Impossibilildade de satisfazer 0 ≤ E(Yi | Xi) ≤ 1

• Problema real da estimativa por MQO!!!

• Não há como garantir que se situe entre 0 e 1.

• Duas formas de agir:

• Calcular os e os que forem < 0 considerar = 0 e

os que forem > 1 considerar = 1

• Usar técnica que garanta que as probabilidades

condicionais de Yi se situem entre 0 e 1 (logit e

probit)

iY

iY



4. O valor de R2 como medida da qualidade do

ajustamento é questionável

X

Yest.

1

R2 estará muito abaixo de 1

(em geral entre 0,2 e 0,6)

Do ponto de vista lógico o Modelo de Probabilidade Linear pressupõe que

Pi = E(Y = 1| X) aumenta linearmente com X, isto é, o efeito marginal ou

incremental de X permanece constante.



• No exemplo da amostra de 40 famílias e os dados de

renda e casa própria (Gujarati, Cap. 15) temos:

• Quando X aumenta uma unidade (US$ 1.000) a prob. de

ter casa própria aumenta sempre na mesma quantia de

0,10.

• Independe da renda ser US$8.000, US$10.000 ou

US$22.000

• O que seria esperado?

– Que a níveis muito baixos ou muito altos a probabilidade de ter

casa própria não fosse tão afetada.

ii XY 1021,09457,0ˆ



• Precisamos de um modelo de probabilidade que

tenha duas características:

1. A medida que Xi aumenta Pi = E(Yi = 1| Xi) aumenta

mas nunca sai da faixa 0 – 1

2. A relação entre Pi e Xi é não linear, se aproxima de

zero a taxas cada vez menores à medida que Xi se

reduz, e se aproxima de 1 a taxas cada vez menores

à medida que Xi aumenta muito.



• Precisamos de uma curva sigmóide, ou em S,

semelhante a FDA de uma v.a.:

• Em geral são escolhidos os modelos (1) logístico

e (2) normal, o primeiro dando origem ao modelo

logit e o sengundo ao probit (ou normit).

X0

1 FDA

Modelo Logit

• O modelo de probabilidade linear no caso da casa

própria era:

• A Função de Distribuição Logística

iiii XXYEP 21)|1(

)( 211

1)|1(

iXiiie

XYEP

Modelo Logit

• Resumindo e chamando Zi = β1 + β2Xi teremos:

• Problema: Pi é não linear em X e em β => não podemos

usar MQO

• Solução: linearizar

10

11

1

1 quando

01

1 quando

11

1

i

ii

ii

Z

Z

Zi

P

e

PZ

ePZ

e

e

eP

Modelo Logit

i

i

i

i

Z

Z

Z

Z

i

i e

e

e

e

P

P

1

11

1iZi

Z

Z

i

eP

e

eP

1

11

111

A razão de chances a favor da

posse da casa própria.

Pi = 0,8 => há 4 chances contra 1

a favor de a família possuir casa

própria.

i

i

ii

i

i

ii

XP

PL

ZP

PL

211

ln

1ln

Tirando o logaritmo:

Denominado Logit

Modelo Logit - Características

1. Quando passa de 0 a 1 (isto é, quando Z varia de -∞ a

+∞), o logit L varia de -∞ a +∞. As probabilidades são

limitadas entre 0 e 1, os logits não.

2. Embora L seja linear em X as probabilidades não o são.

3. Podemos incluir quantos regressores forem necessários.

4. O coeficiente angular mede a variação de L em resposta

a uma unidade de variação em X, isto é, nos diz o

quanto o logaritmo das chances favoráveis ao evento de

interesse variam em resposta a uma unidade de variação

na variável independente.

5. O intercepto dá as chances favoráveis quando a variável

independente é igual a zero. Como na regressão linear

pode não ter sentido prático.

Modelo Logit - Características

6. Se quisermos não as chances favoráveis ao

evento de interesse mas a própria probabilidade

do evento isso pode ser feito pela expressão:

7. A relação linear não é entre Pi e Xi, e sim entre o

logaritmo da razão de chances e Xi.

Z

Z

Zie

e

eP

11

1

Modelo Logit - Estimação

1. Dados em nível individual

– A estimativa por MQO é inviável

– Imagine Pi = 1 se a família tem casa própria

Pi = 0 c.c.

– Ao calcular os logits para estimar o modelo

• Ao invés de MQO usar Máxima Verossimilhança para

estimar os parâmetros

ii

i

ii uX

P

PL

21

1ln

c.c. 1

0ln

própria casa temfamília a se 0

1ln

i

i

L

L

Expressões não

fazem sentido

Modelo Logit – Dados Agrupados - Estimação

1. Dados agrupados ou replicados

• Com os Pi é possível obter os logits estimados

• Podemos usar MQO?

• Não!!

X

US$ mil

Ni ni

6 40 8

8 50 12

10 60 18

... ... ...

relativa frequência a é ˆ

i

ii

N

nP


• É possível demonstrar que, se Ni for

suficientemente grande e cada observação em

uma dada classe de renda Xi se distribui

independentemente como uma variável binomial,

então:

• Usar MQP

• Estimativa da variância:

)1(

1,0~

iii

iPPN

Nu

)ˆ1(ˆ

1ˆ 2

iii PPN


• Etapas para estimação da regressão logit:

1. Para cada nível de renda:

2. Para cada nível de renda obter o logit:

i

i

N

nP ˆ

i

ii

P

PL

ˆ1

ˆlnˆ



3. Transformamos:

ado transformerro de termo

ado transform

ado transform

)ˆ1(ˆ

:onde

em

1ln

*

*

*

21

*

21

21

i

ii

ii

iiii

iiii

iiiiiii

ii

i

ii

v

XX

LL

PPNw

vXwL

uwXwwLw

uXP

PL



4. Estimamos por MQO sem intercepto.

5. Avaliar coeficiente pelos métodos tradicionais de

intervalo de confiança ou teste de hipóteses.

Lembrando que as conclusões serão válidas se as

amostras forem grandes.

Exemplo da casa própria com dados agrupados na pag.

485 do Gujarati.

Modelo Logit – Dados Agrupados - Interpretação

• Interpretação do logit: para uma unidade (US$1000) de aumento na

renda o logaritmo ponderado das chances favoráveis à posse da casa

própria aumenta em 0,08 unidade.

• Interpretação das chances: tomando o antilogaritmo do logit estimado,

obtemos Pi / (1 – Pi), isto é, a razão de chances.

9642,0

)56675,14()43619,14(

)00539,0()11046,0(

07862,059474,1

2

**

R

t

ep

XwL iii

*

*

07862,059474,1

07862,059474,1

ˆ1

ˆ

ii

ii

Xw

Xw

i

i

ee

eP

P


• e0,07862 = 1,0817

• Para cada unidade de aumento da renda ponderada, as chances

ponderadas favoráveis a posse da casa própria aumentam em cerca

de 8,17%.

*

*

07862,059474,1

07862,059474,1

ˆ1

ˆ

ii

ii

Xw

Xw

i

i

ee

eP

P

Se tomarmos o anti-logaritmo do j-ésimo coeficiente angular, subtraímos 1 dele

e multiplicamos o resultado por 100, obtemos a variação percentual das chances

em favor de um aumento de uma unidade no j-ésimo regressor.


• Cálculo das probabilidades: no nosso exemplo, se

quisermos calcular a probabilidade de ter casa própria

se a renda é X = 20 (US$20.000).

02226,0

09311,0

6506,8307862,01825,459474,1

6506,83

1825,4

07862,059474,1

*

*

*

*

**

i

ii

i

i

i

i

iii

w

LL

L

L

X

w

XwL


• Cálculo das probabilidades: no nosso exemplo, se

quisermos calcular a probabilidade de ter casa própria

se a renda é X = 20 (US$20.000).

4944,01

ˆ

0225,1ˆ1

ˆ

Portanto,

ˆ1

ˆln02226,0

02226,0

02226,0

02226,0

02226,0

*

e

eP

eP

P

P

P

w

LL

i

i

i

i

i

i

ii

Dada a renda de US$20.000, a

probabilidade de que a família tenha

uma casa própria é de cerca de 49%.


• Cálculo da variação da probabilidade: envolve não

apenas β2, mas também o nível de probabilidade em

relação ao qual a variação é medida.

• Para o nível de renda de US$20.000 teremos dP/dX =

0,01965

)1(2 ii

i

PPdX

dP

Modelo Logit – Dados Não Agrupados

• Como Yi = 1 ou 0, nestes casos, teremos que recorrer a procedimentos de estimação não lineares usando o método da máxima verossimilhança.

• É um método para grandes amostras, e os erros-padrão estimados são assintóticos

• Ao invés da estatística t usamos a estatística z.

• O R2 não é adequado como medida de ajustamento.– O Eviews apresenta o R2 de McFadden que também

varia entre 0 e 1.

– Outra medida de ajustamento é o Count R2.


• Fávero et. al. apresentam outras medidas de

ajustamento:

– Pseudo R2

– Cox & Snell R2

– Nagelkerke R2

– Teste qui-quadrado: para avaliar se há diferenças

significativas entre o esperado e o observado

– Hosmer – Lemeshow Goodness of fit Test: outra

medida do poder preditivo do modelo


• Para testar a significância do modelo como um

todo o equivalente ao teste F da regressão

múltipla é a estatística da razão de

verossimilhança. Esta estatística segue a

distribuição qui-quadrado com g.l. igual ao no. de

variáveis explanatórias (o intercepto não conta).

Modelo Logit – Dados Não Agrupados -

Interpretação

• Gujarati usa um exemplo sobre previsão de notas de

alunos, com Y =1 se a nota é A e Y = 0 c.c.

• GPA = pontuação média; TUCE = pontuação no início do

curso; PSI = 1 se utilizado novo método de ensino.

• O modelo e os resultados foram:

40419,15)3(3740,0

0255,05014,00252,00082,0

3786,20951,08261,20213,13

1

2

4321

dfcLRstatistiMcFaddenR

valuesp

PSITUCEGPAL

uPSITUCEGPAP

PL

iiii

iiii

i

ii


Interpretação

• Os regressores em conjunto tem impacto positivo sobre a nota final pois LR = 15,40 cujo valor p é de cerca de 0,0015, muito pequeno.

• As três variáveis têm efeito positivo sobre o logit embora TUCE seja não significativo.

• O coeficiente 2,8261 de GPA signfica que para cada aumento de 1 na nota média o logit estimado aumenta, em média cerca de 2,83 un.

• A interpretação em relação às chances faz-se tomando o antilogaritmo dos coeficientes. Ex.: o antilog. de PSI é 10,7897 (e2,3786). Estudantes submetidos ao novo método de ensino têm cerca de dez vezes mais chances de tirar uma nota A.

40419,15)3(3740,0

0255,05014,00252,00082,0

3786,20951,08261,20213,13

1

2

4321


valuesp

PSITUCEGPAL

uPSITUCEGPAP

PL

iiii

iiii

i

ii


Interpretação

• Para obter a probabilidade de um estudante ter nota A, observa-se os

dados deste estudante (GPA, TUCE e PSI) e calcula-se Li, ou seja, o

logit estimado. Ex.: logit estimado igual a 0,8178

• Para obter a probabilidade usa-se a expressão:

40419,15)3(3740,0

0255,05014,00252,00082,0

3786,20951,08261,20213,13

1

2

4321


valuesp

PSITUCEGPAL

uPSITUCEGPAP

PL

iiii

iiii

i

ii

6937,01

1

11

1

8178,0

eP

e

e

eP

i

Z

Z

Zi

A probabilidade estimada do estudante tirar

nota A é aproximadamente 69%.

Como o observado foi Y = 1 para este estudante

podemos assumir que a previsão está próxima.

Modelo Probit

• Utiliza ao invés da função logística acumulada a

função de distribuição acumulada (FDA) da

normal.

• Para o exemplo da casa própria:

0 2

2

2

)(

22

1)(

XX

eXF

)()()|1( 2121 iiii XFXZPXYPP

Modelo Probit – Dados Agrupados -

Interpretação

• Resultados do modelo probit para o exemplo da casa

própria: β1 = -1,0166 e β2 = 0,04846

• Para conhecer o efeito de uma variação unitária em X

sobre a probabilidade de Y = 1, isto é, ter casa própria

derivamos a equação anterior e:

• Onde é a função de densidade de

probabilidade normal padrão em

• Portanto, essa avaliação dependerá do valor de X

221 )( i

i

i XfdX

dP

)( 21 iXf

iX21

Modelo Probit – Dados Agrupados -

Interpretação

• Resultados do modelo probit para o exemplo da casa

própria: β1 = -1,0166 e β2 = 0,04846

• Para X = 6 teremos na função de densidade normal

f[-1,0166+0,04846(6)] = f(-0,72548).

• Para Z = -0,72548 a densidade normal é de cerca de

0,3066, que multiplicado por β2 , dará 0,01485.

• Ou seja, partindo de um nível de renda de US$6.000,

quando a renda aumenta US$1.000 a probabilidade de

uma família ter casa própria aumenta em 1,4%.

Efeito marginal de uma variação unitária de um

regressor nos vários modelos de regressãoModelo de Regressão

Linear

O coeficiente angular mede a variação do valor

médio do regressando para uma variação unitária no

valor de um regressor, mantidas constantes as

demais variáveis.

Modelo de Probabilidade

Linear

O coeficiente angular mede diretamente a variação

da probabilidade de ocorrência de um evento em

consequência de uma variação unitária no valor de

um regressor, tudo o mais constante.

Modelo Logit O coeficiente angular nos dá a variação no logaritmo

das chances dada uma variação unitária de um

regressor. Entretanto, a taxa de variação na

probabilidade de ocorrência do evento é dada por

βjPi(1-Pi), onde βj é o coeficiente do j-ésimo regressor

e a avaliação de Pi leva em conta todas as variáveis

do modelo.

Modelo Probit A taxa de variação da probabilidade é mais

complicada. Dada por βjf(Zi), onde f(Zi) é a função de

densidade da normal padrão e Zi = β1+β2X2i+...+βkXki,

ou seja, o modelo de regressão usado na análise.

Entre os modelos logit e probit, qual é o

preferível?

• Na maioria das aplicações são bastante parecidos

• A distribuição logística tem caudas mais gordas

=> a prob. condicional Pi aproxima-se de 0 ou 1

mais lentamente

• Logit é mais simples para interpretar!!

• Os coeficientes dos dois modelos não podem ser

comparados diretamente. Embora a distribuição

logística padrão e a normal padrão tenham ambas

média zero, suas variâncias são diferentes.

Modelo Tobit

• No exemplo da casa própria, se estivéssemos interessados não na probabilidade da família ter casa própria, mas sim na relação entre o montante gasto para adquiri-la em relação a variáveis sócio-econômicas.

• Dilema: se a família não tem casa própria não há dados sobre o montante gasto!!

• Amostra censurada: quando em parte da amostra só temos informações sobre os regressores, mas não sobre o regressando.

• Também denominados modelos de regressão com variável dependente limitada

Modelo Tobit - Estimação

• Podemos estimar a regressão usando apenas a

parte da amostra para a qual temos dados da

variável dependente?

• Não! Os estimadores seriam tendenciosos e

inconsistentes.

• Solução: método da máxima verossimilhança

• Exemplo: pag. 498 Gujarati – modelo dos casos

extraconjugais de Ray Fair

c. c. 0

0 LD se 21

iii uXY

Documents

ECONOMETRIApmbortolon.wdfiles.com/local--files/home/Econometria... · 2018-05-16 · Modelos de escolha qualitativa • Quando Y é quantitativo, através dos modelos de regressão