Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
ECONOMETRIA
Prof. Patricia Maria Bortolon, D. Sc.
Modelos de Escolha Qualitativa
Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.
Rio de Janeiro. Elsevier- Campus, 2006
Modelos de escolha qualitativa
• Variável dependente: binária
• Variável independente: métricas ou binárias
• Exemplos:
– Probabilidade de falência
– Probabilidade de sinistro
– Probabilidade de aderir a segmento diferenciado de
governança corporativa
– Probabilidade de abrir capital
Modelos de escolha qualitativa
• Quando Y é quantitativo, através dos modelos de
regressão linear estimamos o valor esperado ou
valor médio, dados os valores das variáveis
independentes
• Quando Y é qualitativo, o objetivo é encontrar a
probabilidade de que algo aconteça
• Modelos de Probabilidade
),...,,( 21 kiiii XXXYE
O que vamos estudar:
• Como estimar modelos de escolha qualitativa?
Podemos usar MQO?
• Há problemas especiais de inferência?
• Como medir a qualidade do ajustamento?
Podemos usar o R2?
• Como interpretar os coeficientes do modelo?
O que não vamos estudar...
• ... mas são extensões do assunto:
– Dados contáveis ou eventos raros como variável dependente =
processos de probabilidade de Poisson. ex.: no. de artigos
publicados por um docente, no. de patentes registradas por uma
empresa, etc...
– Modelos logit e probit ordinais. Ex.: quando a variável dependente
é nível de escolaridade, ou variáveis em termos de escala do tipo
Likert (“concordo totalmente” a “discordo totalmente”)
– Modelos logit e probit multinomiais: quando a variável de resposta
tem mais de duas categorias mas não são ordenadas ou
hierarquizadas.
– Modelos de duração: ex.: o que determina a duração de uma
lâmpada; a sobrevivência de micro-empresas. Esses casos são
tratados em Análise de Sobrevivência.
Modelos de Escolha Qualitativa
• Há três abordagens para formular um modelo
probabilístico para uma variável de escolha
binária:
– O modelo de probabilidade linear
– O modelo logit
– O modelo probit
Modelo de Probabilidade Linear
iii uXY 21
1 = tem casa própria
0 = c. c.
Renda familiar
É um modelo linear de probabilidade porque:
iiii XYXYE |1Pr
Modelo de Probabilidade Linear
• Supondo E(ui)=0, para obter estimadores não
tendenciosos. A variância de Yi tem a seguinte distribuição
de probabilidade:
Yi Prob.
0 1 – Pi
1 Pi
Total 1
Se Pi = probabilidade de que Yi = 1
Dist. de Probabilidade Binomial
(np ; np(1-p))
1)|(0 ii XYE
Podemos usar MQO?
Modelo de probabilidade linear
Problemas na utilização de MQO
1. Ausência de normalidade dos termos de erro ui. Porque
assim como Yi, ui também assumem dois valores:
Yi ui Prob.
Qdo. Yi = 1 1 – β1 – β2Xi Pi
Qdo. Yi = 0 – β1 – β2Xi 1 - Pi
iii XYu 21
Também segue distribuição binomial
=> ui não se distribuem normalmente
Modelo de probabilidade linear
Problemas na utilização de MQO
• Entretanto, lembre que a medida que o tamanho
da amostra aumenta a distribuição binomial
converge para a Normal.
• Portanto, no caso de grandes amostras, a
inferência estatística dos modelos de
probabilidade linear segue os procedimentos
habituais de MQO sob premissa de normalidade.
Modelo de probabilidade linear
Problemas na utilização de MQO
2. Variâncias heterocedásticas dos termos de erro.
• Como ui segue distribuição binomial com média Pi e variância
igual a Pi(1-Pi), vemos que a variância depende da média
• A variância de ui depende, em última instância, dos valores de X e,
portanto, não é homocedástica.
• Estimadores de MQO não tendenciosos, porém não são
eficientes.
• Solução: mínimos quadrados ponderados (MQP)
iiii
iii
XXYEP
PPu
21)|(
)1()var(
iiii
i
i
i
i
ii
i
PXXw
w
u
w
X
ww
Y
1P )|E(Y1)|E(Y onde iii
21
Modelo de probabilidade linear
Problemas na utilização de MQO
3. Impossibilildade de satisfazer 0 ≤ E(Yi | Xi) ≤ 1
• Problema real da estimativa por MQO!!!
• Não há como garantir que se situe entre 0 e 1.
• Duas formas de agir:
• Calcular os e os que forem < 0 considerar = 0 e
os que forem > 1 considerar = 1
• Usar técnica que garanta que as probabilidades
condicionais de Yi se situem entre 0 e 1 (logit e
probit)
iY
iY
Modelo de probabilidade linear
Problemas na utilização de MQO
4. O valor de R2 como medida da qualidade do
ajustamento é questionável
X
Yest.
1
R2 estará muito abaixo de 1
(em geral entre 0,2 e 0,6)
Do ponto de vista lógico o Modelo de Probabilidade Linear pressupõe que
Pi = E(Y = 1| X) aumenta linearmente com X, isto é, o efeito marginal ou
incremental de X permanece constante.
Modelo de probabilidade linear
Problemas na utilização de MQO
• No exemplo da amostra de 40 famílias e os dados de
renda e casa própria (Gujarati, Cap. 15) temos:
• Quando X aumenta uma unidade (US$ 1.000) a prob. de
ter casa própria aumenta sempre na mesma quantia de
0,10.
• Independe da renda ser US$8.000, US$10.000 ou
US$22.000
• O que seria esperado?
– Que a níveis muito baixos ou muito altos a probabilidade de ter
casa própria não fosse tão afetada.
ii XY 1021,09457,0ˆ
Modelo de probabilidade linear
Problemas na utilização de MQO
• Precisamos de um modelo de probabilidade que
tenha duas características:
1. A medida que Xi aumenta Pi = E(Yi = 1| Xi) aumenta
mas nunca sai da faixa 0 – 1
2. A relação entre Pi e Xi é não linear, se aproxima de
zero a taxas cada vez menores à medida que Xi se
reduz, e se aproxima de 1 a taxas cada vez menores
à medida que Xi aumenta muito.
Modelo de probabilidade linear
Problemas na utilização de MQO
• Precisamos de uma curva sigmóide, ou em S,
semelhante a FDA de uma v.a.:
• Em geral são escolhidos os modelos (1) logístico
e (2) normal, o primeiro dando origem ao modelo
logit e o sengundo ao probit (ou normit).
X0
1 FDA
Modelo Logit
• O modelo de probabilidade linear no caso da casa
própria era:
• A Função de Distribuição Logística
iiii XXYEP 21)|1(
)( 211
1)|1(
iXiiie
XYEP
Modelo Logit
• Resumindo e chamando Zi = β1 + β2Xi teremos:
• Problema: Pi é não linear em X e em β => não podemos
usar MQO
• Solução: linearizar
10
11
1
1 quando
01
1 quando
11
1
i
ii
ii
Z
Z
Zi
P
e
PZ
ePZ
e
e
eP
Modelo Logit
i
i
i
i
Z
Z
Z
Z
i
i e
e
e
e
P
P
1
11
1iZi
Z
Z
i
eP
e
eP
1
11
111
A razão de chances a favor da
posse da casa própria.
Pi = 0,8 => há 4 chances contra 1
a favor de a família possuir casa
própria.
i
i
ii
i
i
ii
XP
PL
ZP
PL
211
ln
1ln
Tirando o logaritmo:
Denominado Logit
Modelo Logit - Características
1. Quando passa de 0 a 1 (isto é, quando Z varia de -∞ a
+∞), o logit L varia de -∞ a +∞. As probabilidades são
limitadas entre 0 e 1, os logits não.
2. Embora L seja linear em X as probabilidades não o são.
3. Podemos incluir quantos regressores forem necessários.
4. O coeficiente angular mede a variação de L em resposta
a uma unidade de variação em X, isto é, nos diz o
quanto o logaritmo das chances favoráveis ao evento de
interesse variam em resposta a uma unidade de variação
na variável independente.
5. O intercepto dá as chances favoráveis quando a variável
independente é igual a zero. Como na regressão linear
pode não ter sentido prático.
Modelo Logit - Características
6. Se quisermos não as chances favoráveis ao
evento de interesse mas a própria probabilidade
do evento isso pode ser feito pela expressão:
7. A relação linear não é entre Pi e Xi, e sim entre o
logaritmo da razão de chances e Xi.
Z
Z
Zie
e
eP
11
1
Modelo Logit - Estimação
1. Dados em nível individual
– A estimativa por MQO é inviável
– Imagine Pi = 1 se a família tem casa própria
Pi = 0 c.c.
– Ao calcular os logits para estimar o modelo
• Ao invés de MQO usar Máxima Verossimilhança para
estimar os parâmetros
ii
i
ii uX
P
PL
21
1ln
c.c. 1
0ln
própria casa temfamília a se 0
1ln
i
i
L
L
Expressões não
fazem sentido
Modelo Logit – Dados Agrupados - Estimação
1. Dados agrupados ou replicados
• Com os Pi é possível obter os logits estimados
• Podemos usar MQO?
• Não!!
X
US$ mil
Ni ni
6 40 8
8 50 12
10 60 18
... ... ...
relativa frequência a é ˆ
i
ii
N
nP
Modelo Logit – Dados Agrupados - Estimação
• É possível demonstrar que, se Ni for
suficientemente grande e cada observação em
uma dada classe de renda Xi se distribui
independentemente como uma variável binomial,
então:
• Usar MQP
• Estimativa da variância:
)1(
1,0~
iii
iPPN
Nu
)ˆ1(ˆ
1ˆ 2
iii PPN
Modelo Logit – Dados Agrupados - Estimação
• Etapas para estimação da regressão logit:
1. Para cada nível de renda:
2. Para cada nível de renda obter o logit:
i
i
N
nP ˆ
i
ii
P
PL
ˆ1
ˆlnˆ
Modelo Logit – Dados Agrupados - Estimação
• Etapas para estimação da regressão logit:
3. Transformamos:
ado transformerro de termo
ado transform
ado transform
)ˆ1(ˆ
:onde
em
1ln
*
*
*
21
*
21
21
i
ii
ii
iiii
iiii
iiiiiii
ii
i
ii
v
XX
LL
PPNw
vXwL
uwXwwLw
uXP
PL
Modelo Logit – Dados Agrupados - Estimação
• Etapas para estimação da regressão logit:
4. Estimamos por MQO sem intercepto.
5. Avaliar coeficiente pelos métodos tradicionais de
intervalo de confiança ou teste de hipóteses.
Lembrando que as conclusões serão válidas se as
amostras forem grandes.
Exemplo da casa própria com dados agrupados na pag.
485 do Gujarati.
Modelo Logit – Dados Agrupados - Interpretação
• Interpretação do logit: para uma unidade (US$1000) de aumento na
renda o logaritmo ponderado das chances favoráveis à posse da casa
própria aumenta em 0,08 unidade.
• Interpretação das chances: tomando o antilogaritmo do logit estimado,
obtemos Pi / (1 – Pi), isto é, a razão de chances.
9642,0
)56675,14()43619,14(
)00539,0()11046,0(
07862,059474,1
2
**
R
t
ep
XwL iii
*
*
07862,059474,1
07862,059474,1
ˆ1
ˆ
ii
ii
Xw
Xw
i
i
ee
eP
P
Modelo Logit – Dados Agrupados - Interpretação
• e0,07862 = 1,0817
• Para cada unidade de aumento da renda ponderada, as chances
ponderadas favoráveis a posse da casa própria aumentam em cerca
de 8,17%.
*
*
07862,059474,1
07862,059474,1
ˆ1
ˆ
ii
ii
Xw
Xw
i
i
ee
eP
P
Se tomarmos o anti-logaritmo do j-ésimo coeficiente angular, subtraímos 1 dele
e multiplicamos o resultado por 100, obtemos a variação percentual das chances
em favor de um aumento de uma unidade no j-ésimo regressor.
Modelo Logit – Dados Agrupados - Interpretação
• Cálculo das probabilidades: no nosso exemplo, se
quisermos calcular a probabilidade de ter casa própria
se a renda é X = 20 (US$20.000).
02226,0
09311,0
6506,8307862,01825,459474,1
6506,83
1825,4
07862,059474,1
*
*
*
*
**
i
ii
i
i
i
i
iii
w
LL
L
L
X
w
XwL
Modelo Logit – Dados Agrupados - Interpretação
• Cálculo das probabilidades: no nosso exemplo, se
quisermos calcular a probabilidade de ter casa própria
se a renda é X = 20 (US$20.000).
4944,01
ˆ
0225,1ˆ1
ˆ
Portanto,
ˆ1
ˆln02226,0
02226,0
02226,0
02226,0
02226,0
*
e
eP
eP
P
P
P
w
LL
i
i
i
i
i
i
ii
Dada a renda de US$20.000, a
probabilidade de que a família tenha
uma casa própria é de cerca de 49%.
Modelo Logit – Dados Agrupados - Interpretação
• Cálculo da variação da probabilidade: envolve não
apenas β2, mas também o nível de probabilidade em
relação ao qual a variação é medida.
• Para o nível de renda de US$20.000 teremos dP/dX =
0,01965
)1(2 ii
i
PPdX
dP
Modelo Logit – Dados Não Agrupados
• Como Yi = 1 ou 0, nestes casos, teremos que recorrer a procedimentos de estimação não lineares usando o método da máxima verossimilhança.
• É um método para grandes amostras, e os erros-padrão estimados são assintóticos
• Ao invés da estatística t usamos a estatística z.
• O R2 não é adequado como medida de ajustamento.– O Eviews apresenta o R2 de McFadden que também
varia entre 0 e 1.
– Outra medida de ajustamento é o Count R2.
Modelo Logit – Dados Não Agrupados
• Fávero et. al. apresentam outras medidas de
ajustamento:
– Pseudo R2
– Cox & Snell R2
– Nagelkerke R2
– Teste qui-quadrado: para avaliar se há diferenças
significativas entre o esperado e o observado
– Hosmer – Lemeshow Goodness of fit Test: outra
medida do poder preditivo do modelo
Modelo Logit – Dados Não Agrupados
• Para testar a significância do modelo como um
todo o equivalente ao teste F da regressão
múltipla é a estatística da razão de
verossimilhança. Esta estatística segue a
distribuição qui-quadrado com g.l. igual ao no. de
variáveis explanatórias (o intercepto não conta).
Modelo Logit – Dados Não Agrupados -
Interpretação
• Gujarati usa um exemplo sobre previsão de notas de
alunos, com Y =1 se a nota é A e Y = 0 c.c.
• GPA = pontuação média; TUCE = pontuação no início do
curso; PSI = 1 se utilizado novo método de ensino.
• O modelo e os resultados foram:
40419,15)3(3740,0
0255,05014,00252,00082,0
3786,20951,08261,20213,13
1
2
4321
dfcLRstatistiMcFaddenR
valuesp
PSITUCEGPAL
uPSITUCEGPAP
PL
iiii
iiii
i
ii
Modelo Logit – Dados Não Agrupados -
Interpretação
• Os regressores em conjunto tem impacto positivo sobre a nota final pois LR = 15,40 cujo valor p é de cerca de 0,0015, muito pequeno.
• As três variáveis têm efeito positivo sobre o logit embora TUCE seja não significativo.
• O coeficiente 2,8261 de GPA signfica que para cada aumento de 1 na nota média o logit estimado aumenta, em média cerca de 2,83 un.
• A interpretação em relação às chances faz-se tomando o antilogaritmo dos coeficientes. Ex.: o antilog. de PSI é 10,7897 (e2,3786). Estudantes submetidos ao novo método de ensino têm cerca de dez vezes mais chances de tirar uma nota A.
40419,15)3(3740,0
0255,05014,00252,00082,0
3786,20951,08261,20213,13
1
2
4321
dfcLRstatistiMcFaddenR
valuesp
PSITUCEGPAL
uPSITUCEGPAP
PL
iiii
iiii
i
ii
Modelo Logit – Dados Não Agrupados -
Interpretação
• Para obter a probabilidade de um estudante ter nota A, observa-se os
dados deste estudante (GPA, TUCE e PSI) e calcula-se Li, ou seja, o
logit estimado. Ex.: logit estimado igual a 0,8178
• Para obter a probabilidade usa-se a expressão:
40419,15)3(3740,0
0255,05014,00252,00082,0
3786,20951,08261,20213,13
1
2
4321
dfcLRstatistiMcFaddenR
valuesp
PSITUCEGPAL
uPSITUCEGPAP
PL
iiii
iiii
i
ii
6937,01
1
11
1
8178,0
eP
e
e
eP
i
Z
Z
Zi
A probabilidade estimada do estudante tirar
nota A é aproximadamente 69%.
Como o observado foi Y = 1 para este estudante
podemos assumir que a previsão está próxima.
Modelo Probit
• Utiliza ao invés da função logística acumulada a
função de distribuição acumulada (FDA) da
normal.
• Para o exemplo da casa própria:
0 2
2
2
)(
22
1)(
XX
eXF
)()()|1( 2121 iiii XFXZPXYPP
Modelo Probit – Dados Agrupados -
Interpretação
• Resultados do modelo probit para o exemplo da casa
própria: β1 = -1,0166 e β2 = 0,04846
• Para conhecer o efeito de uma variação unitária em X
sobre a probabilidade de Y = 1, isto é, ter casa própria
derivamos a equação anterior e:
• Onde é a função de densidade de
probabilidade normal padrão em
• Portanto, essa avaliação dependerá do valor de X
221 )( i
i
i XfdX
dP
)( 21 iXf
iX21
Modelo Probit – Dados Agrupados -
Interpretação
• Resultados do modelo probit para o exemplo da casa
própria: β1 = -1,0166 e β2 = 0,04846
• Para X = 6 teremos na função de densidade normal
f[-1,0166+0,04846(6)] = f(-0,72548).
• Para Z = -0,72548 a densidade normal é de cerca de
0,3066, que multiplicado por β2 , dará 0,01485.
• Ou seja, partindo de um nível de renda de US$6.000,
quando a renda aumenta US$1.000 a probabilidade de
uma família ter casa própria aumenta em 1,4%.
Efeito marginal de uma variação unitária de um
regressor nos vários modelos de regressãoModelo de Regressão
Linear
O coeficiente angular mede a variação do valor
médio do regressando para uma variação unitária no
valor de um regressor, mantidas constantes as
demais variáveis.
Modelo de Probabilidade
Linear
O coeficiente angular mede diretamente a variação
da probabilidade de ocorrência de um evento em
consequência de uma variação unitária no valor de
um regressor, tudo o mais constante.
Modelo Logit O coeficiente angular nos dá a variação no logaritmo
das chances dada uma variação unitária de um
regressor. Entretanto, a taxa de variação na
probabilidade de ocorrência do evento é dada por
βjPi(1-Pi), onde βj é o coeficiente do j-ésimo regressor
e a avaliação de Pi leva em conta todas as variáveis
do modelo.
Modelo Probit A taxa de variação da probabilidade é mais
complicada. Dada por βjf(Zi), onde f(Zi) é a função de
densidade da normal padrão e Zi = β1+β2X2i+...+βkXki,
ou seja, o modelo de regressão usado na análise.
Entre os modelos logit e probit, qual é o
preferível?
• Na maioria das aplicações são bastante parecidos
• A distribuição logística tem caudas mais gordas
=> a prob. condicional Pi aproxima-se de 0 ou 1
mais lentamente
• Logit é mais simples para interpretar!!
• Os coeficientes dos dois modelos não podem ser
comparados diretamente. Embora a distribuição
logística padrão e a normal padrão tenham ambas
média zero, suas variâncias são diferentes.
Modelo Tobit
• No exemplo da casa própria, se estivéssemos interessados não na probabilidade da família ter casa própria, mas sim na relação entre o montante gasto para adquiri-la em relação a variáveis sócio-econômicas.
• Dilema: se a família não tem casa própria não há dados sobre o montante gasto!!
• Amostra censurada: quando em parte da amostra só temos informações sobre os regressores, mas não sobre o regressando.
• Também denominados modelos de regressão com variável dependente limitada
Modelo Tobit - Estimação
• Podemos estimar a regressão usando apenas a
parte da amostra para a qual temos dados da
variável dependente?
• Não! Os estimadores seriam tendenciosos e
inconsistentes.
• Solução: método da máxima verossimilhança
• Exemplo: pag. 498 Gujarati – modelo dos casos
extraconjugais de Ray Fair
c. c. 0
0 LD se 21
iii uXY