Upload
md1008
View
6
Download
0
Embed Size (px)
DESCRIPTION
l
Citation preview
ECONOMETRIA
Prof. Patricia Maria Bortolon, D. Sc.
Cap. 9 Modelos de Regresso com Variveis Binrias
Fonte: GUJARATI; D. N. Econometria Bsica: 4 Edio.
Rio de Janeiro. Elsevier- Campus, 2006
Variveis Binrias
= variveis dummy assumem valores 0 ou 1
= variveis indicadoras, de categoria, qualitativas ou
binrias
So essencialmente variveis nominais
Um artifcio para classificar dados em categorias
mutuamente exclusivas como masculino e feminino
Modelos com regressores de natureza exclusivamente
binria so chamados modelos de anlise de varincia
(ANOVA)
Ver exemplo 9.1 em dummy1.txt
Exemplo 9.1
Cautela no uso de variveis binrias
Colinearidade perfeita
No exemplo com 3 regies se criarmos uma terceira
dummy D1 teremos ao somar as trs dummies uma
coluna com 51 uns, igual aos 1s implcitos em
1 = . 1 + 111 + 221 + 331 + 12 = . 1 + 112 + 222 + 332 + 23 = . 1 + 113 + 223 + 333 + 3
= . 1 + 11 + 22 + 33 +
Cautela no uso de variveis binrias
Na forma matricial12
=
1 11 211 12 221
1
2
3132
3
123
+
12
1 =
Colinearidade perfeita => essa matriz no tem inversa
Regra: se a varivel qualitativa tem m categorias teremos
que usar (m-1) variveis dummies!!
Cautela no uso de variveis binrias
Categoria de base, de referncia, de controle, de
comparao ou omitida => no se designa varivel
binria
1 o valor mdio dessa categoria
Outros so coeficientes diferenciais de intercepto
Se no usarmos a regra das classificaes menos 1,
ento temos que rodar o modelo sem intercepto
Da os valores mdios sero obtidos diretamente
Modelos ANOVA com duas variveis
qualitativas
Qual a categoria de
referncia nesse caso?
Qual o salrio mdio dos
casados?
Qual o salrio mdio dos
que residem no Sul?
Esses salrios so
estatisticamente diferentes
daqueles da categoria
referencial?
Regresses com variveis quantitativas e
qualitativas: os modelos ANCOVA
Um mtodo de controlar estatisticamente os efeitos de
regressores quantitativos, chamados de covariveis ou
variveis de controle, em um modelo que inclui tanto
regressores quantitativos quanto qualitativos ou
binrios.
Ser que o gasto pblico com educao afeta o salrio
dos professores?
= 1 + 22 + 33 + 44 + Yi = salrio mdio anual dos professores em US$
D2i = 1 se NE ou CO; 0 c.c.
D3i = 1 se Sul e 0 c.c.
Xi = gastos com ensino pblico em US$/aluno
Ver exemplo 9.3 em dummy2.txt
A varivel binria como alternativa ao teste de
Chow
No teste de Chow no possvel dizer se a diferena se
devia ao intercepto, aos coeficientes angulares ou a
ambos.
H quatro situaes possveis:
1. Regresses coincidentes = interceptos e inclinaes so
iguais
2. Regresses paralelas = interceptos diferentes e inclinaes
iguais
3. Regresses concorrentes = interceptos iguais e inclinaes
diferentes
4. Regresses dessemelhantes = interceptos e inclinaes so
diferentes
A varivel binria como alternativa ao teste de
Chow
Exemplo poupana e renda americana de 1970 a 1995
= 1 + 2 + 1 + 2 + Y = poupana
X = renda
t = anos
D = 1 para o perodo 1982 a 1995
0, nos demais casos (1970 1981)
Funo de poupana mdia, 1970 1981: = 0, = 1 + 1
Funo de poupana mdia, 1982 1995: = 1, = (1 + 2) + (1 + 2)
Se significativo indica
que a inclinao diferente
Se significativo indica
que o intercepto diferente
A varivel binria como alternativa ao teste de
Chow
Varivel binria
ADITIVA => para avaliar interceptos
MULTIPLICATIVA => para avaliar inclinaes
Para saber se as retas so coincidentes preciso testar
simultaneamente 2 = 2 = 0
Ver exemplo 9.4 em pouprenda.txt
Efeitos de interao com o uso de
variveis binrias
= 1 + 22 + 33 + + Yi = salrios-hora em US$
D2i = 1 se mulheres, 0 se homens
D3i = 1 se no brancos e no hispnicos, 0 outros
Xi = escolaridade (anos de frequncia escola)
O efeito diferencial da varivel gnero constante nas
duas categorias de raa (a diferena de salrio por ser
mulher no depende de ser branco e hispnico)
O efeito diferencial da varivel raa constante nos
dois gneros.
E se a diferena de salrio pelo gnero depender
tambm da raa?
Efeitos de interao com o uso de
variveis binrias
= 1 + 22 + 33 + + Pode haver uma interao entre as variveis D2 e D3. O
efeito sobre Y mdio pode no ser aditivo, mas tambm
multiplicativo.
= 1 + 22 + 33 + 4(23) + + Mulher no branca no hispnica: D2=1 D3=1
2 = 1, 3 = 1, = (1 + 2 + 3 + 4) + Homem no branco no hispnico: D2=0 D3=1
2 = 0, 3 = 1, = (1 + 3) + Homem branco e hispnico: D2=0 D3=0
2 = 0, 3 = 0, = 1 + Mulher branca e hispnica: D2=1 D3=0
2 = 1, 3 = 0, = (1 + 2) +
Em todos esses
caso a inclinao no
se altera. Poderamos
criar variveis de interao
para ver se a inclinao
se altera.
Variveis binrias em anlises sazonais
Uma soluo usar uma dummy para cada perodo
tendo o cuidado de estimar o modelo sem intercepto.
Usar um perodo como referncia tem a vantagem de
podermos identificar se o intercepto diferencial em
algum perodo no estatisticamente significante.
Os resduos dessa regresso sero a sria
dessazonalizada, com os componentes de tendncia,
cclico e aleatrio.
ST = s + c + t + u
Ver exemplo 9.6
Regresso linear segmentada
Quando h mudana na inclinao a partir de um
determinado valor do regressor.
= 1 + 1 + 2 +
Yi = comisso sobre vendas
Xi = volume de vendas geradas por um
vendedor
X* = valor limiar de vendas, n
D = 1 se Xi > X* e 0 se Xi < X
*
Regresso linear segmentada
Para X < X* => D = 0
(| = 0, , ) = 1 + 1
Para X > X* => D = 1
= 1, , = 1 2
+ (1 + 2)
Variveis binrias em regresses
semilogartmicas
Nessas regresses o coeficiente nos d a semi-elasticidade
(variao percentual da varivel dependente para uma variao
unitria da varivel explicativa).
S se aplica se o regressor for varivel quantitativa.
Para um modelo do tipo
= 1 + 2 + Onde Y = salrio hora em US$ e D = 1 se mulher
A funo salrio para homens ser:
(| = 0) = 1A funo salrio para mulheres ser:
= 1 = 1 + 2
D a variao
no logaritmo mdio
dos salrios-hora
Variveis binrias em regresses
semilogartmicas
O antilogaritmo dos coeficientes nos d o salrio
mediano e no o mdio (antilog x = ex)
= 1 + 2
= 1 + ln(2) => = 0 2 = 1
= 1 2 = 2
Logo, quando D varia de 0 para 1 o ln Y varia (2 1)
A variao no logaritmo uma variao relativa
Se multiplicarmos por 100 teremos a variao %
Variveis binrias em regresses
semilogartmicas
No modelo do exemplo 9.8
Para verificar a variao percentual no salrio mediano
de homens e mulheres fazemos:
0,2437 1 . 100 = 21,63%
O salrio mediano da trabalhadora (D=1) inferior ao
masculino em cerca de 21,63%.
A hiptese da normalidade
= 1 1
( 1)
= 2 2
( 2)
= 3 3
( 3)
Segue a distribuio t com n 3 graus de liberdade.
Por que 3 graus de liberdade?
t => para testar coeficientes parciais da regresso mltipla
2=> para testar hipteses sobre o verdadeiro 2 da populao
Testes de hipteses relativos aos coeficientes
de regresso individuais
H0: 2 = 0
H1: 2 0
Comparar t com tcrtico
Qual seria o tcrtico para o caso da MI?
Na prtica olhamos o p-valor
E se eu espero um determinado sinal?
O teste no mais bilateral... no exemplo da MI poderia supor que o
coeficiente de PNBpc seja negativo. Ento:
H0: 2 0
H1: 2 < 0
Teste de significncia geral da regresso
amostral
Testa se h uma relao linear entre o Y e as variveis
explicativas em conjunto
H0: 2 = 3 = 0
o mesmo que testar 2 = 0 e 3 = 0?
No!
Usamos a mesma amostra para testar 2 = 0 e 3 = 0, portanto
no so independentes
2 = 0 3 = 0 2 = 0 . (3 = 0)
[ 2 2 2 , [ 3 2
3 ] (1 )(1 )
Ento, como testar 2 = 3 = 0?
A abordagem da ANOVA: teste F
2 = 2 2 + 3 3 +
=
2 2 + 3 32
2
3
=
Se distribui como a distribuio F, com 2 e n-3 graus de liberdade.
Se 2 = 3 = 0 for verdadeira SQE e SQR sero muito prximos. O
modelo no agrega explicao. No se rejeitar H0. Se SQE for
muito maior que SQR rejeita-se H0.
STQ SQE SQR
Significncia geral de uma regresso
mltipla
Dado o modelo de regresso com k variveis:
= 1 + 22 + 33 + + + Para testar a hiptese:
H0: 2 = 3 =...= k = 0
H1: nem todos os coeficientes angulares so simultaneamente
iguais a zero
=
=
( 1)
( )
Se F > F(k-1,n-k), rejeite H0.
k =3 no caso de 3 variveis (Y, X2 e X3)
Significncia geral de uma regresso
mltipla
Testes dos coeficientes individuais no substituem o
teste geral da regresso linear mltipla.
possvel ter regresso significativa como um todo
com poucos ou nenhum coeficiente significativo
individualmente.
E tambm R2 baixos em regresses com coeficientes
significativos. Essa uma situao comum em dados
em corte transversal.
O importante a especificao correta do modelo,
sinais corretos e significncia estatstica.
Relao entre R2 e F
2 =
=
( 1)
( )
=
1.
=
1.
=
1.
2
1 2
=
2
( 1)
(1 2)
( )
Relao entre R2 e F
=
2
( 1)
(1 2)
( )
R2 = 0 => F = 0 => regresso no significante
R2 = 1 => F =>
Quando acrescentar uma nova varivel?
=
() .
( )
Se as variveis dependentes dos modelos novo e antigo
so as mesmas posso usar:
=
2 2
.
1 2
Quando acrescentar uma nova varivel?
A prtica de escolher modelo com 2 mais alto no
adequada, pois no h certeza de que o aumento
significativo.
2 aumenta se | t | da nova varivel maior que 1,
sendo | t | calculado sob a hiptese de que o coeficiente
igual a zero.
2 aumentar se t2 = F for maior que 1
Quando acrescentar um grupo de
variveis?
Quando F dado por
=
2 2
.
1 2
for maior que 1.
Teste da igualdade de dois coeficientes da
regresso
= 1 + 22 + 33 + 44 + X3 = renda, X4 = riqueza, Y = demanda do bem
H0: 3 = 4 => (3 - 4) = 0
H0: 3 4 => (3 - 4) 0
= 3 4 (3 4)
3 4
3 4 = 3 + 4 2( 3, 4)
Onde obter as var e cov?
Ver comandos em funcaocusto.txt
Mnimos quadrados restritos: teste das
restries de igualdade linear
Funo Cobb-Douglas
= 1223
3
Onde X2 = insumo de mo de obra, X3 = insumo de
capital, Y = produo
= 0 + 22 + 33 + Onde 0 = 1Se houver retornos constantes de escala = variao
equiproporcional da produo para uma variao
equiproporcional nos insumos
2 + 3 = 1
Mnimos quadrados restritos: teste das
restries de igualdade linear
A abordagem do teste t:
= 2 + 3 (2 + 3)
2 + 3
2 + 3 = 2 + 3 + 2( 2, 3)
Mnimos quadrados restritos: teste das
restries de igualdade linear
A abordagem do teste F:
=
=
2 2
1 2
Mnimos quadrados restritos: teste das
restries de igualdade linear
Como obter o modelo restrito?
2 + 3 = 12 1 = 3
= 0 + (1 3)2 + 33 + = 0 + 2 32 + 33 + 2 = 0 + 3(3 2) +
2
= 0 + 332
+
Ver comandos em cobbdouglas.txt
Teste da estabilidade estrutural ou dos
parmetros nos modelos de regresso: Teste de
Chow
Quando empregamos um modelo de regresso que
envolve o uso de sries temporais pode haver mudana
dos coeficientes ao longo do tempo.
Exemplos: (i) exportaes no Brasil antes e depois da
liberao do cmbio em 1999; (ii) demonstraes
contbeis antes e depois do IFRS
Como saber se h quebra de estrutura?
Teste de Chow
Nada mais que um teste de modelo restrito x modelo
sem restries
Aqui o restrito o que supe que os coeficientes so
iguais ao longo de todo o tempo
Premissas:
1~ 0 , 2
2~(0 , 2)
1 e 2 tm distribuies independentes
Distribuio Normal
com mesma varincia
Teste de Chow
Etapas do teste:
1. Estima-se as regresses separadas
2. Estima-se a regresso para o perodo completo
3. Obtm-se os SQR (soma quad. resduos)
4. Teste F
=
(1 + 2 2)
~ ,1+22
Ver comandos em pouprenda.txt
Teste de Chow
Advertncias:
1. As premissas devem ser respeitadas. preciso verificar se
as varincias dos erros das regresso so iguais.
2. O teste no diz se a diferena entre as regresses decorre
dos interceptos, coeficientes angulares ou de ambos.
3. O teste pressupe que conhecemos o ponto de quebra
estrutural.
Ver comandos em pouprenda.txt