Variáveis instrumentais e estimação GMM

VARIÁVEIS INSTRUMENTAIS E ESTIMAÇÃO GMM

Henrique Dantas Neder

Universidade Federal de Uberlândia

VARIÁVEIS INSTRUMENTAIS

O que são métodos de variáveis instrumentais (IV)? Mais conhecidos como uma solução para regressores endógenos: variáveis explicativas correlacionadas com o termo de erro da regressão, os métodos de variáveis instrumentais são uma maneira de obter estimativas de parâmetros consistentes.

A hipótese fundamental para a consistência dos estimadores OLS é que o termo de erro do modelo é não correlacionado com os regressores.

VARIÁVEIS INSTRUMENTAIS Esta hipótese, também conhecida como hipótese da

esperança condicional nula, pode ser expressa por E[u|x] = 0

Podemos entender isto de uma forma concreta: quando quisermos regredir rendimentos com anos de estudo e soubermos que uma variável latente (não observada) também determina os rendimentos. Neste caso, esta variável latente, por exemplo a habilidade do trabalhador não deve ter sua esperança condicionada ao número de anos de estudo igual a zero. Para cada valor de anos de estudo (por exemplo, 3 anos de estudo e 5 anos de estudo) temos um valor médio da variável latente diferente.

Esta condição também pode ser representada pela independência entre u e X, ou seja, covariância(u,x)=0

Vamos primeiro considerar um diagrama de causalidade para ilustrar o problema colocado por variáveis instrumentais. Podemos usar mínimos quadrados ordinários (MQO) para estimar consistentemente o seguinte modelo:regressão: y = xb + u

(1)Nenhuma associação entre x e u; MQO é consistente.X y

u

Entretanto, a regressão falha na seguinte circunstancia:

Endogeneidade: y = xb + uCorrelação entre x e u; MQO não é consistente.

x y

u

A correlação entre x e u (ou a falha na hipótese de média condicional nula E[u|x] = 0) pode ser causada por muitos fatores.

•Podemos nos referir ao problema da endogeneidade como duas ou mais variáveis determinadas conjuntamente em um modelo comportamental. Um exemplo é o modelo de equações simultâneas tal como o conhecido sistema de oferta e demanda em economia, no qual o preço e a quantidade são conjuntamente determinados no mercado.

• Um choque ou perturbação tanto na oferta como na demanda afetará tanto o preço como a quantidade no mercado de forma que ambas as variáveis estão correlacionadas com uma perturbação no sistema. Regressão por MQO resultará em estimativas inconsistentes de qualquer regressão incluindo preço e quantidade.

•Uma outra situação em que temos que utilizar variáveis instrumentais é quando temos que levar em conta fatores não observáveis relevantes e que são omitidos da equação de regressão. Tanto y como x podem ser afetados por estes fatores latentes, como por exemplo a habilidade.

• Considere a regressão de (ln) rendimentos (y) sobre anos de estudo (x). O termo de erro u engloba todos os outros fatores que afetam os rendimentos tais como habilidade inata dos indivíduos ou inteligência.

• Mas a habilidade é certamente correlacionada com o grau de escolaridade alcançado, causando uma correlação entre o regressor e o erro, Matematicamente, este é o mesmo problema que aquele causado pela endogeneidade ou erros de medida.

A solução deste problema por variáveis instrumentais pode ser vista como:Regressão de variáveis instrumentais: y = xb + u z não correlacionado com u, correlacionado com x

z x

u

y

A variável adicional z é chamada de instrumento para x. Em geral, temos muitas variáveis em x, e mais de uma destas variáveis correlacionada com u. Neste caso, necessitamos no mínimo tantas variáveis em z, quantas forem as variáveis em x correlacionadas com u.

• Para tratar do problema de endogeneidade em um sistema de oferta e demanda, um candidato z deve afetar a quantidade ofertada, mas não deve impactar diretamente a demanda do produto. Um exemplo para um produto agrícola pode ser a temperatura ou a precipitação pluviométrica: estes fatores são claramente exógenos ao mercado, mas provavelmente importantes no processo de produção.

• Consideremos o seguinte sistema de equações de “equilíbrio” de mercado:

(2)

1 2 3 1

1 2 2

d d d

o o

q p r u

p q u

• Se considerarmos a solução algébrica deste sistema de equações estruturais para as variáveis p e q, teremos as equações na forma reduzida, nas quais os fatores exógenos aparecerão em seus lados direitos.

•No caso dos fatores latentes da equação de rendimentos, podemos escolher o instrumento z como o número de anos de estudo do pai ou da mãe. Pais com maior escolaridade provavelmente têm filhos com maior escolaridade; ao mesmo tempo, fatores não observáveis que influenciam simultaneamente a renda e o nível educacional dos indivíduos não podem influenciar variáveis cujos valores são definidos no passado, como a escolaridade dos pais.

MAS PORQUE NÃO UTILIZAR SEMPRE VARIÁVEIS INSTRUMENTAIS? Pode ser difícil achar variáveis que servem como

instrumentos válidos. Muitas variáveis que têm um efeito sobre as variáveis endógenas incluídas, também têm um efeito direto sobre a variável dependente.

Estimadores IV são viesados para pequenas amostras e suas propriedades para amostras finitas são freqüentemente problemáticas. Estes estimadores podem ter resultado ruim em pequenas amostras.

A precisão de estimadores IV é menor do que a de estimadores OLS. Na presença de instrumentos fracos (instrumentos incluídos com baixa correlação com os regressores endógenos) a perda de precisão é muito grande e as estimativas IV podem não compensar a inconsistência dos estimadores OLS. Isto sugere a necessidade de um método para determinar se um dado regressor pode ser tratado como endógeno.

COMO SABER SE OS INSTRUMENTOS SÃO FORTES? Instrumentos podem ser fracos: satisfatoriamente

exógenos mas fracamente correlacionados com os regressores endógenos. Neste caso, “a cura pode ser pior do que a doença”.

Alguns autores (ver citação em Baum, 2008), formalizaram a definição de instrumentos fracos: concluem que a estatística F da equação de primeiro estágio deve exceder 10 para que os instrumentos sejam considerados fortes. Mas este critério não é suficiente para considerar que um instrumento não seja fraco.

Outros autores (Stock e Yogo, 2005) estabelecem uma regra de bolso para avaliar a fraqueza de instrumentos. Os comandos STATA ivreg2 e ivregress incorporam tabulações referentes a esta regra.

SIMULAÇÃO DE UMA VARIÁVEL ENDÓGENA

SIMULAÇÃO DE UMA VARIÁVEL ENDÓGENA

SIMULAÇÃO DE UMA VARIÁVEL ENDÓGENA – UMA NOVA ERA NO ENSINO DA ECONOMETRIA

O viés para este exemplo com variável endógena, com tamanho de amostra n = 150 e 1000 replicações é de aproximadamente 20% para (Cameron e Trivedi, 2009, pg 143), o erro padrão é cerca de 17 vezes menor e sempre rejeitamos a hipótese nula verdadeira de que .

O erro padrão (parâmetro) de x = raiz(1+.52x1) = 1.1180. 1.1180/0.06580 = 17. Ou seja, a estimativa OLS é também inconsistente para a variância do coeficiente (subestima o valor do parâmetro)

Outros exemplos podem ser testados. Esta possibilidade de simulação computacional do DGP (“data generation process”) nos coloca em uma nova era do ensino da econometria.

2 2

2 2

UM PRIMEIRO EXEMPLO DE USO DE IV

Utilizaremos um exemplo de Cameron e Trivedi(2009): gastos médicos com um regressor endógeno.

A variável dependente ldrugexp é o logaritmo dos gastos totais em medicamentos.

Os regressores são: um indicador (dummy) se os indivíduos tem seguro por empresa ou por sindicato (hi_empunion), número de condições crônicas (totchr), idade em anos (age), indicador de gênero (female), se é negro ou hispânico (blhisp) e o logaritmo natural da renda domiciliar anual em milhares de dólares (linc).


Vamos considerar que a variável hi_empunion é endógena. A justificativa é que os indivíduos escolhem uma ou outra condição baseados na sua expectativa de gasto.

Os instrumentos selecionados são: a relação da rendimentos de seguridade social – rendimentos de todas as fontes (ssiratio), uma variável indicadora qualitativa (dummy) do status de renda reduzida (lowincome), o tamanho da força de trabalho empregada na firma (firmsz) e uma variável dummy indicando se a firma é uma grande operadora com localizações múltiplas.


Os primeiros dois instrumentos são relevantes porque espera-se que sejam negativamente correlacionados com ter seguro suplementar.

Para serem instrumentos válidos (sem correlação com o termo de erro da equação de segundo estágio) – vamos admitir que se eles podem ser omitidos desta equação dado que o efeito dos rendimentos já é inteiramente capturado pela variável linc.

Os últimos dois instrumentos podem ser irrelevantes porque muitos indivíduos podem estar aposentados, serem autônomos ou estarem em sistemas de seguro de saúde privados.

UM PRIMEIRO EXEMPLO DE USO DE IV – ESTIMAÇÃO DE UM MODELO EXATAMENTE IDENTIFICADO

use "C:\cameron stata data files\mus06data.dta", clear

global x2list totchr age female blhisp linc

ivregress 2sls ldrugexp (hi_empunion = ssiratio) $x2list, vce(robust) first

Em modelos com mais de um regressor endógeno, mais de uma regressão de primeiro estágio é mostrada se a opção first é usada.

Indivíduos com seguro suplementar tem despesas com remédios que são 90% mais baixas do que as pessoas com este suplemento.

UM PRIMEIRO EXEMPLO DE USO DE IV – ESTIMAÇÃO DE UM MODELO SOBRE IDENTIFICADO

global ivmodel “ldrugexp (hi_empunion=ssiratio multlc) $x2list”

quietly ivregress 2sls $ivmodel, vce(robust)

estimates store TwoSLS

quietly ivregress gmm $ivmodel, wmatrix(robust)

estimates store GMM_hat

quietly ivregress gmm $ivmodel, wmatrix(robust) igmm

estimates store GMM_igmm

quietly ivregress gmm $ivmodel, wmatrix(cluster age)

estimates store GMM_clu

quietly ivregress 2sls $ivmodel

estimates store TwoSLS_def

estimates table TwoSLS GMM_hat GMM_igmm GMM_clu TwoSLS_def, b(%9.5f) se

FÓRMULAS DERIVADAS PARA OS ESTIMADORES

1

1 12

1

ˆ ( ´ ) ´

ˆ ( ´ ( ´ ) ´ ) ´ ( ´ )

ˆ ( ´ ´ ) ´ ´

onde:

Wé qualquer matriz de ponderação simétrica

de posto completo

Para modelos exatamente identificados, todas

as escolhas de W co

IV

SLS

GMM

Z X Z y

X Z Z Z Z X X Z Z Z y

X ZWZ X X ZWZ y

nduzem aos mesmos estimadores

FÓRMULAS DERIVADAS PARA OS ESTIMADORES

Este estimador minimiza a função objetivo:

1 1Q( )={ (y-X )´Z}W{ Z (y-X )}

que é uma forma quadrática de matriz ponderada

em Z (y-X ).

Para GMM, algumas escolhas de W são melhores

do que outras. O estimado

N N

1 1

1/2

r 2SLS é obtido com

ˆW = (Z´Z) . O estimador ótimo GMM usa W =S

ônde S é uma estimativa de Var(N ´ ).Z u

TESTE PARA ENDOGENEIDADE DO REGRESSOR

Se o regressor hi_empunion for exógeno, os estimadores IV (IV, 2SLS ou GMM) são ainda consistentes, mas eles serão muito menos eficientes do que o estimador OLS.

Hausman test: se há pequena diferença entre as estimativas IV e OLS, concluímos que o regressor é exógeno.

2

2ˆ( )

~ (1)ˆˆ( )IV OLS

H

IV OLS

TV

H0:ρ=0

COMENTÁRIOS SOBRE O TESTE HAUSMAN

O comando estat endogenous implementa o teste Durbin-Wu-Hausman (DWH).

É baseado em uma estatística de teste robusta.

Considere o modelo:

Podemos re-escrever esta equação estrutural adicionando uma variável v1 que é o erro da equação de primeiro estágio para y2:

1 2 1 1 2´ ´ , 1,....,i i i iy y x u i N

1 2 1 1 2 1´ ´ , 1,....,i i i i iy y x v u i N

COMENTÁRIOS SOBRE O TESTE HAUSMAN

Sob a hipótese nula de que y2i é éxógena

O teste de exogeneidade é o teste de H0:ρ=0 na regressão de y1 sobre y2, x1 e v1. Como v1 não é diretamente observado utiliza-se o vetor de resíduos ajustados da equação de primeiro estágio.

Para erros homocedásticos e independentes, o teste é assintoticamente equivalente ao primeiro teste Hausman. No caso mais realista de erros heterocedáticos, o teste H0:ρ=0 pode ser ainda implementado desde que utilizemos estimativas robustas de variâncias.

1 2 1[ | , ] 0i i i iE v u y x

1v

TESTES DE RESTRIÇÕES DE SOBRE IDENTIFICAÇÃO

a validade de um instrumento não pode ser testada em um modelo exatamente identificado.

mas é possível testar a validade de instrumentos em um modelo sobre identificado desde que os parâmetros do modelo são estimados usando o GMM ótimo.

o mesmo teste tem diversos nomes, incluindo teste de restrições de sobre identificação (OIR), teste de sobre identificação (OID), Teste de Hansen, teste de Sargent e teste Hansen-Sargent.

TESTES DE RESTRIÇÕES DE SOBRE IDENTIFICAÇÃO

Consideremos o valor da função de critério para o estimador GMM ótimo:

Se as condições de momento da população estão corretas, então e .

Sob a hipótese nula de que todos os instrumentos são válidos, pode ser demonstrado que tem uma distribuição assintoticamente qui-quadrado com numero de graus de liberdade igual ao número de restrições sobre identificação.

11 1ˆQ( )={ (y-X )´Z}S { Z (y-X )} N N

E[Z (y-X )]=0Z (y-X ) 0 ˆ( ) 0Q

ˆ( )Q

Admin

A estatística de teste é qui-quadrado com 1 grau de liberdade pois o número de restrições de sobre-identificação é 2-1 = 1. Não rejeitamos a hipótese nula e concluimos que a restrição de sobre-identificação é válida.

NOTAÇÃO VETORIAL (MATRICIAL) UTILIZADA

1 2 1 2

1 2

Regressores [ ] [ ] [Endógenos Exógenos]

Instrumentos Z = [Z ] [Excluídos Incluídos]

X X X Z

Z

Portanto: a matriz Z será formada por vetores-coluna constituídos dos instrumentos excluídos e dos instrumentos incluídos.

O MÉTODO DAS VARIÁVEIS INSTRUMENTAIS

Seja . O estimador de variáveis instrumentais de β é:

(3)

Apesar deste estimador ser chamado de estimador de variáveis instrumentais em dois estágios, ele pode ser calculado em duas etapas como em apenas uma através da expressão anterior.

1 1 1

1

( ' ( ' ) ' ) ' ( ' ) '

( ' ) '

IV

Z Z

X Z Z Z Z X X Z Z Z Z y

X P X X P y

1( ' ) 'ZP Z Z Z Z


Equação de primeiro estágio:

Equação de segundo estágio:

1 2 3 4 5 6

7 8 9 10

iq= + s+ expr+ tenure+ rns+ smsa+dummies+

med+ kww+ age+ mrt+u

1 2 3 4 5 6

7

lw = + s+ expr+ tenure+ rns+ smsa+dummies+

( )pred iq u




O estimador IV em dois estágios:

1 1 12

1

ˆ ˆ ˆ( ' ) ' { ' ( ' ) ' }{ ' ( ' ) ' }

( ' ) '

SLS

z z

X X X y X Z Z Z Z X X Z Z Z Z y

X P X X P y


O MÉTODO DAS VARIÁVEIS INSTRUMENTAIS: A ESTIMATIVA DA VARIÂNCIA

O estimador da variância dos parâmetros estimados pelo método 2SLS é:

2 1 1 2 12

ˆ ˆ ˆ( ) { ' ( ' ) ' } ( ' )SLS zVar X Z Z Z Z X X P X

O MÉTODO DAS VARIÁVEIS INSTRUMENTAIS – ESTIMATIVA DA VARIÂNCIA

O MÉTODO DAS VARIÁVEIS INSTRUMENTAIS – ESTIMATIVA DA VARIÂNCIA

PROPRIEDADES DA IV COM UMA VARIAVEL INSTRUMENTAL POBRE: ESTIMAÇÃO COM APENAS UMA VARIÁVEL ENDÓGENA

O viés assintótico de um estimador IV é dado pela seguinte equação:

1 1

( , )ˆlim .( , )

u

x

corr z up

corr z x

Mesmo se corr(z,u) for pequena, a inconsistência no estimador IV pode ser muito grande se corr(z,x) também for pequena.

PROPRIEDADES DA IV COM UMA VARIAVEL INSTRUMENTAL POBRE: ESTIMAÇÃO COM APENAS UMA VARIÁVEL ENDÓGENA

Outra expressão para representar o viés assintótico é dada por:

IV é preferível a OLS em termos de viés assintótico quando corr(z,u)/corr(z,x) < corr(x,u)

1 1ˆlim co ( , ). u

x

p rr x u

ESTIMAÇÃO IV: “SÍNTESE”

Quando temos certeza de que os regressores da nossa equação não estão correlacionados com os erros podemos aplicar o método convencional de OLS. No entanto, mesmo nesse caso temos que verificar se os resíduos da regressão são homocedásticos. Então temos que realizar o teste heterocedasticidade. Caso os resíduos sejam heterocedásticos temos que realizar a regressão robusta. Isto pode ser feito utilizando a opção robust (após a vírgula) no comando regress.


Caso tenhamos motivos para acreditar que um ou mais regressores sejam endógenos (tenham correlação não nula com termo de erro da equação) temos que aplicar o método das variáveis instrumentais. Então nesse caso utilizaremos o comando ivreg (ou através do menu endogenous covariates) ao invés do comando regress.


Mas mesmo nesse caso podemos ter uma complicação. Pode acontecer que aplicando o método das variáveis instrumentais os resíduos do modelo não sejam homocedásticos. Nesse caso temos que aplicar o método das variáveis instrumentais articulado com o método dos momentos generalizados (GMM).

QUAIS SÃO AS IMPLICAÇÕES DA HETEROCEDASTICIDADE PARA O ESTIMADOR IV?

Os regressores são todos

exógenos?

Utilizar estimação OLS

Os resíduos da regressão IV são homocedásticos?

Utilizar estimação IV

Utilizar estimação GMM

Os resíduos da regressão OLS são homocedásticos?

Utilizar estimação OLS com opção robustSim

Não

SimSim

Não

Não

O MÉTODO DOS MOMENTOS GENERALIZADOS (GMM) Os economistas consideram que o GMM foi

uma invenção de Lars Hansen em seu paper de 1982 na revista Econometrica.

Mas o método tem seus antecedentes nos trabalhos de Karl Pearson sobre o método dos momentos datados em 1895 e mais a frente (1928) nos trabalhos de Neyman e Egon Pearson sobre o método MCE que supera a dificuldade do método dos momentos quando temos mais condições de momentos do que parâmetros a serem estimados.

O método tem portanto, como qualquer descoberta cientifica, uma história bem definida.

O MÉTODO DOS MOMENTOS GENERALIZADOS

O GMM foi introduzido por Lars Hansen em 1982.

A equação a ser estimada, em notação matricial é:

com uma linha típica:

y X u

i i iy X u


A matriz de regressores X tem dimensão n x K, onde n é o número de observações.

Alguns dos regressores são endógenos, de forma que E(Xiui) ≠0.

Fazemos uma partição do conjunto de regressores em [X1 X2], com K1 regressores X1que de acordo com a hipótese nula são endógenos e K2=(K-K1)

regressores X2 que são considerados exógenos.


Temos então a seguinte equação:(4)

O conjunto de variáveis instrumentais é Z e tem dimensão n x L.

Este é o conjunto completo de variáveis que são exógenas - E(Ziui) =0.

Fazemos uma partição dos instrumentos em [Z1-Z2], com L1 instrumentos Z1que são instrumentos excluídos e L2=(L- L1)instrumentos Z2 =X2 que são os instrumentos incluídos / regressores exógenos.

' '1 2 1 2[ ][ ]'y X X u


A condição de ordem para identificação da equação é: L ≥ K

Isto implica que precisamos ter no mínimo tantos instrumentos excluídos (L1)quantos forem os regressores endógenos (K1).

Se L = K a equação é exatamente identificada. Se L > K a equação é sobre-identificada.

1 2 1 2

1 2

Regressores [ ] [ ] [Endógenos Exógenos]

Instrumentos Z = [Z ] [Excluídos Incluídos]

X X X Z

Z

O ESTIMADOR IV-GMM

Os L instrumentos nos dão um conjunto de L momentos:

(5)

Temos um vetor gi que é L x 1 (resultado de uma

multiplicação de uma matriz que é L x n por outra matriz que é n x 1. Dado que os L instrumentos são todos exógenos -

E(Ziui) =0, temos L momentos nulos:

(6)

' '( ) ( ) i = 1,ni i i i i ig Z u Z y X

'iZ

( ( )) 0iE g

O ESTIMADOR IV-GMM

Cada uma das L equações de momento corresponde a um momento amostral. Para um dado estimador , podemos escrever estes L momentos amostrais como:

(7)

'

1 1

1 1ˆ ˆ( ) ( ) ( )

1' ˆ

n n

i i i ii i

g g Z y Xn n

Z un

O ESTIMADOR IV-GMM

1 11 21 1 1 1 11 1

2 12 22 2 2 1 21 2

1 2 1 1

( ) ... ( ... )

( ) ... ( ... )1... ... ... ... ... ...

( ) ... ( ... )

l k k

l k k

l l l ll n n k nk

g z z z y x x

g z z z y x x

n

g z z z y x x

O ESTIMADOR IV-GMM

O que está por trás da estimação GMM? Temos que escolher um estimador para o vetor de parâmetros que torne tão próximo de zero quanto possível.

No caso de L = K (equação exatamente identificada) temos L condições (equações) iguais a K coeficientes (incógnitas) em . Neste caso, é possível achar uma matriz que soluciona o sistema .

( )g

( )g

O ESTIMADOR IV-GMM

Quando L = K a equação é exatamente identificada e uma solução única existe equivalente ao estimador padrão de variáveis instrumentais:

(9) No caso de sobre-identificação (L > K), podemos

definir um conjunto de K instrumentos: (10)

que é o estimador de mínimos quadrados em dois estágios (2SLS) que a despeito do seu nome é calculado por esta simples equação matricial.

1ˆ ( ' ) 'IV Z X Z y

1ˆ '( ' ) ' zX Z Z Z Z X P X

O ESTIMADOR IV-GMM

Se a equação é sobre-identificada (L ≥ K) temos mais equações do que incógnitas e neste caso não é possível achar uma matriz

que iguale exatamente todo o conjunto de L momentos a zero.

Neste caso, temos que tomar uma matriz de ponderação W (L x L) e utilizá-la para construir uma forma quadrática nas condições de momento.

O ESTIMADOR IV-GMM

No método 2SLS com sobre-identificação os L instrumentos disponíveis são reduzidos aos K necessários para definir a matriz Pz.

De acordo com Baum(2008), na abordagem IV-GMM esta redução não é necessária e todos os L instrumentos são usados no estimador.

Uma matriz de ponderação é empregada de forma que podemos determinar de forma que os elementos de são tão próximos de zero quanto possível.

Com L > K nem todas as L condições de momento podem ser satisfeitas e um critério de função que pondere estas condições apropriadamente é utilizado para aumentar a eficiência do estimador.

ˆGMM

ˆ( )GMMg

O ESTIMADOR IV-GMM O estimador GMM minimiza o critério (função

objetivo):

(11)

onde W é uma matriz de ponderação simétrica LxL. Resolvendo através deste critério de minimização

obtemos o estimador IV-GMM de uma equação sobre-identificada:

(12)

que será idêntico para todas as matrizes W que

diferem por um fator de proporcionalidade.

ˆ ˆ ˆ( ) ( ) ' ( )GMM GMM GMMJ ng Wg

ˆ ( ' ' ) ' 'GMM X ZWZ X X ZWZ y

O ESTIMADOR IV-GMM

A consistência é garantida por qualquer matriz de ponderação W simétrica positiva e portanto há tantos estimadores GMM como há escolhas da matriz de ponderação W.

Mas a eficiência não é garantida por uma W arbitrária. Então, o último estimador será referido como estimador GMM possivelmente ineficiente.

Estamos interessados em obter estimadores GMM eficientes: estimadores com mínima variância assintótica.

QUAL É A ESCOLHA ÓTIMA DA MATRIZ DE PONDERAÇÃO W QUE MINIMIZA A VARIÂNCIA DO ESTIMADOR GMM?

Seja S a matriz de covariância assintótica das condições de momento :

(13)

onde S é uma matriz L x L , e Ω é a matriz de variância-covariância dos

resíduos.

g1

( ( )) lim ( ' ' )

1lim ( ' )

n

n

S AVar g E Z uu Zn

E Z Zn

1( ) 'g Z u

n


A fórmula geral para a distribuição do estimador GMM é:

(14)

O estimador GMM eficiente é o estimador GMM com uma matriz de ponderação ótima que minimiza a variância assintótica do estimador. Isto é obtido pela escolha de W = S-1

1 11( ) ( ' ) ( ' )( ' )GMM XZ XZ XZ XZ XZ XZV Q WQ Q WSWQ Q WQ

n


Substituindo W por S-1 na expressão anterior do estimador GMM, temos:

(15)

com variância assintótica:

(16)

A matriz S é obtida em um primeiro estágio através da estimativa ineficiente de uma matriz diagonal que é posteriormente introduzida na expressão:

(17)

1 1ˆ ( ' ' ) ' 'GMM X ZS Z X X ZS Z y

1 1ˆ( ) ( ' ' )EGMM XZ XZV Q S Q

2 '

1

1 1ˆ ˆ'ˆn

i i ii

S u Z Z Z Zn n


onde é uma matriz diagonal de resíduos ao quadrado de , que é o estimador GMM de primeiro estágio consistente mas não necessariamente eficiente. No comando Stata ivreg2, este estimador de primeiro estágio é ,

o estimador de variáveis instrumentais.

2iu

ÎV

COMO UTILIZAR O COMANDO IVREG2 PARA ESTIMAR GMM

use MROZ, clear

ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6)

ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6), robust

ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6), gmm2s robust

ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6), gmm2s

No primeiro comando (acima) temos um estimador padrão IV/2SLS

(estamos assumindo da matriz de variância- covariância que os erros são condicionalmente homocedásticos e independentes (i.i.d.).

No segundo comando temos um estimador IV/ 2SLS com estimador da matriz de variância-covariância que é robusto a heterocedasticidade.

GMM E ERROS HETEROCEDÁSTICOS é a matriz diagonal de quadrados dos

resíduos.

onde é uma estimativa consistente de . Então, um estimador consistente de S é

(18)

21

2

2

ˆ 0ˆ ˆ

ˆ0i

n

u

u

u

îu iu

1ˆ ˆ( ' )S Z Zn

GMM E ERROS HETEROCEDÁSTICOS

1. Estimar uma equação usando IV.2. Calcule os resíduos . Use estes resíduos

para calcular a matriz de ponderação ótima:

1.

(19)

3. Calcule o estimador GMM eficiente e sua matriz de variância-covariância usando a matriz de ponderação ótima estimada.

u

1 11ˆˆ ˆ( ( ´ ))W S Z Zn

ÊGMM

QUAIS SÃO AS IMPLICAÇÕES DA HETEROCEDASTICIDADE PARA O ESTIMADOR IV?

Na presença de heterocedasticidade, o estimador IV é ineficiente mas consistente, enquanto que a matriz padrão estimada de covariância é inconsistente.

A vantagem do GMM sobre IV é clara: se a heterocedasticidade está presente, o estimador GMM é mais eficiente que o estimador simples IV, enquanto que se não existe heterocedasticidade o estimador GMM não é pior assintoticamente que o estimador IV.

No entanto, o uso do GMM tem um preço. A matriz de ponderação ótima é uma função dos quartos momentos e a obtenção de uma estimativa razoável para estes requer amostras muito grandes.

Se o erro é homocedástico, IV é preferível ao GMM eficiente (ver Slide 30).

S

TESTES DE HETEROCEDASTICIDADE Estatísticas de Breusch-Pagan/Godfrey/Cook-Weisberg

e White/Koenker são testes de heterocedasticidade em regressão OLS.

Testa-se a relação entre os resíduos da regressão e p variáveis indicadores que são relacionadas a heterocedasticidade (por hipótese).

A estatística é distribuída como uma com p graus de liberdade sob a nula de não heterocedasticidade e de que o erro da regressão é normalmente distribuído.

O poder deste teste é muito sensível a hipótese de normalidade dos resíduos: Koenker proposum teste que relaxa esta hipótese.

Estes testes estão no Stata após a estimação com o comando regress, com ivhettest, hettest e whitetst.

2

TESTES DE HETEROCEDASTICIDADE

Pagan e Hall mostraram que estes testes são válidos na regressão IV somente se há heterocedasticidade naquela equação e em nenhuma outra mais no sistema.

As outras equações estruturais no sistema (correspondentes aos regressores endógenos X1) precisam ser homocedásticas mesmo que elas não sejam explicitamente estimadas.

Este teste está disponível no Stata através do comando ivhettest após a estimação com ivreg, ivreg2 ou ivgmm0

TESTANDO A RELEVÂNCIA E VALIDADE DOS INSTRUMENTOS

Como vimos as variáveis instrumentais tem que satisfazer duas condições: precisam ser correlacionadas com os regressores endógenos e devem ser ortogonais ao processo de erro.

A primeira condição pode ser testada examinando o grau de ajuste das regressões de primeiro estágio, ou o que é o mesmo, verificar o poder explicativo dos instrumentos excluídos nestas regressões.

A estatística comumente usada é o R2 da regressão de primeiro estágio: a correlação parcial ao quadrado entre os instrumentos excluídos Z1 e o regressor endógeno (Bound).

TESTANDO A RELEVÂNCIA E VALIDADE DOS INSTRUMENTOS Um exemplo: o pesquisador tem um modelo com dois

regressores endógenos e dois instrumentos excluídos. Um dos instrumentos excluídos é altamente correlacionado com os dois regressores endógenos mas o outro instrumento excluído tem uma correlação nula (representa um processo de ruído).

O modelo está, portanto, sub-identificado: há um instrumento bom mas dois regressores endógenos. Mas a estatística F e o R2 não revelam esta fraqueza.

A solução é encontrar mais instrumentos relevantes ou eliminar o regressor endógeno da equação.

A estatística de Bound só e válida quando temos apenas um regressor endógeno.

TESTANDO A RELEVÂNCIA E VALIDADE DOS INSTRUMENTOS

Para levar em conta diversos regressores endógenos Shea(1997) propôs “uma medida de R2 parcial que leva em conta as inter-correlações entre os instrumentos”. Para um modelo contendo um único regressor endógeno, as duas medidas de R2 são equivalentes.

Se uma equação gera um grande valor do R2 parcial (Bound) e pequeno valor da medida de Shea, podemos concluir que os instrumentos tem pouca relevância para explicar os regressores endógenos e o modelo pode estar sub-especificado.

CONSEQÜÊNCIAS DE INSTRUMENTOS FRACOS Aumento do viés dos coeficientes IV estimados. O modelo não fica identificado com relação as variáveis

endógenas. Neste caso, o viés do estimador IV é o mesmo do

estimador OLS – a estimação IV é inconsistente e nada se ganha com isto.

Para equação com um único regressor endógeno uma estatística F com valor menor do que 10 significa que os instrumentos são fracos.

Deve-se ser parcimonioso na escolha dos instrumentos, dado que o viés por IV é crescente com o numero de instrumentos.

O problema de instrumentos fracos pode aparecer mesmo quando os testes de primeiro estágio são significativos aos níveis de 5 e 1 % e se dispõe de uma amostra grande.

TESTANDO A ENDOGENEIDADE DE UMA VARIÁVEL EXPLICATIVA (WOOLDRIDGE PG 473)

Suponha a seguinte equação de regressão:

(20)onde y2 é a variável que suspeita-se que seja

endógena e z1 e z2 são exógenas.

Temos a equação de y2 na forma reduzida:

(21) Como as variáveis z são não correlacionadas

com u1, y2 será não correlacionado com u1 se, e somente se v2 for não correlacionada com u1.

1 0 1 2 2 1 3 2 1y y z z u

2 0 1 1 2 2 3 3 4 4 2y z z z z v

TESTANDO A ENDOGENEIDADE DE UMA VARIÁVEL EXPLICATIVA

Existem duas maneiras de testar isto:

1) Regredir u1 contra em v2 um modelo

onde e1 é não correlacionado com v2 e tem média 0. Então u1 e v2 serão não correlacionados se, e somente se .

2) Incluir v2 como um regressor adicional na primeira equação e fazer um teste t para :

(22)

1 1 2 1u v e

1 0

1 0 1 2 2 1 3 2 1 2 1y y z z v u 1


Se a estimativa for significativa (através de um teste t) concluímos que y2 é endógena na equação (20).

Podemos também testar a endogeneidade de múltiplas variáveis explicativas. Para cada variável suspeita de ser endógena obtemos os resíduos da equação da forma reduzida e verificamos a significância conjunta da forma estrutural usando um teste F. Se rejeitarmos a nula concluímos que pelo menos uma das variáveis explicativas é endógena (Wooldridge pg. 477).

1


* TESTE DE ENDOGENEIDADE DE UMA UNICA VARIAVEL EXPLICATIVA

use "c:\textos download\wooldridge data files\mroz.dta", clear

regress educ exper expersq motheduc fatheduc if hours > 0

test motheduc fatheduc

predict v2,residuals

regress lwage educ exper expersq v2

regress lwage educ exper expersq

ivregress 2sls lwage exper expersq (educ = motheduc fatheduc)

MODELOS DE EQUAÇÃO SIMULTÂNEA E O PROBLEMA DA IDENTIFICAÇÃO

Vamos supor um modelo Keynesiano simples de determinação de renda:

Função consumo: (23) Identidade da renda: (24) onde:C = despesas de consumoY = renda I = investimento (considerado exógeno) S = poupança t = tempo u = termo de erro estocástico

0 1 1 0 < 1t t tC Y u ( )t t t tY C I S

MODELOS DE EQUAÇÃO SIMULTÂNEA E O PROBLEMA DA IDENTIFICAÇÃO

No modelo de equações simultâneas (equações 23 e 24) nota-se que C e Y são variáveis interdependentes. Quando o termo aleatório ut muda, o valor de C varia (pela equação 23) e isto faz variar Y (pela equação 24) tornando Yt e ut correlacionados em (23).

Isto faz com que o estimador OLS de em (23) seja viesado e inconsistente. Podemos demonstrar isto também (ver Gujarati, pg 582) substituindo (23) em (24) e teremos:

(25)

1

0 1t t t tY Y u I

O PROBLEMA DA IDENTIFICAÇÃO

Problema da identificação = possibilidade de obter, ou não, os parâmetros de uma equação estrutural a partir dos coeficientes estimados na forma reduzida. Em caso afirmativo, dizemos que a equação é identificada. Em caso negativo, dizemos que a equação é sub-identificada.

Uma equação é exatamente identificada quando podemos obter valores numéricos exatos para seus parâmetros.

Uma equação é sobre-identificada quando mais de um valor numérico podem ser obtidos para alguns dos parâmetros das equações estruturais.

REGRAS PARA IDENTIFICAÇÃO: A CONDIÇÃO DE ORDEM

No caso de um modelo com M equações simultâneas, para que a equação possa ser identificada, é preciso que exclua no mínimo M-1 das variáveis (tanto endógenas quanto exógenas) que aparecem no modelo.

Para que uma equação seja identificada, em um modelo de M equações simultâneas, o número de variáveis exógenas excluídas da equação não poderá ser menor do que o número de variáveis endógenas incluídas nesta equação menos 1.


Exemplo 1:Função de demanda: Função de oferta: modelo com duas variáveis endógenas, P e Q e nenhuma variável exógena. Para serem identificadas, cada uma destas equações devem excluir M-1 = 2-1 = 1 variável. Como isto não ocorre nenhuma das equações é identificada.

0 1 1 t t tQ P u

0 1 2 t t tQ P u


Exemplo 2:Função de demanda: Função de oferta: modelo com duas variáveis endógenas, P e Q e l é exógena. Para serem identificadas, cada uma destas equações devem excluir M-1 = 2-1 = 1 variável. A função de demanda não é identificada, mas a função de oferta é exatamente identificada.

0 1 2 1 + u t t tQ P l

0 1 2 t t tQ P u


Exemplo 3:Função de demanda: Função de oferta: modelo com duas variáveis endógenas, Pt e Qt e l e Pt-1 são exógenas. Para serem identificadas, cada uma destas equações devem excluir M-1 = 2-1 = 1 variável. Tanto a função de demanda como a função de oferta são exatamente identificadas. Portanto, o modelo como um todo é identificado.

0 1 2 1 + u t t tQ P l

0 1 2 1 2 t t t tQ P P u

REGRAS PARA IDENTIFICAÇÃO: A CONDIÇÃO DE POSTO

Ver Gujarati e Baum.

TESTES REALIZADOS ATRAVÉS DO COMANDO IVREG2: TESTE HANSEN-SARGAN

Teste de restrições de sobre-identificação. A hipótese nula conjunta é que os

instrumentos são instrumentos válidos, isto é, não correlacionados com o termo de erro e que os instrumentos excluídos são corretamente excluídos da equação estimada.

Sob a nula, a estatística de teste é distribuída como qui-quadrado no número de restrições de sobre-identificação.

Uma rejeição coloca em dúvida a validade dos instrumentos.

TESTES REALIZADOS ATRAVÉS DO COMANDO IVREG2: TESTE HANSEN-SARGAN

Para o estimador eficiente GMM, a estatística de teste é a estatística J de Hansen, que é o valor minimizado da função objetivo GMM.

Para os estimador 2SLS, a estatística de teste é a estatística de Sargan, calculada como N*R2 de uma regressão dos resíduos de IV sobre o conjunto completo de instrumentos.

.

TESTES REALIZADOS ATRAVÉS DO COMANDO IVREG2: ESTATÍSTICA C A estatística C, ou estatística “diferença-em-Sargan” é

obtida através da opção orthog do comando ivreg2. Permite o teste de um subconjunto de condições de

ortogonalidade, ou seja, é o teste de exogeneidade de um ou mais instrumentos.

É definida como a diferença da estatística Hansen-Sargan da equação com o conjunto menor de instrumentos e a equação com o conjunto completo de instrumentos (incluindo os instrumentos suspeitos).

Sob a nula de que todos os instrumentos são válidos a estatística C tem distribuição qui-quadrado no número de instrumentos testados.

A falha em rejeitar a nula significa que o conjunto total de condições de ortogonalidade é válido.

TESTES REALIZADOS ATRAVÉS DO COMANDO IVREG2: TESTE DE RAZÃO DE VEROSSIMILHANÇA DE CORRELAÇÃO CANÔNICA DE ANDERSON

Testa se a equação é identificada, ou seja, se os instrumentos excluídos são válidos.

A hipótese nula é que a equação é sub-especificada. Sob a nula de sub-identificação, a estatística é

distribuída como qui-quadrado com L-K+1 graus de liberdade (L= número de instrumentos excluídos e incluídos).

A estatística fornece uma medida da relevância dos instrumentos e a rejeição da nula indica que o modelo é identificado.

Importante: uma rejeição da nula deve ser interpretada com cautela, já que problemas de instrumentos fracos podem ainda estar presentes.

O COMANDO IVREG2

O COMANDO IVREG2 E COMPLEMENTARES

Uma importante referencia a ser pesquisada é:

Baum, Christopher F. Instrumental variables: Overview and advances. Boston College and DIW BerlinUKSUG 13, London, September 2007.

REFERENCIAS

Baum, C. F., M. E. Schaffer, and S. Stillman. 2003. Instrumental variables and GMM: Estimation and testing. Stata Journal 3: 1–31.

Baum, C. F. 2006. An Introduction to Modern Econometrics Using Stata. College Station, TX: Stata Press.

Baum, C. F. Schaffer M.E. e Stillman, S. 2006. Enhanced routines for instrumental variables/GMM estimation and testing, 2007.

Wooldridge, J. M.. 2003. Introductory Econometrics: A Modern Approach. 2nd ed. New York: Thomson Learning.

REFERENCIAS

Cameron, A.C. e Trivedi, P.K., 2009. Microeconometrics using Stata, StataCorp LP., College Station, Texas.

Documents

Variáveis instrumentais e estimação GMM