30
Tópicos Tópicos em em Econometria Econometria I Aula 1/7/2013 Aula 1/7/2013 1 Modelo Modelo Tobit Tobit para para solução solução de canto de canto ©

Aula 1/7/2013 ModeloModelo Tobit Tobit parapara ... · TópicosTópicos eemm Econometria Econometria I Aula 1/7/2013 1 ModeloModelo Tobit Tobit parapara soluçãosolução de canto

  • Upload
    dotu

  • View
    219

  • Download
    0

Embed Size (px)

Citation preview

TópicosTópicos emem EconometriaEconometria II

Aula 1/7/2013Aula 1/7/2013

1

ModeloModelo TobitTobit paraparasoluçãosolução de cantode canto

©

ExemplosExemplosSoluções de canto

1. Quantidade de dinheiro doado paracaridade: muitas pessoas não fazem este tipode doação. Uma parcela expressiva dos dados será igual a zero.dados será igual a zero.

2. Horas trabalhadas pelas mulheres: muitasmulheres não trabalham. Uma fraçãosignificativa tem horas de trabalho igual a zero.

Modelo Tobit é usado para modelar estassituações

2

Exemplo: oferta de trabalho Exemplo: oferta de trabalho femininafeminina

• Suponha que queremos estimar o efeitoda educação x nas horas trabalhadas de mulheres casadas y.

• O modelo tobit é escrito a partir de umavariável latente y*, que é parcialmenteobservada pelo pesquisador:

y*=β0+β1x+u e u~N(0,σ2)

3

Exemplo: oferta de trabalho Exemplo: oferta de trabalho femininafeminina

• Se y* é positiva, y* é igual ao total de horastrabalhadas : y.

• Se y* é negativo, as horas trabalhadas, y, • Se y* é negativo, as horas trabalhadas, y, se igualam a zero.

• Por hipótese, u é normalmente distribuído.

4

Exemplo: oferta de trabalho Exemplo: oferta de trabalho femininafeminina

O modelo pode ser escrito como:

yi*=β0+β1xi+ui …………………..(1)

tal que

Horas trabalhadas

tal que

yi=yi* if yi*>0

yi=0 if yi*≤0

e

ui~N(0,σ2)

5

O subscrito i denota a i-ésima

observação. A equação (1)

satisfaz as hipóteses do modelo

linear clássico.

y*, y

Quando y* é

negativo,

horas

trabalhadas

são iguais a

zero.

Ilustração gráfica

6

Educ

Exemplo: oferta de trabalho Exemplo: oferta de trabalho femininafeminina

• A variável, y*, pode ser negativa, mas se negativa, horas trabalhadas são iguais a zero.

• O modelo Tobit considera o fato de quemuitas mulheres não trabalham, logo, horas trabalhadas são iguais a zero paramuitas.

7

ProcedimentoProcedimento de de estimaçãoestimação

• Estimação por Máxima Verossimilhança.

• Se horas trabalhadas são positivas (i.e., para as mulheres que estão trabalhando), yi*=yi, ou seja

ui= yi- β0+β1xi

A função de verossimilhança para uma mulherA função de verossimilhança para uma mulherque trabalha é dada pela função de densidadeda normal:

8

)(1

2

11

2

1 10

)(

)(2

1

2

)(

2

10

2102

210

σ

ββφ

σπσπσ

σ

ββφ

σ

ββ

σ

ββ

ii

xy

xyxy

i

xyeeL

ii

iiii −−===

−−

−−−

−−−

444 3444 21

ProcedimentoProcedimento de de estimaçãoestimação

• Se o total de horas de trabalho é igual a zero (i.e., paramulheres que não trabalham), sabemos que y*≤0.

• Neste caso, a contribuição para a verossimilhança é dada pela probabilidade de que y*≤0:

9

)(1

)(

)(

))((

)0()0(

10

10

10

10

10

*

σ

ββσ

ββσ

ββ

σ

ββ

ββ

i

i

ii

ii

iiii

x

x

xuP

xuP

uxPyPL

+Φ−=

+−Φ=

+−≤=

+−≤=

≤++=≤=

Função de verossimilhançaFunção de verossimilhança

0y if )(1

0y if )(1

i

10

i

10

≤+

Φ−=

>−−

=

σ

ββ

σ

ββφ

σ

i

i

ii

i

xL

e

xyL

• Se Di é uma variável binária que assume o valor 1 quandoyi>0. A contribuição de cada observação para a verossimilhança pode ser escrita da seguinte forma:

10

σ

ii D

i

D

iii

xxyL

+Φ−

−−=

1

1010 )(1)(1

σ

ββ

σ

ββφ

σ

FunçaFunça de verossimilhançade verossimilhança• A função de verossimilhança, L, é obtida

multiplicando todas as contribuições a verossimilhança de todas as observações:

∏=n

iLL 10 ),,( σββ

• Os valores de β0,β1 e σ que maximizam a função de verossimilhança são as estimativasTobit dos parâmetros do modelo.

• Maximiza o Log(L).

11

∏=

=i

iLL1

10 ),,( σββ

ExemploExemplo

• Banco de dados: Mroz.dta

• Iremos estimar uma equação das horas de trabalho das mulheres casadas usando o modelo Tobit model.

• Variáveis incluídas no modelo: • Variáveis incluídas no modelo: • Nwifeinc: renda do trabalho do cônjuge

• Educ: escolaridade

• Exper e expersq: experiência no mercado de trabalho

• Age: idade

• Kidslt6: filhos com menos de 6 anos

• kidsge6: filhos com mais de 6 e menos de 18 anos.

12

13

MQO e MQO e TobitTobit

• As estimativas dos coeficientes Tobit tem o mesmo sinal dos estimados por MQO.

• As estimativas Tobit são maiores que MQO contudo isto não é o efeito marginal direto pois dependerá do valor de x.pois dependerá do valor de x.

• Temos que considerar as estimativas dos efeitos marginais.

• Com relação à significância, os resultados são bem parecidos.

14

EfeitosEfeitos parciaisparciais((efeitosefeitosmarginaismarginais))

• Os parâmetros estimados βj medem o efeito de xj em y*.

• Contudo, na solução de canto, estamos• Contudo, na solução de canto, estamosinteressados no efeito de xj sobre y.

• Devemos estimar o efeito sobre o valor esperado de y.

15

EfeitosEfeitos parciaisparciais((efeitosefeitos marginaismarginais))

• A esperança de y dado x é dada por:zero

E(y|x)=P(y>0)E(y|y>0,x)

+P(y=0)E(0|y=0,x)

=P(y>0)E(y|y>0,x) …………..(1)

16

EfeitosEfeitos parciaisparciais((efeitosefeitosmarginaismarginais))

• Vamos computar E(y|y>0,x).

)),(|(

),0|(),0|( 1010

xxuuEx

xuxuxExyyE

ββββ

ββββ

+−>++=

>++++=>

17

),|(

),|(

)),(|(

1010

1010

1010

xxuu

Ex

xxuu

Ex

xxuuEx

σ

ββ

σσσββ

σ

ββ

σσσββ

ββββ

+−>++=

+−>++=

+−>++=

EfeitosEfeitos parciaisparciais((efeitosefeitosmarginaismarginais))

• Se v é uma variável com distribuiçãonormal padrão e c é uma constante, podemos usar a seguinte propriedade dadistribuição normal padrão:distribuição normal padrão:

18

)(1

)()|(

c

ccvvE

Φ−=>

φ

EfeitosEfeitos parciaisparciais((efeitosefeitos marginaismarginais))

• No nosso caso, c=-(β0+β1x). (a esperançatambém é condicionada em x, que tratamoscomo sendo constante).

• Logo, temos que:ββ xuu +

cv

19

)(

)(

)(1

)(

),|(),0|(

10

10

10

10

10

10

1010

σ

ββσ

ββφ

σββ

σ

ββσ

ββφ

σββ

σ

ββ

σσσββ

x

x

x

x

x

x

xxuu

ExxyyE

+

++=

+−Φ−

+−

++=

+−>++=>

Razão inversa de MillsRazão inversa de Mills

)(

)(

10

10

10 x

x

x+

Φ

+

++=

σ

ββσ

ββφ

σββ

Este termo é

denominado de razão

inversa de Mills λ(.)

20

)(/)()(

)2.....().........(

)(

10

10

ccc

onde

xx

Φ≡

+++=

Φ

φλ

σ

ββλββ

σ

Agora temos que calcular a Agora temos que calcular a P(y>0|x)P(y>0|x)

),(

)),((

)|0()|0(

10

10

10

ββ

ββ

ββ

xxu

P

xxuP

xuxPxyP

+−>=

+−>=

>++=>

21

)3..(..........).........(

)(1

),(

10

10

10

σ

ββσ

ββσ

ββ

σ

x

x

xxu

P

+Φ=

+−Φ−=

+−>=

Distribuição

normal é

simétrica

Esperança condicionadaEsperança condicionada

• Inserindo (2) e (3) em (1), temos que:

E(y|x)=P(y>0)E(y|y>0,x)

22

)4....()()()|( 1010

10

+++

+Φ=

σ

ββλββ

σ

ββ xx

xxyE

Efeito marginalEfeito marginal

• Logo, existem duas formas de computar o efeito parcial de x sobre a esperançacondicional de y:

)()(1),0|(

.1 101010 ββλ

ββββλβ

xxxxyyE

+

+++

−=>∂

23

O efeito de x sobre as horas

de trabalho daqueles que

estão trabalhando.

O efeito total de x nas

horas trabalhadas.

)()|(

.2

)()(1),0|(

.1

101

1010101

σ

βββ

σ

ββλ

σ

ββ

σ

ββλβ

x

x

xyE

xxx

x

xyyE

+Φ=

++

++−=

>∂

Efeito marginalEfeito marginal

• Ambos efeitos parciais dependem de x. Logo, eles diferem para as observaçõesdiferentes dos dados.

• Contudo, precisamos saber o efeito total ao• Contudo, precisamos saber o efeito total aoinvés do efeito específico para umaobservação do dado.

• Da mesma forma que nos modelos Probit e logit models, existem duas formas de computar o efeito parcial total:

24

Efeito marginal totalEfeito marginal total

• Efeito parcial na média: coloca a médiadas variáveis explicativas (PEA).

• Média do efeito parcial (APE): computa o efeito parcial para cada indivíduo no banco de dados e depois tira a médiadestes efeitos individuais.

25

ExemploExemplo

• Banco de dados Mroz.dta

1. Computar o efeito da educação nas horastrabalhadas daqueles que já estãotrabalhando:

xyyE >∂ ),0|(

2. Computar o efeito da educação nas horastrabalhadas totais:

26

educ

xyyE

>∂ ),0|(

educ

yE

∂ )x|(

Modelo 1: Tobit, usando as observações 1-753

Variável dependente: hours

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 965,305 446,413 2,1624 0,03059 **

kidslt6 -894,022 111,817 -7,9954 <0,00001 ***

kidsge6 -16,218 38,6407 -0,4197 0,67470

age -54,405 7,41562 -7,3365 <0,00001 ***

educ 80,6456 21,5778 3,7374 0,00019 ***

nwifeinc -8,81424 4,45887 -1,9768 0,04807 **

expersq -1,86416 0,537577 -3,4677 0,00052 ***

exper 131,564 17,2699 7,6181 <0,00001 ***

27

Qui-quadrado(7) 254,9067 p-valor 2,50e-51

Log da verossimilhança -3819,095 Critério de Akaike 7656,189

Critério de Schwarz 7697,806 Critério Hannan-Quinn 7672,222

sigma = 1122,02 (40,4325)

Observações censuradas à esquerda: 325

Observações censuradas à direita: 0

Teste da normalidade dos resíduos -

Hipótese nula: o erro tem distribuição Normal

Estatística de teste: Qui-quadrado(2) = 5,62698

com p-valor = 0,0599952

0000 right-censored observations 444422228888 uncensored observations Obs. summary: 333322225555 left-censored observations at hours<=0000 /sigma 1111111122222222....000022222222 44441111....55557777999900003333 1111000044440000....333399996666 1111222200003333....666644447777 _cons 999966665555....3333000055553333 444444446666....4444333355558888 2222....11116666 0000....000033331111 88888888....88888888555522228888 1111888844441111....777722225555 kidsge6 ----11116666....222211118888 33338888....66664444111133336666 ----0000....44442222 0000....666677775555 ----99992222....00007777666677775555 55559999....66664444000077775555 kidslt6 ----888899994444....0000222211117777 111111111111....8888777777779999 ----7777....99999999 0000....000000000000 ----1111111111113333....666655555555 ----666677774444....3333888888887777 age ----55554444....44440000555500001111 7777....444411118888444499996666 ----7777....33333333 0000....000000000000 ----66668888....99996666888866662222 ----33339999....8888444411114444 expersq ----1111....888866664444111155558888 ....5555333377776666666611115555 ----3333....44447777 0000....000000001111 ----2222....999911119999666666667777 ----....8888000088886666444477779999 exper 111133331111....5555666644443333 11117777....22227777999933338888 7777....66661111 0000....000000000000 99997777....66664444222233331111 111166665555....4444888866663333 educ 88880000....66664444555566661111 22221111....55558888333322222222 3333....77774444 0000....000000000000 33338888....22227777444455553333 111122223333....0000111166667777 nwifeinc ----8888....888811114444222244443333 4444....444455559999000099996666 ----1111....99998888 0000....000044448888 ----11117777....55556666888811111111 ----....0000666600003333777722224444 hours Coef. Std. Err. t P>|t| [95% Conf. Interval]

Log likelihood = ----3333888811119999....0000999944446666 Pseudo R2 = 0000....0000333344443333 Prob > chi2 = 0000....0000000000000000 LR chi2(7777) = 222277771111....55559999Tobit regression Number of obs = 777755553333

. tobit hours nwifeinc educ exper expersq age kidslt6 kidsge6, ll(0)

28 partial 777755553333 33334444....22227777555511117777 0000 33334444....22227777555511117777 33334444....22227777555511117777 Variable Obs Mean Std. Dev. Min Max

. su partial

. gen partial=_b[educ]*(1-lambda*(avxbsig+lambda))

. gen lambda=normalden(avxbsig)/normal(avxbsig)

. gen avxbsig=avxbeta/_b[/sigma]

. egen avxbeta=mean(xbeta)

. predict xbeta, xb

. *****************************

. *manually *

. *on hours for working women *

. *at average of educ *

. *Compute the Partial effect *

. *****************************

0000 right-censored observations

Efeito parcial usando

a média das

variáveis:

manualmente.

/sigma 1111111122222222....000022222222 44441111....55557777999900003333 1111000044440000....333399996666 1111222200003333....666644447777 _cons 999966665555....3333000055553333 444444446666....4444333355558888 2222....11116666 0000....000033331111 88888888....88888888555522228888 1111888844441111....777722225555 kidsge6 ----11116666....222211118888 33338888....66664444111133336666 ----0000....44442222 0000....666677775555 ----99992222....00007777666677775555 55559999....66664444000077775555 kidslt6 ----888899994444....0000222211117777 111111111111....8888777777779999 ----7777....99999999 0000....000000000000 ----1111111111113333....666655555555 ----666677774444....3333888888887777 age ----55554444....44440000555500001111 7777....444411118888444499996666 ----7777....33333333 0000....000000000000 ----66668888....99996666888866662222 ----33339999....8888444411114444 expersq ----1111....888866664444111155558888 ....5555333377776666666611115555 ----3333....44447777 0000....000000001111 ----2222....999911119999666666667777 ----....8888000088886666444477779999 exper 111133331111....5555666644443333 11117777....22227777999933338888 7777....66661111 0000....000000000000 99997777....66664444222233331111 111166665555....4444888866663333 educ 88880000....66664444555566661111 22221111....55558888333322222222 3333....77774444 0000....000000000000 33338888....22227777444455553333 111122223333....0000111166667777 nwifeinc ----8888....888811114444222244443333 4444....444455559999000099996666 ----1111....99998888 0000....000044448888 ----11117777....55556666888811111111 ----....0000666600003333777722224444 hours Coef. Std. Err. t P>|t| [95% Conf. Interval]

Log likelihood = ----3333888811119999....0000999944446666 Pseudo R2 = 0000....0000333344443333 Prob > chi2 = 0000....0000000000000000 LR chi2(7777) = 222277771111....55559999Tobit regression Number of obs = 777755553333

. tobit hours nwifeinc educ exper expersq age kidslt6 kidsge6, ll(0)

29

0000 right-censored observations 444422228888 uncensored observations Obs. summary: 333322225555 left-censored observations at hours<=0000 /sigma 1111111122222222....000022222222 44441111....55557777999900003333 1111000044440000....333399996666 1111222200003333....666644447777

educ 33334444....22227777555511117777 9999....11111111777700008888 3333....77776666 0000....000000000000 11116666....444400006666 55552222....1111444444443333 11112222....2222888866669999 variable dy/dx Std. Err. z P>|z| [ 95% C.I. ] X = 1111000011112222....0000333322227777 y = E(hours|hours>0) (predict, e(0,.))Marginal effects after tobit

. mfx, predict(e(0,.)) varlist(educ)

. ***********************************

. * for working women automatically *

. * at average of educ on hours *

. * Compute the partial effect *

. ***********************************

Efeito parcial na

média (mulheres

trabalhando)

partial_all 777755553333 44448888....77773333444400009999 0000 44448888....77773333444400009999 44448888....77773333444400009999 Variable Obs Mean Std. Dev. Min Max

. su partial_all

. gen partial_all=_b[educ]*normal(avxbsig)

.

. *****************************************

. *manually *

. *of education for the entire observation*

. *Compute the Partial effect at average *

. *****************************************

. Efeito parcial na média

de todas as

observações

30

partial_all 777755553333 44448888....77773333444400009999 0000 44448888....77773333444400009999 44448888....77773333444400009999

educ 44448888....77773333444400009999 11112222....999966663333 3333....77776666 0000....000000000000 22223333....3333222266663333 77774444....1111444411119999 11112222....2222888866669999 variable dy/dx Std. Err. z P>|z| [ 95% C.I. ] X = 666611111111....55557777000077778888 y = E(hours*|hours>0) (predict, ystar(0,.))Marginal effects after tobit

. mfx, predict(ystar(0,.)) varlist(educ)

.

. *****************************************

. *automatically *

. *of education for the entire observation*

. *Compute the Partial effect at average *

. *****************************************

Efeito parcial na média

de todas as

observações