150

Apuntes Benavente Econometria

  • Upload
    javiera

  • View
    88

  • Download
    33

Embed Size (px)

DESCRIPTION

Apuntes profesor Benavente de Econometria

Citation preview

Page 1: Apuntes Benavente Econometria

E onometríaApuntes de Clases1José Miguel Benavente H.Marzo 2011

1Es uela de Nego ios. Universidad Adolfo Ibañez. Do umento basado en Benavente,Otero y Vasquez (2007). Primera versión. Cualquier error es responsabilidad ex lusivadel autor. jmbenaventeuai. l

Page 2: Apuntes Benavente Econometria

Índi e general1. Introdu ión 52. Modelo de Regresión Lineal 92.1. Análisis de Regresión . . . . . . . . . . . . . . . . . . . . . . . . . 92.1.1. ¾Qué es una regresión? . . . . . . . . . . . . . . . . . . . . 92.1.2. Rela iones estadísti as versus rela iones determinísti as . . 102.1.3. Regresión versus Causalidad . . . . . . . . . . . . . . . . . 112.1.4. Regresión versus Correla ión . . . . . . . . . . . . . . . . . 112.2. Análisis de regresión on dos variables . . . . . . . . . . . . . . . 142.2.1. Fun ión de regresión pobla ional (FRP) . . . . . . . . . . 162.2.2. Espe i a ión esto ásti a de la fun ión de regresión pobla- ional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.2.3. Fun ión de regresión muestral . . . . . . . . . . . . . . . . 192.2.4. Propiedades de un Estimador . . . . . . . . . . . . . . . . 222.3. Modelo de regresión on dos variables . . . . . . . . . . . . . . . . 252.3.1. Método de Mínimos Cuadrados Ordinarios . . . . . . . . . 252.3.2. Supuestos detrás del método MCO . . . . . . . . . . . . . 302.3.3. Errores estándar de los Estimadores Mínimos CuadradosOrdinarios . . . . . . . . . . . . . . . . . . . . . . . . . . . 341

Page 3: Apuntes Benavente Econometria

2.3.4. Estimador Mínimo Cuadrado Ordinario de σ2 . . . . . . . 352.4. Modelo de Regresión on k variables . . . . . . . . . . . . . . . . 372.4.1. Representa ión Matri ial del Modelo de Regresión Lineal . 372.4.2. Estimador Mínimo Cuadrados Ordinarios . . . . . . . . . . 382.5. Propiedades del estimador MCO . . . . . . . . . . . . . . . . . . . 402.5.1. Propiedad de mejor estimador lineal insesgado . . . . . . . 412.5.2. Teorema de Gauss-Markov . . . . . . . . . . . . . . . . . . 412.6. Geometría del Estimador MCO . . . . . . . . . . . . . . . . . . . 432.7. Bondad de Ajuste y Análisis de Varianza . . . . . . . . . . . . . . 442.7.1. Modelo de Regresión Lineal en Desvíos . . . . . . . . . . . 442.7.2. Análisis de Varianza . . . . . . . . . . . . . . . . . . . . . 462.7.3. Bondad de Ajuste: R2 y R2 . . . . . . . . . . . . . . . . . 472.8. Inferen ia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 492.8.1. Test t (Una hipótesis lineal) . . . . . . . . . . . . . . . . . 522.8.2. Test F (Conjunto de hipótesis lineales) . . . . . . . . . . . 602.8.3. Intervalos de Conanza . . . . . . . . . . . . . . . . . . . . 602.8.4. Test de Normalidad (Test de Jarque-Bera) . . . . . . . . . 622.9. Predi ión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 632.9.1. Medi ión de la pre isión de la predi ión . . . . . . . . . . 662.10. Estima ión Máximo Verosímil (EMV) . . . . . . . . . . . . . . . . 682.10.1. Propiedades de los estimadores MV . . . . . . . . . . . . . 692.10.2. Estima ión MV . . . . . . . . . . . . . . . . . . . . . . . . 702.11. Inferen ia en el ontexto MV . . . . . . . . . . . . . . . . . . . . . 722.11.1. Test de Razón de Verosimilitud (LR) . . . . . . . . . . . . 722

Page 4: Apuntes Benavente Econometria

2.11.2. Test de Wald (W) . . . . . . . . . . . . . . . . . . . . . . . 732.11.3. Test del Multipli ador de Lagrange (LM) . . . . . . . . . . 732.12. Algunas a ota iones respe to a la estima ión y la inferen ia MV . 753. Forma Fun ional y Espe i a ión 773.1. Regresores Esto ásti os en el Modelo de Regresión Lineal . . . . . 773.2. In orpora ión de No Linealidades . . . . . . . . . . . . . . . . . . 793.2.1. Test de No Linealidades Omitidas (Test de Reset) . . . . . 803.3. Variables Dummies o ualitativas . . . . . . . . . . . . . . . . . . 823.3.1. Posibles usos de las variables Dummies . . . . . . . . . . . 873.4. Variable Dependiente Rezagada . . . . . . . . . . . . . . . . . . . 913.4.1. Ejemplo y adverten ias sobre el uso de variable dependienterezagada omo regresor . . . . . . . . . . . . . . . . . . . . 933.5. Sele ión de Modelos . . . . . . . . . . . . . . . . . . . . . . . . . 953.5.1. Ejemplo: Retornos a la edu a ión, diferen ias entre hom-bres y mujeres . . . . . . . . . . . . . . . . . . . . . . . . . 963.6. Regresión Parti ionada . . . . . . . . . . . . . . . . . . . . . . . . 993.7. Omisión de Variables Relevantes . . . . . . . . . . . . . . . . . . . 993.7.1. Impa to sobre el Insesgamiento . . . . . . . . . . . . . . . 993.7.2. Impa to sobre la Varianza . . . . . . . . . . . . . . . . . . 1003.7.3. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1003.8. In lusión de Variable Irrelevantes . . . . . . . . . . . . . . . . . . 1013.8.1. Impa to sobre Insesgamiento . . . . . . . . . . . . . . . . . 1013.8.2. Impa to sobre Varianza . . . . . . . . . . . . . . . . . . . 1023.8.3. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1033

Page 5: Apuntes Benavente Econometria

3.9. Perturba iones no Esféri as . . . . . . . . . . . . . . . . . . . . . 1053.9.1. Conse uen ias de estima ión por MCO . . . . . . . . . . . 1063.9.2. Estima ión E iente: Mínimos Cuadrados Generalizados . 1063.9.3. Test de Hipótesis . . . . . . . . . . . . . . . . . . . . . . . 1073.9.4. Estima ión uando Ω es des ono ida:Mínimos Cuadrados Fa tibles . . . . . . . . . . . . . . . . 1083.9.5. Hetero edasti idad . . . . . . . . . . . . . . . . . . . . . . 1093.9.6. Auto orrela ión . . . . . . . . . . . . . . . . . . . . . . . . 1184. Problemas on los datos 1374.1. Multi olinealidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 1374.1.1. Multi olinealidad Exa ta y Multi olinealidad Aproximada 1394.1.2. Dete ión de Multi olinealidad . . . . . . . . . . . . . . . 1394.1.3. Otros métodos de dete ión de multi olinealidad . . . . . . 1414.1.4. Remedios ontra la Multi olinealidad . . . . . . . . . . . . 1434.2. Error de Medi ión . . . . . . . . . . . . . . . . . . . . . . . . . . . 1454.2.1. Estima ión por Variables Instrumentales . . . . . . . . . . 1474.2.2. Test de Hausman . . . . . . . . . . . . . . . . . . . . . . . 148

4

Page 6: Apuntes Benavente Econometria

Capítulo 1Introdu iónE onometría es la ien ia que apli a métodos matemáti os y estadísti os al aná-lisis de datos e onómi os, on el objetivo de dotar de una base empíri a a unateoría e onómi a, para así refutarla o veri arla.Aunque la e onometría pare e ser tan antigua omo la misma ien ia e onómi a,sólo en 1930 se rea la So iedad E onométri a, la ual sistematizó su estudio yprá ti a. En 1933 se lanza el primer número de E onometri a en el que RagnanFrish (uno de los fundadores de la So iedad E onométri a, a quién de he ho, sele a redita el haber a uñado el término .E onometría") desta a: "La experien iaha mostrado que ada uno de estos tres puntos de vista, el de la estadísti a, lateoría e onómi a y las matemáti as, es ne esario, pero por si mismo no su ientepara una omprensión real de las rela iones uantitativas de la vida e onómi amodera. Es la unión de los tres aspe tos lo que onstituye una herramienta deanálisis potente. Es la unión lo que onstituye la e onometría".Sin embargo, las metodologías apli adas en e onometría (los tres puntos de vistade Frish), no han sido utilizados ex lusivamente por la ien ia e onómi a. Otras ien ias naturales también han aprove hado sus ventajas. Sin embargo, en el ampo del omportamiento e onómi o adquieren espe ial parti ularidad y rele-van ia, en tanto el ambiente y el omportamiento e onómi os, son esen ialmenteno-experimentales, olo ándonos en situa iones donde todas las variables relevan-tes pare en moverse onstantemente y donde existen fa tores imprede ibles quepueden alterar los resultados. Es por esto que la e onometría es esen ialmenteuna ien ia no determinísti a, donde se re ono e la existen ia de fa tores esen- ialmente imprede ibles que determinan nuestras on lusiones.5

Page 7: Apuntes Benavente Econometria

Capitulo 1: Introdu ión E onometríaEs uela de Nego ios, UAILa metodología e onométri a se puede detallar (a grandes rasgos) según lo enun- ia la Figura 1. En primer lugar ontamos on una teoría e onómi a que bus avalidez. Para ella, es ne esario en ontrar su equivalente modelo e onométri o(rela iones matemáti as que des riban el omportamiento de los agentes involu- rados). Para estimar enton es di ho modelo, se ne esita de la e ua ión resultantedel modelo, los datos que ella impli a y los supuestos bajo los uales se onstruye.Sólo una vez que ontamos on di hos ingredientes se pro ede a estimar uan-titativamente las predi iones o impli an ias expuestas por la teoría e onómi aini ial. Luego, se debe realizar inferen ia o pruebas de hipótesis, las uales nos in-di arán si nuestros resultados son estadísti amente signi ativos. Si la respuestaes si, enton es sólo queda realizar las predi iones pertinentes y las re omenda- iones de políti a aso iadas. Si la respuestas es no, enton es, debemos revisar losposibles errores que existan a nivel de teoría o metodología.

6

Page 8: Apuntes Benavente Econometria

Capitulo 1: Introdu ión E onometríaEs uela de Nego ios, UAITEORIA ECONOMICA

MODELO ECONOMETRICO

ECUACION DATOS SUPUESTOS

ESTIMACION

INFERENCIA Y PRUEBA DE HIPOTESIS

PREDICCIONES Y

RECOMENDACIONES DE POLITICA

SI NO

TEORIA VERIFICADA7

Page 9: Apuntes Benavente Econometria

Capitulo 1: Introdu ión E onometríaEs uela de Nego ios, UAIEsta breve des rip ión no es más que una somera vista a lo que realmente impli aha er e onometría. El amino no está exento de di ultades (en términos de la alidad de los datos, de la di ultad de medir las variables que la teoría indi a,de los supuestos que realizamos, et ), sin embargo, esto, más que una di ultad,impli a un desafío.

8

Page 10: Apuntes Benavente Econometria

Capítulo 2Modelo de Regresión Lineal2.1. Análisis de Regresión2.1.1. ¾Qué es una regresión?La regresión es un elemento fundamental en la E onometría, orresponde a unestudio de dependen ia entre una variable dependiente y una o más variablesexpli ativas. El análisis de regresión tiene omo objeto estimar y/o prede ir elpromedio pobla ional de la variable dependiente para valores jos de la(s) varia-ble(s) expli ativa(s).Por ejemplo, observemos la Figura 1, en el eje de las abs isas tenemos nuestravariable expli ativa (X): notas ontroles, y en el eje de las ordenadas tenemosnuestra variable dependiente (Y): nota examen.

Notas de los controles

Figura 1: Distribución de las Notas del Examen vs. Promedio Notas deControles9

Page 11: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Podemos observar dos osas: primero, para ada nota posible en los ontroles(3.0, 4.0,..) tenemos un rango o distribu ión de notas en el examen y segundo,el promedio de notas en el examen es mayor mientras mayores son notas de los ontroles. Esto último se puede apre iar al trazar una re ta que una los valorespromedios de notas en examen para ada nota en los ontroles (linea negra del laFigura 1), la que orresponde a la re ta de regresión. Esta nos permite, para ada nivel de edad, prede ir la estatura promedio orrespondiente.2.1.2. Rela iones estadísti as versus rela iones determinís-ti asLa alidad de un produ to, por ejemplo el vino, dependerá de omo fue su ose hay por lo tanto, de variables omo la temperatura al que estuvo expuesta la uva, la antidad de lluvia, sol y los fertilizantes. La rela ión entre estas variables expli- ativas y la alidad del vino tiene una naturaleza estadísti a, ya que si bien estasvariables ayudan al produ tor de vino a saber más o menos omo será la ose ha,no podrá prede ir en forma exa ta la alidad del produ to debido a los erroresinvolu rados en estas variables y porque pueden haber otros fa tores difí iles demedir que estén afe tando la alidad del vino.La variable dependiente, en este aso la alidad del vino, tiene una variabilidadaleatoria, ya que no puede ser expli ada en su totalidad por las variables expli- ativas.En la e onometría nos interesa la dependen ia estadísti a entre variables, dondetratamos on variables aleatorias, es de ir, variables que tienen una distri-bu ión de probabilidad. La dependen ia determinísti a, por el ontrario, tratarela iones omo la ley de gravedad de Newton1, las que son exa tas (no tienennaturaleza aleatoria).1La ley de gravedad de Newton plantea que toda partí ula en el universo atrae a ualquierotra partí ula on una fuerza dire tamente propor ional al produ to de sus masas e inversamentepropor ional al uadrado de la distan ia entre ellas: F=k(m1m2

r2), donde F=fuerza, m1 y m2son la masa de las dos partí ulas, r es la distan ia y k una onstante de propor ionalidad. Estaes una rela ión determinísti a, ya que para valores de masas, distan ia y onstante sabemosexa tamente a la fuerza que se atraen estas partí ulas. Si alguna de las variables estuvieramedida on error, la ley de Newton pasa a ser una rela ión estadísti a, y F se onvierte en unavariable aleatoria. 10

Page 12: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.1.3. Regresión versus CausalidadEs importante tener laro que la regresión es una rela ión estadísti a, que noimpli a ausalidad apriori. En el ejemplo del vino, no hay una razón estadísti apara suponer que la lluvia no depende de la alidad del vino. Pero nuestro sentido omún nos ha e onsiderar omo variable dependiente la alidad del vino y no lalluvia. Es importante re ordar de aquí en adelante que una rela ión estadísti ano puede por sí misma impli ar en forma lógi a una ausalidad.2.1.4. Regresión versus Correla iónEl Análisis de Correla ión está estre hamente rela ionado on el de regresiónaunque on eptualmente son dos osas muy diferentes. El análisis de orrela ióntiene omo objetivo medir el grado de aso ia ión lineal entre dos variables, medidaa través del oe iente de orrela ión. Por ejemplo, se puede estar interesadoen medir el grado de orrela ión entre años de edu a ión y salario. En ambio, elanálisis de regresión trata de estimar o prede ir el valor promedio de salario paraun nivel dado de edu a ión.Las diferen ias fundamentales son que, en el análisis de regresión, tenemos unavariable dependiente y una o más expli ativas, la que son tratadas en forma asimé-tri a: la variable dependiente es aleatoria, tiene una distribu ión de probabilidad,en ambio las variables expli ativas toman valores jos. En el análisis de orrela- ión las variables son tratadas de forma simétri a: la orrela ión entre edu a ióny salario es igual a la orrela ión entre salario y edu a ión. Además ambas va-riables son aleatorias. Así, si x e y son dos variables aleatorias, el oe iente de orrela ión se dene de la siguiente manera:ρyx =

E [x− E(x)] [y − E(y)]√var(x)var(y)

=σxy√σ2xσ

2yLo que se al ula para una muestra de la siguiente forma:

ρyx =

∑ni=1

[xi −X

] [yi − Y

]√∑n

i=1

[xi −X

]2√∑ni=1

[yi − Y

]2 on X = 1n

∑ni=1 xi e Y = 1

n

∑ni=1 yi.De ahora en adelante denotaremos on un ˆ a los estimadores de un estadísti- o obtenidos a partir de informa ión muestral.11

Page 13: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Ejemplo 1: Portales de Internet, orrela ión entre número de visitas y valor dela empresa:

Ejemplo 2: Correla ión entre Empleo y Produ to (serie de tiempo):

12

Page 14: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Ejemplo 3: Correla ión entre Produ to per- apita y ranking fútbol:

Ejemplo 4: Correla ión entre temperatura media del día y estudiantes ausentesa lases:

13

Page 15: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Algunas pre au iones on el oe iente de orrela ión:Cuidado uando el grado de orrela ión muestral depende de solo unaspo as observa iones.El oe iente de orrela ión mide una rela ión lineal. Por lo tanto, unavariable puede depender de otra aún uando la orrela ión sea ero si larela ión es no lineal.Correla ión no impli a ausalidad e onómi a, es sólo una rela ión estadís-ti a.Correla ión puede indi ar rela ión espuria.No olvidar que la orrela ión muestral es una variable aleatoria y que porlo tanto, el oe iente por si sólo no garantiza la existen ia de una rela iónestadísti a entre las series.2.2. Análisis de regresión on dos variablesPara esta se ión asumiremos que existe una variable dependiente (Y) que esexpli ada por sólo una variable (X).Consideremos el siguiente ejemplo. En la Tabla 1 se presentan datos de salariosy nivel de edu a ión para una pobla ión de 60 individuos 2Tabla 1: Salarios y Años de Edu a iónAños de Edu a ión (X)Salario (Y) 8 9 10 11 12 13 14 15 16 1716000 18260 15000 15000 20000 20000 21912 35000 40000 6000032868 36520 40000 40000 50000 54780 60000 73040 90000 12000050000 54780 58000 60000 73040 80000 89000 100000 105000 16578480000 82170 90000 90000 100000 100500 120000 140000 180000 250000100000 109560 120000 120000 140000 160000 200000 230000 280000 365200150000 170000 182600 188973 219120 257880 300000 400000 434686 600000219120 273900 280000 328680 365200 400000 500000 600000 730400 1095600300000 365200 380000 434120 500000 550000 650000 883085 1000000 1643400547800 730400 913000 821700 1064558 1460800 1500000 1826000 2487041 4000000E(Y|X) 166199 204532 230956 233164 281324 342662 382324 476347 594125 922220La pobla ión tiene 10 niveles distintos de edu a ión, que van desde 8 a 17. Para ada uno de estos niveles tenemos 9 individuos on distintos salarios. A pesar de lavariabilidad en los salarios para ada nivel edu a ional onsiderado, en promedio2Una pobla ión de 60 individuos puede pare er un po o pequeña, pero por el momento onsideremos que estas familias son el total existente14

Page 16: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.el salario se in rementa a medida que los años de edu a ión aumentan. Estoúltimo se puede veri ar al al ular el promedio para ada nivel de edu a ión, loque se presenta en la última linea de la Tabla 1, estos orresponden a los valoresesperados ondi ionales, ya que dependen de los valores dados de la variable X.En la Figura 2, los valores medios ondi ionales están mar ados on una ruz. Launión de estos valores representa la Re ta de regresión pobla ional, dondeel término pobla ional se reere a que estamos trabajando on el total de lapobla ión.0

10

00

00

02

00

00

00

30

00

00

04

00

00

00

sa

lario

8 10 12 14 16 18

xx

x xx x x

xx

x

Figura 2: Distribución de los salarios para distintos niveles de educación.

Recta de regesiónpoblacional (RRP)

Escolaridad

Deni ión: La urva de regresión pobla ional es simplemente el lugar geométri- o de las medias ondi ionales de la variable dependiente para los valores jos dela(s) variable(s) expli ativa(s).En el ejemplo anterior los valores de Y (salario) no estaban distribuidos de formasimétri a en torno al valor promedio para ada valor X, desde ahora asumiremosque esto si se umple, tal omo lo podemos apre iar en la Figura 3.

15

Page 17: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.

Figura 3: Ingreso semanal y Gasto semanal. Distribución simétrica

En este ejemplo, se ve la rela ión entre ingreso semanal y gasto en onsumosemanal, para ada nivel de ingreso se tiene un rango de gasto que se distribuyeen forma simétri a entorno al valor promedio ondi ional de gasto.2.2.1. Fun ión de regresión pobla ional (FRP)De lo anterior es laro que la media ondi ional E(Y|Xi) es fun ión de Xi, dondeXi es un valor dado de X:E(Y |Xi) = f(Xi) (2.1)donde f(·) es una fun ión ualquiera, en el ejemplo anterior era una fun ión lineal.La e ua ión (2.1) se denomina Regresión Pobla ional.Que forma tiene f(·) es una pregunta empíri a, aunque mu has ve es la teoríanos puede ayudar bastante. Supongamos que en nuestro ejemplo anterior el sa-lario esta rela ionado linealmente on la edu a ión, así podemos suponer que la16

Page 18: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.fun ión de regresión pobla ional E(Y|Xi) es una fun ión lineal de Xi, es de ir:E(Y |Xi) = β1 + β2Xi (2.2)donde β1 y β2 se denominan oe ientes de regresión. Así el objetivo es estimar

β1 y β2 a partir de datos de X e Y.2.2.2. Espe i a ión esto ásti a de la fun ión de regresiónpobla ionalEn los dos ejemplos anteriores veíamos que a medida que se in rementa la varia-ble expli ativa (edu a ión o ingreso), el valor promedio de la variable dependiente(salario o gasto) también se in rementaba. Sin embargo, este patrón se da soloa nivel de promedios. A nivel individual esto no es ne esariamente ierto. En laTabla 1 podemos ver que el individuo que gana menos ingreso on 9 años de edu- a ión, gana menos que el individuo on 8 años de edu a ión on mayor salario.Existe una dispersion de los valores individuales de Yi en torno al promedio ondi ional de esta variable. De esta forma, podemos denir:ui = Yi − E(Y |Xi)oYi = E(Y |Xi) + ui (2.3)donde ui es una variable aleatoria no observable que toma valores positivos o ne-gativos. Este término surge pues no se puede esperar que todas las observa iones

Yi sean igual al promedio ondi ional a Xi.Re ordemos que la regresión es una rela ión estadísti a, a pesar de ono er losvalores de Xi, esto no nos permite prede ir en forma exa ta Yi. Lo que no pode-mos expli ar debido a que tiene naturaleza aleatoria se representa a través de ui,denominado término de error esto ásti o.Enton es siguiendo el ejemplo de la Figura 3, podemos de ir que el gasto de unafamilia individual (Yi) orresponde a la suma de dos omponentes:E(Y|Xi), que orresponde a la media de gasto de todas las familias on elmismo nivel de ingresos → Componente Determinísti oui → Componente Aleatorio 17

Page 19: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Si E(Y|Xi) es lineal en Xi, podemos es ribir la e ua ión (2.3) de la siguienteforma:Yi = E(Y |Xi) + ui

= β1 + β2Xi + ui (2.4)Tomando el valor esperado ondi ional en Xi a la e ua ión (2.4):E(Yi|Xi) = E[E(Y |Xi)|Xi] + E(ui|Xi)

= E(Y |Xi) + E(ui|Xi) (2.5)Debido a que E(Yi|Xi) = E(Y |Xi), impli a que:E(ui|Xi) = 0 (2.6)Así, el supuesto de que la re ta de regresión pasa a través de las medias ondi- ionales de Y, impli a que la media ondi ional de ui es ero.

18

Page 20: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.2.3. Fun ión de regresión muestralEn la mayoría de los fenómenos e onómi os a estudiar, no disponemos de lasobserva iones totales de la pobla ión, omo hemos supuesto hasta ahora. En laprá ti a se tiene al an e nada más que a una muestra de los valores de Y que orresponden a unos valores jos de X. En este aso tenemos que estimar la fun- ión de regresión pobla ional en base a informa ión muestral.Los datos pobla ionales aso iados a la Figura 3 son los siguientes:Tabla 2. Ingreso familiar (X) y Gasto en onsumo (Y).Y|X 80 100 120 140 160 180 200 220 240 260Gasto en 55 65 79 80 102 110 120 135 137 150 onsumo 60 70 84 93 107 115 136 137 145 152familiar 65 74 90 95 110 120 140 140 155 175semanal 70 80 94 103 116 130 144 152 165 178(Y) 75 85 98 108 118 135 145 157 175 180- 88 - 113 125 140 - 160 189 185- - - 115 - - - 162 - 191Media Condi ional 65 77 89 101 113 125 137 149 161 173Supongamos que nosotros no ono emos estos datos, es de ir, no tenemos a esoa las observa iones orrespondientes a la pobla ión total. Tenemos a nuestra dis-posi ión sólo una muestra (Tabla 3), la que ha sido obtenida de forma aleatoriade la pobla ión.Es importante notar que a partir de una pobla ión podemos sa ar una gran an-tidad de muestras en forma aleatoria y en la realidad nosotros observamos solouna de ellas. Debido a esta variabilidad en las muestras podremos estimar la FRPpero no de manera pre isa. Para ejempli ar esto supongamos que además de lamuestra en la Tabla 3 se sa o otra muestra (Tabla 4) a partir de la informa iónpobla ional. Tabla 3. Muestra aleatoriade la pobla ión en tabla 2.Y X70 8065 10090 12095 140110 160115 180120 200140 220155 240150 260Tabla 4. Muestra aleatoriade la pobla ión en tabla 2.Y X55 8088 10090 12080 140118 160120 180145 200135 220145 240175 26019

Page 21: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Al gra ar los datos de las Tablas 3 y 4 obtenemos los diagramas de dispersion enla Figura 4. En este diagrama se han trazado dos re tas de regresión mues-tral: FRM1 orresponde a la primera muestra y FRM2 orresponde a la segunda.Como vemos, no es posible asegurar ual de las dos re tas muestrales representamejor la re ta de regresión pobla ional.Enton es es importante tener en mente que las re tas de regresión muestral repre-sentan la re ta de regresión pobla ional, pero debido a u tua iones muestralespueden ser onsideradas sólo omo una aproxima ión.Como ontraparte muestral la fun ión de regresión muestral puede es ribirse omo:Yi = β1 + β2Xi (2.7)donde Yi es el estimador de E(Y|Xi), β1 es el estimador de β1 y β2 es el estimadorde β2.

Figura 4: Rectas de Regresión basadas en dos muestras distintas

Deni ión: Un estimador es una regla, fórmula o método que di e ómo deter-minar el parámetro pobla ional a partir de la informa ión suministrada por lamuestra disponible.De igual manera que para el aso pobla ional la fun ión de regresión muestral20

Page 22: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.también tiene una representa ión esto ásti a:Yi = β1 + β2Xi + ui (2.8)Enton es, el objetivo del Análisis de Regresión es estimar la Fun ión de regresiónpobla ional:Yi = β1 + β2Xi + ui (2.9) on base en la Fun ión de regresión muestral:Yi = β1 + β2Xi + ui (2.10)Esta aproxima ión se puede ver en la Figura 5:

Figura 5: Rectas de Regresión muestral y poblacional

En términos de la fun ión de regresión muestral, la Yi observada puede ser ex-presada omo:Yi = Yi + ui (2.11)y en términos de la fun ión de regresión pobla ional puede ser expresada omo:

Yi = E(Y |Xi) + ui (2.12)21

Page 23: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.En la gura 5 podemos notar que para todo Xi a la dere ha del punto A, Yisobreestima E(Y |Xi). De igual manera, para ualquier punto a la izquierda deA, Yi subestima E(Y |Xi). Esta sobreestima ión y subestima ión del modelo po-bla ional es inevitable debido a las u tua iones muestrales.¾Cómo se puede onstruir la fun ión de regresión muestral para β1y β2 que este lo más er a de los valores verdaderos (pobla ionales) deβ1 y β2?2.2.4. Propiedades de un EstimadorUn estimador, siendo fun ión de la muestra, es una variable aleatoria y tiene supropia distribu ión de probabilidad.Las propiedades de los estimadores son las siguientes:1. Se denomina sesgo a la diferen ia entre el valor esperado del estimador ysu verdadero valor: E(β)− β. De esta forma, se di e que β es un estimadorinsesgado si E(β) = β.2. El estimador es e iente o de mínima varianza si no hay ningún otro esti-mador insesgado que tenga una varianza menor que β. En general se trata deutilizar estimadores de varianza pequeña, pues de este modo la estima iónes más pre isa.3. El Error Cuadráti o Medio (ECM) es una propiedad de los estimadores quemez la los on eptos de e ien ia e insesgamiento. El ECM de β se dene omo:

ECM(β) = E[(β − β)2]Lo que se puede expresar equivalentemente de la siguiente manera:ECM(β) = V ar(β) + [Sesgo(β)]24. La última propiedad de un estimador es la onsisten ia. El estimador βes onsistente si onverge (en el limite) al verdadero valor del parámetro.Se di e que la su esión de variables aleatorias X1, X2,...,Xn onverge enprobabilidad a la variable aleatoria (o onstante) X si:

∀ε > 0, lımn→∞

Pr[|Xn −X| < ε] = 1Esto se denota plim Xn = X . Dos reglas útiles al respe to son:22

Page 24: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.plim

(XY

)=plimXplimY

plim (X · Y )=plimX · plimY

Ejemplo: Tenemos una variable yi que esta ompuesta por la suma de un om-ponente jo o determinísti o (c) y un omponente aleatorio(ui):yi = c︸︷︷︸

componente fijo

+ ui︸︷︷︸componente aleatorioSi ui ∼ N(0, σ2

u), enton es:µ = E(yi) = c

V (yi) = E[(yi − E(yi))2] = E[u2

i ] = σ2u23

Page 25: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Ahora onsideremos el siguiente estimador de la esperanza de yi, la media mues-tral:µ = Y =

1

n(y1 + y2 + ...+ yn) =

1

n

n∑

i=1

yiVeamos que propiedades tiene este estimador:Insesgamiento: E(µ) = µ

E(µ) = E(Y)

= E

(1

n(y1 + y2 + ... + yn)

)

=1

n(E(y1) + E(y2) + ... + E(yn))dado que E(yi) = E(c) + E(ui)︸ ︷︷ ︸

0

= c,E(µ) = c = µE ien ia: V ar(µ)<V ar(µ1)Comparemos el estimador promedio muestral on un estimador que es sim-plemente ualquier valor de yi:

µ = Y E(Y ) = c V ar(Y )=σ2u

n

µ1 = yi E(yi) = c V ar(yi) = σ2uEnton es para n>1 siempre se umple que µ es más e iente (menor va-rianza) que µ1.Error Cuadráti o Medio: Como µ es un estimador insesgado de µ aligual que µ1, el error uadráti o medio de ambos estimadores es igual a lavarianza del estimador, de esta forma µ tiene menor error uadráti o medioque µ1.Consisten ia: µ es un estimador onsistente dado que:

plim(µ) = plim(Y ) = cYa que si lımn→∞ V ar(Y ) = 0 ⇒ plim(Y ) = c.24

Page 26: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.3. Modelo de regresión on dos variables2.3.1. Método de Mínimos Cuadrados OrdinariosDe la se ión anterior teníamos que el error estimado era:ui = Yi − Yi

= Yi − β1 − β2Xi (2.13)es de ir, los residuos son simplemente la diferen ia entre los valores verdaderos yestimados de Y.Si queremos que la fun ión de regresión muestral sea lo más er ana posiblea la pobla ional, debemos tratar de es oger los oe ientes de regresión (los β's)de forma tal que los errores sean lo más pequeños posible. De a uerdo a estoun riterio para es oger la fun ión de regresión muestral podría ser minimizarla suma de los los errores: ∑ ui =∑

(Yi − Yi), sin embargo este riterio no esmuy bueno. Observemos la Figura 6, existe una gran diferen ia en la magnitudde los errores, sin embargo en la suma de los errores todos re iben el mismo peso.Debido a esto es posible que la suma de los errores sea muy pequeña er ana a ero, in luso uando la dispersion de los errores en torno a la fun ión de regresiónmuestral es alta.

Figura 6: Mínimos Cuadrados Ordinarios

25

Page 27: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Este problema puede ser solu ionado al onsiderar la suma de los errores al ua-drado omo riterio a minimizar, en este aso los errores más lejos re iben unmayor peso:∑

u2i =

∑(Yi − Yi)

2

=∑

(Yi − β1 − β2Xi)2 (2.14)El Método de Mínimos Cuadrados Ordinarios (MCO) es oge β1 y β2 deforma tal que para una muestra dada, ∑ u2

i sea lo más pequeño posible.Enton es el problema que este método propone resolver es el siguiente:mınβ1,β2

∑(Yi − β1 − β2Xi)

2 (2.15)las ondi iones de primer orden de este problema son:∂∑

u2i

∂β1

= −2∑

(Yi − β1 − β2Xi) = −2∑

ui = 0 (2.16)∂∑

u2i

∂β2

= −2∑

(Yi − β1 − β2Xi)Xi = −2∑

uiXi = 0 (2.17)Simpli ando (2.16) y (2.17) obtenemos las e ua iones normales:∑

Yi = nβ1 + β2

∑Xi (2.18)

∑YiXi = β1

∑Xi + β2

∑X2

i (2.19)Debemos resolver un sistema on dos e ua iones y dos in ógnitas. De la e ua ión(2.18) podemos despejar β1 :β1 =

∑Yi − β2

∑Xi

n(2.20)reemplazando (2.20) en (2.19):

∑YiXi =

(∑Yi − β2

∑Xi

n

)·∑

Xi + β2

∑X2

i (2.21)De esta forma, el estimador de β2 es:β2 =

n ·∑

YiXi −∑

Xi

∑Yi

n ·∑

X2i − (

∑Xi)2

(2.22)26

Page 28: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.El que puede ser es rito de la siguiente forma (ha erlo):β2 =

∑xiyi∑x2i

(2.23)donde xi = Xi −X e yi = Yi − Y , on X = 1n

∑ni=1Xi e Y = 1

n

∑ni=1 YiReemplazando (2.22) en (2.20):

β1 =

∑X2

i

∑Yi −

∑Xi

∑XiYi

n ·∑

X2i − (

∑Xi)2

(2.24)= Y − β2X (2.25)Los resultados (2.23) y (2.25) podrían haber sido obtenidos de igual forma, expre-sando ini ialmente el modelo de regresión en desvia iones on respe to a la media.El modelo de regresión original es:Yi = β1 + β2Xi + uisi le restamos el promedio de esta:Y = β1 + β2X + ui (2.26)y re ordando que el valor esperado del término de error es 0, tenemos el siguientemodelo de regresión lineal expresado en desvia iones on respe to a la media:

(Yi − Y ) = β2(Xi −X) + ui

yi = β2xi + uiAsí el problema de Mínimos Cuadrados Ordinarios es:mınβ2

∑(yi − β2xi)

2La ondi ión de primer orden de este problema es:∂∑

u2i

∂β2

= −2∑

(yi − β2xi)xi = 0Así obtenemos el mismo estimador de β2, en ontrado en (2.23), y β1 se obtienesimplemente despejando la e ua ión (2.26):β1 = Y − β2X27

Page 29: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.que orresponde a lo mismo en la e ua ión (2.25).Una vez estimados los oe ientes de regresión mediante MCO y utilizando lainforma ión muestral, la re ta de regresión muestral (Yi = β1 + β2Xi) puede serobtenida fá ilmente.Ejemplo 1: Disponemos datos de una empresa quími a sobre el gasto que ellarealiza en Investiga ión y Desarrollo (I+D) y las ganan ias anuales de esta om-pañiaEjemplo 2: Tenemos los siguientes datos de portales de internet, on los uales queremos ver el impa to promedio del número de visitas en el valor de laempresa: VEMPRESA VISITAS Yi = β1 + β2Xi ui = Yi − β1 − β2XiAOL 134844 50 98976.5 35867.5Yahoo 55526 38 70403.7 -14877.7Ly os 5533 28 46593.1 -41060.1CNet 4067 8 -1028.3 5095.3Juno Web 611 8 -1028.3 1639.3NBC Internet 4450 16 18020.3 -13570.3Earthlink 2195 5 -8171.5 10366.5El Sitio 1225 2 -15314.7 16539.7PROMEDIO 26056.4 19.4 26056.4 0Utilizando estos datos tenemos:n∑

i=1

(Xi −X)2 = 2137,9

n∑

i=1

(Yi − Y )(Xi −X) = 5090422,9

β2 =5090422,9

2137,9= 2381,1

β1 = 26056,4− 2381,1 ∗ 19,4 = −20076,8

28

Page 30: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.

29

Page 31: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.3.2. Supuestos detrás del método MCOEn el análisis de regresión nuestro objetivo no es sólo obtener los valores de β1 yβ2 sino también ha er inferen ia sobre los verdaderos β1 y β2. Nos interesa saberque tan er a están β1 y β2 de sus ontraparte pobla ional o que tan er a esta Yide la verdadera E(Y|Xi). La Fun ión de regresión pobla ional: Yi = β1+β2Xi+ui,nos muestra que Yi depende de Xi y ui. Así, los supuestos he hos para estas dosvariables son fundamentales para lograr una interpreta ión válida de los valoresestimados de la regresión. Mientras no se espe ique la forma omo se generanXi y ui, no hay forma de ha er inferen ia estadísti a sobre Yi ni sobre β1 y β2.Supuesto 1: Modelo de regresión lineal, el modelo de regresión es lineal enparámetros:

Yi = β1 + β2Xi + uiSupuesto 2: Los valores de X son jos, X se supone no esto ásti a. Esto im-pli a que el análisis de regresión es un análisis de regresión ondi ional, ondi ionado a los valores dados del regresor X.Supuesto 3: El valor medio del error ui es igual a ero. Dado el valor deX, el valor esperado del término de error ui es ero:E(ui|Xi) = 0Lo que nos di e este supuesto es que los fa tores que no están onsideradosen el modelo y que están representados a través de ui, no afe tan sistemá-ti amente el valor de la media de Y. Es de ir, los valores positivos de ui se an elan on los valores negativos de ui. De esta forma, el efe to promediode ui sobre Y es ero. Ver Figura 7.

30

Page 32: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.

Figura 7: Distribución condicional del término de error uiSupuesto 4: Homo edasti idad o igual varianza de ui. Dado el valor deX, la varianza de ui es la misma para todas las observa iones:var(ui|Xi) = E[ui −E(ui)|Xi]

2

= E(u2i |Xi) por supuesto 3

= σ2En la Figura 8 podemos apre iar el signi ado del supuesto de homo e-dasti idad, la varia ión alrededor de la re ta de regresión es la misma paratodos los valores de X. Esto impli a que la fun ión de densidad del términode error ui es la misma.

Figura 8: Homocedasticidad

31

Page 33: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Por el ontrario, el la Figura 9 observamos el aso uando la varianza deltérmino de error varia para ada Xi, en este aso parti ular la varianza delerror aumenta en la medida que Xi re e.

Figura 9: HeterocedasticidadEsto se ono e omo Hetero edasti idad o varianza desigual, lo que seexpresa de la siguiente manera:var(ui|Xi) = σ2

i (2.27)Supuesto 5: No existe auto orrela ión entre los errores. Dado dos valoresde X, Xi y Xj , on i6= j, la orrela ión entre ui y uj es ero:cov(ui, uj|Xi, Xj) = E[ui −E(ui)]|Xi[uj −E(uj)]|Xj

= E(ui|Xi)(uj|Xj)

= 0Si en la Fun ión de regresión pobla ional Yi = β1 + β2Xi + ui, ui esta orrela ionado on uj, enton es Yi no depende solamente deXi sino tambiénde uj. Al imponer le supuesto 5 estamos di iendo que solo se onsideraráel efe to sistemáti o de Xi sobre Yi sin preo uparse de otros fa tores quepueden estar afe tando a Y, omo la orrela ión entre los u's.Supuesto 6: La ovarianza entre ui y Xi es ero E(uiXi) = 0:cov(ui, Xi) = E[ui − E(ui)][Xi −E(Xi)]

= E[ui(Xi − E(Xi)] por supuesto E(ui) = 0

= E(uiXi)− E(ui)E(Xi) por supuesto E(Xi) no estocastica

= E(uiXi) por supuesto E(ui) = 0

= 0 32

Page 34: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Como men ionamos en la se ión 2.2.2 se supone que X y u tienen una in-uen ia separada sobre Y (determinísti a y esto ásti a, respe tivamente),ahora si X y u están orrela ionadas, no es posible determinar los efe tosindividuales sobre Y.Este supuesto se umple automáti amente si X es no esto ásti a y el su-puesto 3 se umple.Supuesto 7: El número de observa iones n debe ser mayor que el nú-mero de parámetros por estimar. El número de observa iones tieneque ser mayor que el número de variables expli ativas, de otra forma no sepuede resolver el sistema de e ua iones. Supongamos que tenemos una solaobserva ión para nuestra variable dependiente y nuestra variable expli ativa(Y1 y X1), el modelo de regresión es tal que tiene inter epto, es de ir:Y1 = β1 + β2X1 + u1el estimador MCO de β2 es :

β2 =

∑xiyi∑x2idonde xi = Xi−X e yi = Yi−Y , sin embargo on una observa ión X1 = Xe Y1 = Y , así β2 no esta determinado y así tampo o podemos determinar

β1.Supuesto 8: Variabilidad en los valores de X. No todos los valores de X enuna muestra deben ser iguales, var(X) debe ser un número nito positivo.Si las X son las mismas ⇒ Xi = X , de esta forma ni β2 ni β1 pueden serestimados.Supuesto 9: El modelo de regresión esta orre tamente espe i ado.Esto es muy importante, ya que por ejemplo la omisión de variables impor-tantes en el modelo, o la ele ión de la forma fun ional inade uada, o la onsidera ión de supuestos esto ásti os equivo ados sobre las variables delmodelo, harán uestionable la validez de la interpreta ión de la regresiónestimada. (Aspe tos que veremos más adelante).33

Page 35: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.3.3. Errores estándar de los Estimadores Mínimos Cua-drados OrdinariosComo vimos en la se ión 2.3.1, los valores estimados para β1 y β2 dependen delos datos muestrales, sin embargo, los datos ambian de una muestra a otra yasí los valores estimados también, por eso es ne esario tener una medida que nospermita de ir que tan er ano son los valores estimados a los valores pobla iona-les de los parámetros.La medida que utilizaremos para medir la pre isión del estimador es el error es-tándar, que es la desvia ión estándar de la distribu ión muestral del estimador,la que a su vez es la distribu ión del onjunto de valores del estimador obtenidosde todas las muestras posibles de igual tamaño de una pobla ión dada.Re ordemos el estimador MCO de β2:β2 =

∑xiyi∑x2idonde yi = β2xi+ui (modelo pobla ional en desvia iones on respe to a la media).De esta forma reemplazando yi en el estimador de β2:

β2 =

∑xi(β2xi + ui)∑

x2i

= β2

∑x2i∑

x2i

+

∑uixi∑x2i

= β2 +

∑uixi∑x2iApli ando valor esperado a la expresión anterior:

E(β2) = β2 + E

(∑uixi∑x2i

)

= β2 +

(∑E(ui)xi∑

x2i

)por supuesto 2

= β2 por supuesto 3 (2.28)La e ua ión (2.28) nos di e que en valor esperado el estimador MCO de β2 esigual a su verdadero valor. Esta propiedad del estimador MCO se ono e omoinsesgamiento.34

Page 36: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Ahora pro edamos a al ular la varianza de el estimador MCO de β2:var(β2) = E[β2 − E(β2)]

2

= E(β2 − β2)2

= E

([∑

xiui]2

[∑

x2i ]

2

)Por supuesto 4 E(u2i ) = σ2 y por supuesto 6 E(uiuj) = 0, esto impli a que:

var(β2) =σ2

∑x2i

(2.29)2.3.4. Estimador Mínimo Cuadrado Ordinario de σ2Ahora debemos estimar el parámetro pobla ional σ2, omo este orresponde alvalor esperado de u2i y ui es una estima ión de ui, por analogía:

σ2 =

∑ni=1 u

2i

npare iera ser un estimador razonable. Pero los errores de MCO, están estimadosimperfe tamente si los omparamos on los errores pobla ionales, ya que depen-den de una estima ión de β1 y β2. Veamos esto on más detalle:Partiendo del Regresión pobla ional expresado en desvia iones on respe to ala media:yi = β2xi + (ui − u) (2.30)y re ordando también que:

ui = yi − β2xi (2.31)Al sustituir (2.30) en (2.31), se obtiene:ui = β2xi + (ui − u)− β2xiElevando al uadrado la expresión anterior, apli ando sumatoria y tomando valoresperado:

E(∑

u2i

)= E(β2 − β2)

2∑

x2i + E

[∑(ui − u)2

]

︸ ︷︷ ︸(i)

−2E[(β2 − β2)

∑xi(ui − u)

]

︸ ︷︷ ︸(ii)

= var(β2)∑

x2i + (n− 1)var(ui)− 2E

[∑xiui∑x2i

∑xi(ui − u)

]

= σ2 + (n− 1)σ2 − 2σ2

= (n− 2)σ2 35

Page 37: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.(i) E

[∑(ui − u)2

]= E

[∑(u2

i − 2uiu+ u2)]

= E[∑

u2i − 2u

∑ui + nu2

]

= E[∑

u2i − 2u

n

n

∑ui + nu2

]

= E[∑

u2i − 2nu2 + nu2

]

= E[∑

u2i − nu2

]

= E

[∑u2i − n

(∑ui

n

)2]

= nσ2 − n

nσ2

= (n− 1)σ2

(ii) E[(β2 − β2)

∑xi(ui − u)

]= E

[(β2 − β2)

∑xi(ui − u)

]

= E

[∑xiui∑x2i

∑xi(ui − u)

]

= E

[(∑

xiui)2

∑x2i

− u

∑xiui

∑xi∑

x2i

]

= σ2Por lo tanto se dene el estimador de la varianza σ2 omo:σ2 =

∑u2i

n− 2(2.32)De forma tal que, σ2 es un estimador insesgado de σ2:

σ2 =1

n− 2E(∑

u2i

)= σ2

36

Page 38: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.4. Modelo de Regresión on k variablesAhora abandonemos la simpli a ión de solo usar dos variables, de ahora en ade-lante generalizaremos el modelo de regresión lineal para que pueda tener hasta kvariables expli ativas.A lara ión: haremos un ambio de nota ión, ada observa ión i de la variabledependiente será denotada por yi y ada observa ión i de una variable expli ati-va, por ejemplo X1, será denotada por x1i. Ahora las variables en minús ula nosigni a que estén en desvíos.El Modelo de Regresión Pobla ional en este aso es:yi = β1 + β2x2i + β3x3i + ...+ βkxki + ui i = 1, ..., n2.4.1. Representa ión Matri ial del Modelo de RegresiónLinealEl modelo on k variables expli ativas puede ser expresado en nota ión matri ial.En efe to, ada variable expli ativa xj , on j=1,..., k, es un ve tor olumna dedimensión n, al igual que la variable dependiente y el término de error. De estemodo, el modelo puede ser rees rito de la siguiente forma:

y1y2...yn

=

11...1

β1 +

x21

x22...x2n

β2 +

x31

x32...x3n

β3 + ...+

xk1

xk2...xkn

βk +

u1

u2...un

Donde las variables expli ativas se pueden agrupar en una sola matriz de dimen-sión n×k, que denotaremos simplemente omo X, de esta manera el modelo seexpresa de la siguiente forma:

y1y2...yn

=

1 x21 x31 · · · xk1

1 x22 x32 · · · xk2... ... ... . . . ...1 x2n x3n · · · xkn

·

β1

β2...βk

+

u1

u2...un

⇒ Y = Xβ + u(2.33)donde Y es un ve tor de dimensión n×1, X es la matriz de variables expli ativasde dimensión n×k y u es un ve tor orrespondiente al término de error on di-mensión n×1. 37

Page 39: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Ahora debemos expresar la distribu ión del término de error en términos ma-tri iales:E(u) =

E(u1)E(u2)...E(un)

= 0

n×1

E(uu′) =

E(u21) E(u1u2) · · · E(u1un)

E(u2u1) E(u22) · · · E(u2un)... ... . . . ...

E(unu1) E(unu2) · · · E(u2n)

=

σ2 0 · · · 00 σ2 · · · 0... ... . . . ...0 0 · · · σ2

= σ2 I

n×nDe los supuestos 3, 4 y 5, tenemos enton es que el término de error tiene lasiguiente distribu ión:u ∼

( 0n×1

, σ2 In×n

) (2.34)2.4.2. Estimador Mínimo Cuadrados OrdinariosEl método de MCO, plantea que los parámetros del modelo pueden ser estimadosminimizando la suma de los errores al uadrado (SE(β)), la que en términosmatri iales equivale a:SE(β) =

n∑

i=1

u2i = u′udonde u = Y −Xβ. Enton es el problema de minimizar la suma de los errores al uadrado se expresa de la siguiente forma:

mınβ

SE(β) = mınβ

[(Y −Xβ)′(Y −Xβ)

]

= mınβ

[Y ′Y − 2β ′X ′Y + β ′X ′Xβ

]

∂SE(β)

∂β ′= −2X ′Y + 2X ′Xβ = 0

⇒ β = (X ′X)−1X ′Y (2.35)38

Page 40: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.De (2.35) tenemos:X ′(Y −Xβ) = 0 ⇒ X ′u = 0 (2.36)(2.36) es la ondi ión de ortogonalidad.De esta forma, el ve tor de parámetros estimados β se obtiene de resolver elsiguiente sistema de e ua iones normales:

X ′Xβ = X ′Y ⇔

1 1 1 · · · 1x2,1 x2,2 x2,3 · · · x2,n

x3,1 x3,2 x3,3 · · · x3,n... ... ... . . . ...xk,1 xk,2 xk,3 · · · xk,n

1 x2,1 x3,1 · · · xk,1

1 x2,2 x3,2 · · · xk,2

1 x2,3 x3,3 · · · xk,3... ... ... . . . ...1 x2,n x3,n · · · xk,n

β1

β2

β3...βk

=

1 1 1 · · · 1x2,1 x2,2 x2,3 · · · x2,n

x3,1 x3,2 x3,3 · · · x3,n... ... ... . . . ...xk,1 xk,2 xk,3 · · · xk,n

y1y2y3...yn

n∑n

i=1 x2,i

∑ni=1 x3,i · · · ∑n

i=1 xk,i∑ni=1 x2,i

∑ni=1 x

22,i

∑ni=1 x2,ix3,i · · ·

∑ni=1 x2,ixk,i∑n

i=1 x3,i

∑ni=1 x3,ix2,i

∑ni=1 x

23,i · · ·

∑ni=1 x3,ixk,i... ... ... . . . ...∑n

i=1 xk,i

∑ni=1 xk,ix2,i

∑ni=1 xk,ix3,i · · · ∑n

i=1 x2k,i

β1

β2

β3...βk

=

∑ni=1 yi∑n

i=1 yix2,i∑ni=1 yix3,i...∑ni=1 yixk,i

Es importante re ordar que el estimador MCO esta denido solo uando la matriz(X'X) es invertible, lo que o urre siempre y uando:1. Las k olumnas de la matriz X sean linealmente independientes.2. Se disponga al menos de tantas observa iones omo variables expli ativas,es de ir: n≥ k.(Supuesto 7)Pongamos aten ión en el segundo supuesto, uando n=k la matriz X tiene dimen-sión k×k, por lo tanto salvo que no se umpla el supuesto 8, X es invertible, y deesta forma (X ′X)−1 = X−1(X ′)−1 y por lo tanto:

β = (X ′X)−1X ′Y = X−1(X ′)−1X ′Y = X−1Y (2.37)39

Page 41: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.el ve tor de residuos u = Y −Xβ = Y −X(X−1Y ) = Y − Y = 0n, de esta formael ajuste es perfe to, ya que todos los residuos son ero, la suma residual de igualforma toma el mínimo valor posible, ero.Sin embargo, esta no es una ara terísti a deseable, el ajuste perfe to o urreporque tenemos una muestra muy redu ida. Esto trae omo onse uen ia po orobustez e impre isión en las estima iones. Si es ogemos una nueva muestra, delmismo tamaño que la anterior, obtendremos otro estimador β on suma residual0, que puede diferir en forma arbitraria del anterior.Para lograr estima iones pre isas de los parámetros, es ne esario tener un nú-mero de observa iones notablemente superior al de las variables expli ativas. Ladiferen ia n-k se ono e omo el número de grados de libertad de la estima ión.2.5. Propiedades del estimador MCONotemos que el ve tor β es un ve tor aleatorio, ya que depende del ve tor deerrores:β = (X ′X)−1X ′Y = (X ′X)−1X ′(Xβ + u) = β + (X ′X)−1X ′u (2.38)

E(β) = E(β) + E[(X ′X)−1X ′u]

= β + (X ′X)−1X ′E(u)La esperanza de β es el mismo parámetro, ya que este es un onstante (valorpobla ional), y por supuestos 2 y 3 el segundo término de la expresión anteriores ero,⇒ E(β) = β (2.39)Es de ir, el estimador MCO es insesgado, tal omo lo habíamos mostrado en lae ua ión (2.28).De (2.38) podemos denir el error de estima ión o sesgo omo:

β − β = (X ′X)−1X ′u

40

Page 42: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Ahora al ulemos la varianza de β:var(β) = E[(β − E(β)) · (β − E(β))′]

= E[(β − β) · (β − β)′]

= E[(X ′X)−1X ′uu′X(X ′X)−1]

= (X ′X)−1X ′E(uu′)X(X ′X)−1

= (X ′X)−1X ′(σ2In)X(X ′X)−1

= σ2(X ′X)−1 (2.40)Para poder estimar la varianza de β ne esitamos reemplazar σ2 en (2.40) por suestimador insesgado:σ2 =

u′u

n− k2.5.1. Propiedad de mejor estimador lineal insesgadoSe di e que β, es el mejor estimador lineal insesgado (MELI) de β si se umplelo siguiente:1. El lineal, es de ir, es una fun ión lineal de una variable aleatoria, omo lavariable y en el modelo de regresión.2. Es insesgado, es de ir, su valor esperado, E(β), es igual a el verdaderovalor, β.3. Tiene varianza mínima dentro de la lase de todos los estimadores linealesinsesgados; un estimador insesgado omo varianza mínima es ono ido omoun estimador e iente.2.5.2. Teorema de Gauss-MarkovProposi ión: El estimador MCO es el estimador lineal insesgado óptimo, en elsentido de que ualquier otro estimador lineal e insesgado tiene una matriz de o-varianza mayor que la del estimador MCO. Es de ir, el estimador MCO es MELI.Demostra ión: Sea β = Ay un estimador lineal de β, donde A es una matriz41

Page 43: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.k×n. Denotemos A = A− (X ′X)−1X ′, de modo que:β = [A + (X ′X)−1X ′]Y

= [A + (X ′X)−1X ′](Xβ + u)

= AXβ + β + [A+ (X ′X)−1X ′]uApli ando esperanza a la expresión anterior:E(β) = AXβ + β + [A+ (X ′X)−1X ′]E(u)

= AXβ + βEl estimador β será insesgado solo si la matriz A es tal que AX=0k×k. De estaforma:β = β + [A + (X ′X)−1X ′]uy su matriz de ovarianza será:

cov(β) = E[(β − β)(β − β)′]

= E([A+ (X ′X)−1X ′]u)([A+ (X ′X)−1X ′]u)′= σ2AA′ + σ2(X ′X)−1

︸ ︷︷ ︸cov(β)Como la matriz AA′ es semidenida positiva, se on luye la diferen ia entre la ovarianza de β y β es una matriz semidenida positiva, on lo que la ovarianzade β es mayor o igual a la ovarianza de β

42

Page 44: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.6. Geometría del Estimador MCORe ordemos que el modelo de regresión muestral tiene la siguiente expresión:Y = Xβ + ula que puede ser rees rita de la siguiente forma:

Y = PY +MY (2.41)donde P se denomina matriz de proye ión y se dene de la siguiente manera:P = X(X ′X)−1X ′Además se tiene que M=I-P. De a uerdo a la e ua ión (2.36) el estimador MCOes tal que los errores son ortogonales a las X, es de ir se deben es oger los pará-metros β de forma tal que el ve tor de errores sea ortogonal al espa io formadospor las variables expli ativas.Así, el estimador MCO nos permite des omponer Y en dos términos ortogonalesentre si: el primer omponente puede ser es rito omo una ombina ión linealde las olumnas x y el segundo es un omponente ortogonal a X (el término deerror), tal omo lo muestra (2.41). Esto se representa grá amente en la Figura10.

Col X

Y

MY

PY

0

Figura 10: Descomposición Ortogonal de Y

x1

x2

El término PY alternativamente se puede ver omo la proye ión de Y en elespa io barrido por las X's y MY omo la proye ión de Y es el espa io ortogonala las X's. 43

Page 45: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.7. Bondad de Ajuste y Análisis de VarianzaEl objetivo de esta se ión es introdu ir un riterio de ajuste de nuestra regre-sión, es de ir, un riterio que nos indique uan bien se ajusta nuestro modelo ala muestra.En prin ipio, podríamos pensar que la suma de los residuos uadrados, es de- ir, nuestro riterio original de ajuste, es una buena op ión: a menor sea éste,mejor es nuestro ajuste. Sin embargo, la suma de los residuos uadrados puedeser arbitrariamente es alada al multipli ar la variable dependiente (Y) por el fa -tor de es ala deseado, lo ual invalida su uso omo riterio de ajuste.Por ello, se ha desarrollado un riterio que elimine el problema anterior. Di- ho estadísti o ya no se basará en la magnitud de un valor ( omo la suma de los uadrados de los residuos), sino que intentará preguntarse si la varia ión de las va-riables independientes (X) expli a la varia ión de la variable independiente, omoveremos más adelante. Para ello analizaremos on un po o más de profundidadel modelo de regresión lineal en desvíos on respe to a la media y presentaremosla llamada des omposi ión de varianza (o análisis de varianza), ambos, insumosfundamentales para obtener nuestro estadísti o de bondad de ajuste.2.7.1. Modelo de Regresión Lineal en DesvíosSea el modelo pobla ional usual on k variables:yi = β1 + β2x2i + β3x3i + · · ·+ βkxki + ui (2.42)donde i = 1 . . . n y uya ontraparte estimada es:yi = β1 + β2x2i + β3x3i + · · ·+ βkxki + ui (2.43)Luego, si sumamos para todas las observa iones y dividimos a ambos lados porel tamaño muestral n, tenemos:

Y = β1 + β2x2 + β3x3 + · · ·+ βkxk (2.44)por lo ual:β1 = Y − β2x2 + β3x3 + · · ·+ βkxk (2.45)La e ua ión (2.45) muestra que el término independiente de una regresión quedadeterminado por el resto de los k-1 oe ientes involu rados. Finalmente, note44

Page 46: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.que restando las e ua iones (2.43) y (2.44) obtenemos:yi − Y = β2(x2i − x2) + β3(x3i − x3) + · · ·+ βk(xki − xk) + ui (2.46)la ual es una expresión similar a (2.43), ex epto por dos importantes diferen ias.Primero, el modelo no posee onstante y segundo, las variables se en uentranexpresadas en desvíos on respe to a la media. A pesar de ello, note que los oe- ientes y los residuos son los mismos en ambos modelos.De lo anterior surge un importante orolario respe to del término onstante denuestro modelo. En general, el interés del investigador se entra en el impa to delos regresores sobre la variable dependiente, por lo ual, el término onstante noes más que una orre ión que garantiza que los promedios muestrales de ambosmiembros del modelo e onométri o oin idan.Para transformar en desvíos on respe to a la media un modelo en términos ma-tri iales, introdu iremos una matriz fundamental para el análisis de esta se ión.Denotaremos por M0 una matriz de n× n, denida omo:

M0 = In×n

−ii′

n=

1 0 · · · 00 1 · · · 0... ... . . . ...0 0 · · · 1

1

n

1 1 · · · 11 1 · · · 1... ... . . . ...1 1 · · · 1

=

1− 1n

− 1n

· · · − 1n

− 1n

1− 1n

· · · − 1n... ... . . . ...

− 1n

− 1n

· · · 1− 1n

donde I es la identidad (n×n) e i orresponde al ve tor unitario de dimensión n.Di ha matriz es singular, simétri a (M0'=M0) e idempotente (M0M0=M0). Engeneral, M0 es ono ida omo matriz de desvíos, ya que resta a ada olumna dela matriz involu rada, su media aritméti a. Por ejemplo, es fá il omprobar que:

M0Y = Y − 1

nii′Y =

y1y2...yn

− 1

n

∑ni=1 yi∑ni=1 yi...∑ni=1 yi

=

y1 − Yy2 − Y...yn − Y

Por lo tanto, nuestro modelo expresado en matri es, puede ser expresado en tér-minos de desvío on respe to a la media omo:

M0Y = M0Xβ +M0u (2.47)45

Page 47: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.7.2. Análisis de VarianzaSuponga enton es el siguiente modelo pobla ional:Y = Xβ + udonde Y orresponde a una ve tor n× 1, X orresponde a nuestra matriz de re-gresores que in luye un término onstante, tal que X es de n× k y u orrespondea nuestro ve tor de errores de n× 1.Bus amos enton es denir la varia ión de la variable dependiente (Suma de los uadrados totales = TSS) omo3:

TSS =

n∑

i=1

(Yi − Y )2 (2.48)Para en ontrar enton es una expresión para (2.48), de la e ua ión (2.47) tenemosque nuestro modelo estimado en desvíos on respe to a la media es:M0Y = M0Xβ +M0u on lo ual, al parti ionar nuestra matriz X en X = [i X2], nuestro ve tor deparámetros en β ′ = [β1 β2] y onsiderando que M0i = 0 y que M0u = u,tenemos que:

M0Y = M0iβ1 +M0X2β2 +M0u

= M0X2β2 + u (2.49)Luego, para formar la TSS(suma de los uadrados totales o la suma de los ua-drados de las desvia iones de Y on respe to a su media), de la e ua ión (2.48),multipli amos por Y' la e ua ión (2.49):Y ′M0Y = Y ′(M0X2β2 + u)

= (Xβ + u)′(M0X2β2 + u)

= β ′X ′M0X2β2 + β ′X ′u+ u′M0X2β2 + u′u

Y ′M0Y = β2X′2M

0X2β2 + u′u (2.50)TSS = ESS +RSS (2.51)donde el segundo y el ter er término desapare en gra ias a que los residuos estima-dos son, por onstru ión, ortogonales a las variables expli ativas 4. La igualdad3Note que para di ha deni ión utilizamos los uadrados de la desvia iones, ya que la sumade las desvia iones es siempre ero.4Ya que X ′u = X ′(Y −Xβ) = X ′Y −X ′Y = 0.46

Page 48: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.anterior es ono ida omo la des omposi ión de varianza. El término de laizquierda orresponde a TSS o la suma de los uadrados de las desvia iones dela variable dependiente. En otras palabras, la variabilidad de Y. En la dere ha seen uentra la variabilidad de las variables independientes o regresores y la varia-bilidad de los errores. ¾Cuál es enton es el objetivo?: des omponer la varianza dela variable dependiente aquella parte que es expli ada por la regresión (ESS) deaquella parte expli ada por los residuos (RSS). ¾Por qué?: porque intuitivamente,la regresión se ajusta mejor si las desvia iones de Y se expli an en su mayor partepor desvia iones de X y no por desvia iones de los residuos.2.7.3. Bondad de Ajuste: R2 y R2Denimos enton es la bondad de ajuste del modelo a través del siguiente estadí-grafo llamado también oe iente de determina ión:R2 =

ESS

TSS(2.52)es de ir, omo la propor ión de la varianza de Y que es expli ada por la varianzade la regresión. Alternativamente:

R2 = 1− RSS

TSS(2.53)Note que:1. El oe iente de determina ión es siempre menor a 1. Ello porque RSS ≤

TSS y por lo tanto RSSTSS

≤ 1.2. El análisis de varianza anterior fue derivado bajo el supuesto que el modeloin luía una onstante (por ello utilizábamos la matriz M0). En di ho aso,ne esariamente R2 ≥ 0. En aso de que el modelo no in luya una onstante,se debe utilizar la fórmula (2.5.2) utilizando TSS=Y'Y (sin desvíos).3. Al agregar regresores al modelo, el R2 nun a de re erá (se mantendrá ons-tante o aumentará)4. No es laro uan bueno sea omo predi tor de ajuste.Para ver este último punto, suponga que usted posee el siguiente modelo pobla- ional:Y = β1 + β2X + u47

Page 49: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.donde X es un ve tor (n× 1). Suponga ahora que restamos X a ambos lados denuestro modelo. Obtenemos enton es:Y −X = β1 + γX + uSi β2 ≈ 1, enton es es fá il veri ar que el R2 del primer modelo será er ano a1, mientras que el del segundo sera er ano a ero, a pesar de que los modelosson matemáti amente equivalentes. A pesar de lo anterior, en trabajos apli ados,el R2 es ampliamente utilizado, por lo ual se re omienda su publi a ión.Retro edamos ahora al punto tres. El nos di e que el oe iente de determina iónprobablemente re erá al in luir regresores. Ello plantea in entivos a in luir re-gresores no relevantes para nuestro modelo, on el n de obtener un mejor ajuste.¾Porqué su ede esto?, ya que al in luir regresores, la RSS ne esariamente de re e(o en el mejor de los asos se mantiene), mientras que la TSS permane e onstante.Por esta razón se reó el oe iente de determina ión ajustado, el ual orri-ge el R2 original por los grados de libertad del numerador y el denominador.Enton es, denimos el R2 ajustado (R2) omo:

R2 = 1− u′u/(n− k)

Y ′MY/(n− 1)(2.54)o equivalentemente:

R2 = 1− (1− R2)(n− 1)

(n− k)(2.55)

48

Page 50: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.8. Inferen iaUna vez que hemos estimado nuestra regresión muestral, es ne esario preguntarse uan buena aproxima ión es di ha regresión de la pobla ional. Para que la apro-xima ión sea er ana, es ondi ión ne esaria que los parámetros in luidos en laregresión muestral sea estadísti amente distintos de ero (en aso ontrario, nopertene en a la regresión pobla ional). Así, uno de nuestros objetivos puede serel testear la signi an ia individual de los parámetros.Pero lo anterior es sólo una de las preguntas que omo investigadores podemosestar interesados en responder. Por ejemplo, en la estima ión de la fun ión deprodu ión de una rma, que asumimos Cobb Douglas (Y = AKαLβeu o en loga-ritmo lnY = lnA+α lnK+β lnL+u), podemos estar interesados en des ubrir sila rma presenta rendimientos onstantes, re ientes o de re ientes a la es ala, lo ual se reejará en que α+ β > o ≤ 1. Por lo tanto, ello podría ser otra hipótesisinteresante de plantearse. También podría ser interesante des ubrir si todos losparámetros a la vez son distintos de ero, o de algún valor determinado.La gama de preguntas posibles respe to del valor de los parámetros es sólo a o-tada por la pregunta que el investigador desee responder. Nuestro objetivo es,por lo tanto, desarrollar los métodos de inferen ia y ontraste de hipótesis quenos permitan responder, en el ontexto de una regresión muestral parti ular, laspreguntas anteriores.Dos notas pre autorias. En esta se ión nos o uparemos de restri iones o hi-pótesis lineales sobre los oe ientes. Restri iones no lineales son más es asasen e onometría apli ada y se desarrollan en ontexto de un modelo parti ular.Segundo, en todo lo que se reere a este apartado, asumiremos que los errores denuestra regresión muestral siguen una distribu ión normal (ya veremos porqué).Enton es, sea nuestro modelo pobla ionalY = Xβ + udonde X es una matriz de (n × k),u e Y son ve tores (n × 1) y β es ve tor de(k × 1).Sean enton es las siguientes hipótesis:1. H0: βi = 0 ⇒ Plantea que el regresor Xi no posee inuen ia alguna sobre Y.Este es el test más omún y nos referiremos a él omo test de signi an ia.49

Page 51: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2. H0: βi = βi0 ⇒ Plantea que el regresor Xi posee un impa to determinadopor βi0 sobre Y.3. H0: βi + βj=1 ⇒ Plantea que la suma de los regresores Xi y Xj poseen unimpa to onjunto de magnitud 1.4. H0: βi = βj ⇒ Plantea que los regresores Xi y Xj poseen el mismo impa tosobre Y.5. H0: βi=0 ∀ i=2. . . k ⇒ Plantea que todos los regresores onjuntamente,ex epto la onstante, son ero.6. H0: βl=0 donde el ve tor β ha sido parti ionado en dos (βl y βp) on di-mensiones (kl × 1) y (kp × 1) respe tivamente, tal que kl + kp = k. Planteaenton es que un sub onjunto de parámetros son estadísti amente no signi- ativos.Todas las hipótesis anteriores pueden ser resumidas en la siguiente expresión:Rβ = rdonde R es una matriz de (q×k) onstantes ono idas ( eros o unos), uyo obje-tivo será sele ionar los parámetros a testear, uyo número de las, q, representael número de restri iones. A su vez, r es un ve tor de dimensión q y ontiene elreal al ual es restringido ada parámetro. Veamos omo serán las matri es R y

r en ada una de nuestras hipótesis:1. R=[0. . . 010 . . . 0; r=0; q=1donde 1 se en uentra en la i-ésima posi ión2. R=[0. . . 010 . . . 0; r=βi0; q=1donde 1 se en uentra en la i-ésima posi ión3. R=[0. . . 010 . . . 010 . . . 0; r=1; q=1donde 1 se en uentra en la i-ésima posi ión y en la j-ésima posi ión.4. R=[0. . . 010 . . . 0-10 . . . 0; r=0; q=1donde 1 se en uentra en la i-ésima posi ión y en la j-ésima posi ión.5. R=[0q×1 Ik−1; r=0; q=k − 16. R=[0ki×kj Iki; r=0; q=ki 50

Page 52: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Enton es, nuestra hipótesis nula orresponde a:H0 : Rβ = r (2.56) on lo ual, sólo nos resta derivar el test que nos permita re hazar o no re hazarnuestra nula. La onstru ión del estadígrafo es omo sigue. Dado que MCO(bajo los supuestos relevantes) es insesgado, tenemos que E(β) = β, por lo tanto,

E(Rβ) = Rβ, mientras que la varianza de Rβ orresponde aV [Rβ] = E[R(β − β)(β − β)′R′]

= RV ar(β)R′

= σ2R(X ′X)−1R′Ne esitamos aún un supuesto más para determinar la distribu ión muestral denuestra nula. Dado que β es fun ión de u y u ∼ N(0, σ2), enton es β ∼ N(β, σ2(X ′X)−1)y por lo tanto Rβ ∼ N(r, σ2R(X ′X)−1R′), enton es:β ∼ N [β, σ2(X ′X)−1] (2.57)y

Rβ ∼ N [Rβ, σ2R(X ′X)−1R′] (2.58)y si la nula Rβ = r es ierta:∴ (Rβ − r) ∼ N [0, σ2R(X ′X)−1R′] (2.59)luego estandarizamos, on lo ual:

(Rβ − r)√σ2R(X ′X)−1R′

∼ N [0, 1] (2.60)Además, se puede demostrar que (ha erlo)5:u′u

σ2∼ χ2

(n−k) (2.61)Luego, se puede demostrar que (ha erlo)6:(Rβ − r)′[σ2R(X ′X)−1R′]−1(Rβ − r) ∼ χ2

q (2.62)5Basta on re ordar que si x orresponde a un ve tor de realiza iones normales (0,1), por lo ual x ∼ N(0, σ2I) y A orresponde a una matriz simétri a e idempotente de rango n, enton es1

σ2 x′Ax ∼ χ2

n . Finalmente, re uerde que u = MY = Mu y que el rango de una matriz simétri ae idempotente es su traza.6Basta on re order que si el ve tor x, de dimensión n, es tal que x ∼ N(0,Σ), enton es,x′Σ−1x ∼ χ2

n. 51

Page 53: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.luego, ombinando los dos resultados anteriores, se puede demostrar que (ha er-lo)7:[(Rβ − r)′[R(X ′X)−1R′]−1(Rβ − r)]/q

u′u/(n− k)∼ F(q,n−k) (2.63)El test expuesto en (2.63) orresponde a la forma general del test F. Di ho testes de utilidad para testear ualquier hipótesis de la forma expuesta en (2.56). A ontinua ión veremos sub asos de di ho test general.2.8.1. Test t (Una hipótesis lineal)Rees ribiendo el test F omo:

[(Rβ − r)′[RV ar(β)R′]−1(Rβ − r)] ∼ F(q,n−k)y ha iendo el reemplazo respe tivo de R y r orrespondientes a las hipótesis 1 o2 (H0: βi = 0 = βi0), llegaremos a:F =

(β − βi0)2

V ar(βi)∼ F (1, n− k) (2.64)Re ordando que t2 es una aso parti ular de una F on un grado de libertad enel numerador, tenemos que:

t =β − βi0√V ar(βi)

∼ tn−k (2.65)Lo anterior es ono ido omo el test t (test de signi an ia) y en su versión másutilizada orresponde a t = β√V ar(βi)

, donde se bus a testear la hipótesis nula deque el parámetro es ero.El test t también ubre los asos 3. y 4.. En el aso 3. por ejemplo (H0: βi+βj=1),el estadígrafo orresponderá a:t =

βi + βj − 1√V ar(βi) + 2Cov(βi, βj) + V ar(βj)

∼ tn−k (2.66)La distribu ión t es simétri a y se aproxima a la normal para tamaños de muestras7Sólo un poquito de álgebra y re ordar omo se onstruye una distribu ión F(q, n-k) a partirde la división de dos χ2 on grados de libertad q en el numerador y n-k en el denominador.52

Page 54: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.grandes, sin embargo, la t posee olas más gruesas que la normal (lo ual es máspronun iado en muestras pequeñas: n≤30). La siguiente gura expone la rela iónentre la distribu ión t y la normal:Distribución Normal

Distribución t

Probabilidad

0

Nota pre autoria:Toda la deriva ión anterior se basa en el estri to supuesto de normalidad delos errores. En aso de que los mismos no distribuyan normal, la distribu ióndel test F (y por lo tanto el del t) es des ono ida en muestras nitas. Sin em-bargo, es posible demostrar que ta∼ N(0, 1), es de ir, que el test t distribuyeasintóti amente normal. Luego, los valores ríti os de t y Φ (normal estándar)se en uentran sumamente er a si n-k≥30, por lo ual, en términos prá ti os noimporta mu ho ual de ellas es ojamos para los valores ríti os (a menos que lamuestra sea espe ialmente pequeña).Finalmente, nos queda examinar los riterios de re hazo del test y los nivelesde onanza. Como usted re ordará de sus lases de estadísti a, lo anterior de-pende de omo espe iquemos la hipótesis alternativa. A ontinua ión, pasamosa revisar este punto. 53

Page 55: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Criterio de Re hazo y Nivel de ConanzaUna vez que hemos al ulado el valor del test para nuestra nula parti ular (ovalor al ulado), resta al ular el valor ríti o o el valor que nos indi a la tabla t.Di ho valor ríti o nos dirá si nuestra nula es falsa o si no podemos armar que loes. La ele ión de di ho valor ríti o se toma desde la tabla de distribu ión t y elnúmero debe ser es ogido tomado en uenta el nivel de signi an ia es ogido(1%, 5% o 10%), el ual a su vez determina el nivel de onanza del test(99%, 95% o 90%, respe tivamente). El nivel de onanza posee una expli a iónintuitiva: Nuestro estadígrafo es fun ión de la muestra on lo que estamos traba-jando, por lo ual, si ontáramos on una gran número de ellas y on ada unapudiésemos al ular nuestro estadígrafo, el nivel de onanza indi a el por enta-je de ve es que al ulamos nuestro estadígrafo en que realmente no re hazamoslo ierto o re hazamos orre tamente lo falso. La forma en que se distribuya laprobabilidad de re hazo, es de ir, el nivel de signi an ia, depende de nuestrahipótesis alternativa. A ontinua ión revisamos di ho asunto. Test de una olaSupongamos que nuestra hipótesis es:H0 : βi = βio

H1 : βi > βiodonde βi0 ∈ R. En di ho aso, el estadígrafo es al ulado según lo propuesto en lase ión anterior. El punto está en omo a umulamos la probabilidad de re hazo.En este aso, el total de la probabilidad de re hazo se a umula en la ola dere hade la distribu ión, omo lo muestra la siguiente gura8:8¾Por qué en la ola dere ha? Porque la probabilidad de re hazo, es de ir, el nivel de signi- an ia, nos indi a hasta donde puedo tolerar un valor mayor a βio, por lo ual, are ería desentido que la zona de re hazo se en uentre en la ola izquierda de la distribu ión. Por ejemplo,si βio=0, la distribu ión de nuestro estadígrafo se entra en ero (vea la fórmula), por lo ual lahipótesis alternativa orrespondería a que el parámetro es positivo. el punto es ¾ uán positivopuedo a eptar que sea?.

54

Page 56: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Probabilidad

No se Rechaza

Se Rechaza (5%)

por lo tanto, re hazaremos nuestra hipótesis nula de que el oe iente es ero ontra la hipótesis alternativa que el parámetro es mayor que βio, si el valor al- ulado del test es mayor al valor ríti o de la tabla t. En el aso que H1 sea queel parámetro es menor a βio, enton es la probabilidad de re hazo se on entra enla ola izquierda y se re haza la nula en el aso que el valor al ulado sea menorque el valor ríti o de la tabla t.Test de dos olasSupongamos que nuestra hipótesis es:H0 : βi = βio

H1 : βi 6= βioEn este aso estamos repartiendo uniformemente la probabilidad de re hazo enambas olas de la distribu ión omo lo muestra la siguiente gura (al 95% de onanza):55

Page 57: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Probabilidad

No se Rechaza

Se Rechaza (2,5%)Se Rechaza (2,5%))

Por lo tanto, re hazaremos la nula si el valor al ulado es en módulo mayor queel valor ríti o de tabla. Note que en este aso, la probabilidad de re hazo sereparte un partes iguales en ambas olas. Ello se justi a en que la distribu iónt orresponde a una distribu ión simétri a.Error de Tipo I, Error de Tipo II, Tamaño y Poten ia de un testAntes de ontinuar, veremos uatro on eptos estadísti os importantes que nosindi an ara terísti as de nuestro test.1. Error de Tipo I (ETI): Corresponde a la probabilidad de re hazar lanula uando es ierta.2. Error de Tipo II (ETII): Corresponde a la probabilidad de a eptar lanula uando es falsa.3. Tamaño del Test: Corresponde la probabilidad de ometer ETI. Se dene omo el nivel de signi an ia del test (α).4. Poten ia del Test: Corresponde a la probabilidad de re hazar la nula uando es falsa. Se dene omo Poten ia =1-ETII.El óptimo para el investigador sería minimizar ambos tipos de errores y tener untest on un menor tamaño y mayor poten ia posibles, sin embargo, note que el56

Page 58: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.tamaño del test y por lo tanto, el ETI, es una variable endógena al investigador,en tanto que él de ide on que nivel de onanza trabajar. Luego, el objetivo setransforma en, dado un nivel de onanza, minimizar la o urren ia de ETII.Intuitivamente, si usted es oge un nivel de signi an ia pequeño (1%, por ejem-plo), sus zonas de re hazo serán pequeñas, on lo ual, inevitablemente, la zona deno re hazo re e, lo ual impli a que por minimizar el ETI, ha aumentado el ETII.P-valueOtra forma alternativa al valor ríti o de tabla para re hazar o no re hazar nues-tra nula, orresponde al uso de los llamados p-values, los uales son reportadosen ualquier paquete estadísti o. El p-value (p) se dene omo:p = p(tcalculado) = P (|Z| ≥ |tcalculado|) = 2(1− Φ(|tcalculado|)) (2.67)es de ir, el p-value representa la probabilidad de que el valor ríti o (t de tabla, ennuestro aso), sea mayor al valor t al ulado, es de ir, des ribe el nivel de signi- an ia exa to aso iado a un resultado e onométri o en parti ular. Por ejemplo,un p-value de 0.07 indi a que un oe iente es estadisti amente signi ativo enun nivel de 0.07 (o on un 93% de onanza).Ejemplo:Suponga el siguiente Modelo de Regresión Lineal Simple:

Yi = β1 + β2Xi + ui para i = 1, ..., NAdemás posee la siguiente informa ión muestral de X e Y:Y 2 5 6 7X 0 10 18 20El estimador MCO de β1 y β2 es el siguiente:β =

[β1

β2

]=

[4 4848 824

]−1 [20298

]=

[2,19350,2338

]La matriz de varianzas y ovarianzas de β es:V (β) = σ2

u(X′X)−1

=0,436

2

[4 4848 824

]−1

=

[0,180866 −0,010536−0,010536 0,000878

]57

Page 59: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Primero veamos el ajuste de este modelo, es de ir, en que grado la variable xexpli a a la variable y, para lo ual al ulemos el R2 y R2:

R2 = 1− RSS

TSS= 1−

∑4i=1 u

2i∑4

i=1(Yi − Y )2= 1− 0,436

14= 0,969

R2

= 1− RSS/2

TSS/3= 1−

∑4i=1 u

2i/2∑4

i=1(Yi − Y )2/3= 0,953Como podemos ver, el grado de ajuste del modelo es bastante bueno, omo elmodelo in luye onstante, el R2 se puede interpretar omo la propor ión de lavariabilidad de la variable independiente que es expli ada por la variabilidad dela variable dependiente, la que en este aso al anza un 97%.Ahora veamos si estos parámetros estimados son signi ativos a un 95% de on-anza, para lo ual realizaremos un test t de signi an ia a ada uno de ellos:1. Test de signi an ia de β1:

H0 : β1 = 0

H1 : β1 6= 0

t =β1

V ar(β1)∼ t2De esta forma, el valor al ulado para el estadísti o t es:

tc =2,193548387√

0,180866= 5,157850523El valor de tabla del estadísti o t a un 95% de onanza y on dos gradosde libertad es 4,303.

Probabilidad

No seRechaza Se

Rechaza(2,5%)

SeRechaza(2,5%))

t(2)=4,303 t(2)=4,303

tc=5,15858

Page 60: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.De esta forma, se re haza la hipótesis nula de que β1=0, y por lo tanto elparámetro estimado resulta ser estadísti amente signi ativo.2. Test de signi an ia de β2:H0 : β2 = 0

H1 : β2 6= 0

t =β2

V ar(β2)∼ t2De esta forma, el valor al ulado para el estadísti o t es:

tc =0,233870968√

0,000878= 7,892762865El valor de tabla del estadísti o t a un 95% de onanza y on dos gradosde libertad es 4,303.

Probabilidad

No seRechaza Se

Rechaza(2,5%)

SeRechaza(2,5%))

t(2)=4,303 t(2)=4,303

tc=7,893De esta forma, se re haza la hipótesis nula de que β2=0, y por lo tanto elparámetro estimado resulta ser estadísti amente signi ativo.3. TAREA: Testee la siguiente hipótesis nula:H0 : β1 − β2 = 2

H1 : β1 − β2 6= 259

Page 61: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.8.2. Test F (Conjunto de hipótesis lineales)Los asos 6. y 5. orresponden a un onjunto de hipótesis a testear. En el aso5. orrespondía a un sub onjunto parti ular de parámetros, mientras que el aso6. orrespondía a la nula de que todos ellos eran ero, menos la onstante. Endi hos asos se apli a la fórmula del test F según la e ua ión (2.63) y los riteriosde re hazo siguen lo expuesto en la se ión anterior.Sin embargo, en ambos asos podemos derivar expresiones alternativas para nues-tro test.Todas las pendientes del modelo son ero: En este aso, se puededemostrar que el test F puede expresarse omo:F =

ESS/(k − 1)

RSS/(n− k)∼ F(k−1,n−k) (2.68)o alternativamente, utilizando la deni ión del R2:

F =R2/(k − 1)

(1− R2)/(n− k)∼ F(k−1,n−k) (2.69)Un sub onjunto de las pendientes del modelo son ero: En este aso, se puede demostrar que el test F puede expresarse omo:

F =(u′

∗u∗ − u′u)/k2u′u/(n− k)

∼ F (k2, n− k) (2.70)donde u∗ denotan los residuos MCO restringidos (donde k2 representa elnúmero de regresores que han sido restringidos a ero), mientras que urepresentan los residuos del modelo MCO original.2.8.3. Intervalos de ConanzaUna forma alternativa (o mejor di ho omplementaria) de examinar la signi an- ia estadísti a de un parámetro ( o un onjunto de ellos) es a través de intervalosde onanza (IC). Ellos nos indi an, dado un nivel de onanza, el rango devalores admisibles del oe iente que se estima. Los niveles de onanza gene-ralmente utilizados son 99%, 95% y 90% (al igual que en los test de hipótesis),60

Page 62: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.donde el tamaño de los mismos es ne esariamente de re iente9.Una manera natural de obtener el IC aso iado a βi es a través del test t aso- iado. Vimos enton es que él orresponde a:βi − βi0√V ar(βi)

∼ tn−kenton es, si deseamos un IC del (1-α)% de onanza (es de ir, de α% de signi- an ia) para el parámetro βi, basta obtener de las tablas de distribu ión el valorλα orrespondiente, es de ir:

1− α = Pr

Zα/2 ≤

βi − βi0√V ar(βi)

≤ Z1−α/2

= Pr

−Z1−α/2 ≤

βi − βi0√V ar(βi)

≤ Z1−α/2

= Pr

[βi − Z1−α/2

√V ar(βi) ≤ βi0 ≤ βi + Z1−α/2

√V ar(βi)

]donde la ter era expresión se obtiene de despejar βi0 de la segunda. Note que elintervalo ha sido onstruido en base a una distribu ión simétri a ( omo la t o lanormal), por lo ual el valor de tabla a es oger debe orresponder a α/2.Note además que di ho intervalo está onstruido sólo en base a onstantes o-no idas. Una vez onstruido, se puede ontrastar la nula (H0: βi = βi0) al nivelde signi an ia α sen illamente observando si βi0 pertene e al intervalo (en uyo aso no re hazamos la nula) o se en uentra fuera de él (en uyo aso re hazamosla nula)10. Nuevamente, la validez de di ho intervalo de onanza depende ríti- amente del supuesto de distribu ión de los errores. En el aso que el valor Zαse obtenga de la tabla t, omo ya sabemos, estamos suponiendo que los erroressiguen una distribu ión normal. Un aso más general es utilizar los valores ríti osde la distribu ión normal estándar.También es posible derivar regiones de onanza, es de ir, IC de onanza simul-táneos para una onjunto de parámetros, sin embargo, su utiliza ión es es asa en9Intuitivamente, ya que a más exa ta es mi estima ión del rango posible, on menos onanzapuedo armar estar en lo orre to.10Una forma fá il de verlo es pensando en βi0=0, es de ir, que la variable xi no ayuda aexpli ar y. 61

Page 63: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.e onometría apli ada (½a menos que su pregunta puntual lo requiera!).Finalmente derivaremos el intervalo de onanza para la varianza de los erro-res. Sabemos de la e ua ión (2.61) que:u′u

σ2∼ χ2

n−k

(n− k)σ2

σ2∼ χ2

n−k (2.71)Utilizando la misma lógi a que utilizamos para el IC de un parámetro β, tenemosque el IC para σ2 orresponde a:[(n− k)σ2

χ2n−k,α

≤ σ2 ≤ (n− k)σ2

χ2n−k,1−α

]= (1− α) (2.72)Note que los valores ríti os utilizados orresponden a χ2

n−k,1−α y χ2n−k,α, ya quela distribu ión χ2 es una distribu ión asimétri a.2.8.4. Test de Normalidad (Test de Jarque-Bera)Consideramos ahora el problema de utilizar los momentos de los residuos MCOpara ha er inferen ia sobre la distribu ión de los errores pobla ionales. Dado quealgunas de las propiedades de MCO y de la inferen ia dependen del supuesto denormalidad en los errores, es importante poseer un ontraste para di ho supuesto.Como es sabido, la distribu ión normal es simétri a y meso úrti a. La simetríaimpli a que el ter er momento pobla ional E(u3) en torno a la media, es ero. Elhe ho que sea meso úrti a impli a que la kurtosis es 3 (es de ir, el an ho de las olas de la distribu ión, el ual se mide utilizando el uarto momento en tornoa la media). Re ordemos enton es que el oe iente de simetría pobla ional sedene omo: √

S =E(u3)

(σ2)32mientras que la kurtosis (o oe iente de):

K =E(u4)

(σ2)262

Page 64: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.En base a los anteriores, Bera y Jarke (1981), propusieron el siguiente estadígrafo, onstruido bajo la nula de normalidad:JB = n

[S

6+

(K − 3)2

24

]a∼ χ2

(2)Donde los estimadores muestrales del oe iente de asimetría y kurtosis se obtie-nen al onsiderar que un estimador natural de:µr = E[ur] orresponde a:

mr =1

n

n∑

i=1

uriNote que el estadígrafo está denido en términos del ex eso de kurtosis, porlo ual, a menor sea el valor, menor es la probabilidad de re hazar la nula denormalidad. Note además que el estadísti o es esen ialmente no onstru tivo, entérminos de que no nos indi a que amino seguir en aso de re hazar la nula,además de que no re hazar normalidad no impli a onrmar su existen ia. Sinembargo, en la prá ti a orresponde al test más utilizado.2.9. Predi iónLa predi ión es una de las herramientas más atra tivas y utilizadas en E ono-metría. Si el modelo que hemos es ogido onrma la teoría en onsidera ión, esde ir, a sobrevivido a las pruebas de hipótesis, podemos utilizar el modelo estima-do Y = Xβ para prede ir. La predi ión se puede efe tuar para un valor puntualde la variable dependiente, y0, orrespondiente a un valor dado de los regresores,

x0, o prede ir el valor esperado E[y0/x0] ondi ional a las variables expli ativas.Supongamos primero que queremos prede ir un valor individual de Y, y0, aso ia-do a un ve tor de regresores x0j on j = 1, 2..., k de dimensión 1× k.De a uerdo on el modelo e onométri o se tiene que y0 = β1+x0

2β2+.....+x0kβk+u0.Para prede ir el valor de y0 podemos utilizar la estima ión MCO del modelo,

y0 = x0β.De esta forma, el error de predi ión estará dado por :e0 = y0 − y0 = x0(β − β) + u063

Page 65: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.En donde se distinguen dos fuentes del error de predi iónEl error en la estima ión del ve tor βEl error esto ásti o inherente al modelo u0Sin embargo, si onsideramos que el estimador MCO es insesgado y mantenemoslos supuestos de nuestro modelo de regresión lineal, es trivial mostrar que el valoresperado del error de predi ión será ero. Además, podemos al ular la varianzadel error de predi ión:V ar(e0) = E[x0(β − β)(β − β)′x′0 + 2x0(β − β)u0 + u0u′0]

V ar(e0) = σ2µ + σ2

µx0(X ′X)−1x′0La varianza del error de predi ión dependerá de la matriz de regresores X dedimensión n × k que se utilizó para obtener las estima iones de β. Sabemos quea mayor dispersion de las variables expli ativas menor varianza tendrán nuestrasestima iones MCO11. Además dependerá del ve tor x0 que hemos asumido o-no ido y del parámetro σ2

µ, el ual no ono emos y deberá ser reemplazado porsu estimador σ2µ si es que queremos onstruir un intervalo de onanza para lapredi ión y0.Bajo supuestos de normalidad del término de error, el error de predi ión esuna ombina ión lineal de dos variables normales por lo tanto tiene una distribu- ión Normal(0, σ2e). Por lo tanto, por una razonamiento análogo al de las se ionesanteriores se tiene que:

y0 − y0√σ2µ(1 + x0(X ′X)−1x′0)

∼ N(0, 1) ⇒ y0 − y0√σ2µ(1 + x0(X ′X)−1x′0)

∼ tn−kPor lo tanto, dada una predi ión puntual y0 y una estima ión de la desvia iónestándar del error de predi ión podemos onstruir un intervalo de onanza parael valor de y0:Pr[y0 − t1−α/2,n−k

√V ar(e0) ≤ y0 ≤ y0 + t1−α/2,T−k

√V ar(e0)] = 1− α11Es posible y se re omienda derivar una expresión para la varianza del error de predi iónutilizando un modelo on 2 regresores. En está expresión se apre ia laramente la dependen iade la varianza del error de predi ión on la dispersion en torno a la media de las variablesexpli ativas. 64

Page 66: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Consideremos ahora que el investigador no está interesado en prede ir el valor dela variable endógena y0, si no tan solo su valor esperado E(y0) = x0β. La predi - ión, al igual que en el aso anterior, será x0β. La diferen ia es que el error de pre-di ión en este aso estará denido por e = E[y0]−x0β = x0β−x0β = x0(β− β).Cal ulando enton es la varianza (Ha erlo!) de este nuevo error de predi iónpodemos onstruir ahora un intervalo de onanza para E(y0) de la misma formaque antes.E[y0]− y0√

σ2µ(x

0(X ′X)−1x′0)∼ N(0, 1) ⇒ E[y0]− y0√

σ2µ(x

0(X ′X)−1x′0)∼ tn−k

Pr[y0 − t1−α/2,n−k

√V ar(e0) ≤ E[y0] ≤ y0 + t1−α/2,T−k

√V ar(e0)] = 1− αDonde utilizamos V ar(y0) = V ar(x0β) = x0V ar(β)x′0 = σ2µx

0(X ′X)−1x′0.La siguiente gura ejempli a las predi iones de y0 y E[y0/x0] en un modelode 2 variables independientes.

65

Page 67: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.

2.9.1. Medi ión de la pre isión de la predi iónSe han propuesto varias medidas para valorar la pre isión de los modelos depredi ión. Mu has de estas medidas están para evaluar la predi ión expost, esde ir, predi iones para las que las variables exógenas no tienen que ser predi has.Dos de estas medidas que se basan en los residuos de la predi ión, son la raíz uadrada del error uadrado medio y el error absoluto medio.RMSE =

√∑i(yi − yi)2

n066

Page 68: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.MAE =

∑i | yi − yi |

n0Donde n0 es el número de períodos que hay que prede ir. Estos métodos presentanun problema obvio de es ala. Algunas medidas que no presentan este problemase basan en el estadísti o U de Theil.U =

√(1/n0)

∑i(yi − yi)2

(1/n0)∑

i y2i

67

Page 69: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.10. Estima ión Máximo Verosímil (EMV)Hasta el momento hemos adoptado el riterio de estima ión onsistente on es- oger los valores de los parámetros (β,σ2) de modo de minimizar la suma de losresiduos al uadrado. A ontinua ión, expondremos otra forma de obtener losparámetros de interés, el ual, a diferen ia de OLS, des ansa en un determinadosupuesto respe to de la distribu ión del término de error, teniendo por objetivo, omo veremos más adelante, determinar los parámetros que maximi en la proba-bilidad de o urren ia de la muestra observada. La ventaja de MV es que puedeprodu ir estimadores onsistentes y asintóti amente e ientes uando MCO falla.Sea Y'=[y1, y2, . . ., yn un ve tor n × 1 de valores muestrales para la variabledependiente, los uales dependen de un ve tor k × 1 θ' = [θ1, θ2, . . ., θk. Seaf(y; θ) la densidad onjunta aso iada. A di ha probabilidad onjunta se le llamafun ión de Verosimilitud y se denota por L(·):

L(θ; y) = f(y; θ)Note que hemos invertido la nota ión entre L y la densidad. Ello porque la den-sidad des ribe los valores probables de Y dado un ve tor θ determinado, sinembargo, en nuestro aso el sentido es inverso: estamos interesados en el ve tor θdado un ve tor Y determinado.Al maximizar L(θ; Y ) respe to de θ se obtienen los estimadores máximo vero-símiles (θMV ), los uales maximizan la probabilidad de o urren ia de la muestraobservada, es de ir:θMV = max

θL(θ; Y ) (2.73)o equivalentemente12

θMV = maxθ

ln(L(θ; Y )) = maxθ

l(θ; Y ) (2.74)Luego, si asumimos que las observa iones de Y son independientes, enton es 13:l(θ; Y ) = ln(

n∏

i=1

Li(θ; yi)) =

n∑

i=1

li(θ; yi) (2.75)12En general se utiliza el logaritmo de la fun ión de verosimilitud, denotado omo l = ln(L) omo fun ión objetivo. Note que di ha transforma ión es ino ua, en términos de que el ve torde parámetros que maximize l será el que a su vez maximize L, ya que: ∂l∂θ

= 1

L

∂L

∂θ13Bajo independen ia, la fun ión de distribu ión onjunta de una muestra orresponde a lamultipli a ión de las fun iones de densidad individuales.68

Page 70: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.La primera derivada de L es generalmente ono ida omo S ore, s = (θ; Y ), porlo ual θMV se obtienen al igualar el s ore a ero.2.10.1. Propiedades de los estimadores MVLas propiedades de los estimadores ML se derivan en grandes muestras, por lo ual hablaremos de las propiedades asintóti as de los mismos. Ellas son:1. Consisten ia:plim(θMV ) = θ (2.76)es de ir, asintóti amente, el parámetro estimado orresponde al parámetropobla ional.2. E ien ia Asintóti a: La varianza del estimador ML al anza la llamadaCota Inferior de Cramer Rao, es de ir I(θ)−1. Esta propiedad asintóti aes la prin ipal virtud de los estimadores ML. La ota inferior de CramerRao orresponde al inverso de la matriz de informa ión (que deniremos a ontinua ión), la ual orresponde a la mínima varianza que puede poseerun estimador insesgado.3. Normalidad Asintóti a:

θMV ∼a N(θ, I(θ)−1) (2.77)es de ir, el estimador ML distribuye asintóti amente normal, on media θy varianza igual al inverso de la llamada matriz de informa ión (I(θ)).Esta última se dene omo:I(θ) = E

[∂l∂θ

∂l∂θ

′]= −E

[∂2l

∂θ∂θ′

]donde note que la matriz hessiana de segundas derivadas de L es una matriz uadrada y simétri a de orden k × k.4. Invarianza: Si θ es el estimador ML de θ y g(θ) es una fun ión ontinuade θ, enton es g(θ) es el estimador ML de g(θ).69

Page 71: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.10.2. Estima ión MVComo ya es usual, sea el siguiente modelo pobla ional:Y = Xβ + udonde las matri es poseen los tamaños usuales y u

iid∼ N(0, σ2I). Enton es:f(u1, u2, . . . , un; σ

2I) = f(u1) ∗ f(u2) ∗ · · · ∗ f(un) =n∏

i=1

f(ui)y asumiendo una distribu ión normal para los errores, tenemos que la fun ión deverosimilitud orresponde a:f(u1, u2, . . . , un; σ

2I) =n∏

i=1

1√2πσ2

exp−u2i2σ2 (2.78)

=1

(2πσ2)n2

exp−u′u

2σ2 (2.79)luego, dado nuestro modelo pobla ional, tenemos que:L = f(y1, y2, . . . , yn;X, σ2, β) =

1

(2πσ2)n2

exp−(Y −Xβ)′(Y −Xβ)

2σ2 (2.80) on lo ual, nuestros estimadores θMV = [βMV σ2MV ]

′ se obtienen siguiendo laregla expuesta en (2.74):maxβ,σ2

ln(L) = maxβ,σ2

ln

(1

(2πσ2)n2

exp−(Y −Xβ)′(Y −Xβ)

2σ2

)

= maxβ,σ2

(−n

2ln(2π)− n

2ln(σ2)− (Y −Xβ)′(Y −Xβ)

2σ2

)(2.81) on lo ual, las CPO:∂lnL

∂β=

1

σ2X ′(Y −Xβ) = 0

=⇒ βMV = (X ′X)−1X ′Y (2.82)∂lnL

∂σ= − n

2σ2+

1

2σ4(Y −Xβ)′(Y −Xβ) = 0

=⇒ σ2MV =

(Y −XβMV )′(Y −XβMV )

n(2.83)70

Page 72: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Enton es, bajo normalidad de los errores, el estimador βMV es equivalente al es-timador MCO. Sin embargo, note que el estimador de la varianza de los errores(σMV ) da lugar al estimador sesgado.Nos queda enton es derivar la varianza de los estimadores MV. Vimos que lamatriz de varianzas orrespondía al inverso de la matriz de informa ión (I(θ)).Por fa ilidad de ál ulo, generalmente se utiliza la segunda deni ión de I(θ), esde ir, la de las segundas derivadas de la fun ión de verosimilitud. Enton es:∂2l

∂β∂β ′= −X ′X

σ2

−E

[∂2l

∂β∂β ′

]=

X ′X

σ2(2.84)

∂2l

∂β∂σ2= −X ′u

σ4

−E

[∂2l

∂β∂σ2

]= 0 (2.85)

∂2l

∂(σ2)2=

n

2σ4− u′u

σ6

−E

[∂2l

∂(σ2)2

]=

n

2σ4(2.86)donde esta última esperanza se deriva del he ho que E(u′u) = nσ2. Enton es, lamatriz de informa ión orresponde a:

I(β, σ) =

(X′Xσ2 00 n

2σ4

) (2.87)mientras que su inversa:I(β, σ)−1 =

((X ′X)−1σ2 0

0 2σ4

n

) (2.88)Note que el he ho que la matriz de informa ión (y por lo tanto su inversa) seauna matriz diagonal, reeja que X y u se distribuyen independientemente (de otraforma E(X ′u) 6=0). 71

Page 73: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.11. Inferen ia en el ontexto MV2.11.1. Test de Razón de Verosimilitud (LR)El valor de la fun ión de verosimilitud, L(β, σ2), orresponde al valor de la verosi-militud irrestri ta, es de ir, sin imponer ninguna restri ión sobre los parámetrosdel modelo. Suponiendo enton es que nuestro interés se entra en una serie de res-tri iones lineales del tipo Rβ = r (donde R y r se denen omo en la se ión 2.8),enton es el modelo original es estimable en su versión restringida, al maximizarla fun ión de verosimilitud sujeta a Rβ = r, uyo resultado son los estimadoresβ y σ2. Luego L(β, σ2) orresponde al valor de la verosimilitud restringida.El valor de la verosimilitud restringida no puede ser superior al de la no restringi-da, sin embargo, podría esperarse que si las restri iones impuestas son orre tas,el valor de la primera esté er a del de la segunda. Enton es, denimos la razónde verosimilitud (λ) omo:

λ =L(β, σ2)

L(β, σ2)El test LR se dene enton es omo:LR = −2 lnλ = 2[lnL(β, σ2)− lnL(β, σ2)] ∼a χ2(q) (2.89)donde q orresponde al número de restri iones impuestas (es de ir, el número delas de R).Intuitivamente, el valor del estadígrafo re erá a mayor sea la dis repan ia entrelos valores de la verosimilitud restringida y la no restringida, lo ual nos aleja dela posibilidad que las restri iones impuestas sea válidas (no re hazo de la nula).En el aso que los errores distribuyan normal, es posible derivar una versiónalternativa del estadígrafo utilizando los residuos. Reemplazando βMV y σ2

MV enl es posible demostrar:L(β, σ2) = (2πe)−

n2 (σ2)−

n2 =

(2πe

n

)−n2

(u′u)−n2 (2.90)Luego, si denimos omo uNR los residuos del modelo irrestri to y omo uR,reemplazando en la deni ión del test, obtenemos:

LR = n(ln u′RuR − ln u′

NRuNR) (2.91)72

Page 74: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.2.11.2. Test de Wald (W)Un segundo test asintóti o en el ontexto MV orresponde al llamado Test deWald. Di ho test se basa en evaluar la hipótesis nula en los oe ientes estimadosy evaluar uan er ano es el resultado omprado a lo propuesto por la nula. Unade las ventajas del test de Wald es que sólo ne esita de la estima ión no restringi-da. Así, una vez obtenido β, un ve tor (Rβ− r) er ano a ero tendería a apoyarla hipótesis nula.Siguiendo la misma lógi a de la demostra ión del test F, si:β

a∼ (β, I(β)−1) (2.92)enton es, bajo la hipótesis nula:(Rβ − r)

a∼ (0, RI(β)−1R′) (2.93)enton es, se puede demostrar que:(Rβ − r)′[RI(β)−1R′]−1(Rβ − r)

a∼ χ2q (2.94)donde q es el número de las de R y por lo tanto, el número de restri iones(según la denimos en la se ión 2.8). Luego, omo los estimadores MV distri-buyen asintóti amente normales, enton es la matriz de informa ión expuesta enla e ua ión (2.88) es válida en muestras grandes, tenemos que el estadísti o deWald se dene omo14:

W =(Rβ − r)′[R(X ′X)−1R′]−1(Rβ − r)

σ2

a∼ χ2q (2.95)Una nota: Dijimos que el test era válido asintóti amente, donde hemos utilizadoel resultado de normalidad asintóti a de MV. En aso de que los errores efe ti-vamente distribuyan normal en muestra nita, el test (lógi amente) mantiene sudistribu ión.2.11.3. Test del Multipli ador de Lagrange (LM)Un ter er test orresponde al test LM, el ual también es ono ido omo el testdel S ore. re ordemos que el S ore orresponde a la matriz de primeras derivadas14Note que hemos utilizado sólo el bloque superior izquierdo de la inversa de la matriz deinforma ión. Ello porque el test orresponde a los parámetros aso iados a los oe ientes de laregresión. Además, ello es posible porque la matriz es diagonal, lo ual impli a que no existe orrela ión entre los errores y los regresores. 73

Page 75: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.de la fun ión de Verosimilitud:s(θ) =

∂ lnL

∂θ

=∂l

∂θComo vimos en la introdu ión, s(θ) = 0, por lo ual, al evaluar el s ore en elestimador restringido bajo la nula Rβ− r = 0 (β), generalmente obtendremos unve tor diferente de ero, sin embargo, si la nula no se puede re hazar, esperaría-mos obtener un ve tor er ano a ero.Se puede demostrar que el s ore posee media ero y varianza igual a la matriz deinforma ión (I(θ)). Por lo tanto, tenemos que la forma uadráti a:s′(θ)I(θ)−1s(θ)

a∼ χ2 on lo ual, al evaluar en el ve tor de parámetros restringido tenemos que bajola nula, el test LM se dene y distribuye omo:LM = s′(θ)I(θ)−1s(θ) ∼a χ2

q (2.96)Note que ontraposi ión al test de Wald, sólo ne esitamos al ular el estimadorrestringido. De he ho, su popularidad reside en que mu has ve es es más fá il al ular el estimador restringido que el irrestri to.Dada la normalidad asintóti a de los estimadores MV, podemos redu ir el es-tadígrafo a una forma mu ho más simple. Para ver lo anterior, onsidere unanota ión matri ial del s ore:s(θ) =

[∂l∂β∂l∂σ2

]=

[1σ2X

′u

− n2σ2 +

u′u2σ4

]enton es, para evaluar el s ore en la estima ión restringida, utilizamos los residuosrestringidos, los uales denotaremos por:u∗ = Y −Xβy por lo tanto:σ2∗ =

u′∗u∗

n on lo ual:s(θ) =

[1

σ2∗X′u∗

0

] (2.97)74

Page 76: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.Enton es, tomado en uenta la deni ión de I(θ)−1 dada en (2.87) y evaluándolaen el estimador restringido, tenemos que nuestro test en (2.96) queda omo:LM =

[1σ2u

′∗X 0

] [ σ2(X ′X)−1 0

0 2σ4

n

] [1σ2u

′∗X0

]

=u′∗X(X ′X)−1X ′u∗

σ2

= nu′∗X(X ′X)−1X ′u∗

u′∗u∗

(2.98)= nR2 ∼a χ2

q (2.99)donde el R2 orresponde a la bondad de ajuste de la regresión auxiliar entre u∗y X.Resumiendo, el test se implementa en tres simples pasos:1. Estimar el modelo restringido y obtener sus residuos2. Con ellos orrer una regresión de ellos ontra X. Obtener el R23. Construir el estadísti o2.12. Algunas a ota iones respe to a la estima- ión y la inferen ia MV1. La se ión 2.10.2 asume que la distribu ión de los errores sigue una distri-bu ión normal. Sin embargo, suponer errores normales es sólo uno de losposibles supuestos respe to a la distribu ión de los errores. Existe una gran antidad de posibilidades al respe to, utilizándose otras omo la distribu iónlogísti a y la exponen ial, muy regularmente en otros tópi os e onométri os.Lo anterior es una ventaja de la estima ión MV, dado que sus propiedadesasintóti as se mantienen independientemente de la distribu ión utilizada.2. Otra ventaja orresponde a la posibilidad de utilizar modelos no lineales.MCO (tal y omo lo hemos estudiado) sólo permite estimar modelos linea-les en parámetros, mientras que MV permite no linealidades (aunque elloimplique la imposibilidad de obtener de obtener formas fun ionales erradaspara nuestros estimadores, lo ual impli a ne esariamente utilizar métodosnuméri os para optimizar la fun ión objetivo).75

Page 77: Apuntes Benavente Econometria

Capitulo 2: Modelo de Regresión Lineal E onometríaEs uela de Nego ios, UAI.3. Otra ventaja reside en la inferen ia. Toda la inferen ia vista en MCO poseíadistribu ión exa ta bajo el supuesto de normalidad. Los test asintóti osvisto en la inferen ia MV son válidos bajo ualquier distribu ión supuesta(aunque asintóti amente).4. Adi ionalmente, los tres test vistos son apa es de lidiar on restri iones nolineales. ¾Por qué? Porque MV es apaz de lidiar on modelos no lineales155. Es posible demostrar que W ≥ LR ≥ LM al ser apli ados a un modelolineal. Los tres son asintóti amente equivalentes, sin embargo, en muestrasnitas arrojarán resultados diferentes.6. ¾Cuándo es re omendable utilizar un test t o un test F por sobre un testasintóti o?7. Todos los paquetes estadísti os reportan el valor de la fun ión de verosi-militud (es de ir, la fun ión evaluada en los parámetros estimados). Ello,mu has ve es es utilizado omo un riterio de sele ión entre modelos (re- uerde que nuestro objetivo es maximizar la fun ión de verosimilitud).

15Un ejemplo de restri ión no lineal orresponde a H0 : ln(β2

3) = −0,1+ ln(β2). Para estimarel modelo restringido basta on aislar β2 e introdu irlo en la fun ión de verosimilitud que serámaximizada por métodos numéri os. 76

Page 78: Apuntes Benavente Econometria

Capítulo 3Forma Fun ional y Espe i a ión3.1. Regresores Esto ásti os en el Modelo de Re-gresión LinealEn el desarrollo del modelo de regresión lineal realizado en la se ión 2.4 asu-mimos que nuestras variables expli ativas eran determinísti as (Supuesto 2). Enese ontexto, ada vez que tomábamos una muestra diferente los regresores per-mane ían jos y solo la variable dependiente ambiaba, ha iendo enton es quela regresión muestral fuera una aproxima ión a la regresión pobla ional. En estáse ión pro ederemos a eliminar este supuesto1 y veremos uales son las on-se uen ias de asumir regresores esto ásti os en las estima iones del modelo deregresión lineal. Es de ir, asumiremos ahora que X es obtenida aleatoriamente apartir de alguna distribu ión de probabilidad.Si X es esto ásti o, X debe ser independiente de u si queremos mantener laspropiedades estadísti as de los estimadores MCO. Un método ade uado para ob-tener las propiedades estadísti as de β onsiste en obtener primero los resultados ondi ionados en X. Esto equivale al aso de los regresores no esto ásti os. Des-pués bus amos los resultados in ondi ionales "promediando"(por ejemplo, porintegra ión total) las distribu iones ondi ionadas. La lave de este razonamien-to es que, si podemos estable er insesgamiento ondi ionado en un X arbitrario,podemos promediar las X para obtener un resultado in ondi ionado.Manteniendo los supuestos 3 y 4 dados porE(u|x)=E(u)=0, V ar(u|X) = V ar(u) =1Todos los otros supuestos realizados anteriormente se mantienen.77

Page 79: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIσ2 podemos al igual que antes estudiar si MCO es insesgado.

β = β + (X ′X)−1X ′u

E[β|X ] = β + (X ′X)−1X ′E[u|X ] = βYa que por supuesto 3 E[u|X ] = 0. Podemos ahora al ular el valor esperadoin ondi ional apli ando esperanza sobre todo el espa io posible de los regresores.E[β] = Ex[E[β|X ]]

E[β] = β + Ex[(X′X)−1X ′E[u|X ]] = βPor lo tanto, β también es insesgado in ondi ionalmente.E[β] = Ex[E[β|X ]] = β.El insesgamiento de los parámetros MCO es robusto a los supuestos de la matrizX.Con respe to a la varianza de β ondi ionada en la matriz de variables inde-pendientes tenemos

V [β|X ] = σ2(X ′X)−1Sin embargo, la varianza in ondi ional de β esta dada por2V [β] = Ex[V [β|X ]] + Vx[E[β|X ]]

V [β] = Ex[V [β|X ]] + Vx[β]

V [β] = Ex[V [β|X ]] = E[σ2(X ′X)−1] = σ2E[(X ′X)−1]Nuestra on lusión ini ial se altera un po o, tenemos que sustituir (X ′X)−1 porsu valor esperado para obtener la matriz de ovarianzas apropiadas. La varianzain ondi ionada de β solo puede ser des rita en términos del omportamientomedio de X. Sin embargo, el teorema de Gauss Markov seguirá apli ando. Ya quesi para ada X parti ular el estimador MCO es el mejor estimador lineal insesgadotambién lo será para los valores medios de los regresores.2Apli ando des omposi ión de la varianza(Ver).78

Page 80: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAICon lusiones:Si los errores son independientes de las X enton es se umplirá el Teoremade Gauss Markov.Bajo normalidad del error los test estadísti os tienen la misma distribu iónque en el aso de las X no esto ásti as.3.2. In orpora ión de No LinealidadesEn la se ión 2 asumimos que el modelo de regresión debía ser lineal. Sin embargo,mu has de las rela iones e onómi as no son lineales. Veamos el siguiente ejemplode la rela ión entre las ventas de los portales de Internet y el número de visitasal portal.

Claramente la rela ión es no lineal. No es lo mismo en términos de ventas aumen-tar desde 40 visitas a 50 que de 10 visitas a 20. Pero, ¾Cómo podemos in orporarno linealidad entre Y y X en nuestro modelo de regresión?. Bási amente lo queharemos es utilizar algunos tipos de transforma ión de variables. Esto nos permi-tirá tener un modelo no lineal y a partir de la apli a ión de las transforma ionestener un modelo de regresión lineal para el que se umplen todas las osas quehemos visto. 79

Page 81: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAITransforma ión Logarítmi aSuponga unmodelo original no lineal de la siguiente forma Yi = β1Xβ2

i ui.Si apli amos logaritmo nos quedará un modelo transformado de la si-guiente formaln(Yi) = ln(β1) + β2ln(Xi) + ln(ui)En donde β2 = ∂Y∂X

XY

orresponde a la elasti idad X de Y. Este tipo detransforma iones es muy útil en modelos de demanda y de produ ión.Transforma ión Semilogarítmi aSuponga unmodelo original no lineal de la siguiente forma Yi = β1eβ2Xiui.Si apli amos logaritmo nos quedará un modelo transformado de la si-guiente forma

ln(Yi) = ln(β1) + β2Xi + ln(ui)En donde β2 = ∂Y∂X

1Y

orresponde a la semi elasti idad X de Y. Una uti-liza ión omún de la formula ión semilogarítmi a se da en los asos de re imiento exponen ial. Si X es el tiempo t, enton es ∂ln(Y )∂t

= β2 =Tasamedia de re imiento de Y.Transforma ión Re ípro aSuponga un modelo original no lineal de la siguiente forma Yi = β1 +β2

1Xi

+ ui. El ual podemos expresar omo un modelo transformado dela siguiente formaYi = β1 + β2Zi + uiEn donde β2 =

∂Y∂X

orresponde al parámetro usual.Si no se ono e a priori la forma fun ional, existen algunos métodos que podríanidenti ar la existen ia de alguna no linealidad. A ontinua ión veremos uno deellos.3.2.1. Test de No Linealidades Omitidas (Test de Reset)Una pregunta interesante de plantearse es si nuestro modelo ha omitido no linea-lidades en iertos regresores3. Ramsey (1969) introdujo el siguiente test. Bajo la3Es importante no onfundir la no linealidad en regresores Vs no linealidades en parámetros.Nuestro enfoque se basa en el primer tipo de ellas. El segundo es de mayor omplejidad en tanto80

Page 82: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAInula, el modelo pobla ional orresponde a:Y = Xβ + uluego, denotamos, omo ya es usual, Y = Xβ. Ramsey propuso estimar el si-guiente modelo auxiliar a través de MCO.

Y = Xβ1 + Zβ2 + udonde:Z =

[Y 2 Y 3 . . . Y m

]luego la nula:H0: No Existen no linealidades omitidas

H0: β2=0puede ser testeada utilizando un test de Wald sobre β2. Es posible demostrar quebajo la nula W∼a χ2m−1. Por lo tanto, la nula se re haza al α% de signi an ia siel estadígrafo es mayor que el valor ríti o orrespondiente. Para implementar eltest, m (es de ir, el número de poten ias de Y a in luir en la regresión auxiliar)debe ser sele ionado previamente. Típi amente, valores pequeños omo 2, 3 o 4pare en fun ionar mejor.

que al derivar la fun ión objetivo on respe to a los parámetros de interés, podemos no obteneruna forma fun ional errada para nuestro estimador. Ello nos llevará generalmente a utilizarmétodos numéri os para maximizar o minimizar nuestra fun ión objetivo, la ual, in luso puededejar de ser estri tamente ón ava. 81

Page 83: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI3.3. Variables Dummies o ualitativasEn en análisis de regresión, la variable dependiente esta inuida fre uentementeno solo por variables ontinuas omo so el ingreso, produ ión, pre ios, ostos,estatura, temperatura, et ..., sino también por variables que son esen ialmente ualitativas, estos son regresores binarios, es de ir, variables que sólo toman el va-lor 0 o 1. Di has variables son llamadas variables dummies, variables di otómi aso variables ti ias. Mu has ve es el regresor es binario porque así fue re ogidoen la en uesta. Sin embargo, en otros asos el regresor binario ha sido onstruidoa partir de otras variables de los datos.Algunos ejemplos de variable dummies son: género, raza, religión, na ionalidad,región geográ a, et ....Con respe to a las dos primeras variables men ionadaspor ejemplo, se ha en ontrado que manteniendo todos los demás fa tores ons-tantes, las trabajadoras mujeres ganan menos que sus olegas hombres, y que laspersonas de olor ganan menos que las blan as. Este patrón puede resultar dedis rimina ión sexual o ra ial, pero ualquiera sea la razón, las variables ualita-tivas tales omo género o raza sí inuyen sobre la variable dependiente.Por ejemplo, onsideremos la siguiente variable dummy para género (mujer/hombre)del individuo. Enton es la variable dummy onsistirá en un ve tor (n × 1) onelementos 0 o 1 según orresponda. Es de ir:d1i =

1 mujer0 hombre (3.1)A modo de ejemplo, pensemos en una e ua ión simple de salarios E(Salario(W)/Género),la ual impli a el siguiente modelo:

Wi = β0 + β1d1i + ui (3.2)enton es, dada la espe i a ión es ogida para la dummy, tenemos que:β0 = E(W/hombre)

β0 + β1 = E(W/mujer)Alternativamente, podríamos haber denido la dummy de la siguiente forma:d2i =

0 mujer1 hombre (3.3)82

Page 84: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIy el modelo omoWi = β0 + β1d2i + uienton es, en esta segunda espe i a ión es ogida para la dummy, tenemos que:

β0 + β1 = E(W/hombre)

β0 = E(W/mujer)Una ter era forma de denir el modelo sería in luyendo ambas dummies:Wi = β1d1i + β2d2i + ui on el ual tendríamos que los retornos a ambos géneros serían:β2 = E(W/hombre)

β1 = E(W/mujer)Los tres modelos anteriores son equivalentes. Note que en el ter er modelono in luimos término onstante ya que ello haría que la matriz X fuese singular ypor lo tanto, no invertible. Di ho error de espe i a ión es llamado en la literatu-ra Trampa de las Dummies y orresponde a un error netamente del investigador,no de los datos.Un modelo de regresión puede ontener variables expli ativas que son ex lusi-vamente di otómi as o ualitativas, tales modelos se denominas Modelos deanálisis de varianza (ANOVA), estos modelos son utilizados para determinarla signi an ia estadísti a de la diferen ias de medias entre grupos, por ejemplo,serviría para determinar si existe diferen ia signi ativa entre los ingresos mediosde los hombres y mujeres.Ejemplo I:Contamos on datos de ingreso proveniente de la o upa ión prin ipal para el año2000, de a uerdo a zona geográ a de Chile: Norte (de la primera a la uartaregión), Centro (quinta región, sexta región y región metropolitana) y Sur (dela séptima a la duodé ima región). Suponga que deseamos averiguar si el salariopromedio diere entre las distintas zonas geográ as, si tomamos el promedio delos salarios de los individuos en ada una de las zonas obtenemos lo siguiente:Zona Geográfi a Salario PromedioNorte $ 270,154Centro $ 296,857.8Sur $240,238.983

Page 85: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIEstos números son laramente diferentes entre sí, pero lo que nos interesa saberes si esta diferen ia es estadísti amente signi ativa, para esto utilizaremos unmodelo ANOVA.Consideremos el siguiente modelo de regresión:Yi = β0 + β1D1i + β2D2i + uidonde:

Yi=Salario del individuo i.D1i=es una variable dummy que toma valor 1 si la persona i vive en el norte y ero sino.D2i= es una variable dummy que toma valor 1 si la persona i vive en el sur y ero sino.Este modelo es omo ualquier otro modelo de regresión lineal, la úni a dife-ren ia que ahora todo nuestras variables expli ativas son binarias. De esta forma,el salario promedio de los individuos que viven en el norte es:

E(Yi|D1i = 1, D2i = 0) = β0 + β1de igual forma el salario promedio de los individuos que viven en el sur es:E(Yi|D1i = 0, D2i = 1) = β0 + β2y por último, el salario promedio de los individuos que viven en el entro es:

E(Yi|D1i = 0, D2i = 0) = β0Así, el salario promedio de los individuos de la zona entro esta dado por el inter- epto de la e ua ión de regresión, además los oe ientes β1 y β2 ("pendiente"),indi an la antidad en que los salarios promedios del norte y sur dieren de losdel entro, respe tivamente. Ahora ne esitamos ver si estas diferen ias son esta-dísti amente signi ativas.El modelo estimado es:

84

Page 86: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIComo los tres oe ientes estimados resultan ser estadísti amente signi ativos,la diferen ia en los salarios promedios entre regiones es estadísti amente signi- ativa. De esta forma, se puede on luir que los salarios en la zona entro sonestadísti amente mayores a los de la zona norte y sur, y que los de la zona norteson estadísti amente superior a los de la zona sur.Es importante tener laro que las variables di otómi as simplemente señalaranlas diferen ias, si es que estas existen, pero no sugieren razones por las ualesestas se presentan.Desde ahora llamaremos a la ategoría que no se le asigna dummy (en nues-tro ejemplo la zona entro) omo ategoría base, todas las ompara iones seharán respe to a esta ategoría. Los oe ientes orrespondientes a las variablesdi otómi as los llamaremos oe ientes de intera ión diferen ial.Los modelos ANOVA que a abamos de analizar no son muy fre uentes en e ono-mía, sólo se utilizan para testear diferen ias de medias.Los modelos e onométri os generalmente son más amplios e introdu en tantovariables expli ativas ontinuas omo di otómi as. Por ejemplo, es razonable su-poner que, además del género, existen otros fa tores que expli an el salario (edu- a ión y experien ia (entre otros) siguiendo a Min er (1974)).Espe iquemos nuevamente el modelo en (3.2) omo E(Salario (W)/Edu a ión(E), Género):Wi = β0 + β1d2i + β2Ei + uiDi ho modelo presenta un efe to inter epto para el género, es de ir, hombresy mujeres poseen diferente inter epto, pero igual pendiente (β2) en edu a ión(retorno a la edu a ión):

β 0+β1

β0

β

β2

2

Mujeres

Hombres

E

W

Salario y Educación, diferencia de intercepto entre hombresy mujeres85

Page 87: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIAhora, si quisiéramos espe i ar un modelo en que además las pendientes varíen on el género (retornos a la edu a ión diferen iados), tendríamos el siguientemodelo:Wi = β0 + β1d2i + β2Ei + β3d2i · Ei + uidonde:E(Salario (W)/Edu a ión (E), Hombre)=β0 + β1+β2E+β3E.E(Salario (W)/Edu a ión (E), Mujer)=β0+β2E.

∂E(Salario(W )/Educacin(E),Hombre)∂E

= β2 + β3.∂E(Salario(W )/Educacin(E),Mujer)

∂E= β2.En el aso que existan otros regresores ontinuos (experien ia, por ejemplo), po-dría ser deseable poseer efe tos diferen iados en la pendiente sólo para algunosde ellos.

β 0+β1

β0

β

β2

2

Mujeres

Hombres

E

W

Salario y Educación, diferencia de intercepto y pendienteentre hombres y mujeres

+β3

86

Page 88: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI3.3.1. Posibles usos de las variables DummiesComo hemos men ionado las variable dummies pueden reejar ara terísti as in-dividuales omo género, status marital,raza, et , y de esta forma las habiamosllamado variable ualitativas. Sin embargo, este no es el úni o motivo parain luir dummies en una regresión. Existen además aquellas dummies llamadasdummies esta ionales uyo objetivo es ontrolar por fa tores temporales delos datos. Por ejemplo, estimando la demanda de helados, es posible que existaun .efe to verano"por lo ual la demanda aumente en algunos trimestres o bimes-tres, de esta forma para ontrolar di ho efe to, se deben in luir 4 dummies adauna orrespondiente a un trimestre del año (o 6 en el aso del bimestre, o 2 enel aso del semestre, et .). Re uerde que el aso de in luir una onstante deberetirar dis re ionalmente alguna de ellas, la ual servirá omo trimestre de refe-ren ia. Las dummies también pueden ser útiles para aptar efe tos umbrales.Siguiendo on nuestro ejemplo de edu a ión, podríamos tener que en la en uesta,la variable Edu a ión no fue re ogida en forma ontinua, sino dis reta (es de ir,si la persona posee: Edu a ión Bási a (8 años), Edu a ión Media (12 años), Edu- a ión Universitaria (17 años), Edu a ión universitaria on postgrado (19 años)).Deniendo una dummy por ada nivel de edu a ión, el oe iente aso iado a a-da una de ellas nos mostraría el retorno a ada tipo de edu a ión. Finalmente,las dummies pueden ser de utilidad para uanti ar efe tos ondi ionales. Yahabíamos enun iado éstas uando vimos E(W/E,género), en que permitimos quela pendiente varíe entre géneros. Di has dummies son de interés uando queremos aptar algún efe to ondi ional a alguna ara terísti a. Por ejemplo, el retorno ala edu a ión dado que se es mujer, o que se es asado, o que se es blan o, et .En di ho aso, basta introdu ir la dummy que identi a el estado ondi ionalmultipli ada por la variable de interés.Con luyendo, la forma en que se in luyan las variables binarias en el modelode regresión depende de la pregunta que el investigador desee responder o delobjetivo que tenga para in luirlas. Creatividad y teoría.Desde el punto de vista de la teoría de regresión, di orresponde a un varia-ble aleatoria del mismo pro eso de muestro que generó el resto de las variables.Veamos enton es omo manejarlas algebrai amente. Sea el modelo simple:Wi = β1d1i + β2d2i + uio en nuestra nota ión matri ial usual:

Y = Xβ + u87

Page 89: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIdonde β = (β1β2) y X = [D1D2], enton es:β = (X ′X)−1X ′Y

=

[D′

1D1 D′1D2

D′2D1 D′

2D2

]−1 [D′

1YD′

2Y

]

=

[ ∑ni=1 d

21i

∑ni=1 d1id2i∑n

i=1 d1id2i∑n

i=1 d22i

]−1 [ ∑ni=1 d1iyi∑ni=1 d2iyi

]

=

[n1 00 n2

]−1 [ ∑ni=1 d1iyi∑ni=1 d2iyi

]

=

[y1y2

]donde n1 y n2 son el número de observa iones on d1i=1 y d2i=1, respe tivamente,y y1 y y2 orresponden a las medias muestrales entre las respe tivas observa iones.Y on respe to a la varianza de los estimadores:V (β) = (X ′X)−1σ2

=

[σ2

n10

0 σ2

n2

]donde:σ2 =

1

n

n∑

i=1

u2ies el estimador basado en la muestra ompleta.

88

Page 90: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIEjemplo II:A ontinua ión veremos la apli a ión de la llamada .E ua ión de Min er"paraestimar el retorno a la edu a ión. Los datos orresponden a un grupo de jóvenes hilenos egresados de la edu a ión media té ni a, los que fueron entrevistados en1997. La primera gura muestra la estima ión de la e ua ión de Min er en suversión original (1974):ln(Salario)i = α + β1Educacioni + ui

Consideremos ahora una versión más ompleta del modelo en que in luimos laexperien ia y una dummy que toma el valor 1 si el individuo es una mujer:

Note que el retorno a la edu a ión sigue siendo positivo, mientras que la dummypara mujer es negativa (¾Qué signi a que el parámetro sea negativo?). Veamos a ontinua ión, la misma espe i a ión, sólo que esta vez la dummy se dene omo1 si el individuo es hombre:89

Page 91: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI

¾Cómo es el parámetro de la dummy para el hombre omparado on el de lamujer? ¾Qué pasa on la estima ión del resto de los parámetros?.

90

Page 92: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI3.4. Variable Dependiente RezagadaCuando trabajamos on series de tiempo, es posible que sea de nuestro interésin luir rezagos de la variable dependiente omo variables expli ativas. Ello puedeo urrir uando reemos que existe ierta persisten ia de nuestra variable depen-diente. Por ejemplo, para tratar de expli ar el omportamiento de la ina ión(πt), tendría sentido introdu ir omo variables expli ativas, junto on la tasa de re imiento del dinero (mt), rezagos de la propia tasa de ina ión:πt = β0 + β1πt−1 + β2mt + utSupongamos el modelo más simple posible:yt = β1yt−1 + ut con |β1| < 1 (3.4)Adelantándonos a la teoría de series de tiempo, el modelo anterior re ibe el nom-bre de Pro eso Autorregresivo de Primer Orden (AR(1)), donde el nombrede autorregresivo se debe a que la variable se expli a por rezagos de ella misma yde primer orden porque depende sólo del primer rezago (el orden indi a el númeromáximo de rezagos in luidos).La estima ión MCO del modelo anterior es β = (X ′X)−1X ′Y , donde X=[i,Yt−1, on la diferen ia que esta vez poseemos n-1 datos, a menos que supongamos unvalor ini ial para Y0. En este aso dejan de umplirse uno de los supuestos bajolos uales vimos las propiedades del estimador MCO y la inferen ia aso iada,aunque ontinuemos ha iendo los supuestos pertinentes para el término de error,el modelo viola el supuesto de regresores jos (no esto ásti os).Anali emos esto on más detalle, el estimador MCO de β1 en (3.4) es:β1 =

∑Tt=2 ytyt−1∑Tt=2 yt−12

=

∑Tt=2(β1yt−1 + ut)yt−1∑T

t=2 y2t−1

= β1 +

∑Tt=2 utyt−1∑Tt=2 yt−12para que este estimador sea insesgado se requiere que:

E

[∑Tt=2 utyt−1∑Tt=2 yt−12

]= 0 (3.5)91

Page 93: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIlo ual se umplirá en la medida que ys y ut sean independientes para todo (t,s).Para examinar este punto on más detalle, substituyamos el modelo en repetidaso asiones hasta llegar a una forma general:y1 = β1y0 + u1

y2 = β1y1 + u2 ⇒ y2 = β1(β1y0 + u1) + u2 = β21y0 + (u2 + β1u1)

y3 = β1y2 + u3 ⇒ y3 = β1(β21y0 + u2 + β1u1) + u3 = β3

1y0 + β21u1 + β1u2 + u3...

yt = βt1y0 + (ut + β1ut−1 + β2

1ut−2 + · · ·+ βt−11 u1)Luego, multipli ando yt por ut, ut−1, ut−2, et . y tomando esperanza, tenemosque:

E(ytut) = σ2

E(ytut−1) = β1σ2

E(ytut−2) = β21σ

2Por lo tanto, el valor a tual de y se en uentra orrela ionado on el error a tual ypasado (no on los futuros). De la misma forma, rezagando la expresión nal parayt, multipli ando por ut, ut−1, ut−2, et . se puede veri ar que el regresor yt−1 nose en uentra orrela ionado on el valor a tual del error, pero si on sus valorespasados. Ello impli a que nuestro supuesto E(uiXi) = 0 ya no es válido, por lo ual, la matriz de varianzas y ovarianzas involu radas ya no será una matriz de eros, lo ual se tradu irá en que los estimadores MCO ya no serán insesgados,pero si onsistentes (Demostrarlo).Note que lo anterior es válido para rezagos de la variable dependiente, pero nopara rezagos de variables expli ativas, en uanto estos últimos pueden ser aúninterpretados omo jos. El úni o problema que puede presentar el in luir estetipo de regresores es la alta orrela ión que existente entre el valor presente delregresor y de su o sus rezagos in luidos en el modelo. Ello da origen a problemasde multi olinealidad.

92

Page 94: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI3.4.1. Ejemplo y adverten ias sobre el uso de variable de-pendiente rezagada omo regresorTenemos la siguiente informa ión sobre Índi e de Pre ios al Consumidor (IPC)desde 1982 al 20034. A partir de esta informa ión podemos onstruir la ina ión( ambio por entual en el índi e de pre ios):πt =

IPCt − IPCt−1

IPCt−1

Veamos que resultados obtenemos al realizar la siguiente regresión:IPCt = β0 + β1IPCt−1 + ut

4Informa ión obtenida del Ban o Central de Chile: www.b entral. l93

Page 95: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAICuando el oe iente de la variable dependiente rezagada es muy er ano a 1, sedi e que la serie tiene raiz unitaria5. Sin embargo, este no es el aso. Si teori a-mente siempre se espera que la ina ión sea pequeña pero positiva, deberiamosesperar que el índi e de pre ios siempre fuera re iendo, y por lo tanto esta seriemás que tener una raiz unitaria tiene una tenden ia.

La persisten ia en el índi e de pre ios al onsumidor es asi obvia. Lo que nosinteresa es determinar si existe persisten ia en la ina ión, la que deberíamosesperar fuera estable en el tiempo y on valores relativamente bajos y positivos.Vemos que su ede al estimar el siguiente modelo:πt = β0 + β1πt−1 + ut

El oe iente β1 es signi ativo y del orden del 0.8 ¾Que signi a esto?.5Cuando una serie tiene raiz unitaria, esta no es esta ionaria, lo que signi a que no u túaen torno a su valor promedio. El test t de signi an ia del parámetro que a ompaña a la variabledependiente, no sirve para evaluar la hipótesis de raiz unitaria. Comente error tipo I94

Page 96: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI3.5. Sele ión de ModelosUna pregunta ru ial que se enfrenta en e onometría apli ada es omo es ogerentre diversas espe i a iones planteadas para responder una misma pregunta.No existe un respuesta úni a al problema anterior, sin embargo, algunas re o-menda iones son:Elegir el modelo más parsimonioso (lo más pequeño posible)Que posea un buen ajusteQue sea onsistente on los datos observadosSin embargo, el aso de tener que elegir entre modelos anidados, es posible utilizarlos llamados Criterios de Informa ión. Suponga que usted desea es oger entrealguno de los siguientes modelos:Y = β0 + β1x1 + β2x2 + β3x3 + u (1)

Y = α0 + α1x1 + α3x3 + v (2)

Y = φ0 + φ(x1 + x2) + ω (3)donde se di e que el modelo (1) en ompasa al (2) y al (3), ya que los dos segundosson el versiones restringidas del primero. Luego, se di e (2) y (3) son anidados en(1)La pregunta relevante es ¾Cuál de las tres espe i a iones anteriores es mejor?.Los riterios de informa ión nos ayudan a responder di ha pregunta. El primer riterio de informa ión es el Criterio de Akaike (ACI) y se dene omo:ACI = −2 lnL

n+

k

nmientras que el Criterio de S hwarz (BIC) se dene omo:BIC = −2 lnL

n+ k

ln(n)

nLuego, el riterio de sele ión entre modelos anidados orresponde a elegir elmodelo on menor riterio de informa ión. Note que para que los riterios sean omprables, deben poseer el mismo tamaño de muestra.95

Page 97: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI3.5.1. Ejemplo: Retornos a la edu a ión, diferen ias entrehombres y mujeresRe ordemos lo aprendido en la se ión 3.3 del urso. Veíamos que para estimar elretorno a la edu a ión, es de ir, uanto ingreso adi ional me genera un año másde edu a ión, podíamos onsiderar al menos tres espe i a iones:Modelo I : Wi = β0 + β1d2i + β2Ei + β3Ei · d2i + ui

Modelo II : Wi = β0 + β1d2i + β2Ei + ui

Modelo III : Wi = β0 + β2Ei + uidonde Wi era el logaritmo natural del salario del individuo i, d2i era una variabledummy que tomaba el valor 1 si la persona i era hombre y 0 sino, Ei eran losaños de edu a ión del individuo i y Ei · d2i era una variable intera tiva.Además tenemos que el Modelo II anida al modelo III, y el modelo I anida a losmodelos II y III. De esta forma, podemos utilizar los riterios de informa ión deAkaike y S hwarz para determinar on que espe i a ión nos quedamos.Estima ión del Modelo I:Wi = β0 + β1d2i + β2Ei + β3Ei · d2i + ui

96

Page 98: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIEstima ión del Modelo II:Wi = β0 + β1d2i + β2Ei + ui

Estima ión del Modelo III:Wi = β0 + β2Ei + ui

97

Page 99: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIEn resumen: Modelo Akaike S hwarzI 2.278 -680692.847II 2.279 -680676.053II 2.338 -676154.845Como debemos elegir el modelo que minimize el riterio de informa ión, de a uer-do a ambos riterios debemos elegir el Modelo I.

98

Page 100: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI3.6. Regresión Parti ionada3.7. Omisión de Variables Relevantes3.7.1. Impa to sobre el InsesgamientoConsidere el siguiente modelo pobla ional (expresado en desvíos on respe to ala media):Y = X1β1 +X2β2 + uSuponga ahora que el investigador se equivo a y estima el siguiente modelo:

Y = X1β1 + uEstimando el modelo in orre to obtenemos:β1 = (X ′

1X1)−1X ′

1Y

= β1 + (X ′1X1)

−1X ′1X2β2 + (X ′

1X1)−1X ′

1upor lo ual:E(β1) = β1 + (X ′

1X1)−1X ′

1X2β2

= β1 + Zβ2Ello impli a que por lo general, la omisión de variables relevantes (que pertene enal modelo pobla ional), ausará que los parámetros estimados sea sesgados. Ellono su ederá, sólo en el aso que Z=0 (es de ir que X1 y X2 sea ortogonales) o siβ2=0 (aunque di ho aso es ontradi torio, dado que impli aría que la variableno pertene e al modelo pobla ional).La dire ión del sesgo es difí il de obtener, sin embargo, el análisis se simpli- a si pensamos en β1 y β2 omo es alares. En di ho aso:

E(β1) = β1 +Cov(X1, X2)

V (X1)β2De lo anterior, se desprende que la dire ión del sesgo depende de omo ovarienlas variables in luidas on respe to a las ex luidas y del signo del parámetroomitido. 99

Page 101: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI3.7.2. Impa to sobre la VarianzaEstimando el modelo in orre to, el estimador de la varianza será:V (β1/X1) = σ2(X ′

1X1)−1mientras que si hubiéramos estimado el modelo orre to, se puede demostrar quela varianza del estimador insesgado de β1 (β∗

1) orrespondería a:V (β∗

1/X1, X2) = σ2(X ′1M2X1)

−1donde M2 = I −X2(X′2X2)

−1X ′2. Luego, omparamos las inversas de ambas ma-tri es:

(V (β1/X1))−1 − (V (β∗

1/X1, X2))−1 = σ−2(X ′

1X2(X′2X2)

−1X ′2X1)tal que se puede demostrar que di ha matriz es denida positiva.Por lo tanto, el omitir variables relevantes impli a que los parámetros estimadosserán sesgados y que sus varianzas serán menores. Más aún, también es posibledemostrar que el estimador de la varianza de los errores (σ2) es sesgado ha iaarriba (la varianza pobla ional es menor).3.7.3. EjemploSuponga que un investigador quiere estimar el retorno a la edu a ión y que elmodelo verdadero(obviamente es un aso ilustrativo) está dado por:

Wi = β1Ei + β2EXPi + ui (1)Donde Wi orresponde al logaritmo del salario del individuo i, Ei orresponde alos años de edu a ión del individuo i, EXPi orresponde a los años de experien ialaboral del individuo i6 y ui orresponde a un término de error bien omportado.Sin embargo este investigador utiliza el siguiente modelo para su estima ión.Wi = β1Ei + ui (1)Los resultados del modelo verdadero son6La ual esta denida omo EXPi = Edadi − Ei − 6.100

Page 102: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI

Los resultados el modelo estimado son

Podemos ver el parámetro que a ompaña a la variable años de edu a ión es menoren el modelo estimado que en el modelo verdadero. Esta dire ión del sesgo sepuede expli ar por el signo del parámetro que a ompaña a la variable experien iaen el modelo verdadero y a la rela ión existente entre edu a ión y experien ia enel mer ado laboral.3.8. In lusión de Variable Irrelevantes3.8.1. Impa to sobre InsesgamientoConsidere ahora el siguiente modelo pobla ional:Y = X1β1 + uSuponga ahora que el investigador se equivo a y estima el siguiente modelo:

Y = X1β1 +X2β2 + u101

Page 103: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIEstimando el modelo in orre to obtenemos:β1 = (X ′

1M2X1)−1X ′

1M2Y

= β1 + (X ′1M2X1)

−1X ′1M2udonde M2 se dene igual que el la se ión anterior. Enton es:

E(β1) = β1y on el mismo razonamiento, se puede demostrar que:E(σ2) = E

(u′u

T − k1 − k2

)

= σ2es de ir, la in lusión de variable irrelevantes no ausa sesgo en los parámetrosestimados, ni en la varianza de los errores estimados. Bajo di hos resultados,pare iera que es mejor poner mu hos regresores en nuestro modelo. Sin embargo,nos falta estudiar que su ede on la varianza de los parámetros estimados.3.8.2. Impa to sobre VarianzaRe ordemos que:β1 = β1 + (X ′

1M2X1)−1X ′

1M2u on lo ual, la varianza estimada:V (β1/X1, X2) = σ2(X ′

1M2X1)−1mientras que la varianza verdadera:

V (β1

∗/X1) = σ2(X ′

1X1)−1enton es, omo probamos on anterioridad, la varianza verdadera es menor quela varianza estimada. Ello impli a que el in luir regresores adi ionales, aumentala varianza de nuestros parámetros estimados, lo ual se tradu e en parámetrosmenos e ientes.

102

Page 104: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI3.8.3. EjemploSuponga que un investigador quiere estimar el retorno a la edu a ión y que elmodelo verdadero(obviamente es un aso ilustrativo) está dado por:Wi = β1 + β2Ei + ui (1)Donde Wi orresponde al logaritmo del salario del individuo i, Ei orresponde alos años de edu a ión del individuo i y ui orresponde a u término de error bien omportado.Sin embargo este investigador utiliza el siguiente modelo para su estima ión.

Wi = β1 + β2Ei + β3Di + ui (1)Donde Di orresponde a una variable di otómi a que toma el valor 1 si el indivi-duo fuma y 0 si no fuma.Los resultados del modelo verdadero son

Los resultados el modelo estimado son:

103

Page 105: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIPodemos ver no existe una varia ión importante en los parámetros del modeloestimado y el modelo verdadero. Sin embargo, tal omo habíamos demostrado, lavarianza de los parámetros aumenta disminuyendo enton es la e ien ia.

104

Page 106: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI3.9. Perturba iones no Esféri asUn supuesto importante en el modelo lási o de regresión lineal (Supuesto 4) esque los errores ui son homo edásti os, es de ir la varianza es onstante para todovalor de Xi:V ar(ui) = V ar(uj) para i 6= j

Figura 8: Homocedasticidad

Cuando el supuesto 4 no se umple los errores son Hetero edasti os:

Figura 9: Heterocedasticidad

Además se suponía que los términos de error no estaban orrela ionados entre si(Supuesto 5):Cov(uiuj) = 0 para i 6= j105

Page 107: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIEs de ir, teníamos que E[uu′]=σ2In, ahora si el término de error no umple onlos supuestos del modelo de regresión lineal tenemos que E[uu′]=σ2Ω. Donde Ωes una matriz denida positiva.3.9.1. Conse uen ias de estima ión por MCORe ordemos que el estimador MCO es:β = (X ′X)−1X ′Y

= β + (X ′X)−1X ′uComo el supuesto de que E[u|X ] = 0 se mantiene, tenemos que la E[β|X ] = β ypor lo tanto, E[β − β]=0. De esta forma, el estimador MCO on perturba ionesno esféri as sigue siendo insesgado y onsistente. Pero no será e iente, dadoE[uu′]=σ2Ω enton es la varianza de β es:

V ar(β) = E

[(β − β

)(β − β

)′]

= E[(X ′X)−1X ′uu′X(X ′X)−1

]

= σ2(X ′X)−1(X ′ΩX)(X ′X)−1De esta forma, solo si Ω = In la matriz de ovarianzas de β será igual a σ2(X ′X)−1,por lo tanto el estimador MCO en presen ia de perturba iones no esféri as notendrá varianza mínima, es de ir, no será e iente. Enton es ualquier inferen iabasada en σ2(X ′X)−1 llevará a on lusiones erróneas.3.9.2. Estima ión E iente: Mínimos Cuadrados Generali-zadosLa estima ión e iente de β en el modelo generalizado, donde los errores puedenno ser esféri os, requiere el ono imiento de Ω. Para omenzar supondremos queΩ es una matriz ono ida, simétri a y denida positiva.Bajo estas ondi iones el Método de Mínimos Cuadrados Generalizados nospermite estimar de manera e iente los parámetros.Dado que Ω es una matriz simétri a denida positiva, puede ser des ompues-106

Page 108: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIta de la siguiente manera:7Ω = CΛC ′donde las olumnas de C son los ve tores propios de Ω y los valores propios (λj)de Ω se en uentran en la diagonal de Λ. Enton es sea Λ1/2, la matriz diagonal on el j-ésimo elemento igual a √λj y sea T = CΛ1/2. De esta forma, Ω = TT ′.Además sea P ′ = CΛ−1/2 y por lo tanto, Ω−1 = P ′P . 8Si pre multipli amos Y = Xβ + u por P obtenemos:

PY = PXβ + Pu o

Y∗ = X∗β + u∗ (3.6)Notemos que (3.6) es un modelo transformado de forma tal que:V ar(u∗) = E[u∗u

′∗]

= σ2PΩP ′

= σ2In (3.7)Por lo tanto, el modelo transformado umple on los supuestos del modelo lási ode regresión, y se puede utilizar MCO para estimar el parámetro β:βMCG = (X ′

∗X∗)−1X ′

∗Y

= (X ′P ′PX)−1X ′P ′PY

= (X ′Ω−1X)−1X ′Ω−1YComo el estimador MCG de β es idénti o al estimador MCO apli ado al modelotransformado (3.6) y que umple on los supuestos, βMCG es MELI.3.9.3. Test de HipótesisNuevamente omo el estimador MCG es igual al estimador MCO sólo que se apli aal modelo transformado, todos los pro esos para testear hipótesis y onstruirintervalos de onanza se mantienen.Por ejemplo si queremos testear q hipótesis lineales H0 : Q′β = c, se tiene el7Esto se ono e omo Des omposi ión Espe tral de una matriz.8Esto viene de la ortogonalidad de C, lo que impli a que I = C′C = CC′ y enton esC′ = C−1. 107

Page 109: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIsiguiente estadísti o F:(Q′βMCG − c

)′[Q′σ2

MCG(X′∗X∗)

−1Q]−1(Q′βMCG − c

)

q∼ Fq,n−k

1

(Q′βMCG − c

)′[Q′(X ′

∗X∗)−1Q]

−1(Q′βMCG − c

)

σ2MCG

∼ Fq,n−kdonde σ2MCG es el estimador insesgado de σ2 en presen ia de perturba iones noesféri as:

σ2MCG =

u′∗u∗

n− k=

(Y −XβMCG

)′Ω−1

(Y −XβMCG

)

n− k3.9.4. Estima ión uando Ω es des ono ida:Mínimos Cuadrados Fa tiblesAnteriormente asumimos que Ω era ono ida, en este aso una simple transfor-ma ión del modelo de regresión lineal lleva a una matriz de ovarianza esféri a.En la prá ti a, Ω es des ono ida y es ne esario estimar los parámetros al interiorde esta matriz.Enton es lo que debemos ha er es sustituir Ω por un estimador de ella Ω. Es-to se denomina estimador Mínimos Cuadrados Fa tibles (MCF), donde elestimador de β se dene de la siguiente forma:βMCF =

(X ′Ω−1X

)−1

X ′Ω−1yEl problema es que tenemos más in ógnitas (n(n+1)/2) en Ω que observa iones,para n>1. En la prá ti a para lograr la estima ión de Ω debemos asumir que esfun ión de un número jo y redu ido de parámetros θ. El problema se redu e aen ontrar θ y usarlo para omputar Ω = Ω(θ).108

Page 110: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI3.9.5. Hetero edasti idadLa Hetero edasti idad surge uando a pesar de que Cov(uiuj)=0 para i6= j, lasvarianzas de ada observa ión son diferentes, es de ir, V ar(uj) = σ2j para j=1,...,n.La matriz de ovarianzas en este aso es:

E[uu′] = σ2Ω =

σ21 · · · 0... . . . ...0 · · · σ2

n

= σ2

ω1 · · · 0... . . . ...0 · · · ωn

01

00

00

00

20

00

00

03

00

00

00

40

00

00

0sa

lario

8 10 12 14 16 18

xx

x xx x x

xx

x

Figura 2: Distribución de los salarios para distintos niveles de educación.

Recta de regesiónpoblacional (RRP)

Escolaridad

La hetero edasti idad es un problema bastante re urrente, espe ialmente al tra-bajar on datos de orte transversal. Algunas razones por las que ui puede variarson las siguientes:En los modelos de aprendizaje sobre errores, a medida que la gente aprende,sus errores de omportamiento son menores, así en este aso a medida queaumentan las horas de prá ti a de una ierta a tividad, la varianza de loserrores se redu e.A medida que aumentan los ingresos, la gente tiene más posibilidades dedisponer de parte de ese ingreso de la forma que desee. Así en una regresiónde ahorro ontra ingreso, es posible que σ2i aumente en la medida que elingreso aumenta.La Hetero edasti idad también puede surgir por la presen ia de fa toresatípi os, que es muy diferente a las restantes observa iones.109

Page 111: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIAl omitir variables relevantes, a parte del sesgo que se produ e en las estima- iones por esto, se produ e Hetero edasti idad ya que este variable estaráen el término de error y por lo tanto la varianza dependerá de ella.Otra fuente de Hetero edasti idad es la asimetría en la distribu ión de unao más variables expli ativas in luidas en el modelo, por ejemplo: ingreso,riqueza y edu a ión.

110

Page 112: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIComo men ionamos anteriormente en presen ia de Hetero edasti idad el es-timador MCO seguirá siendo insesgado, pero no tendrá varianza mínima. El es-timador que si umple on la propiedad de MELI es el de MCG. Este últimoestimador requiere ono imiento de la matriz Ω. Sin embargo, White (1980) hapropuesto una aproxima ión a la matriz de ovarianzas del estimador MCO:V ar(β|X) = (X ′X)−1(X ′σ2ΩX)(X ′X)−1que no requiere una representa ión espe i a de la forma fun ional que adopta lahetero edasti idad, por lo que no tendremos riesgo de asumir una forma fun ionalin orre ta.La sugeren ia de White es que la varianza del estimador βMCO se exprese dela siguiente forma:

V ar(β|X) = n(X ′X)−1

(1

nσ2X ′ΩX

)(X ′X)−1se dene:

Σ = n−1σ2X ′ΩX

= n−1

n∑

i=1

σ2i xix

′ila que se estima de la siguiente forma:

Σ = n−1

n∑

i=1

ui2xix

′iWhite demuestra bajo ondi iones generales que:

Σ = n−1n∑

i=1

ui2xix

′i

p→ ΣDe esta forma, una estima ión onsistente de la matriz de ovarianzas es:V ar(β|X) = n(X ′X)−1Σ(X ′X)−1 (3.8)su ompara ión on σ2(X ′X)−1 puede dar no ión del grado de hetero edasti idad.La estima ión de White de una matriz onsistente on Hetero edasti idad esun resultado muy útil, ya que no se ne esita saber la naturaleza de la Hetero- edasti idad. Ante la duda de presen ia de este problema es mejor o upar esteestimador ya que no produ e altera iones, y nos permite ha er inferen ia orre ta on o sin la presen ia de Hetero edasti idad.111

Page 113: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIContrastes de Hetero edasti idad:1. El ontraste de White: La hipótesis nula es de Homo edasti idad (aligual que en todos los ontrastes que estudiaremos). Esto es, H0: σ2i = σ2

∀ i, bajo la hipótesis nula el estimador de la matriz de ovarianzas de β esV ar(β|X) = σ2(X ′X)−1, pero bajo la hipótesis alternativa es (3.8). Basa-do en la observa ión de esto, White propone un test que puede obtenerseal al ular nR2 de una regresión de u2

i ontra todos los produ tos posiblesentre las variables expli ativas. Demuestra que nR2 ∼ χ2J−1, donde J es elnúmero de regresores de esta e ua ión.Consideremos el siguiente modelo:

yi = β0 + β1xi + β2zi + uiLos pasos para realizar el test de White son:a) Obtener β y los residuos de la estima ión del modelo anterior por MCOuini=1b) Correr una regresión de u2

i sobre una onstante, xi, zi, x2i , z2i y xizi. ) Computar nR2 de la regresión anteriord) Para el nivel de signi an ia es ogido, omparar nR2 on el valor rí-ti o de una distribu ión hi uadrado on 5 grados de libertad. Si nR2ex ede el valor ríti o se re haza la hipótesis nula de Homo edasti i-dad.2. El ontraste de Goldfeld y Quandt: este ontraste parte del supuesto deque la magnitud de σ2

i depende de ierta variable zi, la que generalmentees una variable expli ativa pero no es ne esario. Supongamos que di harela ión es positiva, es de ir, para valores más altos de zi mayor es σ2i . Lasobserva iones se dividen en dos grupos, bajo la hipótesis nula ambos grupostienen la misma varianza, pero bajo la alternativa las varianzas dierensigni ativamente. Enton es el ontraste onsiste en:a) Ordenar las observa iones por los valores de la variable zi, de menor amayor.b) Omitir p observa iones en la mitad de la muestra, se sugiere no eliminarmás de la ter era parte de las observa iones. ) Estimar dos ve es el modelo original, una on las n−p

2primeras ob-serva iones muestrales y otra on las n−p

2últimas observa iones en lamuestra. Notar que p debe ser lo su ientemente pequeño de maneraque T−p

2sea mayor al número de parámetros.112

Page 114: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAId) Se al ula es estadísti o:u′2u2

u′1u1

∼ Fm,m con m =n− p

2− kSi se sospe ha que la varianza del error depende inversamente de zi, enton eslas observa iones se deben ordenar de mayor a menor.Si se llega a la on lusión de que el término de error del modelo no presentahetero edasti idad, podría deberse a que hemos omenzado on una malaespe i a ión del parámetro σ2

i , que quizás depende de un variable diferentea la que hemos supuesto. Por esta razón el ontraste debería realizarse variasve es on distintas variables de las que tengamos sospe has pueda dependerla varianza del término de error.3. El ontraste de Breus h y Pagan: supongamos que la varianza deltérmino de error de ada observa ión depende de un ve tor de variables zide dimensión p, es de ir:σ2i = h(z′iα) = h(α0 + α1z1i + α2z2i + ... + αpzpi)Notemos que si todos los oe ientes α's ex epto el orrespondiente a α0fuesen ero, tendríamos una situa ión de Homo edasti idad. Por lo tanto,si puedieramos estimar los oe ientes α0, α1,...,αp un ontraste para lahipótesis nula de Homo edasti idad es:

H0 : α1 = α2 = ... = αp = 0Los pasos para realizar este ontraste son:a) Se estima por MCO el modelo original y se obtienen los residuos o-rrespondientes.b) Se obtiene la serie de residuos normalizados al uadrado:e2i =

u2i

σ2u

i = 1, ..., n donde σ2u =

∑ni=1 u

2i

n ) Se estima una regresión de e2i sobre una onstante y las variables z1i,z2i,...,zpi y se obtiene la suma expli ada (SE) de di ha regresión.9d) Bajo la hipótesis nula de Homo edasti idad y dado el supuesto denormalidad del término de error, la razón SE

2se distribuye χ2

p.9Re ordemos que la suma expli ada de una regresión es igual a∑n

i=1(yi − y)2, uando yi esla variable dependiente. 113

Page 115: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI4. El ontraste de Glesjer: este ontraste es más ambi ioso que el anterior,ya que trata de estimar la verdadera estru tura de Hetero edasti idad, nolimitándose a una estru tura lineal. Sin embargo, una limita ión del on-traste de Glesjer es que sólo resulta útil uando se ree que di ha estru turapuede expli arse solo on una variable. Este ontraste se ha e en tres etapas:a) Estimar el modelo por MCO y obtener los residuos orrespondientes.b) Estimar una regresión del valor absoluto de ui, o su uadrado u2, sobreuna poten ia de la variable zi, es de ir:|ui| = δ0 + δ1z

hi + νipara distintos valores del exponente h: h =

−1, 1, 1

2,−1

2

. Es oger elvalor de h que propor ione una mejor regresión ( oe iente δ1 signi- ativo y una suma residual pequeña). ) Una vez sele ionado h, se divide el ve tor de dimensión (k+1) formadopor las observa iones (yi,xi) de ada periodo por δ0+δ1zhi si se estimo laregresión de |ui| y por√δ0 + δ1zhi si se estimo u2

i , y se estima el modelode nuevo por MCO, pero ahora on las variables transformadas.Ejemplo: Produ ión y Empleo por omunidades autónomas de EspañaComo ejemplo, estimemos la rela ión que existe entre empleo y Pib en las omu-nidades autónomas españolas. Se dispone datos del PIB en miles de millones depesetas, y de o upados, en miles de personas para 1989, los que se muestran enla siguiente tabla:

114

Page 116: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI

Estimador de ladesviación estandar

del error

σ2

u

~

=SEC/(n-k)

= 4307097.27/16

= 269193.56

σu

~= 518.84

115

Page 117: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIEl estimador del parámetro aso iado al empleo resulta ser signi ativo, por ada1,000 empleador el PIB aumenta en 3,760 millones de pesetas. Sin embargo, laestima ión de la onstante es bastante impre isa, y por ello resulta ser no sig-ni ativa. Existe la posibilidad de que la varianza del omponente del PIB noexpli ado por el empleo aumente on este, es de ir, tengamos un problema dehetero edasti idad, donde σi depende de empleoi, y de esta forma, σ2i dependede empleo2i . Con esta sospe ha, es ne esario testear Hetero edasti idad.1. Test Breus h-Pagan: para realizar este test, primero de la estima ión MCOdel modelo de interés se obtienen los residuos, luego se omputan los residuosnormalizados (dividir ada residuo al uadrado por el estimador de la varianzadel error). Se estima una regresión entre los residuos generalizados y el empleo al uadrado.

SE

Una vez realizada la estima ión se onstruye el estadísti o SE2

= 7,64, que resultaser mayor al valor de tabla de una χ21 al 95% de onanza (3.84), de esta formase re haza la hipótesis nula de homo edasti idad.2. Test Goldfeld y Quandt: es de esperar que la varianza dependa positiva-mente del nivel de empleo, de esta forma, ordenamos las observa iones de menora mayor nivel de empleo y omitimos las 6 observa iones que o upan los luga-res entrales. Luego estimamos dos modelos ada uno on 6 observa iones, y se omputa el estadísti o λ igual a la división de la suma residual:116

Page 118: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI

λ = 93.2

Este estadísti o λ debe ser omparado on el valor de tabla de una distribu iónFm,m al 95% de onanza, que es igual a 6.39. De esta forma, nuevamente sere haza la hipótesis nula de Homo edasti idad.

117

Page 119: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI3.9.6. Auto orrela iónAl omienzo de esta se ión examinamos el aso general uando la matriz devarianzas y ovarianzas del error dejaba de umplir los supuestos 4 y 5, en es-te aso la matriz ya no era σ2In, sino que era igual a σ2Ω. La forma que tomeesta matriz Ω dependerá de ual de los dos supuestos se estaba rompiendo. Enla se ión 3.8.5, vimos que forma toma la matriz Ω si se rompe el supuesto 4de Homo edasti idad en el término de error, en este aso la matriz de varianzasy ovarianzas del error es no es alar (o no esféri a) porque los elementos de ladiagonal eran distintos para ada observa ión i.Por otra parte, la auto orrela ión es un problema que surge uando rompemos elsupuesto 5 de no auto orrela ión en los errores. Ello impli a que:Cov(uiuj) 6= 0 para i 6= jLa auto orrela ión en el término de error se da en los datos se serie de tiempo,donde es un problema bastante omún.Luego, nuestra matriz de varianzas y ovarianzas del error ya no será una matrizdiagonal ( omo en el aso de varianzas esféri as y no esféri a pero sólo on he-tero edasti idad) ya que el término de error se en uentra orrela ionado onsigomismo a través del tiempo. La forma que toma la matriz uando sólo tenemosauto orrela ión pero los errores son homo edásti os:

E[uu′] = σ2Ω =

σ2 σ1,2 σ1,3 · · · σ1,T

σ2,1 σ2 σ2,3 · · · σ2,T

σ3,1 σ3,2 σ2 · · · σ3,T... ... ... . . . ...σT,1 σT,2 σT,3 · · · σ2

donde σt,q = cov(utuq).Nuestro modelo ahora será:

yt = Xtβ + ut t = 1, 2, ..., T. (3.9)ut = ρut−1 + εtdonde, omo vimos en la se ión 3.4, el error sigue un pro eso AR(1).

118

Page 120: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIMatriz de Varianzas y Covarianzas uando ut es un AR(1):En este aso el término de error tiene la forma señalada en (3.9):ut = ρut−1 + εt1. V (ut) = V (ρut−1 + εt)=ρ2V (ut−1) + σ2

ε , de esta forma V (ut) =σ2ε

1−ρ22. Como E(ut) = 0, Cov(utut−1) = E(ut · ut−1). Cal ulemos esta última espe-ranza:ut · ut−1 = ut−1 · (ρut−1 + εt)

= ρu2t−1 + ut−1εt /E(·)

E(ut · ut−1) = ρE(u2t−1)︸ ︷︷ ︸

σ2

+E(ut−1εt)︸ ︷︷ ︸0

E(ut · ut−1) = ρσ23. Siguiendo la misma lógi a anterior, E(ut, ut−2) se al ula de la siguienteforma:ut · ut−2 = ut−2 · (ρut−1 + εt)

= ρut−1ut−2 + ut−2εt /E(·)E(ut · ut−2) = ρE(ut−1ut−2)︸ ︷︷ ︸

ρσ2

+E(ut−2εt)︸ ︷︷ ︸0

E(ut · ut−2) = ρ2σ24. Así se puede derivar la siguiente expresión genéri a:E(ut · ut−(T−1)) = ρT−1σ2

119

Page 121: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIEnton es:E[uu′] = σ2Ω =

σ2 σ1,2 σ1,3 · · · σ1,T

σ2,1 σ2 σ2,3 · · · σ2,T

σ3,1 σ3,2 σ2 · · · σ3,T... ... ... . . . ...σT,1 σT,2 σT,3 · · · σ2

=

σ2 ρ · σ2 ρ2 · σ2 · · · ρT−1 · σ2

ρ · σ2 σ2 ρ · σ2 · · · ρT−2 · σ2

ρ2 · σ2 ρ · σ2 σ2 · · · ρT−3 · σ2... ... ... . . . ...ρT−1 · σ2 ρT−2 · σ2 ρT−3 · σ2 · · · σ2

= σ2

1 ρ ρ2 · · · ρT−1

ρ 1 ρ · · · ρT−2

ρ2 ρ 1 · · · ρT−3... ... ... . . . ...ρT−1 ρT−2 ρT−3 · · · 1

Naturaleza y ausas de la auto orrela iónExiste auto orrela ión uando el término de error de un modelo e onométri o está orrela ionado onsigo mismo a través del tiempo. Por supuesto, no es ne esarioque ut este orrela ionado onsigo mismo sólo un periodo atrás, esta orrela iónpuede ser de ualquier orden, es de ir, ut puede ser un AR(1), AR(2),...,AR(q),et . Así, dependiendo de ual sea el orden de la auto orrela ión en el término deerror, la matriz de varianzas y ovarianzas ira tomando distintas formas.La auto orrela ión en el término de error puede ser produ ida por varias au-sas: Existen ia de i los y tenden ias: Si la auto orrela ión es positiva (es de ir,en (3.9) el oe iente ρ es positivo), un valor alto de ut que genera un valorde yt por sobre su media ondi ional, tendrá una probabilidad elevada de irseguido por un valor alto de ut+1, y por ello, de un valor de yt+1 por en imadel promedio; lo mismo o urría para yt debajo del promedio.Sin embargo, si existe auto orrela ión negativa, valores de yt por sobre suvalor promedio ondi ional irán seguidos, on alta probabilidad, de valoresde yt+1 por debajo de su promedio. Por lo tanto, la auto orrela ión positivaesta aso iada a la existen ia de ra has de valores altos y bajos de yt.120

Page 122: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI

Autocorrelación Positiva Autocorrelación NegativaEnton es, si debido a la iner ia presente en la mayoría de las variablesma roe onómi as la variable endógena presenta i los, y estos no son bienexpli ados por la variables exógenas del modelo, el término de error tendráauto orrela ión.Por otra parte, también es ierto que la mayoría de las variables e onómi as(y espe ialmente las variables medidas en términos nominales) tienen unatenden ia, generalmente re iente. Si el onjunto de variables expli ativasdel modelo no expli an ade uadamente di ho omportamiento, enton es eltérmino de error in orporará di ha tenden ia, lo que ondu e a existen ia deauto orrela ión positiva:una primera ra ha de residuos negativos seguidospor otra ra ha de residuos positivos.X

XXXX

XX

XXX

X

XX X

XX

X

XX

X

X

X

Modeloverdadero

Modeloestimado

Autocorrelación producida por una tendenciaVariables omitidas: Omisión tanto de variables relevantes, de no lineali-dades y de rela iones dinámi as (rezagos de la variable dependiente) serán121

Page 123: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIin orporadas al término de error, ausando posible auto orrela ión (ademásde las di ulatdes que usted ya omo e de las se iones 3.4 y 3.6).Corolario: Si usted en uentra auto orrela ión en sus residuos, enton esrevise su modelo, ya que el error está aptando informa ión relevante queusted está omitiendo.Todo lo di ho en las se iones 3.8.1 hasta 3.8.4 apli an en este ontexto (re uerdeque la matriz Ω se planteó en términos generales). De esta forma, MCO siguesiendo insesgado, pero pierde e ien ia, por lo ual ya no es MELI. El estimadorde mínima varianza en este ontexto es MCG, y en aso de des ono erse la formade la auto orrela ión se debe utilizar MCF.Sin embargo y siguiendo el espíritu de la orre ión de White, Newey y West(1987) propusieron una orre ión para la matriz de varianzas y ovarianzas deMCO. Re ordemos que en este ontexto se umple que:V ar(βMCO/X) = σ2(X ′X)−1X ′ΩX(X ′X)−1mientras que el estimador de Newey-West orresponde a:V ar(βMCO/X) = n(X ′X)−1S(X ′X)−1 (3.10)donde el estimador onsistente de S es:

S =1

n

n∑

t=1

n∑

s=1|t−s|<L

w(t− s)utusxtx′s (3.11)donde L orresponde al orden máximo de auto orrela ión del término de error(que no siempre es fá il de determinar).

122

Page 124: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIContrastes de Auto orrela ión1. Test de Durbin-Watson (d): Lejos el test más utilizado para dete tarauto orrela ión de los residuos es el test propuesto en 1951 por Durbiny G.S Watson. El test está diseñado para dete tar auto orrela ión en losresiduos de la forma ut = ρut−1+εt (AR(1)), donde ε es ruido blan o (media ero y varianza onstante). La nula orresponde a no auto orrela ión de losresiduos (H0 : ρ = 0 H1 : ρ 6= 0)y el test se dene omo:d =

∑nt=2(ut − ut−1)

2

∑nt=1 u

2t

(3.12)Si ρ > 0, los valores de u probablemente serán muy er anos, por lo ual elnumerador será muy pequeño en ompara ión al residuo mismo. Ello im-pli a que d será pequeño. Si ρ < 0, enton es el numerador probablementeserá grande, más grande que el residuos n si mismo. Ello impli a que d serágrande10.Se puede demostrar que para muestra grandes d onverge a:d ≃ 2(1− ρ) (3.13) on:

ρ =

∑nt=2 utut−1∑n

t=1 u2tdonde ρ puede ser obtenido de la siguiente regresión:

ut = ρut−1 + ut (3.14)Respe to a los valores ríti os del test, la distribu ión en muestras nitasdepende del supuesto de normalidad de los errores y de la matriz X, porlo ual Durbin y Watson derivaron las tablas de valores de ríti os parafa ilitar la apli a ión del test. Sin embargo, di hos valores poseen rangosindeterminados, en los uales no podemos tomar una de isión respe to a lanula. El test distribuye on dos olas y se presenta en la siguiente gura:10Por lo tanto, auto orrela ión positiva tenderá a arrojar un pequeño d, mientras que auto- orrela ión negativa tenderá a arrojar un d grande123

Page 125: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI

Por ejemplo, el test re haza la nula de no auto orrela ión en favor de laalternativa de orrela ión positiva si DW < dl y lo re haza ante la alterna-tiva de orrela ión negativa de los errores si DW > 4−dl. El test posee doszonas grises que se presentan en los intervalos (dl,du) y (4-du, 4-dl), en las uales no podemos de ir nada respe to de la nula. Finalmente, si DW aedentro del intervalo (du, 4-du) no se re haza la nula de no auto orrela ión.Sin embargo, las tablas de valores ríti os son raramente utilizadas. Loanterior debido a que si no existe auto orrela ión, por la e ua ión (3.13)sabemos que el valor de d será er ano a dos, mientras que si hay eviden iade auto orrela ión positiva d será muy pequeño y si existe eviden ia deauto orrela ión negativa,d será grande.El test posee dos grandes omisiones. Primero, sólo sirve para dete tar au-to orrela ión de orden 1 en los errores y segundo, no puede ser apli ado sise in luyen regresores de la variable dependiente en el modelo (porque se onstruye bajo el supuesto de regresores determinísti os). Además, se debetener presente que el test está onstruido bajo normalidad de los errores yque existen las zonas grises o indeterminadas de las que hablábamos onanterioridad.2. Test de h-Durbin (h) Una varia ión del test DW puede ser apli ada uando existen variables rezagadas de la variable dependiente en nuestro124

Page 126: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAImodelo. Esta varia ión se ono e omo test de h-Durbin. El estadígrafo es:h =

(1− DW

2

)√n

1− nσ2α

∼a N(0, 1) (3.15)donde σ2α a la varianza del parámetro aso iado al primer rezago de la va-riable dependiente in luido en el modelo. Algunas notas respe to al test.Primero, no importa uantos rezagos de Y se hallan in luido en el modelo:sólo nos interesa la varianza del primero de ellos. Segundo, el test no esapli able uando nσ2

α > 1 y ter ero, las propiedades del test sólo son ono- idas asintóti amente, por lo ual debe ser implementado on uidado enmuestras pequeñas.3. Test de Breus h y Godfrey Este test es una alternativa para testear au-to orrela iones de ordenes superiores a 1 y se basa en el test LM introdu idoen la se ión 2.12.3. La nula, al igual que en todos los test de auto orre-la ión es que los residuos no se en uentran orrela ionados. Consideremospara distintos valores de k, el siguiente onjunto de estadísti os:rk =

∑nt=1 utut−k∑n

t=1 u2t

(3.16)note que si k=1, enton es estamos en una aso pare ido al estadísti o DW.Los pasos para realizar el test son:a) Estimar el modelo por MCO y obtener los residuos u. El modelo puedein luir rezagos de la variable dependiente.b) Estimar una regresión auxiliar de ut sobre p rezagos: ut−1, . . . , ut−p,in luyendo las variables exógenas (X) del modelo original. Note quedeberá ex luir p observa iones. ) Cal ular el R2 de la regresión auxiliard) Construir el estadígrafo nR2 ∼ χ2pLa lógi a del test se basa en que si no existe auto orrela ión, enton es losresiduos MCO no deberían ser expli ados por sus retardos, por lo ual el

R2 de la regresión auxiliar debería ser er ano a ero, lo ual nos llevaría aun bajo valor del estadígrafo y a un no re hazo de la nula.4. Test de Box-Pier e-Ljung (Q-Stat) Este test se basa en el uadradode las primeras p auto orrela iones de los residuos MCO. El estadígrafo sedene omo:Q = n

p∑

j=1

r2j (3.17)125

Page 127: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIdonde:rj =

∑nt=j+1 utut−j∑

t=1 u2tLa distribu ión del estadígrafo bajo la nula de no auto orrela ión es χ2 ongrados de libertad igual a p menos el número de rezagos del error in luidosen la espe i a ión autorregresiva del error. De ello se dedu e que el testpermite dete tar auto orrela ión de ordenes superiores a 1.Estima ión de Modelos on Auto orrela iónComo vimos anteriormente la matriz Ω en presen ia de auto orrela ión es:

Ω =

1 ρ ρ2 · · · ρT−1

ρ 1 ρ · · · ρT−2

ρ2 ρ 1 · · · ρT−3... ... ... . . . ...ρT−1 ρT−2 ρT−3 · · · 1

Se puede demostrar que la matriz P en este aso es:

P =

√1− ρ2 0 0 · · · 0−ρ 1 0 · · · 00 −ρ 1 · · · 0... ... ... . . . ...0 0 · · · −ρ 1

Enton es utilizando esta matriz P podemos transformar el modelo y apli ar Míni-mos Cuadrados Generalizados. Al premultipli arX e Y por la matriz P tendremosque la primera observa ión se transforma de la siguiente forma:

√1− ρ2y1 = (

√1− ρ2)x′

1β + (√

1− ρ2)u1 (3.18)Y para el resto de las (T − 1) observa iones la transforma ión es la siguiente:yt − ρyt−1 = (xt − ρxt−1)

′β + ut − ρut−1︸ ︷︷ ︸εt

(3.19)El que la primera observa ión de la muestra tenga un trato espe ial, es porquepara ella no existe una observa ión anterior, y por lo tanto, es imposible apli arla transforma ión en (3.19). 126

Page 128: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI1. Estima ión MCF: El Método de Co hrane Or uttLa matriz P que transforma nuestro modelo en un libre de auto orrela- ión en el error, es tal que ada observa ión de las variables dependientes,expli ativas y término de error, se debe transformar de a uerdo a (3.19). Sies que nuestro modelo es el siguiente:yt = xtβ + ut

ut = ρut−1 + εtEl modelo transformado es de la siguiente forma:yt − ρyt−1︸ ︷︷ ︸

y∗t

= (xt − ρxt−1)︸ ︷︷ ︸x∗

t

β + ut − ρut−1︸ ︷︷ ︸εt

⇒ y∗t = x∗tβ + εtEl Método de Co hrane-Or utt es un pro edimiento iterativo para obtenerla estima ión de β y ρ:a) Estimar por Mínimos Cuadrados Ordinarios la regresión de interés,ignorando la presen ia ( ono ida) de auto orrela ión de primer ordenen el término de error.b) Utilizar los residuos MCO para estimar el parámetro ρ. Esto puedeha erse mediante una regresión de ut ontra ut−1, o a partir del esta-dísti o DW de la estima ión anterior. ) Utilizar este parámetro ρ para transformar las variables, y obtener y∗ty x∗

t .d) Estimar por MCO un modelo on las variables transformadas, paraobtener un nuevo ve tor de oe ientes β.e) Utilizar esta nueva estima ión para omputar otro ve tor de residuos,y utilizar estos residuos para obtener una nuevaestima ión de ρf ) Repetir este pro edimiento hasta que los β onvergan11.Este Método puede ser fá ilmente generalizado on auto orrela ión de ordensuperior.2. Estima ión por Máxima Verosimilitud11Esto su ede uando la diferen ia entre el ve tor de parámetros β diere innitesimalmentedel β obtenido en la vuelta anterior. 127

Page 129: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAISupongamos que se pretende estimar el modelo de regresión on auto orre-la ión de primer orden. Además debemos asumir alguna distribu ión paraεt (re uerde que este es un requisito para poder estimar por máxima ve-rosimilitud). Supongamos que εt se distribuye N(0, σ2

ε). Así, la fun ión deverosimilitud es:L =

(1

σε

√2π

)T

· exp([

−∑Tt=1 ε

2t

2σ2ε

]) (3.20)Re ordemos que P es la matriz que transforma ut en εt, es de ir, εt =Put. La fun ión de verosimilitud en (3.20) se puede expresar en fun ión deltérmino de error ut (AR(1)) omo12:L =

(1

σε

√2π

)T

·√

1− ρ2 · exp([

−(1 − ρ2)u21 −

∑Tt=2(ut − ρut−1)

2

2σ2ε

])dado que en este aso el determinante de P (|P |) es √1− ρ2.Finalmente, la fun ión de verosimilitud en fun ión del término de errororiginal auto orrela ionado es:L =

(1

σε

√2π

)T

·√1− ρ2 · exp

([−u′Ω−1u

2σ2ε

]) (3.21)La ventaja de este método es que puedo estimar simultáneamente β y ρ.12Ver Greene, Análisis E onométri o página 69. Si la fun ión de densidad onjunta de lavariable εt es:f(ε) =

(1

σε

√2π

)T

· exp([

−∑T

t=2ε2t

2σ2ε

])o equivalentemente:f(ε) =

(1

σε

√2π

)T

· exp([−ε′ε

2σ2ε

])la fun ión de densidad de onjunta de Put = εt es:f(u) =

(1

σε

√2π

)T

· |P | · exp([

u′P ′Pu

2σ2ε

])

128

Page 130: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIEl logaritmo de la Verosimilitud Condi ional13 en términos de observables es:lnL = −

(T − 1

2

)ln(2π)−

(T − 1

2

)ln(σ2

ε )−1

2σ2ε

T∑

t=2

[(yt − xtβ)− ρ(yt−1 − xt−1β)]2

Las ondi iones de primer orden del problema de Máxima Verosimilitud son:∂lnL

∂β=

1

σ2ε

T∑

t=2

εtx∗t = 0 (k ecuaciones) (3.22)

∂lnL

∂ρ=

1

σ2ε

T∑

t=2

(ut − ρut−1)ut−1 = 0 (1 ecuacion) (3.23)∂lnL

∂σ2ε

= −(T − 1)

2· 1

σ2ε

+

∑Tt=2 ε

2t

σ4ε

= 0 (1 ecuacion) (3.24)De (3.22) podemos en ontrar el estimador MV de β, que omo podemos observar oin ide on el estimador MCF.De (3.23) se determina el estimador MV de ρ:ρ =

∑Tt=2 utut−1

ut−1que orresponde exa tamente a lo sugerido por el método de Co hrane-Or utt.Ejemplo: Estima ión de Fun ión ConsumoSuponga estamos interesados en estimar una fun ión Consumo:Ct = β0 + β1Yt + ut (3.25)donde Ct es el onsumo e Yt es el Ingreso. Para esto ontamos on informa ióndel onsumo agregado del se tor públi o y privado y del PIB de España para losaños 1954-1988. Estas series se muestran en el siguiente grá o:13La estima ión ondi ional toma la primera observa ión omo dada y es eliminada de laestima ión, es de ir, se estima on (T-1) observa iones129

Page 131: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI

0

4000

8000

12000

16000

20000

1955 1960 1965 1970 1975 1980 1985

CONSUMO PIB

Ahora estimemos (3.25) utilizando la informa ión disponible:

130

Page 132: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI

Dependent Variable: CONSUMO

Method: Least Squares

Date: 11/09/04 Time: 15:51

Sample: 1954 1988

Included observations: 35

CONSUMO=C(1)+C(2)*PIB Coefficient Std. Error t-Statistic Prob.

C(1) 76.53412 81.89808 0.934504 0.3568

C(2) 0.768971 0.006842 112.3909 0.0000

R-squared 0.997394 Mean dependent var 8615.809

Adjusted R-squared 0.997315 S.D. dependent var 3490.620

S.E. of regression 180.8607 Akaike info criterion 13.28878

Sum squared resid 1079450. Schwarz criterion 13.37765

Log likelihood -230.5536 Durbin-Watson stat 0.338818

Si omparamos el valor del DW (0.34) on el valor de tabla (k'=1 y n=35 al 95%de onanza, di=1.4 y ds=1.52), tenemos que se re haza la hipótesis nula de noauto orrela ión a favor de auto orrela ión positiva. Además podemos apre iargrá amente la forma autorregresiva de los residuos:

-400

-200

0

200

400

0

4000

8000

12000

16000

1955 1960 1965 1970 1975 1980 1985

Residual Actual Fitted

Veamos que su ede on nuestros parámetros estimados si apli amos la orre iónde Newey-West a nuestra estima ión MCO:131

Page 133: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI

Dependent Variable: CONSUMO

Method: Least Squares

Date: 11/09/04 Time: 15:59

Sample: 1954 1988

Included observations: 35

Newey-West HAC Standard Errors & Covariance (lag truncation=3)

CONSUMO=C(1)+C(2)*PIB

Coefficient Std. Error t-Statistic Prob.

C(1) 76.53412 105.8340 0.723152 0.4747

C(2) 0.768971 0.008968 85.75039 0.0000

R-squared 0.997394 Mean dependent var 8615.809

Adjusted R-squared 0.997315 S.D. dependent var 3490.620

S.E. of regression 180.8607 Akaike info criterio 13.28878

Sum squared resid 1079450. Schwarz criterion 13.37765

Log likelihood -230.5536 Durbin-Watson sat 0.338818

132

Page 134: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIPara realizar la estima ión MCF de la propensión marginal a onsumir (quees equivalente a la estima ión Máximo Verosímil) debemos primero estimar lafun ión autorregresiva del error. Para esto determinemos primero el ve tor deresiduos de la estima ión MCO de nuestro modelo de interés:

Y luego estimamos el siguiente modelo:

133

Page 135: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIρ

Una vez estimado ρ podemos transformar el modelo original de a uerdo a lae ua ión (3.19), de forma que el error transformado (εt) umple on los requisitospara que MCO sea MELI:

134

Page 136: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAI

La estima ión del modelo transformado arroja los siguientes resultados:

135

Page 137: Apuntes Benavente Econometria

Capitulo 3: Forma Fun ional y Espe i a ión E onometríaEs uela de Nego ios, UAIPrimero, podemos notar que el DW es 1.81, mayor al límite superior de tabla(1.52) y menor a (4 − ds) = 2,48, por lo tanto no se puede re hazar la nulade no auto orrela ión. El parámetro de la propensión marginal a onsumir esexa tamente el mismo que el obtenido de la estima ión MCO del modelo original.

136

Page 138: Apuntes Benavente Econometria

Capítulo 4Problemas on los datos4.1. Multi olinealidadEs prá ti amente imposible en ontrar dos variables e onómi as uyo oe ientede orrela ión es una determinada muestra sea numéri amente ero, di ho oe- iente puede tomar valores pequeños pero nun a llegar a ser ero. Granger yNewbold (1974) entre otros autores han ilustrado omo el sólo he ho de intro-du ir una tenden ia lineal en dos series de tiempo independientes aumenta su orrela ión notablemente.La Multi olinealidad apare e uando las variables expli ativas en modelo e o-nométri o están orrela ionadas entre si, esto tiene efe tos negativas uando sequire estimar los parámetros del modelo por MCO.Existen diversas fuentes de la multi olinealidad:El método de re ole ión de informa ión empleado, obten ión de muestrasen un intervalo limitado de valores de los regresores en la pobla ión.Restri ión en el modelo o en la pobla ión objeto de muestreo.Espe i a ión del modelo.Consideremos el siguiente modelo:

yi = β1 + β2x2i + ...+ βkxki + ui137

Page 139: Apuntes Benavente Econometria

Capitulo 4: Problemas on los datos E onometríaEs uela de Nego ios, UAISi existe la inversa de X'X, el estimador MCO de este modelo, viene dado porβMCO = (X ′X)−1X ′y y su matriz de ovarianzas es Var(β)=σ2

u(X′X)−1.Supongamos que la xji tiene un alto grado de orrela ión on las demás variablesexpli ativas de modelo, es de ir que la regresión lineal:

xji = δ1 + δ2x2i + ...+ δj−1xj−1,i + δj+1xj+1,i + ... + δk−1xki + νi (4.1)tiene un oe iente de determina ión alto.En estas ondi iones la variable xji puede es ribirse aproximadamente omo una ombina ión lineal del resto de las variables expli ativas del modelo, lo que sepuede apre iar en la e ua ión (4.1). Como onse uen ia una de las olumnas dela matriz X, la orrespondiente a xji, puede es ribirse omo una ombina iónlienal aproximada de las demás olumnas de X, y de esta forma (X'X) será apro-ximadamente singular.En la medida que el determinante de (X'X) sea distinto de ero, existirá (X'X)−1,y por lo tanto también existirá es el estimador MCO, y sigue umpliendo on lapropiedad de MELI, pero se tienen las siguientes onse uen ias:1. La solu ión del sistema de e ua iones normales está mal denido: mientrasla dependen ia de xji sea aleatoria omo lo muestra la e ua ión (4.1) y noexa ta, X'X no será exa tamente singular y existirá un úni o estimadorMCO, ya que existe una úni a solu ión al sistema de e ua iones normales,pero también habrá un número de ve tores β1, β2, ..., que al sustituirlos enel sistema de e ua iones normales, serían aproximadamente una solu ión almismo.2. Pequeñas varia iones muestrales por in orporar o sustraer un número re-du ido de observa iones muestrales, introdu irá ligeros ambios en (X'X) yX'y, pero podrían generar importantes ambios en la solu ión β del sistemade e ua iones normales.3. Al ser la matriz X'X asi singular, es muy pequeña. Como onse uen ia lamatriz de ovarianzas será muy grande, por lo tanto el estimador MCO espo o pre iso en este aso.138

Page 140: Apuntes Benavente Econometria

Capitulo 4: Problemas on los datos E onometríaEs uela de Nego ios, UAI4.1.1. Multi olinealidad Exa ta y Multi olinealidad Apro-ximadaLa presen ia de multi olinealidad en un modelo de regresión lineal puede ser dedos formas:Multi olinealidad Exa ta: una de las variables expli ativas es una om-bina ión lineal determinísti a de todas las demás (o algunas de ellas).Multi olinealidad Aproximada: o urre uando una de las variables esaproximadamente igual a una ombina ión lineal de las restantes, omo enla e ua ión (3.1).En la prá ti a, ontrario a lo que se pudiera esperara es más ompli ado la mul-ti olinealidad aproximada que la exa ta.4.1.2. Dete ión de Multi olinealidadPuesto que la multi olinealidad es un problema de naturaleza muestral, que surgeprin ipalmente por el ará ter no experimental de la mayoría de la informa iónre opilada en las Cien ias So iales, no tiene una manera úni a de ser dete tada.Lo que se tiene son algunas reglas prá ti as detalladas a ontinua ión:1. El R2 es alto, pero los parámetros no resultan ser individualmente signi- ativos.Por ejemplo: Considere los siguientes datos:Tabla 6: Multi olinealidadPeriodo yi x2i x3i x4i1 20 5 10 102 12 2 8 63 28 7 12 164 26 6 4 125 14 4 16 86 24 8 14 147 16 3 6 4Las variables x3 y x4 tienen las mismas observa iones numéri as solo que endistinto orden, de forma tal que la orrela ión entre x2 y estas dos variables139

Page 141: Apuntes Benavente Econometria

Capitulo 4: Problemas on los datos E onometríaEs uela de Nego ios, UAIson: ρ23 = 0,32 y ρ24 = 0,93, altamente diferentes entre sí.Una regresión de yi sobre x2i, x3i y una onstante generó las siguientesestima iones MCO:yt = 10,81

(2,6)

+ 2,92x2i(0,42)

− 0,54x3i(0,21)

+ ui (4.2)R2 = 0,92 σ2

u = 2,09

Una regresión de y ontra una onstante, x2 y x4, produjo las siguientesestima iones:yi = 6,67

(3,27)

+ 1,33x2i(1,61)

+ 0,67x4i(0,81)

+ ui (4.3)R2 = 0,83 σ2

u = 3,16

Ambas regresiones no in luyen las mismas variables expli ativas y por lotanto, no son omparables. Sin embargo, en el segundo modelo donde el gra-do de orrela ión entre las variables expli ativas es alto, podemos apre iarque a pesar de que el R2es alto, los parámetros resultan ser insigni ativosindividualmente (t4=2.78). 140

Page 142: Apuntes Benavente Econometria

Capitulo 4: Problemas on los datos E onometríaEs uela de Nego ios, UAI2. Pequeños ambios en los datos, produ e importantes varia iones en las es-tima iones mínimo uadráti as.3. Los oe ientes pueden tener signos opuestos a los esperados o una magni-tud po o reíble.4.1.3. Otros métodos de dete ión de multi olinealidad(a) Métodos basados en la orrela ión entre variables expli ativas: unade las onse uen ias de la multi olinealidad era varianzas de los estimadoresbastante altas. Enton es, ¾Cúal es la rela ión entre la varianza estimada yel grado de orrela ión entre las variables expli ativas?.Si des omponemos la matriz X de la siguiente forma:X = [xj ;Xj]donde xj es un ve tor olumna orrespondiente a la j-ésima variable expli- ativa y Xj una matriz de n×(k-1) on las observa iones de las restantesvariables. Enton es, X'X puede es ribirse omo:

X ′X =

[x′jxj x′

jXj

X ′jxj X ′

jXj

]De esta forma, el elemento (1,1) de (X ′X)−1 es (Demostrar): 1[(x′

jxj)− x′jXj(X

′jXj)

−1(X ′jxj)]

−1 = (x′jMjxj)

−1donde Mj = In−Xj(X′jXj)

−1X ′j y donde x′

jMjxj orresponde a la suma delos residuos al uadrado de una regresión de xj sobre Xj , de esta forma setiene que:V ar(βj) =

σ2u

x′jMjxj

(4.4)Lo que tiene la siguiente expresión:V ar(βj) =

σ2u

STj(1− R2j )

(4.5)1Re ordar que la inversa de una matriz parti ionada es:[

A11 A12

A21 A22

]−1

=

[A−1

11(I +A12F2A21A

−1

11) −A−1

11A12F2

−F2A21A−1

11F2

]donde F2=(A22-A21A−1

11A12). 141

Page 143: Apuntes Benavente Econometria

Capitulo 4: Problemas on los datos E onometríaEs uela de Nego ios, UAIdonde STj es la suma total de la regresión entre xj y Xj (STj=∑ni=1(xji −

xj)2) y R2

j es el oe iente de determina ión de esta misma regresión.La varianza de βj depende de tres osas:La varianza del término de error, que es independiente del grado de orrela ión entre las x's.La suma total propia de la variable xj, la que depende solo de estavariable.El oe iente de determina ión R2j , el que si depende del grado del gra-do de orrela ión entre la variable xj y las restantes, es de ir, dependedel grado de multi olinealidad.La ota inferior para la varianza de βj , uando R2

j=0, es:V ar(β0

j ) =σ2u

STjPor lo que la rela ión entre las varianzas de la estima ión de βj en un asode orrela ión entre variables expli ativas y el aso de independen ia lineales:V ar(βj)

V ar(β0j )

=1

1−R2j

142

Page 144: Apuntes Benavente Econometria

Capitulo 4: Problemas on los datos E onometríaEs uela de Nego ios, UAIDe a uerdo on este análisis, los oe ientes de determina ión obtenidosen las regresiones de ada variable expli ativa on el resto son un buenindi ador de una posible situa ión de multi olinealidad.(b) Métodos basados en el tamaño de la matriz X'X: uando tenemos mul-ti olinealidad la matriz X'X es asi singular, de esta manera una medida detamaño de esta matriz nos permite dete tar la presen ia de multi olineali-dad. El determinante no es una medida buena, ya que tiene problemas desensibilidad a los ambios de unidades. Pero sabemos que el determinantede una matriz simétri a es igual al produ to de sus valores propios, y por lotanto el examen de estos valores nos da una idea del tamaño de la matriz.De esta forma, Belsley propone la siguiente medida para ver el grado demulti olinealidad:γ =

√λmax

λminEsta medida se denomina número de ondi ión de la matriz X, y númerosde este indi ador mayores 25 suelen onsiderarse problemáti os.Los λ's orresponden a los valores propios de la matriz B = S(X ′X)S,donde S es la siguiente matriz diagonal:S =

1√x′

2x20 · · · 0

0 1√x′

3x30

...... 0. . . 0

0 · · · 0 1√x′

kxk

Esta matriz nos permite librarnos del problema de unidad en el tamaño delos valores propios, ya que normaliza ada una de las variables al dividirtodas las observa iones por su desvia ión estándar.El número de ondi ión de la matriz X (γ), impli a que mientras mayor eseste valor, el valor de λmin es realmente pequeño al ompararlo on λmax,indi ando el poten ial problema de multi olinealidad.4.1.4. Remedios ontra la Multi olinealidadSe han propuesto varios métodos para ha er frente a la multi olinealidad. La so-lu ión más sen illa es eliminar de la regresión las variables que se sospe he sonla ausa del problema. Obviamente de este método surgen problemas de espe- i a ión, omo la omisión de variables relevantes. Es ne esario re ordar que el143

Page 145: Apuntes Benavente Econometria

Capitulo 4: Problemas on los datos E onometríaEs uela de Nego ios, UAIestimador MCO sigue siendo el mejor estimador lineal insesgado de los paráme-tros. El problema es que, uando hay multi olinealidad, el mejor no resulta sermuy bueno.Las solu iones propuestas en la literatura (estimador de ridge o estimador restay estimador de omponentes prin ipales) tienen omo ara terísti a bus ar unestimador ligeramente sesgado pero uya varianza sea mu ho menor, es de ir, unestimador on menor error uadráti o medio. No existe una metodología que per-mita eliminar el problema de alta multi olinealidad sin alterar las propiedades yla interpreta ión de los parámetros.Estas metodologías tienen po o respaldo intuitivo, por lo tanto la interpreta iónde los parámetros es des ono ida.

144

Page 146: Apuntes Benavente Econometria

Capitulo 4: Problemas on los datos E onometríaEs uela de Nego ios, UAI4.2. Error de Medi iónUna di ultad en todo trabajo empíri o en E onomía es la imposibilidad de dis-poner de las observa iones muestrales de las variables de interés. Por ejemplo,las variables de ontabilidad na ional omo el PIB, sto k de apital o onsumo,son sólo estima iones de on eptos teóri os que no se observan en la realidad. Enotros asos, omo la Renta Permanente, inteligen ia o habilidad de un trabajador,no disponemos ni siquiera estima iones, y debemos utilizar variables Proxies, queaproximan los on eptos que se quieren utilizar. Así por ejemplo se utilizan añosde experien ia del trabajador para aproximar su habilidad.Podemos adelantar que el error de medi ión o el uso de variables proxies generarásesgos en las estima iones por MCO, el que será menor: uanto más se aproxime la verdadera variable que debería in luirse en elmodelo on que que in luyo efe tivamente. uanto más independiente sea el error de medida de las restantes variablesdel modelo.Consideremos el siguiente modelo lineal simple:yi = βxi + ui i = 1, ..., n (4.6)en el que la variable dependiente yi está medida on error, es de ir, solo observa-mos:y∗i = yi + νi i = 1, ..., n (4.7)donde asumimos que νi ∼ N(0, σ2

ν) y es independiente de xi y ui.Reemplazando (4.7) en (4.6):y∗i = βxi + (ui + νi) = βxi + εi (4.8)Bajo los supuestos men ionados es fá il darse uenta que el estimador de β seráel mismo que si observáramos el verdadero valor de yi.En onse uen ia, los errores de medida en la variable endógena no produ en nin-gún problema importante al estimar por MCO.Ahora supongamos que la variable xi esta medida on error, es de ir:

x∗i = xi + ωi i = 1, ..., n (4.9)145

Page 147: Apuntes Benavente Econometria

Capitulo 4: Problemas on los datos E onometríaEs uela de Nego ios, UAIdonde ωi ∼ N(0, σ2ω) y es independiente de ui, xi y de yi.El modelo en términos de las variables observables es:

yi = βx∗i + (ui − βωi) = βx∗

i + εi (4.10) ontrario a lo que o urría en (4.8) en este aso tenemos di ultad al estimar porMCO, ya que el término de error εi esta rela ionado on x∗i , lo que va en ontradel supuesto 6, veamos:

Cov(εi, x∗i ) = Cov(ui − βωi, xi + ωi)

= Cov(ui, xi)− βCov(ωi, xi) + Cov(ui, ωi)− βCov(ωi, ωi)

= 0− β · 0 + 0− βσ2ωEsto ha e que el estimador MCO de β en el modelo (4.10) sea sesgado:

β =

∑Ni=1 x

∗i yi∑N

i=1 x∗2i

/· 1/N1/N

β =1N

∑Ni=1 x

∗i yi

1N

∑Ni=1 x

∗2i

/plim

plimβ =plim 1

N

∑Ni=1 x

∗i yi

plim 1N

∑Ni=1 x

∗2i

plimβ =plim 1

N

∑Ni=1(xi + ωi)(βxi + ui)

plim 1N

∑Ni=1(xi + ωi)2

plimβ =plim 1

N

∑Ni=1(xi + ωi)(βxi + ui + βωi − βωi)

plim 1N

∑Ni=1(xi + ωi)2

plimβ = β +plim 1

N

∑Ni=1(xi + ωi)(ui − βωi)

plim 1N

∑Ni=1(xi + ωi)2

plimβ = β +−βσ2

ω

S2x + σ2

ω

plimβ =β

1 + σ2ω

S2xdonde S2

x = plim 1n

∑ni=1 x

2i , que supondremos existe.El resultado en términos generales es que el estimador MCO en presen ia deerror de medi ión estará sesgado ha ia en origen.146

Page 148: Apuntes Benavente Econometria

Capitulo 4: Problemas on los datos E onometríaEs uela de Nego ios, UAIEn el aso del modelo de regresión múltiple:y = Xβ + u

X∗ = X + ωdonde todas las variables pueden estar medidas on error. Extendiendo lo desa-rrollado anteriormente:plim βMCO = β − [Σxx + Σωω]

−1Σωωβ (4.11)donde Σxx = plim X′Xn

y Σωω = plim ω′ωn.Lo que impli a que un sólo error basta para generar in onsisten ias en todoslos oe ientes del modelo.4.2.1. Estima ión por Variables InstrumentalesLa estima ión onsistente de los parámetros en presen ia de errores de medida esposible si se disponen de instrumentos.Deni ión: Un instrumento es una variable no in luida en el modelo, que umple on: No estar orrela ionada on el término de error.Esta orrela ionada on la variable expli ativa para la ual a túa omoinstrumento (en este aso la variable medida on error).Volviendo al modelo en (4.10), el sesgo del estimador MCO de β surge por la orrela ión entre la variable x∗

i y εi. Supongamos ahora que se dispone de lavariable zi, tal que:E(ziεi) = 0 E(zix

∗i ) 6= 0Enton es el estimador de variables instrumentales de (4.10) es:

βV I =

∑ni=1 ziyi∑ni=1 zix

∗iEn un modelo de regresión múltiple, tenemos que en ontrar una matriz Z que ontenga los instrumentos de las variables medidas on error. El estimador deVariables Instrumentales se obtiene de una regresión MCO en dos etapas:147

Page 149: Apuntes Benavente Econometria

Capitulo 4: Problemas on los datos E onometríaEs uela de Nego ios, UAIi. En la primera etapa, se ha e una regresión entreX∗ y la matriz de instrumentosZ, para obtener el valor estimado de X∗:X∗ = Zϕ+ ǫ

ϕ = (Z ′Z)−1Z ′X∗

X∗ = Z(Z ′Z)−1Z ′X∗ii. En la segunda etapa se reemplaza el valor estimado de X∗ en el modelo deregresión original:y = X∗β + ε

y = X∗β + εy obtengo el estimador de β mediante MCO:βV I = (X∗′X∗)−1X∗′y

= [X∗′Z(Z ′Z)−1Z ′X∗]−1X∗′Z(Z ′Z)−1Z ′y (4.12)Si todas las variables expli ativas están medidas on error ada una de ellas sene esita un instrumento, enton es Z tiene dimensión n×k al igual que X∗, en este aso se puede demostrar (Ha erlo) que:βV I = (Z ′X∗)−1Z ′y on matriz de varianzas y ovarianzas (también demostrar):

V ar(βV I) = σ2ε(Z

′X∗)−1(Z ′Z)(X∗′Z)−14.2.2. Test de HausmanBajo errores de medida, el estimador MCO es in onsistente, mientras que el esti-mador de variables instrumentales es onsistente. Si en ralidad no hubiese erroresde medida, ambos estimadores serán onsistentes, y MCO es además e iente, loque no o urre on ualquier estimador de variables instrumentales (es un estima-dor en dos etapas, lo que ha e perder e ien ia).Por lo tanto, para ontrastar la existen ia de errores de medida Hausman plantearealizar un test estadísti o omparando (βMCO − βV I) on su matriz de varianzasy ovarianzas. 148

Page 150: Apuntes Benavente Econometria

Capitulo 4: Problemas on los datos E onometríaEs uela de Nego ios, UAILa hipótesis nula es que no existe error de medida, es de ir:H0 : βMCO − βV I = 0 (4.13)Hausman demuestra que la matriz de varianzas y ovarianzas de (βMCO − βV I)es igual a V (βV I) − V (βMCO). De esta forma, se puede onstruir el siguienteestadísti o de Wald para la hipótesis nula en (4.13):

W = (βMCO − βV I)′(V (βV I)− V (βMCO))

−1(βMCO − βV I) ∼ χ2k

149