ECONOMETRÍA PRÁCTICA CON EXCEL

Embed Size (px)

Citation preview

ECONOMETRA PRCTICA CON EXCEL

SERGIO ZIGA Universidad Catlica del Norte Julio, 2004

PRESENTACIONEs sabido que el estudio de la econometra requiere, en apoyo al estudio de los aspectos conceptuales, la estimacin emprica de los modelos economtricos para anlisis, contrastacin y prediccin. Para esto el estudiante debe estar familiarizado con un buen programa de ordenador, de los cuales existen en el mercado muchas alternativas, como por ejemplo RATS, E-Views, Limdep, Gauss, Stata o SAS, cada uno de ellos con caractersticas especiales. Este libro se ocupa de introducir al lector en el programa Excel. Si bien Excel no es el programa preferido por los econometristas, a travs de este libro mostramos la forma en que ste puede ayudar a alcanzar la mayor parte de los objetivos planteados para una asignatura de econometra de pregrado. Como se ver, este libro es un texto de apoyo en los laboratorios computacionales de econometra, es decir tiene un objetivo netamente prctico, por lo cual hemos intentado presentar y resolver gran nmero de ejemplos numricos, a costa de centrarnos solo en los aspectos fundamentales de la teora subyacente, la que asumimos ser estudiada en alguno de los nmerosos libros de texto introductorio existentes, tales como Introduccin a la Econometra de Maddala, Anlisis Economtrico de Green, Introduction to the Theory and Practice of Econometrics de Judge et al., y Econometra de Gujarati.

INDICE

PRESENTACION ............................................................................................................................................................. 1 CAPTULO 1..................................................................................................................................................................... 1 EL PROGRAMA EXCEL ................................................................................................................................................ 1 1.1. ESTADISTICA DESCRIPTIVA CON EXCEL ................................................................................................ 1 1.2. SESGO, CURTOSIS Y NORMALIDAD.......................................................................................................... 4 1.3. GRAFICOS DE PROBABILIDAD NORMAL................................................................................................. 6 1.4. HISTOGRAMA ................................................................................................................................................ 9 1.5. OPERACIONES CON ESCALARES Y MATRICES .................................................................................... 11 a) Crear una frmula matricial.................................................................................................................................. 11 b) Calcular un nico resultado .................................................................................................................................. 11 c) Calcular varios resultados ..................................................................................................................................... 11 d) Operaciones Matriciales........................................................................................................................................ 12 1.6. DISTRIBUCIONES DE PROBABILIDAD.................................................................................................... 13 1.7. POTENCIA DE UN TEST .............................................................................................................................. 15 1.7.1. APLICACIN: SELECCIN ENTRE TESTS ALTERNATIVOS ................................................................. 16 1.8. NIVEL DE SIGNIFICANCIA MARGINAL: CDF O P-VALUE.................................................................... 17 1.8.1. Distribucin Normal......................................................................................................................................... 17 1.8.2. Distribucin t.................................................................................................................................................... 18 1.8.3. Distribucin F .................................................................................................................................................. 19 1.8.4. Distribucin Chi cuadrado............................................................................................................................... 20 1.9. PRUEBAS SOBRE LA MEDIA EN EXCEL ......................................................................................................... 21 1.9.1. Inferencia respecto a una Media...................................................................................................................... 21 1.9.2. Diferencia de dos Medias (Univariado)........................................................................................................... 22 1.9.3. Inferencia En Excel .......................................................................................................................................... 23 1.10. SERIES DE DATOS........................................................................................................................................ 26 CAPTULO 2................................................................................................................................................................... 28 EL MODELO DE REGRESIN LINEAL................................................................................................................... 28 2.1. INTRODUCCIN: QUE ES LA ECONOMETRA? .................................................................................... 28 2.2. ESTIMACIN DE MODELOS DE REGRESIN ......................................................................................... 28 2.2.1. EL MTODO DE MNIMOS CUADRADOS ................................................................................................... 29 2.2.2. IMPLEMENTACIN DE MCO ....................................................................................................................... 31 2.3. PRUEBA DE HIPTESIS............................................................................................................................... 33 2.3.2. LA DISTRIBUCIN DE b Y SUS PROPIEDADES ..................................................................................... 33 2.3.3. LA MATRIZ DE COVARIANZAS DE LOS ERRORES ................................................................................ 34 2.3.4. UNA MEDIDA DEL XITO DE AJUSTE.................................................................................................... 36 2.4. CASO DE ESTUDIO .............................................................................................................................................. 38 2.4.1. Describiendo los Datos .................................................................................................................................... 38 2.4.2. Calculando Estadsticas ................................................................................................................................... 39 2.4.3. Transformacin de datos y creacin de nuevas series ..................................................................................... 39 2.4.5. Grficos de Series de Tiempo........................................................................................................................... 40 2.4.6. Grficos X-Y (Scatter) ...................................................................................................................................... 40 2.4.7. CASO DE ESTUDIO: Corriendo la Regresin 1 ............................................................................................. 42 2.4.8. CASO DE ESTUDIO: Corriendo la Regresin 2 ............................................................................................. 43 2.5. INTERPRETACION DE LOS COEFICIENTES DE REGRESIN............................................................... 45

i

2.5.1. INTRODUCCIN ........................................................................................................................................ 45 2.5.2. FORMA DOBLE LOGARTMICA ............................................................................................................... 46 2.5.3 MODELO LOGARTMICO LINEAL (DE CRECIMIENTO CONSTANTE) ................................................ 46 2.5.4. OTRA VISIN DE LOS COEFICIENTES DE PENDIENTE....................................................................... 47 2.6 RESUMEN: UNA CRTICA AL MODELO....................................................................................................... 50 CAPTULO 3................................................................................................................................................................... 51 MNIMOS CUADRADOS RESTRINGIDOS (INFERENCIA) ................................................................................. 51 3.1. MCO CON ERRORES NORMALES ............................................................................................................. 51 3.2. PRUEBAS SOBRE UN COEFICIENTE......................................................................................................... 53 3.3. TRES TESTS EQUIVALENTES .................................................................................................................... 54 3.4. TEST DE RAZON DE VEROSIMILITUD (LR) ............................................................................................ 54 3.4.1. LR BAJO ESPECIFICACION LINEAL-LINEAL ............................................................................................. 55 3.5. TEST DE WALD .................................................................................................................................................... 57 3.5.1. WALD BAJO ESPECIFICACION LINEAL-LINEAL ....................................................................................... 57 3.5.2. EJEMPLO NUMERICO DEL TEST DE WALD .............................................................................................. 58 3.6. TEST DEL MULTIPLICADOR DE LAGRANGE................................................................................................. 59 3.7. PRUEBA DE SIGNIFICANCIA GLOBAL .................................................................................................... 60 3.8. PRUEBA DE EXCLUSION DE VARIABLES............................................................................................... 61 3.9. PRUEBA DE CAUSALIDAD (GRANGER, 1969) ........................................................................................ 62 3.10. TEST DE ESTABILIDAD (CAMBIO ESTRUCTURAL).............................................................................. 65 3.11. ESTIMANDO REGRESINES RESTRINGIDAS ........................................................................................ 66 CAPTULO 4................................................................................................................................................................... 67 VIOLACIN DE ALGUNOS SUPUESTOS ................................................................................................................ 67 4.1. MNIMOS CUADRADOS GENERALIZADOS............................................................................................ 68 4.2. HETEROCEDASTICIDAD............................................................................................................................ 69 4.2.1. CORRECCIN CON MCG ( CONOCIDA) ............................................................................................. 70 4.2.2. DETECCION DE LA HETEROCEDASTICIDAD ....................................................................................... 721.- Test de Goldfeld y Quandt (1972) ........................................................................................................................................ 72 2.- Arch Test de White (1980): .................................................................................................................................................. 73 3.- Arch Test de Engle (1982):................................................................................................................................................... 74

4.2.3. CORRIGIENDO POR HETEROCEDASTICIDAD: MC PONDERADOS................................................... 75 4.3. CORRELACIN SERIAL .............................................................................................................................. 77 4.3.1. CORRECCIN CON MCG ( CONOCIDA) ............................................................................................. 78 4.3.2. DETECCION DE AR(1): DURBIN-WATSON (1951) ................................................................................. 80 4.3.3. DETECCION EN MODELOS CON Y REZAGADA: Test h de Durbin ....................................................... 83 4.3.4. DETECCIN DE LA AUTOCORRELACIN DE ORDEN SUPERIOR..................................................... 84a) Test de BREUSCH (1978) Y GODFREY (1978) .................................................................................................................. 84 b) Test Q de Ljung y Box (1978) (Box-Jenkins model identification) ....................................................................................... 85

4.3.4.

CORRIGIENDO LA AUTOCORRELACION EN EXCEL............................................................................ 87

4.3.4.1. Primeras Diferencias ..................................................................................................................................................... 87 4.3.4.2. PDG: Mtodos Alternativos .......................................................................................................................................... 89

4.4. ESTIMACION ROBUSTA ............................................................................................................................ 91 4.4.1. CORRECCION DE WHITE (1980) ............................................................................................................. 92 4.4.2. CORRECCION DE NEWEY Y WEST (1987) .............................................................................................. 93 4.4. MULTICOLINEALIDAD............................................................................................................................... 95 4.4.1. MULTICOLINEALIDAD PERFECTA......................................................................................................... 95 4.4.2. MULTICOLINEALIDAD MUY ALTA.......................................................................................................... 95 4.5.3. SOLUCIONES A LA MULTICOLINEALIDAD ........................................................................................... 96 CAPTULO 5................................................................................................................................................................... 97 ESTACIONARIEDAD Y COINTEGRACIN............................................................................................................ 97

ii

5.1. REGRESIONES ESPUREAS ......................................................................................................................... 97 5.2. ESTACIONARIEDAD ................................................................................................................................... 99 5.2.1. DEFINICIN ................................................................................................................................................... 99 5.2.2. SERIE ESTACIONARIA ................................................................................................................................... 99 5.2.3. SERIE NO ESTACIONARIA .......................................................................................................................... 101 5.3. PRUEBAS DE ESTACIONARIEDAD ................................................................................................................ 103 5.3.1. CORRELOGRAMA Y TEST Q ....................................................................................................................... 103 5.3.2. PRUEBAS DE RAICES UNITARIAS: Dickey y Fuller .............................................................................. 105 5.3.3. PRUEBAS DE RAICES UNITARIAS: Augmented Dickey Fuller (ADF) Test ........................................... 106 5.3. DIFERENCIACION DE SERIES I(1)........................................................................................................... 108 5.4. COINTEGRACIN: PRUEBA DE ENGLE-GRANGER ............................................................................ 110 5.4.1. INTRODUCCIN ...................................................................................................................................... 110 5.4.2. DEFINICIN FORMAL DE COINTEGRACION...................................................................................... 111 5.4.3. PRUEBA DE ENGLE-GRANGER (1987).................................................................................................. 113 5.4.4. TEOREMA DE REPRESENTACION DE GRANGER.................................................................................... 114 5.5. COMENTAROS FINALES .................................................................................................................................. 116 CAPTULO 6................................................................................................................................................................. 117 INTRODUCCIN A LA PREDICCIN EN EXCEL............................................................................................... 117 6.1. EL ERROR DE PREDICCIN ..................................................................................................................... 119 6.2. PREDICCIN ESTATICA ........................................................................................................................... 119 6.3. CASO PRCTICO........................................................................................................................................ 122 a) Tasa de Ocupacin (OCCUP) ............................................................................................................................. 123 b) Ingreso por Habitacin (Room Rate)................................................................................................................... 125 c) Nmero de Habitaciones (ROOMS)..................................................................................................................... 126 d) Prediccin Final .................................................................................................................................................. 127 6.4. MEDIDAS DE ERROR DE PREDICCION.......................................................................................................... 128 6.4.1. Error Cuadrtico Medio (Mean Squared Error, MSE).................................................................................. 128 6.4.2. Promedio del Error Absoluto (Mean Absolute Error, MAE) ......................................................................... 128 6.4.3. Promedio del Porcentaje de Error Absoluto (Mean Absolute Percentage Error, MAPE)............................. 128 6.4.4. Ejemplo de Clculo ........................................................................................................................................ 129 CAPTULO 7................................................................................................................................................................. 130 MODELOS ARIMA...................................................................................................................................................... 130 7.1. 9.2. 9.2.1. 9.2.2. 9.3. 9.3.1. 9.3.2. 9.3. 7.4. 9.4.1. 9.4.2. 9.4.3. 9.4.4. AUTOCORRELACIONES SIMPLES Y PARCIALES................................................................................ 130 PROCESOS AUTORREGRESIVOS (AR) ................................................................................................... 131 SIMULACION DE PROCESOS AR(1) ...................................................................................................... 132 ESTIMACION DE UN PROCESO AUTOREGRESIVO ............................................................................ 133 PROCESOS DE MEDIAS MOVILES .......................................................................................................... 134 SIMULACION DE PROCESOS MA(1) ..................................................................................................... 134 ESTIMACION DE UN PROCESO DE MEDIAS MOVILES...................................................................... 134 PROCESOS ARIMA..................................................................................................................................... 136 EL ENFOQUE DE BOX Y JENKINS ........................................................................................................... 138 PASO 1: IDENTIFICACIN ..................................................................................................................... 139 PASO 2: ESTIMACIN ............................................................................................................................. 140 PASO 3: VERIFICACIN / DIAGNSTICO ............................................................................................ 143 PASO 4: PREDICCIN............................................................................................................................. 144

CAPTULO 8................................................................................................................................................................. 147 ERROR EN LAS VARIABLES: INSTRUMENTOS................................................................................................. 147 8.1. VARIABLES INSTRUMENTALES.................................................................................................................... 147 8.2. ESTIMACIN CON INSTRUMENTOS EN SPSS ...................................................................................... 148 8.3. EL ESTIMADOR DE VARIABLES INSTRUMENTALES......................................................................... 150

iii

REFERENCIAS ............................................................................................................................................................ 151 ANEXO: DATOS UTILIZADOS EN EL LIBRO ....................................................................................................... 153

iv

CAPTULO 1 EL PROGRAMA EXCEL

1.1. ESTADISTICA DESCRIPTIVA CON EXCELMicrosoft Excel ofrece un conjunto de herramientas para el anlisis de los datos (Herramientas para Anlisis) lo que permite efectuar anlisis estadstico de una manera simple. Algunas herramientas generan grficos adems de tablas de resultados. Para ver una lista de las herramientas de anlisis disponibles, elija 'Anlisis de Datos' en el men Herramientas. Si este comando no est en el men, en el men Herramientas, elija Complementos, y all seleccione Herramientas para Anlisis. Si no aparece la opcin Herramientas para Anlisis, necesita el CD de instalacin de Excel. Para usar el anlisis de datos, vaya ahora a Herramientas, y all seleccione 'Anlisis de Datos' (Herramientas / Anlisis de datos). Aparecer la lista de opciones en donde seleccionamos Estadstica Descriptiva:

En el cuadro de dilogo de Estadstica descriptiva, lo nico que s "obligatorio" suministrar son los datos a analizar (Rango de entrada) y el lugar en donde se desea escribir los resultados (Rango de salida).

1

Ejemplo. Se tienen datos de la cantidad de produccin (kg), capital ($)y de trabajo (horas) de 10 empresas:

Comenzaremos calculando estadstica de la serie 'capital'. El "Rango de entrada" es $B$1:$B$11, es decir seleccionando los ttulos como promera observacin, de modo que se debe activar la opcin 'Rtulos en la primera fila'. A continuacin debemos activar la seleccin del rango de salida, por ejemplo la celda $A$13, como se muestra acontinuacin:

El resultado es el siguiente:

CAPITAL Media Error tpico Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango Mnimo Mximo Suma Cuenta Mayor (2) Menor(2) Nivel de confianza(95,0%) 5,6 0,733333333 6 6 2,319003617 5,377777778 -1,11811742 -0,058802684 7 2 9 56 10 8 3 1,658915249

Nota: Muchos de estos resultados anteriores pueden obtenerse individualmente a travs del men Insertar/Funcin, y all ir dentro de las funciones estadsticas.

2

Media: Devuelve el promedio (media aritmtica) de los argumentos. PROMEDIO(nmero1;nmero2;...) Error tpico (de la media): (Desviacin estndar)/raiz(T) Mediana: Devuelve la mediana de los nmeros. La mediana es el nmero que se encuentra en medio de un conjunto de nmeros, es decir, la mitad de los nmeros es mayor que la mediana y la otra mitad es menor. MEDIANA(nmero1;nmero2; ...) Moda: Devuelve el valor que se repite con ms frecuencia en una matriz o rango de datos. Al igual que MEDIANA, MODA es una medida de posicin. Desviacin estndar: Calcula la desviacin estndar en funcin de un ejemplo. La desviacin estndar es la medida de la dispersin de los valores respecto a la media (valor promedio). DESVEST(nmero1; nmero2; ...) Varianza de la muestra: Calcula la varianza en funcin de una muestra (con n-1 g.l.). VAR(nmero1;nmero2; ...) Curtosis: Devuelve la curtosis de un conjunto de datos. La curtosis caracteriza la elevacin o el achatamiento relativos de una distribucin, comparada con la distribucin normal. Una curtosis positiva indica una distribucin relativamente elevada, mientras que una curtosis negativa indica una distribucin relativamente plana. CURTOSIS(nmero1;nmero2; ...) Coeficiente de asimetra: Devuelve la asimetra de una distribucin. Esta funcin caracteriza el grado de asimetra de una distribucin con respecto a su media. La asimetra positiva indica una distribucin unilateral que se extiende hacia valores ms positivos. La asimetra negativa indica una distribucin unilateral que se extiende hacia valores ms negativos. COEFICIENTE.ASIMETRIA(nmero1;nmero2; ...) Rango: MAX(Rango) MIN(Rango). Mnimo: Devuelve el valor mnimo de un conjunto de valores. MIN(nmero1;nmero2; ...) Mximo: Devuelve el valor mximo de un conjunto de valores. MAX(nmero1;nmero2; ...) Suma: La sumatora de las observaciones Cuenta: El nmero de observaciones (T) Mayor (2): Ksimo mayor. Devuelve el valor ksimo mayor de cada rango de datos en la tabla de resultados. En el cuadro, escriba el nmero que va a utilizarse para k. Si escribe 1, esta fila contendr el mximo del conjunto de datos. Menor (2): Ksimo menor. Devuelve el valor ksimo menor de cada rango de datos en la tabla de resultados. En el cuadro, escriba el nmero que va a utilizarse para k. Si escribe 1, esta fila contendr el mnimo del conjunto de datos. Nivel de confianza (95,0%): Nivel de confianza para la media. Devuelve el nivel de confianza de la media en la tabla de resultados. En el cuadro, escriba el nivel de confianza que desee utilizar. Por ejemplo, un valor de 95 % calcular el nivel de confianza de la media con un nivel de importancia del 5 %.

3

1.2. SESGO, CURTOSIS Y NORMALIDADExisten 4 formas comunes de estimar la normalidad: 1.2.3.4.Histograma de residuos Normal Probability Plot Anderson-Darling normality test (A2 stat) Jarque-Bera (JB) test of Normality (asinttico)

Por ahora estamos interesados en la prueba de Jarque Bera, la que tiene la siguiente specificacin:

S2 K2 a JB = T + 24 6

2 ( 2)

donde S es el coeficiente de Sesgo y K es el coeficiente de curtosis. Para una variable distribuda normalmente, S=0 y K=3. Luego, el test JB de normalidad es una prueba conjunta de si S=0 y K=3. Si el valor p es suficientemente bajo, se puede rechazar la hiptesis que la variable est normalmente distribuda. Ejemplo: Chi-Squared(2)= 1.061172 with Significance Level 0.58826017, donde Ho: Normalidad. Luego, no podemos rechazar en este caso la hiptesis de normalidad (la conclusin es no rechazar normalidad).

Las definiciones y pruebas estadsticas para el sesgo y la curtosis son las siguientes: a) Sesgo:

En Excel: =coeficiente.asimetria( ) La prueba estadstica de que el sesgo es cero se basa en una Normal, y es:

b) Curtosis:

En Excel: =curtosis( ) La prueba estadstica de que la curtosis es cero se basa en una Normal, y es:

4

Ejemplo: Siguiendo el ejemplo de la serie CAPITAL anterior mostramos el clculo de stas. Los resultados a obtener son los siguientes:Observaciones Media Muestral Desv estandar Varianza Error est de la media Estadistico t Sesgo Curtosis Jarque Bera 10 5,6 2,319003617 5,377777778 0,733333333 7,636363636 Pruebas de Hipotesis Significancia a 1 cola -0,058802684 -0,064415113 0,948639697 -1,11811742 -0,488540664 0,62516693 0,526673995 0,526673995 0,768482877

Las frmulas usadas en cada caso se muestran a continuacin:

5

1.3. GRAFICOS DE PROBABILIDAD NORMALLos grficos de probabilidad normal (normal probability plot) son una tcnica grfica para valorar si los datos son o no aproximadamente normalmente distribuidos. Los datos son graficados contra una distrinucin normal terica de tal forma que los puntos deben formar aproximadamente una lnea recta. Las desviaciones de la lnea recta indican desviaciones de la normalidad. El grfico de probabilidad normal es un caso especial de los grficos de probabilidad. Existen varios tipos de grficos de probabilidad normal 1. Aqu nos referimos solamente al tipo ms simple de ellos: Percentiles vs Datos.

Los pasos para construir un grfico de probabilidad normal son: 1. 2. Las observaciones son rankeadas (ordenadas) de la menor a la mayor, x(1), x(2), . . ., x(n). Las observaciones ordenadas x(j) son graficadas contra su frecuencia acumulativa observada, tipicamente; j/(n + 1)) sobre un grfico con el eje Y apropiadamente escalado para la distribucin hipotetizada. Si la distribucin hipotetizada describe adecuadamente los datos, los puntos graficados se ubican aproximadamente sobre una lnea recta. Si los puntos se desvan significativamente de la linearecta, especialmente en las puntas, entonces la distribucin hipotetizada no es apropiada.

3.

1

Vease por ejemplo www.itl.nist.gov/div898/handbook/eda/section3/probplot.htm.

6

4.

Para valorar la cercana de los ountos a la lnea recta, la prueba del grosor de un lpiz se usa comunmente. Si todos los puntos se encuentran dentro del lapis imaginario, entonces la distribucin hipotetizada es probablemente la apropiada.

Ejemplo: Los siguientes datos representan el grosor de una hoja plstica, en micrones: 43, 52, 55, 47, 47, 49, 53, 56, 48, 48Ordered data Rank order Cumulative Frequency (j) ( j/(n + 1)) 43 1 1/11 = .0909 47 2 2/11 = .1818 47 3 3/11 = .2727 48 4 4/11 = .3636 48 5 5/11 = .4545 49 6 6/11 = .5454 52 7 7/11 = .6363 53 8 8/11 = .7272 55 9 9/11 = .8181 56 10 10/11 = .9090

Los datos ordebados son graficados contra su respectiva frecuencia acumulada. Note como el eje Y es escalado tal que una lnea recta resultar para datos normales.

Basados en el grfico, parece que los datos se encuentran normalmente distribudos. Sin embargo se requieren otras pruebas estadsticas para concluir que el supuesto de normlidad es apropiado.

7

En Excel puede obtenerse este grfico en Herramientas / Analisis de Datos / Regresion / y all seleccionando la opcion Grafico de probabilidad normal. Para el caso de la serie 'Capital' del ejemplo que se ha estado analizando, se tiene el siguiente resutado a partir de Excel.

8

1.4. HISTOGRAMAUn histograma es un grfico para la distribucin de una variable cuantitativa continua que representa frecuencias mediante el volumen de las reas. Un histograma consiste en un conjunto de rectngulos con (a): bases en el eje horizontal, centros en las marcas de clase y longitudes iguales a los tamaos de los intervalos de clase y (b): reas proporcionales a las frecuencias de clase. Si en la distribucin se toman clases de la misma longitud, las frecuencias son proporcionales a las alturas de los rectngulos del histograma ya que el rea se obtiene multiplicando la base por la altura por lo que queda similar a un diagrama de barras, solo que ahora las barras van una junto a otra por tratarse de una variable continua. En Excel, la herramienta para histogramas se encuentra en Herramientas / Anlisis de Datos / Histograma. Antes de ejecutarla se puede (es opcional) definir el 'Rango de Clases', a fin de definir las divisiones para cada rango del histograma. El 'Rango de Clases' son valores lmite que definen rangos de clase, los que debern estar en orden ascendente. Si se omite el rango de clase, Excel crear un conjunto de clases distribuidas uniformemente entre los valores mnimo y mximo de los datos. Ejemplo: En el ejemplo de la serie 'Capital' un histograma es obtenido de la siguiente forma:

9

Histograma3,5 120,00%

3

100,00%

2,5 80,00%

Frecuencia

2 60,00% 1,5 Frecuencia % acumulado

40,00% 1

0,5

20,00%

0 2 4,333333333 Clase 6,666666667 y mayor...

0,00%

10

1.5. OPERACIONES CON ESCALARES Y MATRICESExcel permite realizar operaciones matriciales con facilidad. En Excel, las frmulas que hacen referencia a matrices se encierran entre corchetes {}. Al trabajar con matrices en Excel hay que tener en cuenta lo siguiente: No se puede cambiar el contenido de las celdas que componen la matriz No se puede eliminar o mover celdas que componen la matriz No se puede insertar nuevas celdas en el rango que compone la matriz

a) Crear una frmula matricialUna frmula matricial es una frmula que lleva a cabo varios clculos en uno o ms conjuntos de valores y devuelve un nico resultado o varios resultados. Las frmulas matriciales se encierran entre llaves { } y se especifican presionando CTRL+MAYS+ENTRAR. Cuando se introduce una frmula matricial Microsoft Excel inserta de forma automtica la frmula entre llaves ({}).

b) Calcular un nico resultadoPuede utilizar una frmula matricial para realizar varios clculos que generen un nico resultado. Este tipo de frmula matricial permite simplificar un modelo de hoja de clculo sustituyendo varias frmulas distintas por una sola frmula matricial. Por ejemplo, la siguiente calcula el valor total de una matriz de precios de cotizacin y acciones, sin utilizar una fila de celdas para calcular y mostrar los valores individuales de cada cotizacin.

- Haga clic en la celda en que desee introducir la frmula matricial (en B5). - Escriba la frmula matricial. Cuando se escribe la frmula ={SUMA(B2:C2*B3:C3)} como frmula matricial, se multiplica las acciones y el precio correspondiente a cada cotizacin, y luego se suma los resultados de estos clculos. - Presione CTRL+MAYS+ENTRAR.

c) Calcular varios resultados- Seleccione el rango de celdas en que desee introducir la frmula matricial. - Escriba la frmula matricial. Por ejemplo, dada un serie de tres cifras de ventas (columna B) para una serie de tres meses (columna A), la funcin TENDENCIA determinar los valores de la lnea recta para las cifras de ventas. Para mostrar todos los resultados de la frmula, se escribe en tres celdas en la columna C (C1:C3). Al introducir la frmula =TENDENCIA(B1:B3,A1:A3) como frmula matricial, generar tres resultados separados (22196, 17079 y 11962) basados en las tres cifras de ventas y en los tres meses.

11

Presione CTRL+MAYS+ENTRAR.

d) Operaciones MatricialesExisten una serie de operaciones matriciales en Excel, siendo las ms usadas las siguientes: MDETERM Devuelve la matriz determinante de una matriz MINVERSA Devuelve la matriz inversa de una matriz MMULT Devuelve la matriz producto de dos matrices Vemos un ejemplo para el caso de una multiplicacin. - Seleccione el rango de celdas en que desee introducir la frmula matricial. Para esto debe calcularse la dimensin resultante de la operacin matricial. Por ejemplo, si se multiplican dos matrices de dimensiones 2x3, y 3x4 respectivamente, las celdas de la formula matricial que deben seleccionarse es de dimensin 2x4.

Presione CTRL+MAYS+ENTRAR. Con esto se tiene la matriz resultante, dada por:

19 29

28 42

44 66

46 69

12

1.6. DISTRIBUCIONES DE PROBABILIDADEn econometra, para efectos de inferencia acerca de los coeficientes estimados, es necesario trabajar con un nmero de distribuciones de probabilidad. A continuacin recordamos las ms importantes: la distribucin Normal, Chi-cuadrado, t y F. La siguiente es la funcin de densidad normal para una variable aleatoria X con una distribucin normal con media y varianzas 2:

f (x / , 2 ) =

1 1 SCErrt EXP 2 2 2

donde SCErr representa la suma cuadrada de errores, es decir de desviaciones respecto a la media. Cuando se tienen n variables aleatorias normales Z distribuidas independiente e idnticamente, entonces la distribucin conjunta multivariada con media y matriz de covarianza 2 es:

g ( x) = 2 n / 2

1/ 2

1 EXP ( x )' 1 ( x ) 2

Si Z es una variable aleatoria normal estndar ( Z

N (0,1) ), entonces puede mostrarse que:

1)

t (r ) =

Z

2 (r )r

Es decir, una variable aleatoria normal estndar dividida por la raz cuadrada de una variable aleatoria chi cuadrada con r grados de libertad dividida por r, se distribuye como una t con r grados de libertad (gl).

2 (r1)2)

F (r1, r 2) =

r1 ( r 2)2

r2Es decir, una variable F con r1 gl en el numerador y r2 gl en el denominador corresponde a una chi-cuadrada con r1 gl dividida por r1, dividida por otra chi-cuadrada con r2 gl dividida por r2. 3)

Z2

2

(1)

Es decir, una variable aleatoria normal estndar al cuadrado se distribuye chi-cuadrado con 1 grado de libertad. 4)2

Z 12 + Z 22 + ... + Z n2

2

( n)

No confundir el smbolo de la matriz de covarianza , con el operador de sumatorias.

13

Es decir, la suma de n variables aleatorias normales estndar al cuadrado se distribuye chicuadrado con n grados de libertad. Este resultado puede generalizarse cuando se trata de variables normales no estandarizadas

X N ( , ) :

( X )' 1 ( X ) 2 (n)

14

1.7. POTENCIA DE UN TESTHay dos formas en que un test nos puede llevar a cometer un error: Error del tipo I: Rechazar Ho cuando es verdadera, y Error del tipo II: No rechazar Ho cuando es Falsa.

El punto es que en la prctica no es posible hacer ambos errores arbitrariamente pequeos, pues reduciendo la probabilidad de cometer un error aumenta la probabilidad de cometer el otro error. Sin embargo es ms grave el Error del tipo I que el Error del tipo II: es peor condenar a una persona inocente que dejar libre a un culpable, y por este motivo se trata que la magnitud del error del tipo I sea fijado usualmente a un valor pequeo, es decir queda bajo control del analista: Error tipo I : Rechazar Ho cuando es verdadera (gravsimo) Error tipo II: No rechazar Ho cuando es Falsa (grave) P(Error tipo I) = = Tamao del test (size) o nivel de significancia. P(Error tipo II) =

La forma de medir la calidad de un test estadstico es a travs de su potencia. La Potencia de un test es la probabilidad de que correctamente rechacemos Ho cuando es falsa (la probabilidad de detectar que Ho es falsa).

Potencia = 1 = 1 P ( Error tipo II )Un test perfecto tendr una potencia de 1.0, pues siempre llevar a una decisin correcta. Esto puede lograrse, para un nivel dado de significancia, cuando el tamao de la muestra aumenta (a infinito). As, la evaluacin de un buen test debe hacerse en base a su funcin de potencia. En general el procedimiento ptimo es seleccionar con anticipacin el tamao mximo del error del tipo I que podemos aceptar, y despus se intenta construir una prueba que minimice el tamao del error del tipo II. Cuando Ho es falsa, la potencia puede ser calculada asumiendo varios valores crticos para el parmetro desconocido.

15

1.7.1. APLICACIN: SELECCIN ENTRE TESTS ALTERNATIVOSEn el siguiente ejemplo =1.4 (desviacin estndar), T=25 (nmero de observaciones); y se desea probar la hiptesis Ho:=10 versus H1:>10. Asumiendo que se desea un tamao de error () de hasta 0.06, escogeremos entre 3 distintas regiones crticas a una cola, sabiendo que las medias muestrales son: Prueba A: 10.65, Prueba B: 10.45 y Prueba C: 10.25. Para las diferentes medias muestrales verificamos el cumplimiento del tamao del test requerido: P(Error Tipo I)==Tamao del test P[z> (10.65-10)/0.28 3]=P[z>2.32]=0.0102 P[z> (10.45-10)/0.28]=P[z>1.61]=0.0537 P[z> (10.25-10)/0.28]=P[z>0.89]=0.1867 (no cumple)

A B C

Repitiendo para diferentes valores supuestos de calculamos la potencia del test: =10.4 =10.2 =11.0 Potencia Potencia Potencia 0.19 0.05 0.89 0.43 0.98 0.19

A B

P(Error Tipo II) con =10.4 P[z> (10.65-10.4)/0.28]=P[z0.89]=0.8133 P[z> (10.45-10.4)/0.28]=P[z0.18]=0.5714

Luego: Al aumentar el tamao del error del tipo I de 0.0102 a 0.0537, el error del tipo II disminuye de 0.8133 a 0.5714, y viceversa (no es posible eliminar ambos errores). Puesto que puede tolerarse un error del tipo I de 0.06, entonces la prueba B es mejor que la A, debido a que su potencia es mayor para distintos valores de . El anlisis de potencia permite determinar el tamao muestral apropiado para cumplir ciertos niveles predefinidos de y .

3

Recuerde que el error estndar para la media en este caso se 1.4/(25)**0.5=0.28

16

1.8. NIVEL DE SIGNIFICANCIA MARGINAL: CDF O P-VALUEHemos dicho anteriormente que la magnitud del error del tipo I queda bajo el control del analista, quien lo fija en un valor relativamente pequeo, usualmente 5%. As, la probabilidad de cometer un error del tipo I es justamente el Nivel de Significancia Marginal (NSM). Decimos que un resultado es estadsticamente significativo cuando el NSM es menor que el nivel deseado (generalmente 5%), es decir se tiene suficiente evidencia para rechazar Ho. Si es mayor, entonces es estadsticamente no significativo (no podemos rechazar Ho). Es decir, bajos niveles de P llevan a rechazar Ho.

1.8.1. Distribucin NormalExcel entrega los valores crticos de la normal acumulando la probabilidad de izquierda a derecha y a 1 cola (ej. si decimos al 5%, asignar 5% en 1 cola, la cola izquerda).Ejemplo: El valor crtico a 2 colas al 95% es:

=DISTR.NORM.ESTAND.INV(0,975) = 1,95996

Ejemplo (significancia): Si el valor Z calculado es 2,0, entonces la significancia (p-value) es: =DISTR.NORM.ESTAND(2) = 0,97724987 Sin embargo en este caso es ms conveniente leer la significancia como =1-DISTR.NORM.ESTAND(2) = DISTR.NORM.ESTAND(-2) = 0,0228. Puesto que 0,0228 es < que 5%, se rechaza Ho a 2 colas y tambin a 1 cola.

17

1.8.2. Distribucin tExcel solo puede entregar los valores crticos de la t de la derecha (los positivos), y lo hace acumulando la probabilidad de derecha a izquierda a 2 colas (ej. si decimos al 5%, distribuir 2,5% en cada cola). DISTR.T.INV(probabilidad de 2 colas;grados_de_libertad) Ejemplo: los valores crticos de la t con 4 gl, y al 95% a 2 colas son: -2,776 y 2,776 =DISTR.T.INV(0,05;4) = 2,776 Nota: Puede obtenerse un valor t crtico de 1 cola reemplazando p por 2*probabilidad.

Ejemplo (significancia): Si el valor t calculado es 3,69, con 4 gl, y al 95% a 2 colas, entonces la significancia (p-value) es: =DISTR.T(3,69;4;2) = 0,02101873 lo que implica que Ho es rechazado al 2,1% (a 2 colas), y tambin al 5%. Es importante notar que la funcin =DISTR.T(.) no acepta argumentos negativos, es decir, solamente puede buscarse la significancia en el lado derecho de la distribucin.

18

1.8.3. Distribucin FExcel entrega los valores crticos de la F acumulando la probabilidad de derecha a izquierda y a 1 cola. DISTR.F.INV(probabilidad de 1 cola;gl Num;gl Denom) Ejemplo: El valor crtico de una F(1,4) a 1 cola al 95% es: =DISTR.F.INV(0,05;1;4) = 7,70864742

Ejemplo (significancia): Si el valor F(3,30) calculado es 3,0, entonces la significancia (p-value) a 1 cola es: =DISTR.F(3;3;30) = 0,04606 lo que implica que Ho es rechazado al 5% a 1 cola.

19

1.8.4. Distribucin Chi cuadradoExcel entrega los valores crticos de la Chi acumulando la probabilidad de derecha a izquierda y a 1 cola. PRUEBA.CHI.INV(probabilidad;grados_de_libertad) Ejemplo: El valor crtico de la Chi cuadrado con 10 grados de libertad a 1 cola, al 95% es: =PRUEBA.CHI.INV(0,05; 10) = 18,307

20

1.9. PRUEBAS SOBRE LA MEDIA EN EXCEL1.9.1. Inferencia respecto a una MediaEjemplo: Se tiene informacin de produccin de 10 empresas. Un intervalo de confianza al 95% para la media de la produccin en Excel se desarrolla como sigue:

Sabemos que se trata de 9 grados de libertad, por lo que: a) el estadstico t es = DISTR.T.INV(0,05;9) = 2,262 b) el error tpico de la media es = desvest()/Raiz(10) = 20,29477/Raiz(10) = 6,41777 Y el intervalo viene dado por = (Media +/- 2,262*6,41777) = (88,9 +/- 14,518). Es decir, (74,382 ; 103,418). En Excel, aparece en la ltima fila:PRODUCCION Media Error tpico Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango Mnimo Mximo Suma Cuenta Nivel de confianza(95,0%) 88,9 6,417770468 90 #N/A 20,29477218 411,8777778 -1,230556217 -0,154506756 61 57 118 889 10 14,5180054

Note que al aumentar la confianza, se ampla el Intervalo de Confianza (verifquelo).

21

1.9.2. Diferencia de dos Medias (Univariado)Para comparar 2 grupos de datos, se tienen bsicamente dos enfoques: - Datos son Normales: Test t - Datos solo tienen una distribucin ordinal (no paramtrica): Test U y Test de Wilcoxon) A continuacin nos referiremos solamente a las comparaciones del primer tipo. El estadstico:

Z =

X Y ( 1 2 )

2 1

m

+

2 2

N (0,1)

n

Ejemplo: El anlisis de una muestra de m = 20 personas arroj una edad media de 29.8 aos. Una segunda muestra de n = 25 tuvo un promedio de 34.7 aos. Las distribuciones de la edad son normales con

1 = 4.0 y 2 = 5.0. Son las edades diferentes: Ho:1=2? Realice el test con un = 0.01

Solucin: Ho: 1 - 2, test de dos colas: Zona de rechazo: +/- 2.58

Z =

29.8 34.7 4.9 = 3.65 16 25 1.3416 + 20 25

se rechaza Ho las edades son diferentes.

IC es (-4.9 +/- 2.58*1.3416) = (-4.9 - 3.46 , -4.9 + 3.46) = (-8.36 , -1.43) puesto que 0 se ubica fuera del IC, la diferencia de edades es significativamente diferente de cero (los promedios de cada grupo son diferentes). Ejemplo: Se realizaron test de resistencia en dos tipos de alambres:Tamao de la muestra M = 129 N = 129 Media

Kg mm 2

Desviacin Estndar S1 = 1.3 S2 = 2.0

X = 107.6 Y = 123.6

1 - 2 = 107.6 123.6 1.96

(1.3)2129

+

(2.0)2129

= -16 0.4116 = (-16.4116; -15.5884)

Conclusiones:

2 > 1. 2 es aproximadamente 16

Kg mm 2

ms grande que 1

22

Problema de Behrens-Fisher La solucin ms simple al caso de varianzas desiguales es llamada la aproximacin a la t de Welch, la que corrige los grados de libertad de la t como sigue:2 s12 s 2 + n n gl = 12 2 2 2 s2 s12 n 1 + n2 n1 1 n2 1 2

El resultado puede ser no entero, y entonces se lo aproxima al entero ms cercano.

1.9.3. Inferencia En ExcelEjemplo: Supngase que se desea comparar las medias de salario inicial de los dos grupos de trabajadores (474 observaciones) definidos por la variable sexo (h=hombres y m=mujeres). Employee data.xls a) Varianzas Conocidas: Prueba Z para medias de dos muestras. Debe ingresarse las varianzas conocidas. b) Varianzas Desconocidas. Prueba t para dos muestras suponiendo varianzas iguales. (Muestras Independientes)Prueba t para dos muestras suponiendo varianzas iguales Variable 1 13091,9676 8617742,74 216 49131619 0 472 -11,1523866 4,2491E-26 1,64808834 8,4981E-26 1,96500259 Variable 2 20301,3953 83024550,6 258

Media Varianza Observaciones Varianza agrupada Diferencia hipottica de las medias Grados de libertad Estadstico t P(T