33
REGRESIÓN Y CORRELACIÓN COMPETENCIAS Entender el concepto de regresión y correlación Aplicar correctamente los diferentes modelos de regresión Interpretar los parámetros de los modelos de regresión INTRODUCCIÓN El análisis de regresión es útil para averiguar la forma probable de la relación de las dos variables (directa, inversa) y al mismo tiempo se utiliza para estimar un valor desconocido de la una de las variables. El objeto final de la regresión es predecir o estimar el valor de una variable dependiente (Y), correspondiente a un valor dado para una O MAS variable independiente (X). La correlación se refiere a la medición de la intensidad (fuerza) de relación entre las variables. Cuando se calcula la medida de correlación a partir de un conjunto de datos, el interés se centra en el grado de en que se relacionan las dos variables. 5.1. EL MODELO DE REGRESIÓN LÌNEAL SIMPLE Como se dijo anteriormente el análisis de regresión establece la relación cuantitativa (en forma de ecuación) entre variables. Cuando se analizan dos variables que posiblemente se relacionen se denomina regresión, y sí su tendencia es aproximadamente lineal, entonces nos encontramos con un modelo de regresión lineal simple. Cuando se ha establecido la relación, es posible predecir el valor de una de las variables, si se conoce el valor de la otra variable. La variable que se predice se denomina dependiente y se nota como Y, en tanto que la variable conocida se denomina independiente y se designa como X. 1

REGRESIÓN Y CORRELACIÓN

Embed Size (px)

DESCRIPTION

estadística descriptiva

Citation preview

Page 1: REGRESIÓN Y CORRELACIÓN

REGRESIÓN Y CORRELACIÓN

COMPETENCIAS

Entender el concepto de regresión y correlación Aplicar correctamente los diferentes modelos de regresión Interpretar los parámetros de los modelos de regresión

INTRODUCCIÓN

El análisis de regresión es útil para averiguar la forma probable de la relación de las dos variables (directa, inversa) y al mismo tiempo se utiliza para estimar un valor desconocido de la una de las variables. El objeto final de la regresión es predecir o estimar el valor de una variable dependiente (Y), correspondiente a un valor dado para una O MAS variable independiente (X).

La correlación se refiere a la medición de la intensidad (fuerza) de relación entre las variables. Cuando se calcula la medida de correlación a partir de un conjunto de datos, el interés se centra en el grado de en que se relacionan las dos variables.

5.1. EL MODELO DE REGRESIÓN LÌNEAL SIMPLE

Como se dijo anteriormente el análisis de regresión establece la relación cuantitativa (en forma de ecuación) entre variables. Cuando se analizan dos variables que posiblemente se relacionen se denomina regresión, y sí su tendencia es aproximadamente lineal, entonces nos encontramos con un modelo de regresión lineal simple. Cuando se ha establecido la relación, es posible predecir el valor de una de las variables, si se conoce el valor de la otra variable. La variable que se predice se denomina dependiente y se nota como Y, en tanto que la variable conocida se denomina independiente y se designa como X.

Cuando se dispone de los datos necesarios para determinar la relación que existe entre las dos variables, puede ser establecida gráficamente o matemáticamente (método de los mínimos cuadrados).

El método gráfico consiste en elaborar un figura de puntos (este se denomina nube de puntos o diagrama de dispersión en la figura 5.1). Con los datos reales y al tanteo se puede determinar la mejor recta que ajusta los datos de la muestra real y además permite al investigador ver la relación entre las dos variables. Con los datos de la tabla 5.1 se elabora la figura 5.1.

1

Page 2: REGRESIÓN Y CORRELACIÓN

Tabla 5.1. Ingresos y Gastos mensuales de seis administradores de empresas. (en millones de pesos).

Ingresos Gastos4 2.0

5 2.56 3.07 3.5

8 4.0

9 5.0X Y

2

Page 3: REGRESIÓN Y CORRELACIÓN

Elaborando la gráfica y utilizando el método gráfico, en la figura No. 5.2. las mejores rectas que se ajustan puede ser la recta M1 o la recta M2, etc. es decir de acuerdo al investigador traza la recta que él cree que más se ajusta a los datos. Este método no es muy exacto.

5.1.1 El método de los mínimos cuadrados

Es el método común para obtener la recta que más se ajusta a los datos de la muestra. El método de los mínimos cuadrados parte del principio de que: "la mejor recta que se ajusta a los datos es aquella que minimiza las diferencias de los cuadrados entre los valores observados y los valores estimados."

, donde Y = valor real

Bajo este principio reemplazando en la fórmula anterior el valor estimado por la ecuación de la línea recta Y= ß0 + ß1X e igualando a cero la igualdad, luego derivando parcialmente con respecto a X y luego con respecto a Y, se obtiene la siguiente ecuación y formulas:

Y = ßo + ß1 X donde; Y = Variable dependiente X = Variable independienteßo = Valor autónomo o independiente ß1 = Coeficiente de regresión (pendiente)

En general para hallar la recta, se conoce los valores X, Y, y se desconocen ß o y B1. Para interpretar los parámetros betas se deben tener en cuenta el signo y sí:ß1 > 0. Por cada unidad que aumenta la variable X, la variable independiente Y aumenta en ß1 .ß1 < 0. Por cada unidad que disminuye (aumenta) la variable dependiente X, la variable independiente Y aumenta (disminuye) en ß1. ßo. Es el valor inicial que toma la variable X.

3

Page 4: REGRESIÓN Y CORRELACIÓN

Nota: Para determinar un análisis de regresión se deben seguir los siguientes pasos:

Conocer valores para las variables X, Y. Graficar los datos para determinar aproximadamente la tendencia. Escribir el modelo (lineal, exponencial, parabólico) según la tendencia

vista en paso anterior. Determine los parámetros betas por medio de las ecuaciones normales

o formulas que se deducen de las ecuaciones normales. Justificar el modelo. Uno de los métodos aproximado y no muy potente

es hallar el coeficiente de determinación. Realice las estimaciones solicitadas.

Ejemplo. Estimar el gasto mensual de los Administradores de Empresas que cuenta con un salario mensual de $1.850.000. Para estimar el gasto se cuenta con la información de la tabla 5.2.:

Tabla 5.2. Ingresos y Gastos mensuales de seis administradores

de empresas (en millones de pesos).Ingresos Gastos

4 2.0

5 2.56 3.07 3.5

8 4.0

9 5.0X Y

SOLUCION:

A. Los datos tienen una variable dependiente Y = gasto mensual (millones de pesos), y la variable independiente X = ingreso mensual (millones de pesos).

B. Graficar los datos. Observando la tendencia es aproximadamente una tendencia lineal (figura 5.1)

C. La ecuación a determinar es: Y = ßo + ß1 X

D. Determinar los parámetros betas utilizando la formula o la calculadora

Se obtiene la ecuación de regresión : Y = -0.36 + 0.57XInterpretación: B1 = 0.57 "Por cada millón de pesos que tenga de ingreso mensual los administradores de empresas, los gastos mensuales aumentará en $570.000."

La ecuación anterior se reemplaza los valores reales de X para obtener los Y

estimados . Los datos resultantes se presentan en la tabla 5.4 y figura 5.3.

4

Page 5: REGRESIÓN Y CORRELACIÓN

Tabla 5.4. Gastos mensuales estimados de los administradores de

empresas Ingresos X Gastos Y

4 2.0 1.915 2.5 2.48

6 3.0 3.05

7 3.5 3.628 4.0 4.19

9 5.0 4.76

Para estimar el valor solicitado, debemos justificar el modelo determinando sí la variable independiente en que porcentaje participa explicando las variaciones de la variable Y. Uno de los métodos menos potentes para justificar el modelo es calculando el coeficiente de determinación. Otro método es el de calcular el error estándar de estimación.

5.1.2. Error Estándar de la estimación. sy,x

Mide la diferencia entre los valores reales (y) y los valores estimados por el modelo lineal.

El error estándar de la estimación se utiliza para medir la variabilidad entre los valores observados en la muestra y los valores estimados por el modelo. En otras palabras entre más pequeño sea Sy,x mucho mejor es el modelo para realizar los pronósticos. Como ejemplo se determina el Sy,x para los ingresos y gastos de los administradores de empresas. Para determinar Sy,x elaborar la tabla 5.5.

Tabla 5.5. Calculo de la sumatoria para determinar sy,x X Y

4 2.0 1.91 0,00815 2.5 2.48 0,00046 3.0 3.05 0,00257 3.5 3.62 0,01448 4.0 4.19 0,03619 5.0 4.76 0,0576

Total   0,1191

Reemplazando en la formula:

5

Page 6: REGRESIÓN Y CORRELACIÓN

0

1

2

3

4

5

6

1 2 3 4 5 6

Y

Y estimado

Figura 5.3. Recta estimada

5.1.3. Correlación lineal simple

La correlación mide el grado o intensidad con que se relacionan las variables. Este coeficiente de correlación notado por “r” es importante porque determina sí el modelo hallado es el que más se ajusta a los datos.

El coeficiente de correlación ” r” puede tomar cualquier valor entre -1 y +1, inclusive. Un r igual a -1 o a +1 indica correlación perfecta (el signo indica sí la relación es directa o inversa).

Sí hay poca correlación, el r debe ser cercano a cero, lo cual indica que la relación es poco intensa o débil. Si r se acerca a – 1 o a +1 indica que hay una alta o fuerte correlación entre las variables.

El concepto de muy fuerte o muy débil del r, no tiene un significado preciso. Una medida que tiene significado más exacto es el COEFICIENTE DE DETERMINACION r², y se calcula, elevando el coeficiente de correlación al cuadrado. La interpretación del r² es; es el porcentaje de la variación de la variable dependiente Y que queda explicada por las variaciones de la variable independiente X. El coeficiente de determinación se calcula utilizando la siguiente formula.

Nota1 : Se considera que el modelo teórico se ajusta a la información cuando r2

> 0.75.

Nota 2. A la raíz cuadrada del coeficiente de determinación se denomina el coeficiente de correlación y se nota por " r ".

6

Page 7: REGRESIÓN Y CORRELACIÓN

Ejemplo. Determine sí el modelo anteriormente hallado para los ingresos y gastos de los administradores de empresas es adecuado para realizar las estimaciones.

SOLUCION: El modelo determinado es: Y = -0.37 + 0.57X calculando con la formula anterior o la calculadora

Interpretación: El 97.6% de las variaciones de los ingresos mensuales de los administradores de empresas son explicados por las variaciones de los gastos mensuales que tienen. Con base al criterio que la ecuación anteriormente hallada (Y=-0.37+ 0.57X )

sirve para realizar estimaciones ( ) entonces hay que dar respuesta a la

pregunta que dice: “Estime el gasto mensual de los administradores de empresas que cuenta con un salario mensual de $1.850.000”. Reemplazando la

ecuación Y=-0.37+ 0.57X . Significa

que cuando un administrador de empresas tiene un ingreso mensual de $1.850.000 se estima que el gasto mensual es de $1.414.500.

NOTA: Cuando una variable es tratada a través del tiempo, la variable tiempo la consideran como independiente (X), al primer periodo (mes, día, año, etc.) Asignar el valor de cero y a cada mes, día, año, siguiente se le aumenta una unidad.

7

Page 8: REGRESIÓN Y CORRELACIÓN

CAPÍTULO VI

REGRESIÓN Y CORRELACIÓN LÍNEAL MULTIPLE .

MODELOY = ß0 + ß1 X1 + ß2 X2 + ß3 X3 +...+ ßK XK

INTERPRETACION DE LOS PARAMATROS BETASß1 > 0. Por cada unidad que aumente la variable dependiente X1, entonces la variable dependiente Y aumenta en ß1, sí se mantiene constante X2. X3 X4…………… Xk ß1 < 0. Por cada unidad que disminuya (aumente) X1, entonces la variable dependiente Y aumenta (disminuye) en ß1, sí se mantiene constante X2. X3 X4…………… Xk ß2 > 0. Por cada unidad que aumente la variable dependiente X2, entonces la variable dependiente Y aumenta en ß2, sí se mantiene constante X1. X3 X4…………… Xk ß2 < 0. Por cada unidad que disminuya (aumente) X2, entonces la variable independiente Y aumenta (disminuye) en ß2, sí se mantiene constante X1. X3 X4…………… Xk

COEFICIENTE DE DETERMINACION MULTIPLE R2

8

Page 9: REGRESIÓN Y CORRELACIÓN

Interpretacion: es el porcentaje de la variación total de Y que es explicada por las variacionmes de X1

, X2 , X3 …………… XK

Ejemplo

9

Page 10: REGRESIÓN Y CORRELACIÓN

LA MATRIZ DE CORRELACIÓN

VARIABLE Y X1 X2 X3 X4

Y ry.y ry.1 ry.2 ry.3 ry.4 X1 ry.1 r1.1 r1.2 r1.3 r1.4 X2 ry.1 r2.1 r2.2 r2.3 r2.4 X3 ry.1 r3.1 r3.2 r3.3 r3.4 X4 ry.1 r4.1 r4.2 r4.3 r4.4

Figura 7.1. Matriz de correlación.

Y X1 X2 X3 Y 1 0.28 0.83 0.94 X1 0.28 1 -0.25 0.32 X2 0.83 -0.25 1 0.76 X3 0.94 0.32 0.76 1

Figura 7.2. Matriz de correlación para un modelo de 4 variables.

El modelo para esta matriz de correlación es: Y = ß0 + ß1 X1 + ß2 X2 + ß3 X3

En la figura 7.2 el coeficiente de correlación parcial entre la variable x2 y x3

notado por r23=0.76. En la figura 7.2 , las posibles variable independientes predictora son las 2 y la 3. Entonces el modelo es: Y= ß0 + ß3 X3 + ß4 X4 ya que la variable X1 no se incluye en el modelo por tener un coeficiente de correlación bajo (r2.1).

7.2 MULTICOLÍNEALIDAD

La multicolínealidad aparece cuando hay una alta correlación entre dos variables independientes en un modelo de regresión lineal múltiple.

De acuerdo a la matriz de correlación y a la multicolínealinidad se concluye que para seleccionar variables predictoras debe tener en cuenta:

la variable predictora debe tener una alta correlación con la variable dependiente.

10

Page 11: REGRESIÓN Y CORRELACIÓN

Las variables independientes no debe estar altamente correlacionadas.

Y X1 X2 X3

Y 1 0.28 0.83 0.94 X1 0.28 1 -0.25 0.32 X2 0.83 -0.25 1 0.76 X3 0.94 0.32 0.76 1

Figura 7.3. Matriz de correlación para un modelo de 4 variables.

De acuerdo a los dos criterios anteriores las variables independientes que se deben tener en cuenta para el modelo definitivo es X3, ya que X1 no se tiene en cuenta por tener una baja correlación con la variable dependiente Y (r2.1), y X3

por tener una alta correlación con X2.

EJERCICIOS SECCIÓN 7

ejemplo La siguiente matriz es de correlación: a) ¿Cuáles variables de predicción son buenas para el modelo? b) ¿Existen problemas de multicolinealidad en este ejemplo? c) ¿Qué variables deben incluirse en el modelo final?

Y 1 2 3 4 5 6 Y 1 0.83 0.44 -0.79 0.78 -0.90 0.88 1 0.83 1 0.32 -0.22 0.54 -0.33 0.28 2 0.44 0.32 1 0.04 0.88 0.53 0.32 3 -0.79 -0.22 0.04 1 0.03 0.35 0.28 4 0.78 0.54 0.88 0.03 1 0.87 0.11 5 -0.90 -0.33 0.53 0.35 0.87 1 0.16 6 0.88 0.28 0.32 0.28 0.11 0.16 1

11

Page 12: REGRESIÓN Y CORRELACIÓN

CAPÍTULO VIII.

SERIES CRONOLÓGICAS

8.1 CONCEPTOS GENERALES Se entiende como serie cronológica (tiempo) una colección de datos la cuál se clasifican a través del tiempo. Algunos ejemplos son:

Total de empleados en la industria petrolera en Colombia durante el período 1970-2008

Producto interno Bruto del país 1975-2008. Producción agropecuaria en el departamento del Huila 1980 - 2008. Dinero en circulación de un país X, 1972-2007. Producción mensual de arroz en el departamento del Huila 1987 - 2008.

Figura 8.1. Representación gráfica de las series cronológicas.

8.2 NATURALEZA DE LAS VARIACIONES EN LAS SERIES CRONOLÓGICAS:

12

Page 13: REGRESIÓN Y CORRELACIÓN

Las variaciones de una serie cronológica se clasifican en sistemática y aleatorias. Las variaciones sistemáticas ocurren con regularidad, pudiendo por lo tanto ser medidas estadísticamente y predecirse su ocurrencia futura; por otra parte las variaciones aleatorias son causadas por sucesos aislados como guerras, huelgas, terremotos, etc.; en consecuencia no pueden ser predichas.

Las variaciones sistemáticas se clasifican en: tendencia secular, variaciones cíclicas, variaciones estacionales y las variaciones irregulares.Generalmente una serie cronológica se ve como el resultado de cuatro componentes: la tendencia secular (T), la variación estacional (E), las fluctuaciones cíclicas o movimientos cíclicos (C) y las variaciones irregulares (I).

Al analizar las relaciones de estas componentes, puede formarse un modelo de una SERIE DE TIEMPO que ayudará a separar estas componentes y formular predicciones con respecto de Y. Los modelos de las SERIES DE TIEMPO usualmente son aditivos de la forma Y=T+E+C+I o multiplicativo de la forma Y=TxExCxI.

Donde: Y = valor real de la variable de interésT = tendencia secularE = variaciones estacionalesC = componente estacionalI = componente irregular

Para un modelo aditivo se supone que los cuatro componentes son independientes entre sí, mientras que para el multiplicativo se encuentran relacionadas entre sí. A continuación someramente se explican las componentes y más adelante se tratan profundamente componente por componente.

TENDENCIA SECULAR: Es la componente que se presenta a largo plazo (entre 20 a 100 años) de tiempo que representa el crecimiento o disminución de la serie a largo plazo. Las causas de esta tendencia son; crecimiento de la población, cambio de hábito, cambios tecnológicos, gusto de consumidores e inflación, etc. La tendencia en una gráfica se visualiza mediante un crecimiento o descenso largo y suave ( Figura 8.2).

VARIACIONES ESTACIONALES. Cuando las observaciones en una serie cronológica son hechas en intervalos inferiores a un año (semanas, meses, trimestres). Ellos pueden mostrar variaciones estacionales que se repitan de

13

Page 14: REGRESIÓN Y CORRELACIÓN

la misma manera y con la misma regularidad año tras año. Por ejemplo sí analizan mensualmente una serie de varios años mensualmente , la componente estacional mide la variabilidad de la serie cada enero, cada febrero cada marzo, etc. La figura 8.3. muestra el comportamiento de la cantidad mensual de sillas

Figura 8.3. Cantidad de sillas producidas mensualmente por la fábrica RAM Ltda. 2007-2008

producidas por la empresa Ram en los años 2007 y 2008 (datos hipotéticos). Este es un ejemplo clásico de variación estacional; mientras la producción de sillas ventas se mantienen a un mismo nivel de enero a marzo y mayo a septiembre, en los meses de abril y octubre la producción es alta debido a que esos meses la empresa se prepara para mantener una gran cantidad de inventario para las ventas en junio y diciembre donde hay mayor dinero circulante.

VARIACIONES CÍCLICAS. Son también llamados ciclos. Indican los ascensos y descensos de las actividades, celebradas de un valor normal. Las fluctuaciones cíclicas se observan como fluctuaciones alrededor de la tendencia (ver figura 8.4). Algunos economistas creen por ejemplo, que las actividades comerciales sufren cierto tipo de movimiento oscilatorio cada 12 a 15 años. Durante este período un ciclo completa cuatro fases: prosperidad, recesividad, depresión y recuperación (figura 8.4).

14

Page 15: REGRESIÓN Y CORRELACIÓN

Figura 8.4. Variaciones cíclicas para las ventas de la empresa El Gato. 1940 - 2000

8.2.1. Análisis de la Tendencia Secular (t) La tendencia secular notada por T, describe el movimiento general de una serie cronológica durante un período relativamente largo. Los periodos son entre 10 y 30 en años. Este movimiento en general queda bien descrito mediante una línea recta y otras quedan descritas por tendencias curvilíneas. La más importante tendencia de tipo curvilíneo es la curva exponencial (o del interés compuesto). En esta sección trata de la tendencia lineal.

Para determinar la tendencia existen varias técnicas. A continuación se explican dos métodos para analizar la tendencia: método de la regresión y el método de promedios móviles.

8.2.1.1. Método de Regresión - Modelo Lineal Simple -

Cuando se analizan los datos reales de una muestra en cierta variable y presentan la tendencia, se debe buscar el modelo más aproximado para estimar la tendencia. Como se sabe el modelo puede ser lineal, exponencial, cuadrático, etc. A continuación la formula para estimar una tendencia cuando el comportamiento es lineal:

Y= ßo + ß1X donde Y= Es el valor de tendencia en el período T X= La medida en años, semestres, meses, etc.

Por el método del mínimo cuadrado y despejando los valores para determinar los parámetros ßo y ß1 son:

O se puede utilizar la calculadora.

15

Page 16: REGRESIÓN Y CORRELACIÓN

Ejemplo. Para el consumo de cerveza El Barril (en decenas de millones de canastas) durante el período 2001-2008 de la tabla 8.1, determinar la tendencia si se presenta.

Tabla 8.1. Consumo de cerveza El Barril en el departamento del Huila . 2001-2008 (en decenas de millones de canastas)

Año 2001 2002 2003 2004 2005 2006 2007200

8

Consumo 7.0 7.3 7.5 7.9 8.1 9.1 10.010.9

El primer paso para determinar si hay tendencia o no, es graficando las dos variables. Observando la figura 8.5, parece tener una tendencia lineal. El segundo paso es determinar los valores de ßo y ß1 con las formulas o calculadora para la ecuación Y= ßo + ß1X

Figura 8.5. Consumo de cerveza El Barril en el departamento del

Huila . 2001-2008 (en decenas de millones de canastas)

0

2

4

6

8

10

12

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009

Año

Ca

nsta

s

Utilizando las formulas para los betas o la calculadora, los valores de ßo=6.57 y ß1:0.545

La ecuación queda de la siguiente forma:Y= ßo + ß1X = 6.57 + 0.54 X r2 = 0.92

 Y 7.0 7.3 7.5 7.9 8.1 9.1 10.0 10.9

  6.57 7.11 7.66 8.20 8.75 9.29 9.84 10.38

Como practica graficar los valores de X,Y,

Si a los valores reales (Y) le restamos los valores de tendencia se obtendrá los valores destendenciados. A continuación se muestra la deducción:

16

Page 17: REGRESIÓN Y CORRELACIÓN

Y= T+S+C+I , pero en series anuales no influye las variaciones estacionales, entonces el modelo es: Y-T= C+I. Esta fórmula no da un número que denota los efectos combinados de los componentes cíclicos e irregulares y se presentan en la tabla 8.4

Tabla 8.4. Valores destendenciados AÑO 2001 2002 2003 2004 2005 2006 2007 2008

CONSUMO Y 7 7,3 7,5 7,9 8,1 9,1 10 10,9

TENDENCIA 6,57 7,11 7,66 8,2 8,75 9,29 9,84 10,38

Y - T 0,43 0,19 -0,16 -0,3 -0,65 -0,19 0,16 0,52

8.3 MÉTODO DE PROMEDIO MÓVIL

Es un método sencillo y directo, carece de interés técnico y teórico. No es muy aceptable, porque presenta las siguientes desventajas:

Pierde información en los extremos.

No tiene soporte matemático.

PASOS: Para obtener un promedio móvil de tres años se deben seguir los siguientes pasos:

Calcular los totales móviles de tres años. El procesos es sumar los tres primeros valores del los tres primeros años (7.0+7.3+7.5) y el resultado (21.8) centrarlo en el segundo año. Este es el primer total móvil de tres años. Luego se abandona el valor del primer año y se suma el valor del cuarto año (7.3+7.5+7.9) para formar el segundo total móvil de tres años y este valor (22.7) se centra en el tercer año. El cálculo se continúa hasta el final de la serie (ver tabla 8.5, columna tercera).

Calcular los promedios móviles de tres años, dividiendo cada uno de los totales de tres años, entre tres (ver tabla 8.5).

Tabla 8.5. Consumo de cerveza El Barril en el departamento del Huila. 2001-2008 (en decenas de millones de canastas)

Año Consumo Total móvil Promedio móvil

2001 7.0    

2002 7,3 21.8 7.3

2003 7,5 22.7 7.6

2004 7,9 23.5 7.82005 8,1 25.1 8.4

2006 9,1 27.2 9.1

17

Page 18: REGRESIÓN Y CORRELACIÓN

2007 10 30.0 10.0

2008 10,9    

18

Page 19: REGRESIÓN Y CORRELACIÓN

8.4 VARIACIONES ESTACIONALES (S)

Se presentan regularmente dentro de un año y se repite año tras año. El figura 8.6 puede visualizar la variación estacional. La causa de la presencia de esta variación son las estaciones, época festiva (junio-diciembre). Estas variaciones se presentan en series donde el tiempo puede ser: meses, bimestres, trimestres, etc.

Las variaciones estacionales se pueden aislar en una serie con el fin de poder ver la composición de las series sin presencia de las variaciones estaciónales. También sirve para proyectar racionalmente para cada estación. Al eliminar las variaciones estaciónales, se obtienen los índices estaciónales que son indicadores de la componente estacional. Existen varios métodos para obtener los índices estaciónales:

Método de los promedios simples. Cociente con respecto a promedios móviles. Método de razón con respecto a la tendencia.

De los tres métodos enunciados anteriormente se describe el método de razón con respecto a la tendencia.

8.4.1. Método de razón con respecto a la tendencia

Para determinar los índices estaciónales (IE) se deben seguir los siguientes pasos:a. Determinar la ecuación de tendencia anual para los totales anuales de los años analizados.b. Cambiar de base anual a base mensual.c. Determinar el valor de tendencia mensual para cada mes de la serie.d. Dividir los valores reales de cada mes por el respectivo valor de tendencia.e. Determinar la razón promedio de cada mes.f. Calcule el índice estacional.

Ejemplo. Determine las variaciones estaciónales a los datos de la tabla 8.6.Tabla 8.6. Consumo de cerveza El Halcón en el Huila. 2006- 2008

(en decenas de miles de botellas )Mes 2006 2007 2008

Enero 60.3 72.3 61.3

Febrero 62.4 48.4 63.4

Marzo 68.1 61.8 69.1

Abril 70.6 66.9 71.6

Mayo 70.1 75.4 76.1

Junio 84.3 85.7 99.2

Julio 69.5 71.5 60.5

Agosto 66.2 67.1 70.7

Septiembre 75.4 78.5 74.9

Octubre 76.8 86.2 78.7

19

Page 20: REGRESIÓN Y CORRELACIÓN

Noviembre 75.4 77.4 80.4

Diciembre 115.2 116 102.5

TOTAL 894,3 907,2 908,5

Pasos a seguir. a. Determinar la ecuación de tendencia anual. El consumo anual de cerveza El Halcón es:

AÑO CONSUMO

1986 894.3

1987 907.2

1988 908.5

La ecuación a determinar es: Y= ßo + ß1X. Utilizando la calculadora: Y= 896.23 + 7.1 X r²=0.81b. Cambiar la ecuación a base mensual cuyo origen es enero de 2006. Para determinar la ecuación mensual es:

Origen 2006 junio-julio X= 1 mes Y= consumo

mensual

Origen= 2006 junio 15-julio 15 X=1mes Y= consumo

mensual

Pero hay que llevar el origen a enero:

Entonces la ecuación mensual es: Y= 74.42 + 0.05X Origen: enero de 2006 X= Unidad 1 mes. Y= Consumo mensual.

20

Page 21: REGRESIÓN Y CORRELACIÓN

c. Determinar el valor de tendencia mensual: Para determinar el valor de tendencia mensual se utiliza la ecuación: Y= 74.42 + 0.05X Origen: enero de 2006 X= Unidad de X 1 mes. Y= Consumo mensual.Reemplazando el valor de X ( por 0, 1, 2, 3,…..35) en la ecuación anterior. Los resultados están en la tabla 8.7.

Tabla 8.7. Consumo de cerveza El Halcón en el Huila. 2006- 2008 Valores de tendencia

Mes 2006 2007 2008

Enero 74.42 75.02 75.62

Febrero 74.47 75.07 75.67

Marzo 74.52 75.12 75.72

Abril 74.57 75.17 75.77

Mayo 74.62 75.22 75.82

Junio 74.67 75.27 75.87

Julio 74.72 75.32 75.92

Agosto 74.77 75.37 75.97

Septiembre 74.82 75.42 76.02

Octubre 74.87 75.47 76.07

Noviembre 74.92 75.52 76.12

Diciembre 74.97 75.57 76.17

d. Dividir los valores reales de cada mes por el respectivo valor de tendencia, es decir Y/(T). Los resultados están en la tabla 8.8. Ejemplo: Para enero de 2006 es:

Tabla 8.8. Participación de la tendencia

Mes 2006 2007 2008

Enero 0.81 0.96 0.81

Febrero 0.84 0.64 0.84

Marzo 0.91 0.82 0.91

Abril 0.95 0.89 0.94

Mayo 0.94 1.00 1.00

Junio 1.13 1.14 1.31

Julio 0.93 0.95 0.80

Agosto 0.89 0.89 0.93

Septiembre 1.01 1.04 0.99

Octubre 1.03 1.14 1.03

Noviembre 1.01 1.02 1.06

Diciembre 1.54 1.54 1.35

21

Page 22: REGRESIÓN Y CORRELACIÓN

e. Determinar la razón promedio mensual:Las variaciones aleatorias de la serie se eliminan promediando las tres razones de cada mes. Así para el mes de enero, la media aritmética se calcula sumando los meses de enero de cada año y dividendo por tres ( tabla 8.9, columna 2):

Tabla 8.9. Razón promedio e índice estacionalRazón promedio Índice estacional %

Enero 0.86 86.14

Febrero 0.77 77.13

Marzo 0.88 88.15

Abril 0.93 93.16

Mayo 0.98 98.16

Junio 1.19 119.20

Julio 0.89 89.15

Agosto 0.90 90.15

Septiembre 1.01 101.17

Octubre 1.07 107.18

Noviembre 1.03 103.17

Diciembre 1.47 147.25

Total 11.98 1200.00

Si bien la razón media son medidas satisfactorias para las variaciones estacionales (columna 2, tabla 8.9), no cumple el requisito de que la sumatoria de todos los meses debe ser igual a 12. Para ajustarlo se distribuye el faltante proporcionalmente. ¿Cómo? Doce se divide por el total de la columna de razón media y luego se multiplica esta constante por cada una de las razones medias multiplicada por 100. Como resultado aparece el índice estacional para cada mes (columna 3, tabla 8.9).

Índice para el mes i= Constante * razón media del mes i * 100. Donde:

Por ejemplo para calcular del índice estacional de enero es: Como la constante

es igual a : ,el índice para el mes de

enero es igual a la constante multiplicada por la razón media de enero y por 100.

Índice para el mes de enero=(1,001669449) * 0.86 * 100 = 86.14%

22

Page 23: REGRESIÓN Y CORRELACIÓN

Interpretación del índice estacional: Como cada índice es un porcentaje entonces el promedio del año igual a 100%, cada índice mensual indica el nivel de ventas, producción u otra variable en relación con el promedio anual de 100.0%. Con base a lo anterior el índice del mes de enero (86.14%) de la tabla 8.9 se interpreta de la siguiente forma: El consumo de cerveza El Halcón en el mes de enero esta por lo general 13,86% abajo del promedio de consumo del año en el Huila.

Para el índice del mes de junio se afirma ; que el consumo de cerveza para el mes de junio esta en un 19.20% arriba del promedio del consumo anual de cerveza El Halcón en el Huila (figura 8.7).

8.5 USO DE LOS INDICES ESTACIONALES

Los I.E. se utilizan para estimar las variables para cualquier mes específico. Para estimar el consumo de cerveza El Halcón para marzo de 2009 se siguen los siguientes pasos:a. Determine el valor de la tendencia para el mes específico.b. Multiplique el valor de tendencia (y) para el mes específico por el correspondiente índice estacional del mes (ajuste por estacionalidad).Para nuestro ejemplo, se aplicaran los dos pasos:a. Valor de tendencia para el mes de marzo de 2009 es : aplicando la

ecuación: Origen: enero de

2006 X= Unidad de X 1 mes. Y= Consumo

mensual.

b. El consumo de cerveza El Halcón para marzo de 2009 es: Tendencia * índice estacional = 76.32 * 0.8815 = 67,27608

Entonces se pronostica que el consumo de cerveza El Halcón para el mes de marzo de 2009 es de 672761 botellas.

23

Page 24: REGRESIÓN Y CORRELACIÓN

Ejercicio. Estimar la venta de automóviles para el mes de octubre de 2011 (tabla 8.10). Tabla 8.10.Ventas mensuales de automóviles en la distribuidora El Carro (miles de automóviles). 2004 - 2008

Mes 2004 2005 2006 2007 2008

Enero 2.7 2.8 2.9 3.0 3.1

Febrero 2.6 2.7 2.8 2.9 3.0

Marzo 3.2 3.3 3.4 3.5 3.6

Abril 3.5 3.6 3.7 3.8 3.9

Mayo 3.2 3.3 3.4 3.5 3.5

Junio 4.0 4.1 4.2 4.3 4.4

Julio 3.1 3.2 3.3 3.4 3.5Agosto 3.3 3.4 3.5 3.6 3.7

Septiembre 2.8 2.9 3.0 3.1 3.2

Octubre 2.7 2.8 2.9 3.0 3.1

Noviembre 2.6 2.7 2.8 2.9 3.0

Diciembre 4.3 4.4 4.5 4.6 4.7

8.6 MOVIMIENTOS CÍCLICOS E IRREGULARES

Las fluctuaciones cíclicas son también llamadas ciclos, e indican los ascensos y descensos de las actividades alrededor de un valor normal. La duración de cada ciclo es no fijo, y relativamente corto (duración de varios años). Comúnmente estas variaciones no se pueden apartar de las de naturaleza irregular, por lo que se analizaran juntas. Con los datos de la tabla 8.11 y su respectiva figura 8.8. se observa una fluctuación cíclica.

Los movimientos irregulares (I) son aquellos movimientos diferentes a los vistos anteriormente y son causados por fenómenos naturales tales como: terremotos, erupciones de volcanes, guerras, sequías, etc.

Tabla 8.11. Ventas anuales de una Cía. en millones de pesos para

el período 1994-2008. Año 9

495

96

97

98

99

0 1 2 3 4 5 6 7 8

Ventas

7 6 2 4 8 16

13

14

17

20

23

19

25

28

32.5

Las fluctuaciones cíclicas (C) fluctúan desigualmente y no es fácil de controlar, es por esto importante. Las fluctuaciones cíclicas pueden ser medidas en datos anuales o en datos clasificados en unidades de tiempo menores de un año.

24

Page 25: REGRESIÓN Y CORRELACIÓN

Las variaciones estacionales y los movimientos irregulares se eliminan cuando la serie es clasificada en años. El modelo multiplicativo Y= T*S*C*I queda de la forma Y= T*C.

8.6.1 Medición de los Movimientos Cíclicos en Series Anuales

Como se dijo anteriormente los movimientos irregulares y las variaciones estacionales no influyen en series anuales, entonces el modelo multiplicativo es de la forma Y= TC . Despejando a C, queda de la siguiente forma: C= Y/T . Es decir, son medidas por la razones de Y con respecto a T. Estas razones son llamadas "Datos Ajustados por Tendencia Secular".

Como ejercicio se toma los datos de la tabla 8.12 y se calcula las fluctuaciones cíclicas. Como la serie es anual, no influyen las variaciones estacionales y las

irregulares. La ecuación Y= TC , entonces .Averiguado la tendencia por

el método de regresión es: Y = 2.07 + 1.94 X R² = 0.8998 Donde: Y=Ventas en millones de $ Unidad de X = 1 año

origen 1994

Los valores de son mostrados en la tabla 8.13.Después de determinar la

tendencia se calcula la razón Y/T, los cuales esta en la tabla 8.13.

Tabla 8.12. Ventas anuales de una Cía. en millones de pesos para el período 1994-2008 Año 9

495

96

97

98

99

0 1 2 3 4 5 6 7 8

Ventas

7 6 2 4 8 16

13

14

17

20

23

19

25

28

32.5

La ecuación de tendencia es: Y= 2.07+1.94X r² = 0.8998 Y= millones de $ Origen 1994 Unidad de X= 1 año

Nota: significan el % con respecto a la tendencia. En la figura 8.9

muestra la tendencia y las fluctuaciones cíclicas.

Tabla 8.13 calculo de la tendencia y las variaciones cíclicas

Año 94 95 96 97 98 99 0 1 2 3 4 5 6 7 8

Ventas 7 6 2 4 8 16 13 14 17 20 23 19 25 28 32.5

Tendenci 2.0 4.0 5.9 7.8 9.8 11.7 13. 15.6 17.5 19.5 21.4 23.3 25.3 27.2 29.2

25

Page 26: REGRESIÓN Y CORRELACIÓN

a 7 1 5 8 2 6 7 3 7 1 5 8 2 6 0

C 3.38

1.50

0.34

0.51

0.81

1.36 0.95

0.90 0.97 1.03 1.07 0.81 0.98 1.03 0.03

Para determinar que significa la fluctuación cíclica ©, se observa que C = Y/T . Si a la fluctuación cíclica la multiplican por 100 resulta el porcentaje que se denomina el índice cíclico. Este índice cíclico es la posición de cada valor de Y relativo a la recta de tendencia. De acuerdo a lo anterior para las ventas de 1999 el índice cíclico es de 136 % (se obtiene al multiplicar por 100 el la fluctuación cíclica). Este índice significa que para 1999 el valor de Y (ventas) era el 136% de la recta de tendencia. Para 2005 el índice fue de 81.0% e indica que para las ventas de 2005 fue del 81.0% de la recta de tendencia. En otras palabras se puede interpretar que las ventas para 1999 aumentaron en un 36% (136% - 100) de lo que se esperaba según la estimación de la tendencia y para 2005 disminuyo en un 19.0% (100% - 81.0%) de lo que se esperaba según la estimación de la tendencia.

Figura 8.9 Ventas anuales de una Cía. en millones de pesos para el período 1994-2008. Tendencia y variaciones cíclicas

26

Page 27: REGRESIÓN Y CORRELACIÓN

27