20
Promedios Móviles Utiliza el promedio de los valores de los n datos más recientes en la serie de tiempo como el pronóstico para el siguiente periodo, expresado en forma matemática. El término móvil indica que, conforme se dispone de nuevas observaciones para la serie de tiempo, se reemplaza la observación más antigua en la ecuación y se calcula un nuevo promedio. PM = i=1 n x i n Sea la siguiente tabla: Venta (En Millones de pesos) 1 17 2 21 3 19 4 23 5 18 6 16 7 20 8 20 9 22 10 20 11 15 12 22

Promedios Móviles, mínimos cuadrados y regresión lineal

Embed Size (px)

Citation preview

Page 1: Promedios Móviles, mínimos cuadrados y regresión lineal

Promedios Móviles

Utiliza el promedio de los valores de los n datos más recientes en la serie de tiempo como el pronóstico para el siguiente periodo, expresado en forma matemática.

El término móvil indica que, conforme se dispone de nuevas observaciones para la serie de tiempo, se reemplaza la observación más antigua en la ecuación y se calcula un nuevo promedio.

PM=∑i=1

n

xi

n

Sea la siguiente tabla:

Venta(En Millones de pesos)

1 172 213 194 235 186 167 208 209 22

10 2011 1512 22

Al usar los promedios móviles para pronosticar las ventas de gasolina, primero debemos seleccionar la cantidad de valores de datos que se incluirán en el promedio móvil de tres semanas.

Page 2: Promedios Móviles, mínimos cuadrados y regresión lineal

Representamos gráficamente el conjunto de datos de la tabla y queda cómo:

El cálculo del promedio móvil para las primeras tres semanas de la serie de tiempo de ventas de gasolina es:

SemanaVenta

(En Millones de pesos)

Promedio móvil con tres períodos

1 172 213 194 23 195 18 216 16 207 20 198 18 189 22 18

10 20 2011 15 2012 22 19

Page 3: Promedios Móviles, mínimos cuadrados y regresión lineal

Una consideración importante al seleccionar un método de pronóstico es la precisión del pronóstico, pues evidentemente deseamos que los errores de pronóstico sean pequeños.

En la tabla siguiente, las últimas dos columnas de la siguiente tabla, contienen los errores de pronóstico y los errores de pronóstico al cuadrado (23 – 19 = 4 y este al cuadrado = 16)

Venta(En Millones

de pesos)

Promedio móvil con

tres períodos

Error Error al cuadrado

1 172 213 194 23 19 4 165 18 21 -3 96 16 20 -4 167 20 19 1 18 18 18 0 09 22 18 4 16

10 20 20 0 011 15 20 -5 2512 22 19 3 9

Suma de Errores 0 92

Técnica de los mínimos cuadrados:

Page 4: Promedios Móviles, mínimos cuadrados y regresión lineal

Es una técnica para ajustar una tendencia por medio de datos puntuales. El resultado es la mejor línea de ajuste y tiene las siguientes propiedades:

1) Las desviaciones de todas las distancias verticales es cero.2) La sumatoria de los cuadrados de todas las desviaciones verticales es mínima.3) La línea va a través de las medias .

En ecuaciones lineales, la mejor línea de ajuste se obtiene con la solución simultánea de a y b de las dos siguientes ecuaciones normales.

∑Y=n∗a+b∗∑ X

∑ X∗Y=a∗∑ X+b∗∑ X2

Si se codifican los datos, de modo que ∑ X=0 , los dos términos en las ecuaciones anteriores se cancelan y entonces:

∑Y=n∗a

∑ X∗Y=b∗∑ X2

La codificación se logra fácilmente con datos de series de tiempo, simplemente designando el centro de tiempo del período como X = 0 y teniendo un número igual de períodos positivos y negativos en cada extremo, los que hace que la suma total en X sea Cero.

Ejemplo:

Utilizando el método de los mínimos cuadrados, desarrollar la ecuación lineal de tendencia con los datos de la tabla siguiente:

Años X: Años Codificados

Y: Embarques (Toneladas)

X*Y X2

Page 5: Promedios Móviles, mínimos cuadrados y regresión lineal

1 -5 2 -10 252 -4 3 -12 163 -3 6 -18 94 -2 10 -20 45 -1 8 -8 16 0 7 0 07 1 12 12 18 2 14 28 49 3 14 42 9

10 4 18 72 1611 5 19 95 25

Suma total: 0 113 181 110

a) Establecer la ecuación completa.b) Determinar el valor pronosticado para el año 16.

Desarrollo:

a) a=∑ Y

n=10.3 y b=

∑ X∗Y

∑ X2=181110

=1.6

La ecuación de pronóstico queda de la forma: Y=10.3+1.6∗X

Considerando que el Año 6 X= 0

b) El año 16 corresponde a X = 10, por lo tanto para ese año, la proyección queda dada por:

Y = 10.3 + 1.6 *( 10 ) = 26.3 toneladas.

Métodos de regresión y correlación:

Las técnicas de regresión y correlación, cuantifican la relación estadística entre dos o más variables. La regresión lineal simple expresa la relación entre una variable dependiente Y y una variable independiente X, en términos de la pendiente y la intersección de la línea que mejor se ajuste a las variables. La correlación simple expresa el grado o la cercanía de la relación entre las dos variables en términos de un coeficiente de correlación que proporciona una medida indirecta de la variabilidad de los puntos

Page 6: Promedios Móviles, mínimos cuadrados y regresión lineal

alrededor de la mejor línea de ajuste. Ni la regresión, ni la correlación dan pruebas de la relación causa-efecto.

Regresión lineal simple:

El modelo de regresión lineal simple, toma la forma: Yc = a + b* X, donde Yc , es la variable dependiente y X la variable independiente. Los valores de la pendiente b, y la intersección a, se obtienen utilizando las ecuaciones normales escritas de la forma:

b=∑ X∗Y−n∗X∗Y

∑ X2−n∗X2 y a=Y−b∗X

Las medias de X eY , se determinan como:

X=∑ X

n e Y=

∑Y

n n: número de pares de observaciones realizadas.

1.- La empresa paraíso analiza la relación entre el consumo de energía (en KWH) y el número de habitaciones en una residencia privada unifamiliar. En una muestra aleatoria de 10 casas se obtuvo la siguiente información:

a) Elabora el diagrama de dispersión.

b) Suponiendo que existe una relación lineal, determina los parámetros ‟a” y ‟b‟ de la recta de regresión e interpreta su significado:

Page 7: Promedios Móviles, mínimos cuadrados y regresión lineal

b=∑ X∗Y−n∗X∗Y

∑ X2−n∗X2

Con los datos del problema calculamos los parámetros a y b. Cálculo del parámetro a:

Aplicando la fórmula anterior, se obtiene: b = 0,6666667. También a=Y−b∗X , de donde se obtiene un valor a= 1,33333

Con los parámetros antes calculados se tiene la ecuación de regresión lineal.

Yp = 0,666667*X + 1,33333

De los cuales se puede interpretar que “a” nos representa que cuando no hay consumo en las habitaciones del edificio el consumo de energía por otros factores es 1,3333 kwh. es decir solo encendido de luces de calle. Y el parámetro “b” nos indica que tanto crece el consumo de energía conforme aumenta el número de habitaciones por edificio.

Page 8: Promedios Móviles, mínimos cuadrados y regresión lineal

Desviación Estándar de la Regresión:

Una línea de regresión describe la relación entre un valor dado de la variable independiente X y la media µ y.x de la distribución de probabilidad correspondiente de la variable dependiente Y. El punto estimado o pronóstico, es la media de la distribución para un valor dado X.

La desviación estándar de la regresión Sx.y es la media de la dispersión de los datos alrededor de la línea de regresión.

Sy . x=√∑ Y 2−a∗∑Y−b∗∑ X∗Yn−2

Canal de regresión lineal:

Es una herramienta de análisis técnico basada en el estudio estadístico utilizada para predecir el futuro desde datos pasados. El canal de regresión lineal es usado para determinar cuándo el precio está sobre-desviado desde el punto de equilibrio representado por la línea de tendencia de regresión lineal.

Cómo antes se mencionó, una línea de regresión lineal es una línea dibujada entre dos puntos utilizando el método estadístico de los mínimos cuadrados. La línea obtenida representa la aproximación de los datos a una recta que aparece en la mitad exacta de los precios. Esta recta es una línea de tendencia objetiva, llamada línea de tendencia de regresión lineal, cuya inclinación determina la tendencia del mercado.

El canal de regresión lineal fue desarrollado por Gilber Raff. El canal es construido trazando dos líneas paralelas a la línea de tendencia de regresión lineal. Estas dos líneas, las líneas del canal, se sitúan a una distancia equidistante de la línea de tendencia de regresión lineal (una desviación estándar), una por encima y otra por debajo, formando el canal de regresión lineal. La distancia entre las líneas del canal es de 2 veces la desviación estándar.

Los canales de regresión lineal contienen la mayor parte del movimiento del precio. La línea superior del canal representa una zona de resistencia mientras que la línea inferior del canal representa una zona de soporte. El precio puede extenderse fuera del canal por un corto período de tiempo pero si el precio se mantiene fuera del canal por un período de tiempo largo, un cambio en la dirección de la tendencia puede estar próximo.

La línea de tendencia de regresión lineal muestra el punto de equilibrio y el canal de regresión lineal muestra el rango máximo de desviación del precio desde la línea de regresión lineal que puede esperarse.

Page 9: Promedios Móviles, mínimos cuadrados y regresión lineal

Fuente: Canal de regresión lineal | Definición http://www.efxto.com/diccionario/c/3930-canal-de-regresion-lineal#ixzz2PsJt16A1

Estimación del intervalo:

Se puede establecer una predicción del intervalo, para un valor pronosticado individual de Yc , utilizando la expresión:

Intervalo de predicción = Yc ± t*SIND

S IND=S x. y∗√1+ 1n+(X−X )2

∑ (X−X)2

t: valor de la tabla de distribución t, para el nivel de confianza especificado.

Para muestras grandes (n>100), la ecuación del intervalo de predicción, puede ser aproximada utilizando la distribución normal (Z), en reemplazo de la t y la ecuación para el intervalo de predicción queda dada por:

Intervalo de predicción = Yc ± Z*SIND

Page 10: Promedios Móviles, mínimos cuadrados y regresión lineal

Significancia de la pendiente de la línea de regresión:

Esta medición muestra que tan estadísticamente significativa, es la relación entre X e Y.

Se calcula como:

t calc=bSb

y Sb=S y . x∗√ 1

∑ (X−X )2

El análisis se hace comparando el valor obtenido tcalc , con el valor recogido de la tabla de distribución t

Coeficiente de correlación:

El coeficiente de correlación lineal simple r, es un número entre -1 y 1, que indica que también describe la ecuación lineal, la relación entre dos variables.

El coeficiente r, toma un valor positivo si al aumentar el valor de X, también lo hace el valor de Y. Si al aumentar X, el valor de Y decrece, r tomará valores negativos. Finalmente, un r de valor cero, indica que no existe correlación entre las variables.

La tabla siguiente, muestra el valor de r, respecto al grado de correlación existente:

La desviación de todos los puntos Y, de la línea de regresión Y c, consiste en la desviación contabilizada por la línea de la regresión (explicada) y la variación aleatoria (no explicada).

Page 11: Promedios Móviles, mínimos cuadrados y regresión lineal

Variación total = explicada + no explicada.

∑ (Y−Y )2=∑ (Y c−Y )2+∑(Y−Y c )2

El coeficiente de determinación r2 es la razón de la variación explicada a la variación total.

r2=∑ (Y c−Y )2

∑ (Y−Y )2

El coeficiente de correlación r es la raíz cuadrada del coeficiente de determinación.

r=√∑ (Y c−Y )2

∑ (Y−Y )2

Cuando el tamaño de la muestra es lo suficientemente grande; por ejemplo mayor que 50 pares de datos, el valor de r, puede ser calculado más directamente en base a la ecuación:

Componentes de la demanda

Page 12: Promedios Móviles, mínimos cuadrados y regresión lineal

1) Horizontal

La demanda fluctúa alrededor de una demanda promedio, la cual no aumenta o disminuye en forma consistente.

Ejemplo: Ventas de un producto en la etapa de madurez

2) Tendencia:

Es el aumento o disminución sostenida de la demanda entre un período y el siguiente.

Ej. Las ventas de un producto en etapa de crecimiento presentan esta característica, así como los del período de declinación.

3) Estacional:

Se relaciona con la influencia de los factores estacionales que impactan en la demanda, en forma positiva o negativa.

Ejemplo: Artículos de Verano tales cómo Helados, trajes de baño, etc…

Page 13: Promedios Móviles, mínimos cuadrados y regresión lineal

4) Cíclico:

Similar al anterior excepto que no ocurre a intervalos regulares, además no tiene una extensión constante.

Ejemplo: El impacto de una recesión.

Modelos de normalización exponencial:

Page 14: Promedios Móviles, mínimos cuadrados y regresión lineal

En estos métodos, el peso asignado a la demanda de un período previo, aumenta exponencialmente conforme los datos son más recientes.

¿Cuándo Usarlos?

Cuando se desea pronosticar un período corto. Cuando existe poca información externa o de las causas que lo generan. Cuando no se desea invertir mucho esfuerzo. Otorga la facilidad de utilizar medios

computacionales. Cuando la actualización es simple, ya que se dispone permanentemente de nueva

información.

Clasificación de los modelos:

Modelo básico de normalización exponencial.

Es aplicable cuando no existen componentes de tendencia o estacionalidad. La demanda fluctúa entorno a una demanda promedio. Llamada base. Las fluctuaciones en la demanda son causadas tanto por el cambio de base como

por el ruido aleatorio. El objetivo es estimar la base y utilizarla para pronosticar. La base actual se estima tomando la base anterior y sumándole una fracción de la

diferencia entre la demanda real y la base anterior.

St=St−1+α(Dt−St−1)

Page 15: Promedios Móviles, mínimos cuadrados y regresión lineal

Donde:

St=Baseactual.

St−1=Base Anterior .

Dt=Demandareal actual

α=¿ Factor de normalización entre 0 y 1, lo típico es utilizar valores entre 0.01 y 0.30

En este modelo físico, dado que no existen componentes de tendencia o estacionalidad, el pronóstico para el nuevo período es la extrapolación directa de la base actual calculada, o sea:

F t+1=S t

Ejemplo:

Si α = 0.2

Mes Dt St Ft

Inicial -- 23.0 --Enero 19.36 22.27 23.0Febrero 25.45 22.90 22.27Marzo 19.73 22.27 22.90Abril 21.48 22.11 22.27Mayo 20.77 21.84 22.11Junio 25.42 22.56 21.84Julio 22.56

Algunas características y consideraciones:

El valor de α, permite ponderar la influencia de la demanda real con respecto a la base anterior.

Si las variaciones de la demanda se deben principalmente a la aleatoriedad, debe elegirse un valor bajo de α

Si las fluctuaciones se deben a una base variable, entonces se debe elegir u valor más grande de α

Page 16: Promedios Móviles, mínimos cuadrados y regresión lineal

Modelo de tendencia lineal o aditiva

En estos modelos de normalización, la tendencia aparece expresada por la diferencia entre St y S t−1, la cual se sostiene durante el tiempo en un valor promedio.

Para minimizar los efectos aleatorios, se normaliza esta diferencia aplicando otra constante llamada β.

Según estas consideraciones, la nueva ecuación es:

St=α Dt+(1−α )(St−1+T t−1)

St=(St−1+T t−1)+α (D t−(S t−1+T t−1))

Dónde:

Tt es la tendencia normalizada que se calcula como:

T t=T t−1+β ((S t−S t−1 )−T t−1)

Para calcular el próximo periodo, se extrapola añadiendo la tendencia a la base calculada.

F t+1=S t+T t

Y para m períodos

F t+m=St+m∗T t

Ejemplo:

Mes Dt St Tt Ft

Page 17: Promedios Móviles, mínimos cuadrados y regresión lineal

Inicial -- 20.0 0 --Enero 19.36 19.87 - 0.013 --Febrero 25.45 20.98 0.099 19.86Marzo 19.73 20.81 0.072 21.08Abril 21.48 20.99 0.084 20.88Mayo 20.77 21.02 0.078 21.06Junio 25.42 21.96 0.164 21.10Julio -- -- -- 22.13

Si α = 0.2 y β = 0.1

Características y consideraciones:

El modelo es valioso cuando existe una tendencia y variación aleatoria en los datos.

El proceso de inicialización de este modelo es mejor cuando se dispone de más datos.

Se puede calcular la pendiente de la curva obtenida por regresión lineal de los datos, y esta corresponderá a la tendencia inicial o bien se puede comenzar con el valor cero y

calcularla a través del período con datos.