Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
2
3
PRONÓSTICO
> ES UNA TÉCNICA QUE PERMITE PREDECIR EL FUTURO, BASÁNDOSE EN:
> ACONTECIMIENTOS PASADOS.> INFORMACIÓN ESTADÍSTICA RECABADA
SOBRE EXPERIENCIAS SIMILARES.> ESTIMACIONES BASADAS EN ESTUDIOS DE
MERCADO U OTROS MEDIOS DE SONDEO.
4
EJEMPLOS DE PRONÓSTICOS
> El pronóstico de la demanda de cualquier producto, incluyendo insumos tales como materias primas, mano de obra y otros gastos de fabricación.
> En base a experiencias previas, también es posible estimar la demanda de órdenes de servicio, información y reclamaciones de los clientes.
> Cifras macroeconómicas; tales como crecimiento del PIB, riesgo país, paridad cambiaria, etc.
5
EL PROCESO DE TOMA DE DECISIONES
ELABORACIÓN DE LOS PRESUPUESTOS
ESTADOS FINANCIEROSPROYECTADOS
DISEÑO DEL PRONÓSTICO
6
FACTORES A CONSIDERAR PARA LA ELECCIÓN DEL MÉTODO
> LA DISPONIBILIDAD DE LOS DATOS.> LA VALIDEZ DE LOS DATOS.> LAS VARIABLES QUE SE PRETENDEN
ESTUDIAR Y SU POSIBLE INTERRELACIÓN.> EL NÚMERO DE VARIABLES QUE SE
REQUIEREN.> EL GRADO DE EXACTITUD DESEADO.> LOS RECURSOS INFORMÁTICOS DE QUE SE
DISPONEN.> LOS CONOCIMIENTOS MATEMÁTICOS.> EL ANÁLISIS COSTO-BENEFICIO DEL
MÉTODO.
7
MÉTODOS CUANTITATIVOSPARA ELABORAR PRONÓSTICOS
> ANÁLISIS DE SERIES DE TIEMPO: PROMEDIOS MÓVILES.
SUAVIZACIÓN EXPONENCIAL.
DESCOMPOSICIÓN DE SERIES DE TIEMPO.
> MODELOS EXPLICATIVOS: REGRESIÓN SIMPLE O MULTIVARIABLE.
CRECIMIENTO LINEAL Y EXPONENCIAL.
MODELOS ECONOMÉTRICOS.
MODELOS DE INSUMO-PRODUCTO.
8
BONDADES DE LOS PRONÓSTICOS CUANTITATIVOS
>UN BUEN PRONÓSTICO SIRVE PARA:• Reducir el costo de manejo de inventarios.• Calcular adecuadamente los costos de materia prima.• Incrementar el grado de satisfacción del cliente.• Efectuar atinados presupuestos de ingresos, egresos
y operaciones en general.• Disminuir los imprevistos.
9
10
DEFINICIÓN
�Se llama Series de Tiempo a un conjunto de observaciones sobre valores que toma una variable (cuantitativa) en diferentes momentos del tiempo.
11
¿Para que se utilizan las series de Tiempo?
�Hoy en día diversas organizacionesrequieren conocer el comportamiento futuro de ciertos fenómenos con el fin de planificar, prevenir,es decir, se utilizan para predecir lo que ocurrirácon una variable en el futuro a partir del comportamiento de esa variable en el pasado.
12
APLICACIONES
�En las organizaciones es de mucha utilidad en predicciones a corto y mediano plazo, por ejemplo ver que ocurriría con la demanda de un cierto producto, las ventas a futuro, decisiones sobre inventario, insumos, etc....
� No así para el diseño de un proceso productivo ya que no se disponen de datos históricos y se trata de un proyecto a largo plazo
13
Modelos de series de tiempoMétodo de proyección
Cantidad de datos históricos
Patrón de los datos Horizonte de proyección
Tiempo de preparación
Antecedentes del personal
Ajuste exponencial simple
5 a 10 observaciones para fijar la ponderación
Los datos deben ser estacionarios Corto Corto Poca sofisticación
Ajuste exponencial de Holt
10 a 15 observaciones para fijar la ponderación
Tendencias pero no estacionalidad Corto a mediano Corto
Ligera sofisticación
Ajuste exponencial de Winter
Por lo menos 4 ò 5 observaciones por
trimestre
Tendencias y estacionalidad Corto a mediano Corto
Sofisticación moderada
Modelos de la tendencia de regresión
10 a 20 observaciones para la
estacionalidad, por lo menos 5 por
trimestre
Tendencias y estacionalidad Corto a mediano Corto Sofisticación
moderada
Modelos de regresión causal
10 observaciones por variable
independiente
Puede manejar patrones complejos Corto , mediano o
largo
Largo tiempo para el desarrollo
, corto para la puesta en ejecución
Sofisticación considerable
Descomposición de las series de tiempo
Suficiente para ver 2 picos y simas
Maneja patrones cíclicos y estacionales puede identificar los
puntos críticosCorto a mediano
Corto tiempo para la
moderaciónPoca sofisticación
Box Jenkins 50 o mas observaciones
Deben ser estacionarios o ser transformados en
estacionarios
Corto , mediano o largo
Largo Alta sofisticación
14
COMPORTAMIENTO DE LOS DATOS
�Los datos se pueden comportar de diferentes formas a través del tiempo, puede que se presente una tendencia, un ciclo; no tener una forma definida o aleatoria, variaciones estacionales (anual, semestral, etc).
15
ELEMENTOS I
> TENDENCIA A LARGO PLAZO INDICA SI LA SERIE TEMPORAL ES CRECIENTE O
DECRECIENTE:.
• LA DEMANDA DE UN PRODUCTO, QUE PUEDE SER ESTACIONARIA O IR DECLINANDO CON EL TIEMPO.
> VARIACIÓN ESTACIONAL. PROBABLEMENTE LA DEMANDA DEL PRODUCTO
DIFIERE SEGÚN LA ÉPOCA DEL AÑO .
*EJEMPLO: LOS ARTÍCULOS NAVIDEÑOS, QUE DE OCTUBRE A DICIEMBRE TIENEN UNA MAYOR DEMANDA QUE EL RESTO DEL AÑO.
16
ELEMENTOS II
> VARIACIÓN CÍCLICA. LA SERIE TEMPORAL PUEDE PRESENTAR UNA MEJORA O
BAJA TEMPORAL QUE NO SIGUE NINGÚN PATRÓN CLARO.
• GENERALMENTE SE ORIGINA POR LOS CICLOS MACROECONÓMICOS (TIPO DE CAMBIO, CRISIS, ETC.).
> EFECTOS ALEATORIOS. EL COMPORTAMIENTO DE LA SERIE ES COMPLETAMENTE
IMPREDECIBLE; NO SIGUE NINGÚN PATRÓN.
*EJEMPLO: LAS VENTAS DE DISCOS DURANTE UN MES CUALQUIERA, SIN FESTIVIDADES, O DE ALGÚN MODELO DE ROPA DE UN DISEÑADOR NO RECONOCIDO.
17
Descomposición de los datos de series de tiempo
18
TENDENCIA A LARGO PLAZO
Venta de un artículo de moda
0
20000
40000
60000
80000
100000
120000
140000
2000 2001 2002 2003 2004 2005 2006
Año
Ventas
19
VÁRIACIÓN ESTACIONAL
Venta de regalos
0
2000
4000
6000
8000
10000
Enero
Febr
ero
Mar
zoAbr
ilM
ayo
Junio Julio
Agosto
Septie
mbr
eOctu
bre
Noviem
bre
Diciem
bre
Mes
Ve
nta
s 2004
2005
2006
20 20
VARIACIÓN CÍCLICA
Precios del Crudo
0
1000
2000
3000
4000
5000
6000
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
Año
Precio
21
EFECTOS ALEATORIOS
Ventas de chicles
0
100
200
300
400
500
600
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Ventas
Me
s
Serie1
22
23
PROMEDIOS MÓVILES
> CONSISTE EN CALCULAR EL PROMEDIO DE UN CONJUNTO DE DATOS RECAUDADOS DE UNA MISMA VARIABLE Y UTILIZARLO COMO ESTIMACIÓN DEL VALOR QUE TENDRÁESA MISMA VARIABLE EN EL SIGUIENTE PERIODO.
t t+1 t t+1t t+1 t t+1
n
y...yyF 1nt1tt
1t+−−
+
+++=
24
PROMEDIOS MÓVILES EN EXCEL I
25
PROMEDIOS MÓVILES EN EXCEL II
26
PROMEDIOS MÓVILES EN EXCEL III
27
PROMEDIOS MÓVILES EN EXCEL IV
28
RESULTADO FINAL
29
30
SUAVIZACIÓN EXPONENCIAL
> Esta técnica es usada pronosticar series de tiempo estacionarias.
> Todos los valores de los datos históricos intervienen en la determinación del pronóstico.
> Es similar al método anterior, solo que a los datos más recientes se les da mayor ponderación.
> El pronóstico nuevo es igual al pronóstico del periodo anterior más una corrección proporcional al último error observado.
31
C. EXPONENCIAL EN EXCEL I
32
C. EXPONENCIAL EN EXCEL II
33
RESULTADO FINAL
34
35
ELEMENTOS DE LA SERIE DE TIEMPO> SE DESCOMPONEN LOS ELEMENTOS:
• TENDENCIA• CICLO• ESTACIONALIDAD• ERROR
A EFECTO DE AISLAR E IDENTIFICAR EL
PATRÓN DE COMPORTAMIENTO DE CADA
UNO Y CONSTRUIR EL MODELO
MATEMÁTICO QUE PERMITA PROYECTAR
LA SERIE HACIA EL FUTURO.
36
37
ANÁLISIS DE REGRESIÓN> ESTE MÉTODO SE BASA EN LA
RELACIÓN QUE EXISTE ENTRE DOS O MÁS VARIABLES, QUE PODEMOS LLAMAR INDEPENDIENTES, Y QUE INFLUYEN EN EL COMPORTAMIENTO DE OTRA VARIABLE, QUE LLAMAREMOS DEPENDIENTE.
> UNA VEZ ENCONTRADA ESTA ASOCIACIÓN, Y DEPENDIENDO DE QUÉ TAN FUERTE SEA, SE PROCEDE AL PRONÓSTICO DE LA VARIABLE DEPENDIENTE, DADO(S) DETERMINADO(S) VALOR(ES) DE LA(S) VARIABLE(S) INDEPENDIENTE(S).
38
EJEMPLOS
VARIABLE INDEPENDIENTE(X)
VARIABLE DEPENDIENTE(Y)
* Los gastos de publicidad que se invierten en un periodo.
* Las ventas, pues a medida que se invierta más en publicidad, se espera aumenten las ventas del producto.
* La dimensión en metros cuadrados de un local.
* Las ventas, puesto que en algunos negocios, entre más grande sea el local, mayores serán las ventas.
* El número de miembros que tenga una familia, y el poder adquisitivo de las cabezas.
* Los consumos efectuados en un centro comercial.
39
ESTUDIO CONJUNTO DE DOS VARIABLES
> A continuación se muestra el volumen de ventas registrado por una empresa y los gastos de venta correspondientes a cada periodo.
> Dichas observaciones pueden ser representadas en un diagrama de dispersión (‘scatterplot’). En ellos, cada periodo es un punto, cuyas coordenadas son los valores de las variables.
> Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables, de qué tipo, y si es posible predecir el valor de una de ellas en función de la otra.
VentasGtos. Pub
162 61
154 60
180 78
158 62
171 66
169 60
166 54
176 84
163 68
... ...
40
DIAGRAMA DE DISPERSIÓN O NUBE DE PUNTOS.
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Gastos: $76
Ven
tas:
$ 1
87
Gastos: $50
Ventas: $161
41
RELACIÓN ENTRE LAS VARIABLES
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Parece que las ventas aumentan conforme
la publicidad
42
PREDICCIÓN DE UNA VARIABLE EN FUNCIÓN DE LA OTRA.
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Aparentemente las ventas se incrementan en $10 por cada $10 de gasto... o sea,Las ventas aumentan en un peso por cada peso de publicidad.
$10
$10
43
RELACIÓN DIRECTA E INVERSA
Incorrelación
30
80
130
180
230
280
330
140 150 160 170 180 190 200
Fuerte relación
directa.
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Cierta relación
inversa
0
10
20
30
40
50
60
70
80
140 150 160 170 180 190 200
Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. Incorrelación.
Para los valores de X mayores que la media le corresponden valores de Y menores. Esto es relación inversa o decreciente.
•Para los valores de X mayores que la media le corresponden valores de Y mayores también.
•Para los valores de X menores que la media le corresponden valores de Y menores también.
•Esto se llama relación directa.
44
¿CUÁNDO ES BUENO UN MODELO DE REGRESIÓN?
> Lo adecuado del modelo depende de la relación entre:
la dispersión marginal de Y La dispersión de Y condicionada a X
> Es decir, fijando valores de X, vemos cómo se distribuye Y
La distribución de Y, para valores fijados de X, se denomina distribución condicionada.
La distribución de Y, independientemente del valor de X, se denomina distribución marginal.
> Si la dispersión se reduce notablemente, el modelo de regresión será adecuado.
150 160 170 180 190
32
03
40
36
03
80
40
04
20
32
03
40
36
03
80
40
04
20
32
03
40
36
03
80
40
04
20
32
03
40
36
03
80
40
04
20
32
03
40
36
03
80
40
04
20 r= 0.415
r^2 = 0.172
150 160 170 180 190
35
036
03
70
38
03
90
35
036
03
70
38
03
90
35
036
03
70
38
03
90
35
036
03
70
38
03
90
35
036
03
70
38
03
90 r= 0.984
r^2 = 0.969
45
COVARIANZA DE DOS VARIABLES X E Y
> La covarianza entre dos variables, Sxy, nos indica si la posible relación entre dos variables es directa o inversa. Directa: Sxy >0
Inversa: Sxy <0
Incorreladas: Sxy =0
> El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre el grado de relación entre las variables.
))((1
yyxxn
S i
i
ixy −−= ∑
46
COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON
> La coeficiente de correlación lineal de Pearson de dos variables, r, nos indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales).
> tiene el mismo signo que Sxy por tanto de su signo obtenemos el que la posible relación sea directa o inversa.
> r es útil para determinar si hay relación lineal entre dos variables, pero no servirá para otro tipo de relaciones(cuadrática, logarítmica,...)
yx
xy
SS
Sr =
47
Propiedades de R
> Es adimensional> Sólo toma valores en [-1,1]> Las variables son incorreladas � r=0> Relación lineal perfecta entre dos variables � r=+1 o
r=-1 Excluimos los casos de puntos alineados horiz. o verticalmente.
> Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal. Siempre que no existan observaciones anómalas.
-1 +10
Relación inversa perfecta
Relación directa
casi perfecta
Variables incorreladas
48
CORRELACIONES POSITIVAS
r=0,1
30
80
130
180
230
280
330
140 150 160 170 180 190 200
r=0,4
30
40
50
60
70
80
90
100
110
120
130
140 150 160 170 180 190 200
r=0,8
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
r=0,99
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
49
CORRELACIONES NEGATIVAS
r=-0,5
0
10
20
30
40
50
60
70
80
90
140 150 160 170 180 190 200
r=-0,7
0
10
20
30
40
50
60
70
80
140 150 160 170 180 190 200
r=-0,95
0
10
20
30
40
50
60
70
80
140 150 160 170 180 190 200
r=-0,999
0
10
20
30
40
50
60
70
80
140 150 160 170 180 190 200
50
Evolución de r y diagrama de dispersión
51
PREGUNTAS FRECUENTES
> ¿Si r=0 eso quiere decir que no las variables son independientes? En la práctica, casi siempre sí, pero no tiene
por qué ser cierto en todos los casos. Lo contrario si es cierto: Independencia
implica incorrelación.
> Me ha salido r=1’2 ¿la relación es “superlineal”[sic]? ¿Super qué? Eso es un error de cálculo. Siempre debe tomar un valor
entre -1 y +1.
> ¿A partir de qué valores se considera que hay “buena relación lineal”? Imposible dar un valor concreto (mirad los gráficos anteriores). Para
este curso digamos que si |r|>0,7 hay buena relación lineal y que si |r|>0,4 hay cierta relación (por decir algo... la cosa es un poco más complicada… observaciones atípicas, homogeneidad de varianzas...)
52
OTROS COEFICIENTES DE CORRELACIÓN
> Cuando las variables en vez de ser numéricas son ordinales, es posible preguntarse sobre si hay algún tipo de correlación entre ellas.
> Disponemos para estos casos de dos estadísticos, aunque no los usaremos en clase: ρ (‘ro’) de Spearman
τ (‘tau’) de Kendall
> No tenéis que estudiar nada sobre ellos en este curso. Recordad sólo que son estadísticos análogos a r y que los encontrareis en publicaciones donde las variables no puedan considerarse numéricas.
53
MODELO DE REGRESIÓN LINEAL SIMPLE
> En el modelo de regresión lineal simple, dado dos variables Y (dependiente) X (independiente, explicativa, predictora)
> buscamos encontrar una función de X muy simple (lineal) que nos permita aproximar Y mediante Ŷ = b0 + b1X
• b0 (ordenada en el origen, constante)• b1 (pendiente de la recta)
> Y e Ŷ rara vez coincidirán por muy bueno que sea el modelo de regresión. A la cantidad e=Y-Ŷ se le denomina residuo o error residual.
54
0
30
60
90
120
150
180
0 10
20
30
40
50
60
70
80
90
10
0
11
0
12
0
13
0
14
0
15
0
16
0
17
0
18
0
19
0
20
0
21
0
22
0
> Retomando el ejemplo de las Ventas: Ŷ = b0 + b1X
• b0=$85 (No interpretar como ventas sin invertir en publicidad)• b1=0,5 (En promedio las ventas se incrementan $0.50 por cada $1 en publicidad)
b0=$85
b1=0,5
55
0
30
60
90
120
150
180
0 10
20
30
40
50
60
70
80
90
10
0
11
0
12
0
13
0
14
0
15
0
16
0
17
0
18
0
19
0
20
0
21
0
22
0
> La relación entre las variables no es exacta. Es natural preguntarse entonces:
Cuál es la mejor recta que sirve para predecir los valores de Y en función de los de X
Qué error cometemos con dicha aproximación (residual).
b0=85 cm
b1=0,5
56
� El modelo lineal de regresión se construye utilizando la técnica de estimación mínimo cuadrática:� Buscar b0, b1 de tal manera que se minimice la cantidad
� Σi ei2
� Se comprueba que para lograr dicho resultado basta con elegir:
� Se obtiene además unas ventajas “de regalo”
� El error residual medio es nulo
� La varianza del error residual es mínima para dicha estimación.
Traducido: En término medio no nos equivocamos. Cualquier otra estimación que no cometa error en término medio, si es de tipo lineal, serápeor por presentar mayor variabilidad con respecto al error medio (que es cero).
xbybS
Srb
X
Y101 −==
57
RESIDUOS DEL MODELO DE REGRESIÓN
58
� Que el error medio de las predicciones sea nulo no quiere decir que las predicciones sean buenas.
� Hay que encontrar un medio de expresar la bondad del ajuste (bondad de la predicción)
Cometió un error de -30 en su
última predicción
No importa. Con los dos últimos clientes me
equivoqué en +10 y +20. En término medio el error
es cero.
59
¿Cómo medir la bondad de una regresión?
¿Cómo medir la bondad de una regresión?
Imaginemos un diagrama de dispersión, y vamosa tratar de comprender en primer lugar qué esel error residual, su relación con la varianza de Y,y de ahí, cómo medir la bondad de un ajuste.
60
Interpretación de la variabilidad en Y
YEn primer lugar olvidemos que existe la variable X. Veamos cuál es la variabilidad en el eje Y.
La franja sombreada indica la zona donde varían los valores de Y.
Proyección sobre el eje Y = olvidar X
61
Interpretación del residuo
YFijémonos ahora en los errores de predicción (líneas verticales). Los proyectamos sobre el eje Y.
Se observa que los errores de predicción, residuos, están menos dispersos que la variable Y original.
Cuanto menos dispersos sean los residuos, mejor será la bondad del ajuste.
62
Bondad de un ajuste
Resumiendo:
• La dispersión del error residual será una fracción de la dispersión original de Y
•Cuanto menor sea la dispersión del error residualmejor será el ajuste de regresión.
Eso hace que definamos como medida debondad de un ajuste de regresión,o coeficiente de determinación a:
2
22 1
Y
e
S
SR −=
Y
22 Ye SS <
63
Descomposición de la varianza
64
Resumen sobre bondad de un ajuste> La bondad de un ajuste de un modelo de regresión se
mide usando el coeficiente de determinación R2
> R2 es una cantidad adimensional que sólo puede tomar valores en [0, 1]
> Cuando un, ajuste es bueno R2 será cercano a uno.
> Cuando un ajuste es malo R2 será cercano a cero.
> R2 también se le denomina porcentaje de variabilidad explicado por el modelo de regresión.
> R2 puede ser pesado de calcular en modelos de regresión general, pero en el modelo lineal simple, la expresión es de lo más sencilla: R2=r2
¿Es coherente lo dicho entonces sobre los valores de R2?
65
Otros modelos de regresión
> Se pueden considerar otros tipos de modelos, en función del aspecto que presente el diagrama de dispersión (regresión no lineal)
> Incluso se puede considerar el que una variable dependa de varias (regresión múltiple).
¿recta o parábola?
140 150 160 170 180 190 200
¿recta o cúbica?
140 150 160 170 180 190 200
66
Modelos de análisis de regresión
Modelos de regresión
Simple Múltiple
Lineal No lineal Lineal No lineal
1 variable explicativa 2+ variables explicativas
En clase sólo tratamos el modelo de regresión lineal simple.En todos los demás la bondad del ajuste se mide usando R2
No ajustaremos modelos a mano. Usaremos para ello excel.
67
REGRESIÓN EN EXCEL I
68
REGRESIÓN EN EXCEL II
69
REGRESIÓN EN EXCEL III
70
REGRESIÓN EN EXCEL IV