Upload
estela-rosero
View
14
Download
4
Embed Size (px)
Citation preview
Centro de Investigación Estadística y Mercadeo
www.leondariobello.com
Enfoque Clásico
CIEM
DEFINICION. Una serie de tiempo es un conjunto de datos numéricos
que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede ser: Hora, día, mes, trimestre, año o cualquier periodo que se pueda considerar de interés.
OBJETIVO.Identificar y aislar los factores de influencia con propósitos de hacer predicciones (pronósticos), y prevenir “brotes” o “epidemias”.
Material preparado por:
Profesor León Darío Bello PariasCIEM
Con el análisis de series temporales se pretende extraer
el patrón de comportamiento sistemático contenido en
una sucesión de observaciones que se recoge de forma
regular y homogénea a lo largo del tiempo. Con este
patrón es posible: a) caracterizar el comportamiento del
fenómeno estudiado; b) predecir su evolución futura; y c)
extraer componentes no observables (señales) que
reflejan más fielmente la evolución subyacente de la
variable de interés. Preparado por: León Dario BelloCIEM
El tratamiento numérico de las series Temporales es variado y la metodología a utilizar depende de los objetivos planteados. En general, se puede decir que de una secuencia cronológica nos puede interesar adquirir un conocimiento descriptivo o diagnóstico, en el sentido de poder detectar la dinámica generadora del fenómeno bajo estudio, y un conocimiento predictivo o pronóstico, pretendiendo deducir de los datos registrados hasta el momento, cómo será su comportamiento futuro.
Material preparado por:
Profesor León Darío Bello PariasCIEM
Número de Casos Acumulados de Tosferina Periodo 13 (Antioquia 1994-2001)
0
100
200
300
400
500
600
1994 1995 1996 1997 1998 1999 2000 2001
Año
Nº
Cas
os
Tasas Acumulada por 100.000 habitantes de Tosferina Perioido 13 (Antioquia 1994-2001)
0.0
2.0
4.0
6.0
8.0
10.0
12.0
1994 1995 1996 1997 1998 1999 2000 2001
Años
Tasa
s * 1
00.0
00
http://www.col.ops-oms.org/iah/lisnalsds.htmCIEM
Número de Casos Acumulados de Rubeola Periodo 13 (Antioquia 1994-2001)
0
1000
2000
3000
4000
5000
6000
1994 1995 1996 1997 1998 1999 2000 2001
Años
Nº
Cas
os
Tasas Acumuladas por 100.000 habitantes de Rubeola Periodo 13 (Antioquia 1994-2001)
0.0
20.0
40.0
60.0
80.0
100.0
120.0
1994 1995 1996 1997 1998 1999 2000 2001
Años
Tasa
s *
100.
000
CIEM
Número de Casos Acumulados de HIV/Sida Periodo 13 (Antioquia 1992-2001)
0
100
200
300
400
500
600
700
800
1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
Tasas Acumuladas por 100.000 habitantes de VIH/Sida Periodo 13 (Antioquia 1992-2001)
0.0
2.0
4.0
6.0
8.0
10.0
12.0
14.0
1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
AñosTa
sas
* 10
0.00
0
FUENTE: SIS 12 , REGISTROS DE PROGRAMA, Y SIVIGILA * CERTIFICADOS DE DEFUNCIÓN DANE( SISTEMAS)http://www.dssa.gov.co/infecc/infecciosas.htm
CIEM
Consideraciones Previas
Consistencia: Mecanismos de notificación, los cuales pueden cambiar la forma de captura de la información.
Comparabilidad: cambios que se originan a través del tiempo.
Preparado por: León Dario Bello
CIEM
COMPONENTES DE UNA SERIE Tendencia: Movimientos percistentes
ascendentes o descendentes a través del tiempo. Variaciones estacionales. Fluctuaciones
periódicas en periodos de tiempo cuya frecuencia es menor a un año, aproximadamente en las mismas fechas y casi con la misma intensidad.
Movimientos o variaciones cíclicas.
Los movimientos se consideran cíclicos, solo si se producen en un intervalo de tiempo superior al año.
Movimientos irregulares o al azar. movimientos esporádicos o de corto plazo.Material preparado por:
Profesor León Darío Bello PariasCIEM
COMPONENTES DE UNA SERIE
Material preparado por:
Profesor León Darío Bello PariasCIEM
Preparado por: León Dario Bello
USO DE PROMEDIOS MOVILES SERIE INFECCION RESPIRATORIA AGUDA EN SANTA FE DE BOGOTA (1982-1992)
0
20
40
60
80
100
120
140
MESES
Serie1
Serie2
Serie3
Preparado por: León Dario BelloCIEM
Preparado por: León Dario Bello
Ajuste De Un Modelo
1.T(t) = a + bt
(Lineal)
2.T(t) = a e bt
(Exponencial)
3.
(Exponencial
modificada)
i. La curva de tendencia debe cubrir un periodo relativamente largo para ser una buena representación de la tendencia a largo plazo.
ii. La tendencia rectilínea y exponencial son aplicable a corto plazo, puesto que una curva S a largo plazo puede parecer una recta en un período restringido de tiempo (por ejemplo).
LogisticaGompertz
Especialización EIA
Técnicas de suavizado
Grupo de métodos cuyo objetivo es identificar las componentes subyacentes de la serie.
Suaviza el aspecto de la gráfica mediante la eliminación o alisado de las oscilaciones de la serie.
Especialización EIA
Técnicas de suavizado
Promedios Móviles El objetivo es eliminar de la serie las
componentes estacionales y accidentales.
Xt es el valor de la predicción para el instante t Zt es el valor real de la serie el instante genérico t K es el número de valores considerados en el
cálculo de la media móvil
k
ZZZX tktkt
t11 ...
y ySiguiente observación Observación más remota
Mt t
1
Material preparado por:
Profesor León Darío Bello Parias
Técnicas de suavizado
La previsiones obtenidas con este método, pueden ser útiles en situaciones en que la serie es muy vólatil y una media estable. Se recomienda un K alto si la serie es muy heterógenea. Usualmente se trabaja con valores entre 3 y 11.
Material preparado por:
Profesor León Darío Bello Parias
Incidencia de malaria por 100 000 habitantes. Antioquia 1982-1993 Medias móviles
0
500
1000
1500
2000
2500
3000
1982 1984 1986 1988 1990 1992
Años
Prop
orci
ón Real
Pronóstico M=3
Pronóstico M=5
Preparado por: Maria Cristina Velásquez
Técnicas de suavizadoExponencial simple: Esta técnica supera al método de promedios móviles en
el sentido que no elimina valores. Además, le da mayor ponderación a los últimos valores de la serie y menos peso a los primeros. Se recomienda cuando la serie no tiene tendencia ni estacionalidad, es decir, se estima el nivel de la serie. El pronóstico debe ser a muy corto plazo.
Material preparado por:
Profesor León Darío Bello Parias
n,,,tSyS
yS
ttt 32101 1
11
El problema radica en determinar el valor de
XXtt = X = Xt-1t-1 + a(Z + a(Zt-1t-1 – X – Xt-1t-1) )
Predicción con suavizado exponencial (Método de Brown):
Permite la realización de previsiones a muy corto plazo, además puede emplearse también en el simple suavizado de series, al estilo de las medias móviles. Debe ser utilizado sólo y sólo para series con ruido.
Xt = Xt-1 + a(Zt-1 – Xt-1)
Xt es ekl valor de la serie suavizada para el período t Zt es el valor de la serie original en el período t a es la constante de suavizado, 0<=a<=1.
En series que presenten una tendencia aproximadamente lineal o bien sean estables en media, este método puede dar buenos resultados, si la serie presenta oscilaciones cíclicas, los resultados serán pobres.
Especialización EIA
Estimación de la Estacionalidad
La estimación de la estacionalidad no sólo se realiza con el fin de incorporarla al modelo para obtener predicciones, sino también con el fin de eliminarla de la serie para visualizar otras componentes como tendencia y componente irregular que se pueden confundir en las fluctuaciones estacionales.
CIEM
Técnicas de descomposición de series
El factor de tendencia recoge comportamiento general, a largo plazo de la serie. El factor estacional recoge comportamientos repetitivos de ciclo corto, este comportamiento cíclico está presente con frecuencia en series de tipo económico.
CIEM
Técnicas de descomposición de series (Modelo Holt )
Este modelo pretende identificar la tendencia de la serie de un modo tal que permita que esa tendencia pueda variar a lo largo del tiempo, produciéndose un ajuste automático del modelo. Se utiliza para series con ruido y tendencia ( y ).
Xt+m = St + mbt
Donde: Xt+m es la previsión obtenida para el instante t+m, desde
el instante t St es el nivel de suavizado en que se encuentra la serie en
el instante t bt es la tendencia que presentaba la serie en el instante t.
CIEM
Técnicas de descomposición de series (Modelo Holt - Winters)
El metodo de Holt no admite la presencia de variaciones estacionales. Si le añadimos un tercer término para recoger este elemento, tenemos el modelo de Winters que, por tanto, considera la serie como formada por tres factores : nivel tendencia y ciclos (, y ).
El primer parámetro está relacionado con
el factor aleatorio de la serie, el segundo con la tendencia y el tercero con la componente estacional. CIEM
EL METODO DE HOLT-WINTER PARA EL AJUSTE DE LA TENDENCIA Y DEL PRONOSTICO
METODO DE HOLT-WINTER, es una extensión del planteamiento de suavizado exponencial, la diferencia radica en que el procedimiento de suavizado exponencial proporciona una visión de los movimientos a largo plazo sin tener en cuenta la estacionalidad ni la tendencia, mientras que Holt Winter permite pronosticar teniendo en cuenta ambas componentes. El método se ha venido refinando cada vez más, en esta capacitación se presentan las formulas para tratar la tendencia.
NIVEL E i = U(E i -1+ Ti - 1) + (1-U) Y i
TENDENCIA T i = VT i -1 +(1-V)(E i - E I - 1)
^
PRONOSTICO Yn +J = En + j (Tn)
E i = Nivel de la serie suavizada en el periodo i.
E i - 1 = Nivel de la serie suavizada en el periodo i - 1.
T i = Valor del componente de tendencia en el periodo i.
T i - 1 = Valor del componente de tendencia en el periodo i - 1
Y i = Valor de la serie en el tiempo i.
U = Constante de suavizado asignada de manera subjetiva (0<U<1). V = Constante de suavizado asignada de manera subjetiva (0<V<1). Para empezar a realizar los cálculos, hacemos E 2 = Y 2 y T 2 = Y 2 - Y 1 Preparado por: León Dario Bello
• Es posible tener una apreciación más clara sobre el
comportamiento de la misma.
• Facilita la identificación de patrones subyacentes
en ellas.
• Al aislar los factores exogenos ayuda a conocer
como se relaciona la serie de interés con otras series.
• Ayuda a disminuir las posibilidades de ser
engañados por correlaciones espureas, es decir,
correlaciones que muestran casualidad y no causalidad.
Preparado por: León Dario BelloCIEM
1. Método del porcentaje medio. En este método expresamos los
datos de cada mes como porcentajes del promedio anual. Los
porcentajes para meses correspondientes en distintos años se
promedian entonces (usando una media o una mediana). Los doce
porcentajes resultantes dan el índice estacional.
2. Método del porcentaje de tendencia. En este método
expresamos los datos para cada mes como porcentajes de valores de
tendencia mensuales. Un promedio apropiado de los porcentajes
para meses correspondientes da entonces el índice requerido.
Preparado por: León Dario BelloCIEM
3. Método del promedio móvil en porcentaje. En este método calculamos un promedio móvil de doce meses. Como los resultados obtenidos así caen entre meses sucesivos en lugar de en el centrodel mes ( que es donde caen los datos originales), calculamos un promedio móvil de dos meses de ese promedio móvil de doce meses.
El resultado se llama a veces un promedio móvil de doce meses centrado. Tras hacer eso, expresamos los datos originales de cada mes como un porcentaje del promedio móvil centrado de 12 meses que corresponde a los datos originales. Los porcentajes de los meses correspondientes se promedian a continuación, dando el índice buscado.
Valor original x 100
Valor ajustado estacionalmente = ----------------------------------
índice estacional Preparado por: León Dario Bello
Preparado por: León Dario Bello
DESCOMPOSICION DE LA SERIE
Preparado por: León Dario Bello
Se presentan varios criterios para identificar el modelo que más se
ajusta a los datos originales, los más utilizados son: El Error
Cuadrado Medio (MSE), la Desviación Media Absoluta (DMA) como
métodos numéricos y el análisis de residuales como método gráfico.
La fórmula para el DMA esta dada por.
DMA= Y i - Y ij / n
Preparado por: León Dario Bello
PASOS EN EL ANALISIS CLASICO DE UNA SERIE DE TIEMPO.
1. DETERMINAR SI LA SECUENCIA DE DATOS
FORMAN UNA SERIE NO ALEATORIA.2. ANALISIS EXPLORATORIO DE DATOS. 3.SUAVIZAR LA SERIE para identificar el
comportamiento subyacente de la misma.4. DESCOMPONER LA SERIE en sus respectivas
componentes.5. AJUSTE DE MODELOS MATEMATICOS.6. ANALISIS DE RESIDUALES7. REALIZAR ESTIMACIONES Y PRONOSTICOS.8. VALIDAR EL MODELO Material preparado por:
Profesor León Darío Bello PariasCIEM
Desarrollo de los Pasos
1. Realmente es una serie no aleatoria: Rachas
2. Análisis exploratorio de datos: -Gráfico de secuencias. Gráfico de Caja y Sesgo. - Cálculo de estadísticas descriptivas.3. Identificación de las componentes de la serie:
YEAR, not periodic
1999
1998
1998
1997
1996
1996
1995
1994
1994
1993
1992
1992
1991
1990
1990
1989
1988
1988
Nú
me
ro
d
e C
aso
s
140
120
100
80
60
40
20
Serie IRA la cual contiene número de casos reportados en Santa Fé de Bogotá desde enero de 1988 hasta diciembre de 1999
Preparado por: León Dario Bello
Desarrollo de los Pasos
4. Descomponer la serie.
Preparado por: León Dario Bello
Prueba de homogeneidad de varianzas
Número de Casos
1.009 11 132 .442
Estadísticode Levene gl1 gl2 Sig.
ANOVA
Número de Casos
11507.243 11 1046.113 5.408 .000
25532.083 132 193.425
37039.326 143
Inter-grupos
Intra-grupos
Total
Suma decuadrados gl
Mediacuadrática F Sig.
Prueba de homogeneidad de varianzas
Número de Casos
1.242 11 132 .266
Estadísticode Levene gl1 gl2 Sig.
ANOVA
Número de Casos
8462.910 11 769.355 3.554 .000
28576.417 132 216.488
37039.326 143
Inter-grupos
Intra-grupos
Total
Suma decuadrados gl
Mediacuadrática F Sig.
Diferencia de Medias por año. Diferencia de Medias por mes.Hay Tendencia Hay Estacionalidad
MONTH, period 12
121110987654321
Me
dia
de
Nú
me
ro d
e C
aso
s
100
90
80
70
60
50
YEAR, not periodic
199919981997199619951994199319921991199019891988
Me
dia
de
Nú
me
ro d
e C
aso
s
100
90
80
70
60
CIEM
Desarrollo de los Pasos
Modelo de Winter, se realizó el análisis de residuos.Prueba de rachas
-.3225664
72
72
144
62
-1.840
.066
Valor de pruebaa
Casos < Valor de prueba
Casos >= Valor deprueba
Casos en total
Número de rachas
Z
Sig. asintót. (bilateral)
Error forCASOS fromEXSMOOTH,MOD_6 WI A.20 G .00 D
.00
Medianaa.
Prueba de Kolmogorov-Smirnov para una muestra
144
-.1041087
11.7830248
.035
.035
-.033
.425
.994
N
Media
Desviación típica
Parámetros normales a,b
Absoluta
Positiva
Negativa
Diferencias másextremas
Z de Kolmogorov-Smirnov
Sig. asintót. (bilateral)
Error forCASOS fromEXSMOOTH,MOD_6 WI A.20 G .00 D
.00
La distribución de contraste es la Normal.a.
Se han calculado a partir de los datos.b.
YEAR, not periodic
140
120
100
80
60
40
20
Número de Casos
Fit for CASOS from E
XSMOOTH, MOD_6 WI A
Preparado por: León Dario BelloCIEM
Gráfico de Pronosticos
YEAR, not periodic
2000
2000
1999
1998
1998
1997
1996
1996
1995
1994
1994
1993
1992
1992
1991
1990
1990
1989
1988
1988
140
120
100
80
60
40
20
Número de Casos
Fit for CASOS from A
RIMA, MOD_16 NOCON
El conocimiento del área específica será de gran ayuda para seleccionar modelo adecuado. el participante puede comparando los errores absolutos de otros modelos y realizando las pruebas de residuales, encontrar otros modelos validos.
Preparado por: León Dario Bello
Fecha
JUN 1999
JUL 1998
AUG 1997
SEP 1996
OCT 1995
NOV 1994
DEC 1993
JAN 1993
FEB 1992
MAR 1991
APR 1990
MAY 1989
JUN 1988
JUL 1987
AUG 1986
SEP 1985
OCT 1984
NOV 1983
DEC 1982
JAN 1982
120
100
80
60
40
20
0
HOMBRE
LINT(HOMBRE)
Fecha
140
120
100
80
60
40
20
0
HOMBRE
MUJER
TOTAL
MORTALIDAD POR ACCIDENTE EN BOGOTÁ ENERO 1995 – OCTUBRE
1999
Estimar valores perdidos.Identificar componentes de la serieNo existencia de tendencia ni estacionalidad, ajustar suavización simpleExiste tendencia sin estacionalidad, ajustar HoltExiste tendencia y estacionalidad, ajustar WinterAjustar modelos mínimo cuadráticos y comparar SCEValidar supuestos de los residualesCalcular los pronósticos.
Preparado por: León Dario BelloCIEM