49
Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico Santa María 5 de abril de 2012

Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

Embed Size (px)

Citation preview

Page 1: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

Introducción a las Series Cronológicas

Ronny Vallejos

Universidad Técnica Federico Santa María

5 de abril de 2012

Page 2: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

Índice general

1. Modelos Ingenuos 21.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2. Objetivo del Estudio de Series Cronológicas . . . . . . . . . . . . . . . . . . . . 21.3. Modelos de Suavizamiento Exponencial . . . . . . . . . . . . . . . . . . . . . . . 3

1.3.1. Suavizamiento Exponencial Simple . . . . . . . . . . . . . . . . . . . . . 41.3.2. Suavizamiento Exponencial Doble . . . . . . . . . . . . . . . . . . . . . . 91.3.3. Suavizamiento Exponencial Triple . . . . . . . . . . . . . . . . . . . . . 11

1.4. Filtrado de Series Cronológicas . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.4.1. Diferenciación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.4.2. Medias Móviles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.4.3. Transformaciones que Estabilizan la Varianza . . . . . . . . . . . . . . . 15

1.5. Método de Descomposición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.5.1. Estimación de la Tendencia (Tt) . . . . . . . . . . . . . . . . . . . . . . . 171.5.2. Estimación de la Variación Estacional (Et) . . . . . . . . . . . . . . . . 191.5.3. Predicción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.6. Método de Holt-Winters . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.6.1. Caso no Estacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.6.2. Caso Estacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1.7. Modelos Ingenuos en R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2. Procesos Estacionarios 302.1. Procesos Estocásticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302.2. Procesos de Segundo Orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332.3. Procesos Estacionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362.4. Procesos Ergódicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

1

Page 3: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

1

Modelos Ingenuos

1.1. Introducción

En las mayorías de las áreas del saber es posible disponer de observaciones de una variableestadística a través del tiempo. El análisis de series de tiempo pretende extraer toda la infor-mación que sea posible desde los datos con el fin de determinar patrones o comportamientosque permitan conjeturar los valores futuros. En este capítulo introductorio abordaremos elproblema desde un punto de vista intuitivo, es decir, estudiaremos modelos que se sustentanen argumentos eurísticos, lejos de cualquier formalidad. En los capítulos posteriores daremoslos elementos probabilísticos necesarios para determinar predicciones, intervalos de confianzaasociados a las predicciones cuando las observaciones provienen de modelos paramétricos.

Las series cronológicas han sido estudiadas ampliamente debido a las diversas aplicacionesen las cuales son objeto de estudio. Podemos mencionar algunas áreas como economía, me-teorología, medicina, geofísica, entre otras. Algunas series pueden ser observadas de maneracontinua en el tiempo (por ejemplo temperatura). Estas se denominan series de tiempo con-tinuas. Sin embargo la mayoría de las series que estudiaremos son discretas. En este textoconsideraremos series de tiempo discretas y equiespaciadas en el tiempo.

Definición 1.1. Una serie cronológica o serie de tiempo es una colección de observaciones deun cierto fenómeno hechas secuencialmente en el tiempo.

Anotaremos una serie de tiempo Zt1 , Zt2 , . . . , Ztn donde Zti denota el valor tomado por elproceso en el instante ti. Habitualmente supondremos que la serie es equiespaciada, es decir,que existe un h ∈ R

+ tal que ti+1 − ti = h, para todo 1 ≤ i ≤ n − 1. También supondremosque la serie comienza en el instante t1 = 0 o t1 = 1 dependiendo de la propiedad que se quiereilustrar. Esto quiere decir que en algunos casos consideraremos Z1, Z2, · · · , Zn y en otros casosZ0, Z1, . . . , Zn.

1.2. Objetivo del Estudio de Series Cronológicas

A continuación describimos algunos objetivos básicos del estudio de series de tiempo. Sinembargo, dependiendo del área de interés podrían existir otros objetivos que no se mencionanaquí.

1. Modelación. Es razonable querer encontrar un modelo matemático que sea capaz deexplicar el comportamiento de la serie en cuestión. Esta tarea puede resultar muy com-

2

Page 4: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

plicada, debido a que no siempre la serie en estudio satisface todos los supuestos delmodelo.

2. Predicción. Inferir valores futuros de la serie dando en lo posible limites de confianzapara las predicciones.

3. Diseño de Sistemas de Control. Se desea que la serie mantenga sus valores dentro deciertos márgenes. Cuando la serie toma valores indeseados hay ciertas variables exógenasque podemos modificar de modo que el proceso se mantenga en su estado normal. Esteproceso se llama retroalimentación. Por ejemplo, es posible usar series de accidentesautomovilísticos diarios en una cuidad para predecir cuando iniciar una campaña depublicidad de prevención de accidentes.

Dada una serie de tiempo Z1, Z2, . . . , Zn, es posible realizar análisis descriptivos. General-mente el primer paso para analizar una serie es graficarla, es decir, se construye un diagramadonde se grafica Zt versus t. Esto debe hacerse siempre, independientemente de cuán comple-jos o simples sean los procedimientos que se apliquen posteriormente. El gráfico de la seriepermite:.

a. Detectar posibles outliers. Los outliers son observaciones que pueden ser cuasa de serioserrores de medición o en que el fenómeno en estudio presentó un comportamiento abso-lutamente inusual. Por ejemplo si Zt representa la cantidad producida en una industriade un cierto producto, Z6 podría corresponder a un mes en que hubo huelga.

Si se sospecha que una observación es un outlier, se debe reunir información adicionalsobre posibles factores que afectaron el proceso. Si la serie tiene un comportamientosimilar antes y después del outlier se podría pensar en eliminarlo o reemplazarlo porotra observación usando algún procedimiento o criterio sencillo. Debemos recalcar quela definición formal de un outlier no es un problema sencillo de abordar y está lejos delalcance de este manuscrito. Más adelante consideraremos algunos tipos de outliers queson bastante usados en el análisis de series de tiempo.

b. Detectar variaciones cíclicas o estacionales. Un efecto estacional lleva asociado un perío-do. Más adelante abordaremos el problema de estimar el periodo de la serie pero por elmomento podemos decir que cuando el periodo es evidente en la serie, un simple grá-fico puede evidenciar este comportamiento. Existen series que son periódicas y que elperiodo tiene un efecto muy significativo en la serie pero no es posible determinar esteperíodo por simple inspección. En tal caso usaremos el análisis espectral para descubrirlas periodicidades ocultas de una serie de tiempo.

En general el análisis de series de tiempo varía desde modelos muy simples hasta modelosmuy sofisticados. En este capítulo estudiaremos las técnicas más simples las cuales por el hechode ser simples no dejan de ser importantes. Estas técnicas también pueden ser usadas paraconstruir modelos más complejos.

1.3. Modelos de Suavizamiento Exponencial

Una clase de modelos que en el pasado adquirió gran popularidad debido a su simpleza esla clase de modelos de suavizamiento exponencial. A continuación se dan los detalles de tresmodelos que intentan capturar tres tipos distintos de tendencias en una serie de tiempo.

Ronny Vallejos 3

Page 5: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

1.3.1. Suavizamiento Exponencial Simple

Sea Z1, Z2, . . . , Zn una serie de tiempo, la cual supondremos que no tiene tendencia, esdecir, la serie es localmente constante, más un comportamiento irregular. Utilizaremos comopredicción de los valores futuros, a partir del origen n el promedio de la serie en el instantet = n. Notemos que si la serie de tiempo Z1, Z2, . . . , Zn consiste en una muestra aleatoria detamaño n, entonces es natural pensar en un promedio muestral de las observaciones que daigual peso a cada observación. Sin embargo, en el contexto de series de tiempo, es razonabledar un peso mayor a las observaciones más recientes que las observaciones del pasado remoto.Una forma de lograr esto es dando ponderaciones distintas a las observaciones a través de unpromedio ponderado, cuyos pesos decaen geométricamente. De este modo el nivel medio de laserie (Zt) en el instante t es estimado por:

Zt = αZt + α(1− α)Zt−1 + α(1− α)2Zt−2 + . . .+ . . . , 0 < α < 1, 1 ≤ t ≤ n. (1.1)

Luego la predicción de Zn+k es la estimación del nivel en el instante n + k. Por ejemplo, sidenotamos por Zn(1) o Zn+1 el valor estimado de la serie en el instante t = n+ 1, entonces

Zn+1 = Zn(1) = αZn + α(1− α)Zn−1 + α(1 − α)2Zn−2 + . . .+, 0 < α < 1, 1 ≤ t ≤ n. (1.2)

Note que la ecuación (1.2) también puede ser aplicada para aquellos puntos en el segmentoobservado de la serie, es decir para 1 ≤ t ≤ n. También note que la ecuación (1.2) contieneuna cantidad infinita de términos, pero en la práctica sólo disponemos de un número finito deellos. Una forma de representar (1.2) en una forma más compacta es la siguiente

Zt(1) = αZt + (1− α)Zt−1(1), 0 < α < 1, 1 ≤ t ≤ n. (1.3)

Observación 1.1. Los pesos αi decaen en forma geométrica. En efecto

∞∑

i=0

α(1 − α)i = 1.

Además, como α(1 − α)i ≤ α(1 − α)j , si i ≥ j, entonces los pesos asignan más importanciaal pasado reciente de la serie y menos importancia al pasado remoto de la serie satisfaciendonuestro requerimiento inicial.

Observación 1.2. Si Z0(1) = Z1, entonces es posible usar la ecuación (1.3) de manerarecursiva para generar una nueva serie que contendrá los valores predichos asociados a la serieoriginal. La forma de inicializar la serie de valores predichos no es única. Otra manera simplede inicializar la serie es considerando Z0(1) como el promedio de las primeras observacionesde la serie (por ejemplo, considerando el primer periodo o el 10% de los valores observados).

El procedimiento definido por la ecuación (1.3) se denomina suavizamiento exponencialsimple. La constante α se llama constante de suavizamiento, la cual debe elegirse usandoalgún criterio de optimalidad.

Consideremos nuevamente la ecuación (1.3),

Zt(1) = αZt + Zt−1(1) − αZt−1(1)

= α[Zt − Zt−1(1)] + Zt−1(1)

= αet + Zt−1(1),

Ronny Vallejos 4

Page 6: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

donde et = Zt − Zt−1(1). et se denomina error de precicción a un paso en el tiempo t y midela distancia entre el valor predicho y el valor original de la serie en el instante t. et es similaral concepto de residuo en el contexto de regresión.

Aún está pendiente el problema de cómo estimar α. Un método muy sencillo consiste encalcular los errores de predicción y luego considerar aquel valor de α que minimice la suma decuadrados de dichos errores, es decir,

α = argmınα

n∑

t=1

e2t .

En la práctica es posible calcular la cantidad∑n

t=1 e2t para varios valores de α en el intervalo

(0, 1) y luego encontrar el valor de α que minimice el error cuadrático medio (EMC) depredicción

∑nt=1 e

2t .

Ejemplo 1.1. Los siguientes datos corresponden a la producción mensual en toneladas deun cierto producto observados durante dos años consecutivos. Los valores se encuentran en laTabla 1.1. Supongamos que un modelo de suavizamiento exponencial simple es adecuado para

MES AÑO 1 AÑO 2 MES AÑO 1 AÑO 2En 362 276 Jul 375 344Fe 381 334 Ag 349 337Ma 317 394 Se 386 345Ab 297 334 Oc 328 362Ma 399 384 No 389 314Ju 402 314 Di 343 365

Tabla 1.1: Producción mensual en toneladas.

este problema con α = 0.02. En la Figura 1.1 se muestra un gráfico de los datos a través deltiempo. Es posible observar que la serie aparentemente no tiene tendencia. Esto concuerdacon el supuesto del método de suavizamiento exponencial simple. También se observa un clarocomportamiento estacional. Sea Z0(1) =

16(362 + . . .+ 402) = 359.67. Entonces

Z1(1) = 0.02 × 362 + 0.98 × 359.67 = 359.72.

Continuando con este proceso obtenemos los valores de los errores de predicción (redondeados)que se muestran en la Tabla 1.2. De estos datos se obtiene que ECM =

∑24t=1 = 27.74.

Considerando otros valores de α en la generación de los errores se obtienen valores del ECMque se muestran en la Tabla 1.3. Como regla general empírica, valores de α entre 0.01 y 0.03resultan efectivos.

Observación 1.3. Consideremos nuevamente la ecuación (1.3) pero escribamos la predicciónde la variable Zt, k pasos adelante tomando como punto de partida t = n,

Zn(k) = αZn + (1− α)Zn−1(1),∀k ≥ 1. (1.4)

Entonces la predicción es constante cuando se considera más de un paso adelante ya que ellado derecho de la ecuación 1.4 no depende de k. Una modificación que parece razonable esconsiderar una ecuación que sea recursiva en k a partir de t = n, es decir,

Zn(k) = αZn + (1− α)Zn(k − 1),∀k ≥ 1. (1.5)

Esto permite adaptar la predicción considerando una combinación lineal convexa entre elúltimo valor de la serie y las predicciones para k ≥ 1.

Ronny Vallejos 5

Page 7: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

Tiempo

Prod

ucci

ón M

ensu

al

5 10 15 20

280

300

320

340

360

380

400

Figura 1.1: Producción mensual en toneladas

t Zt Zt−1(1) et = Zt − Zt−1(1) t Zt Zt−1(1) et = Zt − Zt−1(1)

1 362 360 2 13 276 360 -842 381 360 21 14 334 358 -243 317 360 -43 15 394 358 314 297 359 -62 16 334 358 -245 399 358 -41 17 384 358 266 402 359 43 18 314 359 -457 375 360 15 19 344 358 -148 349 360 -11 20 337 357 -209 386 360 26 21 345 357 -1210 328 360 -32 22 362 357 511 389 360 29 23 314 357 -4312 343 360 -17 24 365 356 9

Tabla 1.2: Error de predicción a un paso para t = 1, . . . , 24.

α 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20ECM 27.74 28.02 28.03 28.48 28.79 28.98 29.49 29.75 30.27 30.77

Tabla 1.3: ECM para valores de α en el intervalo (0.02, 0.2).

Supongamos ahora que Z0, Z1, Z2, . . . , Zn es una colección de variables aleatorias y α ∈(0, 1) es una constante. Entonces podemos reescribir la ecuación (1.3) considerando la condicióninicial Z0(1) = Z1, y entendiendo que la predicción del suavizamiento exponencial simple es aun paso, entonces

Zt = αZt + (1− α)Zt−1, t ≥ 1. (1.6)

Ronny Vallejos 6

Page 8: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

Resultado 1.1. Considere un suavizador Zt como en la ecuación (1.6) y α ∈ (0, 1). Entonces

Zt = αt−1∑

j=0

(1− α)jZt−j + (1− α)tZ0, t ≥ 1. (1.7)

Observación 1.4. Note que Zt = Zt−1(1).

Demostración. La demostración se realiza por inducción sobre t. Para t = 1 se tiene queZ1 = αZ1 + (1− α)Z0. Supongamos que la ecuación (1.7) se satisface para t, entonces

Zt+1 = αZt+1 + (1− α)Zt = αZt+1 + (1− α)

α

t−1∑

j=0

(1− α)jZt−j + (1− α)tZ0

= αZt+1 + αt−1∑

j=0

(1− α)j+1Zt−j + (1− α)t+1Z0

= αZt+1 + αt∑

k=1

(1− α)kZt−(k−1) + (1− α)t+1Z0

= αt∑

j=0

(1− α)jZt+1−j + (1− α)t+1Z0.

Resultado 1.2. Supongamos que Z0, Z1, . . . , Zn es una colección de variables aleatorias conmedia constante µ y varianza constante σ2. Entonces para Zt como en (1.7) se tiene

E[Zt] = µ.

Demostración. Usando el resultado anterior, tenemos que

E[Zt] = αt−1∑

j=0

(1− α)jµ+ µ(1− α)t = µ(1− (1− α)t) + µ(1− α)t = µ.

Resultado 1.3. Supongamos que Z0, Z1, . . . , Zn es una colección de variables aleatorias nocorrelacionadas con media constante µ y varianza constante σ2, entonces para Zt como en(1.7) se tiene

V[Zt] < σ2, cuando t −→ ∞.

Demostración.

V[Zt] = α2t−1∑

j=0

(1− α)2jV[Zt−j ] + (1 − α)2tV[Z0]

= α2t−1∑

j=0

(1− α)2jσ2 + (1− α)2tσ2 = α2σ2 1− (1− α)2t

1− (1− α)2+ (1− α)2tσ2

=σ2α

2− α< σ2, cuando t −→ ∞.

Ronny Vallejos 7

Page 9: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

Resultado 1.4. Suponga que Z0, Z1, . . . , Zn es una colección de variables aleatorias que sat-isfacen E[Zt] = µ, 0 < t ≤ N − 1 y E[Zt] = λ,∀t ≥ N. Entonces

E[Zt] = λ, cuando t −→ ∞.

Demostración.

E[Zt] = α

t−N∑

j=0

(1− α)jλ+ α

t−1∑

j=t−N+1

(1− α)jµ+ (1− α)tµ

= λ(1− (1− α)t−N+1) + µ((1− α)t−N+1(1− (1− α)N−1) + (1− α)t

)

−→ λ, cuando t −→ ∞.

El resultado anterior establece que el valor medio del suavizador es sesgado para valoresde t mayores a N, sin embargo, a medida que la serie se aleja del punto t = N el efecto de lasobservaciones iniciales en el valor medio cada vez es menos influyente.

Consideremos ahora un modelo de la forma

Zt = g(t) + ǫt, t = 1, 2, . . . , n, (1.8)

donde el funcional g(·) es desconocido. Entonces un estimador no paramétrico de la funcióng(t) está dado por

g(t) =

∑ns=1 ZsK(s−t

h )∑ns=0K(s−t

h ), (1.9)

donde h es una constante conocida como ancho de banda y K(·) es una función real no negativae integrable que satisface las siguientes propiedades:

i)∫K(u)du = 1.

ii) K(u) = K(−u),∀u.El estimador (1.9) ha sido ampliamente estudiado en el contexto de regresión y fue propuestopor Nadaraya (1964) y Watson (1964) y es conocido en la literatura como el estimador de kernelde Nadaraya-Watson. Existe una familia grande de funciones que satisfacen los supuestos i) yii). Una lista de posibles kernels que pueden ser usados puede ser encontrada en

http://en.wikipedia.org/wiki/Kernel_regression.

En el contexto de series de tiempo, consideremos nuevamente Z1, Z2, . . . , Zn. Entonces si de-seamos predecir la variable Z en el instante n+1 podemos escribir el predictor Zn+1 como unpromedio ponderado de las observaciones pasadas con pesos que decaen geométricamente. Siasumimos que Z0 = 0 en la ecuación (1.7), entonces

Zn+1 = αn−1∑

j=0

(1− α)jZn−j, (1.10)

donde 0 < α < 1. Un simple ajuste que tiene asociado pesos cuya suma es 1 es el estimador

Zn+1 =

∑n−1j=0 (1− α)jZn−j∑n−1

j=0 (1− α)j. (1.11)

Ronny Vallejos 8

Page 10: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

Si definimos h = −(t−1)/(n−1) ln(1−α) y Ke(u) = exp(u)1u≤0, entonces se puede demostrarque la ecuación (1.11) puede ser reescrita en la forma

Zn+1 =

∑nt=1 Ke

(t−(n+1)

h

)Zt

∑nt=1 Ke

(t−(n+1)

h

) . (1.12)

Esto muestra que el suavizamiento exponencial simple es equivalente al estimador de Nadaraya-Watson para un kernel y ancho de banda específico. Una discusión más detallada respecto alsuavizamiento via kernels puede ser encontrada en Wand y Jones (1995) y Gijbels y Wand(1999).

1.3.2. Suavizamiento Exponencial Doble

En esta subsección consideraremos que la serie de tiempo Z1, Z2, . . . , Zn tiene tendencialineal. Es decir, el nivel medio de la serie cambió en el tiempo en forma lineal. Podemos suponerque el modelo subyacente es un modelo de regresión lineal simple de la forma

Zt = β0 + β1t+ ǫt, t = 1, 2, . . . , n,

y estimar los parámetros del modelo vía minimos cuadrados o máxima verosimilitud. Sinembargo usaremos un procedimiento llamado suavizamiento exponencial doble. En este casoasumiremos que los parámetros son variables en el tiempo de tal manera que

β1t =α

1− α(Zt − Zt), donde

Zt = αZt + (1− α)Z t−1,

Zt = αZt + (1− α)Zt−1,

y β0t se estima mediante

β0t = 2Zt − Zt − tβ1t

= 2Zt − Zt − t

1− α(Zt + (1− α)Zt)

].

La formula de predicción para t = n+ k es

Zn(k) = β0n + β1n(n+ k)

=[β0n + nβ1n

]+ β1nk

= a0n + β1nk,

donde a0n = β0n + nβ1n = 2Zn − Zn. Luego

Zn(k) = 2Zn − Zn + β1nk

= 2Zn − Zn +α

1− αZnk − α

1− αZnk.

Por lo tanto,

Zn(k) =

[2 +

αk

1− α

]Zn −

[1 +

αk

1− α

]Zn. (1.13)

Ronny Vallejos 9

Page 11: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

Observación 1.5. Notemos que en este procedimiento se aplica suavizamiento exponenciasimple dos veces; primeramente a la serie original y a luego a la serie suavizada.

Observación 1.6. Para inicializar el algoritmo se necesita conocer Z0 y Z0. Una forma esconsiderar β10 =

α1−α (Z0 − Z0) y β00 = 2Z0 − Z0. despejando Z0 y Z0 nos queda

Z0 = β00 −1− α

αβ10,

Z0 = β00 − 21− α

αβ10.

Las estimaciones β00 y β10 pueden ser obtenidas usando mínimos cuadrados con las primerasobservaciones de la serie. Otra alternativa para inicializar el algoritmo consiste en tomar Z1 =

Z1 = Z1.

Ejemplo 1.2. Consideremos los siguientes datos con α = 0.8.

t Zt Zt Zt Zt − Zt β0t β1t1 1 1 1 0 0 12 2 1.80 1.64 0.16 0.64 1.963 3 2.76 2.54 0.22 0.88 2.984 8 6.95 6.06 0.89 3.56 7.845 10 9.40 8.70 0.70 2.80 10.16 12 11.5 10.94 0.56 2.24 12.067 21 19.09 17.46 1.63 6.52 20.728 24 23.01 21.10 1.91 7.64 24.929 27 26.20 25.34 0.86 3.44 27.06

Tabla 1.4: Suavizamiento exponencial soble para una serie sin cambios pronunciados.

Tiempo

2 4 6 8

05

1015

2025

Serie OriginalPrimer SuavizadoSegundo Suavizado

Figura 1.2: Serie original, serie suavizada y serie con doble suavizado.

Ronny Vallejos 10

Page 12: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

Para tener una mejor apreciación acerca de las series generadas graficamos Zt, Zt, y Zt

versus t. Estas series se muestran en la Figura ??. Es claro que si la serie no presenta cambiostan pronunciados los valores de las series Zt, y Zt representan valores suavizados respecto ala serie original cuando la serie posee una tendencia lineal.

1.3.3. Suavizamiento Exponencial Triple

En este caso supondremos que la serie Z1, Z2, . . . , Zn exhibe una tendencia cuadrática porconsiguiente los metodos de suavizamiento exponencial simple y doble no son aplicables a seriescon este tipo de comportamiento. La idea es considerar un triple suavizamiento siguiendo loslineamientos con los cuales fue construido el suavizamiento exponencial doble. Es decir, elmodelo en cuestión es:

Zt = β0 + β1t+ β2t2, t ≥ 1.

las ecuaciones del suavizamiento son las siguientes:

Zt = αZt − (1− α)Zt−1,

Zt = αZt + (1− α)Zt−1,

Zt = αZt + (1− α)Z t−1.

La ecuación de predicción para t = n+ k es

Zn(k) = an + bnk + cnk2, k ≥ 1 (1.14)

donde an, bn y cn son estimaciones de los parámetros β1, β2 y β3 respectivamente, dadas por

an = 3Zn − 3Zn + Zn,

bn =α2

2(1− α)

((6− 5α)Zn − 2(5− 4α)Zn + (4− 3α)Zn

),

cn =α2

2(1− α)

(Zn − 2Zn + Zn

).

Para estimar la constante α procedemos como antes. Para iniciar el algoritmo podemos usar

por ejemplo Z1 = Z1 = Z1 = Z1. Otra forma de inicializar el proceso recursivo es resolviendoel sistema

a0 = 3Z0 − 3Z0 + Z0,

b0 =α2

2(1 − α)

((6− 5α)Z0 − 2(5− 4α)Z0 + (4− 3α)Z0

),

c0 =α2

2(1 − α)

(Z0 − 2Z0 + Z0

).

Los valores de a0, b0 y c0 se pueden obtener usando mínimos cuadrados en el modelo

Zt = a+ bt+ ct2 + ǫt, t = 1, 2, . . . , n0,

donde n0 << n.En esta subsección hemos considerado tres ejemplos de modelos ingenuos para tratar series

de tiempo sin tendencia, con tendencia lineal y cuadrática. Existen muchos ejemplos en que

Ronny Vallejos 11

Page 13: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

las series de tiempo no presentan este tipo de tendencias, sino patrones más complejos. Eneste caso también es posible definir modelos ingenuos lo suficientemente flexibles para tratareste tipo de series. Antes de continuar en esta dirección nos concentraremos en un problemaque es muy frecuente en Ingeniería, el filtrado de una serie de tiempo.

1.4. Filtrado de Series Cronológicas

Existen muchas situaciones en las cuales es necesario filtrar una serie de tiempo. Porejemplo si se dispone de una serie de tiempo con una clara tendencia lineal pero existe ruidoen la señal y este no permite una estimación eficiente de la tendencia, entonces un paso previorecomendado es filtrar (suavizar) la serie antes de estimar la tendencia. Existen varios métodospara filtrar el ruido inherente en una serie. Aquí revisaremos algunos de ellos.

1.4.1. Diferenciación

La diferenciación tiene como objetivo eliminar la tendencia de una serie. La diferencia deorden uno se define como sigue:

Yt = ∇Zt = Zt − Zt−1 = (1−B)Zt

donde BZt = Zt−1. El operador de retardo B será analizado más adelante. Por el momento esnecesario entender que si el operador de diferencia es aplicado a una serie que tiene tendencialineal, entonces la serie diferenciada es una constante respecto al tiempo. Más aún, podemosplantear el siguiente resultado

Proposisión 1.1. Si Zt =∑m

j=0, ajtj ∈ N, donde aj es una constante para todo j =

1, 2, . . . ,m, entonces ∇Zt es un polinomio de grado m− 1 en t y por lo tanto ∇m+1Zt = 0.

Demostración. La demostración es un resultado inmediato del teorema del binomio

(t− 1)m =m∑

j=0

(m

j

)tm−j(−1)j = tm +mtm−1 + . . .+ (−1)m.

El resultado anterior sugiere que dada una secuencia con cierta tendencia, es posible aplicarel operador ∇ repetidas veces hasta que encontremos una secuencia transformada que tengauna tendencia razonablemente constante. En la práctica el orden de diferenciación es pequeño,es decir basta con aplicar una o dos diferencias para que la serie resultante no exhiba unatendencia. Sin embargo, también existen series que es imposible transformalas en series conaparente media constante.

En economía existen muchas series que poseen una tendencia no constante. En algunas deellas es posible remover dicha tendencia por diferenciación.

A continuación definiremos los filtros lineales de media móvil. Estos filtros sirven parasuavizar una serie como paso previo a la estimación de la tendencia.

Ronny Vallejos 12

Page 14: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

1.4.2. Medias Móviles

Dada una serie temporal Z1, Z2, . . . , Zn y un entero q, consideremos el filtro de media móvillineal

Yt =

q∑

j=−q

ajZt−j , 1 + q ≤ t ≤ n− q, (1.15)

donde aj son constantes para todo −q ≤ j ≤ q. Inmediatamente podemos ver que por ejemplosi aj = 0 para todo j < 0 y para todo j > 1, y además si a0 = a1 = 1, entonces Yt =∇Zt = Zt − Zt−1 es un caso particular de un filtro de medias móviles. Ahora si para todo j,aj = 1/(2q + 1), entonces el promedio de las observaciones

Yt =1

2q + 1

q∑

j=−q

Zt−j , q + 1 ≤ t ≤ n− q, (1.16)

también es un filtro lineal.

Resultado 1.5. Sea Zt = c0 + c1t. Entonces en la ecuación (1.16), Yt = Zt.

Demostración.

Yt =1

2q + 1

q∑

j=−q

Zt−j

=1

2q + 1

q∑

j=−q

(c0 + c1(t− j))

=1

2q + 1

c0(2q + 1) + c1

q∑

j=−q

(t− j)

= c0 + c1t−c1

2q + 1

q∑

j=1

j +

q∑

j=1

−j

= c0 + c1t = Zt.

Resultado 1.6. Sea Zt : t ∈ N una sucesión de variables aleatorias independientes conmedia cero y varianza σ2. Entonces E[Yt] = 0 y V[Yt] =

σ2

2q+1 , donde Yt es como en (1.16).

Demostración. Es fácil ver que E[Yt] = 0. Ahora

V[Yt] = V

q∑

j=−q

ajZt−j

=

q∑

j=−q

a2jV[Zt−j] =σ2

2q + 1.

Si q −→ ∞, V[Yt] −→ 0. Por lo tanto, el proceso Yt es muy cercano a su valor medio paravalores grandes de q.

Ronny Vallejos 13

Page 15: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

Ejemplo 1.3. Los datos mostrados a continuación corresponden a los totales mensuales enmiles de pasajeros internacionales desde Enero de 1949 hasta Diciembre de 1960. Esta seriese encuentra disponible en R bajo la sentencia AirPassengers. Mayor información sobre esteconjunto de datos puede ser encontrada en el sitio

http://stat.ethz.ch/R-manual/R-patched/library/datasets/html/AirPassengers.html

Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec

1949 112 118 132 129 121 135 148 148 136 119 104 118

1950 115 126 141 135 125 149 170 170 158 133 114 140

1951 145 150 178 163 172 178 199 199 184 162 146 166

1952 171 180 193 181 183 218 230 242 209 191 172 194

1953 196 196 236 235 229 243 264 272 237 211 180 201

1954 204 188 235 227 234 264 302 293 259 229 203 229

1955 242 233 267 269 270 315 364 347 312 274 237 278

1956 284 277 317 313 318 374 413 405 355 306 271 306

1957 315 301 356 348 355 422 465 467 404 347 305 336

1958 340 318 362 348 363 435 491 505 404 359 310 337

1959 360 342 406 396 420 472 548 559 463 407 362 405

1960 417 391 419 461 472 535 622 606 508 461 390 432

Tiempo

Tota

l en

mile

s

1950 1952 1954 1956 1958 1960

100

200

300

400

500

600

Figura 1.3: Serie Passengers. Datos mensuales entre 1949 y 1960.

De la Figura 1.3 se observa una clara tendencia lineal en la serie. También se observa unacomponente periódica. Al aplicar una diferencia y un filtro de media móvil a la serie Passengersobtenemos los patrones que se muestran en la Figura 1.4. Efectivamente la serie suavizada esuna representación más suave que la serie original. También se observa que una diferenciadaes suficiente para atenuar la tendencia creciente de la serie original de tal manera que la seriediferenciada oscila en torno a cero como se espera.

Notemos que el filtro (1.15) considera el pasado y el futuro de la serie de tiempo comoinformación importante a ser considerada. En los capítulos subsiguientes estudiaremos unanoción que restringirá la dirección en la cual los datos son considerados. Esta es la idea decausalidad de una serie de tiempo, permite proponer filtros que son sólo función del pasado y nofunción del futuro por el impedimento natural que tenemos de medir observaciones en instantes

Ronny Vallejos 14

Page 16: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

Time

1950 1952 1954 1956 1958 1960

020

040

060

0 Serie OriginalSerie DiferenciadaSerie Suavizada

Figura 1.4: Serie original, serie suavizada y serie diferenciada.

futuros. Además consideraremos la noción de ruido como componente adicional a un filtro demedia móvil. Este tipo de procesos es más flexible en el sentido que permite involucrar en unmodelo una componente estocástico que está fuera de nuestro control y obedece a fenómenosaleatorios que usualmente están presentes en la naturaleza.

Observación 1.7. En general, podemo notar que un filtro lineal queda caracterizado porla acción de los coeficientes que lo definen. Esta idea del filtrado se sustenta en las buenaspropiedades que poseen los filtros lineales, algunas de las cuales estudiaremos posteriormente.Por el momento podemos concebir la acción de un filtro lineal como una caja que permitesuavizar la serie original, tal como se ilustra en la Figura 1.5.

Zt YtFILTRO

LINEAL

Figura 1.5: Filtro lineal aplicado a una serie de tiempo.

1.4.3. Transformaciones que Estabilizan la Varianza

En el ejemplo 1.3 también se observa un patrón muy interesante respecto a la varianzade la serie Passengers la cual aumenta como función del tiempo. La pregunta es si existen

Ronny Vallejos 15

Page 17: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

transformaciones de los datos que hagan posible estabilizar la varianza en este tipo de situa-ciones. Aunque teóricamente no existe una transformación que estabilice la varianza de unavariable aleatoria con una distribución arbitraria, es posible usar algunas funciones que hansido estudiadas en el contexto de análisis de datos.

Una transformación que reduce la dependencia de la variabilidad del tiempo es llama-da transformación estabilizadora de la varianza. El logaritmo es un caso particular de unatransformación que estabiliza la varianza de una variable. Esta función también es un casoparticular de la transformación Tλ de Box-Cox (1964), donde el parámetro λ ≥ 0 debe serelegido de acuerdo a algún criterio. La transformación de Box-Cox está dada por

Tλ(Zt) =

(Zλ

t − 1)/λ, Zt ≥ 0, λ > 0,

log(Zt), Zt > 0, λ = 0.(1.17)

Las elecciones más populares del parámetro λ son λ = 0 o λ = 1/2. Es posible que unatransformación que estabiliza la varianza necesite un filtrado previo de la serie. Por ejemplopara la serie Passengers ya vimos que la serie diferenciada una vez es suficiente para produciruna serie que no tiene tendencia. Ahora, el efecto que tiene la aplicación del filtro de Box-Coxpara λ = 0

Tλ(Zt) = log(Zt)

se ilustra en la Figura 1.6. Claramente se aprecia que la varianza de la serie log(Zt) no dependedel tiempo Figura 1.6 (a). En la Figura 1.6 (b) se aprecia el efecto de la escala entre la serieoriginal y el logaritmo de la serie original. Note también que en este caso no es posible explorarlas bondades de un filtro de la forma log(∇Zt) = log(Zt − Zt−1), ya que la serie diferenciadacontiene valores negativos.

Time

loga

ritm

o de

la s

erie

org

inal

1950 1952 1954 1956 1958 1960

5.0

5.5

6.0

6.5

(a)

Time

serie

orig

inal

y lo

garit

mo

de la

ser

ie o

rgin

al

1950 1952 1954 1956 1958 1960

010

020

030

040

050

060

0 Serie Originallogaritmo de l a serie original

(b)

Figura 1.6: (a) Logaritmo de la serie Passengers; (b) Serie Passengers y logaritmo de la seriePassengers.

Ronny Vallejos 16

Page 18: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

1.5. Método de Descomposición

En esta sección estudiaremos series de tiempo de naturaleza estacional. Específicamentesupondremos que es posible representar una serie a través de un modelo de la forma

Zt = g(Tt, Et, At), (1.18)

donde Tt representa la tendencia de la serie, Et representa la variación estacional o ciclospresentes en la serie, At representa las variaciones accidentales (ruido) y g es una funcióncontinua. En la práctica la función g puede ser altamente no lineal. Los modelos más conocidosen este contexto son casos particulares del modelo (1.18) llamados modelos de descomposiciónaditivo, multiplicativo y mixto. Las ecuaciones de cada modelo se muestran a continuación:

(a) Modelo Aditivo Zt = Tt + Et +At

(b) Modelo Multiplicativo Zt = Tt ·Et · At

(c) Modelo Mixto Zt = Tt ·Et +At

Notemos que el modelo (b) puede ser ser transformado en un modelo de la forma (a) aplicandologaritmo. Luego en lo que sigue nos limitarmos a estudiar los modelos aditivo y mixto.

En la siguiente subsección abordaremos la estimación de las componentes Tt y Et.

1.5.1. Estimación de la Tendencia (Tt)

El objetivo es ajustar un modelo de regresión. Podemos listar algunos de los modelos máspopulares sin excluir el estudio de algún modelo que no mencionaremos aquí.

(I) Modelo Lineal Tt = β0 + β1t+ ǫt(II) Modelo Exponencial Tt = β0e

β1 + ǫt(III) Modelos Cuadrático Tt = β0 + β1t+ β2t

2 + ǫt(IV) Modelo Exponencial Modificado Tt = β0 + β1r

t

(V) Curva de Gumpertz Tt = eβ0+β1rt + ǫt(VI) Curva Logística Tt =

1β0+β1rt

+ ǫt

En los modelos I-VI los parámetros β0, β1 ∈ R y r ∈ (0, 1).Los modelos anteriores pueden ser tratados con las herramientas usuales del análisis de

regresión. Es decir, el proceso de estimación puede ser llevado a cabo por el método de losmínimos cuadrados o máxima verosimilitud. Denotemos la estimación de la tendencia en elinstante t para un modelo que depende de p parámetros de la forma

Tt = g(β0, β1, . . . , βp−1, t) + ǫt

comoTt = g(β0, β1, . . . , βp−1, t),

donde β0, β1, . . . , βp−1 representan las estimaciones de los parámetros (β0, β1, . . . , βp−1 respec-tivamente.

Una vez estimada la tendencia, la predicción de ésta en el instante t = n+ k está dada por

Tn+k = g(β0, β1, . . . , βp−1, n+ k), k ≥ 1.

Note que los modelos (I)-(III) son lineales en los parámetros o pueden ser transformados enmodelos lineales. Los modelos (IV)-(VI) son no lineales de modo que las ecuaciones normales

Ronny Vallejos 17

Page 19: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

deben ser resueltas usando métodos iterativos. A continuación estudiaremos un método deestimación muy simple para el modelo exponencial modificado (IV).

Supongamos que un modelo exponencial modificado es apropiado para la serie en estudioque consiste en 3n observaciones de tal manera que es posible dividir las observaciones entres grupos con n observaciones cada uno. Denotaremos la suma de las observaciones en cadagrupo por S1, S2 y S3 respectivamente. Entonces se debe cumplir que

S1 = (β0 + β1r1) + (β0 + β1r

2) + . . .+ (β0 + β1rn),

S2 = (β0 + β1rn+1) + (β0 + β1r

n+2) + . . . + (β0 + β1r2n),

S3 = (β0 + β1r2n+1) + (β0 + β1r

2n+2) + . . .+ (β0 + β1r3n).

El sistema anterior es equivalente a

S1 = nβ0 + β1(r + r2 + . . . + rn) = nβ0 + β1r(1 + r + . . .+ rn−1),

S2 = nβ0 + β1(rn+ 1 + rn+2 + . . .+ r2n) = nβ0 + β1rn+1(1 + r + . . . + rn−1),

S3 = nβ0 + β1(r2n+1 + r2n+2 + . . .+ r3n) = nβ0 + β1r

2n+1(1 + r + . . .+ rn−1).

Usando la identidad

1 + r + r2 + . . .+ rn−1 =rn − 1

r − 1:= S,

tenemos que

S1 = nβ0 + β1rS, S2 = nβ0 + β1rn+1S, S3 = nβ0 + β1r

2n+1S.

Luego S2 − S1 = β1Sr(rn − 1) y S3 − S2 = β1Sr

n+1(rn − 1). Entonces S3−S2

S2−S1= rn. Esto

implica que r =(S3−S2

S2−S1

)1/n. De esta estimación podemos obtener estimaciones para β1,

β1 =(S2−S1)(r−1)

r(rn−1)2 y finalmente para β0, β0 =1n

(S1 − S2−S1

rn−1

).

Observación 1.8. Para aplicar este método al modelo de Gumpertz basta tomar log(Tt) = T ′t .

Para aplicarlo a la curva logística basta trabajar con 1/Tt = β0 + β1rt.

Ejemplo 1.4. Considere los siguientes datos

t Tt t Tt t Tt

1 297 9 556 17 9652 249 10 642 18 9563 340 11 670 19 9564 406 12 712 20 9905 464 13 808 21 10196 481 14 809 22 10217 549 15 867 23 10338 553 16 855 24 1127

Supongamos que el modelo Tt = β0+β1rt+ ǫt, t = 1, 2, . . . , 24, es apropiado para representar

la tendencia de la serie en estudio. En este caso podemos dividir la serie en tres grupos deobservaciones y usar el método descrito arriba para estimar los parámetros β0, β1 y r. Se

Ronny Vallejos 18

Page 20: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

tiene que S1 = 3339, S2 = 5919, S3 = 8032, S2 − S1 = 2580 y S3 − S2 = 2113. Usando estascantidades obtenemos

r = 0.97,

β1 = −1990.22,

β0 = 2199.07.

Luego, la tendencia estimada es

Tt = 2199.07 − 1990.22 × 0.97t.

Observación 1.9. Algo que es recomendable antes de estimar la tendencia de una serie essuavizar la serie original para evitar distorciones en los parámetros del modelo debido al ruidoinherente en la serie. Este filtrado preliminar puede hacerse usando los filtros de media móvilu otro filtro que produzca una versión suavizada de la serie original.

1.5.2. Estimación de la Variación Estacional (Et)

Si estimamos la tendencia de la serie original Zt entonces la serie original corregida porel efecto de la tendencia es

Wt = Zt − Tt, Modelo Aditivo,

Wt =Zt

Tt

, Modelo Mixto.

Estas son series de tiempo en que sólo deberían manifestarse efectos estacionales y variacionesaccidentales (ruido). Wt se llama serie residual (una vez que la tendencia ha sido removida).Entendemos que la sustracción (división) por la tendencia estimada no es el único método paraproducir una serie residual. Wt También puede ser el resultado de la sustracción (división) entrela serie original y una versión suavizada de la misma. Es decir si denotamos por Yt la seriesuavizada, entonces

Wt = Zt − Yt, Modelo Aditivo,

Wt =Zt

Yt, Modelo Mixto.

En un modelo aditivo, los valores de Wt oscilan en torno a cero y en el caso mixto Wt oscilaen torno a 1.

Supongamos que la serie tiene período conocido s, entonces

Et = Et+s = Et+2s = . . .

y basta con estimar las primeras s componentes. Es decir, E1, E2, . . . , Es. Por ejemplo, sisuponemos que disponemos de datos mensuales, basta con estimar la variación estacional paralas componentes del primer ciclo, E1, E2, . . . , E12. Primero calculamos

eh : Promedio de los valores de W en el mes h. Luego

e =1

12

1∑

h=1

2eh.

Las estimaciones de la variación estacional corregidas por el promedio son

Eh = eh − e,Caso Aditivo,

Eh = eh − (e− 1),Caso Mixto.

Ronny Vallejos 19

Page 21: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

1.5.3. Predicción

Una vez que se estima la tendencia y la variación estacional de un modelo de descomposiciónes posible predecir la serie en valores futuros no observados simplemente prediciendo cada unade sus componntes. Es decir, la predicción de la serie original en el instante t = n+ k, k ≥ 1es

Zn+k = Tn+k + En+k,Caso Aditivo,

Zn+k = Tn+k · En+k,Caso Mixto.

Observación 1.10. Para decidir entre un modelo aditivo o mixto usualmente se utiliza elgráfico de la serie. Si la estacionalidad es proporcional a la tendencia conviene usar un modelomixto (o multiplicativo). Este es el caso de muchas series de tiempo económicas. Si no existeun patrón claro de proporcionalidad entre la tendencia y la parte estacional pueden usarseambos métodos y luego comparar cuales predicciones son más precisas o exactas usando porejemplo el error cuadrático medio de predicción sobre valores observados de la serie.

Observación 1.11. Una de las ventajas de los modelos ingenuos en general es que son muysimples de estimar ya que no consideran una gran cantidad de parámetros. Sin embargo unade las desventajas notables es que no existe un modelo estadístico subyacente. Por lo tanto,en este contexto no tiene sentido construir intervalos de confianza para las predicciones. Enlos modelos que estudiaremos más adelante es posible construir intervalos aleatorios para laspredicciones.

Ejemplo 1.5. Considere los índices trimestrales de precios al por mayor descritos en la Tabla1.5 Se toma t = 1 como el primer trimestre de 2003. Un gráfico de la serie se muestra en la

Trimestre 2003 2004 2005 2006 2007Primer Trimestre 120 130 140 150 180Segundo Trimestre 90 110 120 140 180Tercer Trimestre 90 110 110 140 170Cuarto Trimestre 100 130 150 170 190

Tabla 1.5: Índices de precios trimestrales al por mayor.

Figura 1.7. Podemos ver que es razonable pensar que la tendencia de la serie es proporcionala la variación estacional, por lo tanto consideraremos un modelo de composición mixto. Parasuavizar la serie aplicamos un filtro de media móvil con 5 términos motivado por el hechoque la serie en cuestión está medida en trimestres. Entonces la serie suavizada es obtenida alaplicar

Yt =0.5Zt−2 + Zt−1 + Zt + Zt+1 + 0.5Zt+2

4, 3 ≤ t ≤ 18.

Los valores de la serie suavizada están en la Tabla 1.6. En la Figura 1.8 se aprecia claramenteque existe una tendencia lineal en la serie suavizada. Entonces parece razonable asumir unmodelo de la forma

Tt = β0 + β1t+ ǫt.

Con los datos de la Tabla 1.6 se obtuvo el siguiente modelo ajustado

Tt = 84.65 + 4.74t.

Ronny Vallejos 20

Page 22: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

Tiempo

Indi

ces

de P

reci

os a

l por

May

or

2003 2004 2005 2006 2007

100

120

140

160

180

Figura 1.7: Índices de precios trimestrales al por mayor.

Trimestre 2003 2004 2005 2006 2007Primer Trimestre - 110.00 125.00 136.25 171.25Segundo Trimestre - 116.25 127.50 147.50 177.50Tercer Trimestre 101.25 121.25 131.25 153.75 -Cuarto Trimestre 105.00 123.75 135.00 162.50 -

Tabla 1.6: Serie suavizada Yt por un filtro de media móvil

Tiempo

Ser

ie s

uavi

zada

2003 2004 2005 2006 2007

120

140

160

180

Figura 1.8: Serie suavizada por un filtro de media móvil.

El coeficiente de determinación en este caso es R2 = 0.96 indicando que el ajuste explica el96% de la variabilidad de la variable respuesta. La serie residual en este caso es obtenida

Ronny Vallejos 21

Page 23: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

usando un cuociente entre la serie original y la serie suavizada. Es decir

Wt =Zt

Yt.

Los valores se muestran en la Tabla 1.7. Luego obtenemos E1 = 1.11, E2 = 0.96, E3 =

Trimestre 2003 2004 2005 2006 2007Primer Trimestre - 1.18 1.12 1.10 1.05Segundo Trimestre - 0.95 0.94 0.95 1.01Tercer Trimestre 0.89 0.91 0.84 0.91 -Cuarto Trimestre 0.95 1.05 1.11 1.05 -

Tabla 1.7: Serie residual Wt.

0.89, E4 = 1.04. Finalmente las predicciones para los cuatro trimestres del año 2008 son lassiguientes:

1er Trimestre : Z21 = T21 · E1 = 203.75,

2do Trimestre : Z22 = T22 · E2 = 180.74,

3er Trimestre : Z23 = T23 · E3 = 171.75,

4to Trimestre : Z24 = T24 · E4 = 205.60.

Ejemplo 1.6. Al analizar cierta serie de tiempo trimestral se usó un método ingenuo obtenién-dose una ecuación de tendencia Tt = 84.65+4.71t y una serie de residuos Wt = Zt−Yt, con losvalores que se muestran en la Tabla 1.8. En base a los resultados y dado que t = 1 corresponde

Trim/Año 2007 2008 2009 2010 20111 - 20 15 13.75 8.752 - -6.25 -7.50 -7.50 2.503 -11.25 -11.25 -21.50 -13.75 -4 0.95 1.05 1.11 1.05 -

Tabla 1.8: Serie residual Wt.

al primer trimestre de 2007, el objetivo es predecir los valores de la serie en cada uno de lostrimestres de 2012.

Dada la información proporcionada en la formulación del ejemplo entendemos que se hausado un modelo de descomposición aditivo para producir los valores de la serie residual.Entonces e1 = 10.37, e2 = −4.68, e3 = −14.31, e4 = 5.93. Por lo tanto e = 0.33. Luego comola tendencia ha sido estimada, resta la estimación de la componente estacional.

E1 = e1 − e = 14.04,

E2 = e2 − e = −5.01,

E3 = e3 − e = −14.64,

E4 = e4 − e = 5.60.

Ronny Vallejos 22

Page 24: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

Además,

T21 = 183.56,

T22 = 188.27,

T23 = 192.98,

T24 = 197.69.

Finalmente,

Z21 = T21 + E21 = 197.60,

Z22 = T22 + E22 = 183.25,

Z23 = T23 + E23 = 178.33,

Z24 = T24 + E24 = 203.29.

Terminamos esta sección resumiendo las etapas del método de descomposición en un dia-grama de bloques como se muestra en la Figura 1.9

Ronny Vallejos 23

Page 25: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UT

FSM

Dep

artam

ento

de

Matem

ática

CA

PÍT

ULO

1.

MO

DE

LO

SIN

GE

NU

OS

MÉTODO DE DESCOMPOSICIÓN

Modelo Aditivo : Zt = Tt + Et +At

Modelo Mixto : Zt = Tt ·Et +At

Zt Zn+k

SUAVIZAMIENTO

DE LA SERIE

ORIGINAL

ESTIMACIÓN DE

LA TENDENCIA

Tt

PREDICCIÓN DE

LA TENDENCIA

Tn+k

CONSTRUCCIÓN

DE LA SERIE

ESTACIONAL Wt

ESTIMACIÓN

DE LA VARIACIÓN

ESTACIONAL Et

PREDICCIÓN DE LA

VARIACIÓN ESTACIONAL

En+k

MODELO ADITIVO

Zn+k = Tn+k + En+k

MODELO MIXTO

Zn+k = Tn+k · En+k

Yt

Wt

Tt

Et

Tn+k

En+k

MODELO ADITIVO

Wt = Zt − Tt

MODELO MIXTO

Wt = Zt/Tt

Figura 1.9: Método de Descomposición

Ronny

Vallejos

24

Page 26: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

1.6. Método de Holt-Winters

En esta sección consideramos una forma alternativa de proponer predicciones para valoresfuturos de una serie de tiempo. Estos métodos se basan en recursiones que dependen de unnivel, una pendiente y la estacionalidad de la serie (si existe).

1.6.1. Caso no Estacional

Este método consiste en suponer que la serie de tiempo se comporta localmente como unasuma de un nivel y una tendencia lineal, además de un residuo impredecible. Si denotamos Zt

y mt las estimaciones del nivel medio y la pendiente respectivamente en el instante t, podemosproponer ecuaciones de la forma

Zt = AZt + (1−A)(Zt−1 +mt−1

), 0 ≤ A ≤ 1, (1.19)

mt = C(Zt − Zt−1) + (1− C)mt−1, 0 ≤ C ≤ 1. (1.20)

Note que la estimación del nivel en el instante t − 1, Zt−1 junto con la estimación de latendencia mt−1 sugieren un nivel en el instante t dado por Zt−1 + mt−1. Esta estimación semodifica considerando la nueva observación Zt mediante la ecuación (1.19). En el instantet − 1 la pendiente de la recta es mt−1. Dado Zt, una nueva estimación para la pendiente esZt − Zt−1. Luego la pendiente en el instante t se estima como un promedio ponderado entrela estimación anterior y la estimación sugerida por el valor que la serie toma en el instante t.

Dado que las ecuaciones (1.19) y (1.20) funcionan en forma recursiva, pueden ser inicial-izadas considerando m2 = Z2 − Z1 y Z2 = Z2.

La ecuación de predicción para el instante t = n+ k es

Zn+k = Zn +mnk. (1.21)

1.6.2. Caso Estacional

A las suposiciones hechas en la sección anterior agregamos un factor estacional de periodoconocido s, multiplicativo respecto de la tendencia. Zt se interpreta como un nivel deses-tacionalizado. Anotando Et la estimación de la componente estacional en el instante t lasecuaciones que describen la recursión son las siguientes:

Zt = AZt

Et−s

+ (1−A)(Zt−1 +mt−1

), 0 ≤ A ≤ 1, (1.22)

mt = C(Zt − Zt−1) + (1− C)mt−1, 0 ≤ C ≤ 1. (1.23)

Et = DZt

Zt

+ (1−D)Et−s, 0 ≤ D ≤ 1. (1.24)

Una forma sencilla de resolver el problema de inicialización es considerando

Ej =Zj

1s

∑sk=1 Zk

, j = 1, 2, . . . , s,

Zs =1

s

s∑

k=1

Zk,

ms = 0.

Ronny Vallejos 25

Page 27: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

Aplicando recursivamente las ecuaciones (1.22)-(1.24) se estiman Zt,mt y Et para t = s +1, s+ 2, . . . , s + n. Luego las ecuaciones de predicción para t = n+ k, k = 1, 2, . . . , 2s son

Zn+k = (Zn +mnk)En+k−s, k = 1, 2, . . . , s, (1.25)

Zn+k = (Zn +mnk)En+k−2s, k = s+ 1, 2, . . . , 2s. (1.26)

El método anterior se puede adaptar al caso en que la estacionalidad es aditiva respecto de latendencia en lugar de mutiplicativa. En tal caso, las ecuaciones (1.22) y (1.24) se reemplazanpor

Zt = A(Zt − Et−s) + (1−A)(Zt−1 +mt−1

), 0 ≤ A ≤ 1, (1.27)

Et = D(Zt − Zt) + (1−D)Et−s, 0 ≤ D ≤ 1. (1.28)

Las correspondientes ecuaciones de predicción son

Zn+k = (Zn +mnk) + En+k−s, k = 1, 2, . . . , s, (1.29)

Zn+k = (Zn +mnk) + En+k−2s, k = s+ 1, 2, . . . , 2s. (1.30)

Observación 1.12. Hemos asumido que el periodo s es conocido. En la práctica usualmenteel periodo no se conoce y es necesario estimarlo. La estimación del periodo asociado a unaserie de tiempo será abordada más adelante en el contexto de análisis en el dominio de lafrecuencia.

Observación 1.13. La determinación de las constantes A,C y D se hace usando algunamedida de optimalidad. Por ejemplo, se pueden seleccionar aquellos valores que minimizan elerror cuadrático medio de predicción.

Ejemplo 1.7. Al analizar cierta serie formada por 32 datos trimestrales (1998-2005) medianteel método de Holt-Winters, se optó por un modelo aditivo con A = C = D = 0.3, obteniéndose:

Z32 = 224.25,m32 = 2.08, E32 = 4.18,

E31 = −3.06, E30 = −2.85, E29 = 3.12.

Transcurridos los dos primeros trimestres de 2006 la serie tomo los valores 239.25 el primertrimestre de 2006, y 217.06 el segundo trimestre de 2006. Usando esta información el objetivoes predecir la serie durante los últimos dos trimestres de 2006.

Primero, como estamos en presencia de una serie trimestral, asumiremos que s = 4. En-tonces

Z33 = 0.3(Z33 − E29) + 0.7(Z32 +m32) = 229.27,

m33 = 0.3(Z33 − Z32) + 0.7m32 = 2.96,

E33 = 0.3(Z33 − Z33) + 0.7E29 = 5.18,

Z34 = 0.3(Z34 − E30) + 0.7(Z33 +m33) = 228.53,

m34 = 0.3(Z34 − Z34) + 0.7m30 = −4.30.

Luego, usando las ecuaciones de predicción resulta

Z35 = 0.3Z34 +m34 + E31 = 227.32,

Z36 = 0.3Z34 +m34 · 2 + E32 = 236.41.

Ronny Vallejos 26

Page 28: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

1.7. Modelos Ingenuos en R

Por el momento en esta sección ver el sitio

http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm

1.8. Ejercicios

Problema 1.1.a) En el contexto del Resultado 1.4, encuentre una expresión para la varianza del suavizadorZt cuando t −→ ∞.b) Mediante simulaciones computacionles obtenga estimaciones de la varianza encontrada enla parte a) cuando t ≥ N. ¿Concuerda su resultado teórico con el valor encontrado usandosimulación pata t −→ ∞?

Problema 1.2. En este ejercicio es necesario obtener la serie asociada al calentamiento dela tierra descrito en grados centígrados entre los años 1900-1997. Esta serie es presentada enShumway and stoffer 2000, pagina 5. Para bajar el archivo globtemp.dat encuentre el sitiohttp://www.stat.pitt.edu/stoffer/tsa2/. En Data files, Debajo de Chapter 1 esta ubicado elarchivo deseado.a) Usando los datos de la serie globtemp.dat grafique los datos en el tiempo.b) Usando los valores para alpha, α = 0.01, 0.1, 0.2, 0.4, 0.6, 0.8, 1.0. Obtenga el valor de α queminimiza el error de predicción a un paso.c) Para el valor de α propuesto en b), use suavizamiento exponencial simple para predecir laserie para k = 1, 2, 3.d) Describa las bondades y limitaciones del modelo usado en los puntos anteriores.Problema 1.3. En un problema suavizamiento exponencial se proponen las siguientes ecua-ciones para predecir la serie en el instante t = n+ 1, donde 0 < α < 1.

a) Zt(1) =1αZt +

1α2Zt−1 + · · ·

b) Zt(1) = αZt + α2Zt−1 + · · ·¿Están estas ecuaciones de predicción bien definidas y predicen el futuro asignando mayor

importancia al pasado reciente? Justifique.

Problema 1.4. Demuestre que si h = −(t − 1)/(n − 1) ln(α) y Ke(u) = exp(u)1u≤0, lasecuaciones (1.11) y (1.12) son equivalentes.

Problema 1.5. Demuestre que para la transformación de Box-Cox se tiene que

lımλ↓0

Tλ(Zt) = log(Zt), Zt > 0.

Problema 1.6. El siguiente gráfico muestra una serie cronológica que consiste en 48 obser-vaciones secuanciales en el tiempo. Esta serie (lh) está disponible en R y se muestra en laFigura 1.10. En este problema usted debe modelar esta serie de tiempo. El objetivo final esproporcionar predicciones para t = 49, 50, 51, 52. Comente en forma concisa y clara qué modeloingenuo considera apropiado y explique en forma breve en qué consiste el método que ustedpropone incluyendo la estimación del modelo.

Ronny Vallejos 27

Page 29: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

Time

lh

0 10 20 30 40

1.5

2.0

2.5

3.0

3.5

Figura 1.10: Serie lh.

Problema 1.7. La Figura 1.11 muestra tres patrones diferentes. En cada caso, proponga unmodelo para describir cada serie. Comente y justifique su elección. Describa la estimación delos parámetros en cada caso.

Time

x

0 50 100 150 200

0e+

002e

+06

4e+

066e

+06

(a)

Time

x

0 50 100 150 200

050

100

150

200

(b)

Time

x

0 50 100 150 200

−30

−20

−10

010

2030

40

(c)

Figura 1.11: Tres patrones distintos en el tiempo.

Problema 1.8. Al analizar una serie cronológica formada por datos bimestrales, utilizandoel método ingenuo se optó por el siguiente modelo mixto.

T (t) = 2.65e0.12t.

Los valores de La serie residual una vez removida la tendencia se muestran en la Tabla 1.9.Dado que t = 1 corresponde al primer bimestre de 2001, prediga los valores para la serie encada uno de los bimestres de 2006.

Problema 1.9. Al analizar cierta serie formada por 20 datos trimestrales mediante el métodode Holt-Winters, se optó por un modelo aditivo con A = C = D = 0.3, obteniéndose: X20 =132.12, E20 = 3.12, E18 = −0.63, m20 = 2.58, E19 = −2.52 y E17 = 0.25. En el instante

Ronny Vallejos 28

Page 30: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 1. MODELOS INGENUOS

Bim/Año 2001 2001 2003 2004 20051 - 0.90 0.95 0.93 0.912 - 1.13 1.10 1.12 1.113 - 0.96 0.92 0.90 0.944 0.88 0.87 0.89 0.90 -5 1.10 1.11 1.09 1.10 -6 1.16 1.14 1.16 1.15 -

Tabla 1.9: Serie residual Wt.

t = 21 la serie tomó el valor 139.25. Usando esta información predecir los valores que la serietomará en los instantes t = 22, t = 23, y t = 24.

Ronny Vallejos 29

Page 31: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

2

Procesos Estacionarios

2.1. Procesos Estocásticos

En esta sección nuestro objetivo es estudiar los procesos estocásticos indexados en el tiem-po. Esta clase de procesos usualmente se conocen como series de tiempo o series cronológicas.En el contexto de Ingeniería, estos procesos también se conocen como señales medidas en eltiempo.

Un proceso estocástico es una familia o colección de variables aleatorias definidas en unespacio de probabilidad e indexadas en algún conjunto de índices. Precisamente, sea (Ω,F,P)un espacio de probabilidad y T ⊂ R

d. Un proceso estocástico es una función Z : (Ω,F,P) ×T −→ G ⊂ R, tal que para cada t ∈ T, Zt es una variable aleatoria. Un punto importante aenfatizar es que un proceso estocástico es una familia finita o infinita de funciones del tiempoy no sólo una función del tiempo.

La definición anterior nos permite definir una variedad grande de procesos. Por ejemplo,si T = Z, entonces Zt es una serie de tiempo. Similarmente, si T ⊂ R

d, d > 1 entonces Zt seconoce como un proceso espacial o campo aleatorio. Note que las realizaciones de los procesosestocásticos definidos sobre T = Z, son lineas y las realizaciones de procesos definidos sobreT = R

2 son superficies en el plano R2. G tiene que ver con los estados del proceso.

Ejemplo 2.1. Consideremos el proceso Zt : t ∈ R definido por la ecuación siguiente

Zt = A cos(ηt+ φ), t ∈ R, (2.1)

donde A es una variable aleatoria positiva, φ es una variable aleatoria independiente a A talque φ tiene una distribución uniforme sobre el intervalo (0, 2π) y η es una constante fija.Supongamos que A ∼ N(0, 1) y η = 1. Simulando las variables aleatorias A y φ podemosgenerar una realización del proceso Zt : t ∈ R descrito en la ecuación (2.1) como se muestraen la Figura 2.1. Ahora, consideremos el proceso Zt : t = (x, y) ∈ R

2 definido com sigue

Z(x, y) = β1x+ β2y + ǫ(x, y), (2.2)

donde ǫ(x, y) es una colección de variables aleatorias independientes e idénticamente dis-tribuidas con media cero y varianza σ2. Para β1 = 1, β2 = 1, y ǫ(x, y) ∼ N(0, 1) una realizaciónde este proceso se muestra en la Figura 2.2.

Ejemplo 2.2. Una moneda insesgada es lanzada. Si el resultado es cara, una onda Z1t =sen(5πt), t > 0 es enviada. Si el resultado de la moneda es sello, entonces una función rampa

30

Page 32: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

Time

z

0 200 400 600 800 1000

−2

−1

01

2

Figura 2.1: Una realización asociada al proceso (2.1)

x

y

Z

(a)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

(b)

Figura 2.2: (a) Una realización generada del proceso (2.2). (b) Imagen asociada a la realizaciónmostrada en (a).

Ronny Vallejos 31

Page 33: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

Z2t = t, t > 0 es enviada. El proceso estocástico generado en este caso consiste en dos realiza-ciones asociadas al lanzamiento de una moneda. Esa decir para Ω = C,S, existe una señalasociada a cada elemento del espacio muestral como se ilustra en la Figura 2.3.

Z1t

t

Z1t = t

Z2t = sen(5πt)Z2t

t

Sello

Cara

Ω

1

−1

Figura 2.3: Trayectorias asociadas a los resultados de un experimentoaleatorio.

Ejemplo 2.3. (Camino Aleatorio) Un camino aleatorio puede ser descrito de la siguientemanera: Una partícula se mueve a lo largo de una linea paso a paso. En cada paso se mueveuna unidad hacia la derecha o hacia la izquierda con probabilidades p y 1−p respectivamente,donde 0 < p < 1. Por simplicidad consideremos que cada paso toma una unidad de tiempo enocurrir de tal forma que la serie en cuestión puede considerarse como una serie equiespaciadaen el tiempo. Además supongamos que las posibles posiciones de la partícula son los númerosenteros sobre los ejes cartesianos. Por lo tanto la partícula describe una paseo sobre el planocartesiano yendo y volviendo, continuando hasta infinito. Si graficamos la posición Zn de lapartícula como una función del tiempo n su trayectoria es una linea en zig zag como la que semuestra en la Figura 2.4.

Supongamos que el Xn es el n-ésimo paso del proceso tal que

Xn =

+1 con probabilidad p,

−1 con probabilidad 1− p,

y las variables Xn son independientes. Si denotamos la posición inicial como X0 entonces enel tiempo n el proceso Zn lo podemos escribir en la forma

Zn = X0 +X1 + . . .+Xn.

Por lo tanto, un camino aleatorio es representado por una secuencia Zn : n ≥ 0 discreta enel tiempo.

Ronny Vallejos 32

Page 34: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

0

1

2

3

0 1 2 3 4 5 6 7

b

b

b

b

b

b

b

b

n

Zn

Figura 2.4: Una trayectoria posible de un camino aleatorio.

Ejemplo 2.4. Un movimiento Browniano Wt : t ≥ 0 es un proceso estocástico que satisfacelas siguientes propiedades:i) W0 = 0,ii) Wt es casi seguramente un proceso continuo,iii) Wt tiene incrementos independientes con distribución

Wt −Ws ∼ N (0, t − s) para 0 ≤ t ≤ s.

La condición iii) implica que si 0 ≤ s1 ≤ t1 ≤ s2 ≤ t2, entonces Wt1 −Ws1 y Wt2 −Ws2

son variables independientes.

Para formalizar las nociones de media, varianza y covarianza asociada a un proceso estocás-tico es necesario considerar una subclase de procesos en los cuales los dos primeros momentosson finitos.

2.2. Procesos de Segundo Orden

Definición 2.1. Sea Zt un proceso estocástico definido sobre T = R. Se dice que Zt esun proceso de segundo orden si E[Z2

t ] < ∞, para todo t ∈ T .

El siguiente teorema garantiza que la media, la varianza y la covarianza asociadas a unproceso estocástico de segundo orden existen.

Teorema 2.1. Sea Zt, t ∈ R un proceso de segundo orden. Entonces E[Zt] < ∞, V[Zt] < ∞y C(t, s) = Cov[Zt, Zs] < ∞.

Demostración. Sea Zt, t ∈ R un proceso de segundo orden. Note que para todo t ∈ R,(Zt − 1)2 ≥ 0. Esto implica que Z2

t ≥ 2Zt − 1,∀t ∈ R. Aplicando el operador esperanza aambos lados de la última desigualdad se tiene que 2E[Zt]− 1 ≤ E[Z2

t ] < ∞,∀t ∈ R

∴ E[Zt] < ∞,∀t ∈ R.

Ahora consideremos sin pérdida de generalidad que el proceso Zt, t ∈ R tiene media cero.Es decir E[Zt] = 0,∀t ∈ R. Entonces

C(t, s) = E[ZtZs].

Ronny Vallejos 33

Page 35: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

Similarmente al caso anterior (Zt−Zs)2 ≥ 0,∀t, s ∈ R. Luego Z2

t +Z2s ≥ 2ZtZs =⇒ E[2ZtZs] ≤

E[Z2t ] + E[Z2

s ] < ∞,∀t, s ∈ R.

∴ E[ZtZs] < ∞,∀t, s ∈ R.

Para ver que la varianza de un proceso de segundo orden es finita basta usar la identidadV[Zt] = E[Z2

t ]− E[Zt]2,∀t ∈ R.

Ahora podemos definir las funciones de media, varianza y covarianza asociadas a un procesode segundo orden como sigue.

Definición 2.2. Sea Zt, t ∈ T un proceso de segundo orden.a) La función de media del proceso Zt, t ∈ T está dada por

µ(t) : T × T −−−−→ R

(t, s) 7−→ µ(t) = E[Zt].

b) La función de varianza del proceso Zt, t ∈ T está dada por

V(t) : T × T −−−−→ R

(t, s) 7−→ V(t) = V[Zt].

c) La función de covarianza del proceso Zt, t ∈ T está dada por

C(t, s) : T × T −−−−→ R

(t, s) 7−→ C(t, s) = Cov[Zt, Zs].

Observación 2.1. Note que C(t, t) = Cov[Zt, Zt] = V[Zt].

Observación 2.2. En el contexto de variables aleatorias, la covarianza entre dos variables Xe Y con segundo momento finito, se define como

Cov[X,Y ] = E[(X − E[X])(Y − E[Y ]].

En el caso de un proceso estocástico Zt : t ∈ T nuestro interés es cuantificar la covarianzaentre dos variables aleatorias Zt y Zs que representan la misma cantidad medida en distintosinstantes del tiempo. Visto de esta manera, la función de covarianza de un proceso relacionauna variable de interés Zt con los valores que ha tomado en el pasado o el futuro debido a queel conjunto de índices T posee un orden cronológico entre sus elementos. Esta idea se ilustraen la Figura 2.5:

Recordemos que ∞ < Cov[X,Y ] < ∞. Luego, una cantidad que es acotada en un intervalofinito es más útil que la covarianza para cuantificar la asociación lineal entre dos variables.Análogamente al caso de la correlación entre variables aleatorias, en series de tiempo se definela función de correlación asociada al proceso Zt, t ∈ T como sigue:

ρ(t, s) : T × T −−−−→ R

(t, s) 7−→ ρ(t, s) = Cor[Zt, Zs] =C(t,s)√

C(t,t)C(s,s).

Definición 2.3. Sea C(t, s) una función de covarianza asociada a un proceso estocásticodefinido sobre el conjunto de indices T. C(t, s) es semifedinida positiva si para todo m ∈ N,para todo t1, t2, . . . , tm ∈ T, y para todo a1, a2, . . . , am ∈ R,

m∑

i,j=1

aiajC(ti, tj) ≥ 0.

Ronny Vallejos 34

Page 36: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

b

b

Zt(w)

t

Zs(w)

s

Z

Tiempo

Figura 2.5: Variables aleatorias indexadas en el tiempo.

Definición 2.4. Sea C(t, s) una función asociada a un proceso estocástico definido sobre elconjunto de indices T. Se dice que C(t, s) es una función semifedinida positiva si para todom ∈ N, para todo t1, t2, . . . , tm ∈ T, la matriz Σ = C(ti, tj)mi,j=1 es semidefinida positiva.

Teorema 2.2. Sea C la función de covarianza de un proceso estocastico arbitrario Zt : t ∈ T.Entonces C es semidefinida positiva.

Ejemplo 2.5. Determine si las siguientes funciones son semidefinidas positivasa) C(t, s) = sen(t) sen(s), s, t ∈ R.b) C(t, s) = sen(t+ s), s, t ∈ R.

Notemos en el primer caso que para todo m ∈ N, para todo t1, t2, . . . , tm ∈ R, y para todoa1, a2, . . . , am ∈ R,

m∑

i,j=1

aiajC(ti, tj) =

m∑

i,j=1

aiaj sen(ti) sen(tj) =

m∑

i=1

ai sen(ti)

m∑

j=1

ai sen(tj)

=

(m∑

i=1

ai sen(ti)

)2

≥ 0.

Por lo tanto la función C(t, s) = sen(t) sen(s), s, t ∈ R es semidefinida positiva.Similarmente en el caso b) escribimos

m∑

i,j=1

aiajC(ti, tj) =m∑

i,j=1

aiaj sen(ti + tj) =m∑

i,j=1

aiaj [sen(ti) cos(tj) + sen(tj) cos(ti)]

= 2

m∑

i=1

ai sen(ti)

m∑

j=1

aj cos(tj).

Si m = 1, a1 ≥ 0, es suficiente considerar un t1 tal que sen(t1) y cos(t1) tengan distinto signo.Por ejemplo, si t1 = 3π/4,

2a1 sen(t1)a1 cos(t1) = a21 sen(3π/4) cos(3π/4) = −a21/2 < 0.

Por lo tanto, la función C(t, s) = sen(t+ s), s, t ∈ R no es semidefinida positiva.

Ronny Vallejos 35

Page 37: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

Ejemplo 2.6. Consideremos el proceso Zt : t ∈ R descrito por la ecuación

Zt = β0 + β1t+ ǫt,

donde β0 y β1 son parámetros fijos (no aleatorios), y el proceso ǫt : t ∈ R tiene unafunción de media cero, varianza σ2 y una función de covarianza Cǫ(t, s) = 0,∀t 6= s. Entoncesµ(t) = E[Zt] = E[β0 +β1t+ ǫt] = β0 +β1t. Además, V[Zt] = σ2 y CZ(t, s) = 0,∀t 6= s. En estecaso, la función de media depende del tiempo. Esto significa que el valor medio del procesocambia constantemente. También se observa que el proceso Zt no tiene memoria con el pasadoya que su función de covarianza es nula. Esto nos permite enfatizar el hecho que la función decovarianza de un proceso estocástico indexado en el tiempo proporciona información acercade la memoria del proceso.

En las subsecciones siguientes estudiaremos procesos que tienen asociadas funciones decovarianza con patrones muy variados. Sin embargo, nuestro interés es caracterizar de manerasencilla una clase grande de procesos a través de su función de covarianza.

2.3. Procesos Estacionarios

La clase de procesos aleatorios es muy grande como para poder abordar el análisis de ellos enforma general, de tal manera que un procedimiento o método sirva para todos los posibles pro-cesos existentes. De hecho, la mayoría de métodos desarrollados han sido tratados considerandocasos especiales. Una clase importante de procesos son caracterizados por las propiedades desus distribuciones, especialmente cuando estas distribuciónes no cambian en el tiempo. Si estosucede es claro que las cantidades Zt1 , Zt1+1, . . . , Zt1+h deberían tener la misma distribuciónde probabilidad. Podemos resumir esta propiedad diciendo que para cualquier conjunto de lo-calizaciones t1, t2, . . . , tn la probabilidad conjunta de Zt1 , Zt2 , . . . , Ztn es preservada aunquetraslademos cada localización usando la misma cantidad en cada componente. En otras pal-abras, la distribución de un proceso no cambia si las distribuciones finito-dimensionales soninvariantes bajo traslaciones. Si el proceso Zt : t ∈ T tiene esta propiedad diremos queZt : t ∈ T es estrictamente estacionario. Una definición formal es la siguiente:

Definición 2.5. El proceso Zt : t ∈ T se dice que es estrictamente estacionario si paracada conjunto de localizaciones t1, t2, . . . , tn y para cada h ∈ T, la distribución conjunta deZt1 , Zt2 , . . . , Ztn y Zt1+h, Zt2+h, . . . , Ztn+h son idénticas.

Estacionariedad estricta es un requerimiento bastante fuerte que puede ser relajado si seintroduce una noción basada en los momentos del proceso. Es bien sabido que los momentosde un proceso estocástico no caracterizan de manera única la distribución del proceso, peroun aspecto positivo de considerar este enfoque radica en que si los dos primeros momentosde un proceso satisfacen condiciones apropiadas, entonces es posible caracterizar una clasegrande de procesos que poseen trayectorias que en algún sentido son estables. Como vimosanteriormente, si un proceso tiene segundo momento finito, entonces su función de media,varianza y covarianza existen, por lo tanto esta es una condición que necesitamos asumir sinuestro interés es buscar un sentido de estabilidad del proceso.

Definición 2.6. Sea Zt : t ∈ T un proceso de segundo orden. Se dice que el procesoZt : t ∈ T es débilmente estacionario si su función de media es constante y la función decovarianza entre Zt y Zs depende sólo de la diferencia t− s. Es decir,

Ronny Vallejos 36

Page 38: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

i) E[Zt] = µ,∀t ∈ T.

ii) C(t, s) = Cov[Zt, Zs] = C(t− s),∀t, s ∈ T .

Una consecuencia natural de esta definición es que la varianza del proceso Zt : t ∈ Ttambién es constante con respecto al tiempo. En efecto, si el proceso Zt : t ∈ T es débilmenteestacionario entonces del axioma ii) se tiene que

V[Zt] = Cov[Zt, Zt] = C(0),∀t ∈ T.

Luego podemos decir que un proceso es débilmente estacionario si sus funciones de media yvarianza son constantes con respecto al tiempo y su función de covarianza depende únicamentede la diferencia de los argumentos.

Observación 2.3. Si el proceso Zt : t ∈ T es débilmente estacionario, entonces la funciónde covarianza puede ser escrita como sigue:

C(t, s) = C(t− s) = C(h) = C(t, t+ h),∀t ∈ T.

Ejemplo 2.7. Considere el proceso ǫt, t ∈ T tal que E[ǫt] = 0 y

C(h) =

σ2, h = 0,

0, en otro caso.

Este proceso se conoce como ruido blanco y su principal característica es que no tienememoria con el pasado ni con el futuro. Es sólamente un shock aleatorio en el instante t ylas observaciones en un instante del tiempo no condicionan ni proporcionan información delresto de las variables. Aunque ǫt, t ∈ T es un proceso muy sencillo, veremos más adelanteque sirve para construir procesos más sofisticados. Es fácil ver que ǫt, t ∈ T es un procesoestacionario débil.

Note que en este caso

ρ(h) =C(h)

C(0)=

1, h = 0,

0, en otro caso.

El grafico ρ(h) versus h se denomina correlograma. Un correlograma proporciona informaciónacerca de los patrones asociados a la memoria de un proceso estocástico.

Ejemplo 2.8. Considere el proceso descrito en la ecuación (2.1). Claramente,

E[Zt] = E[A]E[cos(ηt+ φ)] = 0.

Más aún,

C(t, s) = E[ZtZs] = E[A2/2]E [cos(η(t − s)) + cos(η(t+ s) + 2φ)]

=1

2cos(η(t− s)),

o equivalentemente C(h) = 12cos(ηh). Así, Zt : t ∈ R es un proceso débilmente estacionario.

Ronny Vallejos 37

Page 39: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

Ejemplo 2.9. Sea ǫt, t ∈ Z un ruido blanco N(0, 1). Definamos

Xt =

ǫt, si t es par,

(ǫ2t−1 − 1)/√2, si t es impar.

Entonces si t es par E[Xt] = E[ǫt] = 0. Ahora para todo t impar,

E[Xt] = E

[ǫ2t−1 − 1√

2

]=

1√2E[ǫ2t−1 − 1] = 0.

Ahora si t es par C(t, t) = 1, pero si t es impar

C(t, t) = E

[(ǫ2t−1 − 1√

2

)2]=

1

2[ǫ4t − 2ǫ2t + 1] =

1

2(3− 2 + 1) = 1.

Además, si t es par C(t+ 1, t) = E

[(ǫ2t−1

−1)ǫt√2

]= 0, y si t es impar

C(t+ 1, t) = E

[ǫ2t+1

(ǫ2t−1 − 1)√2

]= E[ǫ2t+1]E

[ǫ2t−1 − 1√

2

]= 0.

Esto muestra que C(t+ h, t) = 0, para todo |h| ≥ 2. Luego

C(t+ h, t) =

1, h = 0,

0, en otro caso.

Por lo tanto, el proceso Xt : t ∈ Z es un ruido blanco.Note que si t es impar Xt y Xt−1 son claramente dependientes. Entonces Xt : t ∈ Z es

un ruido blanco pero debido a la dependencia existente, no es una secuencia i.i.d.

Ejemplo 2.10. Sea Zt : t ∈ R un proceso descrito por la ecuación

Zt = At cos(2πft+ φ),

donde f es una frecuencia fija, la fase φ se distribuye uniformemente en el intervalo [−π, π], yla amplitud At : t ∈ R es independiente de φ y satisface

At =∞∑

k=0

gkǫt−k,

donde g0 = 1, gk = 1/√k, k ≥ 1 y ǫt; t ∈ R es un ruido blanco con varianza σ2. Estudie la

estacionariedad débil del proceso Zt : t ∈ R.Primero calculemos la media del proceso Zt : t ∈ R. Como At y φ son independientes

E[Zt] = E[At]E[cos(2πft+ φ)] = 0,

ya que E[At] = 0 y

E[cos(2πft+ φ)] =

∫ π

−πcos(2πft+ φ)

1

2πdφ = 0.

Ronny Vallejos 38

Page 40: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

Ahora, note que V[At cos(2πft+ φ)] = V[At]V[cos(2πft+ φ)] y

V[At] = σ2 + σ2∞∑

k=1

g2k = σ2

[1 +

∞∑

k=1

1

k

],

pero∑∞

k=11k = ∞, entonces V[At] no es finita y concluimos que el proceso Zt : t ∈ R no es

débilmente estacionario.

Ejemplo 2.11. Estudie la estacionariedad débil del proceso

Zt =L∑

l=1

Dl cos(2πflt+ φl),

donde D1,D2, . . . ,DL, f1, f2, . . . , fL son funciones reales constantes y las fases φl son variablesaleatorias independientes e identicamente distribuidas con función de densidad de probabilidaddada por

g(φl) =

1π , 0 ≤ φl ≤ π,

0, −π ≤ φl < 0.

En este caso,

E[Zt] =L∑

l=1

DlE[cos(2πflt+ φl)]

=

L∑

l=1

Dl

∫ π

0cos(2πflt+ φl)

1

πdφl

=

L∑

l=1

Dl

π

∫ π

0[cos(2πflt) cos(φl)− sen(2πflt) sen(φl)]dφl

= −L∑

l=1

2Dl

πsen(2πflt),

la cual es una función del tiempo, por lo tanto el proceso Zt no es débilmente estacionario.

Ejemplo 2.12. Considere el proceso Zt tal que E[Zt] = 0 y V[Zt] = σ2. Definamos

Xt = Z1 cos(ct), c = ±kπ, k ∈ Z.

Entonces Xt = (−1)ktZ1. Esto implica que µX(t) = E[Z1] cos(ct) = 0. La función de autoco-varianza

CX(h) = Cov[Xt+h,Xt] = Cov[Z1 cos(c(t+ h)), Z1 cos(ct)]

= (−1)2kt+khE[Z2

1 ] = σ2(−1)kh.

Luego, el proceso Xt es débilmente estacionario para c = kπ. Es fácil ver que el proceso Xt noes estacionario si c 6= kπ.

Ronny Vallejos 39

Page 41: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

Ejemplo 2.13. Consideremos la función de covarianza dada por

C(h) =

σ2 sen(φh)

φh , h > 0,

σ2 + τ2, en otro caso,

donde φ > 0, σ > 0 y τ > 0. Entonces

lımh→∞

C(h) = lımh→∞

σ2 sen(φh)

φh,

pero

0 ≤∣∣∣∣σ2 sen(φh)

φh

∣∣∣∣ ≤∣∣∣∣σ2

φh

∣∣∣∣ −→ 0,

cuando h → ∞. Por lo tanto, lımh→∞C(h) = 0. Este decaimiento en función de la separación hes habitual en funciones de covarianza asociadas a procesos débilmente estacionarios. Note quea medida que h aumenta, C(h) decrece. Esto es razonable, si consideramos que las variablesaleatorias en cuestión están cada vez más separadas en el tiempo. En estadística espacial existeun principio llamado la primera ley de la geografía, que expresa que eventos más cercanostienden a ser más parecidos que eventos lejanos. Esto refleja que en algún sentido la distanciaentre las variables juega un rol importante en la contabilización de la correlación en el espacio.

Ejemplo 2.14. Considere el proceso Xt = cos(U + tV ), t ∈ R, donde U ∼ U(0, 2π), V ∼f(x) = 1

π(1+x2), x ∈ R tal que U y V son independientes. Estudiemos la estacionariedad de

Xt. Primero note que

E[Xt] = E[cos(U + tV )]

= E[cos(U) cos(tV )− sen(U) sen(tV )]

= E[cos(U)]E[cos(tV )]− E[sen(U)]E[sen(tV )]

= 0.

Ahora,

C(t, s) = E[XtXs] = E[cos(U + tV ) cos(U + sV )]

= E[cos(U) cos(tV )− sen(U) sen(tV )cos(U) cos(sV )− sen(U) sen(sV )]= E[cos2(U) cos(tV ) cos(sV )]− 2E[cos(U) sen(U) sen(tU) sen(sU)]

+ E[sen2(U) sen(tV ) sen(sV )]

=1

2E[cos(tV ) cos(sV ) + sen(tV ) sen(sV )]

=1

2E[cos((t− s)V ))]

Notemos que E[cos(tV − sV )] = Re[E[ei(t−s)V ]] = e|t−s|, t, s ∈ R. Así el proceso Xt esdébilmente estacionario.

Teorema 2.3. Si Zt : t ∈ T es estrictamente estacionario y de segundo orden, entoncesZt : t ∈ T es débilmente estacionario.

Ronny Vallejos 40

Page 42: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

Demostración.

E[Zt] =

∫ZtdF (Zt) =

∫Zt+hdF (Zt+h) =

∫Z0dF (Z0), h = −t

= una constante independiente de t.

Ahora sin pérdida de generalidad supongamos que E[Zt] = 0. Entonces,

C(ti, tj) = E[ZtiZtj ] = E[Zti−tjZ0] = function sólo de ti − tj .

El recíproco de Teorema 2.3 es falso. Adicionando la hipótesis de normalidad del procesose garantiza la equivalencia.

Definición 2.7. Sea Zt : t ∈ T un proceso estocástico. Diremos que el proceso Zt : t ∈ Tes Gaussiano (normal) si para cada n ∈ N, para cada t1, t2, . . . , tn la distribución conjuntafinito-dimensional del vector (Zt1 , Zt2 , . . . , Ztn) es normal.

Ejemplo 2.15. (Continuación del ejemplo 2.4). Consideremos nuevamente el movimientoBrowniano Wt definido en el ejemplo 2.4. Como W0 = 0, entonces Wt1 = Wt1 − W0 ∼N (0, t1). Dados los instantes t1 < t2 < . . . < tk definimos t0 = 0 y para n = 1, 2, . . . , k,Yn = Wtn − Wtn−1

. Note que Y1, Y2, , Yn . . . , Yn son variables aleatorias independientes condistribución N (0, tn − tn−1). Luego, notemos que

Wt1 = w1, . . . ,Wtn = wn ⇐⇒ Y1 = w1, Y2 = w2 − w1, . . . , Yk = wk − wk−1.

Usando el teorema de transformación de vectores aleatorios, nos queda que la densidad con-junta del vector (Wt1 ,Wt2 , . . . ,Wtk)

T está dada por

f(w1, w2 . . . , wk) =k∏

n=1

fYn(wn − wn−1)

=1√

2π(tn − tn−1)e−(wn−wn−1)2/[2(tn−tn−1)].

Esto muestra que el proceso Wt es Gaussiano.

Teorema 2.4. Zt : t ∈ T estrictamente estacionario y de segundo orden ⇐⇒ Zt : t ∈ Tdébilmente estacionario y Gaussiano.

Demostración. La demostración es inmediata considerando que en un proceso Gaussiano ladistribuciones finito-dimensionales quedan determinadas por el primer y segundo momento.

Ejemplo 2.16. Sea Zt = Z1 cos(λt) +Z2 sen(λt), t ∈ R, donde Z1, Z2 son variables aleatoriasN(0, 1) e independientes y λ ∈ R es una constante. Entonces µ(t) = 0 y

C(t, s) = Cov[Zt, Zs] = E[Z1 cos(λt) + Z2 sen(λt)]

= σ2(cos(λt) cos(λs) + sen(λt) sen(λs))

= σ2 cos(λ(t− s))

= σ2 cos(λh).

Además, C(0) = σ2 y ρZ(h) = cos(λh). Por lo tanto el proceso Zs es débilmente estacionarioy además como es también Gaussiano, entonces Zs es estrictamente estacionario.

Ronny Vallejos 41

Page 43: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

Recalcamos que el Teorema 2.4 requiere la hipótesis del segundo momento finito. El sigu-iente ejemplo muestra un caso en que la hipótesis del segundo momento finito no se satisface.

Ejemplo 2.17. (Myers, 1989) SeaZt un proceso estocástico definido como sigue: En cadaposición t, Zt es un valor aleatorio proveniente de una distribución de Cauchy con densidadde probabilidad dada por f(z) = 1/(π(1 + z2)),−∞ < z < ∞, de tal manera que Zt yZs son independientes para cada t 6= s. (Entonces las distribuciones finito-dimensionales sepueden escribir como el producto de las densidades marginales). Podemos ver que el procesono es estacionario débil ya que el primer y segundo momento de la distribución de Cauchyno existen. Sin embargo para cada n ∈ N y para cada t1, t2, . . . , tn, la distribución del vector(Zt1 , Zt2 , . . . , Ztn) es invariante bajo traslacion ya que por definición la distribución es lamisma para cualquier conjunto de puntos t1, t2, . . . , tn. Luego, estamos frente a un procesoque es fuertemente estacionario, pero no débilmente estacionario.

La función de covarianza de un proceso débilmente estacionario es muy importe. Aquídescribiremos algunas de las propiedades más relavantes de una función de covarianza C(h)asociada a un proceso débilmente estacionario.

Proposición 2.1. Sea Zt, t ∈ T un proceso débilmente estacionario con función de covari-anza C(h). Entonces

1. C(0) ≥ 0.

2. C(h) = C(−h) (la función de covarianza es simétrica).

3. C(0) ≥ C(h).

4. Si Cj(h) son funciones de covarianza para j = 1, 2, . . . , n, entonces∑n

j=1 bjCj(h) tam-bién es una función de covarianza si bj ≥ 0, para todo j.

5. Si Cj(h) son funciones de covarianza para j = 1, 2, . . . , n, entonces∏n

j=1Cj(h) es tam-bién una función de covarianza.

6. Una función de covarianza válida en Rd es también una función de covarianza en R

r forr < d.

7. Si C es una función de covarianza válida en Rd, entonces satisface la condición de semi

definida positiva. Es decir,

n∑

i=1

n∑

j=1

aiajC(ti − tj) ≥ 0, for all ti, tj , ai, aj .

Demostración. La demostración de 1 y 2 son inmediatas por la definición de función de co-varianza para un proceso débilmente estacionario. La demostración de 3 es una aplicacióndirecta de la desigualdad de Cauchy-Schwartz. Las pruebas de 4-7 se construyen usando laspropiedades de las funciones semidefinidas positivas.

Ejemplo 2.18. Sea

C(h) =

1, h = 0,

1/h, h 6= 0.

Note que C(h) no puede ser la función de covarianza asociada a un proceso débilmente esta-cionario ya que para h 6= 0, C(h) 6= C(−h). Es decir, la simetría no se satisface. La mismacondición no se satisface para la función C(h) = (−2)h, h ∈ R.

Ronny Vallejos 42

Page 44: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

Ejemplo 2.19. Sea la función C(h) = 1 + cos(πh/2) − cos(πh/4). Entonces C(0) = 1 yC(4) = 3 > C(0). Luego, la condición 1 de la Proposición 2.1 no se satisface, por lo tantoC(h) no es la función de covarianza de un proceso débilmente estacionario.

Ejemplo 2.20. Sea

ρ(h) =

1, h = 0,

ρ, h = ±1,

0, en otro caso.

Nuestro interés es saber para qué valores de ρ, ρ(h) es la función de autocorrelación de unproceso débilmente estacionario. De las condiciones 1-3 en la Proposición 2.1 se obtiene que|ρ| ≤ 1. Ahora nos queda averiguar si existe un subintervalo contenido en [−1, 1] para el cuálρ(h) está bien definida. Sabemos que esta función define una matriz de la forma

Σ =

1 ρ 0 · · · 0ρ 1 ρ · · · 0

0 ρ. . . . . . 0

......

. . . 1 ρ0 . . . 0 ρ 1

Luego podemos usar el siguiente resultado.

Proposición 2.2. Una matriz diagonal dominante con elementos positivos en la diagonal essemi definida positiva.

Entonces es suficiente encontrar bajo que condiciones sobre ρ, Σ es diagonal dominante.Desde la definición tenemos que Σ es diagonal dominante ssi para todo i = 1, 2, . . . , n

|σii| ≥∑

j 6=i

|σij |.

En este caso esta condición es equivalente a |ρ| ≤ 1/2. Otra forma de ver que el intervalo|ρ| ≤ 1/2 está bien definido es usando el hecho que la función ρ(h) corresponde a la funciónde covarianza de un proceso MA(1) de la forma Zt = ǫt + θǫt−1 donde ǫt es un ruido blancocon varianza σ2. (ver Brockwell y Davis 2006, p.28).

Ejemplo 2.21. (Correlación intraclase) Considere el proceso Zt con la estructura de covari-anza C[Zti , Ztj ] = ρ,−1 ≤ ρ ≤ 1, ti 6= tj, i, j = 1, 2, . . . , n y C[Zti , Zti ] = 1, para i = 1, 2, . . . , n.Escribamos la correspondiente matriz de covarianza Σ = (1−ρ)I+ρJ, donde J es la matrizde unos de tamaño n×n. Entonces la matriz Σ es semidefinida positiva si −1/(n−1) ≤ ρ ≤ 1.Si se aplica la Proposición 2.2 obtenemos que la matriz intraclase es diagonal dominante si|ρ| ≤ 1/(n − 1), pero el intervalo que proporciona la Proposición 2.2 está contenido en elintervelo para el cual la matriz intraclase es semidefinida positiva.

Ejemplo 2.22. (Estructura Toeplitz) Considere el proceso Zt con estructura de covarianzaC[Zti , Ztj ] = ρ|ti−tj |, i, j = 1, 2, . . . , n. Entonces la correspondiente matriz de covarianza Σ essemidefinida positiva si 0 < ρ < 1.

Ejemplo 2.23. Sea Zt un proceso tal que podemos construir la matriz Z = Ztij, i, j =1, 2, . . . , n. Asuma que los vectores

Z(j)t = (Zt1j , Zt2j , . . . , Ztnj

)′,

Ronny Vallejos 43

Page 45: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

j = 1, 2, . . . , n, tienen la misma matriz de covarianza Σ y son independientes. Entonces lamatriz de covarianza de vec(Z) es I ⊗Σ. Note que I ⊗Σ es semidefinida positiva ya que Σ esuna matriz de covarianza.

Teorema 2.5. Sea Zt : t ∈ T un proceso estrictamente estacionario. Sea g una funcióndefinida sobre el conjunto de los valores posibles G del proceso Zt : t ∈ T. Entonces elproceso

Yt = g(Zt), t ∈ T,

es estrictamente estacionario.

El Teorema 2.5 asegura que transformaciones que no dependen del tiempo de procesosestrictamente estacionarios son también procesos estrictamente estacionarios.

Ejemplo 2.24. Consideremos el proceso de media móvil de orden 1 definido por

Zt = ǫt −1

2ǫt−1,

donde ǫt : t ∈ Z es un ruido blanco Gaussiano con varianza 1. Entonces el proceso Zt : t ∈Z también es Gaussiano con media cero y función de autocovarianza dada por

CZ(0) = 5/4, CZ (1) = 1/2, CZ(h) = 0, h ≥ 2.

El signo de Zt define otro proceso estocástico:

Yt =

+1, Zt ≥ 0,

−1, Zt < 0.

Como la transformación no depende del tiempo, el proceso Yt es también estrictamente esta-cionario.

2.4. Procesos Ergódicos

2.5. Ejercicios

Problema 2.1. Determine si las siguientes funciones son semidefinidas positivasa) C(t, s) = cos(t+ s).b) C(t, s) = t2 + s2.c) C(t, s) = et−s.

Problema 2.2. Demuestre que la matriz Σ = (1 − ρ)I + ρJ, es semidefinida positiva si−1/(n− 1) ≤ ρ ≤ 1.

Problema 2.3. Sea Zt : t ∈ Z un proceso débilmente estacionario con función de auto-correlación ρZ . Demuestre que el proceso Wt = ∇Zt = Zt − Zt−1 : t ∈ Z es débilmenteestacionario y determine ρW como función de ρZ .

Problema 2.4. Considere el proceso débilmente estacionario Zt : t ∈ R con función deautocovarianza C. Definimos el proceso Zt = (Zt+h − Zt)/h. Demuestre que la función deautocovarianza de Z(s) está dada por

C1(t) =1

h2(2C(t)− C(t+ h)− C(t− h)).

Ronny Vallejos 44

Page 46: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

Problema 2.5. Un movimiento Browniano, Zs : s ∈ R1, es un proceso Gaussiano tal queE[Zs] = 0 y cov[Zs1 , Zs2 ] = σ2min(s1, s2). Definamos Ys ≡ Zs+1 − Zs; s ∈ R1. Demuestreque Ys : s ∈ R1 es estacionario de segundo orden y pruebe que para σ2 = 1, la función decovarianza de Ys es

C0(h) =

1− |h|, |h| < 1,

0, |h| ≥ 1.

Problema 2.6. Sea Zt un proceso intrínsecamente estacionario. El semivariograma de Zt sedefine como

γZ(h) =1

2E[(Zt+h − Zt)

2].

a) Si Zt es un ruido blanco, calcule γZ(h).b) Si Zt = β0 + β1t+ ǫt, donde ǫt es un ruido blanco, calcule γZ(h).c) ¿Qué relación existe entre γZ(h) y CZ(h)?

Problema 2.7. Sea Wt : t ≥ 0 un movimiento Browniano con varianza αt.a) Demuestre que el proceso Yt = Wt/

√α es un movimiento Browniano con varianza igual a

t.b) Sea c > 0 una constante. Determine si el proceso Yt = Wct es un movimiento Browniano.

Problema 2.8. De un ejemplo de un proceso que sea débilmente estacionario pero no fuerte-mente estacionario.

Problema 2.9. Demuestre la proposición 2.1.

Problema 2.10. Encuentre una función de covarianza que sea válida en R1 pero no en R

2.

Problema 2.11. Suponga que X1t ,X

2t , . . . ,X

nt son n procesos centrados i.i.d. Gausianos sobre

R1, cada uno con función de covarianza CX . Demuestre que el proceso definido por

Yt =n∑

i=1

[Xit ]2

es estacionario con función de covarianza CY (h) = 2nCX(h)2.

Problema 2.12. Suponga que el proceso Zt : t ∈ T ) denota un proceso espacial lognormaldefinido para t ∈ T ⊂ R

1. Es decir,

Yt = log(Zt); t ∈ R,

es un proceso Gaussiano denfinido por sus dos primeros momentos:

µY (s) = E[Yt], t ∈ T,

CY [t1, t2] = Cov[Yt1 , Yt2 ]; t1, t2 ∈ T.

a) Verifique que µZ(t) = expµY (t) + (1/2)CY [t, t], t ∈ T.b) Verifique que CZ(t1, t2) = µZ(t1)µZ(t2) [expCY [t1, t2] − 1] , t1, t2 ∈ T.

Ronny Vallejos 45

Page 47: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

Problema 2.13. ¿Es

C(t, s) =1

2(tα + sα − |t− s|α), t, s ∈ R, α > 2,

una función de covarianza?

Problema 2.14. Encuentre un ejemplo de un proceso Yt = gt(Zt), t ∈ T, donde Zt : t ∈ Tes estrictamente estacionario, gt(Zt) depende del tiempo e Yt es débilmente estacionario.

Problema 2.15. De un ejemplo de un proceso estocástico Zt : t ∈ Z tal que para t1, t2 ∈ Z

arbitrarios y h 6= 0, E[Zt1 ] 6= E[Zt1+h] y Cov[Zt1 , Zt2 ] = Cov[Zt1+h, Zt2+h].

Problema 2.16. Considere el siguiente teorema, conocido como Teorema de Gerschgorin.

Teorema 2.6. Sea A una matriz de tamaño n× n y denotemos por Ri el círculo en el planocomplejo con centro en aii y radio

∑nj=1,j 6=i |aii|, es decir;

Ri = z ∈ C : |z − aii| ≤n∑

j=1,j 6=i

|aii|.

Entonces los valores propios de A están contenidos en

R =n⋃

i=1

Ri.

Use el teorema 2.6 para probar que la matriz Σ del ejemplo 2.20 es semidefinida positivasi |ρ| ≤ 1

2 .

Problema 2.17. Sea Zt = φZt−1 + ǫt, t ∈ Z donde ǫt es un ruido blanco con varianza σ2.a) Determine los valores de φ ∈ R para los cuales el proceso Zt : t ∈ Z es débilmenteestacionario.b) Encuentre la función de autocorrelación del proceso Zt y describa su decaimiento comofunción de h.

Problema 2.18. Sean Z1 y Z2 dos variables aleatorias tales que E[Z1] = µ,E[Z2] = µ2,V[Z1] = σ1, V[Z1] = σ2, y cov[Z1, Z2] = σ12. Sea el proceso Zt; t ∈ R definido como sigue:

Zt(w) =

Z1(w), t ≤ 0

Z2(w), t > 0.

Una posible trayectoria del proceso Zt(w) se muestra en la Figura 2.6.a) Describa las trayectorias del proceso Zt(w).b) ¿Qué condiciones deberían imponerse para que el proceso Zt(w) sea estacionario?c) Determine µZ(t) y CX(t1, t2).

Ronny Vallejos 46

Page 48: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

UTFSM

Departamento de Matemática CAPÍTULO 2. PROCESOS ESTACIONARIOS

Z2(w)

Z1(w)

µ1

µ2

t

Figura 2.6: Una posible trayectoria del proceso Zt(w).

Ronny Vallejos 47

Page 49: Introducción a las Series Cronológicasrvallejos.mat.utfsm.cl/Time Series I 2013/TSbook.pdf · Introducción a las Series Cronológicas Ronny Vallejos Universidad Técnica Federico

Bibliografía

[1] Box, G.E.P., Cox, D. R. (1964).An analysis of transformations. Journal of the RoyalStatistical Society, Series B 26, 211-252.

[2] Brockwell, P. J., Davis, R. (2002). Introduction to Time Series and Forecasting SecondEdition. Springer, New York.

[3] Brockwell P. J., Davis, R. (2006). Time Series: Theory and Methods. Springer, New York.

[4] Gaetan, C., Guyon, X. (2010). Spatial Statistics and Modeling, Springer, New York.

[5] Gijbels, I., Wand, M. P. (1999). Understanding exponential smoothing via kernel regres-sion. Journal of the Royal Statistical Society 61, 39-50.

[6] Nadaraya, A., (1964). On estimating regression. Theory of Probability and its Applica-tions 9, 141-142.

[7] Wand, M.P., Jones, M.C. (1995). Kernel Smoothing. Chapman and Hall, London.

[8] Watson, S. (1964). Smooth regression analysis. Sankhya, Series A 26, 359-372 .

48