27
ESTUDIO DE LA DATA SALINIDAD LAGO DE MARACAIBO 1937-2014 Nóta de Febrero de 2014. Para actualizar este estudio se tendría que tomar una quinta época: 1999-2013. En este estudio se trata de encontrar un modelo de serie de tiempo que describa el comportamiento de la salinidad promedio anual en el lago de Maracaibo y usar este modelo para pronosticar la salinidad promedio anual de la salinidad del lago de Maracaibo. La serie de tiempo formada por las observaciones de la salinidad promedio anual del lago de Maracaibo son consideradas como una serie estocástica generada por un proceso estocástico subyacente, se trata de encontrar un modelo que caracterice y describa esta serie temporal y con este modelo hacer pronósticos precisos y confiables de la salinidad. Se trata de determinar el modelo de serie de tiempo que ajuste con mayor precisión (mínimo MAPE) la data histórica de la salinidad promedio del lago Maracaibo para el periodo 1937-1998, para lo cual se examinan los modelos de extrapolación (Suavizamiento , Análisis de Tendencia, y Ajuste Estacional) y los modelos ARIMA para Series de Tiempo Estacionarias. LA DATA Con los datos recopilados se tratara de determinar, que si a pesar de que la profundización del canal de navegación haya contribuido decisivamente con la salinizacion progresiva del Lago, el sistema del Lago llegó o no a un nuevo estado de equilibrio y que si las inyecciones periódicas de salinidad producen o no producen un aumento neto en la salinidad del epilimnio del Lago. De acuerdo a la época en la que se produjo y la fuente que la recopilo, con la data existente de la salinidad promedio anual del lago de Maracaibo se van a establecer cuatro épocas de estudio:

MODELOS DE SERIES DE TIEMPO - plinio11.files.wordpress.com  · Web viewy los intervalos de confianza de este pronostico con una confianza de 95. y una tabla con los pronósticos

Embed Size (px)

Citation preview

ESTUDIO DE LA DATA SALINIDAD LAGO DE MARACAIBO 1937-2014

Nóta de Febrero de 2014.Para actualizar este estudio se tendría que tomar una quinta época: 1999-2013.En este estudio se trata de encontrar un modelo de serie de tiempo que describa el comportamiento de la salinidad promedio anual en el lago de Maracaibo y usar este modelo para pronosticar la salinidad promedio anual de la salinidad del lago de Maracaibo.

La serie de tiempo formada por las observaciones de la salinidad promedio anual del lago de Maracaibo son consideradas como una serie estocástica generada por un proceso estocástico subyacente, se trata de encontrar un modelo que caracterice y describa esta serie temporal y con este modelo hacer pronósticos precisos y confiables de la salinidad.

Se trata de determinar el modelo de serie de tiempo que ajuste con mayor precisión (mínimo MAPE) la data histórica de la salinidad promedio del lago Maracaibo para el periodo 1937-1998, para lo cual se examinan los modelos de extrapolación (Suavizamiento , Análisis de Tendencia, y Ajuste Estacional) y los modelos ARIMA para Series de Tiempo Estacionarias.

LA DATACon los datos recopilados se tratara de determinar, que si a pesar de que la profundización del canal de navegación haya contribuido decisivamente con la salinizacion progresiva del Lago, el sistema del Lago llegó o no a un nuevo estado de equilibrio y que si las inyecciones periódicas de salinidad producen o no producen un aumento neto en la salinidad del epilimnio del Lago.

De acuerdo a la época en la que se produjo y la fuente que la recopilo, con la data existente de la salinidad promedio anual del lago de Maracaibo se van a establecer cuatro épocas de estudio:

1. Primera época de estudio: De 1937 – 1998 2. Segunda época: De 1961 – 1998. 3. Tercera época: De 1977 - 1998. 4. Cuarta época : 1992-1998

La serie 1937-1998: En esta serie se recoge toda la data histórica disponible, desde el año 1937 hasta el año 1998, los valores de salinidad para esta serie secular se consideran como la salinidad promedio anual medida entre 0-1 metro de profundidad en varios sitios del lago y en la estación C-11 esta data fue recopilada por: Redfield (1937 -1953), Instituto Nacional de Canalizaciones (1953-1969), Parra Pardi (1969-1994). Susana de Bautista (1977-1997), Mike3(1992-1998) y ICLAM(1992-1998)

Serie 1952-1998. Serie de la salinidad promedio del lago medidas a una profundidad de 0-1 metro para todas las estaciones y para la estación C-11

Serie 1977-1998. Una primera serie con los valores anuales promedio para una profundidad de 0-1 metro. Una segunda serie con los valores de cuatro épocas por año.

Serie 1992-1998. Series de la salinidad promedio anual para en la estación C-11 en cuatro épocas. Se estudian las series recopiladas por Susana de Bautista, Mike3 y el ICLAM.

ANALISIS DE LA DATA SALINIDAD LAGO DE MARACAIBOMediante las tecnicas graficas y estadisticas del Analisis Exploratorio de Datas (EDA) se determinara para la datas: Salinidad 1937-1998 y Salinidad 1961-1998 lo siguiente:1. Las observaciones que caen fuera de estabilidad estadistica.

2. Las observaciones sustitutas usando Regresion Lineal

3. Hipótesis de igualdad de las dos mitades consecutivas de las Series Originales

4. La amplitud de la estacionalidad con el periodograma y la grafica de subseries

5. La tendencia, mediante la regresion de las series depuradas

6. El orden de diferenciación al cual se hacen estacionarias las series depuradas

1-.ESTUDIO DE LA ESTABILIDAD DE LA DATA SALINIDAD

1. Las observaciones que caen fuera de estabilidad estadistica.

2. Las observaciones sustitutas usando Regresion Lineal

3. 3-. Hipótesis de igualdad de las dos mitades consecutivas de las Series Originales

4. H0: SERIE1937-1970 = SERIE 1970-1998

5-.Determinacion de la tendencia, mediante la regresion de las series depuradasSe determina la recta de regresion y la serie Salinidad Sin Tendencia.6-. Determinación del orden de diferenciación al cual se hacen estacionarias las series depuradas

7-.Determinación de la estacionalidad con el periodograma y la grafica de subseriesDe las graficas de subseries estacionales y del periodograma se determina una Amplintud de la estacionalidad de L= 6

Se usa el Analisis de las Autocorrelaciones para determinar el orden de difereciacion para el

el cual la serie Salinidad se hace estacionaria. Se determino que al tomar la primera

diferencia de la serie original la serie diferenciada una vez es estacionaria.

ESTUDIO DE LA SERIE 1937-1998DETERMINACION DEL PATRON DE COMPORTAMIENTO Y EL PRONOSTICO DE LA DATA: Salinidad del Lago de Maracaibo 1937-1998Mediante las técnicas del Análisis Exploraratorio se determinaron las observaciones que

estaban fuera de control estadístico (8) las cuales fueron sustituidas con valores calculados

por regresión lineal (pues la serie tiene tendencia), a esta serie depurada se le determino la

tendencia (0.111) y a la serie sin tendencia se le realizo un estudio de las autocorrelaciones

obteniéndose que la serie sin tendencia se hace estacionaria al tomarse la primera

diferencia.

A la serie depurada, sin tendencia y diferenciada una vez se le aplicaron modelos de

extrapolación (1-.Análisis de Tendencia 2-. Suavizamiento Exponencial y 3-. Ajuste

Estacional) y los modelos de Series de Tiempo ARIMA.

1-. METODOS DE SUAVIZAMIENTO APLICADOS A LA DATA 1937-1998 Las técnicas de suavizamiento proporcionan un medio para eliminar o al menos reducir las

fluctuaciones volátiles a corto plazo de una serie de tiempo, con frecuencia es más fácil

discernir tendencias y patrones críticos con la serie suavizada que con la serie

original.Examinaremos 5 métodos de suavizamiento a la serie de tiempo Salinidad anual del

lago de Maracaibo 1937-1998 y se determinara el método mas preciso examinando los

errores de pronostico (MSE , MAE Y MAPE).

METODOS DE SUAVIZAMIENTO EXAMINADOS (A) PROMEDIO MOVIL SIMPLE 5 TERMINOS(B) EXPONENCIAL SIMPLE CON ALFA = 0,9999

(C) EXPONENCIAL LINEAL BROWN CON ALFA = 0,2441

(D) EXPONENCIAL CON DOS PARAMETROS ALFA = 0,1308 Y beta = 0,0722

(E) EXPONENCIAL CUADRATICO CON ALFA = 0,9999

Model MSE MAE MAPE ME MPE(A) 0,238873 0,40221 9,8215 0,214061 4,72564 (B) 0,143186 0,304866 8,14321 0,0731656 1,59627 (C) 0,191563 0,333699 8,9771 0,0725751 1,81061 (D) 0,147695 0,301115 8,14287 -0,0352935 -2,02954 (E) 0,65275 0,580664 16,4134 -0,0192101 -0,491391 Model RMSE RUNS RUNM AUTO MEAN VAR(A) 0,488746 *** ** *** OK (B) 0,378399 * OK OK OK (C) 0,437679 *** OK ** OK (D) 0,384311 OK OK OK OK (E) 0,807929 OK OK ** OK

Las tablas presentan los errores y los tests para los cinco métodos de suavizamiento aplicados a la data Salinidad promedio anual del Lago de Maracaibo 1961-1998

El modelo (E) SE Holt con ALFA = 0,1308 Y Beta = 0,0722 :

1. Presenta los menores valores para los errores MAE y MAPE.2. Aprueba satisfactoriamente los cuatro tests considerados

TABLA DE LOS TESTS LECTURA:RMSE = Raíz cuadrada del MSERUNS = Test para las corridas arriba y abajoRUNM = Test para las corridas arriba y abajo de la mediana.AUTO = Test Box-Pierce para las autocorrelaciones excesivas.MEAN = Test para la de la media de la primera y la segunda mitad.VAR = Test de la diferencia de varianza de la primera y la segunda mitad.

La tabla también presenta el resultado de cinco pruebas de los residuales para determinar cual de los métodos aplicados es el más adecuado para la data Salinidad. OK significa que el método pasa la prueba, Un * (*) el método falla a un nivel de 90%. Marginalmente significante (0.05 < p <= 0.10)Dos *( **) el método falla a un nivel de confianza de 95%.= Significante (0.01 < p <= 0.05)

Tres * ( ***) el método falla a un nivel de confianza de 99%. Altamente significante (p <= 0.01)Cuando, para un método se presenta uno mas tests estadísticamente significante a un nivel de Confianza de 95% o mayor, se debe considerar otro método.

RESULTADOSLa tabla compara los errores de 5 diferentes modelos de suavizamiento, obtenidos al ser aplicados la data Salinidad Promedio Anual del Lago de Maracaibo 1961-1998 La tabla también presenta el resultado de cinco pruebas de los residuales para determinar cual de los métodos aplicados es el más adecuado para la data Salinidad.

El modelo (E) SE Holt 2 PARAMETROS con ALFA = 0,1308 Y Beta = 0,0722 es el modelo de suavizamiento mas preciso para ajustar la data Salinidad 1937-1998 por que:

Presenta los menores valores para los errores MAE y MAPE. Aprueba satisfactoriamente los cuatro tests de los residuales

COMPARACION DE METODOS DE AJUSTE.La tabla presenta un resumen de los errores de pronóstico para los modelos: Analisis de Tendencia, Suavizamiento Exponencial, Curva de Crecimiento y Series de Tiempo.

1. Análisis de Tendencia: Línea Recta ( St = -105,379 + 0,0550309t)2. Suvizamiento Exponencial: Holt 2PARAMETROS ALFA = 0,9999 Y BETA =

0,01093. Curva de Crecimiento : Gomperz (St = 4,422*EXP(-EXP(-0,04278(9,888802 *t)4. Modelo Serie de Tiempo : ARIMA(5 ,1 ,5)

Modelo MSE MAE MAPE 1. ANALISIS TENDENCIA 0,40265 0,4809 20,0359

2. SUAVIZAMIENTO EXPONENCIAL 0,314702 0,38996 10,3621

3. CURVA DE CRECIMIENTO 0,197151 0,298189 11,4061

4. SERIE DE TIEMPO: ARIMA(5 ,1 ,5) 0,177953 0,267748 10,3608

La tabla de los errores de pronostico nos indica que el modelo mas preciso para ajustar la serie Salinidad Promedio Anual del Lago de Maracaibo es el Modelo ARIMA(5 ,1 ,5).

ANALISIS DE TENDENCIACURVAS DE CRECIMIENTOCuando requerimos hacer predicciones sobre el comportamiento futuro, de variables que mantienen durante largos periodos una rata de variación constante, como es el caso de la serie de la Salinidad del Lago de Maracaibo , se usan modelos analíticos para interpretar la magnitud del cambio y de la rata de crecimiento estos modelos son conocidos como los modelos del Análisis de Tendencia y las Curvas de Aprendizaje o Curvas de Crecimiento, en seguida se presenta la aplicación de estos modelos a la serie de la salinidad del Lago.

ANALISIS DE TENDENCIAModelos(A) TENDENCIA LINEAL St = -105,379 + 0,0550309 t

(B) TENDENCIA CUADRATICA St = -318,072 + 0,271152 t + -0,000054895 t^2 (C) TENDENCIA EXPONENCIAL St = exp(-42,1707 + 0,02191 t)(D) CURVA-S St = exp(44,1636 + -85038,5 /t)(E) ARIMA(5,1,4)

Modelo MSE MAE MAPE ME MPE (A) 0,402659 0,480992 20,0359 -9,06682E-16 -6,8 (B) 0,408025 0,484291 20,1934 2,29754E-14 -6,66 (C) 0,490269 0,500901 19,3423 0,0611849 -3,453 (D) 0,483988 0,496866 19,209 0,0611999 -3,419 (E) 0,195616 0,315312 12,1129 0,0225992 -1,773 Modelo RMSE RUNS RUNM AUTO MEAN VAR(A) 0,634554 *** *** *** OK *** (B) 0,638769 *** *** *** OK *** (C) 0,700192 *** *** *** ** *** (D) 0,695692 *** *** *** *** *** (E) 0,442285 *** * OK OK OK

El modelo Lineal es el modelo de tendencia que major ajusta la data Salinidad 1937-1998(mayor correlacion y mayor R-Cuadrado), sinembargo los modelos de serie de tiempo ARIMA(5,1,4) y la Curva-S son modelos mas precisos.

TABLA DE COMPARACION DE MODELOS

CURVAS DE CRECIMIENTOLas curvas de crecimiento interpretan adecuadamente a procesos que presenten un omportamiento con una primera fase con un arranque suave, una fase intermedia de crecimiento sostenido y una tercera etapa de estabilización lenta y sostenida.

Se han desarrollado expresiones no-lineales que interpretan cabalmente este tipo de desarrollo, estas funciones son en general funciones de orden exponencial o de orden súper-exponencial y son referidas como las curvas de crecimiento.

El proceso de salinizacion del lago de Maracaibo en los ultimos 70 años puede ser tratado como una curva de crecimiento con un arranque suave, un intermedio de crecimiento sostenido y una parte final de crecimiento decreciente

Se estudia el ajuste de la serie con tres modelos de curvas de crecimiento: Gompertz, MMF y el modelo Logistico, al analizar los tres modelos de curvas de crecimiento: Gompertz, MMF y Logistico se concluye que el modelo que mejor ajusta la serie de tiempo Salinidad 1937-1998 es la curva Gompertz, el modelo Gompertz presenta da el menor Error Estandar(630.643) y el mayor Coeficiente de Correlación (0.8433547).

AJUSTE ESTACIONALDESCOMPOSICION CLASICA Las técnicas de ajuste estacional son métodos para calcular los índices estacionales y usar estos índices para eliminar las variaciones estacionales de la serie de tiempo, la técnica de ajuste estacional se aplica por medio de los métodos de descomposición. El método de descomposición Clásica, también referido como CENSUS I, comienza por establecer la proporción con la que intervienen los factores que gobiernan y determinan el patrón de comportamiento de una serie temporal, una vez identificada la importancia y la cuantía de estos factores, el valor del pronóstico se determina mediante una suma o un producto de estos factores, según que el modelo sea aditivo o multiplicativo.

Los componentes que determinan el patrón de comportamiento de una serie son: fluctuaciones aleatorias, variación estacional, variación cíclica y la tendencia.

La Variación Aleatoria es la fluctuacion producida por causas puramente aleatorias, La Tendencia es el componente de largo plazo que da la base del crecimiento de una serie de tiempo,La Variación Estacional se refiere a los cambios recurrentes que se repiten sistemáticamente en el tiempo y La Variación Cíclica se refiere a las fluctuaciones en forma de ciclos de larga duración que presenta la serie alrededor de la recta o la curva de tendencia, los ciclos pueden ser periódicos o no periódicos y pueden tener o no, un idéntico comportamiento en periodos iguales.El objetivo principal del método de Descomposición es aislar estos componentes, “descomponer” la serie en los efectos de la tendencia, del ciclo, de la estacionalidad y de la variación aleatoria.La diferencia entre el componente estacional y el componente cíclico es que el componente estacional se produce regularmente mientras que el componente cíclico se produce en ciclos a largo plazo. .

ECUACION MODELOS ERR ESTACOEF CORR

y=a*exp(-exp(b-cx)) GOMPERTZ 630.6430.84335

47y=(a*b+c*x^d)/(b+x^d) MMF 631.847

0.841542

y=a/(1+b*exp(-cx)) LOGISTICO 632.9170.84211

70

EL MODELO GENERALEl modelo general de la descomposición puede expresarse, en forma aditiva o en forma multiplicativa, como una función de los cuatro componentes que expresan los factores que influyen en el patrón de la serie:Modelo Aditivo: Xt = TCt + St + It Modelo Multiplicativo:

Yt = Tt*Ct*St*It Ft = El pronostico para el periodo t.It = El componente Estacional.Tt = El componente de Tendencia Ct = El componente Cíclico.St = El componente del Error Aleatorio

Aplicación del método de Descomposición Clásica a: SALINIDAD 1937-1998

CURVAS D E CRECIMIENTO

Las curvas de crecimiento interpretan adecuadamente a procesos que presenten un comportamiento con una primera fase con un arranque suave, una fase intermedia de crecimiento sostenido y una tercera etapa de estabilización lenta y sostenida.

Se han desarrollado expresiones no-lineales que interpretan cabalmente este tipo de desarrollo, estas funciones son en general funciones de orden exponencial o de orden súper-exponencial y son referidas como las curvas de crecimiento.Los procesos que producen curvas tipo Curva-S son comunes en una variedad de campos como la biología, la minería, la agricultura, la ingeniería y la economía.

Las Curvas de Crecimiento se pueden clasificar en dos tipos:1. Curvas-s. En forma de una S, un arranque suave, un intermedio de

crecimiento sostenido y una parte final de crecimiento decreciente.2. Curvas de Crecimiento caracterizadas por un crecimiento sostenido

hasta alcanzar una asintota.CURVAS-SModelo Gompertz: y = a * exp (-exp(b - cx))Modelo Logístico: y = a / (1 + exp (b - cx))Modelo Richards: y = a / (1 + exp(b - cx))^(1/d)Modelo MMF: y = (ab + cx^d)/(b + x^d)Modelo Weibull: y = a - b*exp(-cx^d)

CURVAS DE CRECIMIENTOExponencial (1): y = a*(1-exp(-bx))Exponencial (2): y = a*(b-exp(-cx))Saturación: y = ax / (b + x)

Se analizan 3 modelos de curvas de crecimiento: Gompertz, MMF y Logistico y se concluye que el modelo que mejor ajusta la serie de tiempo Salinidad 1937-1998 es la curva Gompertz.

ECUACION MODELOS ERR ESTAND COEF CORRy=a*exp(-exp(b-cx)) GOMPERTZ 630.643 0.8433547y=(a*b+c*x^d)/(b+x^d) MMF 631.847 0.841542y=a/(1+b*exp(-cx)) LOGISTICO 632.917 0.8421170

MODELO GOMPERTZ

AÑOS

SALI

NID

AD

1.0 13.0 25.0 37.0 49.0 61.0

MODELO MMF

AÑOS

SALI

NID

AD

1.0 11.0 21.0 31.0 41.0 51.0 61.0

MODELO LOGISTICO

AÑOS

SALI

NID

AD

1.0 13.0 25.0 37.0 49.0 61.0

La tabla y la grafica presentan un resumen de la aplicación de tres modelos de Curvas de Crecimiento a la data Salinidad del Lago de Maracaibo 1937-1998.

El modelo Gompertz presenta da el menor Error Estandar(630.643) y el mayor Coeficiente de Correlación (0.8433547).

MODELO GOMPERTZ

SALINIDAD = 4,422*EXP(-EXP(-0,04278(9,888802 * t ))

Parametro Lower Upper NOMBRE ESTIMADO ERROR 95% C.L. 95% C.L. A 4,422904 0,5765733 3,269183 5,576624 B 4,278E-02 1,35E-02 1,51E-02 7,07E-02 C 9,888802 3,347519

-1,5

-0,6

0,3

1,1

2,0

-3,0 -1,5 0,0 1,5 3,0

Probabilidad Normal

VALOR SALINIDAD

VALO

R E

SPERADO

AJUSTE ESTACIONALDESCOMPOSICION CLASICA Las técnicas de ajuste estacional son métodos para calcular los índices estacionales y usar estos índices para eliminar las variaciones estacionales de la serie de tiempo. La técnica de ajuste estacional se aplica por medio de los métodos de descomposición. El método de descomposición Clásica, también referido como CENSUS I, comienza por establecer la proporción con la que intervienen los factores que gobiernan y determinan el patrón de comportamiento de una serie temporal.

Una vez identificada la importancia y la cuantía de estos factores, el valor del pronóstico se determina mediante una suma o un producto de estos factores, según que el modelo sea aditivo o multiplicativo.

Los componentes que determinan el patrón de comportamiento de una serie son: Fluctuaciones Aleatorias. Variación Estacional. Variación Cíclica La Tendencia.

La Variación Aleatoria.Son las fluctuaciones producidas por causas puramente aleatorias, como un cambio súbito del clima.La TendenciaLa Tendencia es el componente de largo plazo que da la base del crecimiento de una serie de tiempo.La Variación EstacionalLa variación estacional se refiere a los cambios recurrentes que se repiten sistemáticamente en el tiempo.

La Variación CíclicaLas variaciones cíclicas se refieren a las fluctuaciones en forma de ciclos de larga duración que presenta la serie alrededor de la recta o la curva de tendencia. Los ciclos pueden ser periódicos o no periódicos y pueden tener o no, un idéntico comportamiento en periodos iguales.

El objetivo principal del método de Descomposición es aislar estos componentes, “descomponer” la serie en los efectos de la tendencia, del ciclo, de la estacionalidad y de la variación aleatoria.

La diferencia entre el componente estacional y el componente cíclico es que el componente estacional se produce regularmente mientras que el componente cíclico se produce en ciclos a largo plazo. .EL MODELO GENERALEl modelo general de la descomposición puede expresarse, en forma aditiva o en forma multiplicativa, como una función de los cuatro componentes que expresan los factores que influyen en el patrón de la serie:Modelo Aditivo: Xt = TCt + St + It Modelo Multiplicativo:

Yt = Tt*Ct*St*It Ft = El pronostico para el periodo t.It = El componente Estacional.Tt = El componente de Tendencia Ct = El componente Cíclico.St = El componente del Error Aleatorio

Aplicación del método de Descomposición Clásica a: SALINIDAD 1937-1998

GRAFICAS BOX-WISKER POR PERIODOS

MODELOS DE SERIES DE TIEMPOMetodología Box-JenkinsLos modelos de Series de Tiempo se basan en la noción de que las series que se van a pronosticar han sido generadas por un proceso estocástico con una estructura que puede describirse y caracterizarse.El proceso de Serie de Tiempo proporciona una descripción del proceso que genera la serie. Si el proceso estocástico que genera la ST es invariable en el tiempo la Serie es estacionaria y el proceso se puede modelar por una ecuación con coeficientes fijos los cuales pueden estimarse con los datos históricos de la serie.

En el caso de la serie Salinidad Anual del lago de Maracaibo para el periodo 1937-1998 al analizar las graficas de las autocorrelaciones se observa que la serie original no es estacionaria y que la estabilidad estadistica se alcanza al tomar la primera diferencia, por lo que los modelos tentativos que se estudian son del tipo: ARIMA (p, 1, q)

1-. IDENTIFICACIONPor medio del procedimiento de identificación de la metodología B-J determinamos el grado de diferenciación para el cual la serie salinidad se hace una serie estacionaria y los modelos ARIMA tentativos que se evaluaran en las próximas fases de la metodología.Con el análisis de las autocorrelaciones se determino que la serie original de la salinidad anual 1937-1998 se hace estacionaria al tomar la primera diferencia, que la serie presenta una estacionalidad de L=7 años y como modelos tentativos los modelos:

ARIMA(4,1,4) ARIMA(4,0,5) ARIMA(4,0,2) ARIMA(5,0,1) ARIMA(4,1,5)

2-. ESTIMACION Y DIAGNOSTICO DE LOS MODELOS En esta fase se determinan los coeficientes de los modelos Arima tentativos y los errores de pronostico (MSE, MAE, MAPE, ME y MPE) de cada modelo.Se determina que: EL MODELO MAS PRECISO ES EL ARIMA (4, 1,5)

MODELOS TENTATIVOS1. ARIMA(4,1,4) 2. ARIMA(4,0,5) 3. ARIMA(4,0,2) 4. ARIMA(5,0,1) 5. ARIMA(4,1,5)

    EL MODELO MAS PRECISO ES EL ARIMA(4,1,5)  MSE MAE MAPE ME MPE RMSE RUNS RUNM AUTO VAR

ARIMA(4,1,4) 0,175 0,266 10,41 0,024 -1,306 0,418 * ** OK OKARIMA(4,0,5) 0,199 0,311 12,03 0,022 -1,699 0,446 *** * OK OKARIMA(4,0,2) 0,197 0,298 11,41 0,018 -1,67 0,444 * OK OK OKARIMA(5,0,1) 0,198 0,301 11,46 0,025 -1,358 0,445 *** ** OK OKARIMA(4,1,5) 0,178 0,268 10,31 0,029 -1,004 0,422 ** OK OK OK

LecturaRMSE =Raíz del Error Medio CuadradoRUNS = Test para las corridas excesivas arriba y debajo de la serie.RUNM = Test para las corridas arriba y debajo de la mediana.AUTO = Test de Box-Pierce para las autocorrelaciones.MEAN = Test la primera y de la segunda mitad de la serie.VAR = Test de la varianza de la primera y la segunda mitad de la serie.OK = no significante (p >= 0.10)* = marginalmente significante (0.05 < p <= 0.10)** = significante (0.01 < p <= 0.05)*** = altamente significante (p <= 0.01)

3-. ESTIMACION DE LOS PARAMETROSDEL MODELO MAS PRECISO ARIMA (4,1,5)Parámetro Estimado Stnd. Error t B P-value AR(1) 0,382336 0,353588 1,0813 0,284458AR(2) -0,193767 0,504041 -0,384428 0,702199AR(3) -0,386848 0,492759 -0,785065 0,435911AR(4) 0,529732 0,235284 2,25146 0,028526MA(1) 0,540756 0,3605 1,50002 0,139544MA(2) -0,235791 0,581132 -0,405744 0,686564MA(3) -0,141579 0,513362 -0,275787 0,783784MA(4) 0,808201 0,290183 2,78515 0,007405Media 0,0474267 0,010681 4,44028 0,000046Constante 0,031707 Varianza del Ruido Blanco = 0,174734 con 53 grados de libertadDesviación Estándar = 0,418012

4-. DIAGNOSTICOLa fase de Evaluación y Diagnostico consiste en determinar si el modelo y los residuales aprueban los tests de aleatoriedad y normalidad.

ANÁLISIS DE LOS RESIDUALESTESTS DE ALEATORIEDAD DE LOS RESIDUALES DEL MODELO ARIMA(4,1,5).

A-.Corridas arriba y abajo de la mediana. Mediana = 0,0234722 Numero de corridas arriba y abajo de la mediana = 22 Numero de corridas esperadas = 32 Estadístico de prueba z = -2,43303 P-value = 0,0149731Como el p-value es menor de 0,05 se puede rechazar la hipótesis de que los residuales siguen una secuencia aleatoria con un nivel de confianza de 95%.

B-.Corridas arriba y debajo de la mediaNumero de corridas arriba y abajo = 35Numero de corridas esperadas = 41Estadístico de prueba z = -1,6814P-value = 0,0926851Como el p-value es menor de 0,1 se puede rechazar la hipótesis de que los residuales siguen una secuencia aleatoria con un nivel de confianza de 90%.

C-. Test de Box-Pierce Test basado en las primeras 20 autocorrelaciones Estadístico de la prueba = 11,5696 P-value = 0,480832

Como el p-value es mayor de 0,1 no se puede rechazar la hipótesis de que los residuales siguen una secuencia aleatoria con un nivel de confianza de 90% o mayor.

Estos tests se usan para determinar si la serie los residuales siguen una secuencia aleatoria, la secuencia aleatoria es referida como el “ruido blanco” y en él, la serie proporciona la misma contribución de valores a las distintas frecuencias.

5-. PRONOSTICOSe presentan las graficas de: Serie de Tiempo de la Salinidad Anual (1937-1998), el pronostico con el modelo ARIMA (4, 1,5) de la Salinidad del Lago de Maracaibo para los próximos 10 años y los intervalos de confianza de este pronostico con una confianza de 95 y una tabla con los pronósticos y los limites de confianza 95% para los próximos 10 años.

RESULTADOSSe presentan las graficas de: Serie de Tiempo de la Salinidad

PRONOSTICO DE SALINIDAD 1937-1998 ARIMA (4, 1,5) Lower 95% Upper 95% PERIODO PRONOS Limite Limite 1999 4,07998 3,23284 4,92712 2000 4,24187 3,13887 5,34488 2001 4,32839 3,00275 5,65404 2002 4,32341 2,90118 5,74564 2003 4,34734 2,89973 5,79495 2004 4,44655 2,99237 5,90073

SERIE SALINIDAD ANUAL 1977-1998

IDENTIFICACION Y MODELOS TENTATIVOS PARA SERIE ANUAL 1937-1998 Con el análisis de las autocorrelaciones se determino que la serie original de la salinidad anual 1977-1998 se hace estacionaria al tomar la primera diferencia, que la serie presenta una estacionalidad de L=6 años y como modelos tentativos los modelos: (A) ARIMA(5,1,4)(B) ARIMA(4,1,4)(C) ARIMA(4,1,5)(D) ARIMA(3,1,5)(E) ARIMA(3,1,3)

Modelo MSE MAE MAPE ME MPE------------------------------------------------------------------------(A) 0,0507389 0,136921 3,72307 -0,00303253 -0,31024

(B) 0,0526063 0,137341 3,7771 -0,0149243 -0,80748 (C) 0,0576933 0,147737 4,05239 -0,00703304 -0,387848 (D) 0,0455321 0,13321 3,60407 -0,00900673 -0,345436 (E) 0,0507705 0,148622 4,08388 0,00957478 0,0742806

PRONOSTICO DE SALINIDAD ANUAL CON ARIMA (4, 1,5) PARA 1977-98 Se presentan las graficas de: Serie de Tiempo de la Salinidad Anual (1977-1998), el pronostico con el modelo ARIMA (4, 1,5) de la Salinidad del Lago de Maracaibo para los próximos 10 años y los intervalos de confianza de este pronostico con una confianza de 95 y una tabla con los pronósticos y los limites de confianza 95% para los próximos 10 años.

SERIE SALINIDAD 1977-1998 CUATRO EPOCAS AL AÑO

IDENTIFICACION Y MODELOS TENTATIVOS PARA SERIE ANUAL 1937-1998 Con el análisis de las autocorrelaciones se determino que la serie original de la salinidad anual 1977-1998 cuatro epocas al año se hace estacionaria al tomar la primera diferencia, que la serie presenta una estacionalidad de L=7años y como modelos tentativos los modelos: (A) ARIMA(5,1,4)(B) ARIMA(4,1,4)(C) ARIMA(4,1,5)(D) ARIMA(3,1,5)(E) ARIMA(3,1,3)

    EL MODELO MAS PRECISO ES EL ARIMA(4,1,5)MSE MAE MAPE ME MPE RMSE RUNS RUNM AUTO VAR

ARIMA(4,1,4) 0,175 0,266 10,41 0,024 -1,306 0,314915 OK OK OK OK ***

ARIMA(4,0,5) 0,199 0,311 12,03 0,022 -1,699 0,320255 OK OK OK OK ***

ARIMA(4,0,2) 0,197 0,298 11,41 0,018 -1,67 0,313707 OK OK OK OK ***

ARIMA(5,0,1) 0,198 0,301 11,46 0,025 -1,358 0,320365 OK OK OK OK ***

ARIMA(4,1,5)

0,178 0,268 10,31 0,029 -1,004 0,315562 OK OK OK OK ***

PRONOSTICO DE SALINIDAD ANUAL CON ARIMA (4, 1,5) PARA 1977-98 Se presentan las graficas de: Serie de Tiempo de la Salinidad Anual (1977-1998), el pronostico con el modelo ARIMA (4, 1,5) de la Salinidad del Lago de Maracaibo para los próximos 10 años y los intervalos de confianza de este pronostico con una confianza de 95 y una tabla con los pronósticos y los limites de confianza 95% para los próximos 10 años.

SERIE SALINIDAD ANUAL 1992-1998

IDENTIFICACION Y MODELOS TENTATIVOS PARA SERIE ANUAL 1992-1998 Con el análisis de las autocorrelaciones se determino que la serie original de la salinidad anual 1977-1998 se hace estacionaria al tomar la primera diferencia, que la serie presenta una estacionalidad de L=6 años y como modelos tentativos los modelos: (A) ARIMA(5,1,4)(B) ARIMA(4,1,4)(C) ARIMA(4,1,5)(D) ARIMA(3,1,5)(E) ARIMA(3,1,3)

MSE MAE MAPE ME MPE (A) 0,115472 0,215147 5,13701 0,0336182 0,370675 (B) 0,125395 0,268966 6,39666 0,0100399 0,0648812 (C) 0,112928 0,251228 6,03475 -0,00204979 -0,131258 (D) 0,0903148 0,19821 4,65495 0,0333939 0,558332 (E) 0,11824 0,254327 6,04809 0,011803 0,133476 RMSE RUNS RUNM AUTO MEAN VAR(A) 0,339811 OK OK OK ** OK (B) 0,354111 OK OK OK OK OK (C) 0,336048 OK OK OK OK OK (D) 0,300524 OK OK OK * OK (E) 0,34386 OK OK OK OK OK

PRONOSTICO DE SALINIDAD ANUAL CON ARIMA (4, 1,5) PARA 1992-98 Se presentan las graficas de: Serie de Tiempo de la Salinidad Anual (1992-1998), el pronostico con el modelo ARIMA (4, 1,5) de la Salinidad del Lago de Maracaibo para los próximos 10 años y los intervalos de confianza de este pronostico con una confianza de 95 y una tabla con los pronósticos y los limites de confianza 95% para los próximos 10 años.

Modelo MSE MAE MAPE ME MPE------------------------------------------------------------------------(A) 0,0507389 0,136921 3,72307 -0,00303253 -0,31024 (B) 0,0526063 0,137341 3,7771 -0,0149243 -0,80748 (C) 0,0576933 0,147737 4,05239 -0,00703304 -0,387848 (D) 0,0455321 0,13321 3,60407 -0,00900673 -0,345436 (E) 0,0507705 0,148622 4,08388 0,00957478 0,0742806

PRONOSTICO DE SALINIDAD ANUAL CON ARIMA (4, 1,5) PARA 1977-98 Se presentan las graficas de: Serie de Tiempo de la Salinidad Anual (1977-1998), el pronostico con el modelo ARIMA (4, 1,5) de la Salinidad del Lago de Maracaibo para los próximos 10 años y los intervalos de confianza de este pronostico con una confianza de 95 y una tabla con los pronósticos y los limites de confianza 95% para los próximos 10 años.Model RMSE RUNS RUNM AUTO MEAN VAR (A) 0,225253 OK OK ** OK OK (B) 0,229361 OK OK OK OK OK (C) 0,240194 OK OK OK OK OK (D) 0,213382 OK OK OK OK OK (E) 0,225323 OK OK OK OK OK

    EL MODELO MAS PRECISO ES EL ARIMA(4,1,5)MSE MAE MAPE ME MPE RMSE RUNS RUNM AUTO VAR

ARIMA(4,1,4) 0,175 0,266 10,41 0,024 -1,306 0,314915 OK OK OK OK ***

ARIMA(4,0,5) 0,199 0,311 12,03 0,022 -1,699 0,320255 OK OK OK OK ***

ARIMA(4,0,2) 0,197 0,298 11,41 0,018 -1,67 0,313707 OK OK OK OK ***

ARIMA(5,0,1) 0,198 0,301 11,46 0,025 -1,358 0,320365 OK OK OK OK ***

ARIMA(4,1, 0,178 0,268 10,31 0,029 -1,004 0,315562 OK OK OK OK ***

5)

Modelos(A) ARIMA (4, 1,5)(B) ARIMA (5, 1,2)(C) ARIMA (5, 1,3)(D) ARIMA (5, 1,5)(E) ARIMA (5, 1,4)

MSE MAE MAPE ME MPE (A) 0,115472 0,215147 5,13701 0,0336182 0,370675 (B) 0,125395 0,268966 6,39666 0,0100399 0,0648812 (C) 0,112928 0,251228 6,03475 -0,00204979 -0,131258 (D) 0,0903148 0,19821 4,65495 0,0333939 0,558332 (E) 0,11824 0,254327 6,04809 0,011803 0,133476 RMSE RUNS RUNM AUTO MEAN VAR(A) 0,339811 OK OK OK ** OK (B) 0,354111 OK OK OK OK OK (C) 0,336048 OK OK OK OK OK (D) 0,300524 OK OK OK * OK (E) 0,34386 OK OK OK OK OK