Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
Calibracao Espaco-temporal de Previsoes
Numericas do Modelo de Mesoescala Eta
para a Velocidade do Vento em Minas
Gerais
Luiz Eduardo da Silva Gomes
Departamento de Metodos Estatısticos
Instituto de Matematica
Universidade Federal do Rio de Janeiro
2018
Calibracao Espaco-temporal de PrevisoesNumericas do Modelo de Mesoescala Eta
para a Velocidade do Vento em MinasGerais
Luiz Eduardo da Silva Gomes
Dissertacao de Mestrado submetida ao Programa
de Pos-Graduacao em Estatıstica do Instituto de
Matematica da Universidade Federal do Rio de
Janeiro como parte dos requisitos necessarios a
obtencao do tıtulo de Mestre em Estatıstica.
Orientadoras: Profa. Dra. Thais C. O. Fonseca
Profa. Dra. Kelly C. M. Goncalves
Rio de Janeiro, RJ – Brasil
2018
ii
CIP - Catalogação na Publicação
Elaborado pelo Sistema de Geração Automática da UFRJ com os dados fornecidospelo(a) autor(a), sob a responsabilidade de Miguel Romeu Amorim Neto - CRB-7/6283.
G633cGomes, Luiz Eduardo da Silva Calibração espaço-temporal de previsões numéricasdo modelo de mesoescala Eta para a velocidade dovento em Minas Gerais / Luiz Eduardo da SilvaGomes. -- Rio de Janeiro, 2018. 105 f.
Orientadora: Thais Cristina Oliveira da Fonseca. Coorientadora: Kelly Cristina Mota Gonçalves. Dissertação (mestrado) - Universidade Federal doRio de Janeiro, Instituto de Matemática, Programade Pós-Graduação em Estatística, 2018.
1. Calibração. 2. Modelo de mesoescala Eta. 3.Modelos lineares dinâmicos espaço-temporais. 4.Previsão da velocidade do vento. 5. Técnica deaumento de dados. I. Fonseca, Thais CristinaOliveira da, orient. II. Gonçalves, Kelly CristinaMota, coorient. III. Título.
Agradecimentos
A Deus.
Aos meus amados pais que sempre fizeram de tudo para que eu pudesse chegar ate aqui.
Obrigado pelo suporte, educacao e apoio que voces me proporcionam. Sem voces, grande
momentos como este, nao seriam possıveis. Eu continuarei orgulhando voces. Ate o fim. Eu
amo voces. Incondicionalmente.
A Iuna Alves, minha velha amiga que tornou-se recem companheira. Voce e incrıvel (e
engracada). Obrigado por sempre mostrar-me o lado bom da vida e me fazer sorrir em dias
chuvosos e ensolarados. Te amo.
As minhas orientadoras Thais Fonseca e Kelly Goncalves pelo auxılio e disponibilidade
oferecidos durante o desenvolvimento do trabalho. O conhecimento compartilhado por voces
foram primordiais no meu desenvolvimento academico.
Aos amigos que fiz durante o curso, em especial, Rafael Erbisti, Rebecca Souza, Renato
Gomes, Rodrigo Lassance e Victor Eduardo. Foi um prazer compartilhar aflicoes, notas de aula
e conceitos (nem tao bons assim) com voces.
Aos amigos que fiz previamente e tambem estavam la, em especial, ao Marcel, meu antigo
orientador de IC na Fiocruz, e a Raıra Marotta, uma graduacao inteira nao foi o suficiente ne?
Aos velhos amigos, Bruno Delgado, Filipe Steikofp, Patrick Martins e Romario Paiva. Nos
estaremos sempre juntos!
A Profa. Marina Paez e ao Prof. Marcos Prates por aceitarem integrar a banca.
Ao Prof. Gustavo Ferreira por, ainda, ser um exemplo profissional e pessoal para mim.
Obrigado pela oportunidade de ir alem do esperado (no passado) e ter chegado ate aqui. Como
proposto por mim no fim da graduacao, obrigado por tambem compor a atual banca.
A Ramiro Cadernas por auxiliar na coordenacao do projeto maior o qual, meu projeto esta
aninhado, e pela disponibilizacao dos dados necessarios para este trabalho.
Por fim, a parceria FAPEMIG/CEMIG pelo apoio financeiro.
v
Resumo
Previsoes de variaveis meteorologicas provenientes de modelos numericos estao,
sistematicamente, sujeitas a erros. Tais erros devem-se a tentativa de simular
deterministicamente processos termodinamicos da atmosfera a partir de suas condicoes
correntes por meio de sistemas de equacoes diferenciais. Alem disto, estes sistemas sao
solucionados em uma grade discreta, apresentando previsoes uniformes para toda regiao
pertencente a mesma celula desta grade. Por consequencia, previsoes procedentes de
modelos numericos podem nao ser representativas em locais especıficos. Assim, tecnicas
de pos-processamento estatıstico sao apropriadas para a calibracao destas previsoes,
minimizando possıveis distorcoes.
O presente trabalho tem por objetivo minimizar os erros das previsoes do modelo
de mesoescala Eta para a velocidade do vento a 10 metros do solo no Estado de Minas
Gerais atraves do desenvolvimento de extensoes aprimoradas dos principais modelos de
pos-processamento estatıstico para campos meteorologicos. Os modelos propostos foram
estruturados atraves da tecnica de aumento de dados e dos Modelos Lineares Dinamicos.
Palavras-Chaves: Calibracao; Modelo de mesoescala Eta; Modelos lineares dinamicos
espaco-temporais; Previsao da velocidade do vento; Tecnica de aumento de dados.
vi
Abstract
Forecasts of meteorological variables from numerical models are systematically subject
to errors. Such errors are due to the attempt to simulate deterministically thermodynamic
processes of the atmosphere from their current conditions through systems of differential
equations. Besides, these systems are solved in a discrete grid, presenting uniform
forecasts for every region belonging to the same grid cell. Consequently, forecasts
from numerical models may not be representative at specific locations. Thus, statistical
post-processing techniques are appropriate for calibration of these forecasts, minimizing
possible distortions.
This work aims to minimize the errors of the Eta mesoscale model’s forecasts for the
wind speed at 10 meters above the ground in the State of Minas Gerais through the
development of improved extensions of the main statistical post-processing models for
meteorological fields. The proposed models were structured by the data augmentation
technique and the dynamic linear models.
Keywords: Calibration; Eta mesoscale model; Data augmentation technique;
Dynamical spatio-temporal linear models; Wind speed forecast.
vii
Sumario
Lista de Figuras xi
Lista de Tabelas xiv
Lista de Abreviaturas e Siglas xv
1 Motivacao 1
1.1 Previsao Numerica em Minas Gerais . . . . . . . . . . . . . . . . . . . . 2
2 Introducao 9
2.1 Previsao Numerica do Tempo . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1.1 Historia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.2 Aplicacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.3 Classificacao dos modelos . . . . . . . . . . . . . . . . . . . . . . 12
2.1.4 Ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1.5 Fontes de incerteza . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.1.6 Aperfeicoamento dos modelos . . . . . . . . . . . . . . . . . . . . 15
2.2 Pos-Processamento Estatıstico . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3 Modelo de Mesoescala Eta . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3 Modelos de Pos-Processamento Estatıstico 19
3.1 Metodos de Calibracao Univariados . . . . . . . . . . . . . . . . . . . . . 19
3.1.1 Model Output Statistics . . . . . . . . . . . . . . . . . . . . . . . 19
3.1.2 Ensemble Model Output Statistics . . . . . . . . . . . . . . . . . . 20
viii
3.2 Metodos de Calibracao Espaciais . . . . . . . . . . . . . . . . . . . . . . 21
3.2.1 Geostatistical Output Pertubation . . . . . . . . . . . . . . . . . . 21
3.2.2 Spatial Ensemble Model Output Statistics . . . . . . . . . . . . . . 22
3.3 Metodos de Calibracao Espaco-temporais . . . . . . . . . . . . . . . . . . 23
3.3.1 Dynamic Geostatistical Output Pertubation . . . . . . . . . . . . . 25
3.3.2 Spatiotemporal Ensemble Model Output Statistics . . . . . . . . . 27
4 Aplicacao a Previsao da Velocidade do Vento em Minas Gerais 29
4.1 Descricao do Conjunto de Dados . . . . . . . . . . . . . . . . . . . . . . . 29
4.2 Selecao de Covariaveis e Definicoes dos Modelos . . . . . . . . . . . . . . 32
4.3 Modelos Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.4 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.4.1 Aplicacao: Diaria . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.4.2 Aplicacao: Horaria . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.4.3 Aplicacao: Interpolacao Espacial . . . . . . . . . . . . . . . . . . 56
4.5 Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5 Consideracoes Finais e Trabalhos Futuros 62
Referencias Bibliograficas 65
Apendice 72
A Outros Modelos de Pos-Processamento Estatıstico 73
A.1 Bayesian Model Average . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
A.2 Spatial Bayesian Model Average . . . . . . . . . . . . . . . . . . . . . . . 74
B Criterios de Comparacao de Modelos 76
B.1 Raiz Quadrada do Erro Quadratico Medio . . . . . . . . . . . . . . . . . 76
B.2 Erro Absoluto Medio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
B.3 Indice de Concordancia de Willmott . . . . . . . . . . . . . . . . . . . . . 76
B.4 Interval Score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
ix
C Distribuicoes Condicionais Completas 78
C.1 Vetor parametrico β . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
C.2 Parametro φ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
C.3 Parametro λ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
C.4 Processo Espacial latente Zt(s) . . . . . . . . . . . . . . . . . . . . . . . 79
C.5 Processo Espacial latente Ut(s) . . . . . . . . . . . . . . . . . . . . . . . 80
D Algoritmo Robusto-Adaptativo de Metropolis 81
E Modelos Dinamicos 83
E.1 Modelo Linear Dinamico . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
E.2 Filtro de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
E.3 Distribuicoes de Previsao . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
E.4 Fatores de Desconto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
E.5 Esquema de Amostragem para MLD . . . . . . . . . . . . . . . . . . . . 86
E.6 MLD com Covariancias Estocasticas e Aprendizado por Descontos . . . . 87
x
Lista de Figuras
1.1 Localizacoes das estacoes de monitoramento meteorologico em Minas
Gerais e vizinhanca. Triangulos solidos representam as estacoes.
Linhas contınuas representam a grade discreta utilizada pelo modelo de
mesoescala Eta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Representacao da interpolacao bilinear feita na grade utilizada pelo modelo
Eta para obtencao de previsoes numericas nos locais de observacao: (a)
Grade discreta (15 km × 15 km) e (b) Interpolacao bilinear. . . . . . . . 4
1.3 Serie temporal da velocidade do vento a 10 metros de altura e de suas
respectivas previsoes numericas ao longo das estacoes do ano iniciado as
12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 FAC da velocidade do vento a 10 metros de altura ao longo das estacoes
do ano iniciado as 12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 Histograma da velocidade do vento a 10 metros de altura ao longo das
estacoes do ano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1 Distribuicao espacial de previsoes da refletividade (dBZ) durante a
passagem do Furacao Gustav no Golfo do Mexico, 2008. Adaptado de
NRL (2018). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Exemplos de grade horizontal com diferentes resolucoes. Adaptado de Li
et al. (2016). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Representacao das trajetorias das previsoes numericas inicializadas com
distintas condicoes iniciais. Adaptado de Wilks (2006). . . . . . . . . . . 13
xi
2.4 Organizacao dos membros do ensemble conforme sua classificacao: (a)
Defasados e (b) Tradicional. Adaptado de Warner (2010). . . . . . . . . . 13
2.5 Ensemble de previsoes para a rota do furacao Katrina. Inicializado em 26
de agosto de 2005, 00 UTC (a) e 12 UTC (b). Adaptado de Leutbecher e
Palmer (2008). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.6 Diagrama do processo de calibracao para ensemble de previsoes da
temperatura de superfıcie. Adaptado de Warner (2010). . . . . . . . . . . 17
2.7 Representacao da topografia pela coordenada vertical eta (η). Adaptado
de Mesinger et al. (1988). . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.1 Matriz de correlacao dos membros do ensemble de previsoes numericas da
velocidade do vento a 10 m em 21 de junho de 2016, 12 UTC. . . . . . . 31
4.2 Criterios de comparacao de modelos na aplicacao diaria ao longo das
estacoes do ano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.3 Interval Score na aplicacao diaria ao longo das estacoes do ano. . . . . . 43
4.4 Mediana a posteriori e intervalos de credibilidade de 90% para o vetor
parametrico estatico do modelo STEMOS na aplicacao diaria ao longo das
estacoes do ano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.5 Diagrama de dispersao com valores previstos versus observados na
aplicacao diaria para 18 a 21 de janeiro de 2016, 12 UTC. . . . . . . . . . 45
4.6 Previsao 1 a 4 dias a frente para a velocidade do vento a 10 m de altura
em janeiro de 2016, 12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.7 Diagrama de dispersao com valores previstos versus observados na
aplicacao diaria para 18 a 21 de outubro de 2016, 12 UTC. . . . . . . . . 47
4.8 Previsao 1 a 4 dias a frente para a velocidade do vento a 10 m de altura
em outubro de 2016, 12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . 48
4.9 Criterios de comparacao de modelos na aplicacao horaria ao longo das
estacoes do ano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.10 Interval Score na aplicacao horaria ao longo das estacoes do ano. . . . . . 51
xii
4.11 Mediana a posteriori e intervalos de credibilidade de 90% para o vetor
parametrico estatico do modelo STEMOS na aplicacao horaria ao longo
das estacoes do ano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.12 Diagrama de dispersao com valores previstos versus observados na
aplicacao horaria de 20 de julho de 2016, 13 UTC a 21 de julho de 2016,
12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.13 Previsao ate 24 horas a frente para a velocidade do vento a 10 m de altura
de 20 de julho de 2016, 13 UTC a 21 de julho de 2016, 12 UTC. . . . . . 54
4.14 Diagrama de dispersao com valores previstos versus observados na
aplicacao horaria de 20 de agosto de 2016, 13 UTC a 21 de agosto de
2016, 12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.15 Previsao ate 24 horas a frente para a velocidade do vento a 10 m de altura
de 20 de agosto de 2016, 13 UTC a 21 de agosto de 2016, 12 UTC. . . . . 55
4.16 Previsao ate 24 horas a frente para a velocidade do vento a 10 m de altura
de 20 de julho de 2016, 13 UTC a 21 de julho de 2016, 12 UTC obtidos a
partir da interpolacao espacial. Estacoes de monitoramento A505, A517,
A550 e A560 fora da amostra. . . . . . . . . . . . . . . . . . . . . . . . . 58
4.17 Previsoes 6, 12, 18 e 24 horas a frente para a velocidade do vento a 10
m de altura para o Estado de Minas Gerais. PN: Previsao numerica
proveniente do modelo Eta. PP: Previsao pontual calibrada proveniente
do ajuste do modelo Dynamic Geostatistical Output Calibration (DGOP).
ME: Margem de erro, definida como metade do comprimento do intervalo
de credibilidade 90% da previsao probabilıstica. . . . . . . . . . . . . . . 59
xiii
Lista de Tabelas
4.1 Configuracao dos membros do ensemble para previsoes 24 horas a frente
as 12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.2 Relacao dos criterios de comparacao de modelos para diferentes blocos de
covariaveis e horizontes obtidos nas previsoes realizadas na aplicacao piloto. 35
4.3 Informacoes acerca das cadeias MCMC para os modelos propostos em
diferentes aplicacoes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
xiv
Lista de Abreviaturas e Siglas
BMA Bayesian Model Averaging
CPTEC Centro de Previsao de Tempo e Estudos Climaticos
CRPS Continuous Ranked Probability Score
DGOP Dynamic Geostatistical Output Calibration
dBZ Decibel relativo a Z
DMA Dynamic Model Averaging
EAM Erro Absoluto Medio
EMOS Ensemble Model Output Statistics
ENIAC Computador Integrador Numerico Eletronico
FAC Funcao de autocorrelacao
FFBS Forward Filtering Backward Sampling
GOP Geostatistical Output Calibration
IC Intervalo de Credibilidade
ICW Indice de Concordancia de Willmott
INPE Instituto Nacional de Pesquisas Espaciais
IS Interval Score
xv
MCMC Monte Carlo via Cadeias de Markov
MEE Modelo de Espaco de Estado
MLD Modelo Linear Dinamico
MLG Modelo Linear Generalizado
MOC Model Output Calibration
MOS Model Output Statistics
NCEP U.S. National Centers for Environmental Prediction
NRL U.S. Naval Research Laboratory
RAM Robusto-Adaptativo de Metropolis
rEQM Raiz Quadrada do Erro Quadratico Medio
SBMA Spatial Bayesian Model Averaging
SEMOS Spatial Ensemble Model Output Statistics
STEMOS Spatiotemporal Ensemble Model Output Statistics
UMOS Updatable Model Output Statistics
URSS Uniao das Republicas Socialistas Sovieticas
UTC Tempo Universal Coordenado
xvi
Capıtulo 1
Motivacao
As previsoes numericas do modelo de mesoescala Eta (Mesinger et al., 1988; Black,
1994) sao utilizadas na predicao de fenomenos climaticos. Esses sistemas sao solucionados
em uma grade discreta, i.e., apresentam previsoes uniformes para toda regiao pertencente
a mesma celula desta grade. Como cada previsao e obtida com base em dados medios
da regiao (e.g. altitude media e vegetacao predominante), a representatividade das
previsoes em locais com orografia1 complexa e vegetacao densa se torna deficiente devido
as diferencas nas caracterısticas reais da superfıcie com a homogeneizacao feita por este
modelo. Dessa forma, previsoes geradas pelo modelo Eta podem nao ser representativas
em um local especıfico (Chou et al., 2007).
Para produzir previsoes em pontos distintos, minimizando estas e outras limitacoes
que este tipo de modelo esta sistematicamente submetido, tecnicas de pos-processamento
estatıstico sao apropriadas e auxiliam na melhor acuracia das estimativas em um contexto
probabilıstico (Glahn e Lowry, 1972).
Este trabalho esta organizado em cinco capıtulos, incluindo este que consiste da
motivacao especıfica para o desenvolvimento de modelos de pos-processamento estatıstico
mais aprimorados. O capıtulo 2 faz uma breve introducao acerca da Previsao Numerica
do Tempo e seus principais conceitos. O Capıtulo 3 lista os principais modelos de pos-
processamento estatıstico univariados e espaciais. A partir destes, apresenta propostas
de extensoes espaco-temporais. O Capıtulo 4 exibe e comenta os resultados obtidos
1Orografia e a descricao das nuances do relevo de uma regiao.
1
na aplicacao de distintos modelos de pos-processamento estatıstico, avaliando-os de
forma comparativa. Por fim, o Capıtulo 5 consolida os resultados, discute detalhes das
aplicacoes e apresenta aplicacoes futuras dos metodos propostos.
1.1 Previsao Numerica em Minas Gerais
Especificamente, a metodologia proposta neste trabalho tem como principal objetivo
corrigir potenciais diferencas verificadas entre valores medidos e previsoes numericas da
velocidade do vento no Estado de Minas Gerais de dezembro de 2015 a novembro de
2016.
O Estado de Minas Gerais situa-se na regiao Sudeste do Brasil, sendo inteiramente
formado por planaltos. O relevo acidentado confere ao Estado um recurso hıdrico
privilegiado, abrigando grandes potenciais hidreletricos. A vegetacao predominante e
a do Cerrado consistindo em grandes variacoes na paisagem entre as estacoes chuvosa
e seca, resultando uma influencia sazonal da rugosidade aerodinamica do terreno2 no
deslocamento dos ventos. Toda a porcao leste do Estado e coberta pela Mata Atlantica,
sendo a vegetacao permanentemente verde e densa (Minas Gerais, 2018).
O clima em Minas Gerais varia desde o quente semiarido ate o mesotermico umido.
De maneira geral, a distribuicao das chuvas em Minas Gerais e desigual com o norte
apresentando longos perıodos de estiagem. Nas areas de maior altitude do sul, o regime
pluviometrico e mais intenso. A sazonalizade tambem exerce influencia nas temperaturas,
onde predominantemente as maiores medias ocorrem no verao. Periodicamente, na maior
parte do territorio mineiro, predominam ventos mais intensos no inverno e na primavera
(Amarante et al., 2010).
Ao longo de Minas Gerais e seu entorno, ha 59 estacoes de monitoramento
meteorologico, onde sao recolhidas, de hora em hora, informacoes instantaneas sobre
a velocidade do vento a 10 metros de altura, umidade relativa do ar, temperatura
de superfıcie, pressao atmosferica e precipitacao, distribuıdas conforme a Figura 1.1.
2A rugosidade aerodinamica do terreno e a altitude em que a velocidade do vento cai a zero com base
na extrapolacao do perfil de vento neutro (Barry e Chorley, 2009).
2
Devido a irregularidade do espacamento das estacoes meteorologicas e a grade discreta
Longitude
Latitu
de
−50 −48 −46 −44 −42 −40
−22
−20
−18
−16
−14
Figura 1.1: Localizacoes das estacoes de monitoramento meteorologico em Minas Gerais
e vizinhanca. Triangulos solidos representam as estacoes. Linhas contınuas representam
a grade discreta utilizada pelo modelo de mesoescala Eta.
consideravelmente fina, as previsoes numericas para os locais de observacao sao obtidas,
usualmente, por meio de interpolacao bilinear (consulte Press et al., 2007). Metodos de
interpolacao mais complexos podem ser aplicados sendo entretanto, pouco provavel que
haja ganhos consideraveis (Gel et al., 2004). A Figura 1.2 ilustra esta interpolacao para
previsoes numericas da velocidade do vento a 10 metros de altura em Minas Gerais.
Assim, ha a possibilidade de analisar o erro pontual destas previsoes, principalmente
em locais que sao afetados por aspectos de posicionamento geografico (e.g. latitude,
longitude e altitude), de proximidade com corpos d’agua e de vegetacao regional. Pode-
se citar algumas estacoes com estas caracterısticas como a estacao meteorologica A507
– Uberlandia, pertencente a regiao do Triangulo Mineiro localizada na parte oeste do
Estado, a qual possui majoritariamente vegetacao de cerrado; A530 – Caldas, localizado
ao sul do Estado, no qual ha grande quantidade de registros de velocidade do vento
baixas; A537 – Diamantina, localizada na regiao central, possuindo a maior altitude
(1359 metros) com relacao ao nıvel do mar dentre todas as estacoes; A543 – Espinosa,
localizada no extremo norte, fazendo fronteira com o Estado da Bahia, onde registra-se
maiores medias da velocidade do vento comparado a Minas Gerais e inclusive, contem
3
Longitude
La
titu
de
0
2
4
6
8
−50 −48 −46 −44 −42 −40
−2
2−
20
−1
8−
16
(a)Longitude
La
titu
de
0
2
4
6
8
−50 −48 −46 −44 −42 −40
−2
2−
20
−1
8−
16
(b)
Figura 1.2: Representacao da interpolacao bilinear feita na grade utilizada pelo modelo
Eta para obtencao de previsoes numericas nos locais de observacao: (a) Grade discreta
(15 km × 15 km) e (b) Interpolacao bilinear.
instalacoes de parques eolicos e; A547 – Sao Romao, localizada proximo as margens do
Rio Sao Francisco, o qual forma um corredor canalizando o vento. Influencias sazonais
podem tambem afetar o desempenho das previsoes. Para elucidar esta hipotese, a Figura
1.3 ilustra a serie temporal da velocidade do vento a 10 metros e de suas respectivas
previsoes numericas ao longo da estacoes do ano.
E possıvel observar que nao ha um padrao seguido pelas diferentes localidades.
Estacoes meteorologicas como A507 e A547 apresentam medias maiores durante a
primavera. Para as mesmas estacoes durante o outono, ocorre o menor erro medio das
previsoes numericas, no entanto, para A543, a periodicidade da previsao ao longo de um
dia aparenta inversao. A Figura 1.4 ilustra a Funcao de autocorrelacao (FAC) para a
serie temporal das mesmas estacoes exibidas previamente, elucidando o padrao periodico
existente nos registros na velocidade do vento a 10 m.
Ha padroes periodicos bem definidos durante algumas estacoes do ano. As estacoes
A537, A543 e A547 nao registraram este padrao durante a primavera, diferentemente
de A507 e A530. Estes padroes periodicos sao efeitos sazonais devido ao forcamento
4
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
Obs. Eta
(a) A507 - VeraoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(b) A507 - OutonoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(c) A507 - InvernoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(d) A507 - Primavera
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
Obs. Eta
(e) A530 - VeraoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(f) A530 - OutonoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(g) A530 - InvernoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(h) A530 - Primavera
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
Obs. Eta
(i) A537 - VeraoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(j) A537 - OutonoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(k) A537 - InvernoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(l) A537 - Primavera
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
Obs. Eta
(m) A543 - VeraoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(n) A543 - OutonoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(o) A543 - InvernoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(p) A543 - Primavera
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
Obs. Eta
(q) A547 - VeraoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(r) A547 - OutonoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(s) A547 - InvernoHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +24 +48 +72 +96 +120
03
69
(t) A547 - Primavera
Figura 1.3: Serie temporal da velocidade do vento a 10 metros de altura e de suas
respectivas previsoes numericas ao longo das estacoes do ano iniciado as 12 UTC.
5
Defasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(a) A507 - VeraoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(b) A507 - OutonoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(c) A507 - InvernoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(d) A507 - Primavera
Defasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(e) A530 - VeraoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(f) A530 - OutonoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(g) A530 - InvernoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(h) A530 - Primavera
Defasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(i) A537 - VeraoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(j) A537 - OutonoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(k) A537 - InvernoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(l) A537 - Primavera
Defasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(m) A543 - VeraoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(n) A543 - OutonoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(o) A543 - InvernoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(p) A543 - Primavera
Defasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(q) A547 - VeraoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(r) A547 - OutonoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(s) A547 - InvernoDefasagem (h)
FA
C
0 24 48 72 96 120−0
.50
.00
.51
.0
(t) A547 - Primavera
Figura 1.4: FAC da velocidade do vento a 10 metros de altura ao longo das estacoes do
ano iniciado as 12 UTC.
6
solar3 o qual, tem influencia direta em variaveis meteorologicas, como a temperatura
de superfıcie e na velocidade do vento. Mais comentarios sobre as consequencias desta
atuacao no comportamento e nas previsoes da velocidade do vento sera dada na Secao
2.1.5.
Majoritariamente em Minas Gerais, as previsoes numericas do modelo de mesoescala
Eta superestimam a velocidade do vento a 10 metros. Uma grande limitacao destas e
a ausencia de previsoes com velocidades baixas e iguais a zero, mesmo sendo observada
uma grande proporcao destes casos, como e evidenciado na Figura 1.5 que apresenta os
histogramas da velocidade do vento a 10 metros de altura para as estacoes meteorologicas
A517 – Muriae, A549 – Aguas Vermelhas, A557 – Coronel Pacheco e F501 – Belo
Horizonte (Cercadinho). Esta ultima destoa significativamente das demais, apresentando
medias mais elevadas. De forma geral, a distribuicao da velocidade do vento a 10 metros
em Minas Gerais e assimetrica com grande variabilidade possuindo ponto de massa em
0 e atingindo velocidade maxima de 12 m/s.
Com a breve descricao dos erros e limitacoes das previsoes numericas, considera-se a
calibracao destas por meio de modelos estatısticos. A partir da motivacao de minimizar
o erro sistematico das previsoes numericas do modelo de mesoescala Eta devido as suas
limitacoes intrınsecas, o principal objetivo deste trabalho e propor modelos de pos-
processamento estatıstico considerando dinamica espaco-temporal para a distribuicao
assimetrica da velocidade do vento.
A seguir, uma visao geral de aspectos importantes no contexto da previsao numerica
de fenomenos meteorologicos como aplicacoes, pos-processamento e informacoes acerca
do modelo Eta sera fornecida.
3Forcamento solar e a diferenca entre a insolacao solar absorvida pela Terra e a energia irradiada de
volta ao espaco (Hansen et al., 1997).
7
Vel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(a) A517 - VeraoVel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(b) A517 - OutonoVel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(c) A517 - InvernoVel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(d) A517 - Primavera
Vel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(e) A549 - VeraoVel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(f) A549 - OutonoVel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(g) A549 - InvernoVel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(h) A549 - Primavera
Vel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(i) A557 - VeraoVel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(j) A557 - OutonoVel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(k) A557 - InvernoVel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(l) A557 - Primavera
Vel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(m) F501 - VeraoVel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(n) F501 - OutonoVel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(o) F501 - InvernoVel. do Vento (m/s)
De
nsid
ad
e
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
(p) F501 - Primavera
Figura 1.5: Histograma da velocidade do vento a 10 metros de altura ao longo das estacoes
do ano.
8
Capıtulo 2
Introducao
Uma breve introducao acerca da Previsao Numerica do Tempo e seus principais
conceitos e feita neste Capıtulo. Historicamente, a expressao “previsao numerica do
tempo” foi utilizada para descrever todas as atividades envolvendo a simulacao numerica
de processos atmosfericos.
A Secao 2.1 apresenta uma visao geral do ferramental teorico utilizado na simulacao
numerica de processos atmosfericos. Na Secao 2.2, a tecnica de pos-processamento
estatıstico de previsoes numericas e conceituada. E por fim, a Secao 2.3 comenta
brevemente sobre o modelo de mesoscala Eta.
2.1 Previsao Numerica do Tempo
Previsoes numericas de variaveis climaticas sao baseadas em modelos matematicos que
fazem previsoes determinısticas com base nas condicoes atmosfericas correntes. Baseadas
na teoria da dinamica dos fluidos, essas variaveis climaticas podem ser vistas como
um sistema de equacoes diferenciais que nao possuem solucao analıtica e utilizam-se
da integracao numerica para simular processos fısicos, dinamicos e termodinamicos da
atmosfera dependendo de suas condicoes correntes, sendo possıvel a solucao do sistema
para qualquer instante de tempo posterior (Krishnamurti, 1995). Na Figura 2.1 e
ilustrada a forma fluida como a atmosfera se comporta.
9
Figura 2.1: Distribuicao espacial de previsoes da refletividade (dBZ) durante a passagem
do Furacao Gustav no Golfo do Mexico, 2008. Adaptado de NRL (2018).
2.1.1 Historia
No inıcio do seculo XX, o meteorologista noruegues Vilhelm Bjerknes propos que
a previsao do tempo poderia ser baseada nas leis da fısica e entao, desenvolveu um
conjunto de equacoes, conhecidas como equacoes primitivas, cuja solucao, a princıpio,
previa movimentos atmosfericos em grande escala.
Em 1922, o matematico ingles Lewis Fry Richardson desenvolveu um metodo
diferente para analisar as equacoes, simplificando-as antes de resolve-las numericamente
(Richardson, 1922), sendo este o primeiro sistema de previsao numerica de variaveis
climaticas. No entanto, somente na decada de 1950, com o advento da computacao
e pleno funcionamento do Computador Integrador Numerico Eletronico (ENIAC),
primeiro computador digital eletronico de grande escala, surgiram resultados efetivos
de previsoes meteorologicas computadorizadas sob idealizacao do matematico hungaro,
naturalizado estadunidense, John von Neummann (Charney et al., 1950). Inicialmente,
von Neummann, sob dias de pos-Segunda Guerra Mundial (1939 – 1945), acreditava
que essa modelagem pudesse levar ao conhecimento antecipado de fenomenos climaticos,
podendo ser usada como arma de guerra contra a, entao, Uniao das Republicas Socialistas
Sovieticas (URSS) (Kwa, 2001).
2.1.2 Aplicacoes
Alem de aplicacoes militares, ha uma gama de modelos numericos de previsao
meteorologica que possuem distintas aplicacoes ambientais, epidemiologicas, agrarias,
10
na seguranca dos meios de transportes e nas industrias de geracao de energia. Pode-se
citar:
– Atividades marıtimas: A direcao e a velocidade do vento podem influenciar a altura
das ondas formadas nos oceanos e em outros corpos d’agua impactando a seguranca
das atividades marıtimas recreativas e comerciais (Bidlot et al., 2002).
– Doencas Infecciosas: A atmosfera pode influenciar a propagacao de doencas
infecciosas humanas e agrıcolas. Variaveis atmosfericas, como temperatura,
umidade relativa, intensidade da radiacao ultravioleta e precipitacao estao
relacionadas a saude dos organismos que transmitem doencas (Thomson et al.,
2000).
– Seguranca e eficiencia do transporte: Operacoes em aeroportos, roteamento de
aeronaves pelos controladores de trafego aereo e as decisoes tomadas por pilotos,
bem como o trafego rodoviario e ferroviario sao afetados pelas condicoes climaticas
(Sharman et al., 2006).
– Agricultura: Eventos climaticos podem influenciar o desempenho e vida util de
colheitas (Mera et al., 2006).
– Aplicacoes Militares: O trafego terrestre de veıculos militares e a trajetorias de
mısseis requerem a tomada de decisao antecipada com relacao a variaveis climaticas
(Liu et al., 2008).
– Industria de energia: A logıstica para abertura de comportas em usinas
hidreletricas, a venda de energia eolica no mercado energetico e a avaliacao do
potencial impacto a saude publica de lancamentos de gases na atmosfera pelas
instalacoes nucleares dependem de previsoes meteorologicas com boa acuracia
(Landberg et al., 2003).
11
2.1.3 Classificacao dos modelos
Operacionalmente, sistemas de previsoes numericas meteorologicas sao solucionados
em uma grade discreta. A Figura 2.2 ilustra diferentes resolucoes de grade, demonstrando
as potenciais diferencas que a amplitude de suas celulas causa nas previsoes.
Figura 2.2: Exemplos de grade horizontal com diferentes resolucoes. Adaptado de Li
et al. (2016).
Conforme a extensao de seu domınio espacial de previsao, os modelos numericos
podem ser classificados como globais, quando descrevem a atmosfera em escala global,
identificando fenomenos meteorologicos de escala sinotica (e.g. trajetoria de ciclones,
tornados e furacoes) ou modelos de mesoescala, quando possuem escalas regionais,
permitindo a analise de fenomenos meteorologicos de mesoescala (e.g. brisas marıtimas
e terrestres).
Dada a natureza caotica da atmosfera, os modelos numericos podem apresentar
distorcoes em suas previsoes devido a anomalias captadas nas condicoes iniciais
necessarias para a solucao de seus sistemas de equacoes. A Figura 2.3 esquematiza a
potencial mudanca na trajetoria das previsoes numericas empregando distintas condicoes
iniciais (Wilks, 2006).
2.1.4 Ensembles
Como previsoes unicas nao descrevem completamente o fenomeno, considera-se a
producao de ensembles (ou conjuntos) de previsoes. O ensemble pode ser interpretado
12
Figura 2.3: Representacao das trajetorias das previsoes numericas inicializadas com
distintas condicoes iniciais. Adaptado de Wilks (2006).
como uma forma de analise de Monte Carlo, visando uma gama de possıveis estados
futuros da atmosfera, a partir de diferentes estados atmosfericos iniciais. Multiplas
simulacoes sao realizadas com objetivo de minimizar incertezas nas previsoes (Epstein,
1969). Os ensembles sao classificados como defasados, quando previsoes sao feitas ate
determinado horizonte e se sobrepoem conforme o regime de funcionamento do modelo,
ilustrado intuitivamente na Figura 2.4(a) e tradicionais, quando utilizam condicoes
iniciais ou suposicoes distintas para uma mesma solucao do sistema, ilustrado na Figura
2.4(b).
(a) (b)
Figura 2.4: Organizacao dos membros do ensemble conforme sua classificacao: (a)
Defasados e (b) Tradicional. Adaptado de Warner (2010).
13
Ensembles sao mais proficientes do que previsoes individuais pois a media de seus
membros e, geralmente, mais precisa do que uma previsao singular. A dispersao entre
seus membros pode indicar maior incerteza associada a previsao pontual. A distribuicao
de frequencia empırica formada fornece informacoes sobre eventos extremos (Grimit e
Mass, 2007). O realismo da dispersao dependera de quao fidedigna as fontes de incerteza
estao sendo representadas pelo modelo. Um exemplo da variabilidade da dispersao e
apresentado na Figura 2.5 que equipara dois ensembles consecutivos para a rota do
furacao Katrina. O ensemble inicializado em 26 de agosto de 2005, 00 UTC exibe uma
grande dispersao a qual, e substancialmente reduzida no ensemble inicializado doze horas
mais tarde. A verdadeira trajetoria do furacao foi proxima a media do ensemble mais
recente.
(a) (b)
Figura 2.5: Ensemble de previsoes para a rota do furacao Katrina. Inicializado em 26 de
agosto de 2005, 00 UTC (a) e 12 UTC (b). Adaptado de Leutbecher e Palmer (2008).
2.1.5 Fontes de incerteza
De acordo com Warner (2010), ha uma variedade de fontes conhecidas de erros que
acometem as previsoes dos modelos numericos. Brevemente, pode-se citar:
– Incerteza sobre as condicoes iniciais: Ma calibracao e localizacao inadequada
dos instrumentos, pouca representatividade da regiao e condicoes atmosfericas
anomalas implicam em variacoes nas previsoes.
14
– Incerteza sobre a superfıcie: Depressoes e corpos d’agua sao sub-representados
devido a homogeneizacao da superfıcie feita pelo sistema.
– Incerteza nos algoritmos numericos: As equacoes diferenciais que compoem o
sistema sao solucionadas a partir de aproximacoes lineares e consequentemente,
ha erros de truncamento.
– Incerteza na parametrizacao dos processos fısicos e dinamicos: A dinamica
atmosferica possui alta complexidade e fenomenos de pequena escala
sao representados indiretamente, pois elevariam demasiadamente o custo
computacional.
A existencia de variacao diurna e sazonal do forcamento solar na superfıcie e na atmosfera
da Terra impacta diretamente o comportamento de muitas variaveis previstas por esses
sistemas. Alem das fontes de erros sistematicos, existem aspectos naturais que podem
causar variacao na qualidade das previsoes. Sao eles:
– Variabilidade regional e climatologica: O padrao climatico de uma regiao
depende de sua localizacao geografica, orografia e a proximidade com o oceano.
Previsoes para regioes com padrao climatico inconstante requerem ferramentas mais
avancadas.
– Variabilidade sazonal: Pode haver queda de desempenho nas previsoes devido as
diferencas regionais existentes entre as estacoes do ano.
– Dependencia do regime climatico: Alguns fenomenos naturais (e.g. El Nino e La
Nina) causam anomalias no padrao climatico global, podendo ocasionar distorcoes
nas previsoes.
2.1.6 Aperfeicoamento dos modelos
Novos metodos de assimilacao de dados, atualizacao dos algoritmos numericos,
reparametrizacoes de processos fısicos e o aumento da resolucao da grade horizontal
fornecem melhorias aos sistemas de previsao numerica. No entanto, e uma tarefa ardua
15
representar fenomenos de pequenas escalas em modelos com carater sinotico. Aumentar
sua complexidade eleva demasiadamente os custos financeiros e computacionais para
a operacionalizacao desses sistemas e, ainda sim, com possibilidade de queda no
desempenho das previsoes devido a insercao de mais erros sistematicos (Kalnay, 2003).
Uma alternativa as melhorias diretamente feitas no modelo e o pos-processamento
estatıstico das previsoes numericas.
2.2 Pos-Processamento Estatıstico
O pos-processamento estatıstico, ou calibracao, das saıdas operacionais do modelo de
previsao numerica (i.e., ensembles) e util na remocao dos erros sistematicos presentes
e pode resultar em avancos equivalentes a melhorias elaboradas no modelo (Glahn e
Lowry, 1972). Relativamente menos dispendioso do que outras abordagens tradicionais de
melhoria (e.g. aumento da resolucao do modelo), esse refinamento deve ser implementado
como parte integrante do sistema de modelagem para aplicacoes operacionais (Warner,
2010). Historicamente, os metodos de pos-processamento estatısticos foram utilizados
para predizer variaveis que nao eram preditas explicitamente pelos modelos numericos
de baixa resolucao relacionando-as estatisticamente (Klein et al., 1959). Atualmente, com
os modelos bem desenvolvidos, o uso de algoritmos estatısticos e empregado como uma
forma de downscaling1 relacionando aspectos locais (e.g. orografia) para reduzir erros
sistematicos. Alguns dos principais bem estabelecidos metodos de pos-processamento
estatıstico serao apresentados e comentados no Capıtulo 3. A ilustracao do processo de
calibracao do ensemble de previsoes para temperatura de superfıcie se encontra na Figura
2.6, sendo esquematizada a remocao do erro sistematico (i.e., remocao do vies na media)
e o ajuste da dispersao (i.e., remocao do vies na variancia).
1Downscaling e o procedimento que faz inferencia sobre informacoes em alta resolucao a partir de
dados provenientes de baixas resolucoes.
16
Figura 2.6: Diagrama do processo de calibracao para ensemble de previsoes da
temperatura de superfıcie. Adaptado de Warner (2010).
2.3 Modelo de Mesoescala Eta
O modelo de mesoescala Eta e um modelo numerico de area limitada desenvolvido
inicialmente na decada de 1970. Apos algumas modificacoes, entrou em operacao no U.S.
National Centers for Environmental Prediction (NCEP) durante a decada de 1980 (Black,
1994). A principal caracterıstica deste modelo e a introducao da coordenada vertical
eta (η), homonima ao modelo, visando a reducao dos erros nas derivadas horizontais
sobre relevos montanhosos (Mesinger et al., 1988). Desta maneira, o terreno passa a ser
representado sob a forma de degraus discretos, onde o topo coincide com a interface do
relevo. A Figura 2.7 ilustra esta discretizacao onde T representa a variavel meteorologica
dentro de cada celula de grade, u simboliza as componentes horizontais do vento, ps
representa a pressao superficial2 e u indica pontos em que o vento e nulo constantemente
por definicao.
Operacionalmente, o modelo Eta vem sendo utilizado pelo Centro de Previsao de
Tempo e Estudos Climaticos (CPTEC) do Instituto Nacional de Pesquisas Espaciais
(INPE) desde 1996 com o intuito de fornecer previsoes do tempo de curto a longo prazo
para o Brasil. Seu domınio engloba toda a America do Sul. Suas variaveis prognosticas
sao temperatura do ar, componentes zonal e meridional do vento, umidade especıfica e
pressao na superfıcie. A partir destas, sao derivadas as demais variaveis previstas pelo
modelo. Sua atual resolucao horizontal e de 5 km. O funcionamento do modelo ocorre
2Pressao superficial e a pressao atmosferica em um local na superfıcie da Terra.
17
Figura 2.7: Representacao da topografia pela coordenada vertical eta (η). Adaptado de
Mesinger et al. (1988).
duas vezes ao dia (00 UTC e 12 UTC) disponibilizando saıdas a cada hora para um
horizonte de previsao de ate 72 horas (INPE/CPTEC, 2018). Os resultados operacionais
sao disponibilizados em http://previsaonumerica.cptec.inpe.br/eta05.
18
Capıtulo 3
Modelos de Pos-Processamento
Estatıstico
Os modelos descritos neste Capıtulo tem por objetivo comum minimizar os
erros sistematicos presentes nas previsoes numericas, como discutido no Capıtulo 2.
Basicamente, estes modelos exploram padroes estatısticos nas relacoes entre observacoes
e previsoes, buscando melhor representatividade local.
A Secao 3.1 apresenta os precursores metodos univariados. Na Secao 3.2, as extensoes
espacias sao listadas. E por fim, a Secao 3.3 propoe novas extensoes espaco-temporais.
3.1 Metodos de Calibracao Univariados
Nesta secao serao apresentados os principais modelos de pos-processamento estatıstico
que foram desenvolvidos para calibracao em localizacoes fixas. Supondo independencia
entre localizacoes, produz previsoes probabilısticas calibradas para estas em um horizonte
pre-determinado, sem possibilidade de interpolacao espacial.
3.1.1 Model Output Statistics
A abordagem precursora de pos-processamento estatıstico e conhecida como o
metodo Model Output Statistics (MOS, Glahn e Lowry, 1972). Nesta abordagem,
19
relaciona-se estatisticamente as previsoes feitas pelo modelo numerico com as observacoes
correspondentes de uma mesma variavel, a fim de quantificar os erros sistematicos para
cada ponto de observacao e corrigir futuras previsoes atraves de um modelo de regressao
linear multipla (Montgomery e Peck, 1982), dado por:
Y = θ0 + θ1F1 + ...+ θmFm + ε. (3.1)
Este modelo supoe uma relacao linear entre a variavel climatica de interesse Y para
a qual, deseja-se minimizar o erro sistematico em sua previsao, com seu ensemble de m
membros F1, ..., Fm (consulte a Secao 2.1.4 do Capıtulo 2) adicionado de um termo de
erro aleatorio ε, para o qual assume-se:
E(ε) = 0, V ar(ε) = σ2. (3.2)
Os metodos de inferencia para estimacao dos coeficientes da regressao θ0, ..., θm e do
parametro de variancia σ2 sao baseados no metodo dos mınimos quadrados e estao
descritos em Glahn e Lowry (1972).
Com o passar dos anos, a aplicacao de ensembles se tornou usual nas operacoes e entao
o metodo MOS recebeu diversas versoes que diferem, em geral, no tamanho do perıodo
de treinamento (e.g. UMOS, Wilson e Vallee, 2002), na modelagem direta do erro de
previsao (e.g. MOC, Mao et al., 1999) e na distribuicao da variavel resposta (e.g. Piani
et al., 2010) por meio dos Modelo Linear Generalizado (MLG, Nelder e Wedderburn,
1972). Uma das extensoes mais avancadas em termos estatısticos, conforme discutido
em Gneiting (2014), e o Ensemble Model Output Statistics (EMOS), utilizado como base
para os modelos que serao propostos na Secao 3.3.
3.1.2 Ensemble Model Output Statistics
O metodo Ensemble Model Output Statistics (EMOS, Gneiting et al., 2005), tambem
conhecido como modelo de regressao nao homogenea, e uma extensao do metodo MOS
(Secao 3.1.1) aplicavel a ensembles. A diferenca para o seu antecessor se encontra
na incorporacao da dispersao dos membros do ensemble ao coeficiente de variancia,
assumindo uma relacao positiva entre a amplitude dessa dispersao com o erro absoluto de
20
previsao. Discussoes sobre essa relacao, conhecida na literatura como relacao dispersao-
proficiencia (spread-skill relationship), podem ser encontradas em Whitaker e Loughe
(1998). Este metodo utiliza o modelo precursor MOS descrito em (3.1) com o erro
aleatorio ε seguindo as seguintes suposicoes:
E(ε) = 0, V ar(ε) = σ2∗ = β0 + β1S
2, (3.3)
com S2 representando a variancia amostral dos membros do ensemble e o vetor
β = (β0, β1)′, coeficientes lineares nao negativos. Para a estimacao dos parametros
desconhecidos do metodo EMOS calibrando a temperatura de superfıcie e a pressao ao
nıvel do mar, Gneiting et al. (2005) supoem normalidade na distribuicao do erro aleatorio
e utilizam a minimizacao do Continuous Ranked Probability Score (CRPS, Matheson e
Winkler, 1976), que neste caso pode ser obtido de forma analıtica. Mais aplicacoes deste
metodo para outros tipos de variaveis climaticas (e.g velocidade, rajada e direcao do
vento) supondo distintas distribuicoes de probabilidade para o erro aleatorio, podem ser
encontradas em Thorarinsdottir e Gneiting (2010), Thorarinsdottir e Johnson (2012) e
Schuhen et al. (2012), respectivamente.
3.2 Metodos de Calibracao Espaciais
Nesta secao serao apresentadas as principais extensoes dos modelos de pos-
processamento estatıstico univariados, as quais foram desenvolvidas de forma que haja
interacao espacial da informacao, i.e., produzem previsoes probabilısticas calibradas para
campos meteorologicos com horizonte pre-determinado.
3.2.1 Geostatistical Output Pertubation
O metodo Geostatistical Output Calibration (GOP, Gel et al., 2004) e uma extensao do
metodo MOS que considera a existencia de correlacao entre as medicoes de um fenomeno
meteorologico medido em diferentes localizacoes possibilitando previsoes para campos
meteorologicos. Foi o metodo de pos-processamento estatıstico pioneiro no contexto
espacial. Seja {Y (s), s ∈ S} um campo meteorologico aleatorio e Y = (y(s1), ..., y(sn))′
21
observacoes deste em um conjunto de n localizacoes pertencentes a S. Considere
m membros do ensemble para estas mesmas localizacoes, representados por F1 =
(F1(s1), ..., F1(sn))′ , ...,Fm = (Fm(s1), ..., Fm(sn))′. A forma geral desse modelo e dada
por:
Y = θ01n + θ1Fs1 + ...+ θmFsm + ε, (3.4)
com 1n representando um n-vetor completo por 1’s, θ = (θ0, ..., θm)′, o vetor parametrico
da regressao e ε = (ε(s1), ..., ε(sn))′, observacoes de um Processo Gaussiano {ε(s), s ∈ S},
com as seguintes suposicoes:
E(ε) = 0n, Cov(ε(si), ε(sj)) = Σi,j = σ2C(si, sj), i, j = 1, ..., n. (3.5)
com 0n representando um n-vetor completo por 0’s. As entradas de C(.) dependem de
uma estrutura de correlacao valida para Processos Espaciais (veja Cressie, 1993). Para
a estimacao dos parametros desconhecidos do modelo GOP calibrando a temperatura
de superfıcie, Gel et al. (2004) propoem um metodo de estimacao em tres estagios
que se aproxima de uma abordagem de maxima verossimilhanca completa. Os autores
indicam a estimacao dos parametros por uma abordagem totalmente Bayesiana devido as
previsoes numericas serem realizadas em uma grade discreta, enquanto que as observacoes
correspondem a locais irregularmente espacados, o chamado problema de mudanca de
suporte, e esta abordagem tem a vantagem de lidar explicitamente e de forma coerente
com tal adversidade. Para mais detalhes sobre mudanca de suporte, consulte Gelfand
et al. (2001).
Uma desvantagem desse metodo e o fato de que nao foi desenvolvido para uso de
ensembles como o EMOS. Extensoes naturais combinando estes metodos com o GOP
serao apresentadas na sequencia.
3.2.2 Spatial Ensemble Model Output Statistics
O metodo Spatial Ensemble Model Output Statistics (SEMOS, Feldmann et al.,
2015), tambem conhecido como modelo de regressao espacial nao homogenea, combina os
metodos EMOS (Secao 3.1.2) e GOP (Secao 3.2.1). Este metodo utiliza o mesmo modelo
22
que o metodo GOP descrito em (3.4) com {ε(s), s ∈ S} sendo um Processo Gaussiano
com ε = (ε(s1), ..., ε(sn))′ seguindo as seguintes suposicoes:
E(ε) = 0n, Cov(ε(si), ε(sj)) = Σ∗i,j = Di,iC(si, sj)Dj,j, i, j = 1, ..., n, (3.6)
onde D = diag(√β0 + β1S2
1 , ...,√β0 + β1S2
n) e uma matriz diagonal de dimensao n com
S2i representando a variancia amostral dos membros do ensemble para a i-esima localidade
e C(.) e uma matriz de correlacao espacial baseada no metodo GOP. Para a estimacao dos
parametros do SEMOS calibrando a temperatura de superfıcie, Feldmann et al. (2015)
consideraram primeiro ajustar o modelo EMOS original de forma semelhante a feita em
Gneiting et al. (2005). Dado as estimativas para os parametros do EMOS, o modelo GOP
e ajustado igualmente como feito em Gel et al. (2004). Nao ha aplicacoes disponıveis
com este modelo para a calibracao de variaveis assimetricas (e.g. velocidade do vento e
chuva) para campos meteorologicos completos na literatura.
3.3 Metodos de Calibracao Espaco-temporais
Comumente nos modelos apresentados, a estimacao dos parametros e feita atraves
de uma janela movel que consiste de um passado recente de valores observados e
previstos pelo modelo numerico, usualmente chamado de perıodo de treinamento no
contexto do pos-processamento estatıstico. Conforme discutido em Gneiting (2014), a
medida em que os perıodos de treinamento sao mais longos, estes permitem, a princıpio,
uma melhor estimativa com menor incerteza. No entanto, como abordado na Secao
2.1.5, perıodos longos podem tambem introduzir distorcoes devido aos efeitos sazonais
provindos do forcamento solar e de aspectos geograficos (e.g. localizacao geografica,
orografia e proximidade com o oceano). Gneiting et al. (2005) e Raftery et al. (2005)
analisam como o comprimento do perıodo de treinamento afeta a estimacao e incerteza
dos parametros, observando que ha ganhos (e.g. menores Raiz Quadrada do Erro
Quadratico Medio (rEQM) e Erro Absoluto Medio (EAM) obtidos em previsoes pontuais
e previsoes intervalares mais estreitas) com o aumento de ate 25 dias, especificamente em
sua aplicacao. Tambem comentam que, provavelmente, diferentes comprimentos deste
23
perıodo sejam melhores para outros tipos de aplicacoes deste modelo (e.g. tipos de
variaveis, ciclos, regioes, horizontes, etc.) e ressaltam a importancia do desenvolvimento
de modos automaticos de decisao.
Em geral, a sazonalidade de fenomenos meteorologicos e bem definida (e.g.
forcamento solar – 24 horas, estacoes do ano – 3 meses), tornando o uso do Filtro
de Kalman (Kalman, 1960) usual para este tipo de aplicacao, contornando a limitacao
do comprimento do perıodo de treinamento e permitindo a dinamica temporal dos
parametros de tendencia.
Nesta secao serao propostas novas extensoes para os principais metodos de pos-
processamento estatıstico apresentados anteriormente. Desenvolvidas com a adicao da
componente temporal por meio dos Modelo Linear Dinamico (MLD, West e Harrison,
1997), de forma que tambem haja interacao espacial da informacao, produzem previsoes
probabilısticas calibradas para campos meteorologicos completos com possibilidade de
previsao em um horizonte intervalar. Estas extensoes foram nomeadas, respectivamente,
por Dynamic Geostatistical Output Calibration (Secao 3.3.1) e Spatiotemporal Ensemble
Model Output Statistics (Secao 3.3.2).
Um modelo que mostrou-se adequado para descricoes de fenomenos meteorologicos
com distribuicao assimetrica de forma simples (e.g. precipitacao em Bardossy e
Plate, 1992) em diferentes escalas de tempo e o modelo Normal Truncado (Stidd,
1973; Hutchinson, 1995). Seja {Yt(s), s ∈ S ⊂ R2, t = 1, ..., T} um campo meteorologico
aleatorio no tempo discreto t. Assumindo que o vetor de observacoes deste campo em n
localizacoes Yt = (yt(s1), ..., yt(sn))′ possui distribuicao Normal Truncada sobre a regiao
C ⊂ Rn, tem-se que:
Yt(s) =
BC−1 (Xt(s), λ) , se BC−1 (Xt(s), λ) ≥ c,
c, se BC−1 (Xt(s), λ) < c,(3.7)
onde C e o produto cartesiano de n intervalos [c,+∞), c e constante conhecida, λ e o
parametro desconhecido desta transformacao especıfica, Xt(s) e um Processo Gaussiano
e BC(., λ) representa a Transformacao Box-Cox (Box e Cox, 1964) definida por:
BC(y, λ) =
(yλ − 1
)/λ, se λ 6= 0 e y > 0,
log y, se λ = 0 e y > 0.
24
Assim, supoe-se que Xt(s) e um Processo Gaussiano latente que e intrınseco a um
Processo Espacial assimetrico a partir de uma transformacao conhecida. Diferentes
famılias de transformacoes foram utilizadas em Glasbey e Nevison (1997), Sanso e Guenni
(1999) e Ravines et al. (2008).
A estruturacao dada em (3.7) baseia-se na tecnica de aumento de dados (Tanner
e Wong, 1987) e lida de forma natural e intuitiva com dados ausentes, eventualidade
corriqueira quando estuda-se simultaneamente um grande numero de localizacoes ao longo
do tempo, e com a suposta “censura” do Processo Espacial assimetrico quando Yt(s) < c,
com adicao de outros Processos Espaciais latentes da seguinte maneira:
Xt(s) =
Ut(s), se Yt(s) e ausente,
BC(Yt(s), λ), se Yt(s) ≥ c,
Zt(s), se Yt(s) < c.
(3.8)
3.3.1 Dynamic Geostatistical Output Pertubation
A extensao proposta para o modelo GOP (Secao 3.2.1), nomeada por DGOP,
combina-o com uma dinamica temporal de seus coeficientes lineares a partir da adaptacao
de MLDs. Assim, DGOP e um MLD com covariancias estocasticas e aprendizado por
descontos a partir de uma evolucao estocastica Beta-Gama (veja Secao E.6 do Apendice
E). Sequencialmente com (3.7), o modelo DGOP e dado por:
Xt = F′tθt + εt, εt ∼ N(0n,Σt), (3.9a)
θt = Gtθt−1 + ωt, ωt ∼ Tnt−1(0p,Wt), (3.9b)
onde Xt = (xt(s1), ..., xt(sn))′, F′tθt descreve a tendencia polinomial com a matriz F′t de
dimensao n×r (r ≥ m) composta por covariaveis explicativas (e.g. ensemble de previsoes,
latitude, longitude e altura das localizacoes) e θt representando o vetor de parametros de
estados de dimensao r, Gt e a matriz de evolucao de dimensao r, ωt e o erro de evolucao
com distribuicao t-Student com nt−1 graus de liberdade com vetor de medias nulo e matriz
de forma Wt. Os graus de liberdade nt−1 sao definidos atraves da evolucao estocastica
25
Beta-Gama. A partir do Processo Gaussiano {εt(s), s ∈ S, t = 1, ..., T}, assume-se que
εt = (εt(s1), ..., εt(sn))′ segue as seguintes suposicoes:
E(εt) = 0n, Cov(εt(si), εt(sj)) = Σti,j = σ2tC(si, sj), i, j = 1, ..., n. (3.10)
Construiu-se C(.) com base na funcao de correlacao exponencial dada por C(si, sj) =
exp(−φ‖si − sj‖) com φ > 0 representando a taxa de decaimento exponencial e ‖si − sj‖,
a distancia euclidiana entre as localizacoes si e sj, i, j = 1, ..., n.
Para a estimacao dos parametros desconhecidos do modelo DGOP, opta-se pela
abordagem Bayesiana devido a incorporacao das incertezas nas estimativas dos
parametros serem levadas em consideracao na inferencia preditiva atraves de suas
distribuicoes a posteriori. Utiliza-se a tecnica de fatores de desconto como auxılio na
especificacao de W1:T . Mais detalhes sobre fatores de desconto podem ser encontrados na
Secao E.4 do Apendice E. Assim, seguindo o Teorema de Bayes, a distribuicao a posteriori
do vetor parametrico Θ = (θ1:T , σ21:T , φ, λ)′ e proporcional a funcao de verossimilhanca
p(Y1,s, ...,YT,s|θ1:T , σ21:T , φ, λ) multiplicada pela distribuicao a priori p(θ0, σ
20, φ, λ). Para
o modelo espaco-temporal DGOP apresentado em (3.7) a (3.9), a distribuicao a posteriori
do vetor parametrico Θ = (θ1:T , σ21:T , φ, λ)′ e dada por:
p(θ1:T , σ21:T , φ, λ|Y1:T ) ∝
T∏t=1
|Σt|−1/2
× exp
{−1
2
T∑t=1
(Xt − F′tθt)′Σt−1(Xt − F′tθt)
}
× exp
{−1
2
T∑t=1
(θt −Gtθt−1)′Wt
−1(θt −Gtθt−1)
}×
∏{i,t:Yit>c}
Y λ−1it × p(θ0, σ2
0, φ, λ).
(3.11)
Para obter amostras aproximadas da distribuicao a posteriori do vetor parametrico
Θ = (θ1:T , σ21:T , φ, λ)′, a qual nao possui forma analıtica conhecida, metodos de Monte
Carlo via Cadeias de Markov (MCMC, Gamerman, 1997) sao aplicaveis. A partir de
(3.11), obtem-se as distribuicoes condicionais completas dos parametros de interesse.
A descricao completa das distribuicoes condicionais completas poderao ser encontradas
no Apendice C. De forma especıfica para os parametros deste modelo, amostras para
26
(θ1:T , σ21:T )′ sao obtidas atraves do procedimento Forward Filtering Backward Sampling
(FFBS, Fruhwirth-Schnatter, 1994; Carter e Kohn, 1994) e para (φ, λ)′, usa-se o algoritmo
Robusto-Adaptativo de Metropolis (RAM, Vihola, 2012). Mais detalhes acerca do
procedimento FFBS podem ser encontrados na Secao E.5 do Apendice E e do algoritmo
RAM, no Apendice D. Informacoes acerca das distribuicoes a priori, fatores de desconto
utilizados e detalhes computacionais serao dados durante sua aplicacao no Capıtulo 4.
3.3.2 Spatiotemporal Ensemble Model Output Statistics
Analogo ao metodo DGOP, o metodo Spatiotemporal Ensemble Model Output
Statistics (STEMOS) combina o metodo SEMOS (Secao 3.2.2) com Modelo Linear
Dinamicos (MLDs). Desta forma, STEMOS e um MLD Normal Multivariado (veja Secao
E.1 do Apendice E).
Com a estruturacao dada em (3.8), o modelo STEMOS e, sequencialmente, dado por:
Xt = F′tθt + εt, εt ∼ N(0n,Σ∗t ), (3.12a)
θt = Gtθt−1 + ωt, ωt ∼ N(0p,Wt), (3.12b)
onde, diferentemente do modelo apresentado anteriormente, ωt e o erro de evolucao
Normalmente distribuıdo com vetor de medias nulo e matriz de covariancia Wt. A partir
do Processo Gaussiano {εt(s), s ∈ S, t = 1, ..., T}, assume-se que εt = (εt(s1), ..., εt(sn))′
segue as seguintes suposicoes:
E(εt) = 0n, Cov(εt(si), εt(sj)) = Σ∗ti,j = Dti,iC(si, sj)Dtj,j , (3.13)
onde Dt = diag(√β0 + β1S2
1,t, ...,√β0 + β1S2
n,t) e uma matriz diagonal de dimensao n
com S2i,t representando a variancia amostral dos membros do ensemble para a i-esima
localidade no tempo t e C(.) e uma matriz de correlacao espacial construıda de mesmo
modo que o modelo DGOP (Secao 3.3.1). Faz-se uso da tecnica de fatores de desconto
para a especificacao de W1:T .
27
A estimacao dos parametros do STEMOS tambem e feita sobre a abordagem
Bayesiana. A distribuicao a posteriori do vetor parametrico Θ∗ = (θ1:T ,β, φ, λ)′ e dada
por:
p(θ1:T ,β, φ, λ|Y1:T ) ∝T∏t=1
|Σ∗t |−1/2
× exp
{−1
2
T∑t=1
(Xt − F′tθt)′Σ∗t−1(Xt − F′tθt)
}
× exp
{−1
2
T∑t=1
(θt −Gtθt−1)′Wt
−1(θt −Gtθt−1)
}×
∏{i,t:Yit>c}
Y λ−1it × p(θ0,β, φ, λ).
(3.14)
De forma especıfica para os parametros deste modelo, amostras para θ1:T sao obtidas
atraves do procedimento FFBS (Fruhwirth-Schnatter, 1994; Carter e Kohn, 1994) e
para (β, φ, λ)′, atraves do algoritmo Robusto-Adaptativo de Metropolis (RAM, Vihola,
2012). Informacoes acerca das distribuicoes a priori utilizadas e detalhes computacionais
tambem serao dados durante a aplicacao no Capıtulo 4.
No capıtulo a seguir, alguns dos modelos de pos-processamento estatıstico para
calibracao de campos meteorologicos completos exibidos nas Secoes 3.2 e 3.3 serao
testados e comparados conforme o desempenho na calibracao feita nas previsoes
numericas da velocidade do vento a 10 metros em Minas Gerais providas pelo modelo
Eta.
28
Capıtulo 4
Aplicacao a Previsao da Velocidade
do Vento em Minas Gerais
Os resultados apresentados neste Capıtulo avaliam a capacidade de calibracao dos
modelos de pos-processamento apresentados no Capıtulo 3.
A Secao 4.1 caracteriza o banco de dados disponıvel. Na Secao 4.2, definicoes iniciais
sao contextualizadas para aplicacao dos modelos propostos. A Secao 4.3 cataloga os
modelos propostos para a aplicacao. Na Secao 4.4, sao exibidos os resultados obtidos
na pratica em distintas aplicacoes. Por fim, a Secao 4.5 resume os resultados e exibe as
conclusoes.
4.1 Descricao do Conjunto de Dados
O banco de dados utilizado e composto pelo ensemble de previsoes numericas horarias
iniciadas as 12 UTC do modelo de Mesoescala Eta para a velocidade do vento instantanea
a 10 metros de altura no Estado de Minas Gerais e seu entorno de 01 de novembro de
2015, 12 UTC a 30 de novembro de 2016, 11 UTC, totalizando mais de dez mil ensembles,
um para cada hora de previsao. A quantidade de membros do ensemble, como elucidado
pela Figura 2.4, pode variar devido a nao inicializacao do modelo Eta e do horizonte de
previsao requisitado. O horizonte maximo de previsao deste modelo e 255 horas, i.e., o
modelo Eta preve de 0 a 255 horas a frente. Assim, se o interesse e calibrar as previsoes
29
Tabela 4.1: Configuracao dos membros do ensemble para previsoes 24 horas a frente as
12 UTC.
Previsao
Origem 02/12/2015 03/12/2015 ... 10/12/2015 11/12/2015 ...
01/12/2015 +24h +48h ... +216h +240h ...
02/12/2015 +24h ... +192h +216h ...
03/12/2015 ... +168h +192h ...
04/12/2015 ... +144h +168h ...
05/12/2015 ... +120h +144h ...
06/12/2015 ... +96h +120h ...
07/12/2015 ... +72h +96h ...
08/12/2015 ... +48h +72h ...
09/12/2015 +24h +48h ...
10/12/2015 +24h ...
no horario de iniciacao do modelo Eta (12 UTC) 24 horas a frente, o ensemble sera
composto pelas previsoes feitas 240, 216, ... , 48 e 24 horas anteriores, totalizando 10
membros. A Tabela 4.1 esquematiza o enquadramento dos membros para a construcao
de um ensemble do tipo defasado, como na Figura 2.4(a).
Para evitar a eventual indisponibilidade de algum membro, optou-se utilizar a
media dos momentaneamente disponıveis sob determinado horizonte de calibracao.
Este procedimento nao acarreta grande perda de informacao, em vista que, ha alta
correlacao linear entre os membros, implicando em uma boa estabilidade do modelo
Eta, como exibida pela Figura 4.1. Note que desta forma tambem evita-se problemas
de multicolinearidade. Mais detalhes sobre tal adversidade, consulte Montgomery e Peck
(1982). Segundo Grimit e Mass (2007), a media dos membros pode captar uma eventual
anomalia meteorologica pontual (e.g. frente fria) e assim, seu uso tambem e indicado por
aspectos teoricos.
Medicoes da variavel meteorologica em estudo nas 59 estacoes de monitoramento em
Minas Gerais e seu entorno, assim como dados georreferenciados destas (e.g. latitude,
longitude e altura do relevo) tambem integram o banco de dados utilizado. O historico de
30
0.5 0.6 0.7 0.8 0.9 1
+96h
+1
20h
+144h
+168h
+192h
+216h
+120h
+144h
+168h
+192h
+216h
+240h
Figura 4.1: Matriz de correlacao dos membros do ensemble de previsoes numericas da
velocidade do vento a 10 m em 21 de junho de 2016, 12 UTC.
registros de previsoes numericas e variaveis meteorologicas esta disponıvel para o mesmo
perıodo de tempo. A precisao numerica dos dados e de uma casa decimal. Outras
definicoes requeridas como entrada para os modelos apresentados na Secao 3.3 como o
vetor de descontos δ, as matrizes F′t e Gt e o fator de desconto requerido na evolucao
estocastica Beta-Gama (veja Secao E.6 do Apendice E) exclusivo do modelo DGOP
(Secao 3.3.1) serao apresentados na secao a seguir.
Devido a atividade operacional que os modelos de pos-processamento exercem e a
grande quantidade de dados disponıveis, nao houve como utilizar todos de forma contınua.
Por consequencia, seguindo a logica das estacoes do ano, foram feitas 12 previsoes, 1
para cada mes, partindo de dezembro de 2015 a novembro de 2016. O horizonte de cada
aplicacao sera explicado a frente.
Projetou-se duas situacoes de aplicacoes para a calibracao da velocidade do vento a
10 metros. Sao elas:
(i) Previsao em um horario especıfico (e.g. no horario de funcionamento do modelo
Eta, 12 UTC). Assim, a unidade de tempo t sao dias.
(ii) Previsao continuamente de hora em hora. Assim, a unidade de tempo t sao horas.
31
Tais aplicacoes foram nomeadas por (i) “diaria” e (ii) “horaria”. Os resultados obtidos
serao apresentados, respectivamente, nas Secoes 4.4.1 e 4.4.2.
4.2 Selecao de Covariaveis e Definicoes dos Modelos
Iniciando a aplicacao, decidiu-se analisar quais covariaveis seriam introduzidas na
analise final. As covariaveis dividem-se em 3 blocos, sao eles:
– Ensemble (ENS): Refere-se a uma covariavel explicativa unidimensional com a
media dos membros do ensemble para determinada localizacao. E o mınimo
requerido como entrada de modelos de pos-processamento estatıstico.
– Autorregresivo (AR): Refere-se a uma covariavel explicativa unidimensional com
valores observados no passado recente, respeitando a defasagem imposta pelo
horizonte de previsao (e.g. Para previsoes 24 horas a frente, o conjunto
autorregressivo recebe as medicoes feitas 24 horas anteriormente) para determinada
localizacao.
– Auxiliares (AUX): Refere-se a uma covariavel explicativa tridimensional com a
latitude, longitude e altitude do relevo dos locais das estacoes de monitoramento
meteorologico. Estas covariaveis nao se alteram ao longo do tempo.
Determinou-se que, em uma analise inicial de desempenho e significancia dos
parametros relacionados a cada covariavel, a combinacao do bloco de covariaveis utilizada
no modelo de calibracao espaco-temporal DGOP (Secao 3.3.1) que retornasse os melhores
resultados em suas previsoes, segundo os criterios de comparacao, em uma aplicacao
piloto, seria a utilizada de forma geral. Considerou-se na aplicacao piloto o tempo em
dias e o horizonte de previsao de 1 a 4 dias a frente, simbolizado por horas como 24 a
96 horas a frente. As previsoes foram feitas para os dias 01 a 04 de abril de 2016, 12
UTC, escolhidos arbitrariamente, com um perıodo de treinamento de 90 observacoes. Os
criterios de comparacao foram selecionados de maneira que seja praticavel a comparacao
entre as previsoes numericas provindas do modelo Eta que fornece apenas estimativas
pontuais com as calibradas provenientes do ajuste dos modelos estatısticos. Assim, os
32
criterios escolhidos foram rEQM, EAM e Indice de Concordancia de Willmott (ICW,
Willmott, 1981). Quanto menores forem os valores da rEQM e do EAM, melhores
serao as previsoes. O ICW e uma medida padronizada variando entre 0 (ausencia de
concordancia) e 1 (correspondencia perfeita). Estes criterios sao os mais usuais em meio
a literatura disponıvel sobre calibracao de variaveis meteorologicas. Mais detalhes acerca
destes criterios podem ser encontrados no Apendice B.
A transformacao proposta em (3.7) auxilia na acomodacao de variaveis meteorologicas
com distribuicao assimetrica e com domınio positivo (R+) em modelos estatısticos que
dispoem intrinsecamente de Processos Gaussianos como os modelos de calibracao espacial,
apresentados na Secao 3.2, e espaco-temporal, apresentados na Secao 3.3. Estes ultimos
tem esta transformacao agregada em si, a qual depende da constante c = 0, definida
conforme a natureza da variavel meteorologica em estudo. Assim, a transformacao em
(3.7) sera dada por:
Yt(s) =
BC−1 (Xt(s), λ) , se BC−1 (Xt(s), λ) ≥ 0,
0, se BC−1 (Xt(s), λ) < 0,
O vetor de descontos δ utilizado e composto por 3 componentes divididas por δT1,
representando o desconto para os coeficientes de tendencia relativos ao intercepto do
modelo, media do ensemble e medicoes retroativas, δT2, para os coeficientes de tendencia
relativos a localizacao geografica (altitude, latitude e longitude) e δS, para a componente
sazonal – intrınseca ao MLD que embasam os modelos propostos. Assim, o vetor de
descontos δ e dado por:
δ = (δT1, δT2, δS)′,
com δT1 = δT2 = 0, 99 e δS = 0, 95 sendo atribuıdos arbitrariamente com base em
aplicacoes anteriores (e.g. Glasbey e Nevison, 1997; Sanso e Guenni, 1999; Ravines et al.,
2008).
A matriz Ft depende da escolha dos blocos de covariaveis que serao utilizados.
Conforme os criterios definidos, foi visto que o modelo com somente as previsoes
numericas (bloco ENS) nao consegue descrever bem o fenomeno e assim, fornecer boas
previsoes. A adicao de informacoes locais, tanto da variavel de estudo de maneira
33
retroativa (bloco AR), quanto de aspectos regionais (bloco AUX), fornecem uma menor
propensao a erros. Dentre os resultados obtidos nesta aplicacao, exibidos na Tabela 4.2,
pode-se perceber uma relacao de complemento entre os blocos. Em particular para as
previsoes do horizonte +96h, note que a insercao do bloco AR fez com que o valor da
rEQM elevasse de 1,316 para 1,371. Adicionado o bloco AUX, regressa a 1,315. Ocorre
algo similar para o EAM neste mesmo horizonte. Assim, perceba que o uso dos 3 blocos
(ENS, AR e AUX) auxiliou na diminuicao dos criterios rEQM e EAM quando o uso de
2 blocos (ENS e AR) acarretou prejuızos no desempenho das previsoes. Para os demais
horizontes, a relacao e proporcionalmente inversa, i.e., quanto maior a quantidade de
covariaveis utilizadas, menor e o erro das previsoes calibradas em todos os criterios de
comparacao. Alem disso, utilizar somente o bloco ENS acarretou em grandes prejuızos no
ICW, obtendo resultados piores dos que os obtidos pelas previsoes numericas as quais,
estao expostas a erros sistematicos, em todos os horizontes, chegando em valores ate
2,5 vezes menores. Por consequencia, todas as covariaveis disponıveis serao utilizadas
em todas as aplicacoes. Cabe ressaltar que o bloco ENS e obrigatorio como entrada de
modelos de pos-processamento estatıstico. Desta forma, nao testou-se na aplicacao piloto
a combinacao que exclui este bloco.
Na pratica, a matriz F′t tera componentes de sua i-esima linha dados por(1, f(si), Yt−h(si), altura(si), latitude(si), longitude(si),1 {aplic} , 0
), i = 1, ..., 59, com
f(si) simbolizando a media dos membros do ensemble para a i-esima localizacao, Yt−h(si),
o registro da variavel meteorologica h unidades de tempo atras e 1 {aplic}, uma funcao
indicadora que recebe o valor 1 quando a unidade de tempo e hora e 0, caso contrario.
Esta funcao indica que quando se trabalha com os modelos espaco-temporais em
aplicacoes que consideram a unidade de tempo como horas, pode-se adicionar covariaveis
explicativas para definir a sazonalidade. O coeficiente sazonal e adaptado na matriz de
evolucao do vetor de estados dada por Gt = BD(G1, G2× 1 {aplic}) com G1 sendo uma
matriz diagonal de ordem 6 e G2, harmonicos, definido pela matriz:
G2 =
cos(2π/24) sen(2π/24)
−sen(2π/24) cos(2π/24)
.
34
Tabela 4.2: Relacao dos criterios de comparacao de modelos para diferentes blocos de
covariaveis e horizontes obtidos nas previsoes realizadas na aplicacao piloto.
Covariaveis
Criterios Horizonte Eta ENS ENS+AR ENS+AR+AUX
rEQM
+24h 1,457 1,382 1,185 1,142
+48h 1,880 0,975 0,735 0,732
+72h 1,579 1,053 0,959 0,919
+96h 1,515 1,316 1,371 1,315
EAM
+24h 1,223 1,055 0,832 0,812
+48h 1,614 0,828 0,603 0,585
+72h 1,262 0,849 0,718 0,678
+96h 1,262 0,982 1,012 0,955
ICW
+24h 0,497 0,293 0,626 0,662
+48h 0,451 0,389 0,700 0,738
+72h 0,463 0,178 0,532 0,601
+96h 0,433 0,382 0,510 0,549
35
Sob esta configuracao, os harmonicos foram definidos com um perıodo de 24 horas
representando o forcamento solar corroborados pela Figura 1.4. Na pratica, o fator
sazonal 1 {aplic} sera nulo na aplicacao (i) “diaria” e unitario, na (ii) “horaria”.
Optou-se fixar o fator de desconto requerido para a evolucao estocastica Beta-Gama do
modelo DGOP (Secao 3.3.1), definido na Secao E.6 do Apendice E, δ∗ = 1, de forma que
o parametro de variancia seja constante ao longo do tempo, i.e., σ2t = σ2, ∀t. Essa decisao
foi tomada em vista que, o parametro σ2t fixado no tempo, pertencente ao modelo em
questao, equivale ao parametro β0 do modelo STEMOS (Secao 3.3.2). Assim, a diferenca,
com relacao aos parametros, entre estes modelos ficara por conta da relacao dispersao-
proficiencia, comentada na Secao 3.1.2, representada pelo parametro β1 > 0. De forma
direta, este parametro infla a variancia quando ha discordancia entre os membros do
ensemble. Na pratica, quando β1 se aproxima de zero, STEMOS e proximo ao DGOP
com variancia fixa.
As distribuicoes a priori atribuıdas aos parametros dos modelos, bem como a definicao
dos modelos que serao utilizados nas aplicacoes serao elucidados na secao a seguir.
4.3 Modelos Propostos
Para a calibracao da velocidade do vento a 10 metros de altura no Estado de
Minas Gerais, comparou-se o desempenho de 3 distintos modelos de pos-processamento
propostos. Em suma, sao eles:
1. Modelo SEMOS
Este modelo possui componente espacial, transformacao Box-Cox na variavel
resposta e censura a esquerda.
Apesar de homonimo, este nao e o proposto por Feldmann et al. (2015) devido
a restricao de acomodar apenas variaveis meteorologicas assumindo distribuicao
simetrica (e.g. temperatura e pressao atmosferica). Assim, o modelo SEMOS
proposto e uma extensao do existente, estruturado como a combinacao da
transformacao definida em (3.7) e o modelo da literatura definido na Secao 3.2.2.
36
Este modelo e um caso particular do modelo STEMOS e ocorre quando o vetor de
estados e fixado ao longo do tempo, i.e., θt = θ, ∀t.
Para os parametros deste modelo, supos-se, inicialmente, independencia entre
seus parametros, i.e., p(θ,β, φ, λ) = p(θ)p(β)p(φ)p(λ) com θ ∼ N(08, I8), β ∼
NT(0,∞)(02, 10I2), φ ∼ G(
2, max(d)6
)e λ ∼ N(1, 10) onde I8 representa uma
matriz identidade de dimensao 8 e max(d), a distancia maxima observada entre
as localizacoes. Como, no contexto da calibracao, θ representa os coeficiente de
uma combinacao linear de covariaveis com a mesma escala (excluındo o bloco
AUX), proximo a uma media ponderada, espera-se que∑8
i=1 θi seja proximo a
1. Entao, a distribuicao a priori atribuıda a θ, assim como para β e λ, e
considerada nao informativa. O vetor de parametros β representa os coeficientes
(estritamente positivos) da combinacao linear da variancia amostral dos membros
do ensemble. Sendo assim, adicionou-se tal restricao na distribuicao a priori
comumente atribuıda para parametros com esta finalidade. Os hiper-parametros
para a distribuicao a priori atribuıda a φ foram selecionados de acordo com a
premissa de que a correlacao espacial e quase nula na metade da distancia maxima
entre as localizacoes observadas (Banerjee et al., 2014) e a λ, de forma que o valor
esperado seja 1, representando o efeito nulo da tranformacao Box-Cox.
2. Modelo STEMOS
Este modelo e o MLD Normal Multivariado com o vetor de erros observacionais εt
restrito as suposicoes indicadas em (3.13) apresentado na Secao 3.3.2. De forma
geral, o STEMOS possui componente espacial, temporal, transformacao Box-Cox
na variavel resposta e censura a esquerda.
As definicoes de entrada utilizadas, como o vetor de descontos δ, as matrizes F′t e
Gt, foram as mesmas utilizadas na aplicacao piloto, definidas na Secao 4.2.
Para os parametros deste modelo, supos-se, inicialmente, independencia entre seus
parametros, i.e., p(θ0,β, φ, λ) = p(θ0)p(β)p(φ)p(λ) com θ0 ∼ N(08, I8). As
distribuicoes a priori atribuıdas ao vetor parametrico (β, φ, λ)’ sao similares ao
37
modelo anterior. De maneira analoga ao parametro θ do modelo SEMOS, a
distribuicao a priori atribuıda a θ0 e tambem considerada nao informativa.
3. Modelo DGOP
Este modelo e o MLD com covariancias estocasticas e aprendizado por descontos a
partir de uma evolucao estocastica Beta-Gama com o vetor de erros observacionais
εt restrito as suposicoes indicadas em (3.10) apresentado na Secao 3.3.1. De forma
geral, o DGOP possui componente espacial, temporal, transformacao Box-Cox na
variavel resposta e censura a esquerda. Foi o modelo utilizado inicialmente na
aplicacao piloto. Sob certas condicoes, e tambem um caso particular do STEMOS.
Para os parametros deste modelo, supos-se, inicialmente, independencia entre seus
parametros, i.e., p(θ0, σ2, φ, λ) = p(θ0)p(σ
2)p(φ)p(λ) com θ0 ∼ T1(0, I8) e ϕ =
1/σ2 ∼ G(1; 0, 1). As distribuicoes a priori atribuıdas ao vetor parametrico (φ, λ)’
sao similares aos modelos anteriores. Os hiper-parametros da distribuicao a priori
atribuıda a ϕ = 1/σ2 foram determinados de forma que haja semelhanca com os
atribuıdos ao vetor de parametros β dos modelos SEMOS e STEMOS, o qual possui
finalidade parecida com a de σ2. As distribuicoes a priori designadas a θ0 e ϕ =
1/σ2 podem ser consideradas nao informativas conforme elucidado previamente.
Modelos de pos-processamento estatıstico que nao possuem componente espacial,
descritos na Secao 3.1, nao foram empregados no presente trabalho pelo fato de nao
considerarem a calibracao de campos meteorologicos. Estes corrigem cada localizacao
de forma independente, sem a possibilidade de interpolacao espacial corrigida e assim,
nao sao uteis para a calibracao da velocidade do vento a 10 m no Estado de Minas
Gerais. Alem disso, os modelos de pos-processamento existentes na literatura que detem
da componente espacial assumem que a variavel meteorologica tem distribuicao simetrica,
o que nao e o caso do presente estudo. Sendo assim, tambem nao foram aplicados em
sua forma canonica.
Para medir o desempenho da calibracao feita pelos modelos propostos e compara-los
com as previsoes numericas determinısticas, empregou-se os mesmos criterios utilizados
na aplicacao piloto, descritos na Secao 4.2. A avaliacao das previsoes probabilısticas
38
dos modelos de pos-processamento propostos e feita tambem atraves do Interval Score
(IS, Gneiting e Raftery, 2007) o qual, leva em consideracao a amplitude e cobertura
dos intervalos de predicao, de forma parcimoniosa. Quando nao ocorre a cobertura, o
modelo e penalizado. Caso todos os valores verdadeiros estejam contidos no intervalo de
predicao, esta medida se resume a amplitude do intervalo. Quanto menores os valores
para IS, mais eficientes sao as previsoes probabilısticas. Para mais detalhes sobre este
criterio, consulte o Apendice B.
Todos os modelos utilizados no presente trabalho foram implementados em linguagem
de programacao R (R Core Team, 2018) no software estatıstico homonimo e visando
a minimizacao do tempo computacional, algumas funcoes do algoritmo MCMC foram
implementadas em linguagem C++ (ISO, 2017) utilizando a biblioteca Armadillo
(Sanderson e Curtin, 2016) por meio do pacote Rcpp (Eddelbuettel e Francois, 2011).
4.4 Resultados
Para a obtencao de amostras da distribuicao a posteriori dos parametros dos modelos
por meio do algoritmo MCMC, monitorou-se a trajetoria de duas cadeias partindo
de valores iniciais distintos. Para minimizar problemas provindos da autocorrelacao
existente entre os valores gerados que compoem a cadeia, apos um determinado perıodo
de aquecimento (burn-in), valores sao incluıdos na amostra da distribuicao a posteriori
com certo espacamento (thinning). Esses valores variam entre os modelos e aplicacoes. A
Tabela 4.3 contem estas informacoes das cadeias MCMC obtidas para todos os modelos
empregados em diferentes aplicacoes juntamente com o tempo medio consumido (em
minutos) a partir de um desktop com configuracoes domesticas medianas1. Devido ao
carater operacional do tipo de correcao a qual os modelos propostos foram desenvolvidos,
o custo computacional e tambem um criterio de comparacao. Como a inferencia foi feita
com o auxılio de metodos computacionais intensivos, a quantidade de parametros e de
iteracoes necessarias do algoritmo influenciam diretamente no tempo de processamento.
1Processador: Intel(R) Core(TM) i5-4590 CPU @ 3.30GHZ; Memoria RAM: 8 GB
39
Tabela 4.3: Informacoes acerca das cadeias MCMC para os modelos propostos em
diferentes aplicacoes.
Cadeias MCMC
Modelo Aplicacao Burn-in Thinning Iteracoes Amostra Tempo medio (min)
DGOPDiaria 15.000 30 75.000 2.000 34,78
Horaria 3.000 30 63.000 2.000 72,33
SEMOSDiaria 2.000 30 63.000 2.000 34,43
Horaria 6.000 30 66.000 2.000 103,36
STEMOSDiaria 15.000 30 75.000 2.000 42,74
Horaria 30.000 50 130.000 2.000 169,83
Com o auxılio do algoritmo Robusto Adaptativo de Metropolis (RAM, Vihola, 2012),
o tuning e feito de maneira sequencial e adaptativa, de forma que, fixa-se a taxa de
aceitacao de interesse (23,4%), resultando em taxas observadas entre 22 a 25%.
A atualizacao dos parametros de estado dos modelos com dinamica espaco-temporal
e feita de acordo como descrito na Secao E.2 do Apendice E. Apos a estimacao do vetor
parametrico Θ particular de cada modelo via MCMC, assume-se a existencia de amostras
Θ(i)
, i = 1, ..., Q da distribuicao a posteriori p(Θ|Y1:T ) com Q representando o tamanho
da amostra gerada. A distribuicao preditiva p(Y1:T ) e aproximada por meio de Integracao
de Monte Carlo (Robert, 2004) da seguinte maneira:
p(Y1:T ) ≈ 1
Q
Q∑i=1
p(Y1:T |Θ
(i)). (4.1)
E por fim, a distribuicao de previsao h unidade de tempo a frente p(YT+h|Y1:T ) dos
modelos com dinamica espaco-temporal e obtida como descrito na Secao E.3 do Apendice
E. Assim, obtem-se, de cada modelo, previsoes pontuais e intervalares para a velocidade
do vento a 10 m.
40
4.4.1 Aplicacao: Diaria
Nesta aplicacao, considera-se o tempo em dias e o horizonte de previsao de 1 a 4 dias
a frente, simbolizado por horas como 24 a 96 horas a frente. As previsoes sao feitas para
o dia 18 a 21 de cada mes, 12 UTC. O perıodo de treinamento possui 90 dias.
Em uma visao geral do desempenho das previsoes do modelo Eta e dos modelos
propostos ao longo das estacoes do ano apresentada na Figura 4.2, por meio dos criterios
rEQM, EAM e ICW, observa-se que as previsoes numericas provenientes do modelo
Eta foram mais erraticas, no perıodo disponıvel desta aplicacao (dia 18 a 21 de cada
mes, 12 UTC), durante os meses do verao e da primavera. Isso pode se dar ao fato
de que estas estacoes do ano apresentaram extremos da velocidade do vento a 10 m,
respectivamente, como menores e maiores medias observadas. A rEQM para estas
previsoes varia, aproximadamente, no intervalo (1; 3, 5), o EAM, em (0, 9; 3) e o ICW,
em (0, 4; 0, 6).
A rEQM para estas previsoes varia, aproximadamente, no intervalo (0, 9; 2, 5), o EAM,
em (0, 7; 2) e o ICW, em (0, 4; 0, 8). Em geral, todos os modelos propostos obtiveram
criterios de comparacao melhores que o modelo Eta, implicando que, de fato, o pos-
processamento foi relevante na qualidade das previsoes. Os resultados destacam-se mais
no verao e na primavera, respectivamente, estacoes do ano que registraram medias
mınimas e maximas da velocidade do vento a 10 m. No entanto, em determinados
momentos nos meses de abril, maio (outono) e julho (inverno), o pos-processamento
produziu resultados ligeiramente piores. E difıcil elucidar com precisao o porque destes
casos pontuais. Uma possibilidade e a ocorrencia de uma anomalia em muitos locais
de observacao, implicando em registros incomuns. Alem disto, perceba a mudanca de
nıvel da rEQM e do EAM iniciada na sucessao do inverno para a primavera durante o
mes de agosto. Possivelmente, indica uma mudanca de regime climatico a qual, pode ser
pretexto para o uso de covariaveis dummies para as estacoes do ano ou a introducao de
harmonicos com perıodo que represente as estacoes do ano exclusivamente nos modelos
com componente temporal. Ambos devem ser aplicados conjuntamente com um perıodo
41
rEQ
M (
m/s
)
De
z
Ja
n
Fev
Ma
r
Ab
r
Ma
i
Ju
n
Ju
l
Ag
o
Se
t
Ou
t
Nov
1.0
2.0
3.0
Verão Outono Inverno Primavera
EtaSEMOSSTEMOSDGOP
(a) rEQM
EA
M (
m/s
)
De
z
Ja
n
Fev
Ma
r
Ab
r
Ma
i
Ju
n
Ju
l
Ag
o
Se
t
Ou
t
Nov
1.0
2.0
3.0
Verão Outono Inverno Primavera
EtaSEMOSSTEMOSDGOP
(b) EAM
ICW
De
z
Ja
n
Fev
Ma
r
Ab
r
Ma
i
Ju
n
Ju
l
Ag
o
Se
t
Ou
t
Nov
0.3
0.5
0.7
Verão Outono Inverno Primavera
EtaSEMOSSTEMOSDGOP
(c) ICW
Figura 4.2: Criterios de comparacao de modelos na aplicacao diaria ao longo das estacoes
do ano.
42
IS
De
z
Ja
n
Fev
Ma
r
Ab
r
Ma
i
Ju
n
Ju
l
Ag
o
Se
t
Ou
t
Nov
46
81
01
4Verão Outono Inverno Primavera
SEMOSSTEMOSDGOP
Figura 4.3: Interval Score na aplicacao diaria ao longo das estacoes do ano.
de treinamento mais longo (� 90 dias2). Em contrapartida, perıodos de treinamentos
muito longos acarretam altos custos computacionais para estes modelos.
Sobre o desempenho das previsoes pontuais calibradas provenientes do ajuste dos
modelos propostos, pode-se afirmar que houve um empate tecnico. Nao ha diferencas
significativas no desempenho destas previsoes pontuais nesta aplicacao. Todavia, os
modelos estatısticos fornecem previsoes intervalares, no contexto da inferencia Bayesiana,
nomeados por Intervalo de Credibilidade (IC). Sao obtidos a partir da distribuicao
preditiva, demonstrada em (4.1). Assim, a Figura 4.3 apresenta o IS, criterio que engloba
a amplitude do IC90% e penaliza valores observados que nao estao contidos nestes,
elucidado na Secao 4.3, ao longo das estacoes do ano. Como nos criterios anteriores, ha
pouca divergencia. Contudo, pode-se enfatizar 2 picos: um ocorrido em abril (outono)
pelas previsoes provenientes do modelo SEMOS e o outro, em agosto (inverno) a partir
do ajuste do modelo DGOP. As previsoes fornecidas pelo ajuste do modelo STEMOS
mostraram-se superficialmente mais parcimoniosas, equilibrando o comprimento medio
do IC90% com a cobertura dos valores observados. No entanto, isto nao o caracteriza
como melhor modelo.
Na tentativa de compreender melhor o processo estatıstico subentendido no
procedimento da calibracao das previsoes numericas da velocidade do vento a 10
m, a Figura 4.4 ilustra um resumo da distribuicao a posteriori para o vetor de
parametros estaticos Θ = (β0, β1, φ, λ)′ ao longo das estacoes do ano. Os parametros
2Duracao media das estacoes do ano.
43
β0
Dez
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov
0.6
0.8
1.0
1.2
Ver Out Inv Pri
(a) β0β
1
Dez
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov0
.00
0.1
00.2
0
Ver Out Inv Pri
(b) β1
φ
Dez
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov1
.02.0
3.0
Ver Out Inv Pri
(c) φ
λ
Dez
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov
0.4
50.5
5
Ver Out Inv Pri
(d) λ
Figura 4.4: Mediana a posteriori e intervalos de credibilidade de 90% para o vetor
parametrico estatico do modelo STEMOS na aplicacao diaria ao longo das estacoes do
ano.
em questao pertencem ao modelo STEMOS o qual, foi selecionado pelo fato de conter
mais parametros, independente dos resultados exibidos ate entao. Observou-se que os
parametros que compoem o vetor parametrico estatico de outros modelos e sao comuns
a Θ = (β0, β1, φ, λ)′, resultaram em valores semelhantes. De fato, estes parametros
nao se alteram significativamente ao longo do tempo. Nota-se leves movimentos na
media a posteriori dos 4 parametros ao longo das estacoes. A variancia do processo,
representada pelo parametro β0, tem um leve decrescimo durante os meses do outono e
se eleva durante a sucessao do inverno para a primavera. A relacao dispersao-proficiencia
(Secao 3.1.2), representada pelo parametro β1, esta distribuıda muito proxima a zero,
indicando uma possıvel nao significancia. Para a taxa de decaimento exponencial da
correlacao espacial, representada pelo parametro φ, mantem-se praticamente constante
em 2. Este parametro caracteriza o inverso do alcance espacial. Especificamente, quanto
menor seu valor, mais significativa sera a correlacao espacial. E por fim, o parametro de
potencia da transformacao Box-Cox, representado pelo parametro λ, evolui em torno de
0,5, indicando uma transformacao raiz quadrada a qual, e bastante usual em variaveis
com distribuicao com assimetria positiva.
Com o objetivo de investigar minuciosamente o comportamento local das previsoes
numericas e calibradas a partir do ajuste dos modelos propostos, selecionou-se os meses
de janeiro (verao) e outubro (primavera), devido a melhor performance dos modelos
propostos, para a exibicao das series observadas e previsoes numericas, calibradas
44
0 2 4 6 8
02
46
8
Previsto
Obse
rva
do
(a) Eta
0 2 4 6 8
02
46
8
PrevistoO
bse
rva
do
(b) SEMOS
0 2 4 6 8
02
46
8
Previsto
Obse
rva
do
(c) STEMOS
0 2 4 6 8
02
46
8
Previsto
Obse
rva
do
(d) DGOP
Figura 4.5: Diagrama de dispersao com valores previstos versus observados na aplicacao
diaria para 18 a 21 de janeiro de 2016, 12 UTC.
pontuais e intervalares. De 18 a 21 de janeiro de 2016, 12 UTC, registraram-se velocidades
do vento a 10 m de ate 8 m/s. No entanto, conforme exibido na Figura 4.5, perceba
que velocidades acima de 5 m/s sao pontuais. Em geral, grande parte das velocidades
registradas acomodam-se ate 5 m/s nesta aplicacao. Note que o diagrama de dispersao
dos modelos propostos sao praticamente identicos e demonstram baixa habilidade dos
modelos para calibrar as previsoes numericas. O melhor ajuste se da pelo modelo que
apresenta um diagrama de dispersao que retorna uma relacao mais proxima de linear entre
valores observados e previstos. Casos isolados de velocidade acima de 6 m/s podem nao
ser previstos devido a um possıvel comportamento atıpico (e.g. passagem de um frente
fria). Pelo diagrama de dispersao, constata-se que as previsoes numericas do modelo Eta
apresentam uma grande sobrestimacao da realidade.
O comportamento local das previsoes em questao e exibido na Figura 4.6.
Arbitrariamente, selecionou-se as estacoes de monitoramento A533 – Ganhaes, A535
– Florestal, A557 – Coronel Pacheco e A561 – Sao Sebastiao do Paraıso. Note que
a velocidade do vento a 10 m as 12 UTC evoluiu suavemente ao longo dos dias nos
locais citados. Diferentemente das previsoes calibradas pontuais, as previsoes numericas
evoluem no tempo, em certos momentos, de forma brusca. Esta distincao indica uma
maior relevancia de outras covariaveis, como a do bloco AR. De forma informativa, com
diferencas sutis, a menor amplitude do IC90% para as previsoes da velocidade do vento
45
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
Eta Prev. Obs.
(a) A533 – SEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(b) A535 – SEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(c) A557 – SEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(d) A561 – SEMOS
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
Eta Prev. Obs.
(e) A533 – STEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(f) A535 – STEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(g) A557 – STEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(h) A561 – STEMOS
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
Eta Prev. Obs.
(i) A533 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(j) A535 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(k) A557 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(l) A561 – DGOP
Figura 4.6: Previsao 1 a 4 dias a frente para a velocidade do vento a 10 m de altura em
janeiro de 2016, 12 UTC.
a 10 m e dada pelo modelo DGOP e a maior, pelo modelo STEMOS. Esta informacao
ja fora contemplada de maneira eficiente no criterio IS, exibido na Figura 4.3.
De 18 a 21 de outubro de 2016, 12 UTC, registraram-se velocidades do vento a 10
m de ate 6 m/s. Repare que a estacao do ano corrente e a primavera, a qual retorna
maiores medias de velocidade do vento. No entanto, nestes dias de previsao nao registrou-
se velocidades acima de 6 m/s. Em contraponto, o cenario apresentado na Figura 4.5
durante o verao o qual, apresenta menores medias de velocidade do vento em geral,
observou-se velocidade ate 8 m/s. Apesar de haver a influencia das estacoes do ano,
a velocidade do vento a 10 m mostra-se volatil. De forma semelhante ao apresentado
anteriormente, as previsoes numericas tambem sobrestimam a velocidade do vento neste
46
0 1 2 3 4 5 6
01
23
45
6
Previsto
Obse
rva
do
(a) Eta
0 1 2 3 4 5 6
01
23
45
6
PrevistoO
bse
rva
do
(b) SEMOS
0 1 2 3 4 5 6
01
23
45
6
Previsto
Obse
rva
do
(c) STEMOS
0 1 2 3 4 5 6
01
23
45
6
Previsto
Obse
rva
do
(d) DGOP
Figura 4.7: Diagrama de dispersao com valores previstos versus observados na aplicacao
diaria para 18 a 21 de outubro de 2016, 12 UTC.
mes. Em vista da nao ocorrencia de velocidades que fogem do padrao, os modelos
apresentaram resultados satisfatorios neste mes.
O comportamento local das previsoes em questao e exibido na Figura 4.8 nas
mesmas estacoes de monitoramento selecionadas previamente nesta aplicacao. De forma
semelhante, a velocidade do vento a 10 m as 12 UTC evoluiu suavemente ao longo dos dias
nos locais citados. Note que, para este mes, as previsoes numericas evoluıram de maneira
mais suave com seus erros dados, aproximadamente, por um incremento constante para
cada localizacao.
Nesta aplicacao, os modelos demonstraram razoavel habilidade para a calibracao das
previsoes numericas, como demonstrado pelos criterios exibidos na Figura 4.2. Houve
certa dificuldade na previsao de velocidades mais altas (acima de 6 m/s). No entanto,
este pode ser um caso atıpico. A componente sazonal dos modelos de calibracao espaco-
temporais nao fora aplicada devido a incompatibilidade com o tipo de aplicacao. A
adicao desta componente pode beneficiar os modelos espaco-temporais propostos. A
secao a seguir desenvolve uma aplicacao a qual, a implementacao da componente sazonal
sera admitida.
4.4.2 Aplicacao: Horaria
Nesta aplicacao, considera-se o tempo em horas e assim, o fator sazonal unitario e
aplicado. As previsoes sao feitas para o dia 20, 13 UTC ao dia 21, 12 UTC de cada mes,
47
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
Eta Prev. Obs.
(a) A533 – SEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(b) A535 – SEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(c) A557 – SEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(d) A561 – SEMOS
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
Eta Prev. Obs.
(e) A533 – STEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(f) A535 – STEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(g) A557 – STEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(h) A561 – STEMOS
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
Eta Prev. Obs.
(i) A533 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(j) A535 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(k) A557 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
−24 0 +24 +48 +72 +96
02
46
(l) A561 – DGOP
Figura 4.8: Previsao 1 a 4 dias a frente para a velocidade do vento a 10 m de altura em
outubro de 2016, 12 UTC.
48
representando um horizonte de 1 a 24 horas a frente. O perıodo de treinamento possui
240 horas.
O desempenho global das previsoes do modelo Eta e dos modelos propostos ao longo
das estacoes do ano, apresentado na Figura 4.9, por meio dos criterios rEQM, EAM e
ICW, demonstra que as previsoes numericas provenientes do modelo Eta aparentam certa
periodicidade em seus erros, corroborando com a premissa de que estas previsoes possuem
erros sistematicos caracterısticos. A rEQM para estas previsoes varia, aproximadamente,
no intervalo (1, 2; 3, 8), o EAM, em (0, 8; 3, 4) e o ICW, em (0, 2; 0, 7).
Com objetivo de comparar o desempenho dos modelos de pos-processamento
propostos com o modelo numerico Eta, obteve-se a previsao pontual a partir da mediana
da distribuicao preditiva, definida em (4.1), em vista que, esta estatıstica retornou
melhores valores para os criterios utilizados. A rEQM para estas previsoes varia,
aproximadamente, no intervalo (0, 5; 2), o EAM, em (0, 4; 1, 7) e o ICW, em (0, 4; 0, 9).
Em geral, todos os modelos propostos obtiveram criterios de comparacao melhores que o
modelo Eta, implicando que, de fato, o pos-processamento aprimorou as previsoes. Atente
ao fato de que, todos os modelos propostos conseguem suavizar a notoria periodicidade
dos erros. Os resultados sao moderadamente prejudicados durante a primavera, estacao
a qual, os erros (rEQM e EAM) maximos observados sao maiores. Apenas em um
momento no mes de maio (outono), o pos-processamento realizado pelos modelos espacos-
temporais produziu resultados vagamente piores. Ja o modelo SEMOS resultou em um
erro relativamente maior, destoando de forma excessiva dos modelos mais robustos. Como
e um caso particular, possivelmente, uma anormalidade meteorologica ocorreu. Assim
como na aplicacao da Secao 4.4.1, observou-se uma mudanca de regime durante a sucessao
do inverno para a primavera.
Sobre o desempenho das previsoes pontuais calibradas provenientes do ajuste dos
modelos propostos, percebe-se que os modelos espaco-temporais apresentam resultados
de rEQM, EAM e ICW suavemente melhores. Ja para as previsoes intervalares, a Figura
4.10 apresenta o IS ao longo das estacoes do ano. Note-que neste criterio, potenciais
disparidades foram realcadas. O modelo proposto SEMOS possui uma longa sequencia
de picos, enquanto os modelos propostos espaco-temporais permanecem mais estaveis.
49
rEQ
M (
m/s
)
De
z
Ja
n
Fev
Ma
r
Ab
r
Ma
i
Ju
n
Ju
l
Ag
o
Se
t
Ou
t
Nov
0.5
1.5
2.5
3.5
Verão Outono Inverno Primavera
EtaSEMOSSTEMOSDGOP
(a) rEQM
EA
M (
m/s
)
De
z
Ja
n
Fev
Ma
r
Ab
r
Ma
i
Ju
n
Ju
l
Ag
o
Se
t
Ou
t
Nov
0.5
1.5
2.5
3.5
Verão Outono Inverno Primavera
EtaSEMOSSTEMOSDGOP
(b) EAM
ICW
De
z
Ja
n
Fev
Ma
r
Ab
r
Ma
i
Ju
n
Ju
l
Ag
o
Se
t
Ou
t
Nov
0.2
0.4
0.6
0.8
Verão Outono Inverno Primavera
EtaSEMOSSTEMOSDGOP
(c) ICW
Figura 4.9: Criterios de comparacao de modelos na aplicacao horaria ao longo das estacoes
do ano.
50
IS
De
z
Ja
n
Fev
Ma
r
Ab
r
Ma
i
Ju
n
Ju
l
Ag
o
Se
t
Ou
t
Nov
46
81
01
2Verão Outono Inverno Primavera
SEMOSSTEMOSDGOP
Figura 4.10: Interval Score na aplicacao horaria ao longo das estacoes do ano.
Sendo assim, salienta-se que as previsoes fornecidas pelos ajustes dos modelos espaco-
temporais foram mais parcimoniosas.
De forma analoga a que fora apresentado na Figura 4.4, um resumo da distribuicao
a posteriori do vetor de parametros estaticos do modelo STEMOS Θ = (β0, β1, φ, λ)′ ao
longo das estacoes do ano e apresentado na Figura 4.11. Comparando com o obtido
na aplicacao da Secao 4.4.1, apesar da transicao estar desajeitada, o parametro β0,
representando a variancia do processo, permanece tendo um leve decrescimo durante
os meses do outono e se eleva durante a sucessao do inverno para a primavera. O
parametro λ, representando a potencia da transformacao BC, evolui tambem em torno
de 0,5, indicando, igualmente, uma transformacao raiz quadrada. O parametro β1,
representando a relacao dispersao-proficiencia (Secao 3.1.2), esta distribuıdo muito
proximo a zero, sendo, igualmente nesta aplicacao, pouco representativo. O parametro
φ e o unico que destoa completamente da aplicacao feita anteriormente como pode-
se comparar as diferentes trajetorias entres as Figuras 4.4 e 4.11. Atente ao fato de
que com a introducao dos campos meteorologicos de forma horaria, muitos instantes
com velocidades do vento reduzidas por todo o territorio (e.g. durante a madrugada)
podem ser adicionados ao perıodo de treinamento, principalmente durante as estacoes
do ano de ventos mais fracos como o outono e parte do inverno. Assim, a velocidade
do vento e aproximadamente uniforme por todo o territorio, implicando na baixa
representatividade da correlacao espacial. Em contrapartida, repare que o cenario muda
51
β0
Dez
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov
0.7
0.8
0.9
1.0
Ver Out Inv Pri
(a) β0β
1
Dez
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov0
.00
0.0
40.0
8
Ver Out Inv Pri
(b) β1
φ
Dez
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov
46
810
Ver Out Inv Pri
(c) φ
λ
Dez
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov
0.4
50.5
50.6
5
Ver Out Inv Pri
(d) λ
Figura 4.11: Mediana a posteriori e intervalos de credibilidade de 90% para o vetor
parametrico estatico do modelo STEMOS na aplicacao horaria ao longo das estacoes do
ano.
durante a primavera, estacao do ano a qual, observou-se maiores medias de velocidade
do vento a 10 m.
Com o proposito de apurar o comportamento local das previsoes numericas e
calibradas a partir do ajuste dos modelos propostos, selecionou-se os meses de julho
e agosto (inverno) conforme o bom desempenho demonstrado nestes meses. Apesar de
pertencerem a mesma estacao do ano, o erro (rEQM e EAM) de agosto se assimila mais ao
padrao da estacao seguinte, aparentando ser um perıodo de mudanca de regime climatico.
De 20 de julho, 13 UTC a 21 de julho de 2016, 12 UTC, registraram-se velocidades do
vento a 10 m de ate 8 m/s, como apresentado na Figura 4.12. Na presente aplicacao,
velocidades mais altas (> 5 m/s) aparecem com mais frequencia. Porem, grande parte
das velocidades registradas ainda acomodam-se ate 5 m/s. Repare que o diagrama de
dispersao dos modelos propostos retornam uma relacao bem proxima de linear entre
valores observados e previstos. Inclusive, para velocidades acima de 5 m/s. Contudo, o
diagrama de dispersao do modelo SEMOS evidencia uma sobrestimacao da velocidade
do vento a 10 m. Em contraste, o diagrama de dispersao das previsoes do modelo Eta
demonstra baixa representatividade.
O comportamento local das previsoes em questao sao exibidos na Figura 4.13.
Arbitrariamente, selecionou-se as estacoes de monitoramento A512 – Ituiutaba, A549
– Aguas Vermelhas, A555 – Ibirite (Rola Moca) e F501 – Belo Horizonte (Cercadinho).
Atente ao fato de que as estacoes A555 e F501 distanciam-se 8 km e sao as estacoes com
52
0 2 4 6 8
02
46
8
Previsto
Obse
rva
do
(a) Eta
0 2 4 6 8
02
46
8
PrevistoO
bse
rva
do
(b) SEMOS
0 2 4 6 8
02
46
8
Previsto
Obse
rva
do
(c) STEMOS
0 2 4 6 8
02
46
8
Previsto
Obse
rva
do
(d) DGOP
Figura 4.12: Diagrama de dispersao com valores previstos versus observados na aplicacao
horaria de 20 de julho de 2016, 13 UTC a 21 de julho de 2016, 12 UTC.
maior proximidade. Assim, estao localizadas dentro da mesma celula da grade discreta
do modelo Eta e portanto, possuem igual previsao (numerica). Entretanto, perceba a
diferenca no nıvel das previsoes calibradas. Isto corrobora com o fato de que aspectos
locais em microescala, i.e., caracterısticas do local da estacao e seu entorno em um curto
raio, influenciam diretamente na velocidade do vento a 10 m. Semelhante ao que ocorre
na aplicacao da Secao 4.4.1, ha uma grande distincao entre as trajetorias das previsoes
numericas e calibradas, prenunciando uma maior relevancia de outras covariaveis. A
maior amplitude do IC90% para as previsoes da velocidade do vento a 10 m e dada pelo
modelo SEMOS. Esta larga amplitude pode ter sido consequencia do uso de um longo
perıodo de treinamento o qual, pode introduzir distorcoes na estimacao dos parametros
devido a sazonalidade provinda do efeito do forcamento solar na velocidade do vento
a 10 m. Em contrapartida, os modelos espaco-temporais proposto se beneficiam desta
particularidade, absorvendo este efeito, sem custo extra.
De 20 de agosto, 13 UTC a 21 de agosto de 2016, 12 UTC, registraram-se velocidades
do vento a 10 m de ate 9 m/s, como apresentado na Figura 4.14. Velocidades acima de 6
m/s nao foram previstas. Note que as previsoes numericas apresentaram sobrestimacao
excessiva. Como ocorrido no cenario anterior, o diagrama de dispersao do modelo SEMOS
evidencia uma sobrestimacao da velocidade do vento a 10 m.
O comportamento local das previsoes em questao sao exibidos na Figura 4.15 nas
mesmas estacoes de monitoramento selecionadas previamente nesta aplicacao. Repare
53
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
02
46
12h 18h 0h 6h 12h
Eta Prev. Obs.
(a) A512 – SEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
02
46
12h 18h 0h 6h 12h
(b) A549 – SEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12h 18h 0h 6h 12h
(c) A555 – SEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12
12h 18h 0h 6h 12h
(d) F501 – SEMOS
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
02
46
12h 18h 0h 6h 12h
Eta Prev. Obs.
(e) A512 – STEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
02
46
12h 18h 0h 6h 12h
(f) A549 – STEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12h 18h 0h 6h 12h
(g) A555 – STEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12
12h 18h 0h 6h 12h
(h) F501 – STEMOS
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
02
46
12h 18h 0h 6h 12h
Eta Prev. Obs.
(i) A512 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
02
46
12h 18h 0h 6h 12h
(j) A549 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12h 18h 0h 6h 12h
(k) A555 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12
12h 18h 0h 6h 12h
(l) F501 – DGOP
Figura 4.13: Previsao ate 24 horas a frente para a velocidade do vento a 10 m de altura
de 20 de julho de 2016, 13 UTC a 21 de julho de 2016, 12 UTC.
0 2 4 6 8
02
46
8
Previsto
Ob
serv
ad
o
(a) Eta
0 2 4 6 8
02
46
8
Previsto
Ob
serv
ad
o
(b) SEMOS
0 2 4 6 8
02
46
8
Previsto
Ob
serv
ad
o
(c) STEMOS
0 2 4 6 8
02
46
8
Previsto
Ob
serv
ad
o
(d) DGOP
Figura 4.14: Diagrama de dispersao com valores previstos versus observados na aplicacao
horaria de 20 de agosto de 2016, 13 UTC a 21 de agosto de 2016, 12 UTC.
54
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12h 18h 0h 6h 12h
Eta Prev. Obs.
(a) A512 – SEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12h 18h 0h 6h 12h
(b) A549 – SEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12
12h 18h 0h 6h 12h
(c) A555 – SEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12
15
12h 18h 0h 6h 12h
(d) F501 – SEMOS
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12h 18h 0h 6h 12h
Eta Prev. Obs.
(e) A512 – STEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12h 18h 0h 6h 12h
(f) A549 – STEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12
12h 18h 0h 6h 12h
(g) A555 – STEMOSHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12
15
12h 18h 0h 6h 12h
(h) F501 – STEMOS
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12h 18h 0h 6h 12h
Eta Prev. Obs.
(i) A512 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12h 18h 0h 6h 12h
(j) A549 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12
12h 18h 0h 6h 12h
(k) A555 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
03
69
12
15
12h 18h 0h 6h 12h
(l) F501 – DGOP
Figura 4.15: Previsao ate 24 horas a frente para a velocidade do vento a 10 m de altura
de 20 de agosto de 2016, 13 UTC a 21 de agosto de 2016, 12 UTC.
como os intervalos de predicao de todos os modelos sao bem mais extensos dos que
foram ajustados no mes anterior. Enfase nos intervalos provenientes do ajuste do modelo
SEMOS os quais, mostram-se pouco informativos devido a sua vasta amplitude. Note o
ocorrido durante a madrugada do dia 21 de outubro de 2016 na estacao de monitoramento
A512. A velocidade do vento a 10 m permaneceu 8 horas seguidas sendo registrada abaixo
de 1 m/s e repentinamente, a velocidade se eleva em ate 6 m/s. Perceba que a previsao
do modelo numerico Eta consegue, embora tardiamente, captar esta mudanca abrupta.
Devido ao historico de erros, tais previsoes tem pouco peso nos modelos de calibracao
propostos e nao faz com que a previsao calibrada realize este movimento inesperado.
O modelo DGOP e um dos modelos espaco-temporais propostos. Os resultados
obtidos por este modelo foram muito proximos aos obtidos pelo outro modelo espaco-
55
temporal proposto, STEMOS, o qual, apresentou os melhores criterios na presente
aplicacao. A principal vantagem do modelo DGOP e possuir menos parametros que
necessitam de metodos computacionais intensivos para serem estimados, requerendo
menos iteracoes do algoritmo MCMC durante o processo de inferencia para alcancar
a convergencia, como apresentado na Tabela 4.3. Alem disso, tambem demonstra que,
dependendo do tipo de aplicacao, o modelo DGOP pode chegar a ser mais de 2 vezes
mais rapido quando comparado ao STEMOS. Por consequencia, foi o escolhido para
demonstrar a calibracao da velocidade do vento a 10 m para todo o Estado de Minas
Gerais.
4.4.3 Aplicacao: Interpolacao Espacial
A interpolacao espacial (Krigagem, Cressie, 1993) e feita a partir da distribuicao
preditiva do Processo Gaussiano latente Xt que fora adaptado aos modelos propostos
atraves da estruturacao dada em (3.8). Esta estruturacao permite lidar com variaveis
com distribuicao assimetrica com domınio positivo conjuntamente com a utilidade da
interpolacao espacial de forma simples e direta, no contexto da inferencia Bayesiana.
Seguindo o que foi apresentado em (4.1), para a predicao da velocidade do vento a 10
m em um novo conjunto de localizacoes Y+t = (y(s+1 ), ..., y(s+m))′, faz-se necessario a
distribuicao preditiva dada por:
p(X+t |Xt) =
∫p(X+
t |Xt, Θ)p(Θ|X+t )dΘ,
sendo aproximada, utilizando Integracao de Monte Carlo, da seguinte maneira:
p(X+t |Xt) ≈
1
Q
Q∑i=1
p(X+t |Xt, Θ
(i)),
de forma que, sob um PG, tem-se:X+t
Xt
|Θ ∼ N
µs+µs
,
Σs+ Σs+,s
Σ′s+,s Σs
.
Conforme as propriedades da distribuicao Normal, chega-se a:
X+t |Xt, Θ ∼ N(µs+ + Σ′s+,sΣ
−1s (Xt − µs),Σs+ − Σ′s+,sΣ
−1s Σs+,s).
56
Por fim, a velocidade do vento a 10 m em um novo conjunto de localizacoes
Y+t = (y(s+1 ), ..., y(s+m))′ e obtida atraves da relacao em (3.7) e a distribuicao de previsao
h unidade de tempo a frente p(YT+h|Y1:T ) do modelo espaco-temporal selecionado e
obtida como descrito na Secao E.3 do Apendice E. Assim, obtem-se, previsoes pontuais
e intervalares para a velocidade do vento a 10 m para todo o Estado de Minas Gerais.
Uma limitacao especıfica da presente aplicacao e o uso do bloco AR. Para a
interpolacao espacial, isto se torna um fator ainda mais adverso pois, nao ha medicoes
disponıveis para o novo conjunto de localizacoes s+1 , ..., s+m. Assim, apesar da possıvel
inclusao de erros, a inputacao destes dados atraves de uma interpolacao bilinear (consulte
Press et al., 2007), como feito com as previsoes numericas regularmente espacadas
(consulte a Figura 1.2), e a opcao mais eficiente do ponto de vista operacional. Espera-se
que as previsoes numericas calibradas serao mais representativas em regioes localizadas
proximas as estacoes de monitoramento meteorologico.
Em busca de garantias de que os resultados obtidos a partir da interpolacao espacial
sao coesos, aplicou-se uma validacao cruzada. Assim, retirou-se 4 estacoes do banco de
dados utilizado. Foram elas: A505 – Araxa, A517 – Muriae, A550 – Itaobim e A560
– Pompeu. Tomou-se a cautela de selecionar estacoes de monitoramento que nao sao,
relativamente, isoladas. Portanto, utilizou-se o modelo DGOP para calibrar a previsao
numerica da velocidade do vento a 10 m para todo o Estado de Minas Gerais para julho
de 2016 utilizando 55 das 59 estacoes de monitoramento. A Figura 4.16 exibe as previsoes
numericas brutas, pontuais e intervalares calibradas para as estacoes de monitoramento
removidas da amostra.
Note que o ajuste feito na interpolacao espacial tem semelhanca em ordem de que
as previsoes calibradas tem trajeto completamente distinto das previsoes numericas
brutas, implicando, novamente, que a previsao numerica tem peso pequeno dentre as
covariaveis. Visualmente, as previsoes intervalares permanecem parcimoniosas. Nao sao
demasiadamente amplas, resultando pouca incerteza em tomadas de decisao, ao mesmo
tempo que, estritamente para estas previsoes nestas estacoes, obtiveram uma proporcao
de mais de 80% de cobertura.
57
Horizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
02
46
12h 18h 0h 6h 12h
Eta Prev. Obs.
(a) A505 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
02
46
12h 18h 0h 6h 12h
(b) A517 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
02
46
12h 18h 0h 6h 12h
(c) A550 – DGOPHorizonte (h)
Ve
l. d
o V
en
to (
m/s
)
0 +6 +12 +18 +24
02
46
12h 18h 0h 6h 12h
(d) A560 – DGOP
Figura 4.16: Previsao ate 24 horas a frente para a velocidade do vento a 10 m de altura
de 20 de julho de 2016, 13 UTC a 21 de julho de 2016, 12 UTC obtidos a partir da
interpolacao espacial. Estacoes de monitoramento A505, A517, A550 e A560 fora da
amostra.
Os mapas com as previsoes calibradas pelo modelo DGOP juntamente com as
previsoes do modelo numerico Eta para 6, 12, 18 e 24 horas a frente no Estado de
Minas Gerais sao apresentados na Figura 4.17. Superficialmente, pode-se comentar sobre
alguns padroes regionais observados. Previu-se velocidades levemente superiores ao longo
do tempo na porcao leste da mesorregiao do Triangulo Mineiro e Alto Paranaıba, no
municıpio de Belo Horizonte e em uma area de terreno acidentado que vai do centro ao
extremo norte do Estado. Em contraponto, observou-se previsoes de velocidade levemente
inferiores na regiao mais ao sul do Estado e na regiao que fica as margens do Rio Paraıba
do Sul em torno de Alem Paraıba.
4.5 Conclusoes
Para calibrar as previsoes da velocidade do vento a 10 m providas pelo modelo
numerico Eta, propos-se 3 modelos de pos-processamentos estatıstico: SEMOS, STEMOS
e DGOP.
Inicialmente, decidiu-se que seria necessario o uso de todas as covariaveis disponıveis,
em vista que, apenas os membros do ensemble nao explicavam razoavelmente o fenomeno.
O restante das covariaveis disponıveis sao compostas pelos valores observados passados
(bloco AR) e pela latitude, longitude e altura do relevo dos locais das estacoes de
58
Longitude
La
titu
de
0
2
4
6
8
−50 −48 −46 −44 −42 −40
−22
−2
0−
18
−16
20/07/2016, 18 UTC – PN
Longitude
La
titu
de
0
2
4
6
8
−50 −48 −46 −44 −42 −40
−22
−2
0−
18
−16
20/07/2016, 18 UTC – PP
Longitude
La
titu
de
0
1
2
3
4
5
−50 −48 −46 −44 −42 −40
−22
−2
0−
18
−16
20/07/2016, 18 UTC – ME
Longitude
La
titu
de
0
2
4
6
8
−50 −48 −46 −44 −42 −40
−22
−2
0−
18
−16
21/07/2016, 00 UTC – PN
Longitude
La
titu
de
0
2
4
6
8
−50 −48 −46 −44 −42 −40
−22
−2
0−
18
−16
21/07/2016, 00 UTC – PP
Longitude
La
titu
de
0
1
2
3
4
5
−50 −48 −46 −44 −42 −40
−22
−2
0−
18
−16
21/07/2016, 00 UTC – ME
Longitude
Latitu
de
0
2
4
6
8
−50 −48 −46 −44 −42 −40
−22
−20
−18
−1
6
21/07/2016, 06 UTC – PN
Longitude
Latitu
de
0
2
4
6
8
−50 −48 −46 −44 −42 −40
−22
−20
−18
−1
6
21/07/2016, 06 UTC – PP
Longitude
Latitu
de
0
1
2
3
4
5
−50 −48 −46 −44 −42 −40
−22
−20
−18
−1
6
21/07/2016, 06 UTC – ME
Longitude
Latitu
de
0
2
4
6
8
−50 −48 −46 −44 −42 −40
−22
−20
−18
−1
6
21/07/2016, 12 UTC – PN
Longitude
Latitu
de
0
2
4
6
8
−50 −48 −46 −44 −42 −40
−22
−20
−18
−1
6
21/07/2016, 12 UTC – PP
Longitude
Latitu
de
0
1
2
3
4
5
−50 −48 −46 −44 −42 −40
−22
−20
−18
−1
6
21/07/2016, 12 UTC – ME
Figura 4.17: Previsoes 6, 12, 18 e 24 horas a frente para a velocidade do vento a 10 m
de altura para o Estado de Minas Gerais. PN: Previsao numerica proveniente do modelo
Eta. PP: Previsao pontual calibrada proveniente do ajuste do modelo DGOP. ME:
Margem de erro, definida como metade do comprimento do intervalo de credibilidade
90% da previsao probabilıstica.
59
monitoramento meteorologico (bloco AUX). Em geral, modelos de calibracao corrigem
variaveis meteorologicas em um horizonte de previsao distante. No entanto, utilizar
valores observados passados restringiu demasiadamente o horizonte maximo de previsao
e assim, as aplicacoes foram restritas a horizontes curtos.
Projetou-se dois distintos modos de aplicacao para avaliar a capacidade de refino
que os modelos propostos possuem. Um deles, considerou a calibracao em um horario
especıfico (12 UTC) e foi nomeado por aplicacao “diaria” e o outro, concentrou-se em
calibrar sequencialmente ao longos das horas, nomeado por aplicacao “horaria”.
Na aplicacao “diaria”, os modelos propostos conseguiram refinar as previsoes
numericas de modo que os criterios de erro (rEQM e EAM), reduzissem. Os resultados
mais significativos com relacao ao EAM, por exemplo, ocorreram nos meses de janeiro
(verao), reduzindo de 2,2 para 0,75 (reducao de 66%), e outubro (primavera), de 2,6
para 1,2 (reducao de 53%) a partir do ajuste do modelo DGOP. As previsoes pontuais e
intervalares foram muito semelhantes entre os modelos propostos. Nenhum dos modelos
se sobressaiu. Foi visto que, em geral, os modelos propostos conseguem diminuir medidas
de erro. Contudo, de forma especıfica, tiveram dificuldades em prever velocidade do
vento ligeiramente mais altas (> 5 m/s). Isto pode ser justificado devido a haver poucos
registros nesta faixa de velocidade. Assim, ate 5 m/s, os modelos propostos tiveram
desempenho razoavel.
Na aplicacao “horaria”, observou-se que o rEQM e o EAM das previsoes do modelo
numerico Eta possuem certa periodicidade. Mesmo assim, os modelos propostos
obtiveram resultados significativamente melhores do que o modelo Eta e conseguiram
suavizar este efeito periodico. Pode-se citar como resultados relevantes a diminuicao
do EAM em janeiro (verao), de 3,4 para 0,75 (reducao de 78%), e em agosto (inverno)
de 3,4 para 0,8 (reducao de 76%) a partir do ajuste do modelo DGOP. Comparando
o desempenho das previsoes probabilısticas entre os modelos propostos a partir do IS,
os modelos espaco-temporais tem vantagem. Isto pode se dar ao fato de que o modelo
espacial nao e habil para lidar com os efeitos sazonais que este tipo de variavel contem
implıcito, mencionados na Secao 2.1.5 e ilustrados na Figura 1.4. Outro ponto importante
e o fato de que o aumento do comprimento do perıodo de treinamento nao prejudica
60
a estimacao dos parametros. Esta e uma discussao recorrente na literatura de pos-
processamento estatıstico (consulte Raftery et al., 2005; Gneiting et al., 2005; Gneiting,
2014). Alem disto, estes modelos conseguem lidar com efeitos sazonais de maneira
intuitiva, sem custos adicionais. Nesta aplicacao, nenhum dos modelos propostos teve
dificuldade para prever velocidades mais altas (> 5 m/s).
Por fim, comparou-se o custo computacional de aplicacao dos modelos. O modelo
STEMOS, apesar de bons criterios, e demasiadamente custoso computacionalmente para
este tipo de aplicacao. Isto ocorre devido a grande quantidade de parametros que
necessitam de metodos computacionais intensivos para serem estimados, requerendo uma
maior quantidade de iteracoes do algoritmo MCMC, como apresentado na Tabela 4.3.
Alem disto, como apontado pelas Figuras 4.4 e 4.11, a distribuicao a posteriori de β1,
parametro que representa a relacao dispersao-proficiencia (Secao 3.1.2) e e exclusivo da
classe de modelos EMOS em geral, esta distribuıda muito proxima a zero, implicando em
uma nao significancia. Uma possıvel justifica a essa irrelevancia pode ser dar dada pelo
fato de que os membros do ensemble de previsoes numericas do modelo Eta mostram-se
estaveis, oscilando pouco, como apresentado na Figura 4.1, e consequentemente, retornam
uma variancia amostral reduzida. Em contraponto, o modelo DGOP chega a ser 2
vezes mais computacionalmente eficiente. Estruturado sob um MLD com covariancias
estocasticas e aprendizado por descontos a partir de uma evolucao estocastica Beta-
Gama, este modelo proposto conseguiu combinar qualidade de previsoes, conforme os
criterios rEQM, EAM, ICW e IS, com um tempo computacional viavel para o tipo de
aplicacao operacional o qual, fora idealizado. Alem disso, a possibilidade da variacao
do parametro de variancia ao longo do tempo σ2t e uma faceta exclusiva deste modelo,
embora nao testada na presente aplicacao por questoes de comparabilidade entre modelos,
elucidadas na Secao 4.2, pode auxiliar em um melhor desempenho sem acarretar prejuızos
no tempo de processamento devido a sua estimacao ser feita de forma sequencial. Assim,
conclui-se que dentre os modelos propostos, o modelo DGOP e o mais aconselhavel para
o pos-processamento estatıstico operacional das previsoes do modelo numerico Eta para
a velocidade do vento a 10 m.
61
Capıtulo 5
Consideracoes Finais e Trabalhos
Futuros
O presente estudo teve a finalidade de calibrar previsoes numericas fornecidas pelo
modelo de mesoescala Eta para a velocidade do vento a 10 metros de altura em Minas
Gerais. Devido a escala em que o modelo Eta trabalha, suas previsoes podem apresentar
erros sistematicos quando deseja-se prever em locais especıficos, como apontado pela
Figura 1.3. Assim, propos-se modelos estatısticos que facam o pos-processamento para
campos meteorologicos completos. Como inovacao, adicionou-se a dinamica temporal
aos modelos de pos-processamento, em vista que, muitos fenomenos meteorologicos
evoluem ao longo do tempo com certa sazonalidade devido ao forcamento solar e/ou
estacoes do ano. Alem disso, utilizou-se a tecnica de aumento de dados (Tanner e Wong,
1987), para definir Processos Gaussianos latentes capazes de acomodar a “censura”
da variavel meteorologica de estudo. Desta forma, contornou-se a limitacao do uso
exclusivo de variaveis meteorologicas com distribuicao simetrica e com domınio em R nos
modelos de calibracao espacial, comentados na Secao 3.2. A insercao deste procedimento,
determinado por (3.7) e (3.8), na literatura do pos-processamento estatıstico trara o
advento de novas aplicacoes deste tipo (e.g. calibracao espacial da velocidade do vento e
precipitacao).
Os modelos de pos-processamento propostos, nomeados por, DGOP (Secao 3.3.1) e
STEMOS (Secao 3.3.2) foram estruturados atraves dos Modelo Linear Dinamico (MLD,
62
West e Harrison, 1997). Ambos tem como base o modelo MOS (Secao 3.1.1; Glahn
e Lowry, 1972) o qual, foi primordial para o desenvolvimento das sucessoras versoes.
Outros metodos de pos-processamento usuais nao foram utilizados no presente trabalho
devido a questoes tecnicas e praticas especıficas como, por exemplo, o modelo Model
Output Calibration (MOC, Mao et al., 1999), o qual supoe que os erros sistematicos
sao Normalmente distribuıdos, quando, na pratica, nao sao, principalmente em variaveis
com distribuicao assimetrica, como discute Lange (2005), e, ocasionalmente, este modelo
pode resultar valores negativos para a previsao da velocidade do vento, sendo necessario
a anexacao de um truncamento determinıstico nas previsoes. O modelo Bayesian Model
Averaging (BMA, Raftery et al., 2005), detalhado no Apendice A, juntamente com sua
extensao temporal Dynamic Model Averaging (DMA, Raftery et al., 2010) nao foram
utilizados porem, sao de interesse para investigacoes futuras. Embora o DMA nao tenha
sido aplicado no contexto do pos-processamento estatıstico de previsoes numericas de
variaveis meteorologicas, e um modelo de mesma natureza dos que foram propostos
neste trabalho. No entanto, encaixar as devidas adaptacoes para variaveis assimetricas
seria computacionalmente custoso para a estimacao dos parametros desta classe de
modelos. Alem disso, o BMA e seus derivados sao indicados para quando se possui um
superensemble, i.e., um ensemble composto por ensembles de distintos modelos numericos,
em vista que, os membros de um mesmo ensemble podem ser altamente correlacionados,
diferindo pouco entre si, como ocorreu na aplicacao especıfica deste trabalho, elucidado
na Figura 4.1. Ainda sobre os modelos propostos, foram desenvolvidos com o princıpio de
genericidade, aplicavel em diferentes tipos de variaveis numericas contınuas positivas ou
com domınio definido em R. As excecoes sao fenomenos meteorologicos que sao medidos
em graus (e.g. direcao do vento) e que estao definidos em um intervalo fechado (e.g.
umidade relativa do ar), requerendo transformacoes especıficas. Ademais, contemplam
covariaveis auxiliares e permitem a calibracao para locais especıficos ou para todo o
campo meteorologico de estudo.
Com respeito aos resultados obtidos, os modelos espaco-temporais propostos
apresentaram vantagem na aplicacao que dispunha de um efeito sazonal definido, com
os resultados exibidos na Secao 4.4.2, em comparacao com o modelo espacial proposto.
63
Quando este efeito nao esta presente, como na aplicacao apresentada na Secao 4.4.1,
nao ha diferencas significativas de resultados entre os modelos mais robustos com o
que possui somente a componente espacial. Indicando que, de fato, os modelos espaco-
temporais beneficiaram-se da sazonalidade intrınseca da variavel de estudo. Os modelos
propostos mostraram-se habeis na aplicacao que considera o tempo em horas com relacao
ao fornecimento de previsoes de velocidades mais altas (> 5 m/s) em vista que, ocorrem
com pouca frequencia.
Um grande limitador de desempenho dos modelos de pos-processamento propostos
foi a ausencia de informacoes locais mais detalhadas (e.g. relevo, orografia e rugosidade),
fazendo com que fosse necessario o uso de uma componente autorregressiva, limitando
largamente o horizonte de previsao. Em geral, os modelos de calibracao trabalham em
previsoes de longo prazo diferentemente de como fora empregado neste trabalho devido as
restricoes de desempenho demonstradas na Tabela 4.2. A velocidade do vento a 10 metros
de altura do solo mostrou-se demasiadamente instavel, sendo fortemente influenciada
por aspectos de microescala (e.g. proximidade com corpos d’agua e com areas urbanas;
Warner, 2010) os quais, se levados em consideracao, presumivelmente, beneficiarao a
qualidade da calibracao. Em vista que o Estado de Minas Gerais possui relevo bastante
acidentado (Amarante et al., 2010) ao longo de sua longa extensao territorial1, restringir a
regiao de aplicacao para locais com caracterısticas topograficas semelhantes pode auxiliar
em uma estimacao mais fidedigna dos efeitos espaciais.
Por fim, pretende-se estender a aplicacao dos modelos de pos-processamento propostos
no presente trabalho para outras variaveis meteorologicas, independente da simetria da
distribuicao (e.g. precipitacao, temperatura de superfıcie (2 m), pressao atmosferica e
velocidade do vento em outras altitudes), e compara-los com os existentes na literatura
em contextos admitidos por estes.
1Minas Gerais possui um territorio com area de 586.852,35 km2 (Minas Gerais, 2018).
64
Referencias Bibliograficas
Amarante, O. d., Silva, F., e Andrade, P. (2010). “Atlas Eolico: Minas Gerais.” Belo
Horizonte: CEMIG .
Banerjee, S., Carlin, B. P., e Gelfand, A. E. (2014). Hierarchical modeling and analysis
for spatial data. Crc Press.
Bao, L., Gneiting, T., Grimit, E. P., Guttorp, P., e Raftery, A. E. (2010). “Bias correction
and Bayesian model averaging for ensemble forecasts of surface wind direction.”
Monthly Weather Review , 138, 5, 1811–1821.
Bardossy, A. e Plate, E. J. (1992). “Space-time model for daily rainfall using atmospheric
circulation patterns.” Water Resources Research, 28, 5, 1247–1259.
Barry, R. G. e Chorley, R. J. (2009). Atmosfera, tempo e clima. Bookman Editora.
Berrocal, V. J., Raftery, A. E., e Gneiting, T. (2007). “Combining spatial statistical and
ensemble information in probabilistic weather forecasts.” Monthly Weather Review ,
135, 4, 1386–1402.
Berrocal, V. J., Raftery, A. E., Gneiting, T., et al. (2008). “Probabilistic quantitative
precipitation field forecasting using a two-stage spatial model.” The Annals of Applied
Statistics , 2, 4, 1170–1193.
Bidlot, J.-R., Holmes, D. J., Wittmann, P. A., Lalbeharry, R., e Chen, H. S. (2002).
“Intercomparison of the performance of operational ocean wave forecasting systems
with buoy data.” Weather and Forecasting , 17, 2, 287–310.
65
Black, T. L. (1994). “The new NMC mesoscale Eta model: Description and forecast
examples.” Weather and forecasting , 9, 2, 265–278.
Box, G. E. e Cox, D. R. (1964). “An analysis of transformations.” Journal of the Royal
Statistical Society. Series B (Methodological), 211–252.
Carter, C. K. e Kohn, R. (1994). “On Gibbs sampling for state space models.”
Biometrika, 81, 3, 541–553.
Charney, J. G., Fjortoft, R., e Neumann, J. v. (1950). “Numerical integration of the
barotropic vorticity equation.” Tellus , 2, 4, 237–254.
Chou, S., Souza, C. d., Gomes, J. L., Evangelista, E., Osorio, C., e Cataldi, M. (2007).
“Refinamento estatıstico das previsoes horarias de temperatura a 2 m do modelo Eta
em estacoes do Nordeste do Brasil.” Revista Brasileira de Meteorologia, 22, 3, 287–296.
Cressie, N. (1993). Statistics for spatial data. New York: Wiley.
Dempster, A. P., Laird, N. M., e Rubin, D. B. (1977). “Maximum likelihood from
incomplete data via the EM algorithm.” Journal of the royal statistical society. Series
B (methodological), 1–38.
Eddelbuettel, D. e Francois, R. (2011). “Rcpp: Seamless R and C++ Integration.”
Journal of Statistical Software, 40, 8, 1–18.
Epstein, E. S. (1969). “Stochastic dynamic prediction.” Tellus , 21, 6, 739–759.
Feldmann, K., Scheuerer, M., e Thorarinsdottir, T. L. (2015). “Spatial postprocessing
of ensemble forecasts for temperature using nonhomogeneous Gaussian regression.”
Monthly Weather Review , 143, 3, 955–971.
Fruhwirth-Schnatter, S. (1994). “Data augmentation and dynamic linear models.”
Journal of time series analysis , 15, 2, 183–202.
Gamerman, D. (1997). Markov Chain Monte Carlo: Stochastic Simulation for Bayesian
Inference. London: Chapman & Hall.
66
Gel, Y., Raftery, A. E., e Gneiting, T. (2004). “Calibrated probabilistic mesoscale weather
field forecasting: The geostatistical output perturbation method.” Journal of the
American Statistical Association, 99, 467, 575–583.
Gelfand, A. E., Zhu, L., e Carlin, B. P. (2001). “On the change of support problem for
spatio-temporal data.” Biostatistics , 2, 1, 31–45.
Glahn, H. R. e Lowry, D. A. (1972). “The use of model output statistics (MOS) in
objective weather forecasting.” Journal of applied meteorology , 11, 8, 1203–1211.
Glasbey, C. e Nevison, I. (1997). “Rainfall modelling using a latent Gaussian variable.”
Lecture Notes in Statistics , 122, 5, 233–242.
Gneiting, T. (2014). Calibration of medium-range weather forecasts . European Centre
for Medium-Range Weather Forecasts.
Gneiting, T. e Raftery, A. E. (2007). “Strictly proper scoring rules, prediction, and
estimation.” Journal of the American Statistical Association, 102, 477, 359–378.
Gneiting, T., Raftery, A. E., Westveld III, A. H., e Goldman, T. (2005). “Calibrated
probabilistic forecasting using ensemble model output statistics and minimum CRPS
estimation.” Monthly Weather Review , 133, 5, 1098–1118.
Grimit, E. P. e Mass, C. F. (2007). “Measuring the ensemble spread–error relationship
with a probabilistic approach: Stochastic ensemble results.” Monthly weather review ,
135, 1, 203–221.
Hansen, J., Sato, M., e Ruedy, R. (1997). “Radiative forcing and climate response.”
Journal of Geophysical Research: Atmospheres , 102, D6, 6831–6864.
Hutchinson, M. (1995). “Stochastic space-time weather models from ground-based data.”
Agricultural and Forest Meteorology , 73, 3-4, 237–264.
INPE/CPTEC (2018). “Instituto Nacional de Pesquisas Espaciais — Centro de Previsao
de Tempo e Estudos Climaticos — Eta Model — Regional.” http://etamodel.cptec.
inpe.br/. Acessado em 15/05/2018.
67
ISO, I. (2017). “IEC 14882: 2017 Information technology-Programming languages-C++.”
Geneva, Switzerland: International Organization for Standardization.
Kalman, R. E. (1960). “A new approach to linear filtering and prediction problems.”
Journal of basic Engineering , 82, 1, 35–45.
Kalnay, E. (2003). Atmospheric modeling, data assimilation and predictability .
Cambridge University Press.
Klein, W. H., Lewis, B. M., e Enger, I. (1959). “Objective prediction of five-day mean
temperatures during winter.” Journal of Meteorology , 16, 6, 672–682.
Krishnamurti, T. (1995). “Numerical weather prediction.” Annual review of fluid
mechanics , 27, 1, 195–225.
Kwa, C. (2001). “The rise and fall of weather modification: changes in American attitudes
toward technology, nature, and society.” Changing the Atmosphere: expert knowledge
and environmental governance, 135–65.
Landberg, L., Myllerup, L., Rathmann, O., Petersen, E. L., Jørgensen, B. H., Badger, J.,
e Mortensen, N. G. (2003). “Wind resource estimation—an overview.” Wind Energy ,
6, 3, 261–271.
Lange, M. (2005). “On the uncertainty of wind power predictions—Analysis of the
forecast accuracy and statistical distribution of errors.” Journal of solar energy
engineering , 127, 2, 177–184.
Leutbecher, M. e Palmer, T. N. (2008). “Ensemble forecasting.” Journal of
Computational Physics , 227, 7, 3515–3539.
Li, Y., Lu, G., Wu, Z., He, H., Shi, J., Ma, Y., e Weng, S. (2016). “Evaluation of
optimized WRF precipitation forecast over a complex topography region during flood
season.” Atmosphere, 7, 11, 145.
Liu, F., West, M., et al. (2009). “A dynamic modelling strategy for Bayesian computer
model emulation.” Bayesian Analysis , 4, 2, 393–411.
68
Liu, Y., Warner, T. T., Bowers, J. F., Carson, L. P., Chen, F., Clough, C. A., Davis,
C. A., Egeland, C. H., Halvorson, S. F., Huck Jr, T. W., et al. (2008). “The operational
mesogamma-scale analysis and forecast system of the US Army Test and Evaluation
Command. Part I: Overview of the modeling system, the forecast products, and how
the products are used.” Journal of Applied Meteorology and Climatology , 47, 4, 1077–
1092.
Mao, Q., McNider, R. T., Mueller, S. F., e Juang, H.-M. H. (1999). “An optimal model
output calibration algorithm suitable for objective temperature forecasting.” Weather
and forecasting , 14, 2, 190–202.
Matheson, J. E. e Winkler, R. L. (1976). “Scoring rules for continuous probability
distributions.” Management science, 22, 10, 1087–1096.
Mera, R. J., Niyogi, D., Buol, G. S., Wilkerson, G. G., e Semazzi, F. H. (2006). “Potential
individual versus simultaneous climate change effects on soybean (C 3) and maize (C
4) crops: an agrotechnology model based study.” Global and Planetary Change, 54, 1,
163–182.
Mesinger, F., Janjic, Z. I., Nickovic, S., Gavrilov, D., e Deaven, D. G. (1988). “The
step-mountain coordinate: model description and performance for cases of Alpine
lee cyclogenesis and for a case of an Appalachian redevelopment.” Monthly Weather
Review , 116, 7, 1493–1518.
Metropolis, N., Rosenbluth, A. W., Rosenbluth, M. N., Teller, A. H., e Teller, E. (1953).
“Equation of state calculations by fast computing machines.” The journal of chemical
physics , 21, 6, 1087–1092.
Minas Gerais, G. (2018). http://mg.gov.br/conheca-minas/geografia/. Acessado
em 15/05/2018.
Montgomery, D. C. e Peck, E. A. (1982). Introduction to linear regression analysis . Wiley.
Nelder, J. A. e Wedderburn, R. W. (1972). “Generalized linear models.” Journal of the
Royal Statistical Society: Series A (General), 135, 3, 370–384.
69
NRL (2018). “U.S. Naval Research Laboratory — Marine Meteorology Division.” https:
//www.nrlmry.navy.mil//. Acessado em 14/05/2018.
Petris, G., Petrone, S., e Campagnoli, P. (2009). Dynamic Linear Models with R.
Springer.
Piani, C., Haerter, J., e Coppola, E. (2010). “Statistical bias correction for daily
precipitation in regional climate models over Europe.” Theoretical and Applied
Climatology , 99, 1-2, 187–192.
Prado, R. e West, M. (2010). Time series: modeling, computation, and inference. CRC
Press.
Press, W. H., Teukolsky, S. A., Vetterling, W. T., e Flannery, B. P. (2007). Numerical
recipes 3rd edition: The art of scientific computing . Cambridge university press.
R Core Team (2018). R: A Language and Environment for Statistical Computing . R
Foundation for Statistical Computing, Vienna, Austria.
Raftery, A. E., Gneiting, T., Balabdaoui, F., e Polakowski, M. (2005). “Using Bayesian
model averaging to calibrate forecast ensembles.” Monthly Weather Review , 133, 5,
1155–1174.
Raftery, A. E., Karny, M., e Ettler, P. (2010). “Online prediction under model uncertainty
via dynamic model averaging: Application to a cold rolling mill.” Technometrics , 52,
1, 52–66.
Raftery, A. E., Madigan, D., e Hoeting, J. A. (1997). “Bayesian model averaging for
linear regression models.” Journal of the American Statistical Association, 92, 437,
179–191.
Ravines, R. R., Schmidt, A. M., Migon, H. S., e Renno, C. D. (2008). “A joint model
for rainfall–runoff: the case of Rio Grande Basin.” Journal of Hydrology , 353, 1-2,
189–200.
Richardson, L. (1922). Weather Prediction by Numerical Process . Cambridge University.
70
Robert, C. P. (2004). Monte carlo methods . Wiley Online Library.
Sanderson, C. e Curtin, R. (2016). “Armadillo: a template-based C++ library for linear
algebra.” Journal of Open Source Software.
Sanso, B. e Guenni, L. (1999). “Venezuelan rainfall data analysed by using a Bayesian
space–time model.” Journal of the Royal Statistical Society: Series C (Applied
Statistics), 48, 3, 345–362.
Schuhen, N., Thorarinsdottir, T. L., e Gneiting, T. (2012). “Ensemble model output
statistics for wind vectors.” Monthly weather review , 140, 10, 3204–3219.
Sharman, R., Tebaldi, C., Wiener, G., e Wolff, J. (2006). “An integrated approach to
mid-and upper-level turbulence forecasting.” Weather and forecasting , 21, 3, 268–287.
Sloughter, J. M., Gneiting, T., e Raftery, A. E. (2010). “Probabilistic wind speed
forecasting using ensembles and Bayesian model averaging.” Journal of the american
statistical association, 105, 489, 25–35.
Sloughter, J. M. L., Raftery, A. E., Gneiting, T., e Fraley, C. (2007). “Probabilistic
quantitative precipitation forecasting using Bayesian model averaging.” Monthly
Weather Review , 135, 9, 3209–3220.
Stidd, C. (1973). “Estimating the precipitation climate.” Water Resources Research, 9,
5, 1235–1241.
Tanner, M. A. e Wong, W. H. (1987). “The calculation of posterior distributions by data
augmentation.” Journal of the American statistical Association, 82, 398, 528–540.
Thomson, M. C., Palmer, T., Morse, A. P., Cresswell, M., e Connor, S. J. (2000).
“Forecasting disease risk with seasonal climate predictions.” The Lancet , 355, 9214,
1559–1560.
Thorarinsdottir, T. L. e Gneiting, T. (2010). “Probabilistic forecasts of wind speed:
ensemble model output statistics by using heteroscedastic censored regression.” Journal
of the Royal Statistical Society: Series A (Statistics in Society), 173, 2, 371–388.
71
Thorarinsdottir, T. L. e Johnson, M. S. (2012). “Probabilistic wind gust forecasting using
nonhomogeneous Gaussian regression.” Monthly Weather Review , 140, 3, 889–897.
Triantafyllopoulos, K. (2002). “On observational variance learning for multivariate
Bayesian time series and related models.” Ph.D. thesis, University of Warwick.
Vihola, M. (2012). “Robust adaptive Metropolis algorithm with coerced acceptance rate.”
Statistics and Computing , 22, 5, 997–1008.
Warner, T. T. (2010). Numerical weather and climate prediction. Cambridge University
Press.
West, M. e Harrison, P. (1997). Bayesian forecasting and dynamic models . 2nd ed.
Springer Verlag, New York.
Whitaker, J. S. e Loughe, A. F. (1998). “The relationship between ensemble spread and
ensemble mean skill.” Monthly weather review , 126, 12, 3292–3302.
Wilks, D. S. (2006). Statistical Methods in the Atmospheric Sciences: An Introduction.
Elsevier.
Willmott, C. J. (1981). “On the validation of models.” Physical geography , 2, 2, 184–194.
Wilson, L. J. e Vallee, M. (2002). “The Canadian updateable model output statistics
(UMOS) system: Design and development tests.” Weather and forecasting , 17, 2,
206–222.
72
Apendice A
Outros Modelos de
Pos-Processamento Estatıstico
A.1 Bayesian Model Average
O metodo Bayesian Model Averaging (BMA, Raftery et al., 1997) e uma abordagem
Bayesiana para combinar modelos estatısticos concorrentes e possui uma ampla aplicacao
nas ciencias sociais e da saude. Sua vantagem em relacao a outras tecnicas, como a analise
de regressao convencional, e a ponderacao de multiplos modelos, nao considerando um
unico modelo como o melhor. SuponhaM = {M1, ...,Mm} um conjunto discreto e finito
de modelos disponıveis, entao, a distribuicao a posteriori da variavel de interesse Y dado
o conjunto de dados D e:
p(Y |D) =m∑k=1
p(Y |Mk, D)P (Mk|D). (A.1)
Em suma, o BMA e a distribuicao de mistura resultante da media das distribuicoes
a posteriori de Y dado cada modelo Mk ponderada pela probabilidade a posteriori dos
modelos.
O metodo BMA foi aplicado como procedimento de pos-processamento estatıstico
inicialmente por Raftery et al. (2005). Neste contexto, cada membro do ensemble Fk
e individualmente associado a uma distribuicao de probabilidade g (i.e, aplicacao do
metodo MOS (secao 3.1.1) individualmente para cada membro do ensemble Fk) sendo
73
compreendido como um modelo unico Mk e a probabilidade a posteriori dos modelos
p(Mk|D), vista como peso ωk, e interpretada como a probabilidade a posteriori do
membro Fk, apos calibracao, ser o que melhor preve o fenomeno meteorologico de interesse
Y . A distribuicao preditiva do metodo BMA e dada pela distribuicao de mistura:
p(Y |F1, ..., Fm) =m∑k=1
ωkgk(Y |Fk), (A.2)
com os pesos ωk sendo nao negativos e∑m
k=1 ωk = 1. Para a estimacao dos parametros
desconhecidos do metodo BMA calibrando a temperatura de superfıcie e a pressao
ao nıvel do mar, Raftery et al. (2005) supoem normalidade na distribuicao do erro
aleatorio e utilizam a estimativa de maxima verossimilhanca a partir do algoritmo
iterativo EM (Dempster et al., 1977). Mais aplicacoes deste metodo para outros tipos de
variaveis climaticas (e.g. precipitacao, velocidade e direcao do vento) supondo distintas
distribuicoes de probabilidade para o erro aleatorio, podem ser encontradas em Sloughter
et al. (2007), Sloughter et al. (2010) e Bao et al. (2010), respectivamente.
A.2 Spatial Bayesian Model Average
O metodo Spatial Bayesian Model Averaging (SBMA, Berrocal et al., 2007) combina
os metodos BMA (secao A.1) e GOP (secao 3.2.1), aproveitando os benefıcios de ambos os
metodos. Este metodo se assemelha a tecnica original, tendo sua funcao preditiva como
uma media ponderada das densidades de previsao individuais com pesos que refletem a
habilidade dos membros da previsao. A distribuicao preditiva do metodo SBMA e dada
pela distribuicao de mistura:
p(Ys|Fs1 , ...,Fsm) =m∑k=1
ωkgk(Ys|Fsk). (A.3)
Analogamente a sua versao univariada, os pesos ωk sao nao negativos e∑m
k=1 ωk = 1.
Para a estimacao dos parametros do SBMA calibrando a temperatura de superfıcie,
Berrocal et al. (2007) consideraram primeiro ajustar o modelo BMA. Dado as estimativas
para os parametros do BMA, o modelo GOP e ajustado para cada membro do
ensemble Fsk , k = 1, ...,m, separadamente. Combinando as estimativas de ambos
74
os procedimentos, os parametros do SBMA sao obtidos. O metodo descrito em
Berrocal et al. (2007) foi projetado para variaveis meteorologicas com distribuicao
simetrica e com domınio em R. Em Berrocal et al. (2008), um procedimento de pos-
processamento espacial foi desenvolvido para precipitacao, onde os autores adaptaram a
versao univariada do BMA para precipitacao proposto por Sloughter et al. (2007).
75
Apendice B
Criterios de Comparacao de Modelos
B.1 Raiz Quadrada do Erro Quadratico Medio
A rEQM e definida por:
rEQM(y1, ..., yn) =
√√√√ 1
n
n∑i=1
(yi − yi)2,
com yi representando o i-esimo valor observado e yi, o valor previsto para yi.
B.2 Erro Absoluto Medio
O EAM e definido por:
EAM(y1, ..., yn) =1
n
n∑i=1
|yi − yi|,
com yi representando o i-esimo valor observado e yi, o valor previsto para yi.
B.3 Indice de Concordancia de Willmott
O ICW (Willmott, 1981) e uma medida padronizada do grau de erro de predicao.
Variando entre 0 (ausencia de concordancia) e 1 (correspondencia perfeita), e dado por:
ICW(y1, ..., yn) = 1−∑n
i=1 (yi − yi)2∑ni=1 (|yi − y|+ |yi − y|)2
,
76
com yi representando o i-esimo valor observado, yi, o valor previsto para yi e y =
1n
∑ni=1 yi.
B.4 Interval Score
O IS (Gneiting e Raftery, 2007) e uma regra de pontuacao intuitiva para previsoes
intervalares considerando o intervalo de predicao central com nıvel (1−α)×100% o qual,
tem extremidades definidas pelos quantis preditivos nos nıveis α2
e 1 − α2. O previsor
e recompensado por intervalos estreitos e penalizado quando nao ha a cobertura da
previsao. O IS medio e dado por:
IS(y1, ..., yn) =1
n
n∑i=1
(ui − li) +2
α(li − xi)1 {xi < li}+
2
α(xi − ui)1 {xi > ui}
com yi representando o i-esimo valor observado e li e ui, respectivamente, os limites
inferior, obtido pelo quantil α2, e superior, obtido pelo quantil 1− α
2, de previsao para yi.
77
Apendice C
Distribuicoes Condicionais
Completas
C.1 Vetor parametrico β
A distribuicao condicional completa de β, vetor de parametros relacionado com a
relacao dispersao-proficiencia no modelo STEMOS, e dada por:
p(β|θ1:T , φ, λ,Y1:T ) ∝T∏t=1
|Σ∗t (β)|−1/2
× exp
{−1
2
T∑t=1
(Xt − F′tθt)′Σ∗t (β)−1(Xt − F′tθt)
}.
(C.1)
Assim, p(β|θ1:T , φ, λ,Y1:T ) nao possui forma analıtica conhecida. A distribuicao
condicional completa de β no modelo SEMOS e obtida de forma analoga.
C.2 Parametro φ
A distribuicao condicional completa de φ, parametro que representa a taxa de
decaimento exponencial no modelo STEMOS, e dada por:
78
p(φ|θ1:T ,β, λ,Y1:T ) ∝T∏t=1
|Σ∗t (φ)|−1/2
× exp
{−1
2
T∑t=1
(Xt − F′tθt)′Σ∗t (φ)−1(Xt − F′tθt)
}.
(C.2)
Assim, p(φ|θ1:T ,β, λ,Y1:T ) nao possui forma analıtica conhecida. A distribuicao
condicional completa de φ nos modelos SEMOS e DGOP e obtida de forma analoga.
C.3 Parametro λ
A distribuicao condicional completa de λ, parametro da transformacao potencia no
modelo STEMOS, e dada por:
p(λ|θ1:T ,β, φ,Y1:T ) ∝ exp
{−1
2
T∑t=1
(Xt(λ)− F′tθt)′Σ∗t−1(Xt(λ)− F′tθt)
}×∏Yit>c
Y λ−1it .
(C.3)
Assim, p(λ|θ1:T ,β, φ,Y1:T ) nao possui forma analıtica conhecida. A distribuicao
condicional completa de λ nos modelos SEMOS e DGOP e obtida de forma analoga.
C.4 Processo Espacial latente Zt(s)
Para o modelo Normal Truncado (Stidd, 1973; Hutchinson, 1995), supoe-se que Xt(s)
e um Processo Gaussiano latente que coordena um outro Processo Espacial assimetrico a
partir de uma transformacao conhecida f . Simplificando a construcao em (3.8), tem-se:
Xt(s) =
f(Yt(s)), se f(Yt(s)) ≥ c,
Zt(s), se f(Yt(s)) < c.
Note que o Processo Espacial Zt(s) e acrescentado para lidar com a censura do
Processo de estudo quando f(Yt(s)) < c com f(Yt(s)) e Zt(s) ocorrendo de forma
79
complementar. Defina como Xt = (xt(s1), ..., xt(sn))′, f(Yt) =(f(yt(s1)), ..., f(yt(sn))
)′e Zt = (zt(s1), ..., zt(sn))′. Assim, o PG Xt e particionado da seguinte maneira:
Xt =
f(Yt)
Zt
|Θ ∼ N
µf(Yt)µZt
,
Σf(Yt) Σf(Yt),Zt
Σ′f(Yt),ZtΣZt
.
Conforme as propriedades da distribuicao Normal e Normal Truncada e a restricao
imposta pela censura supondo distribuicao Normal Truncada para Yt(s), chega-se a
distribuicao condicional completa de Zt dada por:
Zt|f(Yt), Θ ∼ NT(−∞,BC(c;λ))
(µZ∗
t,ΣZ∗
t
),
com µZ∗t
= µZt+ Σ′f(Yt),Zt
Σ−1f(Yt)(f(Yt)− µf(Yt)
)e ΣZ∗
t= Σ′f(Yt),Zt
Σ−1f(Yt)Σf(Yt),Zt .
C.5 Processo Espacial latente Ut(s)
A prosseguir com o desenvolvimento anterior, Ut(s) e introduzido para contornar
possıveis dados faltantes. Assim como no caso anterior, ocorre de forma complementar
aos outros Processos latentes. Baseando-se na estrutura completa apresentada em
(3.8), Ut(s) nao possui restricao com relacao a domınio. Seja Y∗t = (f(Yt),Zt)′ e
Ut = (ut(s1), ..., ut(sn))′. O PG Xt e particionado da seguinte maneira:
Xt =
Y∗t
Ut
|Θ ∼ N
µY ∗t
µUt
,
ΣY ∗t
ΣY ∗t ,Ut
Σ′Y ∗t ,Ut
ΣUt
.
Conforme as propriedades da distribuicao Normal, chega-se a distribuicao condicional
completa de Ut dada por:
Ut|Y∗t , Θ ∼ N(µU∗t,ΣU∗
t),
com µU∗t
= µUt+ Σ′Y ∗
t ,UtΣ−1Y ∗
t
(Y∗t − µY ∗
t
)e ΣU∗
t= Σ′Y ∗
t ,UtΣ−1Yt ΣYt,Ut .
80
Apendice D
Algoritmo Robusto-Adaptativo de
Metropolis
O algoritmo Robusto-Adaptativo de Metropolis (RAM) foi proposto por Vihola (2012)
e e uma extensao do algoritmo de Metropolis (Metropolis et al., 1953). De forma analoga
ao precursor, este metodo e utilizado quando amostras das distribuicoes condicionais
completas sao difıceis de serem geradas. Possui a vantagem de obter a convergencia
de forma mais eficiente quando ha grande quantidade de parametros sendo amostrados
dessa forma. Alem de gerar valores dos parametros de interesse θ = (θ1, ...θp)′, lida
simultaneamente com a probabilidade de aceitacao media α, ou taxa de aceitacao,
pre-fixando uma meta α∗ ∈ (0, 1) e definindo a distribuicao proposta q(.), de modo
independente, requerendo apenas que esta seja esfericamente simetrica e centrada em 0p.
Determine{ζ(k)}k≥1 como uma sequencia que decai para zero. O esquema de amostragem
e dado por:
1. Inicialize θ(0) = (θ(0)1 , ..., θ
(0)p )′, S(0) = s0Ip e k = 1;
2. Obtenha um novo valor para θ(k) a partir de θ(k−1) da seguinte forma:
(a) Gere um valor para θ(k) a partir de:
θ(k) = θ(k−1) + S(k−1)V (k), V (k) ∼ q(.);
81
(b) Aceite o valor proposto em (a) com probabilidade de aceitacao α:
α(k) = min
{1,p(θ(k)|θ(k−1), y)q(θ(k−1)|θ(k))p(θ(k−1)|θ(k), y)q(θ(k)|θ(k−1))
};
(c) Calcule a matriz triangular inferior S(k) com os elementos da diagonal principal
positivos de forma que satisfaca:
S(k)S ′(k)
= S(k−1)
(Ip + ζ(k)(α(k) − α∗)V
(k)V ′(k)
‖V (k)‖2
)S ′
(k−1)
3. Atribua k = k+ 1 e volte para 2, repetindo o procedimento ate que a convergencia
seja alcancada.
Nomeia-se de passeio aleatorio quando amostra-se de θ(k) a partir de θ(k−1) sendo a
taxa de aceitacao otima para este de ≈ 23, 4%. Assim, α∗ = 0, 234. De forma interligada,
ha a indicacao de que s0 = 2.4√p
para que o algoritmo atinja a convergencia de forma mais
agil.
82
Apendice E
Modelos Dinamicos
O MLD e um caso particular do Modelo de Espaco de Estado (MEE).
E.1 Modelo Linear Dinamico
Considerando uma serie temporal n-dimensional Yt, t = 1, 2, ..., o MLD e definido
por:
Equacao de Observacao: Yt = F′tθt + εt, εt ∼ N(0n,Vt), (E.1a)
Equacao de Evolucao: θt = Gtθt−1 + ωt, ωt ∼ N(0p,Wt), (E.1b)
Informacao Inicial: θ0|D0 ∼ N(m0,C0). (E.1c)
Assume-se que as sequencias de erros observacionais εt e de evolucao ωt sao
independentes ao longo do tempo, entre si e da informacao inicial θ0|D0. Para t = 1, 2, ...:
– θt e um vetor p-dimensional denominado vetor de estados;
– F′t e uma matriz n × p conhecida denominada matriz de design com variaveis
independentes;
– Gt e uma matriz p× p conhecida denominada matriz de evolucao dos estados;
– Vt e a matriz de covariancia associada ao erro observacional εt;
83
– Wt e a matriz de covariancia associada ao erro de evolucao ωt.
A equacao de observacao em (E.1a) relaciona o vetor de observacoes Yt ao parametro
de estado θt onde assume-se independencia entre si condicional a θt, dependendo somente
deste. A equacao de evolucao em (E.1b) e responsavel pela evolucao dos parametros de
estado atraves do tempo.
Denota-se por Dt = {Yt,Dt−1} o conjunto de informacoes disponıveis ate o instante
de tempo t em que D0 denota o conjunto de informacoes no instante inicial t = 0.
O modelo descrito em (E.1) e completamente especificado pela quadrupla
{F,G,V,W}t e pela distribuicao a priori Normal assumida para os parametros de estado
em (E.1c), onde m0 e C0 sao, respectivamente, a media e a matriz de covariancia dadas
para θ0 refletindo a incerteza do processo no instante inicial.
O erro εt e uma pertubacao aleatoria no processo de medida das observacoes Yt. Em
contraste, o erro de evolucao ωt influencia no desenvolvimento do sistema ao longo do
tempo. A suposicao de que estes erros sao independentes dentre e entre si, reforca a
distincao destas fontes de variacao estocastica.
E.2 Filtro de Kalman
Para a inferencia sobre a estrutura dos dados e previsao de observacoes futuras da
serie, emprega-se o filtro de Kalman (Kalman, 1960) que e um procedimento recursivo que
baseia-se nas informacoes disponıveis. Especificamente, no contexto do MLD, o processo
do Filtro de Kalman e resumido por:
– Distribuicao a posteriori no tempo t− 1:
θt−1|Dt−1 ∼ N(mt−1,Ct−1);
– Distribuicao a priori no tempo t:
θt|Dt−1 ∼ N(at,Rt),
onde at = Gtmt−1 e Rt = GtCt−1G′t + Wt;
84
– Previsao um passo a frente:
Yt|Dt−1 ∼ N(ft,Qt),
onde ft = F′tat e Qt = F′tRtFt + Vt;
– Distribuicao a posteriori no tempo t:
θt|Dt ∼ N(mt,Ct),
onde mt = at + Atet e Ct = Rt −AtQtA′t com At = RtFtQ
−1t e et = yt − ft.
A demonstracao e feita por inducao utilizando propriedades da distribuicao Normal
e pode ser encontrada na ıntegra em West e Harrison (1997).
E.3 Distribuicoes de Previsao
Para se fazer inferencia sobre Yt+k, para k ≥ 1, condicionado ao conhecimento
corrente Dt, sao necessarias as distribuicoes de θt+k|Dt e Yt+k|Dt. Estas, sao dadas
por:
– Distribuicao de estado k passos a frente:
θt+k|Dt ∼ N(at(k),Rt(k))
sendo definido recursivamente por:
at(k) = Gt+kat(k − 1) e Rt(k) = Gt+kRt(k − 1)G′t+k + Wt+k
com valores iniciais at(0) = mt e Rt(0) = Ct;
– Distribuicao de previsao k passos a frente:
Yt+k|Dt ∼ N(ft(k),Qt(k)),
onde ft = F′t+kat(k) e Qt(k) = F′t+kRt(k)Ft+k + Vt+k.
A demonstracao pode ser encontrada em West e Harrison (1997) e Petris et al. (2009).
85
E.4 Fatores de Desconto
A especificacao da magnitude de Wt e importante pois, controla a extensao da
variacao estocastica na evolucao do modelo e assim, determinam a estabilidade ao longo
do tempo. Na equacao de evolucao em (E.1b), Wt leva a um aumento da incerteza
ou a uma perda de informacao sobre o vetor de estado antecessor. Considerando um
MLD, a especificacao de Wt pode ser feita indiretamente atraves do uso de descontos.
Considerando o filtro para o MLD (secao E.2) onde Rt = V ar(θt|Dt−1) = Pt + Wt
e Pt = GtCt−1G′t. Sendo assim, Wt = Rt − Pt e Pt seria a covariancia caso nao
houvesse incerteza sobre a evolucao dos estados, i.e., Wt = 0p. Definindo δ de forma que
Rt = Pt/δ, pode-se interpretar δ como a percentagem de informacao que se atualiza de
t− 1 para t e entao:
Wt =1− δδ
Pt,
com δ ∈ (0, 1] denominado fator de desconto. Se δ = 1 entao, Wt = 0p e nao ha perda
de informacao na evolucao do estado θt−1 para θt, de forma que Cov(θt|Dt−1) = Pt. Ha
a possibilidade de utilizar multiplos fatores de desconto por meio da matriz de desconto
p× p definida por:
∆ = diag(δ−1/21 , ..., δ−1/2p ).
Assim, Rt = ∆GtCt−1G′t∆.
Na pratica, o valor do fator de desconto e frequentemente fixado, variando entre 0,8
e 0,99.
E.5 Esquema de Amostragem para MLD
Para lidar com Modelos Dinamicos em que a distribuicao a posteriori nao esteja
disponıvel analiticamente, e usual que se utilize metodos MCMC (secao D) decompondo
o esquema em 2 blocos:
(i) Amostragem dos estados condicionados aos parametros estaticos;
(ii) Amostragem dos parametros estaticos condicionados ao vetor de estados.
86
Em particular, nos MLD, o vetor de estados pode ser amostrado utilizando-se um
tipo de amostrador de Gibbs chamado Forward Filtering Backward Sampling (FFBS).
Proposto por Fruhwirth-Schnatter (1994) e Carter e Kohn (1994), o esquema FFBS
tem por objetivo amostrar, de forma eficiente, o vetor de estados de um MLD como
o apresentado em (E.1). O algoritmo consiste em amostrar o vetor de estados
conjuntamente utilizando as distribuicoes filtradas e suavizadas destes parametros. A
amostragem pode ser decomposta em 2 passos da seguinte maneira:
1. Forward Filtering:
Este passo consiste na inferencia dos parametros utilizando o filtro de Kalman
(Kalman, 1960) a partir das definicoes apresentadas na secao E.2.
2. Backward Sampling:
Este passo baseia-se na analise retrospectiva, a partir da decomposicao da
distribuicao a posteriori conjunta dos parametros de estado da seguinte forma:
p(θ0, ...,θT |DT ) = p(θT |DT )T∏t=0
p(θt|θt+1,Dt).
Pelo Teorema de Bayes, obtem-se para t = T − 1, ..., 0:
p(θt|θt+1,DT ) ∝ (θt+1|θt,DT )p(θt|DT ).
Especificamente no contexto do MLD, tem-se:
θt|DT ∼ N(ht,Ht),
onde ht = mt + CtG′t+1R
−1t+1(θt+1 − at+1) e Ht = Ct − CtG
′t+1R
−1t+1Gt+1Ct com
valores iniciais hT = mT e HT = CT .
E.6 MLD com Covariancias Estocasticas e
Aprendizado por Descontos
Na pratica, dificilmente se conhece a covariancia observacional Vt ao longo do tempo.
O MLD com covariancias estocasticas e aprendizado por descontos contorna esta situacao
87
utilizando um passeio aleatorio por meio de uma evolucao estocastica Beta-Gama para
a sequencia de precisao observacional V−1t . Neste contexto, suponha um MLD com a
restricao Vt = σ2t In e ϕt = 1/σ2
t sendo definido por:
Equacao de Observacao: Yt = F′tθt + εt, εt ∼ N(0n, σ2t In), (E.2a)
Equacao de Evolucao: θt = Gtθt−1 + ωt, ωt ∼ Tnt−1(0p,Wt), (E.2b)
Equacao de Precisao: ϕt = γtϕt−1/δ∗, γt ∼ Beta(κt, κt), (E.2c)
Informacao Inicial: θ0|D0 ∼ Tn0(m0,C0),
ϕ0|D0 ∼ G(n0/2, d0/2). (E.2d)
com κt = δ∗nt−1/2 e κt = (1 − δ∗)nt−1/2. O parametro δ∗ ∈ [0, 1] atua como um fator
de desconto, i.e., quanto maior seu valor, menor o choque aleatorio para a covariancia
observacional. Quando δ∗ = 1, a covariancia se torna constante, i.e., Vt = V, ∀t.
As hipoteses usuais de independencia definidas na secao E.1 permanecem, no entanto,
condicionais a Vt. Especificado o modelo, determina-se as equacoes de atualizacao por:
– Distribuicao a posteriori no tempo t− 1:
θt−1|Dt−1 ∼ Tnt−1(mt−1,Ct−1) e ϕt−1|Dt−1 ∼ G(nt−1/2, dt−1/2);
– Distribuicao a priori no tempo t:
θt|Dt−1 ∼ Tnt−1(at,Rt) e ϕt|Dt−1 ∼ G(δ∗nt−1/2, δ∗dt−1/2),
onde at = Gtmt−1 e Rt = GtCt−1G′t + Wt;
– Previsao um passo a frente:
Yt|Dt−1 ∼ Tδ∗nt−1(ft,Qt),
onde ft = F′tat e Qt = F′tRtFt + St−1In com St−1 = dt−1/nt−1;
– Distribuicao a posteriori no tempo t:
θt|Dt ∼ N(mt,Ct) e ϕt|Dt ∼ G(nt/2, dt/2),
onde mt = at+Atet e Ct = (St/St−1)Rt−AtQtA′t com At = RtFtQ
−1t , et = yt−ft,
nt = δ∗nt−1 + 1, dt = δ∗dt−1 + St−1e′tQtet e St = dt/nt.
88
O algoritmo FFBS pode ser aplicado de forma analoga a demonstrada na secao E.5.
O passo Backward Sampling para os parametros ϕt com t = T − 1, ..., 0 e dado por:
ϕt|DT ∼ G(n∗t/2, d∗t/2),
onde n∗t = (1− δ∗)nt + δ∗nt+1 e d∗t = n∗tS∗t com S∗t = ((1− δ∗)/St + δ∗/S∗t+1)
−1 e valores
iniciais n∗T = nT e d∗T = dT .
Para demonstracoes e mais informacoes acerca desta configuracao de MLD, consulte
West e Harrison (1997) e Prado e West (2010). Aplicacoes podem ser encontradas em
Liu et al. (2009). Para a estimacao sequencial da covariancia observacional Vt ao longo
do tempo sem a restricao apresentada em (E.2), veja Triantafyllopoulos (2002).
89