UNIVERSIDADE DO ESTADO DO RIO DE JANEIRO
Dezembro de 2009 ISSN 1413-9022 CCAADDEERRNNOOSS DDOO IIMMEE
SSéérriiee EEssttaattííssttiiccaa –– VVoolluummee 2277
Uso dos Modelos Previvazm e Previvaz para Previsão de Afluências Mensais aos Aproveitamentos Hidroelétricos Tucuruí e Curuá-Una Maria Teresa Chico Rivera Quintão; Saulo Aires de Souza; Fernanda da Serra Costa; Jorge Machado Damázio
1
Cálculo do NMA do Gráfico de Controle de Regressão Danilo Cuzzuol Pedrini; Carla Schwengber ten Caten
13
Previsão do Preço de Venda da Uva Itália e da Manga Tommy Produzidas no Vale do São Francisco via Análise de Séries Temporais: um Estudo de Caso Abdinardo Moreira Barreto de Oliveira; Marcelo José Vieira de Melo Sobrinho
29
A Utilização de Gráficos de Controle de Soma Acumulada (CUSUM) para Monitoramento de um Processo de Usinagem Custodio da Cunha Alves; Altair Carlos Cruz; Elisa Henning; Arnoldo Schmidt Neto
45
UNIVERSIDADE DO ESTADO DO RIO DE JANEIRO
apoio
CADERNOS DO IME
Série Estatística
Publicação semestral, com circulação em junho e dezembro, do Instituto de Matemática e Estatística (IME), da Universidade do Estado do Rio de Janeiro (UERJ). Ricardo Vieiralves de Castro Reitor Maria Christina Paixão Maioli Vice-Reitora Maria Georgina Muniz Washington Diretora do Centro de Tecnologia e Ciência Sérgio Luiz Silva Diretor do Instituto de Matemática e Estatística Geraldo Magela da Silva Vice- Diretor do Instituto de Matemática e Estatística Normalização, divulgação e distribuição: Biblioteca do Centro de Ciências de Tecnologia A (CTC/A) da rede Sirius de Biblioteca da UERJ – [email protected] Editor: Prof. Dr. José Fabiano da Serra Costa - UERJ Corpo Editorial: Prof. Dr. Albert Cordeiro Geber de Melo - CEPEL Prof. Dr. Annibal Parracho Sant’Anna - UFF Prof. Dr. Carlos Alberto Nunes Cosenza - UFRJ Prof. Dra. Fernanda da Serra Costa - UERJ Prof. Dr. Fernando Antonio Lucena Aiube - PUC-RJ/PETROBRAS Prof. Dr. Helder Gomes Costa - UFF Prof. Dr. Jorge Machado Damázio - UERJ Prof. Dr. Luis Felipe Dias Lopes - UFSM Os artigos enviados para publicação deverão ser inéditos, com exceção de resumos ou teses, são de responsabilidade de seus autores, e não refletem, necessariamente, a opinião do IME. Sua reprodução é livre, em qualquer outro veículo de comunicação, desde que citada a fonte.
Dezembro de 2009 ISSN 1413-9022 CCAADDEERRNNOOSS DDOO IIMMEE
SSéérriiee EEssttaattííssttiiccaa –– VVoolluummee 2277
Uso dos Modelos Previvazm e Previvaz para Previsão de Afluências Mensais aos Aproveitamentos Hidroelétricos Tucuruí e Curuá-Una Maria Teresa Chico Rivera Quintão; Saulo Aires de Souza; Fernanda da Serra Costa; Jorge Machado Damázio
1
Cálculo do NMA do Gráfico de Controle de Regressão Danilo Cuzzuol Pedrini; Carla Schwengber ten Caten
13
Previsão do Preço de Venda da Uva Itália e da Manga Tommy Produzidas no Vale do São Francisco via Análise de Séries Temporais: um Estudo de Caso Abdinardo Moreira Barreto de Oliveira; Marcelo José Vieira de Melo Sobrinho
29
A Utilização de Gráficos de Controle de Soma Acumulada (CUSUM) para Monitoramento de um Processo de Usinagem Custodio da Cunha Alves; Altair Carlos Cruz; Elisa Henning; Arnoldo Schmidt Neto
45
USO DOS MODELOS PREVIVAZM E PREVIVAZ PARA PREVISÃO DE AFLUÊNCIAS MENSAIS AOS
APROVEITAMENTOS HIDROELÉTRICOS TUCURUÍ E CURUÁ-UNA
Maria Teresa Chico Rivera Quintão
ELETRONORTE Centrais Elétricas do Norte do Brasil [email protected]
Saulo Aires de Souza
CEPEL Centro de Pesquisas de Energia Elétrica [email protected]
Fernanda da Serra Costa
CEPEL Centro de Pesquisas de Energia Elétrica UERJ Universidade do Estado do Rio de Janeiro
Jorge Machado Damázio
CEPEL Centro de Pesquisas de Energia Elétrica UERJ Universidade do Estado do Rio de Janeiro
Resumo
O planejamento da operação de aproveitamentos hidroelétricos envolve a obtenção e
previsões de afluências para diferentes horizontes e discretização temporal. Em tempo
real podem ser necessárias previsões a nível horário para o horizonte de 24 horas,
enquanto que para um planejamento de médio prazo utiliza-se a previsão de afluências
mensais com horizonte de alguns meses, sendo o maior interesse na previsão para o
próximo mês. Para o último caso, a abordagem de modelagem clássica, consiste em se
adotar um modelo estatístico que considere os efeitos da sazonalidade climática e da
tendência hidrológica, como é o caso dos modelos auto-regressivos e média móvel
adotados nos modelos PREVIVAZM e PREVIVAZ. Este artigo apresenta um estudo do
uso do modelo PREVIVAZM para prever as afluências mensais um passo a frente para
os aproveitamentos hidroelétricos de Tucuruí e Curuá-Una acoplado ao uso do
PREVIVAZ para completar o total afluente do mês em curso.
Palavras-chave: Planejamento da Operação de Hidroelétricas, Previsão de Afluências,
Modelos Estocásticos.
CADERNOS DO IME – Série Estatística Universidade do Estado do Rio de Janeiro - UERJ
Rio de Janeiro – RJ - Brasil ISSN 1413-9022 / v. 27, p. 01 - 12, 2009
Cadernos do IME – Série Estatística Uso dos Modelos Previvazm e Previvaz...
2
1. Introdução
O planejamento da operação de aproveitamentos hidroelétricos envolve a
obtenção e previsões de afluências para diferentes horizontes e discretização temporal.
Em tempo real podem ser necessárias previsões a nível horário para o horizonte de 24
horas, enquanto que para um planejamento de médio prazo utiliza-se a previsão de
afluências mensais com horizonte de alguns meses, sendo o maior interesse na previsão
para o próximo mês. Para o último caso, a abordagem de modelagem clássica, consiste
em se adotar um modelo estatístico que considere os efeitos da sazonalidade climática e
da tendência hidrológica, como é o caso dos modelos auto-regressivos e média móvel
utilizados adotados nos modelos PREVIVAZM e PREVIVAZ (COSTA et al, 2007).
Quando a tendência hidrológica é utilizada uma dificuldade é a sua atualização a
partir dos dados mais recentes de afluência. Em geral, no momento de realização da
previsão, a vazão correspondente ao último intervalo de tempo da tendência hidrológica
ainda não está disponível, por exemplo, quando se deseja prever a afluência do mês
seguinte antes do mês corrente terminar. Uma forma de estimar a vazão do mês em
curso consiste em utilizar previsões a intervalos de tempo menores para o mês.
Este artigo apresenta um estudo do uso do modelo PREVIVAZM para prever as
afluências mensais um passo a frente para os aproveitamentos hidroelétricos de Tucuruí
e Curuá-Una acoplado ao uso do PREVIVAZ para completar o total afluente do mês em
curso.
2. Modelos PREVIVAZ e PREVIVAZM
Os modelos PREVIVAZ e PREVIVAZM utilizam o componente determinístico
de modelos de séries temporais que representam tanto o comportamento sazonal do
clima quanto a tendência hidrológica, esta ultima conhecida na terminologia de séries
temporais como estrutura de dependência temporal. Essencialmente, qualquer estrutura
de dependência temporal sazonal pode ser reproduzida por modelos de séries temporais
lineares do tipo PARMA(p,q), sendo este tipo de modelo uma abordagem bastante
flexível, e bastante popular para a modelagem estocástica de vazões fluviais (HIPEL e
MCLEOD, 1994). O PREVIVAZ e o PREVIVAZM utilizam modelos lineares do tipo
PARMA(p,q) (BOX & JENKINS, 1970), acoplado a diferentes pré-transformações das
séries históricas, tipo Box&Cox ou logarítmicas (BOX & COX, 1964) e a diferentes
Cadernos do IME – Série Estatística Quintão, Souza, Costa & Damázio
3
formas de estimação de parâmetros dos modelos, para obtenção de previsões de vazões
semanais e mensais respectivamente.
Nos modelos PREVIVAZ, e PREVIVAZM os algoritmos de previsão, definidos
por um modelo, método de estimação específico e transformação da série de vazões, são
testados por um esquema onde cada série é dividida em duas partes. Inicialmente,
apenas a primeira parte da série é utilizada para a estimação dos parâmetros (estimação)
e a segunda parte apenas para o cálculo de erros de previsão (verificação). Em seguida,
a estimação dos parâmetros passa a ser feita com a segunda parte da série, ficando a
primeira parte apenas para cálculo de erros de previsão. Para cada parte da série é
computado o erro padrão de previsão (raiz quadrada da média dos quadrados dos erros
de previsão - EQM) um passo à frente obtendo-se, a seguir, a média dos dois valores. A
cada semana/mês escolhe-se o algoritmo de menor erro médio quadrático de previsão
um passo a frente.
3. Metodologia Adotada
Para a avaliação do uso dos modelos PREVIVAZ e PREVIVAZM simulou-se a
obtenção de previsões mensais um passo a frente considerando-se quatro situações:
1- a vazão do mês corrente é conhecida (situação mais favorável, considerada como controle),
2- desconsidera-se todas as informações do mês corrente e utiliza-se o PREVIVAZM para fazer a previsão dois passos a frente (situação mais desfavorável),
3- a vazão do mês corrente é estimada, de forma expedita pela média das vazões diárias já registradas no mês,
4- a vazão do mês corrente é formada pelas vazões semanais observadas do mês corrente, com excessão da vazão da última semana que é obtida pelo modelo PREVIVAZ.
As previsões foram comparadas com os valores observados através da média do
erro percentual absoluto para todo o período disponível e para os períodos úmido, seco,
e de transição.
4. Estudo de Caso
O aproveitamento hidroelétrico de Tucuruí, inaugurado em 1985, está localizado
na região Norte do País, imediatamente a montante da cidade de Tucuruí as margens rio
Tocantíns. O rio Tocantíns nasce no Planalto Central Brasileiro e tem sua foz no
Cadernos do IME – Série Estatística Uso dos Modelos Previvazm e Previvaz...
4
estuário do rio Amazonas. A área da bacia de captação é de aproximadamente 758.000
km2 e a afluência média ao local do aproveitamento é 11.000 m3/s. O volume útil de
seu reservatório é de 38.982 hm3. A potência instalada é 8.370 MW.
O aproveitamento hidroelétrico de Curuá-Una localizado também na região
Norte do País, à 70 Km ao sul da cidade de Santarém, no rio Curuá-Una afluente da
margem direita do rio Amazonas, a área de drenagem associada é de 153.000 km2 e a
afluência média ao local do aproveitamento é 188 m3/s. Foi inaugurado em 1977 e
interligado ao aproveitamento de Tucuruí em 1999. Seu reservatório possui um volume
útil de 400 hm3. A potência instalada é 30 MW.
Estavam disponíveis, para os dois aproveitamentos, séries históricas de vazões
mensais e diárias abrangendo o período de 1931 à 2006. As figuras 1 e 2 apresentam
hidrogramas das vazões mensais para alguns anos do histórico para os aproveitamentos
de Tucuruí e Curuá-Una, respectivamente. Pode-se observar que nos dois casos o
regime hidrológico é bem definido com estação seca ocorrendo entre os meses de Julho
e Novembro para Tucuruí e entre os meses de Setembro e Dezembro para Curuá-Una e
estação úmida ocorrendo entre os meses de Fevereiro e Abril para Tucuruí e entre os
meses de Março e Junho para Curuá-Una.
Figura 1. Hidrogramas de vazões mensais - Tucuruí
HIDROGRAMA DE VAZÕES MENSAIS - TUCURUÍ
0
10000
20000
30000
40000
50000
60000
MES
VA
ZÃ
O (m
³/s)
1931-1933 1944-1946 1956-1958 1962-1964 1973-1975 1985-1987 1997-1999 2005-2007
Cadernos do IME – Série Estatística Quintão, Souza, Costa & Damázio
5
Figura 2. Hidrogramas de vazões mensais - Curuá-Uma
HIDROGRAMA DE VAZÕES MENSAIS - CURUÁ-UNA
0
100
200
300
400
500
600
700
800
900
MES
VA
ZÃ
O (m
³/s)
1931-1933 1944-1946 1956-1958 1962-1964 1973-1975 1985-1987 1997-1999 2005-2007
A partir das séries históricas de vazões diárias foram construídas séries de
vazões semanais, considerando as semanas do PMO (Programa Mensal de Operação),
necessárias para aplicação do modelo PREVIVAZ na situação 4, descrita no item 3. O
período de 1931 a 1995 foi utilizado para a estimação dos parâmetros dos modelo
PREVIVAZM e PREVIVAZ. A simulação das previsões de afluências mensais foi feita
para o período de 2004 a 2006, que corresponde ao período de disponibilidade das
estimativas expeditas da situação 3 descrita no item 3.
5. Resultados
- Caso Tucuruí
Na figura 3 são comparadas as previsões mensais obtidas nas quatro situações
com as vazões observadas. Na figura 4 são apresentados os erros percentuais absolutos
das previsões mensais obtidas em cada situação. Pode-se observar que a situação 1 é
que fornece as melhores previsões e a situação 2, conforme esperado, é a que fornece as
piores previsões. As situações 3 e 4 são similares e se aproximam da situação 1.
Cadernos do IME – Série Estatística Uso dos Modelos Previvazm e Previvaz...
6
Figura 3. Comparação entre a vazão mensal observada e prevista - Tucuruí
0
5000
10000
15000
20000
25000
30000
35000
40000
JAN
ABRJU
LO
UTJA
NABR
JUL
OUT
JAN
ABRJU
LO
UT
TEMPO (MES)
VA
ZÃ
O (
m³/
s)
vazão mensal observada vazão mensal prevista - tipo 1
0
5000
10000
15000
20000
25000
30000
35000
40000
JAN
ABRJU
LO
UTJA
NABR
JUL
OUT
JAN
ABRJU
LO
UT
TEMPO (MES)
VA
ZÃ
O (
m³/
s)
vazão mensal observada vazão mensal prevista - tipo 3 SITUAÇÃO 1 SITUAÇÃO 3
0
5000
10000
15000
20000
25000
30000
35000
40000
JAN
ABRJU
LOUT
JAN
ABRJU
LOUT
JAN
ABRJU
LOUT
TEMPO (MES)
VA
ZÃ
O (
m³/
s)
vazão mensal observada vazão mensal prevista - tipo 2
SITUAÇÃO 2
0
5000
10000
15000
20000
25000
30000
35000
40000
JAN
ABRJU
LOUT
JAN
ABRJU
LOUT
JAN
ABRJU
LOUT
TEMPO (MES)
VA
ZÃ
O (
m³/
s)
vazão mensal observada vazão mensal prevista - tipo 4
SITUAÇÃO 4
Figura 4. Erros Percentuais Absolutos da previsão da vazão mensal – Tucuruí
0
10
20
30
40
50
60
70
80
JAN
MAR
MAI
JUL
SETNO
VJA
NM
ARM
AIJU
LSET
NOV
JAN
MAR
MAI
JUL
SETNO
V
TEMPO (MES)
ER
RO
AB
SO
LU
TO
(%
)
Situação 1 Situação 2 Situação 3 Situação 4
Cadernos do IME – Série Estatística Quintão, Souza, Costa & Damázio
7
A figura 5 compara as distribuições de freqüência dos erros percentuais
absolutos das previsões de afluências mensais de cada situação. Pode-se observar que a
maior proximidade da distribuição de freqüência da situação 4 à curva da situação 1.
Figura 5 – Distribuições de freqüência dos erros percentuais absolutos da previsão de afluência mensal - Tucuruí
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 10 20 30 40 50 60 70 80
ERRO ABSOLUTO (%)
FR
EQ
UE
NC
IA D
E N
ÃO
-EX
CE
DE
NC
IA
Situação 1 Situação 2 Situação 3 Situação 4
A tabela 1 apresenta as médias dos erros percentuais absolutos das previsões
mensais para cada mês do ano, para os períodos seco, úmido e de transição e para o ano
todo para cada uma das quatro situações.
Tabela 1 – Média dos erros percentuais absolutos para Tucuruí
MÊS SITUAÇÃO
1 2 3 4 JAN 9,73 36,69 8,98 6,01
FEV 27,33 27,04 30,82 27,28
MAR 8,22 12,82 14,08 15,46
ABR 15,98 23,61 25,53 23,76
MAI 14,31 20,01 14,73 14,13
JUN 18,35 25,55 25,98 23,63
JUL 4,71 25,64 14,57 5,92
AGO 9,56 19,42 14,53 13,29
SET 9,41 38,58 8,65 9,81
OUT 7,05 36,69 7,46 6,05
NOV 18,00 49,83 16,42 23,20
DEZ 35,82 27,27 37,39 26,12
Cadernos do IME – Série Estatística Uso dos Modelos Previvazm e Previvaz...
8
PERÍODO
JUL-NOV (SECO) 9,75 34,03 12,33 11,65
FEV-ABR (ÚMIDO) 17,18 21,16 23,48 22,17
MAI-JUN (TRANS UMIDO-SECO) 16,33 22,78 20,36 18,88
DEZ-JAN (TRANS SECO-UMIDO) 22,78 31,98 23,18 16,07
JAN-DEZ 14,87 28,60 18,26 16,22
Observa-se que para a maioria dos meses e para todos os períodos a situação 1,
conforme esperado, apresentou os menores valores. A situação 4 aparece como a melhor
alternativa viável na maioria dos meses e em todos os períodos.
- Caso Curuá-Una
Na figura 6 são comparadas as previsões mensais obtidas nas quatro situações
com as vazões observadas.
Figura 6 – Comparação entre a vazão mensal observada e prevista – Curuá-Uma
0
100
200
300
400
500
600
700
800
900
JAN
MA
R
MA
I
JUL
SE
T
NO
V
JAN
MA
R
MA
I
JUL
SE
T
NO
V
JAN
MA
R
MA
I
JUL
SE
T
NO
V
TEMPO (MES)
VA
ZÃ
O (
m³/
s)
vazão mensal observada vazão mensal prevista - tipo 1
0
100
200
300
400
500
600
700
800
900
JAN
MA
R
MA
I
JUL
SE
T
NO
V
JAN
MA
R
MA
I
JUL
SE
T
NO
V
JAN
MA
R
MA
I
JUL
SE
T
NO
V
TEMPO (MES)
VA
ZÃ
O (
m³/
s)
vazão mensal observada vazão mensal prevista - tipo 3 SITUAÇÃO 1 SITUAÇÃO 3
0
100
200
300
400
500
600
700
800
900
JAN
MA
R
MA
I
JUL
SE
T
NO
V
JAN
MA
R
MA
I
JUL
SE
T
NO
V
JAN
MA
R
MA
I
JUL
SE
T
NO
V
TEMPO (MES)
VA
ZÃ
O (
m³/
s)
vazão mensal observada vazão mensal prevista - tipo 2
0
100
200
300
400
500
600
700
800
900
JAN
MA
R
MA
I
JUL
SE
T
NO
V
JAN
MA
R
MA
I
JUL
SE
T
NO
V
JAN
MA
R
MA
I
JUL
SE
T
NO
V
TEMPO (MES)
VA
ZÃ
O (
m³/
s)
vazão mensal observada vazão mensal prevista - tipo 4
SITUAÇÃO 2 SITUAÇÃO 4
Cadernos do IME – Série Estatística Quintão, Souza, Costa & Damázio
9
Na figura 7 são apresentados os erros percentuais absolutos das previsões
mensais obtidas em cada situação. Novamente, pode-se observar que a situação 1 é que
fornece as melhores previsões e a situação 2, mais uma vez, é a que fornece as piores
previsões. As situações 3 e 4 são similares e se aproximam da situação 1.
Figura 7 – Erros Percentuais Absolutos da previsão da vazão mensal – Curuá-Una
0
10
20
30
40
50
60
70
80
JAN
MAR
MAI
JUL
SETNO
VJA
NM
ARM
AIJU
LSET
NOV
JAN
MAR
MAI
JUL
SETNO
V
TEMPO (MES)
ER
RO
AB
SO
LU
TO
(%
)
Situação 1 Situação 2 Situação 3 Situação 4
A figura 8 compara as distribuições de freqüência dos erros percentuais
absolutos das previsões de afluências mensais de cada situação.
Figura 8 – Distribuições de freqüência dos erros percentuais absolutos da previsão de afluência mensal – Curuá-Una
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 10 20 30 40 50 60 70 80
ERRO ABSOLUTO (%)
FR
EQ
UE
NC
IA D
E N
ÃO
-EX
CE
DE
NC
IA
Situação 1 Situação 2 Situação 3 Situação 4
Cadernos do IME – Série Estatística Uso dos Modelos Previvazm e Previvaz...
10
Pode-se observar que a maior proximidade da distribuição de freqüência da
situação 3 à curva da situação 1 para erros menores que 20%. Para os erros maiores a
situação 4 é a que mais se aproxima da situação 1.
A tabela 2 apresenta as médias dos erros percentuais absolutos das previsões
mensais para cada mês do ano, para os períodos seco, úmido e de transição e para o ano
todo para cada uma das quatro situações. Observa-se que para a maioria dos meses e
para todos os períodos a situação 1, conforme esperado, apresentou os menores valores.
As situações 3 e 4 aparece como equivalentes.
Tabela 2 – Média dos erros percentuais absolutos para Curuá-Una
MÊS SITUAÇÃO
1 2 3 4 JAN 25,74 49,41 26,18 31,88 FEV 35,83 27,54 37,57 32,29 MAR 12,77 30,19 20,97 17,66 ABR 4,29 24,47 3,04 15,17 MAI 32,47 30,02 35,41 27,55 JUN 17,42 46,16 21,10 18,95 JUL 9,57 38,58 8,37 10,90 AGO 7,52 28,33 9,07 7,84 SET 10,38 27,72 12,18 9,65 OUT 3,14 24,03 1,49 12,53 NOV 11,13 29,77 7,67 13,90 DEZ 30,50 21,04 28,09 20,98
PERÍODO SET-DEZ (SECO) 13,79 25,64 12,36 14,27
MAR-JUN (ÚMIDO) 16,74 32,71 20,13 19,83 JAN-FEV (TRANS UMIDO-SECO) 8,54 33,46 8,72 9,37 JUL-AGO (TRANS SECO-UMIDO) 30,79 38,47 31,87 32,08
JAN-DEZ 16,73 31,44 17,60 18,27
6. Conclusões
Foi apresentada neste artigo uma aplicação do modelo PREVIVAZM com o
objetivo de obtenção de previsões de afluências médias mensais um passo a frente para
os aproveitamentos hidroelétricos de Tucuruí e Curuá-Una, onde se comparou a
situação ideal, na qual a vazão do mês em curso é conhecida (situação 1), com três
formas de estimar esta vazão:
Situação 2: desconsideram-se todas as informações do mês corrente e utiliza-se o
PREVIVAZM para fazer a previsão dois passos a frente (situação mais desfavorável),
Cadernos do IME – Série Estatística Quintão, Souza, Costa & Damázio
11
Situação 3: a vazão do mês corrente é estimada, de forma expedita pela média
das vazões diárias já registradas no mês,
Situação 4: a vazão do mês corrente é formada pelas vazões semanais
observadas do mês corrente, com excessão da vazão da última semana que é obtida pelo
modelo PREVIVAZ.
No caso de Tucuruí o uso do modelo PREVIVAZ (situação 4) mostrou-se
levemente superior a situação 3. No caso Curuá-Una as situações 3 e 4 para o ano todo
foram equivalentes.
Referências
COSTA, F.S., MACEIRA, M.E.P., DAMÁZIO, J.M., (2007), Modelos de Previsão Hidrológica Aplicados ao Planejamento da Operação do Sistema Elétrico Brasileiro, Revista Brasileira de Recursos Hídricos, vol. 12, nº 3, pgs 21-30.
HIPEL, K.W. A.; MACLOAD, I.; Time Series Modelling of Water Resources and Environmental Systems, Elsevier, 1994.
BOX G.E.P., COX, D.R., An Analysis of Transformations, Journal of the Royal Statistical Society, A127, pgs 211-252, 1964.
BOX, G. E. P., JENKINS, G. M., Time Series Analysis-Forecasting and Control, Holden-Day, 1970.
Cadernos do IME – Série Estatística Uso dos Modelos Previvazm e Previvaz...
12
USE OF PREVIVAZM AND PREVIVAZ MODELS FOR FORECASTING MONTHLY INFLOWS TO TUCURUÍ
AND CURUÁ-UNA HYDROPOWER PLANTS
Abstract
Planning the operation of hydroelectric plants involves the acquisition of inflow
forecasts for different time horizons and discretization. For real time planning, in
general, it needs inflow forecasts for each hour for a time horizon of 24 hours, while for
a medium-term planning, it is used a monthly time discretization aiming at time horizon
of a few months, where the main interest is the anticipation for next month. For the
latter case, the classical modeling approach is to adopt a statistical model that
considers the effects of seasonal climate and hydrological trend, such as the auto-
regressive and moving average formulations used in the PREVIVAZM and PREVIVAZ
models. This article presents a study of the use of PREVIVAZM model to forecast the
monthly inflow one step forward for the Tucuruí and Curua Una hydroelectric plants
coupled with the use of PREVIVAZ in order to complete the total inflow in the current
month.
Key words: Hydropower plant operation planning, Inflow forecasting,, Stochastic
Modelling
CÁLCULO DO NMA DO GRÁFICO DE CONTROLE DE REGRESSÃO
Danilo Cuzzuol Pedrini PPGEP/UFRGS
Carla Schwengber ten Caten
PPGEP/UFRGS [email protected]
Resumo
Para a aplicação dos gráficos de controle (GCs), é necessário supor que os dados
sejam independente e identicamente distribuídos, quando estas suposições não são
satisfeitas o desempenho dos GCs é insatisfatório. Em algumas situações, como quando
ocorrem muitas modificações nas variáveis de controle, essas suposições podem não
ser satisfeitas. Alternativamente, existe o gráfico de controle de regressão, que consiste
no ajuste de um modelo de regressão que relacione a característica de qualidade às
variáveis de controle e o posterior monitoramento da mesma em relação ao valor
previsto pelo modelo. Este artigo utiliza a simulação de Monte Carlo para obter o
Número Médio de Amostras (NMA) para o gráfico de controle de regressão
apresentado por Pedrini et al. (2008), além de comparar com outros gráficos similares
encontrados na literatura. Os resultados encontrados mostram que o gráfico de
controle de regressão apresenta um desempenho satisfatório, sobretudo quando
comparado com os demais gráficos.
Palavras-chave: Gráfico de Controle de Regressão; NMA; Método de Monte Carlo.
CADERNOS DO IME – Série Estatística Universidade do Estado do Rio de Janeiro - UERJ
Rio de Janeiro – RJ - Brasil ISSN 1413-9022 / v. 27 p. 13 - 27, 2009
Cadernos do IME – Série Estatística Cálculo do NMA do Gráfico de Controle...
14
1. Introdução
Os gráficos de controle são o principal destaque dentre as ferramentas do CEP,
devido principalmente à sua simplicidade operacional e efetividade na detecção de
problemas no processo, sendo utilizadas com sucesso no monitoramento do
desempenho dos mais diversos processos industriais. De acordo com Montgomery
(2004), a utilização dos gráficos de controle requer que os dados monitorados sejam
independentes e identicamente distribuídos.
Estas suposições podem não ser satisfeitas quando há alterações no ajuste das
variáveis de controle do processo, pois nesse caso, ocorre uma alteração na média e/ou
variabilidade dos dados, alterando conseqüentemente a distribuição destes. Nesse caso,
seria necessário um gráfico de controle para cada ajuste, o que em muitos casos pode
não ser possível devido ao baixo número de amostras disponíveis em cada ajuste do
processo. Para esta situação, a característica de qualidade de um produto ou processo
pode ser melhor representada pelo seu relacionamento com as variáveis de controle do
processo (JACOBI et al.., 2002; SHU et al.., 2007).
Para solucionar este problema, Mandel (1969) propôs o gráfico de controle de
regressão, que consiste na combinação das técnicas de gráfico de controle e modelos de
regressão linear. Este gráfico de controle, somente pode ser aplicado em processos que
apresentem uma variável de controle, inviabilizando a aplicação em vários processos
industriais. Para solucionar este viés, Haworth (1996) propôs o gráfico de controle de
regressão múltipla, que permite o monitoramento de processos que apresentem mais de
uma variável de controle.
Recentemente, Pedrini et al.. (2008) propuseram uma modificação ao gráfico de
controle de regressão múltipla de Haworth (1996), apresentando também uma
sistemática para aplicação deste gráfico de controle. Estes autores não apresentaram
estudos de sensibilidade do gráfico proposto às alterações no processo.
Dessa forma, o presente trabalho tem como objetivo obter o Número Médio de
Amostras (NMA) para o gráfico de controle de regressão proposto por Pedrini et al..
(2008), além de comparar o desempenho deste gráfico com outros gráficos similares
encontrados na literatura.
Cadernos do IME – Série Estatística Pedrini & Caten
15
2. Revisão Bibliográfica
2.1 Gráfico de Controle de Regressão
De acordo com Cai et al. (2002) e Montgomery (2004), o gráfico de controle de
regressão pode ser utilizado para monitorar processos que apresentem tendências, que
ocorrem devido à interferência de variáveis de controle do processo, como por exemplo,
o desgaste de ferramentas. Loredo at al. (2003) e Montgomery (2004) também apontam
o uso do gráfico de controle de regressão em processos autocorrelacionados, pois se o
conjunto apropriado de variáveis de controle for inserido no modelo de regressão, os
resíduos serão não-correlacionados, mesmo que a variável resposta seja correlacionada.
Para o gráfico de controle de regressão, o valor ótimo para a característica de
qualidade é representado pelo valor estimado pelo modelo, dados os valores das
variáveis de controle. Dessa forma, a linha central deste gráfico é o valor previsto pelo
modelo estimado e os limites de controle são posicionados paralelamente afastados k
desvios-padrão da LC, conforme equações (1), (2) e (3).
(1)
(2)
(3)
onde
O valor da constante k utilizado varia entre 2 e 3, conforme a sensibilidade e
taxa de alarmes falsos desejada para o gráfico de controle de regressão. A estimativa do
desvio-padrão do gráfico de controle de regressão é dada pelo desvio-padrão do modelo
de regressão estimado (MANDEL, 1969; JACOBI et al.., 2002), conforme equação (4).
(4)
onde
O procedimento proposto por Mandel (1969) restringe-se a modelos de
regressão linear simples, ou seja, processos que apresentem apenas uma variável de
controle. Dessa forma, Haworth (1996) modificou o gráfico de controle de regressão de
forma a poder ser utilizado em processos que apresentem mais de uma variável de
controle significativa para explicar a característica de qualidade.
O procedimento proposto por Haworth (1996) consiste no monitoramento dos
resíduos padronizados do modelo. Os limites de controle e linha central para o gráfico
Cadernos do IME – Série Estatística Cálculo do NMA do Gráfico de Controle...
16
de controle de regressão múltipla proposto por Haworth (1996) são baseados no valor
da estatística t, com nível de significância α/2 e n-p graus de liberdade.
Loredo et al. (2002) e Shu et al. (2004) também propuseram alternativas que
permitem o uso de modelos de regressão linear múltipla. No primeiro trabalho, utiliza-
se a amplitude móvel dos resíduos para estimar o desvio-padrão do gráfico de controle
de regressão. Shu et al. (2004) apresentam o gráfico EWMAREG, que consiste no
monitoramento dos resíduos padronizados através de um gráfico de controle de médias
móveis exponencialmente ponderadas. Os procedimentos apresentados por Haworth
(1996), Loredo et al. (2002) e Shu et al. (2004) apresentam a vantagem adicional de
preservar a ordem temporal dos dados, o que permite a realização de todos os testes de
estabilidade apresentados em Montgomery (2004).
Pedrini et al. (2008) modificaram o gráfico de controle de regressão múltipla, de
forma a possibilitar o monitoramento direto da característica de qualidade, ao invés do
monitoramento dos resíduos padronizados. Esta modificação proposta pelos autores visa
facilitar a aplicação do gráfico de controle em processos produtivos, já que o conceito
de resíduos não é de fácil assimilação por parte dos operadores do processo. Os limites
de controle para o gráfico de controle de regressão proposto por Pedrini et al. (2008) são
apresentados nas equações (5), (6) e (7).
(5)
(6)
(7)
onde
O termo dentro da raiz é um fator de correção para o intervalo de confiança para
a previsão do modelo de regressão, já que hii é penalização para o afastamento das
variáveis de controle em relação ao centro do elipsóide formado por todos os valores
das variáveis de controle utilizadas para estimar o modelo de regressão. Ressalta-se que
à medida que os dados utilizados se afastam do centro deste elipsóide, a qualidade da
previsão do modelo piora.
Alguns exemplos de aplicação do gráfico de controle de regressão são
apresentados por Rothschild e Roth (1986), Olin (1998), Omura e Steffe (2003) e
Casarin et al. (2007).
Cadernos do IME – Série Estatística Pedrini & Caten
17
Também são encontrados na literatura alguns procedimentos similares ao gráfico
de controle de regressão, como: o gráfico de controle para seleção de causas, proposto
por Zhang (1985), o gráfico de controle baseados em variáveis ajustadas por modelos de
regressão de Hawkins (1991) e os procedimentos para monitoramento de perfis lineares,
estudados inicialmente por Kang e Albin (2000).
2.2 Número Médio de Amostra
A efetividade na detecção de causas especiais está diretamente ligada à escolha
dos limites de controle, do intervalo de amostragem, do tamanho da amostra e da
escolha das regras sensibilizantes. Segundo Costa et al.. (2005), uma medida de
sensibilidade de um gráfico de controle é o número médio de amostras até o sinal
(NMA), que é o número de amostras que devem ser coletadas até que o processo
indique uma condição de processo fora de controle.
Quando o processo está sob controle estatístico, o NMA0 indica o número médio
de pontos necessários para a ocorrência do primeiro alarme falso do gráfico de controle.
Quando o processo está fora de controle, o NMA1 indica o número de amostras
necessárias para a detecção da ocorrência da alteração na estatística monitorada
(COSTA et al., 2005).
Assim, quando se projeta um gráfico de controle, deseja-se que o NMA0 seja o
maior possível, pois este é um indício de que serão necessárias poucas interrupções no
processo quando este está sob controle estatístico, e que o NMA1 seja o menor valor
possível, já que este valor está diretamente relacionado ao tempo necessário para a
detecção de uma causa especial (MONTGOMERY, 2004; COSTA et al.., 2005). De
forma geral, para um gráfico de controle de Shewhart, o NMA0 pode ser expresso como
o inverso da probabilidade de um ponto estar fora de controle, conforme equação (8).
α
10 =NMA (8)
O NMA1 pode ser escrito em função da probabilidade de erro tipo II, que é a
probabilidade do gráfico não detectar uma alteração na estatística monitorada quando o
processo está fora de controle estatístico (MONTGOMERY, 2004).
β−=
1
11NMA (9)
Cadernos do IME – Série Estatística Cálculo do NMA do Gráfico de Controle...
18
Quando a característica de qualidade monitorada apresenta distribuição
conhecida e independente, os valores de α e β podem ser obtidos pelo uso de simulação
de Monte Carlo ou de Cadeias de Markov.
3. Método Adotado para Simulação
O método de simulação de Monte Carlo será utilizado para calcular o NMA para
gráfico de controle de regressão proposto por Pedrini et al. (2008). Os resultados
obtidos serão comparados com os resultados do gráfico de controle de regressão
múltipla proposto por Haworth (1996) e para o gráfico de controle com limites
calculados através da amplitude móvel dos resíduos proposto por Loredo et al.. (2002).
Para maiores informações sobre o método de Monte Carlo, recomenda-se Bremaud
(1999) e Casella e Robert (2004). Em todos os casos utiliza-se o programa R para o
cálculo do NMA de cada método.
O primeiro passo da simulação consiste na geração da amostra a ser monitorada
pelos gráficos de controle que serão analisados. Dessa forma, gerou-se 5 mil dados para
cada variável de controle, com exceção de x2, que será simulada como sendo uma
variável discreta: serão gerados apenas os valores -1 e 1, sem incluir valores
intermediários. O restante das variáveis de controle, por serem contínuas, foram
modeladas segundo uma distribuição uniforme, cujos valores possuem a mesma
probabilidade de ocorrência,com valor mínimo de -1 e valor máximo de +1. Para
compor o erro aleatório, gera-se um vetor composto por 5 mil valores de uma
distribuição normal com média 0 e desvio-padrão 22,1.
Para a simulação de um processo sob controle, utiliza-se o modelo estimado na
Fase I do método proposto por Pedrini et al.. (2008) para gerar a previsão da
característica de qualidade dado cada conjunto de valores das variáveis de controle. A
seguir, soma-se o resíduo aleatório, de forma a constituir o valor simulado da
característica de qualidade.
No caso da simulação de um processo fora de controle, altera-se a equação do
modelo de regressão conforme a modificação desejada e, ao se somar os resíduos
aleatórios a este resultado, gera-se o vetor de valores simulados da característica de
qualidade. Segundo Shu et al. (2004), a modificação dos coeficientes do modelo de
regressão pode alterar a média e o desvio-padrão dos resíduos, conforme apresentado
nas equações (10) e (11), respectivamente.
Cadernos do IME – Série Estatística Pedrini & Caten
19
kxkkxxeE µββµββµββββ )ˆ(...)ˆ()ˆ()ˆ()(21 221100 −++−+−+−= (10)
2222222
2211 )ˆ(...)ˆ()ˆ()(
21σσββσββσββ +−++−+−=
kxkkxxeV (11)
Onde: é o valor estimado do k-ésimo coeficiente de regressão e βk é o valor alterado do k-ésimo coeficiente de regressão
Quando um ponto fora de controle é detectado pelo gráfico de controle, o
contador C(i), recebe o número da amostra fora de controle. Repetindo-se todo o
procedimento descrito anteriormente 5 mil vezes é possível calcular o NMA através da
equação (12).
(12)
3.1 Alterações Estudadas
Além da situação de processo sob controle estatístico, foram simuladas três
situações de processos fora de controle: (i) alterações no coeficiente de intercepto β0,
com os coeficientes de inclinação constantes; (ii) alterações no coeficiente de inclinação
β1, com os demais coeficientes de regressão mantidos constantes e (iii) alterações nos
coeficientes β0 e β1, com os demais coeficientes de inclinação mantidos constantes. As
explicações dos motivos destas alterações são baseadas nas equações (14) e (15) e serão
informados a seguir.
Analisando estas equações, uma alteração no coeficiente de intercepto β0 visa
alterar a média dos valores simulados da característica de qualidade e,
conseqüentemente, a média dos resíduos do modelo, mas mantendo o desvio-padrão dos
resíduos constante. Dessa forma, a primeira situação simulada visa analisar
isoladamente a sensibilidade do gráfico de controle de regressão proposto às
modificações na média dos valores observados em relação aos valores estimados pelo
modelo de regressão estimado na Fase I do método proposto, já que apenas a média dos
resíduos é alterada, enquanto a variância permanece constante.
De acordo com as equações (10) e (11), uma alteração em um coeficiente de
inclinação βk altera a variância dos resíduos do modelo de regressão e, se a média da
variável de controle xk não for igual a zero, altera também a média dos resíduos. Como
as variáveis de controle simuladas apresentam média igual a zero, uma alteração em
qualquer coeficiente de inclinação altera apenas o desvio-padrão, que é o objetivo da
segunda situação de processo fora de controle.
Cadernos do IME – Série Estatística Cálculo do NMA do Gráfico de Controle...
20
Para a terceira situação fora de controle simulada, altera-se simultaneamente o
coeficiente de intercepto β0 e o coeficiente de inclinação β1, visando assim, verificar a
sensibilidade do gráfico de controle proposto às alterações conjuntas da média e desvio-
padrão dos resíduos. Ressalta-se que em todas essas situações, as alterações nos
coeficientes são planejadas em valores múltiplos do desvio-padrão dos resíduos
estimado na aplicação da Fase I do método proposto.
4. Resultados
Na Tabela 1 apresentam-se os valores do NMA, obtidos através da simulação,
para o processo sob controle e para as alterações do coeficiente de intercepto β0 do
modelo de regressão, para o gráfico de controle proposto, para o gráfico de medidas
individuais para os resíduos, para o gráfico de controle de regressão múltipla proposto
por Haworth (1996).
TABELA 1 – Valores NMA para alterações no coeficiente de intercepto.
Alteração Método
Proposto
Medidas
Individuais
Haworth
(1996)
Sob controle 576,75 736,63 2083,85
β0+0,5σe 226,31 281,43 690,58
β0+1,0σe 60,13 72,20 158,33
β0+1,5σe 19,47 22,74 43,58
β0+2,0σe 7,81 8,82 14,98
β0+2,5σe 3,83 4,16 6,28
β0+3,0σe 2,24 2,40 3,19
β0+3,5σe 1,54 1,60 2,00
β0+4,0σe 1,24 1,27 1,44
Para a situação de processo sob controle, maiores valores do NMA0 indicam
menores taxas de alarmes falsos do gráfico de controle, ou seja, um menor número de
intervenções desnecessárias no processo serão realizadas. Mas, altos valores do NMA0
também podem indicar uma relativa ineficiência do gráfico de controle, já que os limites
de controle podem estar muito largos.
Assim, analisando a Tabela 1, o gráfico de controle de regressão múltipla
proposto por Haworth (1996) apresentou o maior NMA0 e, por conseguinte, a menor
taxa de alarmes falsos. Isto ocorreu porque este gráfico apresentou os limites de controle
Cadernos do IME – Série Estatística Pedrini & Caten
21
mais largos. De forma contrária, o gráfico EWMAREG apresentou o menor NMA0
entre os gráficos estudados, com valores NMA0 ligeiramente inferiores a 370. O gráfico
de controle para medidas individuais, com limites de controle estimados pela amplitude
móvel dos resíduos, apresentou um NMA0 de aproximadamente 730, já que o uso deste
método forneceu limites de controle um pouco maiores que o gráfico de controle
proposto.
O gráfico de controle de regressão proposto apresentou um NMA0 de
aproximadamente 572, isto equivale dizer que o gráfico de controle de regressão
proposto apresentará, em média, um alarme falso a cada 572 amostras monitoradas. Este
desempenho foi considerado satisfatório, embora seja superior ao NMA0 de um gráfico
de controle de Shewhart. O principal motivo para este valor do NMA0 é o uso do termo
hii como fator de correção nos limites de controle do método proposto, este também é o
fator de correção utilizado para o cálculo de intervalos de confiança para a previsão de
novas observações da característica de qualidade. Caso este fator de correção não fosse
utilizado, amostras com valores extremos para as variáveis de controle teriam limites de
controle mais rígidos e o nível de confiança, implicitamente adotado quando se escolhe
a constante k para os limites de controle, não seria constante para todos os valores
monitorados.
Analisando as alterações no coeficiente de intercepto β0, é possível observar que
o gráfico de controle de regressão múltipla de Haworth (1996) apresenta um
desempenho bastante ruim, quando comparado com os demais gráficos de controle
estudados. O NMA deste gráfico somente fica próximo dos demais para mudanças
superiores a 3σe na média de β0. Para mudanças na média de β0 inferiores a 2,5σe, o
gráficos EWMAREG apresentarou desempenho superior aos dos demais gráficos,
embora apresentem um NMA0 um pouco menor, o que indica uma taxa de alarmes
falsos superior aos dos demais gráficos.
Para alterações na média de β0 superiores a 2,5σe, o gráfico de controle de
regressão proposto apresenta o melhor desempenho entre todos os gráficos de controle
estudados. O gráfico de controle para medidas individual aplicado aos resíduos
apresenta um desempenho muito próximo ao gráfico de controle proposto, embora
apresente um NMA1 maior. Isto indica uma proximidade entre o uso das duas técnicas
de controle estatístico.
Cadernos do IME – Série Estatística Cálculo do NMA do Gráfico de Controle...
22
Na Tabela 2, apresentam-se os valores do NMA1 para as alterações do
coeficiente de inclinação β1 dos gráficos de controle de regressão proposto, do gráfico
de medidas individuais para os resíduos e do gráfico de controle de regressão múltipla
proposto por Haworth (1996).
TABELA 2 – Valores NMA para alterações no coeficiente de inclinação β1.
Alteração Método
Proposto
Medidas
Individuais
Haworth
(1996)
Sob controle 576,75 736,63 2083,85
β1+0,5σe 393,17 488,31 1311,10
β1+1,0σe 172,59 204,02 502,31
β1+1,5σe 71,90 82,10 180,61
β1+2,0σe 32,03 35,69 70,00
β1+2,5σe 16,04 17,52 30,71
β1+3,0σe 9,10 9,79 15,46
β1+3,5σe 5,82 6,18 8,90
β1+4,0σe 4,14 4,35 5,78
Analisando a Tabela 2, observa-se que o desempenho do gráfico de controle de
regressão proposto por Haworth (1996) é novamente bastante inferior aos dos demais
gráficos estudados. Neste caso, o gráfico de controle proposto apresenta NMA1 sempre
menos que o gráfico de controle de medidas individuais, especialmente para alterações
inferiores a 2,5σe na média de β1.
Os resultados da Tabela 2 mostram que estes três gráficos apresentados não são
adequados para a detecção de mudanças no desvio-padrão dos resíduos do modelo. A
principal razão para este fraco desempenho é que estes gráficos foram projetados
especificamente para detectar alterações na média do valor observado em relação ao
valor previsto pelo modelo e não para detectar mudanças no desvio-padrão. Isto indica a
necessidade do desenvolvimento de procedimentos para detectar alterações no desvio-
padrão do processo, quando este é monitorado por um gráfico baseado no gráfico de
controle de regressão ou algum outro gráfico similar.
Na Tabela 3 apresentam-se os valores do NMA1 para as alterações simultâneas
do coeficiente de intercepto β0 e do coeficiente de inclinação β1 dos gráficos de controle
de regressão proposto, do gráfico de medidas individuais para os resíduos e do gráfico
de controle de regressão múltipla proposto por Haworth (1996).
Cadernos do IME – Série Estatística Pedrini & Caten
23
TABELA 3 – Valores NMA para alterações simultâneas nos coeficientes β0 e β1.
Alterações Método
Proposto
Medidas
Individuais
Haworth
(1996)
β0+0,5σe
β1+0,5σe 170,01 205,35 490,63
β1+1,0σe 89,99 104,08 227,02
β1+1,5σe 43,75 49,36 97,72
β1+2,0σe 22,54 24,89 44,34
β1+2,5σe 12,72 13,79 22,39
β1+3,0σe 7,92 8,47 12,61
β0+1,0σe
β1+0,5σe 49,40 57,98 120,81
β1+1,0σe 31,36 35,73 68,05
β1+1,5σe 18,82 20,87 36,07
β1+2,0σe 11,84 12,87 20,21
β1+2,5σe 8,00 8,56 12,34
β1+3,0σe 5,82 6,16 8,29
β0+1,5σe
β1+0,5σe 17,11 19,57 36,06
β1+1,0σe 12,63 14,12 23,92
β1+1,5σe 8,95 9,78 15,13
β1+2,0σe 6,80 7,06 10,46
β1+2,5σe 5,11 5,41 7,13
β1+3,0σe 4,20 4,40 5,48
β0+2,0σe
β1+0,5σe 7,20 8,03 13,14
β1+1,0σe 6,05 6,63 10,11
β1+1,5σe 4,93 5,31 7,49
β1+2,0σe 4,10 4,35 5,69
β1+2,5σe 3,54 3,71 4,58
β1+3,0σe 3,17 3,30 3,89
β0+2,5σe
β1+0,5σe 3,67 3,99 5,85
β1+1,0σe 3,39 3,65 5,06
β1+1,5σe 3,09 3,28 4,27
β1+2,0σe 2,83 2,98 3,66
β1+2,5σe 2,64 2,75 3,24
β1+3,0σe 2,51 2,60 3,96
β0+3,0σe
β1+0,5σe 2,22 2,36 3,13
β1+1,0σe 2,19 2,31 2,96
β1+1,5σe 2,16 2,26 2,76
β1+2,0σe 2,12 2,21 2,59
β1+2,5σe 2,10 2,17 2,46
β1+3,0σe 2,08 2,14 2,38
Como é possível observar na Tabela 3, para alterações simultâneas em β0 e β1, o
gráfico de controle proposto possui melhor desempenho, isto é, um NMA1 menor, que
os demais gráficos estudados em todas as situações simuladas. Quando comparado com
Cadernos do IME – Série Estatística Cálculo do NMA do Gráfico de Controle...
24
o gráfico de controle para medidas individuais aplicado aos resíduos do modelo de
regressão, o gráfico de controle proposto é notoriamente superior em mudanças
inferiores a 1,5σe na média de β0 e β1, sendo que a partir desta faixa de alteração, o
desempenho destes gráficos se torna bastante similar. Para todas as faixas de alteração
em β0, com alterações acima de 2,5σe em β1, o gráfico do método proposto e o de
medidas individuais para os resíduos apresentam desempenhos muito próximos.
Analisando a Tabela 3, também é possível observar que o gráfico de controle de
regressão múltipla de Haworth (1996) possui desempenho muito inferior a esses dois
gráficos. Este gráfico só apresenta desempenho próximo aos dos demais gráficos em
situações de grandes alterações nos coeficientes de regressão β0 e β1.
Dessa forma, o gráfico de controle proposto apresentou um bom desempenho
para a detecção de mudanças isoladas no coeficiente de intercepto β0 e em mudanças
simultâneas nos coeficientes de regressão β0 e β1. Para mudanças simuladas no
coeficiente de inclinação β1, que neste caso acarretavam especificamente em alterações
multiplicativas no desvio-padrão dos resíduos, o gráfico de controle proposto teve um
desempenho razoável, embora superior ao dos outros gráficos estudados.
5. Conclusões
O presente trabalho teve como objetivo obter o Número Médio de Amostras
(NMA) para o gráfico de controle de regressão proposto por Pedrini et al. (2008), além
de comparar o desempenho deste gráfico com outros gráficos similares encontrados na
literatura. Dessa forma, utilizou-se a simulação de Monte Carlo para calcular o NMA
do gráfico de controle de regressão proposto por Pedrini et al. (2008).
Analisando os valores obtidos para o NMA0 do gráfico de controle proposto,
observa-se que este possui uma baixa ocorrência de alarmes falsos. Para a simulação de
alterações isoladas no coeficiente de intercepto β0, o gráfico de controle de regressão
proposto apresentou um bom desempenho, sobretudo para mudanças acima de 2,5σe em
β0, quando foi superior a todos os outros gráficos de controle estudados. Desta forma, o
gráfico de controle proposto possui uma boa sensibilidade para a detecção de grandes
mudanças na média do coeficiente de intercepto e, por conseqüência, uma boa
sensibilidade às diferenças entre o valor observado e o valor previsto pelo modelo de
regressão.
Cadernos do IME – Série Estatística Pedrini & Caten
25
Para alterações isoladas no coeficiente de inclinação β1, o gráfico de controle de
regressão proposto não apresentou um bom desempenho, embora melhor que os demais
gráficos de controle. Lembrando que, como a variável de controle x1, possui média igual
a zero, alterações em β1 somente alteram o desvio-padrão dos resíduos, sem alterar a
média destes. Este resultado pode ser explicado pelo fato do gráfico de controle de
regressão ter sido desenvolvido para detectar apenas mudanças na média.
No caso de mudanças simultâneas em um coeficiente de inclinação e no
coeficiente de intercepto, que acarretam numa alteração conjunta da média e desvio-
padrão dos resíduos, o NMA do gráfico de controle de regressão possui um bom
desempenho, sempre melhor que os demais gráficos estudados.
Como sugestão a trabalhos futuros, recomenda-se a proposta de um gráfico de
controle auxiliar para monitorar a variabilidade dos resíduos, combinado com o gráfico
de controle de regressão, e a obtenção do NMA para este novo gráfico de controle.
Outra proposta interessante é a obtenção do NMA para o gráfico de controle de
regressão com testes complementares, através de Cadeias de Markov.
Referências
ALWAN, L. C.; ROBERTS, H. V. Time-Series Modeling for Statistical Process Control. Journal of Business & Economic Statistics, v. 6, n. 1, p. 87-95, 1988.
BREMAUD, P. Markov chains: Gibbs fields, Monte Carlo simulation, and queues. New York: Springer, 1999, 444 p.
CASARIN, V. A.; SOUZA, A. M.; BOHM, S. I. H.; JACOBI, L. F. Aplicação de gráficos de controle de regressão no monitoramento do processo de montagem de colheitadeiras. Foz do Iguaçu: XXVII Encontro Nacional de Engenharia de Produção, 2007.
CASELLA, G.; ROBERT, C.P. Monte Carlo Statistical Methods. New York: Springer, 2ª Edição, 2004, 645 p.
CAI, D. Q.; XIE, M.; GOH, T. N.; TANG, X. Y. Economic Design of Control chart for Trended Process. International Journal of Production Economics, v. 79, p. 85-92, 2002.
COSTA, A. F. B.; EPPRECHT, E. K.; CARPINETTI, L. C. R. Controle Estatístico de Qualidade. São Paulo: Editora Atlas, 2ª Edição, 2005, 334 p.
HAWKINS, D. M. Multivariate quality control based on regression-adjusted variables. Technometrics, v. 33, n. 1, p. 61-75, 1991.
HAWORTH, D. A. Regression control chart to manage software maintenance. Journal of Software Maintenance, v. 8, n. 1, p 35-48, 1996.
JACOBI, L. F.; SOUZA, A. M.; PEREIRA, J. E. S. Gráfico de controle de regressão aplicado na monitoração de processos. Revista Produção, v. 12, n. 1, pág. 46-59, 2002.
KANG, L.; ALBIN, S. On-line monitoring when the process yelds linear profiles. Journal of Quality Technology, v. 32, n. 4, p. 418-426, 2000.
Cadernos do IME – Série Estatística Cálculo do NMA do Gráfico de Controle...
26
LOREDO, E. N.; JERKPAPORN, D.; BORROR, C. M. Model-based control chart for autoregressive and correlated data. Quality and Reliability Engineering International, v. 18, n. 6, p. 489-496, 2002.
MANDEL, B. J. The regression control chart. Journal of Quality Technology, v. 1, n. 1, p. 1-9, 1969.
MONTGOMERY, D. C. Introdução ao Controle Estatístico da Qualidade. 4. Ed. Rio de Janeiro: Editora LTC, 513 p, 2004.
OLIN, B D. Regression control charts revisited: methodology and Cases Studies. New York: 42° Annual Fall Technical Conference (AFTC), 1998.
OMURA, A. P.; STEFFE, J. H. Mixer viscometry to characterize fluid foods with large particulates. Journal of Food Process Engineering, v. 26, n. 3, p. 435-445, 2003.
PEDRINI, D. C.; CATEN, C. S. ten, MOREIRA Jr., F. J. Proposal of a modification on control charts based on residuals. Annals of III International Symposium on Business and Industrial Statistics (ISBIS), 2008.
ROTHSCHILD, B. F.; ROTH, S. R. Statistical process control of plating solutions with regression control charts. The SAMPE Journal, v. 22, n. 5, p. 37-41, 1986.
SHU, L; TSUNG, F; TSUI, K. L. Run-length perfomance of regression control charts with estimated parameters. Journal of Quality Technology, v. 36, n. 3, p. 280-292, 2004.
SHU, L; TSUI, K. L.; TSUNG, F. A review of regression control charts. In: Ruggeri, F.; Faltin, F.; Kenett, R. Encyclopedia of Statistics in Quality and Reliability New York: John Wiley & Sons, p. 1569-1573, 2007.
ZHANG, G. X. Cause-selecting control charts – a new type of quality control charts. The QR Journal, v. 12, n. 4, p. 221-225, 1985.
Cadernos do IME – Série Estatística Pedrini & Caten
27
THE ARL DISTRIBUTION OF A REGRESSION CONTROL CHART
Abstract
In the application of Control Charts, it’s supposed that the data is independent and
identically distributed. When some modifications on control variables occurs, those
assumptions cannot be true and the performance of the control charts is affected. As a
solution, that is the regression controle chart, which consists in the adjusting of a
regression model, relating the response variable to the control variables, and the
following monitoring of the observed value against the predicted value of the response.
The present work uses the Monte Carlo simulation to calculate the Average Run Length
(ARL) of the regression control chart presented by Pedrini et al. (2008), comparing the
result obtained against others procedures of the literature. The work results shows taht
the regression control chart has a good perfomance.
Key-words: Regression Control Chart, ARL, Monte Carlo simulation.
PREVISÃO DO PREÇO DE VENDA DA UVA ITÁLIA E DA MANGA TOMMY PRODUZIDAS NO VALE DO SÃO FRANCISCO VIA ANÁLISE DE SÉRIES TEMPORAIS:
UM ESTUDO DE CASO
Abdinardo Moreira Barreto de Oliveira Universidade Federal do Vale do São Francisco
Marcelo José Vieira de Melo Sobrinho
Universidade Federal do Vale do São Francisco [email protected]
Resumo
O presente estudo investiga a adequação de uma metodologia de previsão de preços
para a manga Tommy e a uva Itália, produzidas e comercializadas no Vale do São
Francisco, através da utilização das técnicas de Análise de Séries Temporais. Foram
coletados e calculados, junto aos registros da Secretaria de Agricultura do Estado da
Bahia, os preços médios mensais destes produtos entre 2002 e 2008, totalizando uma
amostra de 84 períodos. Para a interpretação dos resultados, foram utilizados os
modelos de previsão Holt-Winters e ARIMA. Os resultados indicam, dentre outras
coisas, uma estacionariedade no preço da manga e uma tendência de aumento no preço
da uva. A metodologia desenvolvida pôde ser considerada válida, pois forneceu os
menores erros quadráticos de previsão por meio da suavização exponencial aditiva
para a uva Itália (Holt-Winters) e o modelo ARIMA(2,0,1) para a manga Tommy.
Sugestões de novos estudos são elaboradas ao final do artigo.
Palavras-chave: Previsão de preços, Séries temporais, Fruticultura.
CADERNOS DO IME – Série Estatística Universidade do Estado do Rio de Janeiro - UERJ
Rio de Janeiro – RJ - Brasil ISSN 1413-9022 / v. 27 p. 29 - 43, 2009
Cadernos do IME – Série Estatística Previsão do Preço de Venda da Uva Itália...
30
1. Introdução
O agronegócio é uma das atividades econômicas desenvolvidas no Brasil que
vem recebendo crescente destaque nos meios de comunicação e a atenção de
pesquisadores, estudiosos e investidores, mesmo em momentos de crises econômicas.
Isto porque, dentre outras coisas, a sua participação na economia brasileira representa
33% do PIB, 42% do volume de exportações e 37% na geração de empregos. Além
disso, ele pode ser considerado como uma atividade que melhor desempenha as
políticas de interiorização do desenvolvimento, porque contribui significativamente na
diminuição do fluxo migratório e na redução da pressão populacional nas capitais e
regiões metropolitanas do país (ROCHA et al, 2005; NEVES e CONEJERO, 2007).
Os diversos motivos que justificam esta relevante participação do agronegócio
brasileiro nos cenários nacional e mundial podem ser agrupados em apenas três fatores
(NEVES e CONEJERO, 2007): (1) o aumento dos preços de venda de algumas
principais commodities agrícolas, como açúcar, álcool, soja e café, devido às quebras de
safra dos principais concorrentes e ao aumento da população mundial, acarretando num
maior consumo de alimentos e energia; (2) as melhorias ocorridas na produtividade,
sejam pela capacidade empreendedora dos agricultores em utilizar novas técnicas de
gestão empresarial, sejam pela assimilação de novas tecnologias de plantio
desenvolvidas por centros de pesquisa como a Embrapa e (3) pela magnitude das
exportações de empresas multinacionais com mercados próprios, ou por agroindústrias
nacionais em processo de internacionalização.
Neste cenário também merece destaque os números apresentados pela
fruticultura. Em 2008, as exportações de frutas frescas brasileiras foram de 888 mil
toneladas (acréscimo de 10,31% em relação a 2006), totalizando US$ (F.O.B.) 724
milhões em vendas (aumento de 51,74% em relação a 2006). Do total de dólares que
estas exportações trouxeram para a Balança Comercial brasileira, as vendas de uva
ficaram em 1º lugar e as vendas de manga em 3º lugar, contribuindo respectivamente
com 23,67% e 16,39% desse total (IBRAF, 2009). Boa parte deste desempenho é
decorrente de áreas produtivas irrigadas, das quais se destaca o pólo Petrolina -
Juazeiro, localizado no Vale do Rio São Francisco, região de clima semi-árido situado
entre a Bahia e Pernambuco. O pólo é responsável por 43% das exportações de frutas
brasileiras e por mais de 90% das exportações de uva e manga (LOPES et al, 2007).
Cadernos do IME – Série Estatística Oliveira & Sobrinho
31
Embora os resultados apresentados apontem para uma perspectiva (ainda)
promissora de expansão do agronegócio brasileiro, notadamente o setor aqui em análise,
é importante salientar que o seu desempenho não depende só da aplicação direta de
avanços tecnológicos ocorridos na área de produção ou gestão, mas também sofre
influência de fatores externos até certo ponto imprevisíveis ou incontroláveis, tais como:
(1) as variações climáticas [afetam a qualidade do produto], (2) o dimensionamento
equânime da produção mundial de alimentos nos países fornecedores [sua ausência
pode provocar o excesso ou a escassez destes produtos] e (3) as variações cambiais
ocorridas durante a comercialização da produção agrícola mundial [afetam a renda do
consumidor e a receita do produtor]. Os fatores em tela exercem grande influência no
preço final de venda do produto agrícola destinado ao mercado consumidor e, por conta
de sua imprevisibilidade ou incontrolabilidade, boa parte dos produtores pode sentir
dificuldade em estabelecer um preço final adequado (CAETANO, 2006; NEVES;
CONEJERO, 2007).
Portanto, compreender como será o comportamento dos preços agrícolas se torna
importante para os produtores rurais nacionais, porque tal variável consegue resumir,
em um único valor, toda a informação relevante sobre os aspectos micro e macro
econômicos que afetam o desempenho da empresa no setor onde está inserida (ELDER
apud SACHETIM, 2006). Logo, a descoberta dos movimentos de alta ou de baixa dos
preços agrícolas pode permitir a reorganização do ciclo produtivo, de modo que o
momento da comercialização da safra possa coincidir com os maiores valores que o
mercado consumidor esteja disposto a pagar. Tal informação contribuiria na
maximização das receitas por safra vendida, principalmente para o pequeno e médio
produtor, fazendo-os evitar os períodos de excedente de oferta. Dessa forma, o presente
estudo apresenta uma proposta de previsão de preços para as culturas de uva e manga
produzidas e comercializadas no Vale do São Francisco, com o intuito de contribuir na
elaboração do planejamento da produção da atividade agrícola local. Para isto são
empregados dois métodos largamente utilizados para a realização de previsões – o de
suavizações e o auto-regressivo integrado e de médias móveis - descritos a seguir.
2. Referencial Teórico
A Análise de Séries Temporais constitui-se de um método quantitativo de
previsão que realiza a projeção de valores futuros de uma variável, fundamentada
Cadernos do IME – Série Estatística Previsão do Preço de Venda da Uva Itália...
32
eminentemente nas suas observações passadas, organizadas de forma seqüencial e em
intervalos de tempo específicos escolhidos pelo analista. Alicerçado neste conceito, este
método apresenta uma característica peculiar: a de que suas observações adjacentes são
dependentes, ou seja, os elementos que causaram os padrões de atividade no passado
continuarão a influenciá-lo, de maneira semelhante, no futuro. Logo, o modelo
matemático a ser construído para realizar a previsão da série temporal permitirá que os
dados analisados “falem por si”, sem precisar recorrer a uma teoria subjacente
específica para possibilitar a sua interpretação (BOX, JENKINS e REINSEL, 1994;
LEVINE et al., 2005).
Moretin e Toloi (2006) informam que ao utilizar a Análise de Séries Temporais
no estudo de uma variável qualquer vinculada a um instante de tempo t, o pesquisador
poderá estar interessado em: (1) averiguar o mecanismo causador de sua trajetória; (2)
realizar projeções de valores da função amostral em curto ou em longo prazo; (3)
delinear o desempenho da série, procurando identificar a existência de tendências, ciclos
e variações sazonais (especialmente em séries econômicas e financeiras) e; (4) buscar
periodicidades importantes nos dados, com o intuito de encontrar componentes de
freqüência que caracterizem a existência de um espectro.
Dentre os métodos de previsão disponíveis, existe uma grande classe que tenta
abordar as razões das variações ocorridas em séries temporais, que é a das suavizações.
Sua premissa básica é que os valores extremos encontrados na série simbolizam casos
fortuitos ou randômicos e, realizando a suavização destes, pode-se encontrar o modelo
básico da série, discernindo-o de quaisquer “ruídos” que porventura estejam incluídos
nas observações e, assim, utilizá-lo para calcular os valores futuros da função amostral
(MORETIN e TOLOI, 2006). A suavização da série temporal acontece através do
cálculo de médias móveis exponencialmente ponderadas, o que significa dizer que seus
valores mais recentes recebem maior peso de importância na previsão dos valores no
futuro. Além disso, tal procedimento averigua a existência de uma tendência linear e de
um componente de sazonalidade (SILVA, SAMOHYL e COSTA, 2002). Caso a série
temporal estudada possua estas características, um dos modelos de suavização mais
indicados na literatura especializada é o Holt-Winters (HW).
A vantagem de utilizá-lo se deve à sua fácil compreensão, ao seu baixo custo, a
sua adaptabilidade para séries com modelo de comportamento mais genérico
Cadernos do IME – Série Estatística Oliveira & Sobrinho
33
(MORETIN e TOLOI, 2006) e, de acordo com os resultados de estudos empíricos, sua
precisão é compatível com a de modelos mais complexos, como por exemplo, a
abordagem ARIMA (MAKRIDAKIS e HIBON, 2000). Talvez porque estas vantagens
possam estar baseadas no Princípio da Parcimônia (BOX, JENKINS e REINSEL, 1994)
é que seu modelo vem sendo empregado em alguns estudos de previsão de commodities
agrícolas (SILVA, SAMOHYL e COSTA, 2002; PACHECO e SILVA, 2003; BACCI,
REZENDE e MEDEIROS, 2006), na indústria alimentícia (QUEIROZ e
CAVALHEIRO, 2003; ALBUQUERQUE e SERRA, 2006) ou até mesmo na previsão
de demanda turística (SERRA, TAVARES e SANTOS, 2005), conseguindo estes
pesquisadores resultados satisfatórios de previsão de valores futuros das séries.
O modelo HW é dividido em dois subgrupos: aditivos e multiplicativos. O
primeiro considera que a amplitude da variação da sazonal permanece uniforme ao
longo do tempo, enquanto que no segundo ela muda com o passar do tempo, podendo
ascender ou descender conforme for o caso. Para seu uso, é necessária a estimação das
constantes de amortecimento de Nível (α), de Tendência (β) e de Sazonalidade (γ). O
Quadro 1 apresenta as equações de suavização e de previsão, onde Yt é o valor
observado no instante t na série analisada.
Quadro 1 – Equações de suavização exponencial sazonal de Holt-Winters
Equação HW Aditivo HW Multiplicativo
Nível
Tendência
Sazonalidade
Previsão
Fonte: adaptado de Moretin e Toloi (2006)
Os contrapontos que a literatura fala sobre o modelo HW são (1) as dificuldades
em determinar os valores mais apropriados das constantes de suavização e (2) a
impossibilidade e/ou dificuldade de se estudar suas propriedades estatísticas, como a
média, a variância e o intervalo de confiança da previsão (MORETIN e TOLOI, 2006).
Embora apresente um grau de complexidade maior, o modelo auto-regressivo
integrado e de médias móveis (ARIMA) anunciou uma nova geração de ferramentas de
previsão de séries temporais, dada a combinação de três filtros para a estimação dos
Cadernos do IME – Série Estatística Previsão do Preço de Venda da Uva Itália...
34
valores futuros: o auto-regressivo [AR], o de integração [I] e o de médias móveis [MA].
Os modelos [AR(p)] estudam o mecanismo de autocorrelação do processo gerador da
série temporal, ou seja, as autocorrelações acontecem quando se verificam a presença de
correlação entre os p valores observados na série temporal. Os modelos [MA(q)]
pesquisam a estrutura de autocorrelação dos resíduos de previsão. Portanto, tal
autocorrelação é examinada sempre que existir uma correlação entre a média móvel dos
q termos de erro sucessivos na série temporal. Caso a série apresente ambas as
características, os modelos podem ser combinados criando um processo [ARMA (p, q)].
Por fim, o filtro [I(d)] é utilizado quando se observa que a série temporal é não-
estacionária, ou seja, ela é integrada. Assim, após calcular a diferença entre os valores
subjacentes da série d vezes, é possível torná-la estacionária, de modo que ofereça uma
base válida para a previsão. O Quadro 2 mostra as equações empregadas de acordo do
modelo ARIMA, onde Yt* é o valor calculado, ϕt é o coeficiente auto-regressivo, θt é o
coeficiente de média móvel, µ é uma constante e εt é o termo de erro estocástico de
ruído branco (BOX, JENKINS e REINSEL, 1994; GUJARATI, 2006).
Quadro 2 – Equações de previsão para o modelo ARIMA
Método Equação
AR(p)
MA(q)
ARMA (p, q)
Fonte: adaptado de Moretin e Toloi (2006)
Sobre a potencialidade do uso do método ARIMA para a previsão de preços
agrícolas no Brasil, vale destacar os estudos feitos com o trigo (ARÊDES e PEREIRA,
2008), o cacau (MORAES e ALBUQUERQUE, 2006) e a soja (SILVA, SAMOHYL e
COSTA, 2002), onde seus resultados de previsão foram estatisticamente satisfatórios.
3. Procedimentos Metodológicos
O presente estudo foi realizado com o intuito de compreender o comportamento
da série de preços da Manga Tommy (MT) e da Uva Itália (UI) produzidas e
comercializadas no Vale do São Francisco, seguindo as orientações (1), (2) e (3) citadas
por Moretin e Toloi (2006). Os preços foram coletados no site da Secretaria de
Agricultura, Irrigação e Reforma Agrária do Estado da Bahia (SEAGRI, 2009), relativos
Cadernos do IME – Série Estatística Oliveira & Sobrinho
35
à cidade de Juazeiro (BA). A escala de tempo utilizada foi mensal, entre os anos de
2002 e 2008, totalizando 84 observações. Foram construídas duas séries mensais – MT
e UI – onde mostram o preço médio mensal, atualizados pelo IGP-DI da FGV.
Para o modelo Holt-Winters, primeiro foi necessário identificar se as séries
mensais apresentam tendência e sazonalidade. Para a tendência, foi adotado o teste
Wald-Wolfowitz. Como o número de observações acima (n1) e abaixo (n2) da mediana
(m) foram maiores que 20 em todas as séries, foi realizada uma aproximação normal
para testar a hipótese H0 (não há tendência) frente a H1 (há tendência). Em todas as
séries, H0 foi rejeitada (n1=42; n2=42; Z=-9,00; Z ajustado=8,89; P=0,0001), indicando
a existência de tendência e eliminando a conjectura da aleatoriedade de seus valores.
Quanto à ocorrência de sazonalidade, foi utilizado o teste de Friedman. Para a série MT
(S=45,31; DF=11; P=0,001) foi verificada a existência de sazonalidade a 1% de
significância. Para a série UI (S=18,10; DF=11; P=0,079) foi verificada a existência de
sazonalidade a 10% de significância, possibilitando assim o uso do modelo supracitado.
Para avaliar o subgrupo (aditivo ou multiplicativo) que melhor se adapta na predição
das observações, foi utilizado o menor erro quadrático médio (MSE) como parâmetro.
Para a utilização do modelo ARIMA, primeiro foi aplicado o teste de
estacionariedade (ou de raiz unitária). Aqui foi usado o teste KPSS (KWIATKOWSKI
et al., 1992), onde foi testada a hipótese H0 (são estacionárias). Em serguida, foi feita a
análise dos seus correlogramas, com 28 defasagens (± 1/4 do tamanho das séries).
O diagnóstico do modelo estimado se deu através do teste Breusch-Godfrey
(teste LM), com o objetivo de verificar a hipótese H0 de não-existência de correlação
serial entre os resíduos do modelo. Por fim, a capacidade de previsão do modelo foi
testada através da estatística U de Theil. Neste aspecto, foi utilizada a equação U2 (1)
sugerida por Bliemel (1973), onde Pi e Ai representam, respectivamente, os valores
previstos e observados na série temporal, e que quanto mais próximo de zero for o valor
obtido, melhor será a qualidade de previsão do método empregado. Os softwares
utilizados foram o Eviews 6.0, Minitab 14, MS Excel e Statistica 7.0.
Equação 1 – Estatística de Theil para medição de qualidade de previsão do modelo
Cadernos do IME – Série Estatística Previsão do Preço de Venda da Uva Itália...
36
4. Análise e discussão dos resultados
4.1 Previsões através do modelo HW
Em relação à Manga Tommy, os resultados encontrados indicam a aplicabilidade
do supracitado modelo, sendo este utilizado tanto pela suavização exponencial sazonal
aditiva (Uaditiva= 0,35767; MSEaditiva = 0,059576) como pela multiplicativa (Umultiplicativa =
0,35770; MSEmultiplicativa = 0,059587).
Um entendimento para os resultados da estatística U de Theil serem tão
próximos, em ambas as situações, decorre do comportamento dos preços da Manga
Tommy ao longo do período analisado. No longo prazo, é possível verificar certa
estacionariedade entre a amplitude de seus valores máximos e mínimos, característica
marcante em suavizações exponenciais aditivas. No curto prazo, comparando
anualmente os valores obtidos, verifica-se mudanças relevantes nos patamares das
amplitudes dos preços, demandando o uso de suavizações exponenciais multiplicativas
nas previsões, conforme mostra a Figura 1.
Figura 1 – Gráfico Real versus Previsto para a Manga Tommy, com suavização aditiva (2002-2008)
Além disso, é possível notar que ao longo do 1º semestre, o preço médio da MT
tende a subir, alcançando seus valores máximos entre os meses de junho e julho, para
inverter sua tendência e decair para seus valores mínimos históricos, que normalmente
acontecem entre novembro e dezembro. Por fim, os coeficientes de amortização
estimados para a série aditiva foram α=0,765, β=0,000, γ=0,000, para a série
multiplicativa foram α=0,915, β=0,000, γ=0,000, e os valores iniciais para as equações
de recorrência foram S0=0,6046 e T0=-0,001.
Cadernos do IME – Série Estatística Oliveira & Sobrinho
37
Figura 2 – Gráfico Real versus Previsto para a Uva Itália, com suavização aditiva (2002-2008)
Para a Uva Itália, os resultados também indicam o uso do HW, mas apontam
somente para o uso de suavização exponencial sazonal aditiva (Uaditiva=0,0822;
MSEaditiva = 1,2348) em vez da multiplicativa (Umultiplicativa = 0,0878; MSEmultiplicativa =
1,4084), mesmo com seus valores de U bem próximos (Figura 2). Dessa forma, pode-se
dizer que, embora seu preço de venda esteja numa tendência de alta, este pode estar
assumindo, ao longo de cada ano, um padrão estacionário, tendo em vista que a
amplitude da variação sazonal poderia estar se estabilizando. Assim, se vista em longo
prazo, a série sugere ser multiplicativa dada às mudanças nos patamares de suas
amplitudes; mas se vista em curto prazo – dentro do próprio ano – a série aparenta estar
estacionária em torno de sua linha de tendência, demandando, portanto, a suavização
aditiva. Além disso, os maiores valores de preço de venda foram observados no 2º
semestre. Por fim, os coeficientes de amortização para a série aditiva foram α=0,974,
β=0,000, γ=0,000, para a série multiplicativa foram α=0,968, β=0,102, γ=0,000, e os
valores iniciais para as equações de recorrência foram S0=7,986 e T0=0,1129.
4.2 Previsões através do método ARIMA
Neste tópico são apresentados os resultados para as séries MT e UI através do
método ARIMA. O primeiro item analisado foi a estacionariedade das séries, para
verificar a necessidade de calcular as primeiras diferenças e assim retirar sua raiz
unitária. No caso da série MT, foi constatado que a mesma é estacionária [I(0)] – KPSS
stat. = 0,096906; Valor Crítico Assintótico 1% = 0,739000 –, não rejeitando, portanto,
H0. Em relação à série UI, foi obtida a rejeição de H0. Nesta situação, o teste foi refeito
com o objetivo de averiguar se UI é um processo estacionário em tendência. O
Cadernos do IME – Série Estatística Previsão do Preço de Venda da Uva Itália...
38
resultado final indica que UI é estacionária em sua tendência, isto é, embora sua média
não seja constante, a sua variância é, não sendo necessária a diferenciação de seus
valores – KPSS stat. = 0,061139; Valor Crítico Assintótico 1% = 0,739000.
O segundo item foi a identificação do modelo a partir da análise das funções de
autocorrelação e autocorrelação parcial. Comparando o comportamento dos
correlogramas referentes às séries MT e UI com os padrões teóricos citados por Gujarati
(2006, p. 679), estes indicam que as séries sigam, pelo menos, um processo AR(p).
Figura 3 – Correlograma Serie MT Figura 4 – Correlograma Série UI
Em seguida, para cada série, foram realizadas a estimação dos seguintes
modelos: AR(1), AR(2), MA(1), MA(2), ARMA(1,1), ARMA(1,2), ARMA(2,1) e
ARMA(2,2), todos com intercepto, já que os correlogramas não apontam p e q maiores
que duas defasagens. O desempenho dos modelos foi medido a partir de um conjunto de
critérios fundamentados tanto na importância das variáveis como na não-existência de
correlação serial entre os resíduos (teste LM), ambos ao nível de 5% de significância.
Os resultados mostraram que para a série MT, o modelo que melhor se ajustou foi o
ARMA (2,1) [χ2=0,9998], e para a série UI, o modelo selecionado foi o ARMA(1,0)
[χ2=0,6877], cujas respostas atendem aos padrões teóricos esperados. Como
anteriormente fora identificado que a série UI é um processo estacionário em tendência,
também foi estimado um modelo ARMA(1,0) com remoção desta tendência. As Tabelas
1 e 2 mostram os resultados estatísticos para os modelos acima calculados.
Cadernos do IME – Série Estatística Oliveira & Sobrinho
39
Tabela 1 – Estatística para o modelo ARMA (2,1) para a série MT
Manga Tommy Constante AR(1) AR(2) MA(1) Coeficiente 0,585986 1,498471 -0,697126 -0,730474 Probabilidade 0,000000 0,000000 0,000000 0,000000 Critério de informação de Akaike 0,006716 Critério de informação de Schwarz 0,124117
Tabela 2 – Estatística para o modelo ARMA (1,0) para a série UI com tendência
Uva Itália Constante AR(1) t Coeficiente 9,225007 0,674888 0,098470 Probabilidade 0,000000 0,000000 0,000000 Critério de informação de Akaike 3,174499 Critério de informação de Schwarz 3,261927
A última etapa do modelo ARIMA é a análise da qualidade de previsão dos
dados a partir das equações calculadas. A estatística U de Theil apresentou o resultado
de U = 0,335140 para o modelo ARMA (2,1) da série MT, demonstrando um
desempenho ligeiramente melhor que seus modelos de suavização exponencial. Quanto
à série UI, a estatística U de Theil retornou o valor U = 0,0898 para o modelo
ARMA(1,0), e U = 0,0841 para o modelo ARMA(1,0) com tendência. Nesta série, o
modelo de suavização aditiva apresentou um desempenho melhor que os modelos
ARIMA estimados, mas o modelo ARMA(1,0) com tendência teve uma performance
melhor que o modelo de suavização exponencial multiplicativa. As figuras 5 e 6
mostram os resultados da aplicação do modelo ARMA para a previsão de preços da
manga Tommy e da uva Itália.
Figura 5 – Gráfico Real versus Previsto para a Manga Tommy, ARMA (2,1) (2002-2008)
Cadernos do IME – Série Estatística Previsão do Preço de Venda da Uva Itália...
40
4 Figura 6 – Gráfico Real versus Previsto para a Uva Itália, ARMA (1,0) com tendência (2002-2008)
5. Considerações finais
O presente estudo procurou contribuir na apresentação de uma proposta de
previsão de preço para a produção de uva Itália e da manga Tommy oriundas do Vale do
São Francisco, de modo que auxilie no planejamento da atividade agrícola local, através
da análise de modelos de Séries Temporais. Já que as situações econômicas e de
negócios mudam ao longo do tempo, os produtores rurais devem utilizar técnicas que
monitorem as implicações que estas causarão no desempenho de sua organização.
A Análise de Séries Temporais é um ramo da Econometria que permite a
estimação, com a maior precisão e o menor número de termos possíveis, o valor do
preço futuro destes produtos agrícolas. Uma das vantagens que esta metodologia pôde
apresentar neste estudo foi a sua capacidade de ilustrar, a partir da elaboração de
projeções o resultado do embate econômico que envolve os interesses de vendedores e
compradores de frutas, especialmente manga Tommy e uva Itália. Logo, a modelagem
matemática dos dados passados pode ajudar a indicar momentos de reversão de
tendências de preço, antecipando a informação do surgimento de um novo cenário que
venha a favorecer os objetivos de determinado agente econômico, o que facilitaria a
decisão do produtor rural quanto à época de comercialização e o valor a ser cobrado
pela safra produzida.
Portanto, os resultados obtidos neste estudo são satisfatórios quanto à
aplicabilidade de ambos os modelos para o acompanhamento da evolução do preço da
Cadernos do IME – Série Estatística Oliveira & Sobrinho
41
manga Tommy e da uva Itália, produzidas e comercializadas no contexto do Vale do
São Francisco. Neste ínterim, vale salientar que, embora o método Holt-Winters tenha
sido validado em ambas as séries temporais, os valores encontrados apontam para um
melhor poder de predição do modelo na série de preços da uva Itália. Além disso,
também foi identificada a propensão de estacionariedade da trajetória de ambas as
funções amostrais, posicionando-se entre os valores máximos e mínimos de preços
recentes. Quanto ao modelo ARIMA, este apresentou um melhor desempenho na
predição dos valores da manga Tommy, ainda que este não seja seu modelo definitivo.
Assim, tendo em vista o comportamento invertido das séries de preços estudadas,
sugere-se aos produtores o investimento em ambas as culturas aqui analisadas como
forma de diversificação.
Para estudos futuros, recomenda-se a aplicação de modelos complexos de
previsão de séries temporais, como a metodologia de Vetores Auto-Regressivos (VAR)
ou de métodos heterocedásticos (ARCH e GARCH), para comparar seus resultados com
os aqui alcançados. Outra recomendação é determinar, através de métodos
econométricos determinísticos (Regressão), as variáveis econômicas que podem
influenciar na estimação do preço futuro dos produtos agrícolas aqui estudados além da
variável tempo, o que contribuiria para a ampliação do arcabouço teórico, metodológico
e prático de gestão de fruticultura irrigada na região do Vale do São Francisco.
Referências
ALBUQUERQUE, J. C. S.; SERRA, C. M. V. Utilização de modelos de Holt-Winters para a previsão de séries temporais de consumo de refrigerantes no Brasil. In: XXVI ENEGEP, Fortaleza, Anais... Rio de Janeiro: ABEPRO, 2006.
ARÊDES, A. L.; PEREIRA, M. W. G. Potencialidade da utilização de modelos de séries temporais na previsão do preço do trigo no Estado do Paraná. Rev. de Economia Agrícola, São Paulo, v. 55, n. 1, p. 63-76, jan./jun. 2008.
BACCI, L. A.; REZENDE, M. L.; MEDEIROS, A. L. Combinação de métodos de séries temporais na previsão da demanda de café no Brasil. In: XXVI ENEGEP, Fortaleza, Anais... Rio de Janeiro: ABEPRO, 2006.
BLIEMEL, F. Theil’s forecast accuracy coefficient: a clarification. Journal of Marketing Research, v.10, p.444-446, 1973.
BOX, G. E. P; JENKINS, G. M; REINSEL, G. C. Time series analysis: forecasting and control. 3.ed. New Jersey: Prentice Hall, 1994.
CAETANO, J.R. O ponto vulnerável da agricultura. Exame, São Paulo, 02. mai. 2006. Disponível em: <http://portalexame.abril.com.br/revista/exame/edicoes/0866/economia/m0081647.html>.Acesso em: 20/07/2006.
GUJARATI, D. Econometria Básica. 4. ed. Rio de Janeiro: Elsevier, 2006.
Cadernos do IME – Série Estatística Previsão do Preço de Venda da Uva Itália...
42
INSTITUTO BRASILEIRO DE FRUTAS. Comparativo das exportações brasileiras de frutas frescas 2008 - 2007-2006. Disponível em:< http://www.ibraf.org.br/estatisticas/est_frutas.asp>. Acesso em: 27 abr. 2009.
KWIATKOWSKI, D.; PHILLIPS, P. C. B.; SCHMIDT, P.; SHIN, Y. Testing the null hypothesis of stationarity against the alternative of a unit root. Journal of Econometrics, v.54, p.159-178, 1992.
LEVINE, D. M; STEPHAN, D; KREHBIEL, T. C; BERENSON, M. L. Estatística: teoria e aplicações usando o Microsoft Excel em português. 3.ed. Rio de Janeiro: LTC, 2005.
LOPES, F. F; CASTRO, L.T; NEVES, M.F; CALDEIRA, M.A. O Vale do São Francisco: lições para o planejamento estratégico de uma região. In: NEVES, M. F (org.). Agronegócios e desenvolvimento sustentável: uma agenda para a liderança mundial na produção de alimentos e bioenergia. São Paulo: Atlas, 2007, p.128-138.
MAKRIDAKIS, S; HIBON, M. The M3-Competition: results, conclusions and implications. International Journal of Forecasting, v. 16, p. 451-476, 2000.
MORAES, M. C.; ALBUQUERQUE, A. P. Previsão para o preço futuro do cacau através de uma série univariada de tempo: uma abordagem utilizando o método ARIMA. In: XXX EnANPAD, Salvador, Anais... Rio de Janeiro: ANPAD, 2006.
MORETTIN, P. A; TOLOI, C. M. C. Análise de séries temporais. 2.ed. São Paulo: Edgard Blücher, 2006.
NEVES, M. F; CONEJERO, M. A. Cenário econômico da produção de alimentos, fibras e bioenergia. In: NEVES, M. F (org.). Agronegócios e desenvolvimento sustentável: uma agenda para a liderança mundial na produção de alimentos e bioenergia. São Paulo: Atlas, 2007, p.11-19.
PACHECO, R. F; SILVA, A. V. F. Aplicação de modelos quantitativos de previsão em uma empresa de transporte ferroviário. In: XXIII ENEGEP, Ouro Preto, Anais... Rio de Janeiro: ABEPRO, 2003.
QUEIROZ, A. A; CAVALHEIRO, D. Método de previsão de demanda e detecção de sazonalidade para o planejamento da produção de indústrias de alimentos. In: XXIII ENEGEP, Ouro Preto, Anais... Rio de Janeiro: ABEPRO, 2003.
ROCHA, F.D; OLIVEIRA, D.F; LACERDA, T.S; SILVEIRA, V. N. S. Estratégias de financiamento do capital de giro em empresas do setor alimentício. In: XII SIMPEP, Bauru, Anais... Bauru: UNESP, 2005.
SACHETIM, H. M. Análise Técnica: estudo da confiabilidade dos principais indicadores de Análise Técnica, aplicados às ações mais negociadas na Bovespa no período de 1995-2005. Curitiba, 2006. 130 p. Dissertação (Mestrado em Administração) – Centro de Pesquisa e Pós-Graduação em Administração, Universidade Federal do Paraná.
SECRETARIA DE AGRICULTURA, IRRIGAÇÃO E REFORMA AGRÁRIA. Cotação agrícola. Disponível em:<http://www.seagri.ba.gov.br/cotacao.asp>. Acesso em: 03 abr. 2009.
SERRA, C. M. V; TAVARES, H. R; SANTOS, J. C. C. Aplicação de séries temporais na análise de demanda turística no Estado do Pará usando os modelos de Holt-Winters. In: XXV ENEGEP, Porto Alegre, Anais... Rio de Janeiro: ABEPRO, 2005.
SILVA, W.V; SAMOHYL, R.W; COSTA, L. S. Comparação entre os métodos de previsão univariados para o preço médio da soja no Brasil. In: XXII ENEGEP, Curitiba, Anais... Rio de Janeiro: ABEPRO, 2002.
Cadernos do IME – Série Estatística Oliveira & Sobrinho
43
SELLING PRICE PREDICTION OF ITALY GRAPE AND TOMMY MANGO PRODUCED AT SÃO FRANCISCO
VALLEY BY TIME SERIES ANALYSIS: A CASE STUDY
Abstract
This paper investigates the adequacy of a methodology for price prediction of Tommy
mango and Itlay grape, both produced and traded at São Francisco valley, by the use of
time series analysis .The average prices of these products were calculated based on
Agriculture Secretary of state of Bahia’s monthly records, between 2002 and 2008,
which total sample collected was 84 periods. For results interpretation, this study
applied the Holt-Winters and ARIMA prediction models. The results show, among other
things, a stationarity on mango price and a growing trend on grape price. The
methodology developed could be considered valid, because it gave minors square errors
prediction by additive exponential smoothing for Italy grape (Holt-Winters) and the
ARIMA model (2,0,1) for Tommy mango. Suggestion of new studies is showed in the end
of this paper.
Key-words: Price prediction, Time series, Orcharding.
A UTILIZAÇÃO DE GRÁFICOS DE CONTROLE DE SOMA ACUMULADA (CUSUM) PARA
MONITORAMENTO DE UM PROCESSO DE USINAGEM
Custodio da Cunha Alves
Universidade da Região de Joinville - UNIVILLE [email protected]
Altair Carlos Cruz
Universidade da Região de Joinville - UNIVILLE [email protected]
Elisa Henning
Universidade do Estado de Santa Catarina - UDESC [email protected]
Arnoldo Schmidt Neto
Universidade da Região de Joinville - UNIVILLE [email protected]
Resumo
Este trabalho apresenta os gráficos de controle CUSUM como um procedimento
alternativo e mais apropriado que os tradicionais gráficos de Shewhart para detectar
pequenos desvios médios do valor nominal de um processo de usinagem. O objetivo
deste trabalho é investigar a partir de um estudo comparativo se há diferença
significativa quanto a sensibilidade existente entre a utilização destes gráficos e os
gráficos de Shewhart para detectar pequenas mudanças na média do processo. Na
realização deste estudo utilizou-se dados reais de um processo de usinagem para
aplicação de gráficos de controle CUSUM no monitoramento deste processo, o que
atualmente é feito com gráficos de Shewhart. Este estudo foi fundamental para definir
a melhor escolha entre os gráficos para a análise estatística deste processo.
Palavras-chave: Ferramentas estatísticas; Gráficos CUSUM; Processos industriais.
CADERNOS DO IME – Série Estatística Universidade do Estado do Rio de Janeiro - UERJ
Rio de Janeiro – RJ - Brasil ISSN 1413-9022 / v. 27, p. 45 - 58, 2009
Cadernos do IME – Série Estatística A Utilização de Gráficos de Controle...
46
1. Introdução
Os gráficos de controle estatístico de processos mais conhecidos e amplamente
aplicados no setor industrial são ainda, sem dúvida, os tradicionais gráficos de
Shewhart. No Brasil, por exemplo, o mais comum deles (o par de gráficos X e R), que
mostra a média de vários subgrupos racionais de observações sucessivas, é enfatizado
na maioria das literaturas de controle de qualidade existentes como se não houvesse
nenhum outro tipo de gráfico. Apesar de extremamente eficazes, estas ferramentas
estatísticas não são as únicas disponíveis para monitorar a qualidade de um processo.
Em alguns casos, outros tipos de gráficos de controle podem ser utilizados com a
mesma finalidade, e com vantagens. É o caso dos gráficos de controle de Soma
Acumulada (Cumulative Sum Control Charts - CUSUM).
Os gráficos de controle de Shewhart proporcionam uma grande sensibilidade no
diagnóstico de causas especiais esporádicas ou intermitentes como, por exemplo, a troca
de operadores em uma produção que opera em dois ou três turnos. Se, por hipótese, os
operadores de um dos turnos não estiverem treinados, este fato se tornará evidente no
gráfico de Shewhart, através de pontos fora de controle estatístico, conforme figura 1.
Figura1 - Exemplo de um gráfico de controle de Shewhart
Representação de um Gráfico de Shewhart
15
15,5
16
16,5
17
17,5
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Ordem das amostras
Méd
ias
LIC
LMC Pontos fora de controle: P, R e T
LMCInício da troca do turno
P R T
Já nos casos em que há uma causa identificável no sistema, que gera uma
pequena e constante variação na média ou na variabilidade (amplitude ou desvio
padrão), os gráficos de controle de Shewhart apresentarão uma tendência nos valores
plotados para as amostras. Apesar de existirem algumas regras práticas para executar
este tipo de análise (sete pontos consecutivos do mesmo lado da linha central, por
Cadernos do IME – Série Estatística Alves, Cruz, Henning & Neto
47
exemplo, é considerado como “sinal de alarme”), detectar esta tendência nem sempre é
fácil, e exige conhecimento por parte do responsável pela análise do processo. E mesmo
que venha a ser percebida, é difícil determinar através dos gráficos de controle de
Shewhart, quando o processo começou a deteriorar-se. Exatamente nestes casos, o uso
de gráficos de controle de soma acumulada (CUSUM) pode ser vantajoso, isto é,
quando existe outro tipo de causa especial persistente até que uma ação seja tomada
para eliminar a causa. Seu processo de decisão baseia-se na soma acumulada dos
resultados, e não em observações isoladas de amostras. Isto torna os gráficos CUSUM
mais sensíveis a uma pequena e contínua alteração das condições do processo.
Hawkins (1998) justifica que os gráficos CUSUM são mais apropriados do que
os gráficos de Shewhart para diagnosticar pequenas e persistentes mudanças de um
processo usando o seguinte exemplo: Num laboratório químico se um lote novo de
substância não tiver a composição adequada, os ensaios são influenciados e o lote é
substituído. Utilizando os gráficos de Shewhart dificilmente se conseguirá em tempo
hábil a substituição deste lote, a menos que estas causas especiais persistentes tenham
efeitos muito grandes. Além disso, os gráficos de Shewhart não são suficientemente
adequados para estimar quando, e de quanto a mudança de um processo pode ser um
indicativo útil para diagnosticar uma determinada causa especial persistente.
2. Gráficos de Controle de Soma Acumulada (Gráficos CUSUM)
Os gráficos de controle CUSUM inicialmente propostos na Inglaterra por Page
(1954) são alternativas viáveis aos gráficos de Shewhart. Estes gráficos incorporam
diretamente, toda a seqüência de informações demarcando as somas acumuladas dos
desvios de em relação ao valor-alvo (valor nominal). Supondo que amostras de
tamanho n são coletadas, é a média da j-ésima amostra e é o valor desejado para a
média do processo. A estatística CUSUM é formada demarcando a quantidade da
equação (1) junto à amostra i
)( 011 µ−= xC
)()(oo
xxC µµ −+−= 212= )( 21 oxC µ−+
=−+−+−= )()()( 3213 ooo xxxC µµµ )( 32 oxC µ−+ .....
∑=
− −+=−=i
j
oiioii xCxC1
1 )()( µµ (1)
Cadernos do IME – Série Estatística A Utilização de Gráficos de Controle...
48
onde iC é a soma acumulada incluindo a i-ésima amostra, pois combinam informações
de diversas amostras. Se o processo permanece sob controle para o valor desejado oµ ,
as somas acumuladas definidas em (1) descrevem um percurso aleatório com média
zero. Porém, se a média muda para algum valor acima 1µ > oµ , então a tendência
ascendente se desenvolverá na soma acumulada iC . Reciprocamente, se a média muda
para algum valor abaixo 1µ < oµ , a soma acumulada iC terá uma direção negativa. Por
esta razão, se nos pontos demarcados aparecer uma tendência para cima ou para baixo,
deve-se considerar isto como uma evidência de que a média do processo mudou e uma
busca de causas assinaláveis deve ser realizada.
Há dois procedimentos diferentes para monitorar a média de um processo via
gráficos de controle CUSUM: Algoritmo CUSUM e Máscara V.
O procedimento Algoritmo CUSUM tem a propriedade de armazenar os valores
das somas unilaterais acumuladas do processo analisado. Seja ix a i-ésima observação
do processo. Quando o processo está sob controle, ix tem uma distribuição normal com
média oµ e desvio padrão .σ Se o processo tende a se afastar do valor pretendido, o
gráfico CUSUM indica a presença de uma causa assinalável que deve ser investigada,
como acontece no caso dos gráficos de Shewhart. As estatísticas +
iC e −
iC são
denominadas Cusum superior e Cusum inferior unilaterais, conforme equações (2) e (3).
])(,0[ 1+−
+ ++−= ioii CKxmáxC µ (2)
])(,0[ 1−−
− +−−= iioi CxKmáxC µ (3)
onde 000 == −+CC . Se +
iC ou −iC , excede o intervalo de decisão H, o processo é
considerado fora de controle. Um valor razoável para H é cinco vezes o desvio padrão
σ do processo. Nas equações (2) e (3), K é denominado de valor de referência e,
corresponde aproximadamente a metade do valor, no qual há interesse em detectar
rapidamente determinada mudança entre oµ (valor nominal) e o valor da média fora de
controle 1µ . Se esta mudança é esperada em unidades de desvio padrão, então K
representa a metade da magnitude desta mudança ou
Cadernos do IME – Série Estatística Alves, Cruz, Henning & Neto
49
=K2
∆=
201 µµ −
= σδ
2 (4)
ondeδ é o tamanho da mudança em unidades de desvio padrão;σ é o desvio padrão; oµ
o valor pretendido (alvo); ∆ o valor do deslocamento que estamos interessados e
=1µ oµ + ∆ o valor da média fora de controle. A outra abordagem envolve a
padronização dos dados apresentados, supondo que os valores da variável ix seguem
distribuição N(0,1) conforme equações (5) e (6):
],0[ 1+−
+ +−= iii CkymáxC (5)
],0[ 1−−
− +−−= iii CykmáxC = ],0[ 1−−++ ii Cykmín (6)
Para isso, antes de efetuar os cálculos de +iC e −
iC padroniza-se a variável ix
fazendo σ
µ nxy o
i
i
)( −= como a variável padronizada de ix .
No procedimento Algoritmo CUSUM, o gráfico é projetado pela escolha
adequada ds valor de referência K e do intervalo de decisão H (limites inferior e
superior do gráfico CUSUM) capaz de minimizar falsos alarmes para a amplitude da
mudança que se deseja detectar .
Montgomery (2004), recomenda que o melhor modelo matemático para
selecionar estes valores é definí-los conforme equações (7) e (8):
nkK
σ= (7)
nhH
σ= (LSC)
nhH
σ−= (LIC) (8)
onde parâmetros k e h são freqüentemente usados com os valores k=0,5 e h=5
respectivamente, e σ o desvio padrão dos dados.
Em geral, recomenda-se que esses parâmetros sejam escolhidos de modo a
fornecer um bom desempenho (ARL) do gráfico CUSUM. Se escolhermos h=4,77, isso
resultará em um gráfico CUSUM com ARLo = 370 amostras, o que coincide com o
valor de ARLo para um gráfico de controle de Shewhart com os limites σ3 habituais.
Hawkins (1993), recomenda os valores para k e os correspondentes valores de h
que resultam ARLo = 370, conforme tabela 1.
Cadernos do IME – Série Estatística A Utilização de Gráficos de Controle...
50
Tabela.1 Valores de k e h que geram ARLo = 370 sugeridos para o Algoritmo CUSUM
k 0,25 0,5 0,75 1,0 1,25 1,5
h 8,01 4,77 3,34 2,52 1,99 1,61
Fonte: Hawkins (1993)
Os valores de k e h conforme tabela (1) são calculados com uma confiabilidade
idêntica a do gráfico de Shewhart (temos uma probabilidade de 0,27% de cometermos
um erro tipo I, isto é, de o gráfico apresentar um sinal de alarme sem que a média
efetivamente tenha se deslocado de seu valor original).
No procedimento Algoritmo CUSUM, é possível a partir dos valores das somas
unilaterais acumuladas do processo analisado determinar a estimativa do valor médio do
processo ( µ̂ ) após a emissão do sinal fora de controle (Montgomery, 2004):
=µ̂
>++
>++
−
−
−
+
+
+
HCseN
CK
HCseN
CK
i
i
o
i
i
o
,
,
µ
µ
(9)
O procedimento Máscara V proposto por Barnard (1959) é um método gráfico
alternativo utilizado além do Algoritmo CUSUM que permite por inspeção dos pontos
representados decidir se ocorreu ou não um desvio no valor médio oµ desejado. Este
procedimento é aplicado a sucessivos valores da estatística CUSUM
11
−=
+==∑ ii
i
j
ii CyyC (10)
onde iy é a observação padronizada
σ
µ nxy oi
i
)( −= .
Estes dois procedimentos Algoritmo CUSUM e Máscara V apesar de serem
diferentes têm a mesma função e apresentam vantagens e desvantagens. A escolha de
cada um deles para monitorar a média do processo depende dos recursos
computacionais disponíveis para a escolha dos mesmos (Alves, 2003).
Neste artigo, o desenvolvimento do procedimento Algoritmo CUSUM em uma
planilha eletrônica MS-Excel®, permite avaliar em tempo real a média do processo para
cada ponto plotado no gráfico. Com a utilização do aplicativo RExcel (Neuwirth et al.,
2009) é possível efetuar análises estatísticas mais completas, como avaliar a
Cadernos do IME – Série Estatística Alves, Cruz, Henning & Neto
51
normalidade e a ausência de auto-correlação dos dados, condição necessária para
gráficos CUSUM e Shewhart. O RExcel, que está disponível na Internet, faz com que
funções do ambiente GNU R (R Core Development Team, 2009) possam rodar na
própria planilha. É, portanto, uma alternativa para aplicação de controle estatístico on-
line de processos, que pode ser facilmente desenvolvida pelo próprio usuário.
3. Informações do Processo de Usinagem
Os dados reais utilizados neste artigo são referentes a um processo de usinagem
do corpo da válvula de descarga cedidos por uma indústria de metais sanitários
localizada na cidade de Joinville-SC. Nesse processo, a parte interna do corpo da
válvula de descarga é usinada para a obtenção de um alojamento no seu interior onde é
colocado para vedar um anel oring de borracha durante a montagem da válvula de
descarga.
O processo de usinagem deste alojamento para o anel oring requer uma alta
precisão para evitar possíveis vazamentos durante seu uso. Nesse processo, a
característica da qualidade utilizada para o monitoramento com gráficos de controle
CUSUM é a medida diâmetro do alojamento para o anel de oring do corpo da válvula de
descarga cujo valor nominal é 46,515 ± 0,185 mm. Esta característica da qualidade é
atualmente monitorada via gráficos de controle X de Shewhart com 25 amostras de
tamanho n=8 coletadas diariamente a cada hora de produção. A escolha desta
característica da qualidade se deve ao fato de tratar-se de um processo de alta precisão,
cuja variação na amplitude da média do processo é extremamente pequena. Esta alta
precisão condiciona a aplicação de gráficos de controle com maior sensibilidade na
detecção de pequenos desvios, tais como os gráficos CUSUM. Por esta razão, com base
em dados históricos e acompanhamentos do processo a partir de dados recentes,
decidiu-se detectar um pequeno desvio na média do processo de apenas 0,001mm acima
do valor nominal.
Os dados históricos indicam um processo sob controle cujas médias se
aproximam a uma distribuição normal com média iX = 46,515mm e desvio padrão de
0,02mm. Os dados recentes deste processo, coluna B (Figura1), também revelam que o
valor médio se manteve constante em torno de 46,515mm com um desvio padrão de
Cadernos do IME – Série Estatística A Utilização de Gráficos de Controle...
52
0,02mm até a 15a amostra, e, a partir da 16a amostra este processo sofreu um acréscimo
de 0,001mm passando a ser igual a 46,516mm.
Os dados do processo são: oσ =0,02mm (Desvio padrão conhecido do processo);
oµ = 46,515 mm (Valor nominal); 1µ = 46,516 mm (Valor médio do processo para o
estado fora de controle); desvio do valor nominal ∆=0,001mm e intervalo de decisão H
(limites inferior e superior do gráfico CUSUM) obtido a partir da equação 8.
4. Construção dos Gráficos de Controle CUSUM
Para ilustrar a sistemática de desenvolvimento dos gráficos de controle CUSUM,
foram utilizados dados reais do processo de usinagem em estudo, conforme Figura 2
(planilha eletrônica).
Existem vários métodos para se construírem gráficos CUSUM. Neste artigo,
optamos pela metodologia proposta por Hawkins (1993). Para tal, desenvolveu-se uma
planilha eletrônica (figura 2) em ambiente MS-Excel cujas fórmulas inseridas nas
células desta planilha geram dados para a análise estatística antecipada do processo,
bem como a utilização dos mesmos para a construção dos gráficos de controle.
Conforme planilha eletrônica utilizada neste artigo para a construção do gráfico
CUSUM, a coluna B apresenta a média dos 25 subgrupos racionais do processo. As
colunas C, D e E, representam respectivamente os limites de controle LIC, LMC e LSC
do gráfico de controle X de Shewhart ( σ3 ) cujos valores são obtidos conforme modelo
matemático:
LIC=n
o
o
σµ 3− LMC= oµ LIC=
n
o
o
σµ 3+ (11)
A coluna F representa a Soma Acumulada Ci que é obtida conforme equação (1).
As colunas G e I, representam respectivamente, as estatísticas +iC e −
iC do Algoritmo
CUSUM, obtidas pelas equações (2) e (3). As colunas H e J, representam
respectivamente os contadores +N e
−N de períodos +iC e −
iC não nulos. As colunas K
e L, representam respectivamente os intervalos de decisão H e –H (limites de controle
utilizado no Algoritmo CUSUM), obtidos pelas equação (8). Além disso, o valor de
referência K (Célula E30), obtido conforme equação (4) e o valor h=4,77 (Célula
Cadernos do IME – Série Estatística Alves, Cruz, Henning & Neto
53
K30), obtido da tabela 1 cuja escolha se deve a um gráfico CUSUM com confiabilidade
idêntica ao gráfico de controle X de Shewhart ( σ3 ).
Figura 2 - Planilha eletrônica dos dados gerados a partir das informações do processo
Os dados do processo se comportam segundo uma distribuição normal e não
apresentam autocorrelação (figura 3). A verificação da normalidade e independência
dos dados do processo foi desenvolvida com auxílio do aplicativo RExcel (NEUWIRTH
et al. 2009).
Os gráficos de controle: X de Shewhart, Algoritmo CUSUM, Status CUSUM e
o CUSUM (com a Máscara V) obtidos dos dados gerados a partir da planilha eletrônica
(figura 2) são ilustrados nas figuras 4, 5, 6 e 7.
No gráfico X de Shewhart (figura 4) nenhum ponto ultrapassa as linhas de
controle. O aumento na média do processo não é detectado. É possível melhorar a
sensibilidade do gráfico Shewhart com auxílio das regras suplementares, mas a
incorporação dessas regras, segundo Costa et al. (2004), diminui a simplicidade de
interpretação do gráfico e aumenta o número de alarmes falsos.
Cadernos do IME – Série Estatística A Utilização de Gráficos de Controle...
54
Figura 3 – Gráficos: Normalidade e Autocorrelação dos dados do processo
Figura 4 - Gráfico de Controle de Shewhart (Xbarra)
Gráfico de Controle de Shewhart (Xbarra)
46,49046,49546,500
46,50546,51046,51546,52046,525
46,53046,53546,540
0 5 10 15 20 25
Subgrupos racionais
Méd
ias
dos
subg
rupo
s ra
cion
ais
Médias dos subgrupos racionais LIC( 3 Sigmas ) LMC LSC( 3 Sigmas )
Como se pode observar, o gráfico CUSUM (figura 5) assinala um deslocamento
no nível médio do processo a partir da 16ª amostra, ultrapassando o limite superior do
Cadernos do IME – Série Estatística Alves, Cruz, Henning & Neto
55
CUSUM na 19ª. Amostra. Isto é reforçado na figura 6, onde num mesmo gráfico, estão
os dados observados e as estatísticas CUSUM inferior e superior.
Figura 5 - Gráfico de Controle CUSUM
Figura 6 - Gráfico de STATUS CUSUM
Gráfico de STATUS CUSUM
-0,08-0,07-0,06-0,05-0,04-0,03-0,02-0,01
00,010,020,030,040,050,060,070,080,09
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Alg
oritm
o C
US
UM
46,47
46,48
46,49
46,50
46,51
46,52
46,53
46,54G
ráfic
o de
She
wha
rt
( X
barr
a )
Ci+ (CUSUM Superior) Ci - (CUSUM Inferior) Gráfico de Shew hart( Xbarra)
A máscara V é apresentada na figura 7. Indica um aumento no valor médio deste
processo a partir da 17ª. amostra.
Cadernos do IME – Série Estatística A Utilização de Gráficos de Controle...
56
Figura 7 - Gráfico CUSUM (Procedimento: Máscara V)
Gráfico CUSUM (Procedimento: Máscara V)
-0,090-0,080
-0,070-0,060
-0,050-0,040
-0,030-0,020
-0,0100,000
0,0100,020
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27Subgrupos Racionais
Som
a A
cum
ula
da
( C
i )
Verificou-se, analisando os gráficos das figuras 4, 5, 6 e 7, que somente os
procedimentos CUSUM sinalizaram o aumento na média, pequeno, mas fundamental,
em virtude da precisão desejada neste processo.
Embora os gráficos Shewhart sejam atrativos pela simplicidade de aplicação e
uso, só são eficazes para detectar grandes (e repentinas) alterações. Os gráficos
CUSUM são ótimos para sinalizar pequenos a moderados (e persistentes) desvios na
média de um processo. Além disso, de acordo com Gomes et al. (2008), no
acompanhamento de uma seqüência do processo, o gráfico CUSUM mostra exatamente
onde saiu de controle e quando voltou.
5. Conclusões e Considerações Finais
Os resultados obtidos a partir de dados reais neste artigo, mostram os gráficos
CUSUM como ferramentas muito úteis no monitoramento deste processo de usinagem.
Em primeiro lugar, porque se mostraram mais sensíveis do que os gráficos de controle
X de Shewhart para detectar pequena mudança (variação) na média da característica da
qualidade monitorada. Em segundo lugar, porque foi possível determinar quando esta
mudança ocorreu e estimar tanto a amplitude desta mudança quanto o novo valor médio
deste processo para o intervalo após a mudança. Os resultados deste estudo são
apresentados a partir dos gráficos de controle desenvolvidos para os dados deste
processo (figuras 4, 5, 6 e 7).
Cadernos do IME – Série Estatística Alves, Cruz, Henning & Neto
57
− O gráfico de controle X de Shewhart com seqüência de pontos que não violam as regras de decisão não foi capaz para detectar um sinal fora de controle. Além disso, não foi suficientemente sensível para sinalizar o momento da mudança no valor médio deste processo.
− O Algoritmo CUSUM assinala mudança no nível médio deste processo com os pontos fora dos intervalos de decisão H e –H
− O gráfico CUSUM com a Máscara V confirma um aumento considerável no valor médio deste processo a partir da 17a amostra, assinalando assim o início deste aumento.
A utilização de dados reais na realização deste estudo foi imprescindível para
que fundamentos teóricos sobre gráficos CUSUM fossem transferidos para uma
situação prática.
Referências
ALVES, C.C. Gráficos de controle CUSUM: um enfoque dinâmico para a análise estatística de processos. Dissertação de Mestrado em Engenharia de Produção, UFSC, Florianópolis, 2003.
BARNARD, G.A. Control Charts and Stochastic Processes, Journal of the Royal Statistical Society, 21, 239-271, 1959.
COSTA, A. F.B. EPPRECHT, E. K. CARPINETTI, L.C.R. Controle Estatístico de Qualidade. São Paulo: Editora Átlas S.A, 2004.
GOMES, I.C., OLIVEIRA, C.L., MINGOTI, S.A. Estudo da Aplicação de Gráficos de Controle na vigilância de Infecçoes Hospitalares no Hospital das Clínicas da UFMG. In: SIMPEP - SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO, 15. Bauru. Anais: ... Bauru: UNESP, 2008. Disponível em: < http://www.simpep.feb.unesp.br/anais_simpep.php?e=1> Acesso em: 04 mai. 2009.
HAWKINS, D.M., OLWELL, D.H. Cumulative Sum Control Charting: An Underutilized SPC Tool, Quality Engineering, 5 (3), 463-477, 1993
HAWKINS, D.M., OLWELL, D.H. Cumulative Sum Charts and Charting for Quality Improvement. Engineering and Physical Science, Springer, 1998.
MONTGOMERY, D. C. Introdução ao Controle Estatístico da Qualidade. 4 ed., Rio de Janeiro: LTC Editora, 2004.
PAGE, E.S. Continuous Inspection Schemes, Biometrika, 41, 100-115, 1954.
NEUWIRTH, E., HEIBERGER, R., RITTER, C., PIETERSE J. K., VOLKERING, J. RExcelInstaller: Integration of R and Excel, (use R in Excel, read/write XLS files), 2009. Disponível em: < http://rcom.univie.ac.at/ >. Acesso em 02/02/2010.
R DEVELOPMENT CORE TEAM. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria, 2009. Disponível em: http://www.R-project.org. Acesso em 04/02/2010.
Cadernos do IME – Série Estatística A Utilização de Gráficos de Controle...
58
THE USE OF CUMULATIVE SUM CHARTS (CUSUM) FOR MONITORING A MACHINING PROCESS
Abstract
This paper presents the CUSUM control charts as an alternative and more appropriate
procedure than the traditional Shewhart charts to detect small deviations from the
average value of a machining process. The objective of this work is to investigate based
on a comparative study whether there is significant difference in sensitivity between the
use of these charts and Shewhart charts in detecting small changes in the process mean.
In this study, we used real data from a machining process for application of CUSUM
control charts in monitoring this process, which is currently done with Shewhart charts.
This study was essential in defining to define the best choice between the charts for
statistical analysis of this process.
Keywords: Statistical Tools, CUSUM charts; Industrial processes.
CADERNOS DO IME
Série Estatística
A revista Cadernos do IME é um veículo de divulgação de trabalhos acadêmicos publicado pelo Instituto de Matemática e Estatística da Universidade do Estado do Rio de Janeiro.
A revista é semestral, sendo publicada em junho e dezembro. São aceitos trabalhos inéditos e que apresentem elementos de originalidade, em português, inglês ou espanhol.
Os Cadernos do IME aceitam os seguintes tipos de contribuições:
• Artigo técnico, trabalho de pesquisa com elementos de originalidade;
• Resenha / Revisão, revisão de literatura e análise crítica de produtos;
• Comunicação, texto destinado destinado à informação sobre trabalhos de graduação e de pós-graduação; à divulgação de opiniões, pesquisas em andamento.
Os artigos não devem ultrapassar 12 páginas. Os arquivos digitais no formato word deverão ser encaminhados aos editores da série. As chamadas de trabalho estão disponíveis na página da revista. Processo de Avaliação: Os artigos submetidos à publicação são avaliados em sistema blind-review por consultores ad-hoc pertencentes ao corpo de avaliadores da revista. Com base nestas avaliações, a Editoria da revista selecionará os artigos para publicação Os conteúdos e pontos de vista expressos nos trabalhos publicados são de inteira responsabilidade dos autores. Correspondência: Universidade do Estado do Rio de Janeiro Instituto de Matemática e Estatística Rua São Francisco Xavier, 524 - Pavilhão Reitor João Lyra Filho- 6º andar Maracanã - 20550-900 – Rio de Janeiro, RJ Telefax: 21 2334-0144 www.ime.uerj.br/cadernos/cadest
Ricardo Vieiralves de Castro Reitor
Maria Christina Paixão Maioli
Vice-Reitora Maria Georgina Muniz Washington Diretora do Centro de Tecnologia e Ciência
Sérgio Luiz Silva Diretor do Instituto de Matemática e Estatística Geraldo Magela da Silva Vice- Diretor do Instituto de Matemática e Estatística Rubens Andre Sucupira Departamento de Análise Matemática Jéssica Ruth Gavia Zurita Departamento de Estruturas Matemáticas Mara de Carvalho de Souza Departamento de Geometria e Representação Gráfica Mariluci Ferreira Portes Departamento de Informática e Ciência da Computação Guilherme Caldas de Castro Departamento de Estatística Maurício Pereira dos Santos Departamento de Matemática Aplicada
apoio