Download pdf - Cadernos Do IME - Serie a Vol 27

UNIVERSIDADE DO ESTADO DO RIO DE JANEIRO

Dezembro de 2009 ISSN 1413-9022 CCAADDEERRNNOOSS DDOO IIMMEE

SSéérriiee EEssttaattííssttiiccaa –– VVoolluummee 2277

Uso dos Modelos Previvazm e Previvaz para Previsão de Afluências Mensais aos Aproveitamentos Hidroelétricos Tucuruí e Curuá-Una Maria Teresa Chico Rivera Quintão; Saulo Aires de Souza; Fernanda da Serra Costa; Jorge Machado Damázio

1

Cálculo do NMA do Gráfico de Controle de Regressão Danilo Cuzzuol Pedrini; Carla Schwengber ten Caten

13

Previsão do Preço de Venda da Uva Itália e da Manga Tommy Produzidas no Vale do São Francisco via Análise de Séries Temporais: um Estudo de Caso Abdinardo Moreira Barreto de Oliveira; Marcelo José Vieira de Melo Sobrinho

29

A Utilização de Gráficos de Controle de Soma Acumulada (CUSUM) para Monitoramento de um Processo de Usinagem Custodio da Cunha Alves; Altair Carlos Cruz; Elisa Henning; Arnoldo Schmidt Neto

45

UNIVERSIDADE DO ESTADO DO RIO DE JANEIRO

apoio

CADERNOS DO IME

Série Estatística

Publicação semestral, com circulação em junho e dezembro, do Instituto de Matemática e Estatística (IME), da Universidade do Estado do Rio de Janeiro (UERJ). Ricardo Vieiralves de Castro Reitor Maria Christina Paixão Maioli Vice-Reitora Maria Georgina Muniz Washington Diretora do Centro de Tecnologia e Ciência Sérgio Luiz Silva Diretor do Instituto de Matemática e Estatística Geraldo Magela da Silva Vice- Diretor do Instituto de Matemática e Estatística Normalização, divulgação e distribuição: Biblioteca do Centro de Ciências de Tecnologia A (CTC/A) da rede Sirius de Biblioteca da UERJ – [email protected] Editor: Prof. Dr. José Fabiano da Serra Costa - UERJ Corpo Editorial: Prof. Dr. Albert Cordeiro Geber de Melo - CEPEL Prof. Dr. Annibal Parracho Sant’Anna - UFF Prof. Dr. Carlos Alberto Nunes Cosenza - UFRJ Prof. Dra. Fernanda da Serra Costa - UERJ Prof. Dr. Fernando Antonio Lucena Aiube - PUC-RJ/PETROBRAS Prof. Dr. Helder Gomes Costa - UFF Prof. Dr. Jorge Machado Damázio - UERJ Prof. Dr. Luis Felipe Dias Lopes - UFSM Os artigos enviados para publicação deverão ser inéditos, com exceção de resumos ou teses, são de responsabilidade de seus autores, e não refletem, necessariamente, a opinião do IME. Sua reprodução é livre, em qualquer outro veículo de comunicação, desde que citada a fonte.

Dezembro de 2009 ISSN 1413-9022 CCAADDEERRNNOOSS DDOO IIMMEE

SSéérriiee EEssttaattííssttiiccaa –– VVoolluummee 2277

Uso dos Modelos Previvazm e Previvaz para Previsão de Afluências Mensais aos Aproveitamentos Hidroelétricos Tucuruí e Curuá-Una Maria Teresa Chico Rivera Quintão; Saulo Aires de Souza; Fernanda da Serra Costa; Jorge Machado Damázio

1

Cálculo do NMA do Gráfico de Controle de Regressão Danilo Cuzzuol Pedrini; Carla Schwengber ten Caten

13

Previsão do Preço de Venda da Uva Itália e da Manga Tommy Produzidas no Vale do São Francisco via Análise de Séries Temporais: um Estudo de Caso Abdinardo Moreira Barreto de Oliveira; Marcelo José Vieira de Melo Sobrinho

29

A Utilização de Gráficos de Controle de Soma Acumulada (CUSUM) para Monitoramento de um Processo de Usinagem Custodio da Cunha Alves; Altair Carlos Cruz; Elisa Henning; Arnoldo Schmidt Neto

45

USO DOS MODELOS PREVIVAZM E PREVIVAZ PARA PREVISÃO DE AFLUÊNCIAS MENSAIS AOS

APROVEITAMENTOS HIDROELÉTRICOS TUCURUÍ E CURUÁ-UNA

Maria Teresa Chico Rivera Quintão

ELETRONORTE Centrais Elétricas do Norte do Brasil [email protected]

Saulo Aires de Souza

CEPEL Centro de Pesquisas de Energia Elétrica [email protected]

Fernanda da Serra Costa

CEPEL Centro de Pesquisas de Energia Elétrica UERJ Universidade do Estado do Rio de Janeiro

[email protected]

Jorge Machado Damázio

CEPEL Centro de Pesquisas de Energia Elétrica UERJ Universidade do Estado do Rio de Janeiro

[email protected]

Resumo

O planejamento da operação de aproveitamentos hidroelétricos envolve a obtenção e

previsões de afluências para diferentes horizontes e discretização temporal. Em tempo

real podem ser necessárias previsões a nível horário para o horizonte de 24 horas,

enquanto que para um planejamento de médio prazo utiliza-se a previsão de afluências

mensais com horizonte de alguns meses, sendo o maior interesse na previsão para o

próximo mês. Para o último caso, a abordagem de modelagem clássica, consiste em se

adotar um modelo estatístico que considere os efeitos da sazonalidade climática e da

tendência hidrológica, como é o caso dos modelos auto-regressivos e média móvel

adotados nos modelos PREVIVAZM e PREVIVAZ. Este artigo apresenta um estudo do

uso do modelo PREVIVAZM para prever as afluências mensais um passo a frente para

os aproveitamentos hidroelétricos de Tucuruí e Curuá-Una acoplado ao uso do

PREVIVAZ para completar o total afluente do mês em curso.

Palavras-chave: Planejamento da Operação de Hidroelétricas, Previsão de Afluências,

Modelos Estocásticos.

CADERNOS DO IME – Série Estatística Universidade do Estado do Rio de Janeiro - UERJ

Rio de Janeiro – RJ - Brasil ISSN 1413-9022 / v. 27, p. 01 - 12, 2009

Cadernos do IME – Série Estatística Uso dos Modelos Previvazm e Previvaz...

2

1. Introdução

O planejamento da operação de aproveitamentos hidroelétricos envolve a

obtenção e previsões de afluências para diferentes horizontes e discretização temporal.

Em tempo real podem ser necessárias previsões a nível horário para o horizonte de 24

horas, enquanto que para um planejamento de médio prazo utiliza-se a previsão de

afluências mensais com horizonte de alguns meses, sendo o maior interesse na previsão

para o próximo mês. Para o último caso, a abordagem de modelagem clássica, consiste

em se adotar um modelo estatístico que considere os efeitos da sazonalidade climática e

da tendência hidrológica, como é o caso dos modelos auto-regressivos e média móvel

utilizados adotados nos modelos PREVIVAZM e PREVIVAZ (COSTA et al, 2007).

Quando a tendência hidrológica é utilizada uma dificuldade é a sua atualização a

partir dos dados mais recentes de afluência. Em geral, no momento de realização da

previsão, a vazão correspondente ao último intervalo de tempo da tendência hidrológica

ainda não está disponível, por exemplo, quando se deseja prever a afluência do mês

seguinte antes do mês corrente terminar. Uma forma de estimar a vazão do mês em

curso consiste em utilizar previsões a intervalos de tempo menores para o mês.

Este artigo apresenta um estudo do uso do modelo PREVIVAZM para prever as

afluências mensais um passo a frente para os aproveitamentos hidroelétricos de Tucuruí

e Curuá-Una acoplado ao uso do PREVIVAZ para completar o total afluente do mês em

curso.

2. Modelos PREVIVAZ e PREVIVAZM

Os modelos PREVIVAZ e PREVIVAZM utilizam o componente determinístico

de modelos de séries temporais que representam tanto o comportamento sazonal do

clima quanto a tendência hidrológica, esta ultima conhecida na terminologia de séries

temporais como estrutura de dependência temporal. Essencialmente, qualquer estrutura

de dependência temporal sazonal pode ser reproduzida por modelos de séries temporais

lineares do tipo PARMA(p,q), sendo este tipo de modelo uma abordagem bastante

flexível, e bastante popular para a modelagem estocástica de vazões fluviais (HIPEL e

MCLEOD, 1994). O PREVIVAZ e o PREVIVAZM utilizam modelos lineares do tipo

PARMA(p,q) (BOX & JENKINS, 1970), acoplado a diferentes pré-transformações das

séries históricas, tipo Box&Cox ou logarítmicas (BOX & COX, 1964) e a diferentes

Cadernos do IME – Série Estatística Quintão, Souza, Costa & Damázio

3

formas de estimação de parâmetros dos modelos, para obtenção de previsões de vazões

semanais e mensais respectivamente.

Nos modelos PREVIVAZ, e PREVIVAZM os algoritmos de previsão, definidos

por um modelo, método de estimação específico e transformação da série de vazões, são

testados por um esquema onde cada série é dividida em duas partes. Inicialmente,

apenas a primeira parte da série é utilizada para a estimação dos parâmetros (estimação)

e a segunda parte apenas para o cálculo de erros de previsão (verificação). Em seguida,

a estimação dos parâmetros passa a ser feita com a segunda parte da série, ficando a

primeira parte apenas para cálculo de erros de previsão. Para cada parte da série é

computado o erro padrão de previsão (raiz quadrada da média dos quadrados dos erros

de previsão - EQM) um passo à frente obtendo-se, a seguir, a média dos dois valores. A

cada semana/mês escolhe-se o algoritmo de menor erro médio quadrático de previsão

um passo a frente.

3. Metodologia Adotada

Para a avaliação do uso dos modelos PREVIVAZ e PREVIVAZM simulou-se a

obtenção de previsões mensais um passo a frente considerando-se quatro situações:

1- a vazão do mês corrente é conhecida (situação mais favorável, considerada como controle),

2- desconsidera-se todas as informações do mês corrente e utiliza-se o PREVIVAZM para fazer a previsão dois passos a frente (situação mais desfavorável),

3- a vazão do mês corrente é estimada, de forma expedita pela média das vazões diárias já registradas no mês,

4- a vazão do mês corrente é formada pelas vazões semanais observadas do mês corrente, com excessão da vazão da última semana que é obtida pelo modelo PREVIVAZ.

As previsões foram comparadas com os valores observados através da média do

erro percentual absoluto para todo o período disponível e para os períodos úmido, seco,

e de transição.

4. Estudo de Caso

O aproveitamento hidroelétrico de Tucuruí, inaugurado em 1985, está localizado

na região Norte do País, imediatamente a montante da cidade de Tucuruí as margens rio

Tocantíns. O rio Tocantíns nasce no Planalto Central Brasileiro e tem sua foz no


4

estuário do rio Amazonas. A área da bacia de captação é de aproximadamente 758.000

km2 e a afluência média ao local do aproveitamento é 11.000 m3/s. O volume útil de

seu reservatório é de 38.982 hm3. A potência instalada é 8.370 MW.

O aproveitamento hidroelétrico de Curuá-Una localizado também na região

Norte do País, à 70 Km ao sul da cidade de Santarém, no rio Curuá-Una afluente da

margem direita do rio Amazonas, a área de drenagem associada é de 153.000 km2 e a

afluência média ao local do aproveitamento é 188 m3/s. Foi inaugurado em 1977 e

interligado ao aproveitamento de Tucuruí em 1999. Seu reservatório possui um volume

útil de 400 hm3. A potência instalada é 30 MW.

Estavam disponíveis, para os dois aproveitamentos, séries históricas de vazões

mensais e diárias abrangendo o período de 1931 à 2006. As figuras 1 e 2 apresentam

hidrogramas das vazões mensais para alguns anos do histórico para os aproveitamentos

de Tucuruí e Curuá-Una, respectivamente. Pode-se observar que nos dois casos o

regime hidrológico é bem definido com estação seca ocorrendo entre os meses de Julho

e Novembro para Tucuruí e entre os meses de Setembro e Dezembro para Curuá-Una e

estação úmida ocorrendo entre os meses de Fevereiro e Abril para Tucuruí e entre os

meses de Março e Junho para Curuá-Una.

Figura 1. Hidrogramas de vazões mensais - Tucuruí

HIDROGRAMA DE VAZÕES MENSAIS - TUCURUÍ

0

10000

20000

30000

40000

50000

60000

MES

VA

ZÃ

O (m

³/s)

1931-1933 1944-1946 1956-1958 1962-1964 1973-1975 1985-1987 1997-1999 2005-2007


5

Figura 2. Hidrogramas de vazões mensais - Curuá-Uma

HIDROGRAMA DE VAZÕES MENSAIS - CURUÁ-UNA

0

100

200

300

400

500

600

700

800

900

MES

VA

ZÃ

O (m

³/s)

1931-1933 1944-1946 1956-1958 1962-1964 1973-1975 1985-1987 1997-1999 2005-2007

A partir das séries históricas de vazões diárias foram construídas séries de

vazões semanais, considerando as semanas do PMO (Programa Mensal de Operação),

necessárias para aplicação do modelo PREVIVAZ na situação 4, descrita no item 3. O

período de 1931 a 1995 foi utilizado para a estimação dos parâmetros dos modelo

PREVIVAZM e PREVIVAZ. A simulação das previsões de afluências mensais foi feita

para o período de 2004 a 2006, que corresponde ao período de disponibilidade das

estimativas expeditas da situação 3 descrita no item 3.

5. Resultados

- Caso Tucuruí

Na figura 3 são comparadas as previsões mensais obtidas nas quatro situações

com as vazões observadas. Na figura 4 são apresentados os erros percentuais absolutos

das previsões mensais obtidas em cada situação. Pode-se observar que a situação 1 é

que fornece as melhores previsões e a situação 2, conforme esperado, é a que fornece as

piores previsões. As situações 3 e 4 são similares e se aproximam da situação 1.


6

Figura 3. Comparação entre a vazão mensal observada e prevista - Tucuruí

0

5000

10000

15000

20000

25000

30000

35000

40000

JAN

ABRJU

LO

UTJA

NABR

JUL

OUT

JAN

ABRJU

LO

UT

TEMPO (MES)

VA

ZÃ

O (

m³/

s)

vazão mensal observada vazão mensal prevista - tipo 1

0

5000

10000

15000

20000

25000

30000

35000

40000

JAN

ABRJU

LO

UTJA

NABR

JUL

OUT

JAN

ABRJU

LO

UT

TEMPO (MES)

VA

ZÃ

O (

m³/

s)

vazão mensal observada vazão mensal prevista - tipo 3 SITUAÇÃO 1 SITUAÇÃO 3

0

5000

10000

15000

20000

25000

30000

35000

40000

JAN

ABRJU

LOUT

JAN

ABRJU

LOUT

JAN

ABRJU

LOUT

TEMPO (MES)

VA

ZÃ

O (

m³/

s)


SITUAÇÃO 2

0

5000

10000

15000

20000

25000

30000

35000

40000

JAN

ABRJU

LOUT

JAN

ABRJU

LOUT

JAN

ABRJU

LOUT

TEMPO (MES)

VA

ZÃ

O (

m³/

s)


SITUAÇÃO 4

Figura 4. Erros Percentuais Absolutos da previsão da vazão mensal – Tucuruí

0

10

20

30

40

50

60

70

80

JAN

MAR

MAI

JUL

SETNO

VJA

NM

ARM

AIJU

LSET

NOV

JAN

MAR

MAI

JUL

SETNO

V

TEMPO (MES)

ER

RO

AB

SO

LU

TO

(%

)

Situação 1 Situação 2 Situação 3 Situação 4


7

A figura 5 compara as distribuições de freqüência dos erros percentuais

absolutos das previsões de afluências mensais de cada situação. Pode-se observar que a

maior proximidade da distribuição de freqüência da situação 4 à curva da situação 1.

Figura 5 – Distribuições de freqüência dos erros percentuais absolutos da previsão de afluência mensal - Tucuruí

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0 10 20 30 40 50 60 70 80

ERRO ABSOLUTO (%)

FR

EQ

UE

NC

IA D

E N

ÃO

-EX

CE

DE

NC

IA


A tabela 1 apresenta as médias dos erros percentuais absolutos das previsões

mensais para cada mês do ano, para os períodos seco, úmido e de transição e para o ano

todo para cada uma das quatro situações.

Tabela 1 – Média dos erros percentuais absolutos para Tucuruí

MÊS SITUAÇÃO

1 2 3 4 JAN 9,73 36,69 8,98 6,01

FEV 27,33 27,04 30,82 27,28

MAR 8,22 12,82 14,08 15,46

ABR 15,98 23,61 25,53 23,76

MAI 14,31 20,01 14,73 14,13

JUN 18,35 25,55 25,98 23,63

JUL 4,71 25,64 14,57 5,92

AGO 9,56 19,42 14,53 13,29

SET 9,41 38,58 8,65 9,81

OUT 7,05 36,69 7,46 6,05

NOV 18,00 49,83 16,42 23,20

DEZ 35,82 27,27 37,39 26,12


8

PERÍODO

JUL-NOV (SECO) 9,75 34,03 12,33 11,65

FEV-ABR (ÚMIDO) 17,18 21,16 23,48 22,17

MAI-JUN (TRANS UMIDO-SECO) 16,33 22,78 20,36 18,88

DEZ-JAN (TRANS SECO-UMIDO) 22,78 31,98 23,18 16,07

JAN-DEZ 14,87 28,60 18,26 16,22

Observa-se que para a maioria dos meses e para todos os períodos a situação 1,

conforme esperado, apresentou os menores valores. A situação 4 aparece como a melhor

alternativa viável na maioria dos meses e em todos os períodos.

- Caso Curuá-Una

Na figura 6 são comparadas as previsões mensais obtidas nas quatro situações

com as vazões observadas.

Figura 6 – Comparação entre a vazão mensal observada e prevista – Curuá-Uma

0

100

200

300

400

500

600

700

800

900

JAN

MA

R

MA

I

JUL

SE

T

NO

V

JAN

MA

R

MA

I

JUL

SE

T

NO

V

JAN

MA

R

MA

I

JUL

SE

T

NO

V

TEMPO (MES)

VA

ZÃ

O (

m³/

s)


0

100

200

300

400

500

600

700

800

900

JAN

MA

R

MA

I

JUL

SE

T

NO

V

JAN

MA

R

MA

I

JUL

SE

T

NO

V

JAN

MA

R

MA

I

JUL

SE

T

NO

V

TEMPO (MES)

VA

ZÃ

O (

m³/

s)

vazão mensal observada vazão mensal prevista - tipo 3 SITUAÇÃO 1 SITUAÇÃO 3

0

100

200

300

400

500

600

700

800

900

JAN

MA

R

MA

I

JUL

SE

T

NO

V

JAN

MA

R

MA

I

JUL

SE

T

NO

V

JAN

MA

R

MA

I

JUL

SE

T

NO

V

TEMPO (MES)

VA

ZÃ

O (

m³/

s)


0

100

200

300

400

500

600

700

800

900

JAN

MA

R

MA

I

JUL

SE

T

NO

V

JAN

MA

R

MA

I

JUL

SE

T

NO

V

JAN

MA

R

MA

I

JUL

SE

T

NO

V

TEMPO (MES)

VA

ZÃ

O (

m³/

s)


SITUAÇÃO 2 SITUAÇÃO 4


9

Na figura 7 são apresentados os erros percentuais absolutos das previsões

mensais obtidas em cada situação. Novamente, pode-se observar que a situação 1 é que

fornece as melhores previsões e a situação 2, mais uma vez, é a que fornece as piores

previsões. As situações 3 e 4 são similares e se aproximam da situação 1.

Figura 7 – Erros Percentuais Absolutos da previsão da vazão mensal – Curuá-Una

0

10

20

30

40

50

60

70

80

JAN

MAR

MAI

JUL

SETNO

VJA

NM

ARM

AIJU

LSET

NOV

JAN

MAR

MAI

JUL

SETNO

V

TEMPO (MES)

ER

RO

AB

SO

LU

TO

(%

)


A figura 8 compara as distribuições de freqüência dos erros percentuais

absolutos das previsões de afluências mensais de cada situação.

Figura 8 – Distribuições de freqüência dos erros percentuais absolutos da previsão de afluência mensal – Curuá-Una

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0 10 20 30 40 50 60 70 80

ERRO ABSOLUTO (%)

FR

EQ

UE

NC

IA D

E N

ÃO

-EX

CE

DE

NC

IA



10

Pode-se observar que a maior proximidade da distribuição de freqüência da

situação 3 à curva da situação 1 para erros menores que 20%. Para os erros maiores a

situação 4 é a que mais se aproxima da situação 1.

A tabela 2 apresenta as médias dos erros percentuais absolutos das previsões

mensais para cada mês do ano, para os períodos seco, úmido e de transição e para o ano

todo para cada uma das quatro situações. Observa-se que para a maioria dos meses e

para todos os períodos a situação 1, conforme esperado, apresentou os menores valores.

As situações 3 e 4 aparece como equivalentes.

Tabela 2 – Média dos erros percentuais absolutos para Curuá-Una

MÊS SITUAÇÃO

1 2 3 4 JAN 25,74 49,41 26,18 31,88 FEV 35,83 27,54 37,57 32,29 MAR 12,77 30,19 20,97 17,66 ABR 4,29 24,47 3,04 15,17 MAI 32,47 30,02 35,41 27,55 JUN 17,42 46,16 21,10 18,95 JUL 9,57 38,58 8,37 10,90 AGO 7,52 28,33 9,07 7,84 SET 10,38 27,72 12,18 9,65 OUT 3,14 24,03 1,49 12,53 NOV 11,13 29,77 7,67 13,90 DEZ 30,50 21,04 28,09 20,98

PERÍODO SET-DEZ (SECO) 13,79 25,64 12,36 14,27

MAR-JUN (ÚMIDO) 16,74 32,71 20,13 19,83 JAN-FEV (TRANS UMIDO-SECO) 8,54 33,46 8,72 9,37 JUL-AGO (TRANS SECO-UMIDO) 30,79 38,47 31,87 32,08

JAN-DEZ 16,73 31,44 17,60 18,27

6. Conclusões

Foi apresentada neste artigo uma aplicação do modelo PREVIVAZM com o

objetivo de obtenção de previsões de afluências médias mensais um passo a frente para

os aproveitamentos hidroelétricos de Tucuruí e Curuá-Una, onde se comparou a

situação ideal, na qual a vazão do mês em curso é conhecida (situação 1), com três

formas de estimar esta vazão:

Situação 2: desconsideram-se todas as informações do mês corrente e utiliza-se o

PREVIVAZM para fazer a previsão dois passos a frente (situação mais desfavorável),


11

Situação 3: a vazão do mês corrente é estimada, de forma expedita pela média

das vazões diárias já registradas no mês,

Situação 4: a vazão do mês corrente é formada pelas vazões semanais

observadas do mês corrente, com excessão da vazão da última semana que é obtida pelo

modelo PREVIVAZ.

No caso de Tucuruí o uso do modelo PREVIVAZ (situação 4) mostrou-se

levemente superior a situação 3. No caso Curuá-Una as situações 3 e 4 para o ano todo

foram equivalentes.

Referências

COSTA, F.S., MACEIRA, M.E.P., DAMÁZIO, J.M., (2007), Modelos de Previsão Hidrológica Aplicados ao Planejamento da Operação do Sistema Elétrico Brasileiro, Revista Brasileira de Recursos Hídricos, vol. 12, nº 3, pgs 21-30.

HIPEL, K.W. A.; MACLOAD, I.; Time Series Modelling of Water Resources and Environmental Systems, Elsevier, 1994.

BOX G.E.P., COX, D.R., An Analysis of Transformations, Journal of the Royal Statistical Society, A127, pgs 211-252, 1964.

BOX, G. E. P., JENKINS, G. M., Time Series Analysis-Forecasting and Control, Holden-Day, 1970.


12

USE OF PREVIVAZM AND PREVIVAZ MODELS FOR FORECASTING MONTHLY INFLOWS TO TUCURUÍ

AND CURUÁ-UNA HYDROPOWER PLANTS

Abstract

Planning the operation of hydroelectric plants involves the acquisition of inflow

forecasts for different time horizons and discretization. For real time planning, in

general, it needs inflow forecasts for each hour for a time horizon of 24 hours, while for

a medium-term planning, it is used a monthly time discretization aiming at time horizon

of a few months, where the main interest is the anticipation for next month. For the

latter case, the classical modeling approach is to adopt a statistical model that

considers the effects of seasonal climate and hydrological trend, such as the auto-

regressive and moving average formulations used in the PREVIVAZM and PREVIVAZ

models. This article presents a study of the use of PREVIVAZM model to forecast the

monthly inflow one step forward for the Tucuruí and Curua Una hydroelectric plants

coupled with the use of PREVIVAZ in order to complete the total inflow in the current

month.

Key words: Hydropower plant operation planning, Inflow forecasting,, Stochastic

Modelling

CÁLCULO DO NMA DO GRÁFICO DE CONTROLE DE REGRESSÃO

Danilo Cuzzuol Pedrini PPGEP/UFRGS

[email protected]

Carla Schwengber ten Caten

PPGEP/UFRGS [email protected]

Resumo

Para a aplicação dos gráficos de controle (GCs), é necessário supor que os dados

sejam independente e identicamente distribuídos, quando estas suposições não são

satisfeitas o desempenho dos GCs é insatisfatório. Em algumas situações, como quando

ocorrem muitas modificações nas variáveis de controle, essas suposições podem não

ser satisfeitas. Alternativamente, existe o gráfico de controle de regressão, que consiste

no ajuste de um modelo de regressão que relacione a característica de qualidade às

variáveis de controle e o posterior monitoramento da mesma em relação ao valor

previsto pelo modelo. Este artigo utiliza a simulação de Monte Carlo para obter o

Número Médio de Amostras (NMA) para o gráfico de controle de regressão

apresentado por Pedrini et al. (2008), além de comparar com outros gráficos similares

encontrados na literatura. Os resultados encontrados mostram que o gráfico de

controle de regressão apresenta um desempenho satisfatório, sobretudo quando

comparado com os demais gráficos.

Palavras-chave: Gráfico de Controle de Regressão; NMA; Método de Monte Carlo.


Rio de Janeiro – RJ - Brasil ISSN 1413-9022 / v. 27 p. 13 - 27, 2009

Cadernos do IME – Série Estatística Cálculo do NMA do Gráfico de Controle...

14

1. Introdução

Os gráficos de controle são o principal destaque dentre as ferramentas do CEP,

devido principalmente à sua simplicidade operacional e efetividade na detecção de

problemas no processo, sendo utilizadas com sucesso no monitoramento do

desempenho dos mais diversos processos industriais. De acordo com Montgomery

(2004), a utilização dos gráficos de controle requer que os dados monitorados sejam

independentes e identicamente distribuídos.

Estas suposições podem não ser satisfeitas quando há alterações no ajuste das

variáveis de controle do processo, pois nesse caso, ocorre uma alteração na média e/ou

variabilidade dos dados, alterando conseqüentemente a distribuição destes. Nesse caso,

seria necessário um gráfico de controle para cada ajuste, o que em muitos casos pode

não ser possível devido ao baixo número de amostras disponíveis em cada ajuste do

processo. Para esta situação, a característica de qualidade de um produto ou processo

pode ser melhor representada pelo seu relacionamento com as variáveis de controle do

processo (JACOBI et al.., 2002; SHU et al.., 2007).

Para solucionar este problema, Mandel (1969) propôs o gráfico de controle de

regressão, que consiste na combinação das técnicas de gráfico de controle e modelos de

regressão linear. Este gráfico de controle, somente pode ser aplicado em processos que

apresentem uma variável de controle, inviabilizando a aplicação em vários processos

industriais. Para solucionar este viés, Haworth (1996) propôs o gráfico de controle de

regressão múltipla, que permite o monitoramento de processos que apresentem mais de

uma variável de controle.

Recentemente, Pedrini et al.. (2008) propuseram uma modificação ao gráfico de

controle de regressão múltipla de Haworth (1996), apresentando também uma

sistemática para aplicação deste gráfico de controle. Estes autores não apresentaram

estudos de sensibilidade do gráfico proposto às alterações no processo.

Dessa forma, o presente trabalho tem como objetivo obter o Número Médio de

Amostras (NMA) para o gráfico de controle de regressão proposto por Pedrini et al..

(2008), além de comparar o desempenho deste gráfico com outros gráficos similares

encontrados na literatura.

Cadernos do IME – Série Estatística Pedrini & Caten

15

2. Revisão Bibliográfica

2.1 Gráfico de Controle de Regressão

De acordo com Cai et al. (2002) e Montgomery (2004), o gráfico de controle de

regressão pode ser utilizado para monitorar processos que apresentem tendências, que

ocorrem devido à interferência de variáveis de controle do processo, como por exemplo,

o desgaste de ferramentas. Loredo at al. (2003) e Montgomery (2004) também apontam

o uso do gráfico de controle de regressão em processos autocorrelacionados, pois se o

conjunto apropriado de variáveis de controle for inserido no modelo de regressão, os

resíduos serão não-correlacionados, mesmo que a variável resposta seja correlacionada.

Para o gráfico de controle de regressão, o valor ótimo para a característica de

qualidade é representado pelo valor estimado pelo modelo, dados os valores das

variáveis de controle. Dessa forma, a linha central deste gráfico é o valor previsto pelo

modelo estimado e os limites de controle são posicionados paralelamente afastados k

desvios-padrão da LC, conforme equações (1), (2) e (3).

(1)

(2)

(3)

onde

O valor da constante k utilizado varia entre 2 e 3, conforme a sensibilidade e

taxa de alarmes falsos desejada para o gráfico de controle de regressão. A estimativa do

desvio-padrão do gráfico de controle de regressão é dada pelo desvio-padrão do modelo

de regressão estimado (MANDEL, 1969; JACOBI et al.., 2002), conforme equação (4).

(4)

onde

O procedimento proposto por Mandel (1969) restringe-se a modelos de

regressão linear simples, ou seja, processos que apresentem apenas uma variável de

controle. Dessa forma, Haworth (1996) modificou o gráfico de controle de regressão de

forma a poder ser utilizado em processos que apresentem mais de uma variável de

controle significativa para explicar a característica de qualidade.

O procedimento proposto por Haworth (1996) consiste no monitoramento dos

resíduos padronizados do modelo. Os limites de controle e linha central para o gráfico


16

de controle de regressão múltipla proposto por Haworth (1996) são baseados no valor

da estatística t, com nível de significância α/2 e n-p graus de liberdade.

Loredo et al. (2002) e Shu et al. (2004) também propuseram alternativas que

permitem o uso de modelos de regressão linear múltipla. No primeiro trabalho, utiliza-

se a amplitude móvel dos resíduos para estimar o desvio-padrão do gráfico de controle

de regressão. Shu et al. (2004) apresentam o gráfico EWMAREG, que consiste no

monitoramento dos resíduos padronizados através de um gráfico de controle de médias

móveis exponencialmente ponderadas. Os procedimentos apresentados por Haworth

(1996), Loredo et al. (2002) e Shu et al. (2004) apresentam a vantagem adicional de

preservar a ordem temporal dos dados, o que permite a realização de todos os testes de

estabilidade apresentados em Montgomery (2004).

Pedrini et al. (2008) modificaram o gráfico de controle de regressão múltipla, de

forma a possibilitar o monitoramento direto da característica de qualidade, ao invés do

monitoramento dos resíduos padronizados. Esta modificação proposta pelos autores visa

facilitar a aplicação do gráfico de controle em processos produtivos, já que o conceito

de resíduos não é de fácil assimilação por parte dos operadores do processo. Os limites

de controle para o gráfico de controle de regressão proposto por Pedrini et al. (2008) são

apresentados nas equações (5), (6) e (7).

(5)

(6)

(7)

onde

O termo dentro da raiz é um fator de correção para o intervalo de confiança para

a previsão do modelo de regressão, já que hii é penalização para o afastamento das

variáveis de controle em relação ao centro do elipsóide formado por todos os valores

das variáveis de controle utilizadas para estimar o modelo de regressão. Ressalta-se que

à medida que os dados utilizados se afastam do centro deste elipsóide, a qualidade da

previsão do modelo piora.

Alguns exemplos de aplicação do gráfico de controle de regressão são

apresentados por Rothschild e Roth (1986), Olin (1998), Omura e Steffe (2003) e

Casarin et al. (2007).


17

Também são encontrados na literatura alguns procedimentos similares ao gráfico

de controle de regressão, como: o gráfico de controle para seleção de causas, proposto

por Zhang (1985), o gráfico de controle baseados em variáveis ajustadas por modelos de

regressão de Hawkins (1991) e os procedimentos para monitoramento de perfis lineares,

estudados inicialmente por Kang e Albin (2000).

2.2 Número Médio de Amostra

A efetividade na detecção de causas especiais está diretamente ligada à escolha

dos limites de controle, do intervalo de amostragem, do tamanho da amostra e da

escolha das regras sensibilizantes. Segundo Costa et al.. (2005), uma medida de

sensibilidade de um gráfico de controle é o número médio de amostras até o sinal

(NMA), que é o número de amostras que devem ser coletadas até que o processo

indique uma condição de processo fora de controle.

Quando o processo está sob controle estatístico, o NMA0 indica o número médio

de pontos necessários para a ocorrência do primeiro alarme falso do gráfico de controle.

Quando o processo está fora de controle, o NMA1 indica o número de amostras

necessárias para a detecção da ocorrência da alteração na estatística monitorada

(COSTA et al., 2005).

Assim, quando se projeta um gráfico de controle, deseja-se que o NMA0 seja o

maior possível, pois este é um indício de que serão necessárias poucas interrupções no

processo quando este está sob controle estatístico, e que o NMA1 seja o menor valor

possível, já que este valor está diretamente relacionado ao tempo necessário para a

detecção de uma causa especial (MONTGOMERY, 2004; COSTA et al.., 2005). De

forma geral, para um gráfico de controle de Shewhart, o NMA0 pode ser expresso como

o inverso da probabilidade de um ponto estar fora de controle, conforme equação (8).

α

10 =NMA (8)

O NMA1 pode ser escrito em função da probabilidade de erro tipo II, que é a

probabilidade do gráfico não detectar uma alteração na estatística monitorada quando o

processo está fora de controle estatístico (MONTGOMERY, 2004).

β−=

1

11NMA (9)


18

Quando a característica de qualidade monitorada apresenta distribuição

conhecida e independente, os valores de α e β podem ser obtidos pelo uso de simulação

de Monte Carlo ou de Cadeias de Markov.

3. Método Adotado para Simulação

O método de simulação de Monte Carlo será utilizado para calcular o NMA para

gráfico de controle de regressão proposto por Pedrini et al. (2008). Os resultados

obtidos serão comparados com os resultados do gráfico de controle de regressão

múltipla proposto por Haworth (1996) e para o gráfico de controle com limites

calculados através da amplitude móvel dos resíduos proposto por Loredo et al.. (2002).

Para maiores informações sobre o método de Monte Carlo, recomenda-se Bremaud

(1999) e Casella e Robert (2004). Em todos os casos utiliza-se o programa R para o

cálculo do NMA de cada método.

O primeiro passo da simulação consiste na geração da amostra a ser monitorada

pelos gráficos de controle que serão analisados. Dessa forma, gerou-se 5 mil dados para

cada variável de controle, com exceção de x2, que será simulada como sendo uma

variável discreta: serão gerados apenas os valores -1 e 1, sem incluir valores

intermediários. O restante das variáveis de controle, por serem contínuas, foram

modeladas segundo uma distribuição uniforme, cujos valores possuem a mesma

probabilidade de ocorrência,com valor mínimo de -1 e valor máximo de +1. Para

compor o erro aleatório, gera-se um vetor composto por 5 mil valores de uma

distribuição normal com média 0 e desvio-padrão 22,1.

Para a simulação de um processo sob controle, utiliza-se o modelo estimado na

Fase I do método proposto por Pedrini et al.. (2008) para gerar a previsão da

característica de qualidade dado cada conjunto de valores das variáveis de controle. A

seguir, soma-se o resíduo aleatório, de forma a constituir o valor simulado da

característica de qualidade.

No caso da simulação de um processo fora de controle, altera-se a equação do

modelo de regressão conforme a modificação desejada e, ao se somar os resíduos

aleatórios a este resultado, gera-se o vetor de valores simulados da característica de

qualidade. Segundo Shu et al. (2004), a modificação dos coeficientes do modelo de

regressão pode alterar a média e o desvio-padrão dos resíduos, conforme apresentado

nas equações (10) e (11), respectivamente.


19

kxkkxxeE µββµββµββββ )ˆ(...)ˆ()ˆ()ˆ()(21 221100 −++−+−+−= (10)

2222222

2211 )ˆ(...)ˆ()ˆ()(

21σσββσββσββ +−++−+−=

kxkkxxeV (11)

Onde: é o valor estimado do k-ésimo coeficiente de regressão e βk é o valor alterado do k-ésimo coeficiente de regressão

Quando um ponto fora de controle é detectado pelo gráfico de controle, o

contador C(i), recebe o número da amostra fora de controle. Repetindo-se todo o

procedimento descrito anteriormente 5 mil vezes é possível calcular o NMA através da

equação (12).

(12)

3.1 Alterações Estudadas

Além da situação de processo sob controle estatístico, foram simuladas três

situações de processos fora de controle: (i) alterações no coeficiente de intercepto β0,

com os coeficientes de inclinação constantes; (ii) alterações no coeficiente de inclinação

β1, com os demais coeficientes de regressão mantidos constantes e (iii) alterações nos

coeficientes β0 e β1, com os demais coeficientes de inclinação mantidos constantes. As

explicações dos motivos destas alterações são baseadas nas equações (14) e (15) e serão

informados a seguir.

Analisando estas equações, uma alteração no coeficiente de intercepto β0 visa

alterar a média dos valores simulados da característica de qualidade e,

conseqüentemente, a média dos resíduos do modelo, mas mantendo o desvio-padrão dos

resíduos constante. Dessa forma, a primeira situação simulada visa analisar

isoladamente a sensibilidade do gráfico de controle de regressão proposto às

modificações na média dos valores observados em relação aos valores estimados pelo

modelo de regressão estimado na Fase I do método proposto, já que apenas a média dos

resíduos é alterada, enquanto a variância permanece constante.

De acordo com as equações (10) e (11), uma alteração em um coeficiente de

inclinação βk altera a variância dos resíduos do modelo de regressão e, se a média da

variável de controle xk não for igual a zero, altera também a média dos resíduos. Como

as variáveis de controle simuladas apresentam média igual a zero, uma alteração em

qualquer coeficiente de inclinação altera apenas o desvio-padrão, que é o objetivo da

segunda situação de processo fora de controle.


20

Para a terceira situação fora de controle simulada, altera-se simultaneamente o

coeficiente de intercepto β0 e o coeficiente de inclinação β1, visando assim, verificar a

sensibilidade do gráfico de controle proposto às alterações conjuntas da média e desvio-

padrão dos resíduos. Ressalta-se que em todas essas situações, as alterações nos

coeficientes são planejadas em valores múltiplos do desvio-padrão dos resíduos

estimado na aplicação da Fase I do método proposto.

4. Resultados

Na Tabela 1 apresentam-se os valores do NMA, obtidos através da simulação,

para o processo sob controle e para as alterações do coeficiente de intercepto β0 do

modelo de regressão, para o gráfico de controle proposto, para o gráfico de medidas

individuais para os resíduos, para o gráfico de controle de regressão múltipla proposto

por Haworth (1996).

TABELA 1 – Valores NMA para alterações no coeficiente de intercepto.

Alteração Método

Proposto

Medidas

Individuais

Haworth

(1996)

Sob controle 576,75 736,63 2083,85

β0+0,5σe 226,31 281,43 690,58

β0+1,0σe 60,13 72,20 158,33

β0+1,5σe 19,47 22,74 43,58

β0+2,0σe 7,81 8,82 14,98

β0+2,5σe 3,83 4,16 6,28

β0+3,0σe 2,24 2,40 3,19

β0+3,5σe 1,54 1,60 2,00

β0+4,0σe 1,24 1,27 1,44

Para a situação de processo sob controle, maiores valores do NMA0 indicam

menores taxas de alarmes falsos do gráfico de controle, ou seja, um menor número de

intervenções desnecessárias no processo serão realizadas. Mas, altos valores do NMA0

também podem indicar uma relativa ineficiência do gráfico de controle, já que os limites

de controle podem estar muito largos.

Assim, analisando a Tabela 1, o gráfico de controle de regressão múltipla

proposto por Haworth (1996) apresentou o maior NMA0 e, por conseguinte, a menor

taxa de alarmes falsos. Isto ocorreu porque este gráfico apresentou os limites de controle


21

mais largos. De forma contrária, o gráfico EWMAREG apresentou o menor NMA0

entre os gráficos estudados, com valores NMA0 ligeiramente inferiores a 370. O gráfico

de controle para medidas individuais, com limites de controle estimados pela amplitude

móvel dos resíduos, apresentou um NMA0 de aproximadamente 730, já que o uso deste

método forneceu limites de controle um pouco maiores que o gráfico de controle

proposto.

O gráfico de controle de regressão proposto apresentou um NMA0 de

aproximadamente 572, isto equivale dizer que o gráfico de controle de regressão

proposto apresentará, em média, um alarme falso a cada 572 amostras monitoradas. Este

desempenho foi considerado satisfatório, embora seja superior ao NMA0 de um gráfico

de controle de Shewhart. O principal motivo para este valor do NMA0 é o uso do termo

hii como fator de correção nos limites de controle do método proposto, este também é o

fator de correção utilizado para o cálculo de intervalos de confiança para a previsão de

novas observações da característica de qualidade. Caso este fator de correção não fosse

utilizado, amostras com valores extremos para as variáveis de controle teriam limites de

controle mais rígidos e o nível de confiança, implicitamente adotado quando se escolhe

a constante k para os limites de controle, não seria constante para todos os valores

monitorados.

Analisando as alterações no coeficiente de intercepto β0, é possível observar que

o gráfico de controle de regressão múltipla de Haworth (1996) apresenta um

desempenho bastante ruim, quando comparado com os demais gráficos de controle

estudados. O NMA deste gráfico somente fica próximo dos demais para mudanças

superiores a 3σe na média de β0. Para mudanças na média de β0 inferiores a 2,5σe, o

gráficos EWMAREG apresentarou desempenho superior aos dos demais gráficos,

embora apresentem um NMA0 um pouco menor, o que indica uma taxa de alarmes

falsos superior aos dos demais gráficos.

Para alterações na média de β0 superiores a 2,5σe, o gráfico de controle de

regressão proposto apresenta o melhor desempenho entre todos os gráficos de controle

estudados. O gráfico de controle para medidas individual aplicado aos resíduos

apresenta um desempenho muito próximo ao gráfico de controle proposto, embora

apresente um NMA1 maior. Isto indica uma proximidade entre o uso das duas técnicas

de controle estatístico.


22

Na Tabela 2, apresentam-se os valores do NMA1 para as alterações do

coeficiente de inclinação β1 dos gráficos de controle de regressão proposto, do gráfico

de medidas individuais para os resíduos e do gráfico de controle de regressão múltipla

proposto por Haworth (1996).

TABELA 2 – Valores NMA para alterações no coeficiente de inclinação β1.

Alteração Método

Proposto

Medidas

Individuais

Haworth

(1996)

Sob controle 576,75 736,63 2083,85

β1+0,5σe 393,17 488,31 1311,10

β1+1,0σe 172,59 204,02 502,31

β1+1,5σe 71,90 82,10 180,61

β1+2,0σe 32,03 35,69 70,00

β1+2,5σe 16,04 17,52 30,71

β1+3,0σe 9,10 9,79 15,46

β1+3,5σe 5,82 6,18 8,90

β1+4,0σe 4,14 4,35 5,78

Analisando a Tabela 2, observa-se que o desempenho do gráfico de controle de

regressão proposto por Haworth (1996) é novamente bastante inferior aos dos demais

gráficos estudados. Neste caso, o gráfico de controle proposto apresenta NMA1 sempre

menos que o gráfico de controle de medidas individuais, especialmente para alterações

inferiores a 2,5σe na média de β1.

Os resultados da Tabela 2 mostram que estes três gráficos apresentados não são

adequados para a detecção de mudanças no desvio-padrão dos resíduos do modelo. A

principal razão para este fraco desempenho é que estes gráficos foram projetados

especificamente para detectar alterações na média do valor observado em relação ao

valor previsto pelo modelo e não para detectar mudanças no desvio-padrão. Isto indica a

necessidade do desenvolvimento de procedimentos para detectar alterações no desvio-

padrão do processo, quando este é monitorado por um gráfico baseado no gráfico de

controle de regressão ou algum outro gráfico similar.

Na Tabela 3 apresentam-se os valores do NMA1 para as alterações simultâneas

do coeficiente de intercepto β0 e do coeficiente de inclinação β1 dos gráficos de controle

de regressão proposto, do gráfico de medidas individuais para os resíduos e do gráfico

de controle de regressão múltipla proposto por Haworth (1996).


23

TABELA 3 – Valores NMA para alterações simultâneas nos coeficientes β0 e β1.

Alterações Método

Proposto

Medidas

Individuais

Haworth

(1996)

β0+0,5σe

β1+0,5σe 170,01 205,35 490,63

β1+1,0σe 89,99 104,08 227,02

β1+1,5σe 43,75 49,36 97,72

β1+2,0σe 22,54 24,89 44,34

β1+2,5σe 12,72 13,79 22,39

β1+3,0σe 7,92 8,47 12,61

β0+1,0σe

β1+0,5σe 49,40 57,98 120,81

β1+1,0σe 31,36 35,73 68,05

β1+1,5σe 18,82 20,87 36,07

β1+2,0σe 11,84 12,87 20,21

β1+2,5σe 8,00 8,56 12,34

β1+3,0σe 5,82 6,16 8,29

β0+1,5σe

β1+0,5σe 17,11 19,57 36,06

β1+1,0σe 12,63 14,12 23,92

β1+1,5σe 8,95 9,78 15,13

β1+2,0σe 6,80 7,06 10,46

β1+2,5σe 5,11 5,41 7,13

β1+3,0σe 4,20 4,40 5,48

β0+2,0σe

β1+0,5σe 7,20 8,03 13,14

β1+1,0σe 6,05 6,63 10,11

β1+1,5σe 4,93 5,31 7,49

β1+2,0σe 4,10 4,35 5,69

β1+2,5σe 3,54 3,71 4,58

β1+3,0σe 3,17 3,30 3,89

β0+2,5σe

β1+0,5σe 3,67 3,99 5,85

β1+1,0σe 3,39 3,65 5,06

β1+1,5σe 3,09 3,28 4,27

β1+2,0σe 2,83 2,98 3,66

β1+2,5σe 2,64 2,75 3,24

β1+3,0σe 2,51 2,60 3,96

β0+3,0σe

β1+0,5σe 2,22 2,36 3,13

β1+1,0σe 2,19 2,31 2,96

β1+1,5σe 2,16 2,26 2,76

β1+2,0σe 2,12 2,21 2,59

β1+2,5σe 2,10 2,17 2,46

β1+3,0σe 2,08 2,14 2,38

Como é possível observar na Tabela 3, para alterações simultâneas em β0 e β1, o

gráfico de controle proposto possui melhor desempenho, isto é, um NMA1 menor, que

os demais gráficos estudados em todas as situações simuladas. Quando comparado com


24

o gráfico de controle para medidas individuais aplicado aos resíduos do modelo de

regressão, o gráfico de controle proposto é notoriamente superior em mudanças

inferiores a 1,5σe na média de β0 e β1, sendo que a partir desta faixa de alteração, o

desempenho destes gráficos se torna bastante similar. Para todas as faixas de alteração

em β0, com alterações acima de 2,5σe em β1, o gráfico do método proposto e o de

medidas individuais para os resíduos apresentam desempenhos muito próximos.

Analisando a Tabela 3, também é possível observar que o gráfico de controle de

regressão múltipla de Haworth (1996) possui desempenho muito inferior a esses dois

gráficos. Este gráfico só apresenta desempenho próximo aos dos demais gráficos em

situações de grandes alterações nos coeficientes de regressão β0 e β1.

Dessa forma, o gráfico de controle proposto apresentou um bom desempenho

para a detecção de mudanças isoladas no coeficiente de intercepto β0 e em mudanças

simultâneas nos coeficientes de regressão β0 e β1. Para mudanças simuladas no

coeficiente de inclinação β1, que neste caso acarretavam especificamente em alterações

multiplicativas no desvio-padrão dos resíduos, o gráfico de controle proposto teve um

desempenho razoável, embora superior ao dos outros gráficos estudados.

5. Conclusões

O presente trabalho teve como objetivo obter o Número Médio de Amostras

(NMA) para o gráfico de controle de regressão proposto por Pedrini et al. (2008), além

de comparar o desempenho deste gráfico com outros gráficos similares encontrados na

literatura. Dessa forma, utilizou-se a simulação de Monte Carlo para calcular o NMA

do gráfico de controle de regressão proposto por Pedrini et al. (2008).

Analisando os valores obtidos para o NMA0 do gráfico de controle proposto,

observa-se que este possui uma baixa ocorrência de alarmes falsos. Para a simulação de

alterações isoladas no coeficiente de intercepto β0, o gráfico de controle de regressão

proposto apresentou um bom desempenho, sobretudo para mudanças acima de 2,5σe em

β0, quando foi superior a todos os outros gráficos de controle estudados. Desta forma, o

gráfico de controle proposto possui uma boa sensibilidade para a detecção de grandes

mudanças na média do coeficiente de intercepto e, por conseqüência, uma boa

sensibilidade às diferenças entre o valor observado e o valor previsto pelo modelo de

regressão.


25

Para alterações isoladas no coeficiente de inclinação β1, o gráfico de controle de

regressão proposto não apresentou um bom desempenho, embora melhor que os demais

gráficos de controle. Lembrando que, como a variável de controle x1, possui média igual

a zero, alterações em β1 somente alteram o desvio-padrão dos resíduos, sem alterar a

média destes. Este resultado pode ser explicado pelo fato do gráfico de controle de

regressão ter sido desenvolvido para detectar apenas mudanças na média.

No caso de mudanças simultâneas em um coeficiente de inclinação e no

coeficiente de intercepto, que acarretam numa alteração conjunta da média e desvio-

padrão dos resíduos, o NMA do gráfico de controle de regressão possui um bom

desempenho, sempre melhor que os demais gráficos estudados.

Como sugestão a trabalhos futuros, recomenda-se a proposta de um gráfico de

controle auxiliar para monitorar a variabilidade dos resíduos, combinado com o gráfico

de controle de regressão, e a obtenção do NMA para este novo gráfico de controle.

Outra proposta interessante é a obtenção do NMA para o gráfico de controle de

regressão com testes complementares, através de Cadeias de Markov.

Referências

ALWAN, L. C.; ROBERTS, H. V. Time-Series Modeling for Statistical Process Control. Journal of Business & Economic Statistics, v. 6, n. 1, p. 87-95, 1988.

BREMAUD, P. Markov chains: Gibbs fields, Monte Carlo simulation, and queues. New York: Springer, 1999, 444 p.

CASARIN, V. A.; SOUZA, A. M.; BOHM, S. I. H.; JACOBI, L. F. Aplicação de gráficos de controle de regressão no monitoramento do processo de montagem de colheitadeiras. Foz do Iguaçu: XXVII Encontro Nacional de Engenharia de Produção, 2007.

CASELLA, G.; ROBERT, C.P. Monte Carlo Statistical Methods. New York: Springer, 2ª Edição, 2004, 645 p.

CAI, D. Q.; XIE, M.; GOH, T. N.; TANG, X. Y. Economic Design of Control chart for Trended Process. International Journal of Production Economics, v. 79, p. 85-92, 2002.

COSTA, A. F. B.; EPPRECHT, E. K.; CARPINETTI, L. C. R. Controle Estatístico de Qualidade. São Paulo: Editora Atlas, 2ª Edição, 2005, 334 p.

HAWKINS, D. M. Multivariate quality control based on regression-adjusted variables. Technometrics, v. 33, n. 1, p. 61-75, 1991.

HAWORTH, D. A. Regression control chart to manage software maintenance. Journal of Software Maintenance, v. 8, n. 1, p 35-48, 1996.

JACOBI, L. F.; SOUZA, A. M.; PEREIRA, J. E. S. Gráfico de controle de regressão aplicado na monitoração de processos. Revista Produção, v. 12, n. 1, pág. 46-59, 2002.

KANG, L.; ALBIN, S. On-line monitoring when the process yelds linear profiles. Journal of Quality Technology, v. 32, n. 4, p. 418-426, 2000.


26

LOREDO, E. N.; JERKPAPORN, D.; BORROR, C. M. Model-based control chart for autoregressive and correlated data. Quality and Reliability Engineering International, v. 18, n. 6, p. 489-496, 2002.

MANDEL, B. J. The regression control chart. Journal of Quality Technology, v. 1, n. 1, p. 1-9, 1969.

MONTGOMERY, D. C. Introdução ao Controle Estatístico da Qualidade. 4. Ed. Rio de Janeiro: Editora LTC, 513 p, 2004.

OLIN, B D. Regression control charts revisited: methodology and Cases Studies. New York: 42° Annual Fall Technical Conference (AFTC), 1998.

OMURA, A. P.; STEFFE, J. H. Mixer viscometry to characterize fluid foods with large particulates. Journal of Food Process Engineering, v. 26, n. 3, p. 435-445, 2003.

PEDRINI, D. C.; CATEN, C. S. ten, MOREIRA Jr., F. J. Proposal of a modification on control charts based on residuals. Annals of III International Symposium on Business and Industrial Statistics (ISBIS), 2008.

ROTHSCHILD, B. F.; ROTH, S. R. Statistical process control of plating solutions with regression control charts. The SAMPE Journal, v. 22, n. 5, p. 37-41, 1986.

SHU, L; TSUNG, F; TSUI, K. L. Run-length perfomance of regression control charts with estimated parameters. Journal of Quality Technology, v. 36, n. 3, p. 280-292, 2004.

SHU, L; TSUI, K. L.; TSUNG, F. A review of regression control charts. In: Ruggeri, F.; Faltin, F.; Kenett, R. Encyclopedia of Statistics in Quality and Reliability New York: John Wiley & Sons, p. 1569-1573, 2007.

ZHANG, G. X. Cause-selecting control charts – a new type of quality control charts. The QR Journal, v. 12, n. 4, p. 221-225, 1985.


27

THE ARL DISTRIBUTION OF A REGRESSION CONTROL CHART

Abstract

In the application of Control Charts, it’s supposed that the data is independent and

identically distributed. When some modifications on control variables occurs, those

assumptions cannot be true and the performance of the control charts is affected. As a

solution, that is the regression controle chart, which consists in the adjusting of a

regression model, relating the response variable to the control variables, and the

following monitoring of the observed value against the predicted value of the response.

The present work uses the Monte Carlo simulation to calculate the Average Run Length

(ARL) of the regression control chart presented by Pedrini et al. (2008), comparing the

result obtained against others procedures of the literature. The work results shows taht

the regression control chart has a good perfomance.

Key-words: Regression Control Chart, ARL, Monte Carlo simulation.

PREVISÃO DO PREÇO DE VENDA DA UVA ITÁLIA E DA MANGA TOMMY PRODUZIDAS NO VALE DO SÃO FRANCISCO VIA ANÁLISE DE SÉRIES TEMPORAIS:

UM ESTUDO DE CASO

Abdinardo Moreira Barreto de Oliveira Universidade Federal do Vale do São Francisco

[email protected]

Marcelo José Vieira de Melo Sobrinho

Universidade Federal do Vale do São Francisco [email protected]

Resumo

O presente estudo investiga a adequação de uma metodologia de previsão de preços

para a manga Tommy e a uva Itália, produzidas e comercializadas no Vale do São

Francisco, através da utilização das técnicas de Análise de Séries Temporais. Foram

coletados e calculados, junto aos registros da Secretaria de Agricultura do Estado da

Bahia, os preços médios mensais destes produtos entre 2002 e 2008, totalizando uma

amostra de 84 períodos. Para a interpretação dos resultados, foram utilizados os

modelos de previsão Holt-Winters e ARIMA. Os resultados indicam, dentre outras

coisas, uma estacionariedade no preço da manga e uma tendência de aumento no preço

da uva. A metodologia desenvolvida pôde ser considerada válida, pois forneceu os

menores erros quadráticos de previsão por meio da suavização exponencial aditiva

para a uva Itália (Holt-Winters) e o modelo ARIMA(2,0,1) para a manga Tommy.

Sugestões de novos estudos são elaboradas ao final do artigo.

Palavras-chave: Previsão de preços, Séries temporais, Fruticultura.


Rio de Janeiro – RJ - Brasil ISSN 1413-9022 / v. 27 p. 29 - 43, 2009

Cadernos do IME – Série Estatística Previsão do Preço de Venda da Uva Itália...

30

1. Introdução

O agronegócio é uma das atividades econômicas desenvolvidas no Brasil que

vem recebendo crescente destaque nos meios de comunicação e a atenção de

pesquisadores, estudiosos e investidores, mesmo em momentos de crises econômicas.

Isto porque, dentre outras coisas, a sua participação na economia brasileira representa

33% do PIB, 42% do volume de exportações e 37% na geração de empregos. Além

disso, ele pode ser considerado como uma atividade que melhor desempenha as

políticas de interiorização do desenvolvimento, porque contribui significativamente na

diminuição do fluxo migratório e na redução da pressão populacional nas capitais e

regiões metropolitanas do país (ROCHA et al, 2005; NEVES e CONEJERO, 2007).

Os diversos motivos que justificam esta relevante participação do agronegócio

brasileiro nos cenários nacional e mundial podem ser agrupados em apenas três fatores

(NEVES e CONEJERO, 2007): (1) o aumento dos preços de venda de algumas

principais commodities agrícolas, como açúcar, álcool, soja e café, devido às quebras de

safra dos principais concorrentes e ao aumento da população mundial, acarretando num

maior consumo de alimentos e energia; (2) as melhorias ocorridas na produtividade,

sejam pela capacidade empreendedora dos agricultores em utilizar novas técnicas de

gestão empresarial, sejam pela assimilação de novas tecnologias de plantio

desenvolvidas por centros de pesquisa como a Embrapa e (3) pela magnitude das

exportações de empresas multinacionais com mercados próprios, ou por agroindústrias

nacionais em processo de internacionalização.

Neste cenário também merece destaque os números apresentados pela

fruticultura. Em 2008, as exportações de frutas frescas brasileiras foram de 888 mil

toneladas (acréscimo de 10,31% em relação a 2006), totalizando US$ (F.O.B.) 724

milhões em vendas (aumento de 51,74% em relação a 2006). Do total de dólares que

estas exportações trouxeram para a Balança Comercial brasileira, as vendas de uva

ficaram em 1º lugar e as vendas de manga em 3º lugar, contribuindo respectivamente

com 23,67% e 16,39% desse total (IBRAF, 2009). Boa parte deste desempenho é

decorrente de áreas produtivas irrigadas, das quais se destaca o pólo Petrolina -

Juazeiro, localizado no Vale do Rio São Francisco, região de clima semi-árido situado

entre a Bahia e Pernambuco. O pólo é responsável por 43% das exportações de frutas

brasileiras e por mais de 90% das exportações de uva e manga (LOPES et al, 2007).

Cadernos do IME – Série Estatística Oliveira & Sobrinho

31

Embora os resultados apresentados apontem para uma perspectiva (ainda)

promissora de expansão do agronegócio brasileiro, notadamente o setor aqui em análise,

é importante salientar que o seu desempenho não depende só da aplicação direta de

avanços tecnológicos ocorridos na área de produção ou gestão, mas também sofre

influência de fatores externos até certo ponto imprevisíveis ou incontroláveis, tais como:

(1) as variações climáticas [afetam a qualidade do produto], (2) o dimensionamento

equânime da produção mundial de alimentos nos países fornecedores [sua ausência

pode provocar o excesso ou a escassez destes produtos] e (3) as variações cambiais

ocorridas durante a comercialização da produção agrícola mundial [afetam a renda do

consumidor e a receita do produtor]. Os fatores em tela exercem grande influência no

preço final de venda do produto agrícola destinado ao mercado consumidor e, por conta

de sua imprevisibilidade ou incontrolabilidade, boa parte dos produtores pode sentir

dificuldade em estabelecer um preço final adequado (CAETANO, 2006; NEVES;

CONEJERO, 2007).

Portanto, compreender como será o comportamento dos preços agrícolas se torna

importante para os produtores rurais nacionais, porque tal variável consegue resumir,

em um único valor, toda a informação relevante sobre os aspectos micro e macro

econômicos que afetam o desempenho da empresa no setor onde está inserida (ELDER

apud SACHETIM, 2006). Logo, a descoberta dos movimentos de alta ou de baixa dos

preços agrícolas pode permitir a reorganização do ciclo produtivo, de modo que o

momento da comercialização da safra possa coincidir com os maiores valores que o

mercado consumidor esteja disposto a pagar. Tal informação contribuiria na

maximização das receitas por safra vendida, principalmente para o pequeno e médio

produtor, fazendo-os evitar os períodos de excedente de oferta. Dessa forma, o presente

estudo apresenta uma proposta de previsão de preços para as culturas de uva e manga

produzidas e comercializadas no Vale do São Francisco, com o intuito de contribuir na

elaboração do planejamento da produção da atividade agrícola local. Para isto são

empregados dois métodos largamente utilizados para a realização de previsões – o de

suavizações e o auto-regressivo integrado e de médias móveis - descritos a seguir.

2. Referencial Teórico

A Análise de Séries Temporais constitui-se de um método quantitativo de

previsão que realiza a projeção de valores futuros de uma variável, fundamentada


32

eminentemente nas suas observações passadas, organizadas de forma seqüencial e em

intervalos de tempo específicos escolhidos pelo analista. Alicerçado neste conceito, este

método apresenta uma característica peculiar: a de que suas observações adjacentes são

dependentes, ou seja, os elementos que causaram os padrões de atividade no passado

continuarão a influenciá-lo, de maneira semelhante, no futuro. Logo, o modelo

matemático a ser construído para realizar a previsão da série temporal permitirá que os

dados analisados “falem por si”, sem precisar recorrer a uma teoria subjacente

específica para possibilitar a sua interpretação (BOX, JENKINS e REINSEL, 1994;

LEVINE et al., 2005).

Moretin e Toloi (2006) informam que ao utilizar a Análise de Séries Temporais

no estudo de uma variável qualquer vinculada a um instante de tempo t, o pesquisador

poderá estar interessado em: (1) averiguar o mecanismo causador de sua trajetória; (2)

realizar projeções de valores da função amostral em curto ou em longo prazo; (3)

delinear o desempenho da série, procurando identificar a existência de tendências, ciclos

e variações sazonais (especialmente em séries econômicas e financeiras) e; (4) buscar

periodicidades importantes nos dados, com o intuito de encontrar componentes de

freqüência que caracterizem a existência de um espectro.

Dentre os métodos de previsão disponíveis, existe uma grande classe que tenta

abordar as razões das variações ocorridas em séries temporais, que é a das suavizações.

Sua premissa básica é que os valores extremos encontrados na série simbolizam casos

fortuitos ou randômicos e, realizando a suavização destes, pode-se encontrar o modelo

básico da série, discernindo-o de quaisquer “ruídos” que porventura estejam incluídos

nas observações e, assim, utilizá-lo para calcular os valores futuros da função amostral

(MORETIN e TOLOI, 2006). A suavização da série temporal acontece através do

cálculo de médias móveis exponencialmente ponderadas, o que significa dizer que seus

valores mais recentes recebem maior peso de importância na previsão dos valores no

futuro. Além disso, tal procedimento averigua a existência de uma tendência linear e de

um componente de sazonalidade (SILVA, SAMOHYL e COSTA, 2002). Caso a série

temporal estudada possua estas características, um dos modelos de suavização mais

indicados na literatura especializada é o Holt-Winters (HW).

A vantagem de utilizá-lo se deve à sua fácil compreensão, ao seu baixo custo, a

sua adaptabilidade para séries com modelo de comportamento mais genérico


33

(MORETIN e TOLOI, 2006) e, de acordo com os resultados de estudos empíricos, sua

precisão é compatível com a de modelos mais complexos, como por exemplo, a

abordagem ARIMA (MAKRIDAKIS e HIBON, 2000). Talvez porque estas vantagens

possam estar baseadas no Princípio da Parcimônia (BOX, JENKINS e REINSEL, 1994)

é que seu modelo vem sendo empregado em alguns estudos de previsão de commodities

agrícolas (SILVA, SAMOHYL e COSTA, 2002; PACHECO e SILVA, 2003; BACCI,

REZENDE e MEDEIROS, 2006), na indústria alimentícia (QUEIROZ e

CAVALHEIRO, 2003; ALBUQUERQUE e SERRA, 2006) ou até mesmo na previsão

de demanda turística (SERRA, TAVARES e SANTOS, 2005), conseguindo estes

pesquisadores resultados satisfatórios de previsão de valores futuros das séries.

O modelo HW é dividido em dois subgrupos: aditivos e multiplicativos. O

primeiro considera que a amplitude da variação da sazonal permanece uniforme ao

longo do tempo, enquanto que no segundo ela muda com o passar do tempo, podendo

ascender ou descender conforme for o caso. Para seu uso, é necessária a estimação das

constantes de amortecimento de Nível (α), de Tendência (β) e de Sazonalidade (γ). O

Quadro 1 apresenta as equações de suavização e de previsão, onde Yt é o valor

observado no instante t na série analisada.

Quadro 1 – Equações de suavização exponencial sazonal de Holt-Winters

Equação HW Aditivo HW Multiplicativo

Nível

Tendência

Sazonalidade

Previsão

Fonte: adaptado de Moretin e Toloi (2006)

Os contrapontos que a literatura fala sobre o modelo HW são (1) as dificuldades

em determinar os valores mais apropriados das constantes de suavização e (2) a

impossibilidade e/ou dificuldade de se estudar suas propriedades estatísticas, como a

média, a variância e o intervalo de confiança da previsão (MORETIN e TOLOI, 2006).

Embora apresente um grau de complexidade maior, o modelo auto-regressivo

integrado e de médias móveis (ARIMA) anunciou uma nova geração de ferramentas de

previsão de séries temporais, dada a combinação de três filtros para a estimação dos


34

valores futuros: o auto-regressivo [AR], o de integração [I] e o de médias móveis [MA].

Os modelos [AR(p)] estudam o mecanismo de autocorrelação do processo gerador da

série temporal, ou seja, as autocorrelações acontecem quando se verificam a presença de

correlação entre os p valores observados na série temporal. Os modelos [MA(q)]

pesquisam a estrutura de autocorrelação dos resíduos de previsão. Portanto, tal

autocorrelação é examinada sempre que existir uma correlação entre a média móvel dos

q termos de erro sucessivos na série temporal. Caso a série apresente ambas as

características, os modelos podem ser combinados criando um processo [ARMA (p, q)].

Por fim, o filtro [I(d)] é utilizado quando se observa que a série temporal é não-

estacionária, ou seja, ela é integrada. Assim, após calcular a diferença entre os valores

subjacentes da série d vezes, é possível torná-la estacionária, de modo que ofereça uma

base válida para a previsão. O Quadro 2 mostra as equações empregadas de acordo do

modelo ARIMA, onde Yt* é o valor calculado, ϕt é o coeficiente auto-regressivo, θt é o

coeficiente de média móvel, µ é uma constante e εt é o termo de erro estocástico de

ruído branco (BOX, JENKINS e REINSEL, 1994; GUJARATI, 2006).

Quadro 2 – Equações de previsão para o modelo ARIMA

Método Equação

AR(p)

MA(q)

ARMA (p, q)

Fonte: adaptado de Moretin e Toloi (2006)

Sobre a potencialidade do uso do método ARIMA para a previsão de preços

agrícolas no Brasil, vale destacar os estudos feitos com o trigo (ARÊDES e PEREIRA,

2008), o cacau (MORAES e ALBUQUERQUE, 2006) e a soja (SILVA, SAMOHYL e

COSTA, 2002), onde seus resultados de previsão foram estatisticamente satisfatórios.

3. Procedimentos Metodológicos

O presente estudo foi realizado com o intuito de compreender o comportamento

da série de preços da Manga Tommy (MT) e da Uva Itália (UI) produzidas e

comercializadas no Vale do São Francisco, seguindo as orientações (1), (2) e (3) citadas

por Moretin e Toloi (2006). Os preços foram coletados no site da Secretaria de

Agricultura, Irrigação e Reforma Agrária do Estado da Bahia (SEAGRI, 2009), relativos


35

à cidade de Juazeiro (BA). A escala de tempo utilizada foi mensal, entre os anos de

2002 e 2008, totalizando 84 observações. Foram construídas duas séries mensais – MT

e UI – onde mostram o preço médio mensal, atualizados pelo IGP-DI da FGV.

Para o modelo Holt-Winters, primeiro foi necessário identificar se as séries

mensais apresentam tendência e sazonalidade. Para a tendência, foi adotado o teste

Wald-Wolfowitz. Como o número de observações acima (n1) e abaixo (n2) da mediana

(m) foram maiores que 20 em todas as séries, foi realizada uma aproximação normal

para testar a hipótese H0 (não há tendência) frente a H1 (há tendência). Em todas as

séries, H0 foi rejeitada (n1=42; n2=42; Z=-9,00; Z ajustado=8,89; P=0,0001), indicando

a existência de tendência e eliminando a conjectura da aleatoriedade de seus valores.

Quanto à ocorrência de sazonalidade, foi utilizado o teste de Friedman. Para a série MT

(S=45,31; DF=11; P=0,001) foi verificada a existência de sazonalidade a 1% de

significância. Para a série UI (S=18,10; DF=11; P=0,079) foi verificada a existência de

sazonalidade a 10% de significância, possibilitando assim o uso do modelo supracitado.

Para avaliar o subgrupo (aditivo ou multiplicativo) que melhor se adapta na predição

das observações, foi utilizado o menor erro quadrático médio (MSE) como parâmetro.

Para a utilização do modelo ARIMA, primeiro foi aplicado o teste de

estacionariedade (ou de raiz unitária). Aqui foi usado o teste KPSS (KWIATKOWSKI

et al., 1992), onde foi testada a hipótese H0 (são estacionárias). Em serguida, foi feita a

análise dos seus correlogramas, com 28 defasagens (± 1/4 do tamanho das séries).

O diagnóstico do modelo estimado se deu através do teste Breusch-Godfrey

(teste LM), com o objetivo de verificar a hipótese H0 de não-existência de correlação

serial entre os resíduos do modelo. Por fim, a capacidade de previsão do modelo foi

testada através da estatística U de Theil. Neste aspecto, foi utilizada a equação U2 (1)

sugerida por Bliemel (1973), onde Pi e Ai representam, respectivamente, os valores

previstos e observados na série temporal, e que quanto mais próximo de zero for o valor

obtido, melhor será a qualidade de previsão do método empregado. Os softwares

utilizados foram o Eviews 6.0, Minitab 14, MS Excel e Statistica 7.0.

Equação 1 – Estatística de Theil para medição de qualidade de previsão do modelo


36

4. Análise e discussão dos resultados

4.1 Previsões através do modelo HW

Em relação à Manga Tommy, os resultados encontrados indicam a aplicabilidade

do supracitado modelo, sendo este utilizado tanto pela suavização exponencial sazonal

aditiva (Uaditiva= 0,35767; MSEaditiva = 0,059576) como pela multiplicativa (Umultiplicativa =

0,35770; MSEmultiplicativa = 0,059587).

Um entendimento para os resultados da estatística U de Theil serem tão

próximos, em ambas as situações, decorre do comportamento dos preços da Manga

Tommy ao longo do período analisado. No longo prazo, é possível verificar certa

estacionariedade entre a amplitude de seus valores máximos e mínimos, característica

marcante em suavizações exponenciais aditivas. No curto prazo, comparando

anualmente os valores obtidos, verifica-se mudanças relevantes nos patamares das

amplitudes dos preços, demandando o uso de suavizações exponenciais multiplicativas

nas previsões, conforme mostra a Figura 1.

Figura 1 – Gráfico Real versus Previsto para a Manga Tommy, com suavização aditiva (2002-2008)

Além disso, é possível notar que ao longo do 1º semestre, o preço médio da MT

tende a subir, alcançando seus valores máximos entre os meses de junho e julho, para

inverter sua tendência e decair para seus valores mínimos históricos, que normalmente

acontecem entre novembro e dezembro. Por fim, os coeficientes de amortização

estimados para a série aditiva foram α=0,765, β=0,000, γ=0,000, para a série

multiplicativa foram α=0,915, β=0,000, γ=0,000, e os valores iniciais para as equações

de recorrência foram S0=0,6046 e T0=-0,001.


37

Figura 2 – Gráfico Real versus Previsto para a Uva Itália, com suavização aditiva (2002-2008)

Para a Uva Itália, os resultados também indicam o uso do HW, mas apontam

somente para o uso de suavização exponencial sazonal aditiva (Uaditiva=0,0822;

MSEaditiva = 1,2348) em vez da multiplicativa (Umultiplicativa = 0,0878; MSEmultiplicativa =

1,4084), mesmo com seus valores de U bem próximos (Figura 2). Dessa forma, pode-se

dizer que, embora seu preço de venda esteja numa tendência de alta, este pode estar

assumindo, ao longo de cada ano, um padrão estacionário, tendo em vista que a

amplitude da variação sazonal poderia estar se estabilizando. Assim, se vista em longo

prazo, a série sugere ser multiplicativa dada às mudanças nos patamares de suas

amplitudes; mas se vista em curto prazo – dentro do próprio ano – a série aparenta estar

estacionária em torno de sua linha de tendência, demandando, portanto, a suavização

aditiva. Além disso, os maiores valores de preço de venda foram observados no 2º

semestre. Por fim, os coeficientes de amortização para a série aditiva foram α=0,974,

β=0,000, γ=0,000, para a série multiplicativa foram α=0,968, β=0,102, γ=0,000, e os

valores iniciais para as equações de recorrência foram S0=7,986 e T0=0,1129.

4.2 Previsões através do método ARIMA

Neste tópico são apresentados os resultados para as séries MT e UI através do

método ARIMA. O primeiro item analisado foi a estacionariedade das séries, para

verificar a necessidade de calcular as primeiras diferenças e assim retirar sua raiz

unitária. No caso da série MT, foi constatado que a mesma é estacionária [I(0)] – KPSS

stat. = 0,096906; Valor Crítico Assintótico 1% = 0,739000 –, não rejeitando, portanto,

H0. Em relação à série UI, foi obtida a rejeição de H0. Nesta situação, o teste foi refeito

com o objetivo de averiguar se UI é um processo estacionário em tendência. O


38

resultado final indica que UI é estacionária em sua tendência, isto é, embora sua média

não seja constante, a sua variância é, não sendo necessária a diferenciação de seus

valores – KPSS stat. = 0,061139; Valor Crítico Assintótico 1% = 0,739000.

O segundo item foi a identificação do modelo a partir da análise das funções de

autocorrelação e autocorrelação parcial. Comparando o comportamento dos

correlogramas referentes às séries MT e UI com os padrões teóricos citados por Gujarati

(2006, p. 679), estes indicam que as séries sigam, pelo menos, um processo AR(p).

Figura 3 – Correlograma Serie MT Figura 4 – Correlograma Série UI

Em seguida, para cada série, foram realizadas a estimação dos seguintes

modelos: AR(1), AR(2), MA(1), MA(2), ARMA(1,1), ARMA(1,2), ARMA(2,1) e

ARMA(2,2), todos com intercepto, já que os correlogramas não apontam p e q maiores

que duas defasagens. O desempenho dos modelos foi medido a partir de um conjunto de

critérios fundamentados tanto na importância das variáveis como na não-existência de

correlação serial entre os resíduos (teste LM), ambos ao nível de 5% de significância.

Os resultados mostraram que para a série MT, o modelo que melhor se ajustou foi o

ARMA (2,1) [χ2=0,9998], e para a série UI, o modelo selecionado foi o ARMA(1,0)

[χ2=0,6877], cujas respostas atendem aos padrões teóricos esperados. Como

anteriormente fora identificado que a série UI é um processo estacionário em tendência,

também foi estimado um modelo ARMA(1,0) com remoção desta tendência. As Tabelas

1 e 2 mostram os resultados estatísticos para os modelos acima calculados.


39

Tabela 1 – Estatística para o modelo ARMA (2,1) para a série MT

Manga Tommy Constante AR(1) AR(2) MA(1) Coeficiente 0,585986 1,498471 -0,697126 -0,730474 Probabilidade 0,000000 0,000000 0,000000 0,000000 Critério de informação de Akaike 0,006716 Critério de informação de Schwarz 0,124117

Tabela 2 – Estatística para o modelo ARMA (1,0) para a série UI com tendência

Uva Itália Constante AR(1) t Coeficiente 9,225007 0,674888 0,098470 Probabilidade 0,000000 0,000000 0,000000 Critério de informação de Akaike 3,174499 Critério de informação de Schwarz 3,261927

A última etapa do modelo ARIMA é a análise da qualidade de previsão dos

dados a partir das equações calculadas. A estatística U de Theil apresentou o resultado

de U = 0,335140 para o modelo ARMA (2,1) da série MT, demonstrando um

desempenho ligeiramente melhor que seus modelos de suavização exponencial. Quanto

à série UI, a estatística U de Theil retornou o valor U = 0,0898 para o modelo

ARMA(1,0), e U = 0,0841 para o modelo ARMA(1,0) com tendência. Nesta série, o

modelo de suavização aditiva apresentou um desempenho melhor que os modelos

ARIMA estimados, mas o modelo ARMA(1,0) com tendência teve uma performance

melhor que o modelo de suavização exponencial multiplicativa. As figuras 5 e 6

mostram os resultados da aplicação do modelo ARMA para a previsão de preços da

manga Tommy e da uva Itália.

Figura 5 – Gráfico Real versus Previsto para a Manga Tommy, ARMA (2,1) (2002-2008)


40

4 Figura 6 – Gráfico Real versus Previsto para a Uva Itália, ARMA (1,0) com tendência (2002-2008)

5. Considerações finais

O presente estudo procurou contribuir na apresentação de uma proposta de

previsão de preço para a produção de uva Itália e da manga Tommy oriundas do Vale do

São Francisco, de modo que auxilie no planejamento da atividade agrícola local, através

da análise de modelos de Séries Temporais. Já que as situações econômicas e de

negócios mudam ao longo do tempo, os produtores rurais devem utilizar técnicas que

monitorem as implicações que estas causarão no desempenho de sua organização.

A Análise de Séries Temporais é um ramo da Econometria que permite a

estimação, com a maior precisão e o menor número de termos possíveis, o valor do

preço futuro destes produtos agrícolas. Uma das vantagens que esta metodologia pôde

apresentar neste estudo foi a sua capacidade de ilustrar, a partir da elaboração de

projeções o resultado do embate econômico que envolve os interesses de vendedores e

compradores de frutas, especialmente manga Tommy e uva Itália. Logo, a modelagem

matemática dos dados passados pode ajudar a indicar momentos de reversão de

tendências de preço, antecipando a informação do surgimento de um novo cenário que

venha a favorecer os objetivos de determinado agente econômico, o que facilitaria a

decisão do produtor rural quanto à época de comercialização e o valor a ser cobrado

pela safra produzida.

Portanto, os resultados obtidos neste estudo são satisfatórios quanto à

aplicabilidade de ambos os modelos para o acompanhamento da evolução do preço da


41

manga Tommy e da uva Itália, produzidas e comercializadas no contexto do Vale do

São Francisco. Neste ínterim, vale salientar que, embora o método Holt-Winters tenha

sido validado em ambas as séries temporais, os valores encontrados apontam para um

melhor poder de predição do modelo na série de preços da uva Itália. Além disso,

também foi identificada a propensão de estacionariedade da trajetória de ambas as

funções amostrais, posicionando-se entre os valores máximos e mínimos de preços

recentes. Quanto ao modelo ARIMA, este apresentou um melhor desempenho na

predição dos valores da manga Tommy, ainda que este não seja seu modelo definitivo.

Assim, tendo em vista o comportamento invertido das séries de preços estudadas,

sugere-se aos produtores o investimento em ambas as culturas aqui analisadas como

forma de diversificação.

Para estudos futuros, recomenda-se a aplicação de modelos complexos de

previsão de séries temporais, como a metodologia de Vetores Auto-Regressivos (VAR)

ou de métodos heterocedásticos (ARCH e GARCH), para comparar seus resultados com

os aqui alcançados. Outra recomendação é determinar, através de métodos

econométricos determinísticos (Regressão), as variáveis econômicas que podem

influenciar na estimação do preço futuro dos produtos agrícolas aqui estudados além da

variável tempo, o que contribuiria para a ampliação do arcabouço teórico, metodológico

e prático de gestão de fruticultura irrigada na região do Vale do São Francisco.

Referências

ALBUQUERQUE, J. C. S.; SERRA, C. M. V. Utilização de modelos de Holt-Winters para a previsão de séries temporais de consumo de refrigerantes no Brasil. In: XXVI ENEGEP, Fortaleza, Anais... Rio de Janeiro: ABEPRO, 2006.

ARÊDES, A. L.; PEREIRA, M. W. G. Potencialidade da utilização de modelos de séries temporais na previsão do preço do trigo no Estado do Paraná. Rev. de Economia Agrícola, São Paulo, v. 55, n. 1, p. 63-76, jan./jun. 2008.

BACCI, L. A.; REZENDE, M. L.; MEDEIROS, A. L. Combinação de métodos de séries temporais na previsão da demanda de café no Brasil. In: XXVI ENEGEP, Fortaleza, Anais... Rio de Janeiro: ABEPRO, 2006.

BLIEMEL, F. Theil’s forecast accuracy coefficient: a clarification. Journal of Marketing Research, v.10, p.444-446, 1973.

BOX, G. E. P; JENKINS, G. M; REINSEL, G. C. Time series analysis: forecasting and control. 3.ed. New Jersey: Prentice Hall, 1994.

CAETANO, J.R. O ponto vulnerável da agricultura. Exame, São Paulo, 02. mai. 2006. Disponível em: <http://portalexame.abril.com.br/revista/exame/edicoes/0866/economia/m0081647.html>.Acesso em: 20/07/2006.

GUJARATI, D. Econometria Básica. 4. ed. Rio de Janeiro: Elsevier, 2006.


42

INSTITUTO BRASILEIRO DE FRUTAS. Comparativo das exportações brasileiras de frutas frescas 2008 - 2007-2006. Disponível em:< http://www.ibraf.org.br/estatisticas/est_frutas.asp>. Acesso em: 27 abr. 2009.

KWIATKOWSKI, D.; PHILLIPS, P. C. B.; SCHMIDT, P.; SHIN, Y. Testing the null hypothesis of stationarity against the alternative of a unit root. Journal of Econometrics, v.54, p.159-178, 1992.

LEVINE, D. M; STEPHAN, D; KREHBIEL, T. C; BERENSON, M. L. Estatística: teoria e aplicações usando o Microsoft Excel em português. 3.ed. Rio de Janeiro: LTC, 2005.

LOPES, F. F; CASTRO, L.T; NEVES, M.F; CALDEIRA, M.A. O Vale do São Francisco: lições para o planejamento estratégico de uma região. In: NEVES, M. F (org.). Agronegócios e desenvolvimento sustentável: uma agenda para a liderança mundial na produção de alimentos e bioenergia. São Paulo: Atlas, 2007, p.128-138.

MAKRIDAKIS, S; HIBON, M. The M3-Competition: results, conclusions and implications. International Journal of Forecasting, v. 16, p. 451-476, 2000.

MORAES, M. C.; ALBUQUERQUE, A. P. Previsão para o preço futuro do cacau através de uma série univariada de tempo: uma abordagem utilizando o método ARIMA. In: XXX EnANPAD, Salvador, Anais... Rio de Janeiro: ANPAD, 2006.

MORETTIN, P. A; TOLOI, C. M. C. Análise de séries temporais. 2.ed. São Paulo: Edgard Blücher, 2006.

NEVES, M. F; CONEJERO, M. A. Cenário econômico da produção de alimentos, fibras e bioenergia. In: NEVES, M. F (org.). Agronegócios e desenvolvimento sustentável: uma agenda para a liderança mundial na produção de alimentos e bioenergia. São Paulo: Atlas, 2007, p.11-19.

PACHECO, R. F; SILVA, A. V. F. Aplicação de modelos quantitativos de previsão em uma empresa de transporte ferroviário. In: XXIII ENEGEP, Ouro Preto, Anais... Rio de Janeiro: ABEPRO, 2003.

QUEIROZ, A. A; CAVALHEIRO, D. Método de previsão de demanda e detecção de sazonalidade para o planejamento da produção de indústrias de alimentos. In: XXIII ENEGEP, Ouro Preto, Anais... Rio de Janeiro: ABEPRO, 2003.

ROCHA, F.D; OLIVEIRA, D.F; LACERDA, T.S; SILVEIRA, V. N. S. Estratégias de financiamento do capital de giro em empresas do setor alimentício. In: XII SIMPEP, Bauru, Anais... Bauru: UNESP, 2005.

SACHETIM, H. M. Análise Técnica: estudo da confiabilidade dos principais indicadores de Análise Técnica, aplicados às ações mais negociadas na Bovespa no período de 1995-2005. Curitiba, 2006. 130 p. Dissertação (Mestrado em Administração) – Centro de Pesquisa e Pós-Graduação em Administração, Universidade Federal do Paraná.

SECRETARIA DE AGRICULTURA, IRRIGAÇÃO E REFORMA AGRÁRIA. Cotação agrícola. Disponível em:<http://www.seagri.ba.gov.br/cotacao.asp>. Acesso em: 03 abr. 2009.

SERRA, C. M. V; TAVARES, H. R; SANTOS, J. C. C. Aplicação de séries temporais na análise de demanda turística no Estado do Pará usando os modelos de Holt-Winters. In: XXV ENEGEP, Porto Alegre, Anais... Rio de Janeiro: ABEPRO, 2005.

SILVA, W.V; SAMOHYL, R.W; COSTA, L. S. Comparação entre os métodos de previsão univariados para o preço médio da soja no Brasil. In: XXII ENEGEP, Curitiba, Anais... Rio de Janeiro: ABEPRO, 2002.


43

SELLING PRICE PREDICTION OF ITALY GRAPE AND TOMMY MANGO PRODUCED AT SÃO FRANCISCO

VALLEY BY TIME SERIES ANALYSIS: A CASE STUDY

Abstract

This paper investigates the adequacy of a methodology for price prediction of Tommy

mango and Itlay grape, both produced and traded at São Francisco valley, by the use of

time series analysis .The average prices of these products were calculated based on

Agriculture Secretary of state of Bahia’s monthly records, between 2002 and 2008,

which total sample collected was 84 periods. For results interpretation, this study

applied the Holt-Winters and ARIMA prediction models. The results show, among other

things, a stationarity on mango price and a growing trend on grape price. The

methodology developed could be considered valid, because it gave minors square errors

prediction by additive exponential smoothing for Italy grape (Holt-Winters) and the

ARIMA model (2,0,1) for Tommy mango. Suggestion of new studies is showed in the end

of this paper.

Key-words: Price prediction, Time series, Orcharding.

A UTILIZAÇÃO DE GRÁFICOS DE CONTROLE DE SOMA ACUMULADA (CUSUM) PARA

MONITORAMENTO DE UM PROCESSO DE USINAGEM

Custodio da Cunha Alves

Universidade da Região de Joinville - UNIVILLE [email protected]

Altair Carlos Cruz


Elisa Henning

Universidade do Estado de Santa Catarina - UDESC [email protected]

Arnoldo Schmidt Neto


Resumo

Este trabalho apresenta os gráficos de controle CUSUM como um procedimento

alternativo e mais apropriado que os tradicionais gráficos de Shewhart para detectar

pequenos desvios médios do valor nominal de um processo de usinagem. O objetivo

deste trabalho é investigar a partir de um estudo comparativo se há diferença

significativa quanto a sensibilidade existente entre a utilização destes gráficos e os

gráficos de Shewhart para detectar pequenas mudanças na média do processo. Na

realização deste estudo utilizou-se dados reais de um processo de usinagem para

aplicação de gráficos de controle CUSUM no monitoramento deste processo, o que

atualmente é feito com gráficos de Shewhart. Este estudo foi fundamental para definir

a melhor escolha entre os gráficos para a análise estatística deste processo.

Palavras-chave: Ferramentas estatísticas; Gráficos CUSUM; Processos industriais.


Rio de Janeiro – RJ - Brasil ISSN 1413-9022 / v. 27, p. 45 - 58, 2009

Cadernos do IME – Série Estatística A Utilização de Gráficos de Controle...

46

1. Introdução

Os gráficos de controle estatístico de processos mais conhecidos e amplamente

aplicados no setor industrial são ainda, sem dúvida, os tradicionais gráficos de

Shewhart. No Brasil, por exemplo, o mais comum deles (o par de gráficos X e R), que

mostra a média de vários subgrupos racionais de observações sucessivas, é enfatizado

na maioria das literaturas de controle de qualidade existentes como se não houvesse

nenhum outro tipo de gráfico. Apesar de extremamente eficazes, estas ferramentas

estatísticas não são as únicas disponíveis para monitorar a qualidade de um processo.

Em alguns casos, outros tipos de gráficos de controle podem ser utilizados com a

mesma finalidade, e com vantagens. É o caso dos gráficos de controle de Soma

Acumulada (Cumulative Sum Control Charts - CUSUM).

Os gráficos de controle de Shewhart proporcionam uma grande sensibilidade no

diagnóstico de causas especiais esporádicas ou intermitentes como, por exemplo, a troca

de operadores em uma produção que opera em dois ou três turnos. Se, por hipótese, os

operadores de um dos turnos não estiverem treinados, este fato se tornará evidente no

gráfico de Shewhart, através de pontos fora de controle estatístico, conforme figura 1.

Figura1 - Exemplo de um gráfico de controle de Shewhart

Representação de um Gráfico de Shewhart

15

15,5

16

16,5

17

17,5

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Ordem das amostras

Méd

ias

LIC

LMC Pontos fora de controle: P, R e T

LMCInício da troca do turno

P R T

Já nos casos em que há uma causa identificável no sistema, que gera uma

pequena e constante variação na média ou na variabilidade (amplitude ou desvio

padrão), os gráficos de controle de Shewhart apresentarão uma tendência nos valores

plotados para as amostras. Apesar de existirem algumas regras práticas para executar

este tipo de análise (sete pontos consecutivos do mesmo lado da linha central, por

Cadernos do IME – Série Estatística Alves, Cruz, Henning & Neto

47

exemplo, é considerado como “sinal de alarme”), detectar esta tendência nem sempre é

fácil, e exige conhecimento por parte do responsável pela análise do processo. E mesmo

que venha a ser percebida, é difícil determinar através dos gráficos de controle de

Shewhart, quando o processo começou a deteriorar-se. Exatamente nestes casos, o uso

de gráficos de controle de soma acumulada (CUSUM) pode ser vantajoso, isto é,

quando existe outro tipo de causa especial persistente até que uma ação seja tomada

para eliminar a causa. Seu processo de decisão baseia-se na soma acumulada dos

resultados, e não em observações isoladas de amostras. Isto torna os gráficos CUSUM

mais sensíveis a uma pequena e contínua alteração das condições do processo.

Hawkins (1998) justifica que os gráficos CUSUM são mais apropriados do que

os gráficos de Shewhart para diagnosticar pequenas e persistentes mudanças de um

processo usando o seguinte exemplo: Num laboratório químico se um lote novo de

substância não tiver a composição adequada, os ensaios são influenciados e o lote é

substituído. Utilizando os gráficos de Shewhart dificilmente se conseguirá em tempo

hábil a substituição deste lote, a menos que estas causas especiais persistentes tenham

efeitos muito grandes. Além disso, os gráficos de Shewhart não são suficientemente

adequados para estimar quando, e de quanto a mudança de um processo pode ser um

indicativo útil para diagnosticar uma determinada causa especial persistente.

2. Gráficos de Controle de Soma Acumulada (Gráficos CUSUM)

Os gráficos de controle CUSUM inicialmente propostos na Inglaterra por Page

(1954) são alternativas viáveis aos gráficos de Shewhart. Estes gráficos incorporam

diretamente, toda a seqüência de informações demarcando as somas acumuladas dos

desvios de em relação ao valor-alvo (valor nominal). Supondo que amostras de

tamanho n são coletadas, é a média da j-ésima amostra e é o valor desejado para a

média do processo. A estatística CUSUM é formada demarcando a quantidade da

equação (1) junto à amostra i

)( 011 µ−= xC

)()(oo

xxC µµ −+−= 212= )( 21 oxC µ−+

=−+−+−= )()()( 3213 ooo xxxC µµµ )( 32 oxC µ−+ .....

∑=

− −+=−=i

j

oiioii xCxC1

1 )()( µµ (1)


48

onde iC é a soma acumulada incluindo a i-ésima amostra, pois combinam informações

de diversas amostras. Se o processo permanece sob controle para o valor desejado oµ ,

as somas acumuladas definidas em (1) descrevem um percurso aleatório com média

zero. Porém, se a média muda para algum valor acima 1µ > oµ , então a tendência

ascendente se desenvolverá na soma acumulada iC . Reciprocamente, se a média muda

para algum valor abaixo 1µ < oµ , a soma acumulada iC terá uma direção negativa. Por

esta razão, se nos pontos demarcados aparecer uma tendência para cima ou para baixo,

deve-se considerar isto como uma evidência de que a média do processo mudou e uma

busca de causas assinaláveis deve ser realizada.

Há dois procedimentos diferentes para monitorar a média de um processo via

gráficos de controle CUSUM: Algoritmo CUSUM e Máscara V.

O procedimento Algoritmo CUSUM tem a propriedade de armazenar os valores

das somas unilaterais acumuladas do processo analisado. Seja ix a i-ésima observação

do processo. Quando o processo está sob controle, ix tem uma distribuição normal com

média oµ e desvio padrão .σ Se o processo tende a se afastar do valor pretendido, o

gráfico CUSUM indica a presença de uma causa assinalável que deve ser investigada,

como acontece no caso dos gráficos de Shewhart. As estatísticas +

iC e −

iC são

denominadas Cusum superior e Cusum inferior unilaterais, conforme equações (2) e (3).

])(,0[ 1+−

+ ++−= ioii CKxmáxC µ (2)

])(,0[ 1−−

− +−−= iioi CxKmáxC µ (3)

onde 000 == −+CC . Se +

iC ou −iC , excede o intervalo de decisão H, o processo é

considerado fora de controle. Um valor razoável para H é cinco vezes o desvio padrão

σ do processo. Nas equações (2) e (3), K é denominado de valor de referência e,

corresponde aproximadamente a metade do valor, no qual há interesse em detectar

rapidamente determinada mudança entre oµ (valor nominal) e o valor da média fora de

controle 1µ . Se esta mudança é esperada em unidades de desvio padrão, então K

representa a metade da magnitude desta mudança ou


49

=K2

∆=

201 µµ −

= σδ

2 (4)

ondeδ é o tamanho da mudança em unidades de desvio padrão;σ é o desvio padrão; oµ

o valor pretendido (alvo); ∆ o valor do deslocamento que estamos interessados e

=1µ oµ + ∆ o valor da média fora de controle. A outra abordagem envolve a

padronização dos dados apresentados, supondo que os valores da variável ix seguem

distribuição N(0,1) conforme equações (5) e (6):

],0[ 1+−

+ +−= iii CkymáxC (5)

],0[ 1−−

− +−−= iii CykmáxC = ],0[ 1−−++ ii Cykmín (6)

Para isso, antes de efetuar os cálculos de +iC e −

iC padroniza-se a variável ix

fazendo σ

µ nxy o

i

i

)( −= como a variável padronizada de ix .

No procedimento Algoritmo CUSUM, o gráfico é projetado pela escolha

adequada ds valor de referência K e do intervalo de decisão H (limites inferior e

superior do gráfico CUSUM) capaz de minimizar falsos alarmes para a amplitude da

mudança que se deseja detectar .

Montgomery (2004), recomenda que o melhor modelo matemático para

selecionar estes valores é definí-los conforme equações (7) e (8):

nkK

σ= (7)

nhH

σ= (LSC)

nhH

σ−= (LIC) (8)

onde parâmetros k e h são freqüentemente usados com os valores k=0,5 e h=5

respectivamente, e σ o desvio padrão dos dados.

Em geral, recomenda-se que esses parâmetros sejam escolhidos de modo a

fornecer um bom desempenho (ARL) do gráfico CUSUM. Se escolhermos h=4,77, isso

resultará em um gráfico CUSUM com ARLo = 370 amostras, o que coincide com o

valor de ARLo para um gráfico de controle de Shewhart com os limites σ3 habituais.

Hawkins (1993), recomenda os valores para k e os correspondentes valores de h

que resultam ARLo = 370, conforme tabela 1.


50

Tabela.1 Valores de k e h que geram ARLo = 370 sugeridos para o Algoritmo CUSUM

k 0,25 0,5 0,75 1,0 1,25 1,5

h 8,01 4,77 3,34 2,52 1,99 1,61

Fonte: Hawkins (1993)

Os valores de k e h conforme tabela (1) são calculados com uma confiabilidade

idêntica a do gráfico de Shewhart (temos uma probabilidade de 0,27% de cometermos

um erro tipo I, isto é, de o gráfico apresentar um sinal de alarme sem que a média

efetivamente tenha se deslocado de seu valor original).

No procedimento Algoritmo CUSUM, é possível a partir dos valores das somas

unilaterais acumuladas do processo analisado determinar a estimativa do valor médio do

processo ( µ̂ ) após a emissão do sinal fora de controle (Montgomery, 2004):

=µ̂

>++

>++

−

−

−

+

+

+

HCseN

CK

HCseN

CK

i

i

o

i

i

o

,

,

µ

µ

(9)

O procedimento Máscara V proposto por Barnard (1959) é um método gráfico

alternativo utilizado além do Algoritmo CUSUM que permite por inspeção dos pontos

representados decidir se ocorreu ou não um desvio no valor médio oµ desejado. Este

procedimento é aplicado a sucessivos valores da estatística CUSUM

11

−=

+==∑ ii

i

j

ii CyyC (10)

onde iy é a observação padronizada

σ

µ nxy oi

i

)( −= .

Estes dois procedimentos Algoritmo CUSUM e Máscara V apesar de serem

diferentes têm a mesma função e apresentam vantagens e desvantagens. A escolha de

cada um deles para monitorar a média do processo depende dos recursos

computacionais disponíveis para a escolha dos mesmos (Alves, 2003).

Neste artigo, o desenvolvimento do procedimento Algoritmo CUSUM em uma

planilha eletrônica MS-Excel®, permite avaliar em tempo real a média do processo para

cada ponto plotado no gráfico. Com a utilização do aplicativo RExcel (Neuwirth et al.,

2009) é possível efetuar análises estatísticas mais completas, como avaliar a


51

normalidade e a ausência de auto-correlação dos dados, condição necessária para

gráficos CUSUM e Shewhart. O RExcel, que está disponível na Internet, faz com que

funções do ambiente GNU R (R Core Development Team, 2009) possam rodar na

própria planilha. É, portanto, uma alternativa para aplicação de controle estatístico on-

line de processos, que pode ser facilmente desenvolvida pelo próprio usuário.

3. Informações do Processo de Usinagem

Os dados reais utilizados neste artigo são referentes a um processo de usinagem

do corpo da válvula de descarga cedidos por uma indústria de metais sanitários

localizada na cidade de Joinville-SC. Nesse processo, a parte interna do corpo da

válvula de descarga é usinada para a obtenção de um alojamento no seu interior onde é

colocado para vedar um anel oring de borracha durante a montagem da válvula de

descarga.

O processo de usinagem deste alojamento para o anel oring requer uma alta

precisão para evitar possíveis vazamentos durante seu uso. Nesse processo, a

característica da qualidade utilizada para o monitoramento com gráficos de controle

CUSUM é a medida diâmetro do alojamento para o anel de oring do corpo da válvula de

descarga cujo valor nominal é 46,515 ± 0,185 mm. Esta característica da qualidade é

atualmente monitorada via gráficos de controle X de Shewhart com 25 amostras de

tamanho n=8 coletadas diariamente a cada hora de produção. A escolha desta

característica da qualidade se deve ao fato de tratar-se de um processo de alta precisão,

cuja variação na amplitude da média do processo é extremamente pequena. Esta alta

precisão condiciona a aplicação de gráficos de controle com maior sensibilidade na

detecção de pequenos desvios, tais como os gráficos CUSUM. Por esta razão, com base

em dados históricos e acompanhamentos do processo a partir de dados recentes,

decidiu-se detectar um pequeno desvio na média do processo de apenas 0,001mm acima

do valor nominal.

Os dados históricos indicam um processo sob controle cujas médias se

aproximam a uma distribuição normal com média iX = 46,515mm e desvio padrão de

0,02mm. Os dados recentes deste processo, coluna B (Figura1), também revelam que o

valor médio se manteve constante em torno de 46,515mm com um desvio padrão de


52

0,02mm até a 15a amostra, e, a partir da 16a amostra este processo sofreu um acréscimo

de 0,001mm passando a ser igual a 46,516mm.

Os dados do processo são: oσ =0,02mm (Desvio padrão conhecido do processo);

oµ = 46,515 mm (Valor nominal); 1µ = 46,516 mm (Valor médio do processo para o

estado fora de controle); desvio do valor nominal ∆=0,001mm e intervalo de decisão H

(limites inferior e superior do gráfico CUSUM) obtido a partir da equação 8.

4. Construção dos Gráficos de Controle CUSUM

Para ilustrar a sistemática de desenvolvimento dos gráficos de controle CUSUM,

foram utilizados dados reais do processo de usinagem em estudo, conforme Figura 2

(planilha eletrônica).

Existem vários métodos para se construírem gráficos CUSUM. Neste artigo,

optamos pela metodologia proposta por Hawkins (1993). Para tal, desenvolveu-se uma

planilha eletrônica (figura 2) em ambiente MS-Excel cujas fórmulas inseridas nas

células desta planilha geram dados para a análise estatística antecipada do processo,

bem como a utilização dos mesmos para a construção dos gráficos de controle.

Conforme planilha eletrônica utilizada neste artigo para a construção do gráfico

CUSUM, a coluna B apresenta a média dos 25 subgrupos racionais do processo. As

colunas C, D e E, representam respectivamente os limites de controle LIC, LMC e LSC

do gráfico de controle X de Shewhart ( σ3 ) cujos valores são obtidos conforme modelo

matemático:

LIC=n

o

o

σµ 3− LMC= oµ LIC=

n

o

o

σµ 3+ (11)

A coluna F representa a Soma Acumulada Ci que é obtida conforme equação (1).

As colunas G e I, representam respectivamente, as estatísticas +iC e −

iC do Algoritmo

CUSUM, obtidas pelas equações (2) e (3). As colunas H e J, representam

respectivamente os contadores +N e

−N de períodos +iC e −

iC não nulos. As colunas K

e L, representam respectivamente os intervalos de decisão H e –H (limites de controle

utilizado no Algoritmo CUSUM), obtidos pelas equação (8). Além disso, o valor de

referência K (Célula E30), obtido conforme equação (4) e o valor h=4,77 (Célula


53

K30), obtido da tabela 1 cuja escolha se deve a um gráfico CUSUM com confiabilidade

idêntica ao gráfico de controle X de Shewhart ( σ3 ).

Figura 2 - Planilha eletrônica dos dados gerados a partir das informações do processo

Os dados do processo se comportam segundo uma distribuição normal e não

apresentam autocorrelação (figura 3). A verificação da normalidade e independência

dos dados do processo foi desenvolvida com auxílio do aplicativo RExcel (NEUWIRTH

et al. 2009).

Os gráficos de controle: X de Shewhart, Algoritmo CUSUM, Status CUSUM e

o CUSUM (com a Máscara V) obtidos dos dados gerados a partir da planilha eletrônica

(figura 2) são ilustrados nas figuras 4, 5, 6 e 7.

No gráfico X de Shewhart (figura 4) nenhum ponto ultrapassa as linhas de

controle. O aumento na média do processo não é detectado. É possível melhorar a

sensibilidade do gráfico Shewhart com auxílio das regras suplementares, mas a

incorporação dessas regras, segundo Costa et al. (2004), diminui a simplicidade de

interpretação do gráfico e aumenta o número de alarmes falsos.


54

Figura 3 – Gráficos: Normalidade e Autocorrelação dos dados do processo

Figura 4 - Gráfico de Controle de Shewhart (Xbarra)

Gráfico de Controle de Shewhart (Xbarra)

46,49046,49546,500

46,50546,51046,51546,52046,525

46,53046,53546,540

0 5 10 15 20 25

Subgrupos racionais

Méd

ias

dos

subg

rupo

s ra

cion

ais

Médias dos subgrupos racionais LIC( 3 Sigmas ) LMC LSC( 3 Sigmas )

Como se pode observar, o gráfico CUSUM (figura 5) assinala um deslocamento

no nível médio do processo a partir da 16ª amostra, ultrapassando o limite superior do


55

CUSUM na 19ª. Amostra. Isto é reforçado na figura 6, onde num mesmo gráfico, estão

os dados observados e as estatísticas CUSUM inferior e superior.

Figura 5 - Gráfico de Controle CUSUM

Figura 6 - Gráfico de STATUS CUSUM

Gráfico de STATUS CUSUM

-0,08-0,07-0,06-0,05-0,04-0,03-0,02-0,01

00,010,020,030,040,050,060,070,080,09

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Alg

oritm

o C

US

UM

46,47

46,48

46,49

46,50

46,51

46,52

46,53

46,54G

ráfic

o de

She

wha

rt

( X

barr

a )

Ci+ (CUSUM Superior) Ci - (CUSUM Inferior) Gráfico de Shew hart( Xbarra)

A máscara V é apresentada na figura 7. Indica um aumento no valor médio deste

processo a partir da 17ª. amostra.


56

Figura 7 - Gráfico CUSUM (Procedimento: Máscara V)

Gráfico CUSUM (Procedimento: Máscara V)

-0,090-0,080

-0,070-0,060

-0,050-0,040

-0,030-0,020

-0,0100,000

0,0100,020

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27Subgrupos Racionais

Som

a A

cum

ula

da

( C

i )

Verificou-se, analisando os gráficos das figuras 4, 5, 6 e 7, que somente os

procedimentos CUSUM sinalizaram o aumento na média, pequeno, mas fundamental,

em virtude da precisão desejada neste processo.

Embora os gráficos Shewhart sejam atrativos pela simplicidade de aplicação e

uso, só são eficazes para detectar grandes (e repentinas) alterações. Os gráficos

CUSUM são ótimos para sinalizar pequenos a moderados (e persistentes) desvios na

média de um processo. Além disso, de acordo com Gomes et al. (2008), no

acompanhamento de uma seqüência do processo, o gráfico CUSUM mostra exatamente

onde saiu de controle e quando voltou.

5. Conclusões e Considerações Finais

Os resultados obtidos a partir de dados reais neste artigo, mostram os gráficos

CUSUM como ferramentas muito úteis no monitoramento deste processo de usinagem.

Em primeiro lugar, porque se mostraram mais sensíveis do que os gráficos de controle

X de Shewhart para detectar pequena mudança (variação) na média da característica da

qualidade monitorada. Em segundo lugar, porque foi possível determinar quando esta

mudança ocorreu e estimar tanto a amplitude desta mudança quanto o novo valor médio

deste processo para o intervalo após a mudança. Os resultados deste estudo são

apresentados a partir dos gráficos de controle desenvolvidos para os dados deste

processo (figuras 4, 5, 6 e 7).


57

− O gráfico de controle X de Shewhart com seqüência de pontos que não violam as regras de decisão não foi capaz para detectar um sinal fora de controle. Além disso, não foi suficientemente sensível para sinalizar o momento da mudança no valor médio deste processo.

− O Algoritmo CUSUM assinala mudança no nível médio deste processo com os pontos fora dos intervalos de decisão H e –H

− O gráfico CUSUM com a Máscara V confirma um aumento considerável no valor médio deste processo a partir da 17a amostra, assinalando assim o início deste aumento.

A utilização de dados reais na realização deste estudo foi imprescindível para

que fundamentos teóricos sobre gráficos CUSUM fossem transferidos para uma

situação prática.

Referências

ALVES, C.C. Gráficos de controle CUSUM: um enfoque dinâmico para a análise estatística de processos. Dissertação de Mestrado em Engenharia de Produção, UFSC, Florianópolis, 2003.

BARNARD, G.A. Control Charts and Stochastic Processes, Journal of the Royal Statistical Society, 21, 239-271, 1959.

COSTA, A. F.B. EPPRECHT, E. K. CARPINETTI, L.C.R. Controle Estatístico de Qualidade. São Paulo: Editora Átlas S.A, 2004.

GOMES, I.C., OLIVEIRA, C.L., MINGOTI, S.A. Estudo da Aplicação de Gráficos de Controle na vigilância de Infecçoes Hospitalares no Hospital das Clínicas da UFMG. In: SIMPEP - SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO, 15. Bauru. Anais: ... Bauru: UNESP, 2008. Disponível em: < http://www.simpep.feb.unesp.br/anais_simpep.php?e=1> Acesso em: 04 mai. 2009.

HAWKINS, D.M., OLWELL, D.H. Cumulative Sum Control Charting: An Underutilized SPC Tool, Quality Engineering, 5 (3), 463-477, 1993

HAWKINS, D.M., OLWELL, D.H. Cumulative Sum Charts and Charting for Quality Improvement. Engineering and Physical Science, Springer, 1998.

MONTGOMERY, D. C. Introdução ao Controle Estatístico da Qualidade. 4 ed., Rio de Janeiro: LTC Editora, 2004.

PAGE, E.S. Continuous Inspection Schemes, Biometrika, 41, 100-115, 1954.

NEUWIRTH, E., HEIBERGER, R., RITTER, C., PIETERSE J. K., VOLKERING, J. RExcelInstaller: Integration of R and Excel, (use R in Excel, read/write XLS files), 2009. Disponível em: < http://rcom.univie.ac.at/ >. Acesso em 02/02/2010.

R DEVELOPMENT CORE TEAM. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria, 2009. Disponível em: http://www.R-project.org. Acesso em 04/02/2010.


58

THE USE OF CUMULATIVE SUM CHARTS (CUSUM) FOR MONITORING A MACHINING PROCESS

Abstract

This paper presents the CUSUM control charts as an alternative and more appropriate

procedure than the traditional Shewhart charts to detect small deviations from the

average value of a machining process. The objective of this work is to investigate based

on a comparative study whether there is significant difference in sensitivity between the

use of these charts and Shewhart charts in detecting small changes in the process mean.

In this study, we used real data from a machining process for application of CUSUM

control charts in monitoring this process, which is currently done with Shewhart charts.

This study was essential in defining to define the best choice between the charts for

statistical analysis of this process.

Keywords: Statistical Tools, CUSUM charts; Industrial processes.

CADERNOS DO IME

Série Estatística

A revista Cadernos do IME é um veículo de divulgação de trabalhos acadêmicos publicado pelo Instituto de Matemática e Estatística da Universidade do Estado do Rio de Janeiro.

A revista é semestral, sendo publicada em junho e dezembro. São aceitos trabalhos inéditos e que apresentem elementos de originalidade, em português, inglês ou espanhol.

Os Cadernos do IME aceitam os seguintes tipos de contribuições:

• Artigo técnico, trabalho de pesquisa com elementos de originalidade;

• Resenha / Revisão, revisão de literatura e análise crítica de produtos;

• Comunicação, texto destinado destinado à informação sobre trabalhos de graduação e de pós-graduação; à divulgação de opiniões, pesquisas em andamento.

Os artigos não devem ultrapassar 12 páginas. Os arquivos digitais no formato word deverão ser encaminhados aos editores da série. As chamadas de trabalho estão disponíveis na página da revista. Processo de Avaliação: Os artigos submetidos à publicação são avaliados em sistema blind-review por consultores ad-hoc pertencentes ao corpo de avaliadores da revista. Com base nestas avaliações, a Editoria da revista selecionará os artigos para publicação Os conteúdos e pontos de vista expressos nos trabalhos publicados são de inteira responsabilidade dos autores. Correspondência: Universidade do Estado do Rio de Janeiro Instituto de Matemática e Estatística Rua São Francisco Xavier, 524 - Pavilhão Reitor João Lyra Filho- 6º andar Maracanã - 20550-900 – Rio de Janeiro, RJ Telefax: 21 2334-0144 www.ime.uerj.br/cadernos/cadest

Ricardo Vieiralves de Castro Reitor

Maria Christina Paixão Maioli

Vice-Reitora Maria Georgina Muniz Washington Diretora do Centro de Tecnologia e Ciência

Sérgio Luiz Silva Diretor do Instituto de Matemática e Estatística Geraldo Magela da Silva Vice- Diretor do Instituto de Matemática e Estatística Rubens Andre Sucupira Departamento de Análise Matemática Jéssica Ruth Gavia Zurita Departamento de Estruturas Matemáticas Mara de Carvalho de Souza Departamento de Geometria e Representação Gráfica Mariluci Ferreira Portes Departamento de Informática e Ciência da Computação Guilherme Caldas de Castro Departamento de Estatística Maurício Pereira dos Santos Departamento de Matemática Aplicada

apoio