View
219
Download
0
Category
Preview:
Citation preview
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO INSTITUTO DE MATEMÁTICA
DEPARTAMENTO DE MÉTODOS ESTATÍSTICOS
Thamyres Lacerda Rocha de Oliveira
Camilla Carneiro de Mendonça Brasil Corrêa
Controle Estatístico de Qualidade: Uma abordagem Bayesiana
Orientador: Fernando Antônio Moura
Rio de Janeiro
2014
2
Thamyres Lacerda Rocha de Oliveira
Camilla Carneiro de Mendonça Brasil Corrêa
Controle Estatístico de Qualidade: Uma abordagem Bayesiana
Trabalho de conclusão de curso do curso de
Estatística da UFRJ com o intuito de apresentar
modelos de Inferência Bayesiana para Controle
Estatístico de Qualidade.
Orientador: Fernando Moura
Rio de Janeiro
2014
3
Agradecimentos
À Deus seja toda honra e glória, pois pela sua soberania esteve sempre ao
nosso lado.
À esta universidade, seu corpo docente, direção e administração, que nos
proporcionou a oportunidade de fazer este curso.
Ao nosso orientador, professor Fernando Moura, pela oportunidade e por
todas as suas contribuições na execução deste projeto. Também agradecemos por seu
empenho e paciência conosco.
Às nossas famílias, das quais hoje somos um reflexo, pelo apoio e palavras de
incentivo.
À todos que direta ou indiretamente contribuíram para a nossa formação
profissional, os nossos sinceros agradecimentos.
4
Resumo
Este trabalho tem como objetivo apresentar técnicas de Inferência Bayesiana
para o Controle Estatístico de Qualidade. Desta forma, abordamos as técnicas clássicas
do Controle Estatístico de Qualidade, uma introdução à inferência bayesiana, o
desenvolvimento de modelos para o Controle Estatístico de Qualidade Bayesiano, uma
comparação entre as abordagens frequentista para o problema descrito e por fim, uma
conclusão sobre os métodos estudados. Os modelos estudados apresentaram uma
capacidade de detecção de uma amostra supostamente fora de controle mais
rapidamente do que no modelo Clássico. Além disso, o teste Bayesiano é capaz de
calcular a probabilidade da hipótese nula condicional aos dados, o que a metodologia
clássica não nos fornece. Portanto foi possível concluir que o método Bayesiano
desenvolvido pode ser considerado como uma alternativa viável para o Controle
Estatístico de Qualidade.
5
Lista de Ilustrações
Gráfico 1. Gráfico da Amplitude R .................................................................................. 35
Gráfico 2. Gráfico da Média excluindo a 12ᵃ amostra ................................................ 37
Gráfico 3. Gráfico da Média excluindo a 12ᵃ e 13ᵃ amostras ..................................... 38
Gráfico 4. Gráfico de Controle Estatístico de Qualidade Bayesiano para o Exemplo dos
Saquinhos de Leite .......................................................................................................... 44
Gráfico 5. Gráfico de Controle Estatístico de Qualidade Bayesiano para dados
simulados ........................................................................................................................ 45
Lista de Tabelas
Tabela 1. Valores para d2 e d3......................................................................................... 12
Tabela 2. Probabilidades associadas às possíveis escolhas da hipótese H0. ................. 14
Tabela 3. Fator de Bayes e Interpretações ..................................................................... 21
Tabela 4. Possíveis hipóteses de H0 para e ............................................................. 27
Tabela 5. Dados das 25 amostras de saquinhos de leite, Amplitudes e Médias. .......... 33
Tabela 6. Dados das 25 amostras de saquinhos de leite, Amplitudes e Médias excluindo
a 12ᵃ amostra .................................................................................................................. 35
Tabela 7. Dados das 25 amostras de saquinhos de leite, Amplitudes e Médias excluindo
a 13ᵃ amostra .................................................................................................................. 37
Tabela 8. Probabildade a posteriori de H0 para C0 = 0.5 ................................................ 41
Tabela 9. Probabildade a posteriori de H0 para C0 = 1 ................................................... 41
Tabela 10. Probabildade a posteriori de H0 para C0 = 10 ............................................... 41
Tabela 11. Fator de Bayes para C0 = 0.5 ......................................................................... 42
Tabela 12. Fator de Bayes para C0 = 1 ............................................................................ 42
Tabela 13. Fator de Bayes para C0 = 10 .......................................................................... 43
6
Lista de Abreviaturas e siglas
CEQ – Controle Estatístico de Qualidade
FB – Fator de Bayes
a.a. – Amostra Aleatória
Sumário
Resumo ............................................................................................................................. 4
Lista de Ilustrações ........................................................................................................... 5
Lista de Tabelas ................................................................................................................ 5
Lista de Abreviaturas e siglas............................................................................................ 6
Introdução ........................................................................................................................ 7
Capítulo 1: O controle estatístico de qualidade na abordagem clássica ......................... 9
1.1. Os fundamentos da estatística clássica ............................................................. 9
1.2. O monitoramento do processo. ......................................................................... 9
Capítulo 2: O controle estatístico de qualidade na abordagem bayesiana ................... 18
2.1. Os fundamentos da Inferência Bayesiana ....................................................... 18
2.2. Controle Estatístico de Qualidade – Abordagem Bayesiana ........................... 21
2.3. Inferência Bayesiana e Clássica........................................................................ 32
Capítulo 3: Aplicação da metodologia abordada ........................................................... 33
3.1. Aplicação com Exemplo Clássico ........................................................................ 34
3.2. Aplicação com Exemplo Bayesiano ..................................................................... 39
Conclusão........................................................................................................................ 46
Bibliografia ...................................................................................................................... 48
Apêndice A ...................................................................................................................... 49
Apêndice B ...................................................................................................................... 51
Apêndice C ...................................................................................................................... 53
7
Introdução
Qualidade é um conceito muito utilizado pela Engenharia de Produção e possui
diversas definições. Alguns exemplos são: adequação ao uso (Juran, 1999); atender e,
se possível, exceder as expectativas do consumidor (Deming, 2000); atender as
especificações (Crosby, 1995). A produção, o uso e o descarte de um produto sempre
acarretam prejuízo para uma sociedade e portanto, quanto menor for o prejuízo,
melhor será a qualidade do produto (Tagushi, 1999). Além disso, qualidade também é
considerado o valor do bem – ou do serviço – que significa o grau de satisfação do
consumidor com respeito à vários quesitos, tais como preço, confiabilidade,
durabilidade, estética e etc.
O Controle Estatístico de Qualidade (CEQ) é a técnica estatística que avalia se
um determinado processo se encontra adequado, utilizando como base paramétrica
amostras em condições ideais e o prévio conhecimento que o pesquisador tem do
processo.
O controle é feito através de ferramenta estatísticas, e utiliza principalmente
técnicas de estimação de parâmetros, construção de gráficos de controle e testes de
hipóteses que mostram se esses processos se encaixam ou não, dentro de limites de
adequação determinados previamente.
Na estatística é possível destacar duas abordagens: a Estatística Clássica e a
Estatística Bayesiana. Tanto na inferência Clássica como na Bayesiana o objetivo
principal é inferir sobre a população a partir da amostra selecionada da mesma. No
8
caso Clássico é guiada pela amostragem repetida que está fundamentada na
Interpretação Frequentista de Probabilidade. Para a Estatística Bayesiana o conceito de
probabilidade está intrínseco ao grau de credibilidade. Propõe-se caracterizar a
aprendizagem com a experiência, isto é, a modificação da atitude inicial em relação
aos “antecedentes”, “causas”, “hipóteses” ou “estados” depois de ter a informação
adicional de que certo acontecimento se realizou. Assim, para os Bayesianos, a
distribuição de probabilidade que expressa o conhecimento a priori sob a quantidade
de interesse é baseada na informação a priori e é de natureza subjetiva.
Em Controle Estatístico de Qualidade (CEQ) é aplicado mais usualmente
técnicas da Estatística Clássica. Neste trabalho, no entanto, propõe-se o uso de
Estatística Bayesiana e sua comparação com o método clássico com o intuito de serem
incorporadas experiências e conhecimentos já adquiridos para se fazer inferência.
9
Capítulo 1: O controle estatístico de qualidade na
abordagem clássica
1.1. Os fundamentos da estatística clássica
Segundo o princípio da amostragem repetida os métodos estatísticos devem
ser avaliados através do respectivo comportamento sob repetições do experimento
efetuadas nas mesmas condições. Uma das etapas do princípio consiste precisamente
na interpretação frequentista de probabilidade, quando se utiliza frequências como
medida de incerteza; outra etapa consiste em avaliar os procedimentos estatísticos
pela frequência com que produzem bons resultados ou respostas corretas.
1.2. O monitoramento do processo.
Todo processo está sujeito a variações, sendo grandes ou pequenas, fato que
faz com que cada elemento seja único e tenha particularidades que o torna diferente
de todos os outros embora às vezes pareçam semelhantes. A expressão variabilidade
do processo faz alusão às diferenças existentes entre as unidades produzidas.
Segundo Shewhart, todo e qualquer processo, por mais bem projetado e por
mais bem controlado que seja, possui em sua variabilidade um componente impossível
de ser eliminado. Trata-se da variabilidade natural do processo, que é ocasionada por
uma série de perturbações que não conseguimos controlar chamadas causas
aleatórias. Quando o processo apresenta apenas a variabilidade natural dizemos que
ele está sob controle. Há ainda a variabilidade provocada pelas causas especiais, que
são perturbações maiores e mais fáceis de serem controladas, estas causas têm o
poder de deslocar a distribuição da variável resposta X, deslocando a sua média do
valor-alvo e/ou aumentando sua dispersão. Quando, além de causas aleatórias o
10
processo tiver a presença de causas especiais, diz-se que o processo está fora de
controle.
O objetivo do CEQ é monitorar o processo para que as causas especiais sejam
identificadas, e quando detectadas deve-se proceder uma investigação e intervir para
eliminá-las. O monitoramento é realizado através de uma análise periódica de
amostras.
Se a variável a ser controlada é contínua, o usual é monitorar o processo por
um par de gráficos de controle, um que controle a média e outro que controle a
dispersão da variável. Os gráficos mais empregados são os gráficos de controle de
(média amostral) e R (amplitude amostral), utilizados para monitorar a média e a
dispersão da variável, respectivamente. Para construir estes gráficos precisamos
conhecer bem a variável aleatória X, ou seja, a forma de sua distribuição, sua média μ
e seu desvio-padrão σ. Como estes parâmetros em geral são desconhecidos,
precisamos estimá-los sob circunstâncias de um processo em controle, sem presença
de causas especiais.
Gráficos de Controle por variáveis
Um gráfico de controle deve conter uma linha média (LM), representando a
estimativa pontual da variável de interesse, um limite superior de controle (LSC) e um
limite inferior de controle (LIC). Quando uma amostra apresentar a sua observação no
gráfico acima do LSC ou abaixo de LIC, é um sinal de que alguma causa especial pode
estar intervindo no processo.
11
Construção dos gráficos de controle de e R
O gráfico de tem linha média e limites de controle segundo proposto por
Shewhart da seguinte forma:
Onde é o estimador da média de , o estimador do desvio-padrão de X,
quando o processo estiver sob controle, e n o tamanho da amostra.
Denotaremos por μ0 e σ0 a média e o desvio-padrão da população. Na prática,
estes valores não são conhecidos com precisão absoluta, então utilizaremos as
estimativas disponíveis 0 e 0.
Caso a dispersão do processo continue estável e sua média permaneça
ajustada, o intervalo de
√ em torno de μ engloba 99,73% dos valores de .
Vamos agora determinar os limites de controle e linha média para o gráfico de
R. Estes também são usualmente determinados com limites de 3-sigma:
Caso a variável X tenha distribuição Normal com desvio-padrão igual a σ, então
a distribuição de R (amplitude amostral), que é a diferença, em módulo, entre o menor
e o maior valor da amostra (R = Xmax – Xmín) , terá média e desvio-padrão dados por:
μR = d2σ
σR = d3σ
As constantes d2 e d3 dependem apenas do tamanho da amostra n. Veja a
tabela abaixo:
√
√
12
Tabela 1. Valores para d2 e d3
N 2 3 4 5 6 7 8 9 10 11 12 13 14 15
d2 1,128 1,693 2,059 2,326 2,534 2,704 2,847 2,970 3,078 3,173 3,258 3,336 3,407 3,472
d3 0,853 0,888 0,880 0,864 0,848 0,833 0,820 0,080 0,797 0,787 0,778 0,770 0,763 0,756
Quando o limite inferior de controle de R (LICR) apresentar um valor negativo,
consideramos este limite como zero. Pois por definição, a amplitude não pode
apresentar valores abaixo de zero.
Dado um conjunto inicial de m amostras, a estimativa usual para é o valor
médio das médias das amostras:
= ∑
onde é a média da i-ésima amostra; e a estimativa para , quando estiver
utilizando o gráfico de controle de em conjunto com o R, é:
= ⁄
onde é a média aritmética dos m valores de :
∑
⁄
Deve-se sempre começar pelo monitoramento de R, pois se a média do
processo alterar-se durante a coleta das amostras, isto não terá repercussão na
determinação dos limites de controle do gráfico de R porque este não depende da
média. O mesmo não pode ser dito para o gráfico de , pois a determinação de seus
limites é feita com base nas estatísticas e R. Portanto , o gráfico da amplitude pode
13
ser construído com o processo desajustado: basta que ele esteja isento de causas
especiais que afetem sua dispersão.
Desempenho dos gráficos de e R
Quando utilizamos um gráfico de controle para monitorar determinado
processo,se o seu ponto de referência estiver acima do limite superior de controle ou
abaixo do limite inferior de controle esta amostra deverá passar por uma avaliação
para detecção de causas especiais. Cada vez que realizamos este procedimento,
estamos fazendo um teste de hipótese, e as hipóteses testadas são sempre as
mesmas:
H0: “Processo sob controle” ou “Processo centrado no valor-alvo” ou “μ = μ0”
H1: “Processo fora de controle” ou “Processo não centrado no valor-alvo” ou “μ ≠ μ0”
A hipótese H0 é aceita como verdadeira toda vez que o valor da estatística cair
dentro dos limites de controle. Em testes de hipóteses a rejeição de H0 implica na
aceitação de H1, pois estas hipóteses são complementares.
No entanto, podemos cometer o erro de rejeitar a hipótese nula (H0) por
engano, ou seja, apesar de ela ser verdadeira. A este erro denominamos erro do tipo I,
e consideramos que ele poderá acontecer com probabilidade . Outro tipo de erro
poderá ser cometido, o erro do tipo II, se decidirmos em aceitar a hipótese de nulidade
(H0) sendo na verdade ela falsa. Este segundo erro depende do valor verdadeiro do
parâmetro μ e poderá acontecer com probabilidade . Abaixo, uma tabela que torna
mais esclarecedora os tipos de erros associados a cada uma das hipóteses.
14
Tabela 2. Probabilidades associadas às possíveis escolhas da hipótese H0.
Decisão
Aceitar H0 Rejeitar H0
Realidade de H0
Verdadeira 1 – α α
(decisão correta) (erro do tipo I)
Falsa Β 1 – β
(erro do tipo II) (decisão correta)
Desempenho de
As probabilidades de alarme falso (α) e de não-detecção (β) são dadas por:
α = P ( > ou < |μ = μ0)
P ( ≤ ≤ |μ = μ1) onde μ1 H1
O poder do gráfico de controle, Pd, é definido pela probabilidade de detecção
de amostras não conformes.
Para obter a probabilidade de alarme falso (risco α) é necessário conhecer a
distribuição de . Suponha que as observações são normalmente distribuídas, logo
tem-se que também tem distribuição normal. Padronizando a variável obtemos a
variável Z que segue uma distribuição normal com média zero e variância um, onde:
(
√ ) onde
Z =
, Z ~ N ( = 0, = 1)
A probabilidade de um ponto de cair fora do limite de controle é igual a:
(
) (
)
15
Substituindo na equação acima os limites de controle por ,
e também e
√ , chegamos após algumas
simplificações à equação : | | , que representa, segundo a tabela da
distribuição acumulada da normal-padrão que se encontra no apêndice C, um risco
. Portanto esta é a probabilidade de que uma amostra gere um alarme
falso.
Quando a hipótese alternativa (H1) é a verdadeira, o ideal seria que a primeira
amostra já sinalizasse a não conformidade. Contudo isso nem sempre acontece,
principalmente quando o deslocamento sofrido pela média é pequeno. É usual
expressar esse deslocamento em unidades iguais ao desvio-padrão da variável X, de
forma que o valor da nova média, , seja escrita como , portanto:
O poder do gráfico de controle , neste caso em que a média da variável X
sofre um deslocamento, é:
[ ] [ ] [ ] [ ]
onde, ( )
[ ]
√ , e semelhantemente,
√ .
Logo, [ √ ] [ √ ].
Desempenho de R
Utiliza-se o gráfico de controle de R para identificar alterações na variabilidade
do processo. As hipóteses e associadas ao gráfico são:
16
onde representa o desvio-padrão do processo quando ele está isento de causas
especiais. Quando é a hipótese verdadeira existe o risco de um valor de R cair fora
dos limites do gráfico. Este risco chamamos de . Quando for a hipótese
verdadeira, há o risco de se considerar o processo sob controle para qualquer valor
de da hipótese . São eles:
[ | ]
[ | ] ,
Assim como é feito no gráfico de controle de , os limites de são fixados a
mais ou menos três desvios-padrão do valor médio de . Sendo assim,
e .
A variável aleatória não apresenta uma distribuição normal e possui uma
distribuição de probabilidade assimétrica, consequentemente os limites de 3-sigma
geram um risco para a variável maior que 0,0027 (o risco de ). Além disso, para
n entre 2 e 6, estes limites produzem um negativo.
O cálculo de probabilidades de uma amplitude amostral ser menor ou igual a
não é simples, portanto, para facilitar este cálculo foram tabeladas as
probabilidades em termos da estatística pivotal ⁄ , pois sua distribuição
depende apenas do tamanho da amostra , veja a tabela de W no apêndice C. Assim
temos [ ] [ ⁄ ].
17
O risco associado ao gráfico de controle de é dado pela equação:
[ | ]
[ | ]
[ | ]
É possível também obter o poder do gráfico de R através da expressão:
[ | ]
[
| ]
Quando ocorrer um aumento de o poder do gráfico de R é dado por :
[
| ]
18
Capítulo 2: O controle estatístico de qualidade na
abordagem bayesiana
2.1. Os fundamentos da Inferência Bayesiana
A estatística Bayesiana, que assim é chamada pois tem por fundamento o
Teorema de Bayes, utiliza técnicas que trabalham com probabilidades condicionadas.
O Teorema de Bayes é um corolário do teorema da probabilidade total e
permite calcular a seguinte probabilidade:
|
Onde P(A) e P(Bi) são as probabilidades a priori de A e Bi, P(Bi |A) e P(A| Bi) são
as probabilidades a posteriori de Bi condicional a A e de A condicional a Bi
respectivamente. E Bi é a i-ésima partições do espaço amostral S, i=1,2,...
Função de verossimilhança, distribuição a priori , distribuição a posteriori
A função de verossimilhança é a função de densidade conjunta das variáveis
aleatórias de avaliada para os valores observados
) e tendo como argumento o parâmetro desconhecido θ. Ou seja,
quando a f.d.p. conjunta ( | ) das observações em uma amostra aleatória (a.a.) é
considerada uma função de para a amostra observada ).
19
Já, a distribuição de um parâmetro θ, anterior à informação amostral, se chama
distribuição a priori de θ. Para a construção da distribuição a priori, o pesquisador
deverá utilizar sua experiência passada e conhecimentos já adquiridos sobre o
experimento para traçar as regiões do espaço Ω onde é mais provável que
encontremos o parâmetro θ.
Suponha uma a.a. de n variáveis aletórias cuja função
densidade de probabilidade (f.d.p.) é | e a f.d.p. a priori de é . Seja a f.d.p
conjunta | dada por:
| ∏ |
Observe que, pelo Teorema de Bayes:
( | ) onde (
Portanto, temos a distribuição a posteriori de dada por:
|
( )
( | )
( )
Onde ( ) ∫ ( | ) é uma constante que depende somente da amostra
observada.
Logo,
| ( | )
Dizemos que a distribuição a posteriori do parâmetro é igual a função de
verossimilhança multiplicada pela função a priori de a menos de uma constante.
20
É comum comparar distribuições a posteriori que foram resultados de
diferentes distribuições a priori para que se perceba a real influência desta função
sobre a posteriori. No entanto, é muito comum que diferentes distribuições a priori
não façam muita diferença depois da amostra ser observada. Isso acontece
principalmente quando a amostra é muito grande ou quando as priori comparadas são
pouco informativas. Este fato tem duas implicações: priori divergentes de diferentes
pesquisadores se tornam menos importantes quando se coleta muitos dados.
Teste de hipóteses Bayesiano e Fator de Bayes
Assim como apresentado anteriormente para o Controle Estatístico de
Qualidade Frequentista, avaliaremos as condições do processo testando a hipótese do
mesmo estar sob controle, desenvolvendo testes de hipótese sob a abordagem
bayesiana.
O objetivo do desenvolvimento de testes de hipóteses que seguem os princípios da
inferência bayesiana é tornar possível o cálculo das reais probabilidades das hipóteses
em questão dado o conjunto amostral
O fator de Bayes é uma das mais usadas ferramentas para testes de hipóteses
Bayesianos e comparação de modelos. Alguns autores o citam como alternativa
bayesiana aos p-valores oferecidos pelos testes clássicos. O que ele realmente nos
oferece é um nível quantitativo ao qual podemos dizer que nossos dados observados
suportam ou rejeitam a nossa hipótese.
Dito isto, temos que o fator de Bayes é a razão entre | e | :
21
|
|
Como sabemos que as probabilidades acima são complementares temos as
seguintes regras:
Tabela 3. Fator de Bayes e Interpretações
Fator de Bayes | | Interpretação
FB < 1 < 0,5 > 0,5 Suporta H1
1 0,500 0,500 Não informativo
2 0,667 0,333 Sustenta fracamente H0
3 0,750 0,250
4 0,800 0,200
Sustenta substancialmente H0
5 0,833 0,167
6 0,857 0,143
7 0,875 0,125
8 0,889 0,111
9 0,900 0,100
10 0,909 0,091 Sustenta de forma forte H0
> 10 > 0,909 < 0,091 Sustenta de forma muito forte H0
100 0,990 0,010 Sustenta de forma decisiva H0
Lembrando é claro que a interpretação do Fator de Bayes varia na literatura e
de acordo com a importância e a necessidade das hipóteses testadas.
Em seguida apresentaremos os testes Bayesianos que foram estudados nesta
nova abordagem do controle estatístico de qualidade.
2.2. Controle Estatístico de Qualidade – Abordagem Bayesiana
Apresentamos nesta seção os testes de hipóteses desenvolvidos sob a
abordagem bayesiana.
22
O objetivo do desenvolvimento de testes de hipóteses que seguem os
princípios da inferência bayesiana é tornar possível o cálculo das reais probabilidades
das hipóteses em questão dado o conjunto amostral.
Teste de Hipóteses para
O primeiro teste a ser estudado se refere ao parâmetro de média . Desejamos
primeiramente testar apenas se está sob controle. Neste caso, vamos testar:
Tendo em consideração o universo de Controle Estatístico de qualidade e a
forma que é realizada frequentemente sua amostragem, consideramos que em cada
momento observacional i é obtida uma amostra com n elementos. E assumimos
em que e . Sendo assim , que
denotaremos apenas por , segue uma distribuição Normal(
, donde é um
parâmetro de precisão, e .
A partir daí, desenvolveu-se um teste Bayesiano de acordo com o teste de
hipótese para conforme bibliografia [2] (Migon, H. S.; Gamerman, D.).
Sejam parâmentros desconhecidos com as seguintes distribuições a priori:
| ( )
(
)
Onde: , , e são fixados.
Além disso, considere e por consequência , com
, fixado.
Desejamos calcular | e | onde representa o conjunto de
dados: .
23
Utilizando-se o teorema de Bayes temos:
| |
onde (1)
O primeiro passo é determinar | :
| | ∫
|
∫
|
A distribuição conjunta dos para é a seguinte:
( | ) ∏
√
( )
(
)
⁄
∑( )
Por sua vez, como (
) temos:
(
)
(
)
Daí temos:
|
∫ (
)
⁄
∑ ( )
(
)
(
)
∫ (
)
⁄(
)
(
)
⁄
∑( )
24
| ∫
[(
∑( )
)
]
Como (
)
⁄(
)
(
)
é uma constante, a integral acima apresenta o
núcleo de uma distribuição (
[
∑ ( )
]
).
Considere uma distribuição gama de parâmetros conhecidos .
Sabemos então que ∫
.
Se é a função núcleo da gama , temos que ∫
onde
e portanto, ∫
.
Aplicando o apresentado acima em | , temos
[
∑ ( )
]
(
)
| ⁄ (
)
⁄(
)
(
)
(
)
[
∑ ( )
]
(2)
Substituindo-se em (2) a expressão ∑ ( )
( ) , onde
∑
obtemos:
| (
)
(
)
(
)
(
)
( ( )
)
Por outro lado:
25
| ∫ ∫
∫ ∫ | |
∫ ∫ (
)
⁄
∑( )
(
)
⁄
( )
(
)
(
)
∫ ∫ (
)
⁄
(
)
⁄
(
)
(
)
(
∑( )
( )
)
∫ ∫
(
∑( )
)
(
( )
)
Seja =(
)
⁄
(
)
⁄
(
)
(
) uma constante.
A expressão acima, com variáveis μ e , tem núcleo de uma distribuição
Normal-Gamma ( , , α, β), onde:
, ,
,
[
( )
]. A demonstração desses resultados está
contida no Apêndice A.
Aplicando o mesmo procedimento usado para o cálculo de | ,
obtemos | Sabemos que ∫ ∫ |
.
26
Logo,
| ∫ ∫
(
∑ ( )
)
(
( )
) (
)
√
√
(
)
(
) (
)
(
)
(
)
⁄ (
( )
)
Agora que conhecemos | , | , e ,
temos:
| |
(
)
(
)(
)
(
)
(
)
(
)
(
( ))
E temos portanto, imediatamente de (1),
|
e
|
Em que, (
)
, e
(
)
(
( )
)
.
O fator de Bayes é dado por:
27
|
|
(
)
⁄
[
( )
( )
]
Teste de Hipóteses conjunto para μ e
Neste segundo teste, além da informação fornecida pelas médias amostrais,
como visto anteriormente, também temos disponível informações de variância
amostral. Temos então, não só a possibilidade de testar somente , como também
podemos testar individualmente , ou ainda, testar conjuntamente os parâmetros e
. Abaixo segue uma tabela com as possíveis combinações de hipóteses para H0:
Tabela 4. Possíveis hipóteses de H0 para e
Argumentos possíveis para
e
Argumentos possíveis para
Não considera Não considera
Sendo H1 o complementar da hipótese H0 escolhida.
Dentre as alternativas acima, escolhemos para desenvolver os cálculos de
probabilidade referentes ao teste versus
.
Considere agora que além dos ’s conhecemos também as variâncias
amostrais ’s, assim sendo,
.
28
Consideraremos ainda todas as suposições que foram feitas anteriormente com
respeito às distribuições de , | e . Além disso, suponha que
(
).
|
|
|
|
∏
√
∏(
)
(
)
(
)
⁄ (
)
(
) ∏
∑
(
) ∑
(
)
⁄ (
)
(
) (∏
)
[
] (
) ∑
|
|
∬
∬
| |
∬ |
| |
∫ ∫ (
)
⁄
∑
(
)
(
)
(∏
)
∑
(
)
⁄
( )
(
)
(
)
29
∫ ∫ (
)
⁄
(
)
⁄
(
)
(∏
)
(
)
(
)
(
)
( )
∑
( )
∫ ∫
( )
( ( )
)
∑
( )
Onde
(
)
⁄
(
)
⁄
(
)
∏
(
)
(
)
(
)
uma constante.
Procedendo conforme na página 26, podemos dizer que esta expressão tem
núcleo de uma distribuição Normal-Gama ~ (
[ ∑
( )
] )
Portanto, | √
√
|
(
)
(
)
(
)
⁄ ∏
[
√
(
)]
⁄ ( )
⁄ (
∑
( )
)
30
Tem-se portanto
| |
(
)
∏
( (
)
(
( ) ∑
)
(
)
(
)
(
)
⁄
( )
⁄ (
∑
( )
)
)
Logo, podemos obter as distribuições a posteriori, são elas:
|
e
|
Onde, (
)
( ( )
∑
), e
(
)
(
)
(
)
⁄
( )
⁄ ( ∑
( )
)
O fator de Bayes para este teste é:
|
|
(
)
( ( ) ∑
)
(
)
(
)(
)
⁄ (
)
⁄ ( ∑
( ) )
Suponha agora que queiramos testar as hipótese:
31
Considere como informação inicial
, além
disso todas as priori previamente definidas.
| ∬ |
| |
∫ ∫ (
)
⁄
(
)
⁄
(
)
∏
(
)
(
)
(
)
∑
( )
(
( )
)
Seja
(
)
⁄
(
)
⁄
(
)
∏
(
)
(
)
(
)
∑
( )
Esta equação terá núcleo de uma distribuição gama em φ, com parâmetros
e
( )
.
Logo, integrando em φ temos:
∫ (
)
⁄
(
)
⁄
(
)
(∏
)
(
)
(
)
(
)
∑
( )
(
)
( ( )
)
Esta integral deve ser avaliada por métodos numéricos.
32
2.3. Inferência Bayesiana e Clássica
A estimação Clássica feita com os próprios dados coletados pode gerar
equívocos quanto à avaliação da situação do processo estar sob controle ou não.
Também, diferente da abordagem Bayesiana, a abordagem clássica não nos oferece
probabilidades para cada hipótese, mas apenas as probabilidades do erro tipo 1 (α) e
do erro tipo 2 (β).
As técnicas bayesianas tem um caráter adaptativo, com a atualização das suas
estimativas à medida que nova informação torna-se disponível. Dessa forma, podemos
dizer que a abordagem bayesiana atualiza e agrega informação de uma forma que a
abordagem frequentista não faz.
33
Capítulo 3: Aplicação da metodologia abordada
Para ilustrar, vamos utilizar o exemplo de saquinhos de leite. Este exemplo foi
retirado de Costa et al. (2009, p.48).
Considere que uma indústria de produção de leite deseja monitorar o volume
de leite que é colocado nos saquinhos. Uma vez que a embalagem informa haver um
litro de leite em cada saquinho o objetivo do produtor é preencher a embalagem com
este volume informado, ou pelo menos chegar mais próximo possível desta
quantidade. Caso o conteúdo seja consideravelmente inferior a 1 litro o consumidor
será prejudicado, e isto pode gerar ao produtor alguns problemas como a insatisfação
dos clientes, incidência de multas e processos à indústria, etc. Enquanto que caso o
conteúdo seja superior a um litro o saquinho pode estourar por não suportar o volume
nele contido, além disso, uma grande quantidade de saquinhos com volume superior
ao estipulado pode gerar prejuízo ao produtor.
O procedimento de controle foi realizado de forma que, a cada intervalo de
tempo h (não informado) retirava-se uma amostra de cinco saquinhos de leite para
inspecionar o volume de leite. Foram recolhidas um total de 25 amostras.
A Tabela 5 abaixo apresenta os valores de , volume do j-ésimo saquinho de
leite pertencente a i-ésima amostra, e de e , amplitude e média, respectivamente,
da i-ésima amostra para os 25 subgrupos de tamanho 5 (t=25, n=5). No final desta
tabela temos a amplitude média e a média global do grupo.
Tabela 5. Dados das 25 amostras de saquinhos de leite, Amplitudes e Médias.
i 1 1004,6 997,3 1003 1005,9 995,8 10,1 1001,32
2 1001,6 1008,6 997,9 1001,3 999,1 10,7 1001,7
3 999,1 992,6 1001,1 1001,6 1002,9 10,3 999,46
4 1007,9 997,5 991,3 997,8 1000,8 16,6 999,06
34
5 999,5 995,6 1004,3 995,6 991,4 12,9 997,28
6 1003,3 996,8 997,2 993,6 1000,1 9,7 998,2
7 999,7 1012,1 995,2 1001,8 1002,2 16,9 1002,2
8 1000,1 995,3 990 997,5 1003,2 13,2 997,22
9 1004,3 1001,4 1001,6 999,1 996,4 7,9 1000,56
10 999 995,8 989,9 995,1 1002,8 12,9 996,52
11 1003,2 1004,4 993,5 994,6 997,6 10,9 998,66
12 996,2 1017,3 993,6 996,5 1003,7 23,7 1001,46
13 1014 1008,9 1004,1 1007,9 1000,7 13,3 1007,12
14 1002,2 996,6 1002,7 1004,2 1001,8 7,6 1001,5
15 998,3 997,5 1006,1 996,5 998,1 9,6 999,3
16 995,8 1000,8 999,1 1002,5 1001 6,7 999,84
17 1004,1 1003 1004,8 997,9 999,9 6,9 1001,94
18 1000,1 994,9 1000,1 1004,9 997,3 10 999,46
19 1000,2 996,1 998 1006,1 999,4 10 999,96
20 1002,3 999 1000,8 1000,7 998 4,3 1000,16
21 998,3 998,1 1004,2 1002,1 991,3 12,9 998,8
22 997,1 1000,7 999,8 1000,6 1001,7 4,6 999,98
23 1003,6 996,1 1001,4 998 991,8 11,8 998,18
24 999,9 1006,4 1005,1 999,8 1003 6,6 1002,84
25 1007,3 999,8 992,5 996,2 998,2 14,8 998,8
10,996* 1000,061**
3.1. Aplicação com Exemplo Clássico
A partir de uma amostra considerada sob controle, temos a informação inicial
que e .
Utilizando-se da abordagem frequentista de CEQ, considerando que a variável
em questão é contínua, faz sentido que se estude a centralidade e a dispersão em
conjunto e por isso ilustraremos nosso trabalho com gráficos de controle de e .
Conforme explicado na seção 1.2, iniciaremos pelo monitoramento de R:
35
Como o limite inferior de controle de R apresentou um valor negativo,
.
Temos então o seguinte gráfico de controle:
Gráfico 1. Gráfico da Amplitude R
Verificamos que a amostra de número 12 possui amplitude acima do limite
superior de controle. Neste caso, deve-se averiguar qual causa especial fez com que
esta única amostra se posicionasse fora dos limites de controle, e tomar providências
para que amostras futuras não sejam comprometidas com essas mesmas causas
especiais. Visto isso, eliminamos esta amostra e então recalculamos os limites de
controle:
Tabela 6. Dados das 25 amostras de saquinhos de leite, Amplitudes e Médias excluindo a 12ᵃ amostra
i 1 1004,6 997,3 1003 1005,9 995,8 10,1 1001,32
2 1001,6 1008,6 997,9 1001,3 999,1 10,7 1001,7
3 999,1 992,6 1001,1 1001,6 1002,9 10,3 999,46
4 1007,9 997,5 991,3 997,8 1000,8 16,6 999,06
5 999,5 995,6 1004,3 995,6 991,4 12,9 997,28
6 1003,3 996,8 997,2 993,6 1000,1 9,7 998,2
7 999,7 1012,1 995,2 1001,8 1002,2 16,9 1002,2
8 1000,1 995,3 990 997,5 1003,2 13,2 997,22
0
5
10
15
20
25
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Am
plit
ud
e R
Número da Amostra
Gráfico da Amplitude R
36
9 1004,3 1001,4 1001,6 999,1 996,4 7,9 1000,56
10 999 995,8 989,9 995,1 1002,8 12,9 996,52
11 1003,2 1004,4 993,5 994,6 997,6 10,9 998,66
... ... ... ... ... ... ... ...
13 1014 1008,9 1004,1 1007,9 1000,7 13,3 1007,12
14 1002,2 996,6 1002,7 1004,2 1001,8 7,6 1001,5
15 998,3 997,5 1006,1 996,5 998,1 9,6 999,3
16 995,8 1000,8 999,1 1002,5 1001 6,7 999,84
17 1004,1 1003 1004,8 997,9 999,9 6,9 1001,94
18 1000,1 994,9 1000,1 1004,9 997,3 10 999,46
19 1000,2 996,1 998 1006,1 999,4 10 999,96
20 1002,3 999 1000,8 1000,7 998 4,3 1000,16
21 998,3 998,1 1004,2 1002,1 991,3 12,9 998,8
22 997,1 1000,7 999,8 1000,6 1001,7 4,6 999,98
23 1003,6 996,1 1001,4 998 991,8 11,8 998,18
24 999,9 1006,4 1005,1 999,8 1003 6,6 1002,84
25 1007,3 999,8 992,5 996,2 998,2 14,8 998,8
E portanto:
Gráfico 1. Gráfico da Amplitude R excluindo a 12ᵃ amostra
0
5
10
15
20
25
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Am
plit
ud
e R
Número da Amostra
Gráfico da Amplitude R
37
Agora verificaremos os limites de controle para :
√
√
1000,0
√
√
O gráfico de controle para é o seguinte:
Gráfico 2. Gráfico da Média excluindo a 12ᵃ amostra
Novamente, detectamos uma não-conformidade na 13ª amostra,
examinamos os motivos, excluímos esta amostra e recalculamos esses limites:
Tabela 7. Dados das 25 amostras de saquinhos de leite, Amplitudes e Médias excluindo a 13ᵃ amostra
i 1 1004,6 997,3 1003 1005,9 995,8 10,1 1001,32
2 1001,6 1008,6 997,9 1001,3 999,1 10,7 1001,7
3 999,1 992,6 1001,1 1001,6 1002,9 10,3 999,46
4 1007,9 997,5 991,3 997,8 1000,8 16,6 999,06
5 999,5 995,6 1004,3 995,6 991,4 12,9 997,28
6 1003,3 996,8 997,2 993,6 1000,1 9,7 998,2
7 999,7 1012,1 995,2 1001,8 1002,2 16,9 1002,2
993
995
997
999
1001
1003
1005
1007
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Mé
dia
Número da Amostra
Gráfico da Média
38
8 1000,1 995,3 990 997,5 1003,2 13,2 997,22
9 1004,3 1001,4 1001,6 999,1 996,4 7,9 1000,56
10 999 995,8 989,9 995,1 1002,8 12,9 996,52
11 1003,2 1004,4 993,5 994,6 997,6 10,9 998,66
... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ...
14 1002,2 996,6 1002,7 1004,2 1001,8 7,6 1001,5
15 998,3 997,5 1006,1 996,5 998,1 9,6 999,3
16 995,8 1000,8 999,1 1002,5 1001 6,7 999,84
17 1004,1 1003 1004,8 997,9 999,9 6,9 1001,94
18 1000,1 994,9 1000,1 1004,9 997,3 10 999,46
19 1000,2 996,1 998 1006,1 999,4 10 999,96
20 1002,3 999 1000,8 1000,7 998 4,3 1000,16
21 998,3 998,1 1004,2 1002,1 991,3 12,9 998,8
22 997,1 1000,7 999,8 1000,6 1001,7 4,6 999,98
23 1003,6 996,1 1001,4 998 991,8 11,8 998,18
24 999,9 1006,4 1005,1 999,8 1003 6,6 1002,84
25 1007,3 999,8 992,5 996,2 998,2 14,8 998,8
√
√
999,7
√
√
O novo gráfico de controle de é:
Gráfico 3. Gráfico da Média excluindo a 12ᵃ e 13ᵃ amostras
993
995
997
999
1001
1003
1005
1007
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Mé
dia
Número da Amostra
Gráfico da Média
39
Para analisarmos o desempenho conjunto dos gráficos de e R, as hipóteses
associadas a este uso serão:
Os riscos α, conforme mostrados anteriormente são os seguintes:
Como o erro do tipo 1 conjunto é , então .
Portanto, enquanto o processo permanecer sob controle, a probabilidade de um valor
de estar fora dos limites de controle é de 0,0077. Além disso, pode-se facilmente
concluir que o tempo médio entre alarmes falsos é de
.
Este é o procedimento de monitoramento utilizado na abordagem clássica.
Além disso, podemos calcular o poder do teste, que é a probabilidade de detectar uma
amostra não-conforme, sendo ela de fato, para cada valor dos parâmetros de
interesse.
3.2. Aplicação com Exemplo Bayesiano
Para aplicarmos a teoria apresentada, utilizamos os mesmos dados
empregados na metodologia clássica e com auxílio do software R, calculamos as
probabilidades condicionais das hipóteses H0 e H1 dado o nosso conjunto de dados.
Teste de Hipóteses para
Desejamos primeiramente testar apenas se o processo está sob controle em
relação à média, o que, neste caso, significa testar:
40
Conforme já discutido acima, sejam os parâmentros desconhecidos com as
seguintes distribuições a priori:
| ( )
(
)
Dado as restrições de cada um dos parâmetros, consideramos os seguintes
valores para os parâmetros das distribuições a priori:
;
, que no caso influencia na variabilidade da variância de | foi fixado em
0.5, 1 e 10, aumentando, mantendo e diminuindo sua variância
respectivamente;
assumiu 0.001, 0.05, 0.1, 5, 10, 50 e 100;
, cujo inverso é a média de foi usado com os valores 1, 5, 10, 25,100,500
e 2500.
Por ter pouca informação quanto aos parâmetros relativos à precisão,
decidimos utilizar um conjunto de valores possíveis de e para avaliarmos o
processo. Também consideramos
.
Após as definições apresentadas acima, ajustou-se o modelo através do
software R. O anexo B contém este programa.
As tabelas que se sucedem exibem os valores das probabilidades | . A
probabilidade | pode ser facilmente calcula pois é complementar à
probabilidade | exibida.
41
Tabela 8. Probabildade a posteriori de H0 para C0 = 0.5
np
0.001 0.05 0.1 5 10 50 100
1 0.9399663 0.939965 0.9399638 0.9398413 0.9397185 0.9388111 0.9378366
5 0.9399663 0.9399653 0.9399644 0.9398721 0.9397865 0.9393086 0.9389812
10 0.9399663 0.9399657 0.939965 0.9399074 0.9398585 0.939645 0.9395393
25 0.9399663 0.9399667 0.939967 0.939996 0.9400157 0.940071 0.9400882
100 0.9399664 0.9399718 0. 939977 0.9402367 0.940325 0.9404522 0.9404747
500 0.939967 0.9399975 0.9400257 0.940499 0.940546 0.9405903 0.9405963
2500 0.9399697 0.9401008 0.9401895 0.9405984 0.9406104 0.9406204 NaN
Tabela 9. Probabildade a posteriori de H0 para C0 = 1
np
0.001 0.05 0.1 5 10 50 100
1 0.917314 0.9173123 0.9173106 0.9171466 0.9169822 0.9157682 0.9144654
5 0.917314 0.9173127 0.9173114 0.9171879 0.9170733 0.9164337 0.9159957
10 0.917314 0.9173132 0. 9173123 0.9172352 0.9171697 0.9168839 0.9167424
25 0.917314 0.9173145 0.917315 0.9173538 0.9173801 0.9174543 0.9174772
100 0.9173142 0.9173213 0.9173284 0.917676 0.9177944 0.9179646 0.9179948
500 0.9173149 0.9173557 0.9173935 0.9180272 0.9180904 0.9181496 0.9181576
2500 0.9173185 0.917494 0.9176128 0.9181604 0.9181766 0.91819 NaN
Tabela 10. Probabildade a posteriori de H0 para C0 = 10
np
0.001 0.05 0.1 5 10 50 100
1 0.7842126 0.7842091 0.7842056 0.7838641 0.7835222 0.7810038 0.7783146
5 0.7842126 0.7842099 0.7842071 0.7839501 0.7837117 0.7823827 0.7814747
10 0.7842126 0.7842108 0.784209 0.7840485 0.7839122 0.7833178 0.7830237
25 0.7842127 0.7842137 0.7842147 0.7842955 0.7843502 0.7845047 0.7845524
100 0.784213 0.7842278 0.7842426 0.7849669 0.7852138 0.7855692 0.7856321
500 0.7842145 0.7842995 0.7843782 0.7856998 0.7858317 0.7859554 0.7859721
2500 0.784222 0.7845876 0.7848352 0.7859781 0.7860118 0.7860397 NaN
É possível concluir que, para um mesmo valor de C0, as probabilidades
| se mantêm bem próximas mesmo que se extrapole seus parâmetros e np.
Variações de C0, no entanto, podem significar drásticas mudanças na probabilidade,
42
como pode ser visto no caso np = 0,001 onde para , |
e , | .
Interessante observar que mesmo considerando parâmetros bastante
diferentes nas distribuições a priori, obtem-se probabilidades a posteriori de muito
próximas. Como já foi mensionado neste trabalho.
Em seguida, calculamos o Fator de Bayes para cada caso apresentado:
Tabela 11. Fator de Bayes para C0 = 0.5
np
0.001 0.05 0.1 5 10 50 100
1 15.65731 15.65697 15.65662 15.62269 15.58883 15.34284 15.08664
5 15.65731 15.65705 15.65677 15.63122 15.60758 15.47679 15.38839
10 15.65732 15.65714 15.65696 15.64100 15.62746 15.56864 15.53966
25 15.65732 15.65742 15.65753 15.66557 15.67103 15.68644 15.69120
100 15.65735 15.65883 15.66030 15.73267 15.75746 15.79323 15.79959
500 15.6575 15.66596 15.67381 15.80642 15.81975 15.83226 15.83396
2500 15.65825 15.69470 15.71947 15.83456 15.83797 15.8408 NaN
Tabela 12. Fator de Bayes para C0 = 1
np
0.001 0.05 0.1 5 10 50 100
1 11.09394 11.09370 11.09345 11.06951 11.04561 10.87200 10.69117
5 11.09395 11.09376 11.09356 11.07553 11.05885 10.96654 10.90415
10 11.09395 11.09382 11.09370 11.08243 11.07288 11.03136 11.01091
25 11.09395 11.09402 11.09409 11.09977 11.10362 11.11450 11.11786
100 11.09397 11.09501 11.09605 11.14712 11.16462 11.18987 11.19435
500 11.09408 11.10005 11.10559 11.19917 11.20858 11.21740 11.21860
2500 11.09461 11.12033 11.13781 11.21903 11.22144 11.22343 NaN
43
Tabela 13. Fator de Bayes para C0 = 10
np
0.001 0.05 0.1 5 10 50 100
1 3.634190 3.634116 3.634041 3.626720 3.619412 3.566289 3.510898
5 3.634191 3.634133 3.634074 3.62856 3.623459 3.595223 3.576129
10 3.634191 3.634153 3.634114 3.63067 3.627749 3.615053 3.608797
25 3.634192 3.634214 3.634236 3.635972 3.637149 3.640473 3.6415
100 3.634199 3.634517 3.634835 3.650446 3.655794 3.663509 3.664879
500 3.634231 3.636057 3.63775 3.666352 3.669225 3.671922 3.672289
2500 3.634393 3.642257 3.647601 3.672420 3.673155 3.673765 NaN
Para todos os valores de C0 e dos parâmetro estudados o Fator de Bayes foi
maior que 1(um). Nos casos em que C0=0.5 e C0=1.0, o fator de Bayes variou de 15.67 a
15.84 e 11.09 a 11.22 respectivamente, mostrando nesses casos que o teste em
questão sustenta de forma muito forte a hipótese H0. Contudo para C0=10, o fator de
Bayes variou de 3.63 a 3.67, que de fato, sustenta fracamente a hipótese H0.
Também foi observado que quanto maior o C0, menor é | , e também
menor é o Fator de Bayes.
Exemplificando a eficiência do teste
Para que pudéssemos ter uma forma de analisar a eficácia do teste proposto,
ou seja, ter a capacidade de detectar amostras fora de controle, executamos o teste de
uma forma agregativa, ou seja, consideramos toda a informação disponível a cada
período de tempo. Este método foi aplicado ao exemplo dos saquinhos de leite, e
então calculamos em cada um desses momentos as probabilidades da hipótese H0 e o
respectivo FB dado o conjunto de dados disponível até o momento t. Por exemplo,
quando t=11 (FB=3,65) este FB se refere às probabilidades de todas as amostras
coletadas até o tempo t=11. Para este procedimento utilizamos C0=1; np=5; σp2=25.
44
Gráfico 4. Gráfico de Controle Estatístico de Qualidade Bayesiano para o Exemplo dos Saquinhos de Leite
Observou-se que, neste exemplo desde o início suportava-se, embora
fracamente, a hipótese . Em t=11, o FB detectou uma retração na probabilidade de
aceitação de H0. Lembramos que no exemplo clássico houve amostra não conforme
em t=12 e posteriormente em t=13. Isso mostra que o procedimento em questão foi
capaz de detectar uma possível amostra fora de controle antes do método clássico. No
entanto, como podemos observar ao longo do gráfico, o FB é crescente o que nos gera
consistência na aceitação da hipótese nula.
Afim de testar a eficiência do método sugerido, também simulamos novas
observações para o exemplo dos saquinhos de leite. Foram geradas trinta amostras,
sob a hipótese de normalidade, de cinco observações cada uma delas. No entanto,
nessas novas amostras, a média μ estava sob controle até a décima amostra, e da
décima primeira à trigésima os valores gerados tinham média μ=1005. A variância
usada foi a mesma para todos os dados ( =15). Novamente, utilizou-se C0=1; np=5;
σp2=25.
0
1
2
3
4
5
6
7
8
9
10
11
12
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28
Fato
r d
e B
aye
s
t
Método Agregativo para o Exemplo dos Saquinhos de Leite
45
Gráfico 5. Gráfico de Controle Estatístico de Qualidade Bayesiano para dados simulados
O que se pôde observar neste gráfico foi que as primeiras observações tiveram
muita oscilação no FB, isso é esperado, e se explica pelo fato de haver pouca
informação sobre o problema. Mesmo assim o FB estava, em sua maior parte, acima
de 2, podendo dizer que o teste suportava fracamente a hipótese de μ=1000.
Entre o décimo e o décimo quinto ponto houve uma tendência crescente do FB,
ou seja, até aí o FB ainda não estava detectando a mudança na média, e estava até
mesmo indicando que suportava substancialmente a hipótese H0. A partir do décimo
quinto ponto o FB foi decrescendo drasticamente, e após o décimo quinto ponto,
finalmente, os teste começam a indicar incertezas acerca da hipótese H0.
0
1
2
3
4
5
6
7
8
9
0 5 10 15 20 25 30 35
Fato
r d
e B
aye
s
t
Método agregativo para dados simulados
Sob controle Fora de controle
46
Conclusão
O objetivo deste trabalho é propor uma metodologia Bayesiana para o CEQ.
Consideramos que o CEQ Bayesiano seria uma forma razoável e alternativa ao CEQ
clássico, pois ele não restringiria seus resultados apenas a erros do tipo 1 e 2, ele
poderia calcular a probabilidade real da hipótese nula dado um conjunto de dados.
Usando conceitos de Inferência Bayesiana e Clássica desenvolveram-se testes
de hipóteses e metodologia para analisar a eficácia dos mesmos em comparação ao
CEQ clássico. Os conceitos iniciais foram extraídos de Migon (1999, p.63), no entanto
neste trabalho tais conceitos foram implementadas para dados de médias de amostras
recolhidas em instantes de tempo, portanto alguns parâmetros tiveram de ser
adaptados.
Para exemplificar, utilizamos um conjunto de dados descrito em Costa et al.
(2009, p.48) e aplicamos sobre estes dados o CEQ sob abordagem Clássica.
Utilizando-se de conceitos Bayesiano, calculamos as probabilidades
condicionais da hipótese nula dado o mesmo conjunto de dados, da hipótese
alternativa dado o conjunto de dados, e o fator de Bayes. Como tínhamos pouca
informação a priori dos parâmetros, aplicamos o teste para algumas combinações
possíveis. Concluímos que apenas o parâmetro C0 , de fato, influencia.
A partir de então foi criada uma metodologia para a análise desses resultados.
Foi calculado o Fator de Bayes agregando as amostras de cada tempo, e com essas
informações foram construídos os gráficos de Controle Bayesianos para que se
pudesse detectar alguma não conformidade. No exemplo estudado, o método
desenvolvido, apontou uma provável não conformidade antes do CEQ clássico. No
entanto ele suporta, pelo menos fracamente, a hipótese de que o processo está sob
controle ao longo do tempo estudado.
Para analisar a capacidade de detecção de amostras fora de controle,
simulamos um conjunto de amostras em que, a partir da décima amostra a média
estava alterada. O método indicou a partir da décima quinta amostra sucessivas
47
perdas de credibilidade, mas somente a partir da vigésima sexta ele passa a não
suportar a hipótese H0.
Como sugestão para trabalhos futuros destacamos o desenvolvimento de
testes Bayesianos para outros parâmetros de interesse, ou testes em que as variáveis
aleatórias seguem diferentes distribuições de probabilidade. Além disso, sugere-se que
testes sejam desenvolvidos para incorporar evoluções dinâmicas de médias e
variâncias do processo.
48
Bibliografia
[1] COSTA, Antonio; EPPRECHT, Eugenio; CARPINETTI, Luiz. Controle Estatístico de
Qualidade, 2ª edição. São Paulo: Atlas S.A., 2009.
[2] MIGON, Helio; GAMERMAN, Dani. Statistical Inference: An integrated approach, 1ª
edição. London: Arnold, 1999.
[3] DEGROOT, Morris; SCHERVISH, Mark. Probability and statistics, 4 ª edição. Boston:
Pearson Education, 2002.
49
Apêndice A
Para identificar os parâmetros da Normal-Gama que aparece no cálculo de |
procederemos da seguinte forma:
Sabemos que se (μ , ) ~ Normal-Gama( , ,α ,β) então:
| √
√
(
)
Igualando os termos do expoente de temos:
, logo
Analogamente, para os termos do expoente da exponencial temos:
Por sua vez,
∑ ( )
( )
[ (
)
]
Esta expressão foi simplificada afim de evidenciar μ e , daí igualando
as duas expressões acima conclui-se que:
( ) logo
Completando o termo restante é possível achar β:
[
( )
]
[
( )
]
50
Então,
(μ, )~Normal-Gamma ( , , α, β), onde:
, ,
,
[
( )
].
51
Apêndice B
Segue o output do programa feito em R para o cálculo das probabilidades a
posteriori de H0 e H1 dado o conjunto de dados:
#Dt é uma matriz n x t onde cada linha é uma amostra do experimento com suas n observações.
# As duas ultimas colunas são a média e a variância amostral da linha respectivamente
# Seja P(H0)=lambda e P(H1)=1-lambda
#Teste H0: mi=mi0
#Seja mi0 o valor que será testado para mi
#Os parâmetros: mi, fi, mip, c0, np, sigmap2
# Xij~Normal(mi,fi^-1)
# mi|fi~Normal(mip, (C0*fi)^-1)
# fi~Gama(np/2, np*sigmap2/2)
teste.mi.dadosmedia <- function (Dt,lambda,mi0,mip,C0,np,sigmap2)
n<-ncol(Dt)
t<-nrow(Dt)
Xbb<-mean(Dt)
#achar Xb
Xb<-rep(NA,times=t)
for(i in 1:t)Xb[i]<-mean(Dt[i,])
52
Xb<-Xb[1:t]
S2<-(var(Xb)*(n-1))/n
# para facilitar a programação, repartimos os cálculos de probabilidades em três equações: eq1,
eq2, e eq3
eq1<-(gamma((t+np)/2)/gamma(np/2))*(sqrt(n/pi))*((np*sigmap2)^(np/2))
eq2<-((n*t*S2+np*sigmap2+n*t*((Xbb-mi0)^2))^(-(t+np)/2))
eq3<-(sqrt(C0/(n*t+C0)))*((n*t*S2+np*sigmap2+(n*t*C0/(n*t+C0))*((Xbb-mip)^2))^(-(t+np)/2))
Prob.Dt.dado.H0<-eq1*eq2
Prob.Dt.dado.H1<-eq1*eq3
Prob.Dt<-eq1*(lambda*eq2+(1-lambda)*eq3)
Prob.H0.dado.Dt<-(lambda*eq2)/(lambda*eq2+(1-lambda)*eq3)
Prob.H1.dado.Dt<-((1-lambda)*eq3)/(lambda*eq2+(1-lambda)*eq3)
Bayes.factor<-eq2/eq3
result <- list(Prob.H0.dado.Dt,Prob.H1.dado.Dt,Bayes.factor)
return(result)
53
Apêndice C
Tabela da Distribuição Normal Padrão
P(Z<z)
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
54
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
Recommended