Upload
paulo-simas
View
415
Download
14
Embed Size (px)
DESCRIPTION
Aula para curso preparatório para o CQE
Citation preview
Curso preparatório para a prova de Certificação
CQE ASQ
Módulo: Estatística II Instrutor: Paulo Simas Tecnologia da Informação - UMSA Maio/2010
Disciplina: Estatística II
Paulo Afonso Lourenço SimasEngenheiro Mecânico - PUC-BH (1985)
Engº de Qualidade Certificado - CQE-ASQ (2003)
MBA Gestão Empresarial (2007)
paulo.simas@usiminasmecânica.com.br3829-3766 8395-9961
Escopo Stat:VI. Quantitative Methods and Tools (43 Questions)
D. Statistical Decision-Making
Point estimates and confidence intervalsHypothesis testing Paired-comparison testsGoodness-of-fit testsAnalysis of variance (ANOVA)Contingency tables
E. Relationships Between Variables
Linear regressionSimple linear correlationTime-series analysis
Agenda
Primeiro Dia: 27/05/2010– 8:00: Introdução– 8:30: Estimativas (medias e
proporções)– 10:00: Intervalo– 10:30: Estimativa (desvio
Padrão/variância)– 12:00: Almoço– 13:30: Exercícios– 14:30 Correção– 15:30: Intervalo– 16:00: Testes de hipóteses
para a média e a proporção
Segundo Dia: 28/05/2010– 8:00: Testes de hipóteses
para 2 médias/proporções– 10:00: Intervalo– 10:30: Testes de hipóteses
para a variância e Testes de aderência e independência
– 12:00: Almoço– 13:30:Exercícios– 14:30: Correção– 15:30: Intervalo– 16:00: Regressão Linear
Simples
Agenda
Terceiro Dia: 11/06/2009– 8:00: Regressão Linear Múltipla– 10:00: Intervalo– 10:30: Séries Temporais– 12:00: Almoço– 13:30: Exercícios– 15:30: Intervalo– 16:00 Correção
1) If an answer is obvious it must be a trick question.FACT: Just because an answer is obvious to you doesn’t mean it is obvious toeveryone.
2) Guessing wrong can hurt your score more than leaving an answer blank.FACT: There is no penalty for guessing, and you have a 25% chance of getting it right.
3) The passing score for all ASQ exams is 70%.FACT: The passing score for each ASQ exam is established as a minimum performancestandard during the cut-score process.
4) Taking a section refresher course or buying ASQ exam prep material is a sureway to pass.FACT: Section refresher courses and the self-directed products are excellent ways toprepare for the examinations, but using them does not guarantee that you will pass.
5) If you do poorly on one area of the body of knowledge, you automatically fail thetest.FACT: Your total score on the examination determines whether you pass or fail, not yourscore on any one portion of the test.
6) ASQ limits the number of people who pass.FACT: Anyone who meets or exceeds the passing score (cut point) passes theexamination. ASQ does not set a passing rate.
Top 10 Myths of Certification
7) The grading of the constructed response portion of the certified quality managerexam is very subjective.FACT: The constructed response portion of the exam is designed to test the candidate’sability to respond to realworld situations.
8) It takes a long time to receive exam results.FACT: ASQ works very hard to provide exam results as quickly as possible and is veryaware that the examinees are anxious to learn whether they have passed or failed.
9) Test questions are deliberately tricky.FACT: ASQ goes through an extensive process to ensure that examination questionsare as accurate, clear, and concise as possible.
10) I can’t learn from my mistakes if I don’t get my scored test back.FACT: Because of its policy to reuse examination questions, ASQ cannot release copiesof the examinations.
Top 10 Myths of Certification
InglêsVeja como é o seu inglês e qual a modalidade mais fácil de usar agora. Eu optei pelo seguinte:
Eu lia o texto escrito em Inglês e pronunciava em Português. Uma espécie de tradução simultânea. Durante os dias que estudamos junto, eu lia o texto dos livros e os outros escutavam. Não quiseram ler, pois ficaram receosos de retardar o processo. Eu achei bom, pois assim aperfeiçoei mais rápido.
Tempo de estudoCada um tem necessidade de uma quantidade de estudo. eu precisei de muito. Após as aulas,
eu passava os Sábados e Domingos reescrevendo as questões e resolvendo-as, conferindo-as em seguida. Eu precisava sedimentar novamente os conceitos básicos de cada disciplina. Fiz 80% dos exercícios do Stevenson (copiados e resolvidos). Busquei na Internet tudo que dizia respeito ao CQE. Encontrei outros materiais e usei-os para estudo também.
RelaxÉ importante que vocês vejam o limite de cada um. Eu não conseguia estudar após o
expediente. Então ia para casa, verificava a situação por lá (tenho uma filha que estava com 15 anos e um filho de 10 anos.), rezava o terço com eles, ia para a ginástica, e depois que tudo se acalmava, por volta das 9:00 horas da noite, eu voltava a estudar um pouco, se achasse que iria render alguma coisa. Não se esforcem demasiadamente, pois o cansaço da mente e do estado emocional podem prejudicar muito. O resultado do estudo, a vida familiar, seu humor e mais.
Sala de estudosNós pedimos uma sala reservada para nós a partir de Setembro, sendo que tínhamos esta sala
exclusiva, aonde deixamos a maior parte do material, e vínhamos de segunda a sábado estudar nela. Aos Sábados, às vezes era necessário pegar as chaves e informar à vigilância, pois ficávamos sozinhos aqui. Nosso tempo de estudo variou. Eu tirei férias a partir de 27 de Outubro e misturei com os dias de aula, ficando até a segunda-feira após a prova por conta. Outros obtiveram 1 mês de liberação da chefia. Outros conseguiram férias de 15 dias antes da prova. E outros nada.
Estudos para o CQE
SimuladosDevem ser feitos no dia marcado, no horário marcado. Não fiquem adiando. Não busquem os
simulados dos anos anteriores. Como isto é trabalho voluntário, em horários extras, os simulados têm muitas questões repetidas de um ano para outro. Venham para o simulado, para usá-lo como experiência. Vocês terão que ler as questões, entendê-las, resolvê-las e marcar o gabarito. Se vocês já tiverem os resultados ou resolvidos esses simulados, eles não expressarão a condição real da prova, e vocês terão resultados menos realistas. Após os simulados não existe condições psicológicas de se continuar a estudar, o ideal é ir descansar.
Simulados ExtrasEles preparam 3 simulados. Nós fizemos 5. Os dois extras foram feitos buscando-se mais
informações, questões que outras turmas haviam preparado, e simulado da ABCQ. O problema foi no simulado de outra turma, anterior à nossa, que baixaram da internet as questões do site da ASQ, sendo que tinham questões de CRE, CQM, CQA e CQE. Com isto, tivemos um tempo de preocupação (desespero) quando vimos questões tão difíceis para os estudos que estávamos fazendo. Tragam o material para os simulados, pois vocês devem aprender a usá-lo e o que eles contém.
GabaritoMinha turma foi quase unânime em marcar o gabarito enquanto resolvia a prova. Foi uma
experiência válida, porém este sistema foi adotado deste os simulados.
Estudos para o CQE
MaterialResumos, livros, dicionários. Após os estudos, por volta de Outubro, comecem a fazer seus
resumos. Podem utilizar-se de resumos de outros, mas é importante que vocês façam os próprios. Cada um tem sua dificuldade ou facilidade. O resumo de um pode parecer bobagem para uns e não ser entendido por outros. Se forem fazer o dicionário, façam os próprios dicionários. Existem palavras que a gente lê 2 ou 3 vezes e aprende, existem palavras que a gente lê uma infinidade de vezes e depois se desespera escreve para todo lado e acaba aprendendo e existem palavras que por mais que a gente se desespera, jamais aprende. Volto a repetir, cada um tem a sua dificuldade ou facilidade.(Nós tínhamos: Foundations, Pizdek, Primer, Questões da ABCQ, Stevenson)
CalculadoraTenham uma calculadora boa em mãos. Não é necessário nada sofisticado. Precisa ser
Científica e ter funções Estatísticas. O uso na prova é pouco, porém de grande valia se ela tiver as funções para acelerar/facilitar os resultados. Não é permitido uso de calculadora programável. Vejam com o Paulo Rogério sobre o uso de tais calculadoras com antecedência. É muito importante que vocês arrumem a calculadora com bastante antecedência, pois precisam estar acostumados com ela para usá-la no dia.
Estudos para o CQE
Bibliografia
•ASQ’s FOUNDATIONS IN QUALITY
•JURAN’S QUALITY HANDBOOK
1ª Parte:
– Introdução
– Estimativas (Médias e Proporções)
– Estimativas (Desvio Padrão/Variância)
Slide 12
Cálculo das Probabilidades
Grandes Áreas da Estatística
Coleta de Dados
Estatística Descritiva
EstatísticaInferencial
•Organização•Apresentação•Sintetização
Métodos paratomada de decisões
AmostragemPlanejamento deExperimentos
QUESTÕES
• Até que ponto, podemos confiar nos resultados ou estimativas de
estatísticas amostrais?
• Qual é o tamanho ideal ou mínimo para uma amostra representativa?
Precisamos de mecanismos para quantificar em quanto podemos acreditar Precisamos de mecanismos para quantificar em quanto podemos acreditar
no resultados de uma amostra! no resultados de uma amostra!
• Grau de confiança • Tamanho da amostra
• Estimativa • Precisão
Distribuição Amostral da Média:
Média1 1 2 2 4 2,252 5 3 3 6 4,253 2 4 4 3 3,254 9 8 5 9 7,755 4 0 1 0 1,256 2 3 4 2 2,757 4 5 6 7 5,58 5 6 8 9 79 8 6 6 5 6,2510 9 6 7 8 7,511 0 2 8 0 2,512 8 8 4 8 713 9 9 7 8 8,2514 8 7 4 5 615 9 6 4 2 5,2516 3 7 9 4 5,7517 3 1 2 2 218 2 4 4 6 419 8 9 3 4 620 2 7 9 7 6,2521 3 3 4 5 3,7522 3 6 7 8 623 9 8 9 6 824 3 0 1 2 1,525 7 9 6 8 7,5
Amostras aleatórias
0 1 2 3 4 5 6 7
freq
uên
cia
8 9
Distribuição dos 100 dados
f(x) 1
XDistribuição amostral das 25 médias
TEOREMA CENTRAL DO LIMITE
Na medida em que o tamanho da amostra aumenta, a distribuição amostral das médias amostrais tende para uma distribuição normal;
População original
Médias amostraisn=5
Médias amostraisn=30
Compreendendo o Teorema Central do Limite...
Uma variável “x” pode
possuir uma distribuição
normal ou não, com média
() e desvio-padrão ().
Se amostras de tamanho (n)
são extraídas aleatoriamente
dessa população.
Na medida em que o tamanho
da amostra aumenta, a
distribuição das médias
amostrais tende para uma
distribuição normal.nx
Neste caso, a média das
médias amostrais será a
média da população E
o desvio-padrão das médias
amostrais é chamado de
erro padrão, dado por:
X
O Teorema Central do Limite em projeto de elevadores
Em projetos de elevadores é fundamental considerar o
peso das pessoas para que não haja sobrecarga e
futuras falhas. Dado que a população brasileira tem
peso distribuído normalmente entre 72 kg e d.p. 12 kg,
determine a probabilidade de que:
a) uma pessoa escolhida aleatoriamente pese mais de
78 kg.
6915,0
50,012
7278Xz
z
Logo, a probabilidade de uma pessoa pesar mais de 78 kg é de 30,85%.
b) Levando em consideração que uma empresa desenvolveu
um elevador de grande porte (25 pessoas) e a capacidade
máxima de carga é de 1950Kg. Qual a probabilidade de que
25 pessoas que entrem aleatoriamente no elevador, ao
mesmo tempo, propiciem um peso médio maior que 78kg?
Agora estamos lidando com a média para um grupo de 25 valores, e não
mais com um valor individual.
kgX
72
4,225
12
nX
50,24,2
7278
x
Xx
Z
99379,0z
Logo, a probabilidade será de 0,62%.
Conclusões sobre o Teorema Central do Limite.
• O Teorema Central do Limite demonstra que se n é grande (n>30) a
distribuição amostral das médias será aproximadamente normal,
qualquer que seja a variável x;
• Se a própria distribuição original tem distribuição normal, então as
médias amostrais terão distribuição normal para qualquer tamanho
amostral (n).
• No caso de amostragem sem reposição ou quando o tamanho “n” da
amostra é superior a 5% do tamanho N da população finita, ajustamos o
erro-padrão da média amostral para:
1.
N
nN
nX
• Um estimadorestimador é uma estatística amostral utilizada para obter uma
aproximação de um parâmetro populacional. Uma estimativaestimativa é um valor
específico, ou um intervalo de valores, usado para aproximar um
parâmetro populacional.Estimadores
Estimativa pontual Estimativa intervalar
É um valor único (número) usado para aproximar um parâmetro populacional
Intervalo que tem uma probabilidade de conter o verdadeiro valor da população.
Intervalo de Confiança para Média:
ESTIMADOR
ESTIMATIVA INTERVALAR (Intervalo de confiança)
• Fornece uma faixa de possíveis valores que o parâmetro de interesse () pode
assumir, com um grau de confiança conhecido.
O grau de confiança é a probabilidade (1-) expressa em valor percentual do intervalo de confiança conter o verdadeiro valor do parâmetro
populacional.
X
0 Z-1,96 -1,96
/2=0,025 /2=0,025
Grau de confiança de 95%
Para um grau de confiança 95%, o valor crítico de é igual a 1,96 2
Z
• Um Intervalo de confiança é uma amplitude de valores que tem a probabilidade de
conter o verdadeiro valor da população.
Interpretação do conceito de intervalo de confiança para uma
X5050403020 807060
Número da amostra
1
2
3
4...
454647
...
98
99100 =50
Se em um estudo, forem retiradas várias amostras aleatórias de tamanho n da população e que, para cada amostra, seja construído um intervalo de 100(1-) de confiança para .
Os intervalos obtidos serão diferentes, mas 100(1-)% destes intervalos conterão entre os seus intervalos o valor verdadeiro do parâmetro.
Intervalo de Confiança de uma Média populacional (Grandes amostras n>30 ou quando é conhecido)
1) Colete uma amostra aleatória de tamanho n>30 da população ou
uma amostra de qualquer tamanho se é conhecido;
2) Calcule os valores de e (s).
3) Determine o valor do coeficiente de confiança (1 - );
4) Encontre o valor de crítico de
5) Calcule a margem de erro (E)
6) Calcule os limites do intervalo de confiança
7) Interprete o resultado obtido.
X
2
Z
nZx
.2
ExEx
nZE
.2
• É a diferença ou erro máximo provável (1-) entre a média amostral
observada e a verdadeira média populacional . A margem de erro “E”
é também chamada de “erro máximo da estimativa” e pode ser
calculada por: n
ZE
.2
Obs.: a fórmula da margem de erro exige o conhecimento do desvio-padrão
populacional . Sendo praticamente impossível termos o valor do sem ter o valor
da Média populacional, podemos substituir o valor de pelo desvio-padrão amostral
s.
n
sZE .
2
Intervalo inferior Intervalo superiorX
XE
“Margem de erro - Precisão do Intervalo”
Um dos principais produtos de uma indústria siderúrgica é a folha
de flandres. Havia uma preocupação com a possibilidade de
haver um número de folhas fora da faixa de especificação de
dureza (LIE = 58,0 HR e LSE = 64,0 HR). A partir desta
informação a empresa decidiu estimar a dureza média das folhas
de flandres () coletando uma amostra aleatória de 50 folhas.
61,0 60,2 60,3 60,3 60,0 61,0 60,360,0 60,0 60,9 61,0 61,2 59,2 60,960,0 60,5 59,8 59,3 61,0 59,6 59,859,6 60,1 58,0 59,8 58,9 57,6 58,060,5 60,1 61,6 61,1 59,7 58,3 61,659,5 59,0 60,3 58,7 59,6 54,2 60,361,0 59,7 59,9 59,9 60,0 58,6 59,9
Medidas de dureza (HR) das folhas-de-flandres fabricadas pela siderúrgica
61,0
21,60
s
X
Para um grau de confiança de 95%, determine a margem de erro (E) e o intervalo
de confiança para média populacional ().
61,0
21,60
s
X
Resolução:
n = 50
n
sxZE
2
Margem de erro:
17,0169,050
61,0.96,1 E
Grau de confiança de 95% implica em:1 - = 95% = 5% = 0,05 96,1025,0
2
ZZ
Dados:
ExEx
Intervalo de confiança
17,021,6017,021,60
[60,04 ; 60,38]HR
Interpretação:
Se fôssemos selecionar muitas amostras (n=50) da produção de folhas e construíssemos um intervalo de 95% de confiança para cada amostra, 95% desses intervalos conteriam a média populacional .
(Pequenas amostras n 30 e desvio padrão da população desconhecida)
1) Colete uma amostra aleatória de tamanho n < 30 da população;
2) Calcule os valores de e s.
3) Determine o valor do coeficiente de confiança (1 - );
4) Encontre o valor de crítico de
5) Calcule a margem de erro (E)
6) Calcule os limites do intervalo de confiança
7) Interprete o resultado obtido.
X
1;2
nt
ntx
n
.
1;2
ExEx
ntE
n
.
1;2
INTERVALO DE CONFIANÇA DE MÉDIA POPULACIONAL
• O conceito de nível de confiança pode ser utilizado para o cálculo do
tamanho da amostra, necessário para fazermos inferências confiáveis.
• Se a amostra empregada for muito pequena, a
margem de erro será grande, o que
impossibilita ou inviabiliza a tomada de decisão.
• Por outro lado, se a amostra for muito grande,
o intervalo obtido pode ser mais estreito do que
o necessário. (gastos desnecessários);
Como o tamanho
da amostra afeta o
erro de
amostragem?
2
2/ .
E
sZn
n
sZE .
2
CÁLCULO DO TAMANHO DA AMOSTRA:
500 1000 1500 2000 2500 3000Tamanho da amostra
Mar
gem
de
erro
(E
)
0,5
1
1,5
3
2
2,5Tamanho de amostra e margens de erromantendo fixos (S=10 e 95% de confiança)
• Os ganhos em precisão conseguidos com aumentos fixos dos tamanhos das
amostras não são constantes;
• Tamanho de amostra 5.000 podem ser um perda de tempo e dinheiro porque
elas fornecem pouca precisão adicional;
Em um estudo para a determinação do perfil dos veteranos de uma Faculdade, a
característica de maior interesse tem s=0,3. Qual deve ser o tamanho da amostra
para que tenhamos 95% de confiança em que o erro da estimativa da
correspondente a esta característica não supere 0,05?
2
2/ .
E
sZn
13905,0
)3,0).(96,1(.22
2/
E
sZn
E = 0,05s = 0,3 =0,05
Refaça o cálculo supondo que se deseja ter 98% de confiança.
PROPORÇÃO
• A estimativa de proporções populacionais é muito semelhante à de
médias populacionais;Estimadores
Estimativa pontual de uma proporção
Estimativa intervalar de uma proporção
• 21% das peças é defeituosa;• 45% dos eleitores votariam novamente no Presidente Lula
• Entre 18 e 23% das peças são defeituosas;• A proporção de votos para reeleição do Presidente está entre 15 a 25%.
• A média de uma distribuição amostral de proporções amostrais
é sempre igual a verdadeira proporção da população.
Intervalo de Confiança para Proporção:
Estimativa pontual
n
Xp ˆ
O estimador da proporção amostral:
Sendo X o número de elementos da amostra (n) que apresenta a característica de estudo;
O erro-padrão da estimativa:
n
qppEP
ˆ.ˆ)ˆ( pq ˆ1ˆ Sendo:
Suposição: A proporção populacional é igual a proporção amostral!
Estimativa intervalar
n
qpZp
n
qpZp
ˆ.ˆ.ˆ;
ˆ.ˆ.ˆ
22
• intervalo de 100(1-)% de confiança;• supondo amostras grandes (n>40) [aproximação da Binomial para Normal];
• Se amostra finita e n > 5% de N:
1
.ˆ.ˆ
.ˆ2 N
nN
n
qpZp
Tamanho da amostra
2
2
2
ˆ.ˆ
E
qpZn
Para o cálculo do tamanho da amostra:
•Se não tivermos noção do número de defeituosos, isto é, p desconhecido:Devemos perceber que p varia de 0 a 1 (de nenhum defeituoso até 100% defeituoso)
21,0q.p3,0p
16,0q.p2,0p
09,0q.p1,0p
0q.p0p
:para
)p1.(pq.p
21,0q.p7,0p
24,0q.p6,0p
25,0q.p5,0p
24,0q.p4,0p
Assim, consideramos P = 0,5 por nos garantir a maior relação para o tamanho da amostra
Exemplo:
Nos Estados Unidos, os pesquisadores de opinião são
atormentados por uma diversidade de fatores de confusão, como
secretárias eletrônicas. Em uma pesquisa junto a 1068 americanos,
673 informaram ter secretária eletrônica. Com base nesses
resultados amostrais determine:
a) A estimativa pontual da população p:
b) a estimativa intervalar de 95% da proporção populacional
630,01068
673ˆ
n
Xp
0290,01068
)370,0).(630,0(.96,1
ˆ.ˆ
2
n
qpZE
659,0601,0
0290,0630,00290,0630,0
ˆˆ
p
p
EppEp Intervalo de confiança
Entre os americanos, a
percentagem daqueles
que possuem secretária
eletrônica é estimada em
63%, com uma margem
de erro de + 2,9 pontos
percentuais.
Conclusões• Intervalos de confiança são muito mais informativos do que as
estimativas pontuais;
• Toda estimativa intervalar está associada a um grau de confiança;
Referência Bibliográfica
Triola.; - Introdução a Estatística
• Quando se tem n<30 e não se conhece o desvio-padrão da população
usamos a distribuição t.
1. Uma máquina automática de suco industrial é regulada de modo que
a quantidade suprida de cada vez, tenha distribuição aproximadamente
normal com desvio-padrão de 35ml. Determine um intervalo de 96% de
confiança para a quantidade média de toda produção, sabendo que uma
amostra de 30 embalagens teve um conteúdo médio de 290 ml.
Exercícios:
2. Uma amostra aleatória de 40 empregados é tomada de uma linha de
produção de 500. A média de horas-extras trabalhadas por semana é
cinco horas com desvio-padrão de uma hora. Construa um intervalo de
99% de confiança para a média das horas extras trabalhadas para a
toda a linha de produção.
3. Um fabricante de cintos de segurança deseja estimar a probabilidade
dos cintos resistirem a um esforço. Como o teste é destrutível , ele deseja
manter o tamanho da amostra o menor possível. Determine o número de
observações que devem ser feitas para estimar a probabilidade a menos
de 0,04 com 95% de confiança, se ele crê (baseando-se em experimentos
anteriores) que a percentagem de defeituosos não supere a 6%.
4. Especifique quais são e como influenciam as 3 variáveis que
determinam a margem de erro de um intervalo de confiança.
5. Qual o tamanho da amostra necessária para estimar o tempo médio que
um vendedor de uma loja de móveis gasta com cada cliente, a menos de 2
minutos do verdadeiro valor, para obter um nível de confiança de 99% de
confiança? Suponha o desvio da população igual a 12 minutos. (obs.:
sempre arredondamos a resposta para o próximo número inteiro superior.)
6. A Polícia Rodoviária faz mensalmente uma pesquisa para avaliar a
velocidade desenvolvida nas rodovias durante o período de 2 às 4 horas
da madrugada. Num período de observação e em um trecho específico,
100 carros passaram por um aparelho de radar a uma velocidade média
de 115 Km/h, com desvio padrão de 10 Km/h.
a) Estime a verdadeira média (estimativa pontual) da população;
b) Construa um intervalo de 98% de confiança para a média da população.
7. Uma amostra aleatória de 40 contas não-comerciais na filial de um
banco acusou saldo médio de R$140,00 com desvio-padrão de R$30,00.
a) Construa um intervalo de 95% confiança para a verdadeira média.
b) Construa um intervalo de 99% confiança para a verdadeira média.
c) A que conclusão podemos chegar com os resultados das letras
anteriores?
8. Um grupo de pesquisa de mercado constatou que 25% dos 200
fregueses recentemente entrevistados num grande shopping center de
Belo Horizonte residem a mais de 5 Km deste local.
a) Construa um intervalo de 95% de confiança para a percentagem efetiva
de fregueses que moram a mais de 5 km do Shopping Center;
b) Qual é o erro provável máximo associado ao intervalo?
9. A Biblioteca da faculdade deseja estimar a percentagem de livros de
seu acervo que são publicados até 1995. Qual deve ser o tamanho da
amostra aleatória para se ter 90% de confiança de ficar menos de 5% da
verdadeira proporção?
10. Uma amostra aleatória de 40 homens trabalhando num grande projeto
de construção revelou que 6 homens não estavam usando capacetes
protetores. Construa um intervalo de 98% confiança dos que não estão
usando capacetes nesse projeto.
INTERVALO DE TOLERÂNCIA
Limites de Tolerância são similares a Capabilidade de
Processo, isto é, eles mostram os limites práticos de
variabilidade do processo e portanto podem ser valiosas
informações na determinação dos limites de tolerância na
engenharia.
Existem dois tipos de determinação dos limites de tolerância:
-Os que assumem a distribuição Normal
-Os que não requerem qualquer distribuição.
Intervalo de Tolerância:
Intervalo de Tolerância:
Método Distribuição Fórmula dos limites
Amostra de n elementos sabendo-se a média e o desvio padrão
Normal
Amostra de n elementos sabendo-se a média e o range
Normal
N amostras de n elementos cada uma e sabendo-se a média das médias e o range
Normal
Definida a proporção da população, e amostra de n observando o maior e o menor valores
Nenhuma A probabilidade é que ao menos P% da população estará entre os extremos amostrais
RKx 1
Ksx
RKx 2
• Identificação de K, K1 e K2:
•Fazer uso das tabelas de “Fatores de Tolerância para
Distribuição Normal” (Juran, Apêndice II, Tabelas U, V e W)
Intervalo de Tolerância:
INTERVALO DE TOLERÂNCIA
• Alguns valores de K (proporção populacional 95% e nível de
confiança 95%)n One Sided K Two Sided K
3 9.916 7.655
4 6.370 5.145
5 5.079 4.202
6 4.414 3.707
7 4.007 3.399
8 3.732 3.188
9 3.532 3.031
10 3.379 2.911
11 3.259 2.815
12 3.162 2.736
13 3.081 2.670
14 3.012 2.614
15 2.954 2.566
INTERVALO DE CONFIANÇA PARA A VARIÂNCIA
• A variância amostral s2 é a melhor estimativa pontual da variância
populacional 2 (população normal).
• Embora s2 seja a melhor estimativa pontual de 2, não há indicação
de quão bom realmente seja. Para compensar esta deficiência,
estabelecemos uma estimativa intervalar mais “reveladora”:
•Lembrete: a distribuição Qui-Quadrado não é simétrica!!!!
2
22
2
2 )1()1(
ED
snsn
INTERVALO DE CONFIANÇA PARA O DESVIO PADRÃO
• O intervalo de confiança para o desvio padrão é dado pela raiz
quadrada de cada componente do intervalo de confiança da variância.
2E
2
2D
2 s)1n(s)1n(
Exemplo:
A variância amostral para um conjunto de 25
amostras foi calculado ser 36. Calcule o
intervalo de 90% de confiança para a variância
populacional.
Slide 49
38,6272,23
85,13
36)125(
42,36
36)125(
s)1n(s)1n(
2
2
2
22
2
2
1n,2/11n,2/
95,02/1
05,02/
25n
36s2
Exercícios: Folha 1
Slide 50
2ª Parte:
– Testes de hipóteses para a média e a proporção
Slide 51
TESTE DE HIPÓTESE
Hipótese, em estatística, é uma afirmação sobre uma propriedade
(parâmetro) de uma população.
O objetivo da estimação é
estimar (calcular) algum
parâmetro populacional.
O objetivo do teste de hipótese
é decidir se determinada
afirmação sobre um parâmetro
populacional é verdadeira.
Inferência estatística
Inspeciona-se uma amostra de 142 peças de uma grande remessa,
encontrando-se 8% de peças defeituosas. O fornecedor garante que
não haverá mais de 6% de peças defeituosas em cada remessa. O
que devemos responder com o auxílio do teste de hipótese é se a
afirmação do fornecedor é verdadeira !
O problema:O problema:
Teste de Hipótese:
Estabelecer a hipótese nula ( pressupõem-
se que não há diferença entre o que se
afirma e que realmente acontece).
Hipótese NulaoH Hipótese Alternativa 1H
É a afirmação que deve ser verdadeira
se a hipótese nula é falsa.
A forma simbólica de uma hipótese nula pode ser:
:
:
:
o
o
o
H
H
H Algum valor
Algum valor
Algum valor
A forma simbólica de uma hipótese alternativa pode ser:
:
:
:
1
1
1
H
H
H Algum valor
Algum valor
Algum valor
ESTABELECENDO HIPÓTESES:
Se o leitor ou consumidor está fazendo a
pesquisa e deseja usar o teste de hipótese
para apoiar sua afirmação, então essa
afirmação deve ser formulada de maneira
que se torne a hipótese alternativa, não
podendo assim, conter a situação de
igualdade!
A Hipótese alternativaA Hipótese alternativa Hipótese de pesquisaHipótese de pesquisa
3: oH
3:1 H
A Telemar afirma que pelo menos 88%
dos telefones públicos em Belo Horizonte
estão em bom estado.
88,0: pHo
Um fabricante de pneu alega que seus
pneus suportam 64 mil Km no mínimo.
000.64: oH
000.64:1 H
88,0:1 pH
O tempo médio para fazer um teste é
crítico para a gestão de custos de um
grande laboratório. Supõem-se que um
certo tipo de teste pode ser feito em três
minutos.
Hipóteses
EXEMPLOS DE HIPÓTESES NULAS E ALTERNATIVAS
• O teste consiste em verificar se uma estatística amostral observada
pode razoavelmente provirrazoavelmente provir de uma população com um parâmetro
alegado;
X
0 Z
Estatísticas amostrais como esta são bastante prováveis se
Ho é verdadeira;
Estatísticas amostrais como esta são bastante improváveis se Ho é verdadeira;
CARACTERÍSTICAS DE UM TESTE DE HIPÓTESE:
Inspeciona-se uma amostra de 142 peças de uma grande remessa,
encontrando-se 8% de peças defeituosas. O fornecedor garante que
não haverá mais de 6% de peças defeituosas em cada remessa. O
que devemos responder com o auxílio do teste de hipótese é se a
afirmação do fornecedor é verdadeira !
O problema:O problema:
n
qppEP
.)( 02,0
142
)94,0).(06,0()( pEP
%6: pHo
%6:1 pH
0,102,0
06,008,0
.
ˆ
nqp
ppZ
0,1587
f(x)
X0,08
0 1 Z
• A probabilidade de obter uma discrepância
superior a 8% com uma amostra de 142 de
uma população com 6% é de cerca de 16%;
ENTENDENDO A BASE DO TESTE DE HIPÓTESE:
Assim podemos dizer:
Isto pode sugerir que a discrepância pode ser devida apenas ao acaso, mas não
podemos afirmar, em definitivo, que a população tenha realmente uma
percentagem de 6% de defeituosos. Em vista da distribuição amostral de tal
população e da estatística observada, podemos afirmar que a afirmativa parece
verdadeira.• Suponhamos agora que tivéssemos
encontrado uma proporção amostral,
digamos de 19%.
5,602,0
06,019,0ˆ
x
ppZ
f(x)
X
0 6,5Z
• A probabilidade é pequena. Assim, parece
pouco provável que tal estatística amostral
provenha de uma população com um
parâmetro com população alegada de 6%.
Procedimentos para o teste de hipótese de uma e p:
1- Formular as hipóteses nula e alternativa colocando-as na forma simbólica;
Obs.:Das duas expressões, a hipótese nula (Ho) é a que contém a condição
de igualdade. A hipótese alternativa (H1) e a outra afirmação;
2- Escolher o nível de significância () com base na gravidade do erro tipo 1.
Tomar um valor de () pequeno se as consequências da rejeição de uma Ho
verdadeira são sérias. (valores comuns para : 0,05 e 0,01);
4- Determinar a estatística de teste. Incluir a estatística de teste no gráfico;
5- Rejeitar Ho se a estatística de teste esta na região crítica. Não rejeitar Ho se a
estatística de teste não está na região crítica;
6- Formule a decisão estatística em termos do problema original.
3- Determinar os valores críticos e a região crítica. Esboçar um gráfico e incluir os
valores críticos e a região crítica;
Conceitos importante para o Teste de Hipótese:
• Estatística de teste = é uma estatística amostral da média ou da
proporção;
• Região Crítica = é o conjunto de todos os valores da estatística
de teste que levam à rejeição da hipótese nula;
• Valor Crítico = O valor crítico e o valor ou valores que separa(m)
a região crítica dos valores da estatística de teste que não levam a
rejeição da hipótese nula;
Região Crítica e o nível de significância num teste bilateral
Não rejeitamos Ho
Rejeitamos HoRejeitamos Ho
Região Crítica Região Crítica
/2 /20
Decidimos rejeitar a hipótese nula
Não rejeitamos a hipótese nula
A hipótese nula é verdadeira
A hipótese nula é falsa
Erro tipo I ()
Erro tipo II ()
Ok
Ok
Erros do tipo: I e II
O valor é verdadeiro na realidade
• A probabilidade de um erro tipo I acontecer é igual ao nível de significância () de
um teste de hipótese. Valores comuns predeterminados: (=0,05 e =0,01)
() nível de significância ou a
probabilidade do erro tipo I
() nível de significância ou a
probabilidade do erro tipo II
Erro Tipo I: Risco do Produtor
• Teste Bilateral = quando a região crítica está situada nas duas regiões
extremas (caudas) sob a curva;/2/2
• Teste Unilateral a esquerda =
quando a região crítica está situada na
extrema esquerda sob a curva;
• Teste Unilateral a direita =
quando a região crítica está situada na
extrema direita sob a curva;
Erro Tipo II: Risco do Consumidor
Exemplo de um Teste de Hipótese Para Média
Um fabricante de pneu americano alega que seus pneus suportam
uma quilometragem de 40.000 milhas no mínimo. Suponhamos que
os resultados de um teste tenham sido: amostra n=49, média
amostral 38.000 milhas. Sabe-se que quilometragem de todos os
pneus tem desvio-padrão de 3.500 milhas. Realize o teste de
hipótese para testar a afirmação do fabricante.
000.40:1 H
000.40: oH500
49
500.3
nX
0,4500
000.40000.38
x
Xx
Z
Adotando: (=0,05) temos que Z = - 1,65
Portanto a Ho deve ser rejeitada se:
Z < Z0,05
Single Sample Test
X
0-4,0 Z-1,65
1- O valor de Z = - 4,0 é menor que
-1,65 , o que rejeitaria a hipótese nula;
CONCLUSÕESCONCLUSÕES
2- A evidências suficientes para garantir
a rejeição da afirmação que a média é
maior ou igual à 40 mil Milhas
3- Poderemos, estar correndo um erro
tipo I. Não há maneiras de se estar
absolutamente certo se Ho é verdadeiro
ou não.
Qual a verdadeira média dos pneus?
- Uma forma de responder a
esta pergunta é usar os dados
amostrais para estimar a média
da quilometragem. Usando um
nível de confiança de 95%,
temos:
38.000+1,96.(500)
nX x.96,1
(38.000+980) milhas
Exemplo para o teste de uma afirmação de uma proporção:
Um estudo sobre a eficácia do air-bag em automóveis, constatou
que, em 821 colisões com carros de tamanho médio equipados
com air-bag, 46 resultaram na hospitalização do motorista. Ao
nível de significância de 0,01, teste a afirmação de que a taxa de
hospitalização nos casos de air-bag é inferior à taxa de 7,8%.
078,0: pHo
078,0:1 pH
35,2
821)922,0).(078,0(
078,005603,0
.
ˆ
nqp
ppZ
922,0078,011 pq05603,0821
46ˆ p
078,0p
01,0
Implica num valor crítico de Z= -2,33
A estatística de teste está dentro da região crítica.
Rejeitamos Ho. Assim temos evidências suficientes para
afirmar que a taxa de hospitalização é inferior a 7,8%.
Portanto a Ho deve ser rejeitada se:
01,0ZZ
Exemplo para o teste de uma afirmação de uma proporção:
Em um teste de gosto de consumidores, 100 bebedores regulares de
Pepsi recebem amostras cegas de Coca e Pepsi; 48 deles preferiram a
Coca-cola no teste. Se os diretores da Coca-cola afirmam que seu
refrigerante é preferido por 50% dos bebedores de Pepsi, teste esta
afirmação ao nível de significância de 0,05.
50,0: pHo
50,0:1 pH
40,0
100)5,0).(5,0(
5,048,0
.
ˆ
nqp
ppZ025,0
2
Implica num valor crítico de Z0,025=+1,96 Não há evidencia
suficiente para
rejeitar a afirmação
de que 50 % dos
bebedores de Pepsi
preferem coca
Conclusão
Portanto a Ho deve ser rejeitada se:
025,0ZZ 025,0ZZ ouZ=0
Dados amostrais indicamZ= - 0,4
p=0,5
-1,96 +1,96
48,0100
48ˆ p 5,05,01p1q 50,0p
Pontos importantes e conclusões:
• Para o teste de hipótese da Média, o tamanho da amostra (n) sempre deve ser > que
30;
• Para o teste de hipótese da Média de pequenas amostras, a distribuição t de
student deve ser usada;
• Nos testes bilaterais, o nível de significância () é dividido igualmente entre as duas
caudas que constituem regiões críticas;
• Quando a hipótese alternativa (H1) é de algum valor, temos um teste bilaterais.
Quando H1 tem sinal (>) temos um teste unilateral a direita e quando H1 recebe sinal
(<) temos um teste unilateral a esquerda ;
• A interpretação do texto é bastante importante na realização dos experimentos de teste
de hipótese. Se mencionar igual trata-se de uma afirmação nula, se não mencionar,
a afirmação será a hipótese alternativa;
Exercícios:
1. Um fabricante de fio de arame alega que seu produto tem uma resistência
média à ruptura superior a 10 Kg, com desvio padrão de 0,5 kg. O INMETRO
resolve testar essa afirmativa, extraindo uma amostra de 50 peças de arame, a
qual acusou resistência média de 10,4 kg. Que conclusão o INMETRO pode
chegar?
2. Uma rede de pizzaria compra as peças de salame utilizadas na produção de
pizzas de uma grande indústria produtora de alimentos derivados de carne. Pizzas
de boa qualidade exigem um teor médio de gordura nas peças de salame igual a
40%. Experiências anteriores com este fornecedor revelam que o teor médio de
gordura tem variabilidade igual a um d.p. de 2,0%. Um teste com 36 peças de
salame um teor médio de gordura de 41%. Faça o teste de hipótese adotando nível
de significância 0,05.
3. O tempo médio necessário para paradas de manutenção de uma certa
máquina copiadora é igual a 93 minutos. Uma companhia alega que o seu novo
modelo foi projetado para ter uma manutenção mais fácil e consequentemente
mais rápida. Um teste com 73 máquinas de um novo modelo resultou num tempo
de reparo médio de 88,8 minutos. Sabendo-se que os arquivos de manutenção
registram um desvio-padrão de 26,6 minutos, utilize o nível de significância de
(=0,025) para testar a alegação da companhia.
4. Em uma certa indústria, cerca de 15% dos trabalhadores possuíam doenças
provocadas pela radiação. A companhia afirmou ao sindicato que faria a
medicação de seus trabalhadores e depois do tratamento cerca de 140
trabalhadores foram novamente avaliados. Constatou-se cerca de 19
trabalhadores com altos índices de radiação. Utilize (=0,025) para checar a
alegação da companhia de que o tratamento teve sucesso.
5. Uma empresa fornece uma grande variedade de parafusos à montadora Fiat.
Um dos tipos de parafusos mais importantes utilizados na montagem dos
automóveis é o de comprimento igual à 3,5 polegadas. Para este tipo, o
fornecedor alega que um lote enviado contém parafusos com tamanho médio
igual à 3,5 polegadas e desvio-padrão de 0,01 polegada. Você é o diretor
responsável pelo controle de qualidade de peças de terceiros da FIAT e determina
aos seus estagiários que tirem uma amostra aleatória de 40 parafusos para
verificar o comprimento. O resultado encontrado no teste foi uma média de 3,49
polegadas. Utilize um nível de significância igual (=0,05).
6. Um engenheiro de produção recém contratado pela “Cera Inglesa” deseja
estimar a percentagem do estoque de todos os tipos de produtos que chegaram
na central de distribuição de Belo Horizonte no início do ano passado e que ainda
não foi distribuída. Qual deve ser o tamanho da amostra aleatória a ser tomada
para se ter 99% de confiança de ficar menos de 3% da verdadeira proporção?
7. Uma amostra aleatória com 69 compradores de novos veículos GOLF mostrou
que a quilometragem média percorrida durante o primeiro ano de utilização do
veículo foi de 7.500 km com desvio-padrão de 1150 km.
A) Construa um intervalo de 90% confiança para a verdadeira quilometragem
média.
B) Construa um intervalo de 99% confiança para a verdadeira quilometragem
média.
C) A que conclusão podemos chegar com os resultados das letras anteriores?
8. O tempo médio, por operário para executar uma tarefa tem sido igual a 100
minutos, com um desvio padrão de 15 minutos. Introduziu-se uma modificação para
diminuir esse tempo, e, após certo período, sorteou-se uma amostra de 36
operários, medindo-se o tempo de execução de cada um. O tempo médio da
amostra foi de 85 minutos. Estes resultados trazem evidências estatísticas da
melhora desejada?
Exemplos: soluções
Slide 74
3ª Parte:
– Testes de hipóteses para 2 médias / proporções
– Testes de hipóteses para a variância e Testes de aderência e independência
Slide 75
Exemplos de Comparações
Técnicos de uma indústria que opera com duas linhas de produção desejam avaliar a similaridade de produção das linhas a fim de identificar possíveis pontos de melhoria em uma delas;
A área de marketing de uma empresa prestadora de serviços deseja fazer uma nova peça publicitária comparando o serviço prestado ao das concorrentes.
Teste de Hipótese sobre 2 Médias Amostrais:
Two Sample Test
Tipos de Amostras
Independentes
se a amostra extraída de uma das populações não tem qualquer relação com a amostra extraída da outra população; como por exemplo o peso de Homens e de Mulheres.
H1 M1H2 M2H3 M3
Dependentes ou Emparelhadas
quando uma amostra possui alguma relação com a outra; como por exemplo o peso do indivíduo antes e após um tratamento para emagrecimento.
H1a H1dH2a H2d
H3a H3d
Comparação de Duas MédiasDados Emparelhados
Dez cobaias (porcos) foram submetidas a um tratamento com um novo tipo de ração, por um mês. Deseja-se saber se a nova ração foi efetiva para o aumento de peso dos animais.
Trata-se de dados emparelhados, pois o que se pretende medir é o peso atual – peso anterior de um mesmo indivíduo da população
depois - antes =
H0: 0
H1: < 0
O teste a ser usado será “t de Student”:
t = d. -
sd/nPorque ?
A distribuição t-Student assemelha-se a distribuição normal em relação à forma, sendo menos alta na região próxima a média e mais alta nas extremidades, sendo aplicável para n < 30. A medida que n sobe t tende para z.
Comparação de Duas MédiasDados Emparelhados
H0: 0
H1: < 0
d. = 4.3
Sd = 4.9
tcalc= (d.- ) / (Sd/ n)
tcalc= (4.3- 0) / (4.9/ 10)
tcalc= 2.77
Considerando = 0,05 e t(n-1) tem-se
tcrítico = -1.833
Sendo tcalc > tcrítico, não há evidência para rejeitar H0
Antes Após Diferença300 315 15310 312 2315 320 5320 320 0310 313 3312 315 3325 330 5310 307 -3315 319 4311 320 9
Média 312,8 317,1 4,3D.P. 6,7 6,2 4,9
Escolha dos Testes
Comparação de2 médias
Dados Emparelhados
H0: = 0H1: 0
Calcula-set de Student
Não
Desconhecidos 1 = 2
Conhecidos 1 = 2
Z = (X1-X2) (1/n1+1/n2)
2
)1()1( 22
212
nm
smsns
mns
YX
11.2
Calcula-set como sendo...
Calcula-se t de StudentUsando Aspin-Welch
Sim
Desconhecidos 1 2
Comparação de Duas MédiasDados Não Emparelhados
Dois diferentes métodos de execução de uma tarefa foram testados, resultando nos dados abaixo, expressos em minutos. Deseja-se saber se o método 2 é mais rápido que o método 1.
Trata-se de dados não emparelhados, e é razoável supor que as variâncias sejam iguais.
Comparação de Duas MédiasDados Não Emparelhados
H0: 1 = 2
H1: 1 > 2
X1 = 55, S1 = 2,7 e n1 = 5
Y2 = 53, S2 = 2,2 e m2 = 5
S = 2.5
tcalc = 1.26
Considerando = 0,05 e t(n1+m2-2);0,05
tem-se tcrítico = 1.86
Sendo tcalc < tcrítico, não há evidência para rejeitar H0
Método 1 Método 254 5055 5458 5651 5257 53
Média 55 53D.P. 2,7 2,2
2
)1()1( 22
212
nm
smsns
m1
n1
.s
YXt
2
calc
Escolha de t crítico = f(H1)
• A região crítica para um teste
com nível de significância (),
depende da hipótese
alternativa;
mns
YXTo
11.2
211 : H 2;0 mntT
211 : H 2;0 mntT
211 : H2;2/0 mntT
Hipótese alternativa Região Crítica
2;2/0 mntT
Características do teste de comparação para proporções:
Proporção populacional
Tamanho da amostra
Número de sucessos na amostraproporção amostral
Para a população 1Para a população 1
1p
1n
1x
1
11ˆ
n
xp
Proporção populacional
Tamanho da amostra
número de sucessos na amostraproporção amostral
Para a população 2Para a população 2
2p
2n
2x
2
22ˆ
n
xp
• Têm-se dois conjuntos de dados amostrais independentes
escolhidos de maneira aleatória;
• Em ambas as amostras verificam-se as condições de:
(Condição para uso da Distribuição Normal) 5ˆ.
5ˆ.
qn
pn
Teste de hipótese s/ 2 proporções amostrais:
Características do teste de comparação para proporções:
• O teste de hipótese feito para duas proporções populacionais
utiliza a seguinte estimativa combinada do valor comum a p1 e p2 :
21
21
nn
xxp
pq 1Para pPara p1 =1 = p p2 2 têm-se a seguinte têm-se a seguinte
estimativa combinadaestimativa combinada
• A estatística de teste para duas proporções será igual :
21
21
..
ˆˆ
nqp
nqp
ppZo
“Exemplo da aplicação do teste de hipótese para comparação de duas proporções”
Uma empresa nacional de linha branca deseja comparar o
desempenho dos motores fabricados pelo seu fornecedor (1) com o
desempenho dos motores vendidos por um outro fornecedor (2) ao seu
concorrente. A variável escolhida para a realização da comparação foi a
proporção de motores que funcionam sem a necessidade de reparos por
um período de um mês, quando submetidos a condições específicas de
“stress”. No estudo foram tomados 100 motores de cada fornecedor,
sendo encontrados: X1=66 e X2=73 motores que funcionaram sem a
necessidade de reparos. A equipe da empresa realizará o teste de
hipótese adotando o nível de significância = 0,05.
1- Estabelecer as Hipóteses nula e alternativa:
21: ppHo
211 : ppH
A empresa quer comparar o desempenho dos motores dos dois fornecedores;
Os parâmetros de interesse são as proporções de motores dos
fornecedores: p1 e p2 que funcionam sem a necessidade de reparo
2- Determinação do nível de significância e da região crítica:
A partir da tabela de distribuição normal padronizada
96,1025,0
2
ZZZcrítico
Portanto, a Ho deve ser rejeitada se Zteste >1,96
ou Zteste <-1,96
3- Verificação se o teste baseado em Z é válido (pré requisito):
4- Determinação da estimativa combinada de p1 e p2:
Amostra 15ˆ.
5ˆ.
qn
pn
5100
34.100
5100
66.100
Amostra 25ˆ.
5ˆ.
qn
pn
5100
27.100
5100
73.100
Okkk !!!Okkk !!!
695,0100100
7366
21
21
nn
xxp
305,0695,011 pq
5- Determinação da estatística de teste apropriada:
08,1
100)305,0).(695,0(
100)305,0).(695,0(
10073
10066
..
ˆˆ
21
21
nqp
nqp
ppZ teste
6- Decidir se a hipótese nula deve ser rejeitada ou não:
Como Zteste = -1,08 não está na região crítica, não há
evidência para rejeitar a hipótese nula ao nível de
significância de 5%.
Não há evidências para concluir que o desempenho
dos motores produzidos pelo fornecedor 1 é diferente
do desempenho do motor produzido pelo fornecedor 2.
Os Engenheiros de Produto da Cervejaria Schincariol querem realizar um
teste para avaliar se os consumidores da Nova Schin do interior de Minas
Gerais e de Belo Horizonte, diferem ou não na proporção de aprovação
da nova cerveja. Para isto, tomou-se uma amostra aleatória de 50
consumidores na capital e 50 consumidores no interior do estado. Na
capital, 18 aprovaram a nova cerveja e no interior apenas 25 aprovaram.
Realize o teste ao nível de 0,01 de significância.
1- Estabelecer as Hipóteses nula e alternativa:
21: ppHo
211 : ppH
A empresa quer comparar se existe diferença na proporção de aprovação da nova cerveja.
TESTE DE HIPÓTESE PARA DUAS PROPORÇÕES
2- Determinação do nível de significância e da região crítica:
A partir da tabela de distribuição normal padronizada
58,2005,0
2
ZZZcrítico
Portanto, a Ho deve ser rejeitada se Zteste >+2,58 ou Zteste<-2,58.
3- Verificação se o teste baseado em Z é válido (pré requisito):
Amostra 15ˆ.
5ˆ.
qn
pn
550
32.50
550
18.50
Amostra 25ˆ.
5ˆ.
qn
pn
550
25.50
550
25.50
Okkk !!!Okkk !!!
4- Determinação da estimativa combinada de p1 e p2:
43,05050
2518
21
21
nn
xxp
57,043,011 pq
5- Determinação da estatística de teste apropriada:
41,1
50)57,0).(43,0(
50)57,0).(43,0(
5025
5018
..
ˆˆ
21
21
nqp
nqp
ppZ teste
6- Decidir se a hipótese nula deve ser rejeitada ou não:
Como Zteste = -1,41 não está na região crítica, não há
evidência para rejeitar a hipótese nula ao nível de
significância de 1%.
Não há evidências para concluir que haja diferença na
proporção dos consumidores que aprovam a Nova
Schin na capital e no interior.
Testes de Hipóteses para a variância amostral
• Estatística de teste:
• Lembrete: A distribuição Qui-Quadrado não é simétrica!!!!
2
22 )1(
sn
Graus de liberdade = n-1
Suposição:
• População distribuída normalmente
Testes de hipóteses para a variância :
Exemplo:
• O departamento de desenvolvimento de aço da R&D tentou
desenvolver uma nova liga de aço com menor variabilidade da
tensão elástica. O departamento da R&D declara que o novo material
terá uma variação de tensão dentro de 4 Sigmas menor ou igual a 60
psi 95% das vezes. Uma amostra de 8 elementos foi testada e
rendeu um desvio padrão de 8 psi. Pode uma redução na variação
da tensão elástica ser validada com 95% de confiança?
Testes de hipóteses para a variância :
20
200
20
200
:H
:H
O melhor range de variação esperado é 60 psi. Isto nos leva a ter
um sigma de 15 psi (uma aproximação de 4 sigma de largura
acobertado por 95,44% das ocorrências).
A hipótese nula é:
A hipótese alternativa:
A hipótese nula é:
A hipótese alternativa:
Testes de hipóteses para a variância :
2200
2200
15:H
15:H
99,115
8)18(s)1n(X
2
2
20
2x2
Da tabela de Qui-quadrado: porque a hipótese alternativa é “<“
este é um teste unilateral. Usando gl = n-1 = 7, o valor crítico
para qui-quadrado com 95% de confiança é 2,17.
A estatística de teste calculada é:
Testes de hipóteses para a variância :
Uma vez que 1,99 é menor que 2,17, ela cai na região crítica e a
hipótese nula deve ser rejeitada.
Existe evidência suficiente para rejeitarmos a Hipótese nula.
A declaração do departamento da R&D foi suportada.
Comparação de duas variâncias amostrais
• Estatística de teste:
• Lembrete: A distribuição F não é simétrica!!!!
22
21
s
sF
Graus de liberdade do numerador = n1-1
Suposições:
• Populações independentes;
•:Ambas distribuídas normalmente
Graus de liberdade do denominador = n2-1
Exemplo:
Um laboratório de materiais está estudando o efeito de
envelhecimento de um determinado produto. Eles querem saber se
existe melhoria na consistência de concentração após o
envelhecimento por um ano (assuma um nível de confiança de 95%).
Os dados obtidos são listados abaixo:
No Início 1 ano depois
Numero de testes 9 7
Desvio Padrão (psi) 900 300
Hipótese Nula:
Hipótese Alternativa:
6v
8v
:H
:H
2
1
22
211
22
210
A hipótese alternativa é relativa à melhoria na variação, portanto
temos um teste unilateral. A partir da distribuição F, ovalor
crítico de F é 4,15.
A região de rejeição da hipótese nula é maior ou igual a 4,15.
9300
900
s
sF
2
2
22
21
Fazendo o cálculo da estatística de teste:
Uma vez que o valor calculado de F está na região crítica, a
hipótese nula deve ser rejeitada.
Existe evidência suficiente para indicar a redução da variância e
aumento da consistência da concentração após o
envelhecimento por um ano.
TESTE DE ADERÊNCIA
• No teste de aderência, a hipótese testada refere-se à forma da
distribuição da população.
• Este teste baseia-se na estatística:
2
2 2
11
( )O E
E
O
Eni i
i
i
ii
k
i
k
onde:2
a estatística do teste, com graus de liberdade;Oi a frequência observada de uma determinada classe;Ei a frequência esperada desta classe, segundo o modelo testado = nipi;n o número de elementos da amostra;k número de classes ou valores considerados;pi probabilidade de se obter um valor da variável na classe esperada, segundo o modelo.
Testes de Ajuste – Goodness of Fit:
•Passos para conduzir um teste de aderência:
1- Formule as hipóteses nula e a alternativa.
2- Se o parâmetro da distribuição dada nas hipóteses nula e
alternativa não for conhecido, então deve ser calculado.
3- Calcular a freqüência esperada para cada uma das categorias “k”
como a distribuição hipotética fosse a distribuição verdadeira.
4- Calcular a estatística de teste.
5- Rejeite H0 se o valor calculado for maior que o valor tabelado (ou
seja, não adere ao modelo).
= k-1-m, onde “m” é o número de parâmetros do modelo estimados
independentemente a partir da amostra.
; ; ;calc2 2
• Exemplo:
É um dado de jogar honesto e balanceado, fornecidos o número de
vezes que cada um dos lados saiu?
Um dado foi jogado 48 vezes com os seguintes resultados:
Face Número Saídas Face Número Saídas
1 12 2 7
3 2 4 7
5 12 6 8
Quando o dado é jogado, a expectativa é que cada um dos lados
deveria sair um número igual de vezes.
É óbvio que existirão saídas aleatórias desta expectativa teórica uma
vez que o dado seja honesto.
H0: as saídas do dado seguem uma distribuição uniforme
H1: as saídas do dados não seguem uma distribuição uniforme.
Faces fe f0 (fe – f0)2 / fe
1 8 12 2,000
2 8 7 0,125
3 8 2 4,500
4 8 7 0,125
5 8 12 2,000
6 8 8 0,000
Total 48 48 8,750
k
1i e
2e02 750,8
f
)ff(
O valor do qui-quadrao calculado é 8,75. O valor de qui-
quadrado crítico é 11,07.
O qui-quadrado calculado não excede o qui-quadrado crítico.
Portanto, a hipótese de um dado honesto seguindo uma
distribuição uniforme não pode ser rejeitada.
As saídas aleatórias a partir de uma expectativa teórica
podem tranquilamente ser explicadas pela causa comum.
TESTE DE INDEPENDÊNCIA
• Os testes de independência são realizados através de Tabelas de
Contingência.
• Tabela de contingência é a representação tabular das freqüências
observadas.
Exemplo: 100 pessoas foram entrevistadas sobre um projetode lei; o resultado é colocado em forma de uma tabela decontingência:
OpiniãoSexo Favorável Desfavorável Indiferente Totais
Homens 33 12 15 60Mulheres 7 20 13 40
Totais 40 32 28 100
TESTE DE INDEPENDÊNCIA
• O teste de independência:H0: as variáveis são independentes;H1: as variáveis não são independentes.
O teste será feito usando 2, semelhante ao teste de aderência.
2 = a estatística do teste, com graus de liberdade;
r = número de linhas;s = número de colunas;Oij = frequência observada na interseção da linha i com a coluna j;Eij = frequência esperada na interseção da linha i com a coluna j;n = número de elementos da amostra.
2
2
11
( )O E
Eij ij
ijj
s
i
r
TESTE DE INDEPENDÊNCIA
• Rejeita-se H0 se 2calc > 2
crít.
= (L-1).(c-1)
•“macete” para cálculo do : na tabela anterior, risque uma
linha e uma coluna, conte o que sobrou
– Exercícios: Folha 2
Slide 111
4ª Parte:
– Regressão Linear Simples
Slide 112
CORRELAÇÃO ENTRE DUAS VARIÁVEIS
Problema: O diretor de vendas de varejo nacional
necessita analisar se há relação entre o investimento em
propaganda e as vendas da empresa. O departamento de
vendas preparou uma tabela com as vendas (em milhões)
e os investimentos em propaganda (em milhões) dos
últimos dez anos.
480400270195210470490520335430Vendas
2535178203742352130Propagandas
Objetivo: analisar a possibilidade de definir um modelo que represente a
relação entre as duas variáveis.
$
Correlação e regressão linear entre 2 variáveis :
EXEMPLOS DE CORRELAÇÃO ENTRE DUAS VARIÁVEIS
• A temperatura na cidade pode influenciar as taxas de criminalidade?
• Correlação entre a quantidade de acidentes de trabalho numa
construtora e o tempo de experiência do trabalhador!
• A Correlação entre a tensão na rede elétrica (volts) e a variação no
corte (mm);
• A correlação entre o nº. de horas de treinamento em ferramentas da
qualidade e o nº. de peças defeituosas produzidas por um trabalhador;
A correlação é uma técnica estatística que tem por objetivo investigar
se há ou não correlação linear entre duas ou mais variáveis;
Existe correlação entre duas variáveis quando uma delas está, de
alguma forma, relacionada com a outra;
Os dados analisados num teste de correlação são emparelhados e
aleatórios;
Para estudar o comportamento conjunto de duas variáveis X e Y,
serão apresentadas duas técnicas: o Diagrama de Dispersão e o
Coeficiente de Correlação de Pearson.
CORRELAÇÃO:
Consiste de um método gráfico que ajuda a avaliar se existe ou não
alguma associação (relação) entre as variáveis em estudo, mas não nos
fornece o valor numérico dessa relação.
OBJETIVO: Alguma correlação ou relação entre duas variáveis
significa: “qual alteração devemos esperar em uma das variáveis, como
consequência de alterações sofridas pela outra variável”;.
y
x
...... .
Não há correlação entre x e y
. .. .
.
..
. ..y
x
..Correlação não linear entre x e y
........
..... . ..... .
DIAGRAMA DE DISPERSÃO
INTERPRETAÇÃO DO DIAGRAMA DE DISPERSÃO:
y
x
... ......
.....
.
Correlação positiva entre x e y
y
x
... ......
........ . . .
.
.
Forte Correlação positiva entre x e y
y
xCorrelação positiva perfeita entre x e y
. ........
...
.
y
x
..
Correlação negativa entre x e y
. .. .. .. ...
y
x
..
Forte Correlação negativa entre x e y
.. .. ... . ...
..
.
y
xCorrelação negativa perfeita entre x e y
.. .......
.
...
.
INTERPRETAÇÃO DO DIAGRAMA DE DISPERSÃO:
Diagrama de Dispersão:
Gráfico 1- Diagrama de dispersão das notas de Estatística versus
Matemática
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Notas de Matemática
No
tas d
e E
sta
tísti
ca
Pode-se notar que as variáveis
Notas em Estatística e Notas
em Matemática estão
correlacionadas positivamente,
isto é, à medida que aumenta-
se a nota em Matemática,
aumenta-se também a nota em
Estatística.
36593291067Estatística (Y)
26784310956Matemática (X)
Exemplo 1: Suponha que dez alunos foram submetidos a um teste de
Estatística e de Matemática, obtendo-se as seguintes notas :
EXEMPLO DE DIAGRAMA DE DISPERSÃO
Exemplo 2: A tabela seguinte fornece o Peso (Kg) de alunos e a
respectiva Altura alcançada no teste de salto em altura (Cm).
515248545550Altura (Y)
494751464550Peso (X)
O gráfico indica que as
variáveis Peso e Altura obtida
no teste de salto em altura
encontram-se correlacionadas
negativamente, isto é, à
medida que o peso aumenta, o
valor obtido para o teste de
salto em altura diminui.
Gráfico 2- Diagrama de dispersão do peso versus resultado do teste de salto
em altura
47484950515253545556
44 46 48 50 52
Peso (Kg)
Alt
ura
(C
m)
Observações importantes e conclusões sobre diagramas:
As conclusões tiradas de diagramas de dispersão tendem a ser
subjetivas, o cálculo do coeficiente de correlação linear pode propiciar
uma melhor avaliação do tipo de relacionamento;
OUTLIER - observação extrema, que não é condizente com o
restante da massa de dados. Pode ser fruto de um registro incorreto.
Deve ser analisado detalhadamente e eliminado do conjunto;
A existência de uma correlação entre as variáveis consideradas não
implica necessariamente na existência de uma relação de causa-efeito
entre X e Y;
Construindo diagramas de dispersão no software Excel;
O coeficiente de correlação linear r mede o grau (intensidade)
da relacionamento (linear) entre as variáveis X e Y em uma
amostra;
Cálculo do coeficiente de correlação:
2222 )()()()(
))((
yynxxn
yxxynr
número de pares de dados analisados
soma de todos os valores de x e soma de todos os valores de y
elevar cada valor de x ao quadrado e somar os resultados
somamos os valores de x e elevamos o resultado ao quadrado;
multiplicamos cada valor x pelo valor correspondente de y e somamos
os produtos
xy
x
x
yx
n
2
2
,
COEFICIENTE DE CORRELAÇÃO
O valor de r está sempre entre –1 e 1;
r mede a intensidade, ou o grau de um relacionamento linear. Não
serve para medir a intensidade de um relacionamento não linear.
Se o valor de r estiver próximo de 0, concluímos que não há
correlação linear significativa entre x e y.
Se o valor de r estiver próximo de +1 ou –1, concluímos que há
correlação linear.
PROPRIEDADES DO COEFICIENTE DE CORRELAÇÃO
Os pesquisadores tem estudado os ursos,
anestesiando-os a fim de obterem medidas
vitais como idade, peso, comprimento e etc.
Como os usos são bastante pesados e difíceis
de serem levantados, os pesquisadores tem
dificuldade em pesar o urso na selva. Será
que é possível medirmos o peso de um urso a
partir do outras medidas mais fáceis?
53 67,5 72 72 73,5 68,5 73 3780 344 416 348 262 360 332 34peso (lbs)
Comprimento (in)Comprimento e pesos de ursos
Resolução:
2222 )()()()(
))((
yynxxn
yxxynr
número de pares de dados analisados
soma de todos os valores de x e soma de todos os valores de y
elevar cada valor de x ao quadrado e somar os resultados
somamos os valores de x e elevamos o resultado ao quadrado;
multiplicamos cada valor x pelo valor correspondente de y e somamos
os produtos
xy
x
x
yx
n
2
2
,
22 )176.2()520.728(8)5,516()75,525.34(8
)2176).(5,516()879.151(8
r
897,0184.093.175,9433
128.91r
Interpretação do coeficiente de correlação linear:
Se o valor de r estiver próximo
de 0, concluímos que não há
correlação linear significativa entre
x e y.
obs.: o valor de r deve estar sempre entre –1 e +1, inclusive.
Se o valor de r estiver
próximo de +1 ou –1,
concluímos que há correlação
linear.
Como r=0,897 (e está próximo de 1), dizemos que
existe correlação entre a altura do urso e o seu peso!
Interpretação do coeficiente de correlação linear:
Com os dados abaixo sobre crimes violentos e a temperatura média
entre 21 e 2 horas das noites de sábado de uma comunidade, avalie se
há correlação entre as variáveis.
Crimes violentos/1000 residentes
52,24,15,42,83
3,62,52
Temperatura ºC
221819242320212017
Regressão linear Simples
Proposição: A análise de regressão é uma técnica estatística que
tem por objetivo investigar e modelar o relacionamento entre duas
variáveis (regressão simples) ou mais variáveis (regressão
múltipla).
Iniciaremos estudando a relação entre duas variáveis (regressão
simples).
Objetivo: Descrever, utilizando dados amostrais, a relação entre
duas variáveis, quando verificamos que existe correlação linear
significativa entre elas:
• traçando seu gráfico e,
determinando a equação da reta que representa aquela
relação (reta de regressão).
Método dos Mínimos Quadrados
Definição: Dada uma coleção de dados amostrais emparelhados
(duas variáveis), a reta de regressão tem sua equação de
regressão dada por:
Esta definição expressa uma relação entre x (variável
independente ou preditora) e (variável dependente ou resposta).
baxy ˆ
yyy
A partir dos dados amostrais, não podemos achar os parâmetros
populacionais, mas estimá-los como a e b:
e 22
xxn
yxxyna
n
xayb
Exemplo 1: O diretor de vendas de uma rede de varejo nacional precisa
analisar a relação entre o investimento em propaganda e as vendas da
empresa. Os dados estão na tabela abaixo:
Variável explicativa(x) : Investimento em propagandas;Variável resposta (y) : Vendas da empresa.
Propagandas (X) 30 21 35 42 37 20 8 17 35 25
Vendas (Y) 430 335 520 490 470 210 195 270 400 480
Regressão Linear Simples
Na resolução de problemas de regressão o primeiro passo é traçar o diagrama de dispersão
correspondente.
Diagrama de Dispersão
0
100
200
300
400
500
600
0 10 20 30 40 50
Investimento em Propagandas
Ve
nd
as
da
Em
pre
sa
Regressão Linear Simples
O objetivo da regressão linear é colocar no diagrama de dispersão uma
linha que melhor se ajuste ou que melhor represente a relação entre as
duas variáveis.
Diagrama de Dispersão
0
100
200
300
400
500
600
0 10 20 30 40 50
Investimento em Propagandas
Ve
nd
as
da
Em
pre
sa
Regressão Linear Simples
Interpretação dos Parâmetros do Modelo de Regressão
• Obtida uma reta de regressão, o primeiro passo na sua interpretação é verificar o sinal de a. Se for positivo, indica que, quanto maior o valor de x, maior o valor de y; se for negativo, indica que quanto maior o valor de x, menor o valor de y.
• a é a inclinação da reta de regressão. Ele indica a mudança na média de y para cada aumento de uma unidade em x.
• b é o intercepto do modelo. Se o domínio do modelo inclui x=0, b fornece a média de y quando x=0. Caso contrário, b não possui interpretação.
• A reta de regressão para o Exemplo 1 é:
• a = 9,74 indica que para cada aumento de uma unidade no investimento em propagandas há um aumento de 9,74 unidades na média de vendas da empresa.
xy 74,907,117
Exemplo 2: Abaixo estão mostrados os comprimentos e os pesos de
oito ursos cinzentos:
Comprimento x (in.) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0 Peso y (lb) 80 344 416 348 262 360 332 34
Com base nestes dados, parece haver alguma relação entre o
comprimento de um urso e o seu peso? Em caso afirmativo, qual
é esta relação?
Regressão Linear Simples
Com os dados da tabela anterior, determine a equação de
regressão da reta que relaciona comprimentos e pesos dos ursos
dessa espécie.x y x . y x2 y2
53,0 80 4.240 2809,00 6.40067,5 344 23.220 4556,25 118.33672,0 416 29.952 5184,00 173.05672,0 348 25.056 5184,00 121.10473,5 262 19.257 5402,25 68.64468,5 306 24.660 4692,25 129.60073,0 332 24.236 5329,00 110.22437,0 34 1.258 1369,00 1.156
Total 516,5 2176 151.879 34.525,75 728.520
x y xy 2x 2y
Regressão Linear Simples
Regressão Linear
Definições:
Desvio total: distância vertical yy
Desvio explicado: distância vertical yy ˆ
Desvio não-explicado: distância vertical , também chamado de resíduoyy ˆ
y = valor observado
y = média dos valores observados
y = valor predito pela equação de regressão
Regressão Linear Simples:
140
220
300
380
460
540
0 9 18 27 36 45
Investimento
Ve
nd
as
a: Desvio Total: Valor Real – Média
a
c
c: Desvio Não Explicado: Valor Real – PreditoChamado RESÍDUO ou ERRO.
b
b: Desvio Explicado: Valor Predito – Média
Regressão Linear
Definições:Variação total: soma dos quadrados dos desvios totais
2)( yy Variação explicada: soma dos quadrados dos desvios explicados
2)ˆ( yy
2)ˆ( yy
Variação não-explicada: soma dos quadrados dos desvios não-explicados
Relações entre os desvios
(desvio total) = (desvio explicado) + (desvio não-explicado)
yy = yy ˆ + yy ˆ
(variação total) = (variação explicada) + (variação não-explicada)
De maneira análoga:
2)( yy = 2)ˆ( yy +2)ˆ( yy
Definição: Valor da variação de y que é explicado pela reta de regressão.
Coeficiente de Determinação
totalvariação
explicada variação2 r
2
22
)(
)ˆ(
yy
yyr
Obs. Podemos calcular r2 tanto pela definição acima, como simplesmente elevando ao quadrado o coeficiente de correlação linear r
r2 sempre assumirá valores entre 0 e 1
ou
Exemplo:
Coeficiente de Determinação
Diagrama de dispersão: média no 2o grau e índice na universidade - reta ajustada
80 82 84 86 88 90 92 94 96 98 1000.90
1.22
1.54
1.86
2.18
2.50
2.82
3.14
3.46
3.78
4.10
Y = -13.520 + (.180 * X)
Médias dos estudantes no 2o grau
Índ
ice
do
s e
stu
da
nte
s n
a u
niv
ers
ida
de
r2 = 0,92 = 0,81 Ou seja 81% da variação pode ser explicada pela reta
Erro padrão da estimativa
É uma medida das diferenças entre os valores observados e os valores preditos obtidos através da reta de regressão
2
)ˆ( 2
n
yyse 2
2
n
xyaybyse
ou
Intervalo de predição para um y individual
Dado um valor fixo x0, o intervalo de predição para um determinado y é:
EyyEy ˆˆ
22
20
2 )((
)(11
xxn
xxn
nstE e
Análise de Resíduos
Os resíduos são as diferenças entre os valores observados da variável dependente e os valores preditos da variável dependente, através do modelo de regressão, para um determinado valor da variável independente. Para tornar a análise mais confiável, sem que as grandezas dos resíduos venham a prejudicá-la recomenda-se padronizar os resíduos: calcula-se o desvio padrão dos resíduos e divide-se cada um deles pelo desvio padrão.Para fazer a análise de resíduos precisamos construir pelo menos dois diagramas de dispersão:- um que relacione os resíduos padronizados com os próprios valores preditos da variável independente;- outro que relacione os resíduos padronizados com os valores da variável independente
Análise de Resíduos
Se o modelo de regressão é adequado os resíduos padronizados não podem apresentar quaisquer padrões, eles devem distribuir-se de forma aleatória nos dois diagramas, atendendo os seguintes critérios:- a quantidade de resíduos padronizados positivos deve ser aproximadamente igual à quantidade de negativos.- a grandeza dos resíduos padronizados positivos deve ser aproximadamente igual a dos negativos, para todos os valores preditos da variável dependente, e para todos os valores da variável independente.- não pode haver padrões não aleatórios (tendências crescentes ou decrescentes, curvas, etc.) em nenhum dos diagramas.
Somente se todas estas condições forem satisfeitas é que podemos considerar o modelo de regressão apropriado. Se houver dois ou mais modelos apropriados escolhemos o mais simples, ou aquele que apresentar o mais alto coeficiente de determinação. Os diagramas deveriam ser como a figura abaixo:
Análise de Resíduos
Resíduos padronizados
Valorespreditosou X
0.700 1.050 1.400 1.750 2.100 2.450 2.800 3.150 3.500 3.850-3.0
-2.4
-1.8
-1.2
-0.6
0.0
0.6
1.2
1.8
2.4
Resíduos de Índice (Y)
Valores preditos
Re
síd
uo
s P
ad
ron
iza
do
s
Análise de Resíduos
Exemplo:
Resíduos padronizados: média no 2o grau e índice na universidade
Questão: as variáveis são relacionadas? Não coeficiente angular = 0. Sim coeficiente angular 0. Teste de hipóteses: H0: = 0 H1: 0 Como o desvio padrão da população é desconhecido, usamos “t”
de Student,com (n-2) graus de liberdade.
sb desvio padrão da distribuição amostral do coeficiente angular.
Teste de hipóteses para o Coeficiente Angular
tb
s
b
sb b
(
~valor amostral) - (valor esperado)
desvio padrao
0
nxxss eb /)(
1.
22
bstb .t.s-b
t.sb : para confiança de intervalo
b
b
Questão: as variáveis são relacionadas? Não coeficiente de correlação = 0. Sim coeficiente de correlação 0. H0: = 0 H1: 0 ou > 0 ou < 0. O teste é feito com “t” de Student:
Intervalo de confiança para o coeficiente de correlação:
Teste de hipóteses para o Coeficiente de Correlação
( ) .t rn
rn calc
2 2
2
1t t
tcrit n
n
. ;
; /
2
2 2
para < 0 ou > 0
t para 0crit.
3r1
r1ln
2
1tanh
3r1
r1ln
2
1tanh 2/2/
n
Z
n
Z
Exercícios: Folha 3
Slide 149
5ª Parte:
– Regressão Linear Múltipla
– Séries Temporais
Slide 150
Para y = b1x1 + b2x2
Onde está a reta de regressão ?
Regressão Linear Múltipla:
Os cálculos necessários à regressão múltipla são complexos e envolvem a resolução de sistemas lineares ou matrizes
Basicamente os softwares apresentam 3 componentes para a regressão múltipla:– A Equação de Regressão;– R2 Ajustado e– Significância Global da Equação.
CONCEITOS E DEFINIÇÕES
Equação de Regressão MúltiplaEquação de Regressão Múltipla: expressa um
relacionamento linear entre uma variável
dependente Y e duas ou mais variáveis
independentes (x1, x2, x3, ..., xk).
Modelo MatemáticoModelo Matemático:
Y = b0 + b1x1 + b2x2 + ... + bkxk
Valor Predito de Y
K = número de variáveis independentes
Intecepto
Xi= variáveis independentes
bi= Coeficientes
CONCEITOS E DEFINIÇÕES
Coeficiente de Determinação Múltipla (RCoeficiente de Determinação Múltipla (R22):): é a medida de ajustamento da equação de regressão múltipla aos dados amostrais.
Limitação de RLimitação de R22: : na medida em que se incluem novas variáveis R2 aumenta, ou seja, a simples inclusão de todas as variáveis disponíveis levará R2 para próximo de 1. Entretanto a melhor equação nem sempre inclue todas as variáveis.
Como contornar este Como contornar este problema ?problema ?
CONCEITOS E DEFINIÇÕES
Coeficiente de Determinação AjustadoCoeficiente de Determinação Ajustado: é o coeficiente de determinação R2 modificado de modo a levar em conta o número de variáveis e o tamanho da amostra. É o melhor número para comparar diferentes equações.
Modelo MatemáticoModelo Matemático:R2 Ajustado= 1 - (n –1 ) (1 – R2)
[n – (k+1)]
Número de dados Número de Variáveis Independentes
CONCEITOS E DEFINIÇÕES
Significância Global: O valor PSignificância Global: O valor P.– Os Softwares, via de regra, apresentam o valor P,
que é uma medida da significância global da equação de regressão.
– Assim como R2, P é uma medida da aderência da equação aos dados amostrais.
– Quanto menor o valor de P, melhor a aderência da equação, ou seja, melhor o modelo.
P indica a probabilidade de se estar rejeitando H0 de forma indevida.
CONCEITOS E DEFINIÇÕES
Já calculamos o coeficiente de correlação entre a altura do urso e seu peso (r = 0.897), daí r2=0.8046.
O que fazer para melhorar O que fazer para melhorar a estimativa do peso, sem a estimativa do peso, sem o uso de uma balança ?o uso de uma balança ?
NOSSO AMIGO URSO
Os biólogos resolveram testar mais variáveis, além da altura. Foram escolhidas as seguintes variáveis:– Altura (já avaliada) [ H ]– Tórax [ T ]– Comprimento da Cabeça [ CC ]– Largura da Cabeça [ LC ]– Idade [ I ]– Diâmetro do Pescoço [ DP ]
Utilizando-se um Software apropriado, foram obtidos os dados a seguir:
NOSSO AMIGO URSO
Como variável única, Tórax é melhor que a altura para predizer o peso dos ursos.
Quanto mais variáveis consideradas, maior o valor de R2
A melhor equação de regressão é definida por I, DP, H e T, porque:– Maior R2;– Menor P;– Além de ser mais simples.
Variáveis > H T CC e H I e DP e H e T I e CC e LC e DP e H e TR2 0,805 0,983 0,828 0,999 0,999
R2 Ajustado 0,773 0,980 0,759 0,997 0,996Significância Global0,002 0,000 0,012 0,000 0,046
NOSSO AMIGO URSO
Sabe-se que o nível de resistência de um aço é correlacionado com seu teor de Carbono, conforme demonstrado no diagrama de dispersão.
82,8% da variação da resistência é explicada pela equação de regressão.
y = 1170x + 315,3R2 = 0,8285
340
350
360
370
380
390
400
410
420
0,000 0,020 0,040 0,060 0,080 0,100
Teor de C (%)
Re
sis
tên
cia
(M
Pa)
O que pode O que pode ser feito para ser feito para melhorar a melhorar a estimativa estimativa da da Resistência ?Resistência ?
UM CASO PRÁTICO
O conhecimento técnico determina que o Manganês tem efeito semelhante ao Carbono.
Os mesmos dados foram submetidos a regressão múltipla tendo C como X1 e Mn como X2.
O “O “poder de poder de explicaçãoexplicação” ” da regressão da regressão subiu de subiu de 82,8% para 82,8% para 96,2%.96,2%.
y = 1188,9x + 268,59R2 = 0,9624
340
350
360
370
380
390
400
410
420
0,00 0,05 0,10 0,15
C+Mn/6
Re
sis
tên
cia
(MP
a)
UM CASO PRÁTICO
A partir deste conhecimento, o projetista vai poder determinar qual a combinação necessária entre C e Mn, que reflita em menor custo, mas que atenda às exigências mínimas de Resistência, com maior nível de precisão.
UM CASO PRÁTICO
1. Use o bom senso e considerações de ordem prática para incluir ou excluir variáveis.
2. Inclua um número relativamente pequeno de variáveis independentes (x).
3. Escolha uma equação em que a inclusão de uma nova variável provoque pequeno incremento em R2.
4. Para um mesmo número de variáveis independentes (x) escolha aquela que tenha o R2 maior.
5. Escolha a equação cujo valor de Significância Global (P) seja o menor.
ESCOLHA DE VARIÁVEIS
Série temporal: conjunto de observações ordenadas no tempo.Exemplos:
a.Consumo mensal de energia em uma residência
b.Preço semanal de um produto
c.Valor anual de um índice de produção industrial
Idéia básica: observações passadas da série contêm informações sobre o seu padrão de comportamento futuro.
CONCEITO
Séries Temporais:
Definição: tipo mais simples de série temporal, em que os
valores da série flutuam aleatoriamente em torno de um
valor fixo (nível da série), sem apresentar qualquer
tendência. Vendas das Fábricas da GM (em milhões de unidades)
4
5
6
7
8
9
10
Ano
SÉRIES GLOBALMENTE CONSTANTES
Suavização Exponencial
Forma de modelar a série temporal
Supõe que a série é constante
Cada valor é uma média ponderada dos valores
anteriores da série
Pesos decaem à medida que o tempo de observação
fica mais distante do presente
SÉRIES GLOBALMENTE CONSTANTES
Vendas Líquidas da Xerox Corp. (em bilhões de dólares)
0
2
4
6
8
10
12
14
16
18
20
Ano
Rec
eita
A série é composta por dois fatores: o nível (como na
série globalmente constante) e a tendência.
SÉRIES COM TENDÊNCIA LINEAR
SÉRIES COM TENDÊNCIA LINEAR
MÉTODOS PARA ISOLAR A TENDÊNCIA: TREND ANALYSIS:
É o melhor processo. A tendência dos dados é dada pela curva de regressão.
MOVING AVERAGE: "Este processo, que objetiva suavizar as variações na variável estudada
tem a grande vantagem de não exigir a determinação de nenhuma curva a qual a tendência deva se adaptar.
Limitação: é quase impossível remover completamente variações cíclicas e irregulares.
Ideal: médias com períodos de tempo longo.
Problema: quanto mais dados, menos sensível a média se torna a observações recentes (às vezes é necessário ponderação)
Além do nível e da tendência, algumas séries possuem um
fator sazonal. Este fator capta características da série que
se repetem a intervalos regulares de tempo.
Exemplo: A venda de um artigo em uma loja é função não
somente da venda no mês anterior e de uma expectativa
de aumento ou decréscimo (tendência da procura), mas
também da venda desse produto na mesma época, em
anos anteriores.
SÉRIES SAZONAIS
Tipos de Efeito Sazonal
1. Efeito aditivo: a amplitude do fator sazonal independe do nível
local da série.
SÉRIES SAZONAIS
2. Efeito Multiplicativo: a amplitude do fator sazonal varia
proporcionalmente ao nível da série.
Tipos de Efeito Sazonal
SÉRIES SAZONAIS
Exercícios: Folha 4
Slide 174