226
ESTASTÍTICA INFERENCIAL 5º Semestre LUAN GUERRA CADERNOS PPT

Estastítica Inferencial

Embed Size (px)

DESCRIPTION

Estastítica Inferencial - 5º semestre - Caderno Completo

Citation preview

ESTASTÍTICA

INFERENCIAL 5º Semestre

LUAN GUERRA

CADERNOS PPT

FACEBOOK

Não curtir? Por quê?

SUGESTÕES

[email protected]

AVISO

Esse material foi criado a partir do caderno de um aluno do curso de administração.

Sendo assim, não substituirá nenhuma fonte didática como: livros, artigos científicos, etc.

Observação:

O objetivo dessa apresentação é simplesmente ajudar o estudante, nada além disso.

CONCEITO

POPULAÇÃO

População é conjunto de elementos sobre

os quais queremos informações.

Ex.: Paulistanos, veículos, cães

abandonados, produtos para vender.

AMOSTRA

Uma parte do conjunto (sub-conjunto) da

população.

Ex.: Moradores da Paulista, raça de cães,

final de placa.

AMOSTRAGEM QUANDO USAR?

Exemplos:

Economia

Confiabilidade

Radipez de processamento

Teste destrutivo

MÉTODOS DE AMOSTRAGENS TIPOS

AMOSTRAGEM CONVENIÊNCIA

Os entrevistados são escolhidos por conveniência:

– Menos Confiável

– Baixo Custo

– Boa para obter idéias sobre determinação assunto

– Boa como pesquisa exploratória

EXEMPLO

Grupo de estudantes, de igrejas, membros de organização sociais, lojas de departamentos questionários destacáveis em revistas, entrevistas com “pessoas na rua”.

AMOSTRAGEM JULGAMENTO

São selecionados com base no julgamento do pesquisador, que usando sua experiência, escolhe os elementos a serem incluídos na amostra.

EXEMPLOS

Amostragem por julgamento: Testes de mercado para avaliar o potencial de um novo produto, seleção de distritos eleitorais representativos para uma pesquisa de voto.

AMOSTRAGEM QUOTAS

1º - Classificação da população em termos de propriedades;

2º - Determinação da ´proporção da população para cada característica;

3º - Fixação de quotas para cada entrevistador;

EXEMPLO

Amostragem por quota: Pesquisa sobre o "trabalho das mulheres na atualidade“. Descobrem-se as proporções (%) dessas características na população, como 47% de homens e 53% de mulheres.

Quando n = 50 pessoas, tem-se 23 homens e 27 mulheres. Então o pesquisador receberá uma "quota" para entrevistar 27 mulheres.

AMOSTRAGEM ALEATÓRIA SIMPLES

É o processo de

retirada dos elementos

de uma população no

qual cada unidade tem

a mesma oportunidade

de integrar a amostra.

SORTEIO NÃO VICIADO

AMOSTRA

USO DE TABELAS DE

NÚMEROS ALEATÓRIOS

EXEMPLO - AMOSTRAGEM

ALEATÓRIA SIMPLES

Empresa deseja selecionar amostra de 20 trabalhadores de horário integral a partir da população de 500 colaboradores nessa situação.

Associar um código de 3 dígitos a cada colaborador, ordenados por ordem alfabética, de 001 a 500.

Escolher, ao acaso, um dígito de partida na Tabela de Números Aleatórios

Indo da esquerda para a direita, e de cima para baixo, na tabela, selecionar 20 números com 3 dígitos entre 001 e 500, sem pular ou repetir, identificando assim a amostra.

EXEMPLO - AMOSTRAGEM ALEATÓRIA SIMPLES

AMOSTRAGEM SISTEMÁTICA

• Decidir tamanho de amostra N

• Calcular

• Selecionar 1. Item aleatoriamente

• Selecionar os demais itens a partir desse inicial

AMOSTRAGEM ESTRAFICADA PROPORCIONAL

• A população é dividido em 2 ou mais

grupos.

• Aplica-se, em cada grupo, a amostragem

aleatória simples.

AMOSTRAGEM CONGLOMERADO (CLUSTERS)

• População é composta de vários

CLUSTERS representativos.

• Aplica-se AAS nos CLUSTERS

• Combinam-se as amostras em um única

VARIÁVEL DEFINIÇÃO

As variáveis qualitativas pode ser ordinal (possui ordem natural) ou nominal (não possui ordem natural).

As variáveis quantitativas pode ser discreta (assume valores exatos) ou contrários (assume valores aproximados).

Exemplo: População de cães abandonados.

VARIÁVEL

É a característica que queremos estudar.

As variáveis podem ser:

Qualitativa

Os valores são qualidades ou atributos.

Quantitativas

Os valores são quantidade.

EXEMPLOS

Variáveis Qualitativas:

Ordinal – Porte, size

Nominal – raça, cor

Variáveis Quantitativas:

Discreta – Nº de Dentes INTERVALOS ESPECÍFICOS

Contínua – Peso, altura

VARIAÇÕES

Quantitativa Contínua

Quantitativa Discreta

Qualitativa Ordinal

Qualitativa Nominal

CLASSIFICAÇÃO EXERCÍCIO

Moradores de uma cidade

Camisetas à venda em uma loja

V. Quant. Discreta: Preço

V. Qual. Nominal: Marca, cor

V. Qual. Ordinal: Tamanho

Alunos desta sala

DISTRIBUIÇÃO DE PROBABILIDADE

CARACTERÍSTICA DA

DISTRIBUIÇÃO NORMAL

• Formato de sino

• Simétrica

• Média, Mediana e Moda iguais.

• A posição é dada pela média, μ.

• A dispersão é dada pela desvio padrão, σ.

• A área total sob a curva é igual a 1

• Do ponto de vista teórico, a distribuição possui amplitude de -∞ à +∞.

ÁREA = 1

FUNÇÃO DENSIDADE DE

PROBABILIDADE NORMAL

EXEMPLO

• Qual é a maior média?

EXEMPLO

• Qual a curva normal tem desvio padrão maior?

σ =15

σ =25

DISTRIBUIÇÃO NORMAL

MODELOS DE DISTRIBUIÇÃO CONTÍNUAS

É a distribuição normal Z , que tem média.

O e desvio-padrão 1.

Qualquer distribuição normal x com média

μ e desvio-padrão o pode ser transformado

em Z através de mudança de variável.

EXEMPLOS

Distribuição Normal

Quanto menor o formato do “sino” maior será a aproximação dos dados

avaliados.

FÓRMULA DISTRIBUIÇÃO NORMAL PADRÃO

EXEMPLO

• Calcule a probabilidade do valor Z

correspondente à variável aleatória normal

estar entre 0,00 e 1,00, ou seja, P(0,00 < Z <

1,00).

• Esboce o gráfico.

RESOLUÇÃO

Olhar a TABELA de Distribuição Normal Padrão:

P(0 < Z < 1) = 0,3413

ou

34,13%

ENCONTRANDO

EXERCÍCIO

• X representa o tempo (em segundos) para

fazer o download de uma imagem da

internet. Supondo que X é normal com

média 8,0 e desvio-padrão 5,0.

• Encontre P(x < 8,6)

RESOLUÇÃO

TABELA

RESOLUÇÃO

P = 0,50 + 0,0478 = 0,5478

EXERCÍCIO

• X representa o tempo levado (em

segundos) para fazer o download de uma

imagem da internet.

Supondo que X é normal com média 8,0 e

desvio-padrão 5,0.

• Encontre P(X > 8,6).

RESOLUÇÃO

P(x > 8,6) = P(Z >0,12) = 1 – P(Z < 0,12)

P(x > 8,6) = P(Z >0,12) = 1 – 0,5478 = 0,4522

0,5478

EXERCÍCIO

Supondo x normal com média 8,0 e desvio

padrão 5,0. Encontre P(8,0 < x < 8,6).

RESOLUÇÃO

TABELA

RESOLUÇÃO

P(8,0 < x < 8,6) = 0,0478

4,78%

EXERCÍCIO

Calcular P(Z < 0,32).

TABELA

RESOLUÇÃO

P = 0,50 + 0,1255 = 0,6255

62,55%

EXERCÍCIO

Calcular P(0 < Z < 1,71).

TABELA

RESOLUÇÃO

P(0 < x < 1,71) = 0,4564

45,64%

EXERCÍCIO

Calcular P(1,32 < Z < 1,79).

TABELA

RESOLUÇÃO

P(1,32 < Z < 1,79)

P(Z = 1,79) – P(Z = 1,32)

P = 0,4633 – 0,4066

P = 0,0567

5,67%

EXERCÍCIO

Calcular P( Z < - 1,3).

SIMETRIA

TABELA

RESOLUÇÃO

P( Z < -1,3)

P(Z > 1,3)

P = 0,5 – 0,4032

P = 0,0968

9,68%

0,5 0,4032

EXERCÍCIO

O tempo gasto no exame vestibular de uma

universidade tem distribuição Normal, com

média 120 min. e desvio padrão 15 min.

a) Sorteando um aluno ao acaso, qual é a

probabilidade que ele termine o exame antes de

100 min.

Considere X com o tempo gasto no exame

vestibular.

TRANSFORMANDO

RESOLUÇÃO

TRANSFORMANDO

SIMETRIA

TABELA

RESOLUÇÃO

P( Z < -1,33)

P(Z > 1,33)

P = 0,5 – 0,4082

P = 0,0918

9,18%

0,5 0,4082

CONTINUAÇÃO

O tempo gasto no exame vestibular de uma universidade tem distribuição Normal, com média 120 min. e desvio padrão 15 min.

b) Qual deve ser o tempo de prova de modo a permitir que 95% dos vestibulandos terminem no prazo estipulado?

ÁREA

TABELA Encontre o valor mais aproximado

de 0,45.

Esse valor corresponderá 95%.

RESOLUÇÃO

CONTINUAÇÃO

O tempo gasto no exame vestibular de

uma universidade tem distribuição Normal,

com média 120 min. e desvio padrão 15

min.

c) Qual é o intervalo central de tempo, tal

que 90% dos estudantes gastam para

completar o exame?

ESTIMAÇÃO POR PONTOEXEMPLO

Usando os dados da EAI, calculamos a

média e o desvio padrão correspondentes

aos dados de salário anual.

ESTIMAÇÃO POR PONTOEXEMPLO

• 1500 dos 2500 gerentes concluíram o programa de treinamento. Se admitirmos que p denota a proporção da população que concluiu o programa de treinamento, temos:

• O salário médio anual da população ( =$51800), o desvio padrão ( =$4000) e a proporção da população que concluiu o treinamento (p=0,60) são parâmetros característicos da população de gerentes da EAI.

EXEMPLO II

• Suponha que as informações necessárias sobre todos os gerentes do

EAI não estivessem prontamente disponíveis no banco de dados da

empresa. Como o diretor de pessoal da empresa pode obter

estimativas dos parâmetros populacionais usando uma amostra de

gerentes em vez de todos os 2500 gerentes da população?

• Para selecionar uma AAS:

– 1º. Atribuir números de 1 a 2500 aos gerentes

– 2º. Consultar tabela de números aleatórios ou usar programa para obter

número aleatório (EXCEL, etc.)

– 3º. Repetir o cálculo da média, desvio padrão e da proporção para

amostra.

EXEMPLO II

• Resumo das estimações por ponto obtidas

de uma amostra aleatória simples de 30

gerentes da EAI

EXERCÍCIO III

Os dados a seguir são de uma amostra

aleatória simples:

5 8 10 7 10 14

• Qual é a estimação por ponto da

média da população?

EXERCÍCIO III

• b) Qual é a estimação por ponto do desvio

padrão da população?

EXERCÍCIO

Uma AAS dos dados de cinco meses de venda forneceu a seguinte informações:

a) Desenvolva uma estimação por ponto do número médio de unidades da população vendidas por mês.

b) Desenvolva a estimação por ponto do desvio padrão da população?

A

CALCULANDO NA HP12C

F FIN

94∑+

100∑+

85∑+

94∑+

92∑+

g 0 ( x ) = 93

CALCULANDO NA HP12C

F FIN

Nº ∑+

Nº ∑+

Nº ∑+

Nº ∑+

Nº ∑+

g 0 ( x ) = Média

B

CALCULANDO NA HP12C

F FIN

Nº ∑+

Nº ∑+

Nº ∑+

Nº ∑+

Nº ∑+

g 0 ( x ) = Média

g ∑+ ( ∑- ) = Desvio Padrão

CALCULANDO NA HP12C

F FIN

94 ∑+

100 ∑+

85 ∑+

94 ∑+

92 ∑+

g 0 ( x ) = 93

g ∑+ ( ∑- ) = 5,38

Anote o valor do DESVIO PADRÃO, pois a calculadora exibirá por alguns segundos.

EXERCÍCIO

Uma pergunta de uma pesquisa realizada com uma amostra de 150 indivíduos produziu 75 respostas “sim”, 55 respostas “não” e 20 respostas “sem opinião”.

a) Qual é a estimação por ponto da proporção da população que respondeu Sim?

b) Qual é a estimação por ponto da proporção da população que respondeu Não?

RESOLUÇÃO

DADOS:

150 – Total

75 – Sim

55 – Não

20 – Sem Opinião

RESOLUÇÃO

PROBABILIDADE

A) p = 75/150 = 0,50 = 50%

B) p = 55/150 = 0,3667 = 36,7%

HISTOGRAMA

AMOSTRAL

EXEMPLIFICAÇÃO

Distribuição da frequência de x em 500

ASS de 30 gerentes da EAI:

Histograma da frequência relativa dos valores

de x em 500 ASS com tamanho 30 cada uma.

Histograma da frequência relativa dos valores

de p em 500 ASS com tamanho 30 cada uma.

DISTRIBUIÇÃO AMOSTRAIS PROPRIEDADES

O valor esperado para a média das amostras é igual média das população

μx = μ

μx = Valor esperado para a média da amostra

μ = Média da População

Quando o valor esperado de um estimador por ponto for igual ao parâmetro populacional, dizemos que o estimador do ponto é sem viés

DESVIO PADRÃO DAS MÉDIAS

DAS AMOSTRAS

Use a seguinte expressão para calcular DESVIO PADRÃO das médias das amostras:

Sempre que:

– A população for infinita (não consigo “mensurar”)

– A população for finita e o tamanho da amostra for MENOR ou IGUAL a 5% do tamanho da população, ou seja, n/N = 0,05

MAIOR QUE 5%

Caso não o problema utilize premissas diferentes

destas:

– A população for infinita

– A população for tinta e o tama:nho da amostra for ou

igual a 5% do tamanho da população, ou seja, n/N = 0,05

Utilize a fórmula abaixo:

EXEMPLIFICAÇÃO

O desvio padrão dos salários anuais da

população de 2500 gerentes da EAI é 4.000. A

população é finita, com n = 2500. O tamanho da

amostra, 30, é menor que 5% do tamanho da

população, logo podemos ignorar o fator de

correção para populações finitas e usar:

EXEMPLIFICAÇÃO

Como o resultado é finito e o tamanho da amostra é MENOR que 5%.

População = 2500

Amostra = 30

A partir do resultado dos dados acima, optaremos por essa fórmula:

Dados: 30/2500 = 0,012

EXEMPLIFICAÇÃO

1500 dos 2500 gerentes concluíram o

programa de treinamento. Admitindo que

p denota a proporção da população que

concluiu o programa de treinamento. Qual

o valor esperado de P?

EXEMPLIFICAÇÃO ERRO PADRÃO DA PROPORÇÃO AMOSTRAL

A proporção da população de 2500 gerentes que

participaram do programa de treinamento gerencial é P =

0,60.

Dada uma amostra com tamanho 30, qual o erro padrão da

proporção P ?

O tamanho da amostra, 30, é menor que 5% do tamanho

da população, logo podemos ignorar o fator de correção

para populações finitas e usar.

EXERCÍCIO

Você escreve os valores da população [1, 3, 5, 7] em pedaços de papel e os coloca em uma caixa.

Você seleciona dois papéis aleatoriamente, com substituições.

a) Liste todas as amostras possíveis de tamanho n = 2 e calcule a média de cada.

b) Represente essas médias que formam a distribuição amostra de média das amostras em um histograma.

c) Encontre a média e o desvio padrão da média das amostras. Compare seus resultados com a média μ=4 e desvio padrão 2,236 da população.

A

B

C

C

C

C

Desvio Padrão:

–1,5811

–2,236

Podemos afirmar que são compatíveis.

C

0,56

LIMITE CENTRAL

TEOREMA

EXEMPLIFICAÇÃO

EXEMPLIFICAÇÃO

TABELA

EXEMPLIFICAÇÃO

EXERCÍCIO

Em certa semana o preço médio da gasolina na

Califórnia foi de US$ 1,164 por galão. Qual é a

probabilidade de que o preço médio em uma

amostra de 38 postos esteja entre US$ 1,169 e

US$ 1,179?

Admita que o desvio padrão seja de US$ 0,049.

RESOLUÇÃO

Z1

Z2

TABELA Z1

TABELA Z2

RESULTADO

P(Z1 < Z < Z2)

P(0,63 < Z < 1,9)

P(Z = 1,9) – P(Z = 0,63)

P = 0,4713 – 0,2357

P = 0,2356

EXEMPLO

O presidente da Doerman Distributors acredita

que 30% das encomendas feitas à firma são

provenientes de clientes que compram pela

primeira vez. Uma AAS de 100 pedidos será

usada para estimar a proporção de clientes que

compram pela primeira vez. Supondo que o

presidente esteja correto e p=30.

Qual é o erro padrão de p ?

EXEMPLO

BINOMIAL PROPRIEDADES

• O experimento consiste em uma sequência de n ensaios idênticos

• Dois resultados são possíveis em cada ensaio. Referimo-nos a um como um sucesso e ao outro como um fracasso.

• A probabilidade de um sucesso, p, não se modifica de ensaio para ensaio. A probabilidade de um fracasso (1-p), não se modifica de ensaio para ensaio.

• Os ensaios são independentes.

EXEMPLIFICAÇÃO

Um produto manufaturado pode ser

classificado em perfeito ou defeituoso; a

resposta de um questionário pode ser

verdadeira ou falsa; as chamadas

telefônicas podem ser locais ou

interurbanas.

EXEMPLIFICAÇÃO

Qual é a probabilidade de termos 3 caras

quando uma moeda honesta for lançada 4

vezes?

Distribuição de Probabilidades de Caras no

Lançamento simultâneo de 4 Moedas

honestas.

EXEMPLIFICAÇÃO RESOLUÇÃO

BINOMIAL GRÁFICO

TABELA

CONDIÇÃO

Média = μ = np

EXEMPLIFICAÇÃO DISTRIBUIÇÃO BINOMIAL

Decida se você pode usar a distribuição normal para aproximar x, o número de pessoas que responderam sim.

a) Para 51% dos adultos nos EUA, a promessa final de ano mais importante foi a de se exercitar mais. Você seleciona aleatoriamente 65 adultos deste grupo e lhes pergunta se a promessa foi cumprida.

Neste experimento binomial, n=65, p=0,51 e q=0,49

RESOLUÇÃO

EXERCÍCIO

Decida se você pode usar a distribuição normal para aproximar x, o número de pessoas que responderam sim.

b) 15% dos adultos nos EUA não fazem promessa de final de ano. Você seleciona aleatoriamente 15 adultos deste grupo e lhes pergunta se fizeram promessa de final de ano.

RESOLUÇÃO

TESTANDO A CONDIÇÃO

NÃO PODE APROXIMAR

BINOMIAIS DISTRIBUIÇÃO

Suponha que o diretor da empresa EAI

queira saber qual a distribuição

AMOSTRAL de P que pode ser

aproximada da pela distribuição normal.

CORREÇÃO DE CONTINUIDADE

Para calcular probabilidades binomiais exatas, pode-se usar a fórmula binomial para cada valor de x e adicionar os resultados.

Geometricamente, isso corresponde a adicionar as áreas das barras no histograma da probabilidade.

Cada barra tem largura de uma unidade e x é o ponto médio do intervalo

CORREÇÃO DO ERRO

P(c-0,5 < x < c 0,5)

P (x = c)

CORREÇÃO DE CONTINUIDADE

Quando utilizarmos uma distribuição

normal contínua pata aproximar uma

probabilidade binomial, movemos uma

unidade 0,5 para a esquerda e direita do

centro para incluir todos os valores

possíveis de x do intervalo. Isto chama-se

CORREÇÃO PELA CONTINUIDADE.

DEMONSTRAÇÃO

BINOMIAL

DISTRIBUIÇÃO

NORMAL

EXEMPLIFICAÇÃO

Encontre a probabilidade de se obter entre 3 e 6 caras, inclusive, em 10 lançamentos de uma moeda honesta, usando (a) a distribuição binomial e (b) a aproximação normal para distribuição binomial.

– (a) a distribuição binomial

– X = caras que apareceram em 10 lançamentos

– n = tentativas = 10 lançamentos

– p = probabilidade de sucesso = 0,50

– Q = probabilidade de fracasso = 0,50

FÓRMULAS

RESOLUÇÃO

RESOLUÇÃO

• (b) a aproximação normal para

distribuição binomial.

Tratando os dados como contínuos, segue

que 3 a 6 caras podem ser consideradas

como 2,5 a 6,5 caras.

RESOLUÇÃO

GRÁFICO

ESTIMATIVA INTERVALAR

A estimativa pontual obtida é igual a 12,4

e a margem de erro 2,1. Qual a estimativa

intervalar?

Represente na reta numérica. Interprete o

resultado.

NÍVEL DE CONFIANÇA

O nível de confiança c é a probabilidade

de que o intervalo estimado contenha o

parâmetro populacional.

Pelo teorema do limite central, n>30, a

distribuição de amostragem das médias

amostrais é uma distribuição normal.

INTERPRETAÇÃO

INTERPRETAÇÃO:

A média populacional está no intervalo 10,3<μ<14,5

EXERCÍCIO

Se c = 90% então 5% da área está à

esquerda de -zc = 1,645 e 5% está à

direita de zc= 1,645.

INTERPRETAÇÃO

Os valores críticos são valores que separam amostras estatísticas que são prováveis das que são improváveis ou incomuns.

RESOLUÇÃO

Encontre o valor mais próximo de 45%.

RESOLUÇÃO

Encontre o valor mais próximo de 45%.

RESULTADO

Zc = 1,645

MARGEM DE ERRO

Também chamada de erro máximo da estimativa ou tolerância é a maior distância possível entre o ponto de estimativa e o valor do parâmetro que está estimado.

Se n>30 o desvio padrão da amostra s pode ser usado no lugar de σ.

EXERCÍCIO

Pesquisadores de mercado usam o número de frases por anúncio como medida de legibilidade de anúncios de revistas. Tomando uma amostra aleatória do número de frases encontrados em 50 anúncios. Para o nível de confiança de 95%, encontre a margem de erro para a média do número de frases em todos os anúncios de revistas. Interprete o resultado.

EXERCÍCIO

EXERCÍCIO

EXERCÍCIO

EXERCÍCIO

Com 95% de confiança, você

pode dizer que a média

populacional do número de

frases está entre 11,0 e 13,8.

EXERCÍCIO

Considere o intervalo de confiança de 90% construído no exemplo anterior.

Se um número grande amostras for coletado e o intervalo de confiança for criado para cada amostra, ~90% desses intervalos conterão μ.

TAMANHO DA AMOSTRA

Para a mesma amostra estatística, conforme o nível de confiança aumenta, o intervalo de confiança fica mais largo. Conforme o intervalo de confiança fica mais largo, a precisão da estimativa decresce o nível de confiança é aumentar o tamanho da amostra.

Mas, qual tamanho de amostra é necessário para garantir certo nível de confiança para uma margem de erro dada?

TAMANHO DA AMOSTRA

Dado o nível de confiança c e uma margem de erro E, do tamanho mínimo da amostra n necessário para estimar a média populacional μ é:

Se for desconhecido, você estimá-lo usando s, dado que você tenha uma amostra preliminar com pelo menos 30 elementos.

EXERCÍCIO

CONSIDERE O ÚLTIMO EXERCÍCIO

REALIZADO.

Quantos anúncios de revista devem ser

incluídos na amostra se você quer estar

95% confiante de que a média amostral

esteja dentro de uma frase da média

populacional?

EXEMPLO

INTERPRETAÇÃO

Quando necessário, arredonde (para cima) para obter um

número inteiro 97 é o número mínimo de anúncios de revista

para serem incluídos na amostra.

MENCIONA NO EXERCÍCIO

DISTRIBUIÇÃO t

Nas situações reais o desvio padrão da população é desconhecido. Limitações, como tempo e custo, impedem a coleta de amostras com o tamanho 30 ou mais. Emprega-se nesta caso, a distribuição t.

DEFINIÇÃO

Se n<30 e a distribuição de uma variável aleatório x for aproximadamente normal, então a distribuição t é:

DISTRIBUIÇÃO t

• É uma família de curvas determinada pelos graus de liberdade (g.I).

As caudas na distribuição t são “mais grossas” do que aquelas na distribuição normal padrão.

• Depois de 30 g.I., a distribuição t está muito próxima à distribuição normal padrão z.

DISTRIBUIÇÃO t

EXEMPLO DISTRIBUIÇÃO t

Encontre o valor crítico tc para uma

confiança de 95% quando o tamanho da

amostra é 15.

EXEMPLO DISTRIBUIÇÃO t

EXEMPLO DISTRIBUIÇÃO t

Pela tabela, tc = 2,145. No gráfico temos a

distribuição t para 14 graus de liberdade,

c = 0,95 e tc = 2,145

EXEMPLO DISTRIBUIÇÃO t

INTERPRETAÇÃO:

95% da área sob a

curva da distribuição t

com 14 graus de

liberdade está entre

t= + 2,145.

EXEMPLO DISTRIBUIÇÃO t

Encontre o valor crítico tc para uma

confiança de 90% quando o tamanho da

amostra é 22.

a) Identifique os graus de liberdade

b) Identifique o nível de confiança c

c) Use a tabela para encontra tc

EXEMPLO DISTRIBUIÇÃO t

a) Identifique os graus de liberdade

90%

n = 22

EXEMPLO DISTRIBUIÇÃO t

g.l. = n – 1 = 22 – 1 = 21

DISTRIBUIÇÃO QUI-QUADRADO

Distribuição:

A estimativa pontual para σ² e s² e a estimativa

pontual σ e s.

Se a variável x tem distribuição normal, então a

distribuição de:

HIPÓTESE ESTABELECENDO

HIPÓTESE ESTABELECENDO

A Hipótese nula H0 contém uma

afirmação de igualdade, tal como ≤, = ou ≥.

A Hipótese alternativa Ha é o

complemento da hipótese nula. É uma

afirmação que deve ser verdadeira se H0

for falsa e contém uma afirmação de

desigualdade estrita, tal como, >, ≠ e <.

HIPÓTESE ESTABELECENDO

HIPÓTESE EXEMPLO

Escreva a afirmação como uma sentença

matemática. Afirme as hipóteses nula e

alternativa e identifique qual representa a

afirmação.

– Uma universidade pública alega que a

proporção de seus estudantes que se

graduaram em 4 anos é de 82%.

HIPÓTESE RESOLUÇÃO

HIPÓTESE EXEMPLO

Escreva a afirmação como uma sentença

matemática. Afirme as hipóteses nula e

alternativa e identifique qual representa a

afirmação.

– Um fabricante de torneiras anuncia que o

índice médio de fluxo de água de certo tipo

de torneira é menor que 11 litros por minuto.

HIPÓTESE RESOLUÇÃO

HIPÓTESE EXERCÍCIO

Escreva a afirmação como uma sentença matemática. Afirme as hipóteses nula e alternativa e identifique qual representa a afirmação.

– Uma indústria de cereais

anuncia que o peso médio dos conteúdos de suas caixas de 0,57 kg de cereal é mais do que 0,57 kg.

TIPOS DE ERRO

Erro tipo I ocorre se a hipótese nula for

rejeitada quando é verdadeira.

Erro tipo II ocorre se a hipótese nula não for

rejeitada quando é falsa.

HIPÓTESE EXEMPLO

O limite para contaminação por

salmonela por frango é 20%. Um

inspetor de carnes reporta que o frango

produzido por uma empresa excede o

limite. Você realiza um teste de

hipóteses para determinar se a

afirmação do inspetor de carne é

verdadeira. Quando irá ocorrer um erro

tipo I ou tipo II? Qual é mais sério?

HIPÓTESE RESOLUÇÃO

Erro tipo I ocorre se a proporção real de frango contaminado for ≤ 0,2, mas H0 foi rejeitada.

Erro tipo II ocorre se a proporção real de frango contaminado for > 0,2, mas H0 não foi rejeitada.

O erro do tipo II é mais sério, pois pode resultar em doenças ou mortes causadas pelos frangos contaminados que foram comprados pelo consumidor.

NÍVEL DE SIGNIFICÂNCIA

Em um teste de hipótese, o nível de significância é sua probabilidade máxima permissível para cometer um erro tipo I. Ele é denotado por α.

Níveis de significância comumente usados:

α = 0,10 α = 0,05 α = 0,01

Embora o controle de um erro do tipo II em testes de

hipóteses não seja comum, ele pode ser feito. A probabilidade de um erro do tipo II é denotada por β.

VALOR P

Se H0 for verdadeira, um valor P (ou valor de probabilidade) de um teste de hipótese é a probabilidade de se obter uma estatística amostral com valores tão extremos ou mais extremos do que aquela determinada a partir dos dados da amostra.

Uma maneira de se decidir se rejeitamos a H0 é determinar se a probabilidade de se obter uma estatística de teste padronizada é menor que o nível de significância.

TESTE UNICAUDAL À ESQUERDA

EXEMPLO

Se a hipótese alternativa Ha contém o

símbolo menos que (<), o teste de

hipótese será um teste unicaudal à

esquerda.

TESTE UNICAUDAL À DIREITA

EXEMPLO

Se a hipótese alternativa Ha contém o

símbolo maior que (>), o teste de

hipótese será um teste unicaudal à

direita.

TESTE BICAUDAL

Se a hipótese alternativa Ha contém o

símbolo de não igualdade (≠), o teste de

hipótese será um teste bicaudal. Cada

cauda tem uma área de ½ p.

TESTE EXERCÍCIO

Para a afirmação dada estabeleça H0 e Ha.

Determine se o teste de hipótese é unicaudal à

esquerda, à direita ou bicaudal. Descreva uma

distribuição de amostragem normal e sombreie

a área para o valor P.

Uma universidade pública que a proporção de

seus estudantes que se graduaram em 4 anos é

82%.

TESTE RESOLUÇÃO

TESTE - VALOR P

Para usar um valor P para chegar a uma conclusão em um teste de hipótese, compare o valor P com α.

– 1. Se P ≤ α, então rejeito H0.

– 2. Se P > α, então falhe em rejeitar H0.

Falhar em rejeitar a H0 não significa que você tenha aceitado a hipótese nula como verdadeira. Diz apenas que não há evidência suficiente para rejeitar a H0.

TESTE EXERCÍCIO

O valor P para o teste de hipótese é P=0,0237. Qual sua decisão se o nível de significância é α = 0,05 e α = 0,01?

– Como 0,0237 ≤ 0,05, então rejeito H0. REJEITA H0

– Como 0,0237 > 0,01, então falho ao rejeitar H0.

FALHA EM REJEITA H0

Quanto menor o valor de P, mais evidência há a favor da rejeição de H0. O valor de P fornece a você o menor nível de significância para o qual a estatística da amostra permite que você rejeite a H0.

TESTE EXERCÍCIO

Em um anúncio, uma pizzaria afirma que

a média de seu tempo de entrega é menor

que 30 minutos. Uma seleção aleatória de

36 tempos de entrega tem média amostral

de 28,5 minutos e desvio padrão de 3,5

minutos. Há evidência suficiente para

apoiar a firmação em α = 0,01? Use um

valor P.

TESTE RESOLUÇÃO

No nível de significância de 1%, há evidência suficiente

para concluir que a média do tempo de entrega é < 30

minutos.

TESTE RESOLUÇÃO

Depois de determinar a estatística do

teste padronizada do teste de hipótese e a

área correspondente da estatística do

teste, realize um dos passos a seguir para

encontrar o valor P.

TESTE EXERCÍCIO

Em um anúncio, uma pizzaria afirma que

a média de seu tempo de entrega é menor

que 30 minutos. Uma seleção aleatória de

36 tempos de entrega tem média amostral

de 28,5 minutos e desvio padrão de 3,5

minutos. Há evidência suficiente para

apoiar a firmação em α = 0,01? Use um

valor P.

TESTE RESOLUÇÃO

No nível de significância de 1%, há evidência suficiente

para concluir que a média do tempo de entrega é < 30

minutos.

REGRA DE DECISÃO

DEFINIÇÃO

Para usar um valor P para chegar a uma

conclusão em um teste de hipótese, compare o

valor P com α.

– Se P < α, então rejeitar H0

– Se P > α, então falhe em rejeitar H0

EXEMPLO

Em um anúncio, uma pizzaria afirma que

a média de seu tempo de entrega é menor

que 30 minutos. Uma seleção aleatória de

36 tempos de entrega tem média amostral

de 28,5 minutos e desvio padrão de 3,5

minutos. Há evidência suficiente para

apoiar a firmação em α = 0,01?

Use um valor P.

RESOLUÇÃO

No nível de significância de 1%, há evidência suficiente para

concluir que a média do tempo de entrega é < 30 minutos.

RESOLUÇÃO

EXEMPLO

Você acha que a afirmação do investimento médio da franquia mostrada no gráfico é incorreta, então você seleciona aleatoriamente 30 franquias e determina o investimento necessário para cada.

A média amostral de investimento é $135.000 com desvio padrão de $30.000. Há evidência suficiente para apoiar sua afirmação em α = 0,05. Use um valor P.

TESTE DE HIPÓTESE

= 143260

≠ 143260

α = 0,05

RESOLUÇÃO

RESOLUÇÃO

RESOLUÇÃO

RESPOSTA

P é maior “>” que α, logo você falha em

rejeitar à hipótese H0

REJEIÇÃO

Uma região de rejeição (ou região

crítica) da distribuição amostral é a

amplitude de valores para a qual a

hipótese nula não é provável. Se uma

estatística de teste está nessa região, a

hipótese nula é rejeitada. Um valor crítico

z0 separa a região de rejeição de não

rejeição.

ENCONTRANDO VALORES CRÍTICOS

EM UMA DISTRIBUIÇÃO NORMAL

EXEMPLO

Encontre o valor crítico e a região de

rejeição para um teste unicaudal à

esquerda com α = 0,01.

EXEMPLO

Encontre o valor crítico e a região de

rejeição para um teste bicaudal à

esquerda com α = 0,05.

REGRA DE DECISÃO BASEADA

NA REGIÃO DE REJEIÇÃO

Se a estatística padronizada z do teste:

– Estiver na região de rejeição, então rejeite H0.

– Não estiver na região de rejeição, então falhe em

rejeitar H0.

EXEMPLO

Funcionários de uma grande firma de

contabilidade afirmam que a média dos

salários dos contadores é menor que a de

seu concorrente, que é $45.000. Uma

amostra aleatória de 30 dos contadores

da firma tem média de salário de $43.500

com desvio padrão de $5.200. Com α =

0,05, teste a afirmação dos funcionários.

RESOLUÇÃO

RESOLUÇÃO

1,645

RESOLUÇÃO

RESOLUÇÃO

No nível de significância de 5%, não há evidência suficiente para apoiar a afirmação dos funcionários de que a média < $45.000.

ÁREA = -1,645

Z = -1,579

REGIÃO DE REJEIÇÃO

Uma região de rejeição (ou região

crítica) da distribuição amostral é a

amplitude de valores para a qual a

hipótese nula não é provável. Se uma

estatística de teste está nessa região, a

hipótese nula é rejeitada.

Um valor crítico z0 separa a região de

rejeição de não rejeição.

VALORES CRÍTICOS DISTRIBUIÇÃO T

EXERCÍCIO

Um revendedor de carros usados diz que o

preço médio de um Honda Pilot LX 2005 é de

pelo menos $23.900. Você suspeita que essa

afirmação é incorreta e descobre que uma

amostra aleatória de 14 veículos similares tem

média de preço de $23.000 e desvio padrão de

$1.113. Há evidências suficientes para rejeitar a

afirmação do revendedor em α = 0,05?

Assuma que a população é normalmente

distribuída.

DADOS RELEVANTES

Quando a quantidade é menor que n < 30,

utiliza-se a tabela DISTRIBUIÇÃO T.

No caso desse exercício, estamos

trabalhando com uma amostra de 14

VEÍCULOS.

RESOLUÇÃO

RESPOSTA

No nível de significância de 5%, há evidência suficiente para rejeitar a afirmação de que a média é de pelo menos $23.900.

EXERCÍCIO

Uma indústria afirma que a média do nível do pH do rio mais próximo é 6,8. Você seleciona 19 amostras de água e mede os níveis de pH de cada uma. A média amostral e o desvio padrão são de 6,7 e 0,24, respectivamente. Há evidência suficiente para rejeitar a afirmação da indústria em α = 0,05?

Assuma que a população é normalmente distribuída.

RESOLUÇÃO DADOS:

n = 19

σ = 0,24

gl = 18

-1,85

TABELA

RESOLUÇÃO

RESPOSTA

Não há evidências!

TESTE DE HIPÓTESE PROPORÇÃO

Um centro de pesquisas declara que

menos de 20% dos usuários de Internet

têm rede sem fio em suas casas. Em uma

amostra aleatória de 100 adultos, 15%

dizem que têm rede sem fio em casa.

Com α = 0,01 há evidências suficientes

para apoiar a declaração do pesquisador?

EXEMPLO

Um fabricante de tacos de golfe afirma que os golfistas podem diminuir seus placares usando os tacos de golfe recém-projetados para ele. Oito jogadores de golfe são escolhidos aleatoriamente e é pedido a cada um que forneça seu mais recente placar. Após usar os novos tacos por um mês, é pedido novamente aos jogadores que forneçam seus placares recentes. Os placares para cada um estão na tabela. Assumindo que os placares são distribuídos normalmente, existe evidência suficiente para apoiar a afirmação do fabricante para α = 0,10?

DADOS

ATENÇÃO

“diminuir placar” significa:

placar antigo > placar novo

d = (placar antigo) – (placar novo)

RESOLUÇÃO

RESOLUÇÃO

No nível de significância

de 10%, há evidência

suficiente para apoiar a

afirmação do fabricante

de que os placares foram

menores com os novos

tacos de golfe.

EXERCÍCIO

Um legislador estadual quer determinar se seu

índice de desempenho (0-100) mudou do ano

passado para este. A tabela mostra o índice de

desempenho do legislador para 16 eleitores

selecionados aleatoriamente para o ano

passado e para este. Em α = 0,01, há evidência

suficiente para concluir que o desempenho do

legislador mudou? Assuma que os índices de

desempenho são normalmente distribuídos.

DIFERENTE

EXERCÍCIO

RESOLUÇÃO

RESOLUÇÃO

No nível de significância de 1% não há

evidência suficiente para concluir que a

classificação de desempenho do

legislador mudou.

t = 1,369

t0 = 2,947