11
Prof.Paulo Alessio – Definições, exercícios e algumas figuras foram extraídos do referencial bibliográfico. Notas de aulas não comercializáveis. Utilizadas para apoio às aulas. 2012/1 1 Disciplina: PROBABILIDADE e ESTATÍSTICA (Parte 9). 25. Teste do Qui-quadrado ( χ 2 ). Os testes de hipóteses, nos quais se supõem que os dados seguem determinada distribuição de probabilidades são denominados paramétricos. Imagine que as suposições necessárias para a aplicação dos testes paramétricos não sejam satisfeitas. Suponha que ocorram alguns dos casos abaixo: Os dados sob análise têm nível de mensuração qualitativo: ordinal ou nominal. Os dados sob análise têm nível de mensuração quantitativo, mas há indícios de que a distribuição não é normal. Há interesse em realizar inferências sobre a própria forma da distribuição. Uma alternativa para essas situações é a utilização de testes não paramétricos, ou testes livres de distribuição. O teste do χ 2 (qui-quadrado) é utilizado para avaliar a discrepância entre frequências observadas e esperadas para um determinado conjunto de eventos e também para testar hipóteses estatísticas. A estatística do qui-quadrado pode ser utilizada tanto para verificar a aderência das frequências observadas a um modelo, (teste aderência), como para verificar a independência entre duas variáveis. 25.1 Nível de Significância do Teste. Os valores de χ 2 tabelados para determinado valor de α são denominados valores críticos, e α é o nível de significância de um teste. Assim, se o valor do χ 2 calculado através da fórmula ( ) - = = k i i e e o i i 1 2 2 χ ou n k i i i e o - = =1 2 2 χ para os dados de um problema, for maior que o valor crítico do χ 2 tabelado para o nível α , então as frequências observadas diferem significativamente das frequências esperadas, nesse nível. No caso contrário, isto é, se χ 2 calculado for menor que χ 2 crítico, conclui-se que não há discrepância significativa entre as frequências observadas e esperadas, no nível α . O teste Qui-Quadrado é unilateral. Geralmente, os níveis de significância adotados são: 10%, 5% e 1%. RA = Região de Aceitação e RR = Região de Rejeição (Região Crítica) A distribuição do qui-quadrado tem grande aplicação no teste de compatibilidade entre as frequências observadas e esperadas para uma prova. RA RR VALOR CRÍTICO

Notas de aula - 9

Embed Size (px)

Citation preview

Page 1: Notas de aula - 9

Prof.Paulo Alessio – Definições, exercícios e algumas figuras foram extraídos do referencial bibliográfico. Notas de aulas não comercializáveis. Utilizadas para apoio às aulas. 2012/1

1

Disciplina: PROBABILIDADE e ESTATÍSTICA (Parte 9).

25. Teste do Qui-quadrado ( χ2

).

Os testes de hipóteses, nos quais se supõem que os dados seguem determinada distribuição de probabilidades são denominados paramétricos. Imagine que as suposições necessárias para a aplicação dos testes paramétricos não sejam satisfeitas. Suponha que ocorram alguns dos casos abaixo: � Os dados sob análise têm nível de mensuração qualitativo: ordinal ou nominal. � Os dados sob análise têm nível de mensuração quantitativo, mas há indícios de que a distribuição não é normal. � Há interesse em realizar inferências sobre a própria forma da distribuição.

Uma alternativa para essas situações é a utilização de testes não paramétricos, ou testes livres de distribuição.

O teste do χ2

(qui-quadrado) é utilizado para avaliar a discrepância entre frequências

observadas e esperadas para um determinado conjunto de eventos e também para testar hipóteses estatísticas.

A estatística do qui-quadrado pode ser utilizada tanto para verificar a aderência das frequências observadas a um modelo, (teste aderência), como para verificar a independência entre duas variáveis. 25.1 Nível de Significância do Teste.

Os valores de χ2

tabelados para determinado valor de α são denominados valores críticos, e α é o

nível de significância de um teste. Assim, se o valor do χ2

calculado através da fórmula

( )∑

−=

=k

i ieeo ii

1

2

2

χ ou nk

i i

i

eo

−=∑=1

22

χ para os dados de um problema, for maior que o valor crítico

do χ2

tabelado para o nível α , então as frequências observadas diferem significativamente das

frequências esperadas, nesse nível. No caso contrário, isto é, se χ2

calculado for menor que χ2

crítico, conclui-se que não há discrepância significativa entre as frequências observadas e esperadas, no nível α . O teste Qui-Quadrado é unilateral.

Geralmente, os níveis de significância adotados são: 10%, 5% e 1%.

RA = Região de Aceitação e RR = Região de Rejeição (Região Crítica)

A distribuição do qui-quadrado tem grande aplicação no teste de compatibilidade entre as frequências observadas e esperadas para uma prova.

RA

RR

VALOR CRÍTICO

Page 2: Notas de aula - 9

Prof.Paulo Alessio – Definições, exercícios e algumas figuras foram extraídos do referencial bibliográfico. Notas de aulas não comercializáveis. Utilizadas para apoio às aulas. 2012/1

2 Quando, numa tabela de frequências, as frequências observadas ocupam apenas uma linha

dessa tabela, ela é denominada tabela de entrada simples. Se as frequências observadas ocupam mais de uma linha, a tabela é de multientrada ou de contingência. Exemplos

1) Tabelas de entrada simples. a) 100 lançamentos de duas moedas.

Duas “caras” Duas “coroas” Uma “cara” e uma “coroa” oi 22 34 44 ei 25 25 50

b) 120 lançamentos de um dado.

1 2 3 4 5 6 oi 18 21 22 19 17 23 ei 20 20 20 20 20 20

2) Tabela de contingência (dupla entrada). Resultado de uma amostra de estudantes de uma universidade, classificados quanto ao sexo e

a área de estudo escolhida.

Ciências Humanas Ciências Exatas Masculino ( oi ) 48 52

Feminino ( oi ) 45 25 25.2 Teste Qui-quadrado de Aderência.

O teste qui-quadrado de aderência pode ser aplicado quando estamos estudando dados distribuídos em categorias e há interesse em verificar se as frequências observadas nas k diferentes categorias (oi, i = 1, 2, ...,k) são significativamente distintas de um conjunto de k frequências esperadas (ei, i = 1, 2, ...,k). As hipóteses são:

.,...,2,1lg:

;,...,2,1:0

kiumapara

kitodopara

eoH

eoH

iii

ii

=≠

==

A estatística desse teste, chamada de χ2

, é uma espécie de medida de distância entre as

frequências observadas e as frequências esperadas de cada categoria. Sua expressão é dada por:

( )∑

−=

=k

i ieeo ii

1

2

2

χ . Quanto mais próximo de zero for o valor calculado pela expressão do χ2

,

menor é a discrepância entre as frequências observadas e as frequências esperadas. Observe que na

expressão do χ2

, o termo oi - ei , indica a diferença, na categoria i, entre a frequência observada e a

esperada ou, em outras palavras, o desvio em relação ao modelo proposto. Se, simplesmente, somássemos esses desvios para todas as categorias, obteríamos zero, pois o total de dados é o mesmo. Para evitar soma zero, tomamos o quadrado dos desvios. Entretanto, por serem quantidades não negativas, sua soma pode se tornar alta e, por essa razão, é conveniente fazer uma mudança de escala dividindo esses desvios ao quadrado pela frequência esperada. Somando, para todas as

categorias, obtemos a expressão do χ2

que é, assim, uma medida da discrepância que desejamos

quantificar. Neste teste também é usado:

H0 – a hipótese é verdadeira H1 – a hipótese é falsa

Para H0 verdadeira, diz-se que há aderência (as frequências observadas devem ficar próximas das frequências esperadas. Quando ei > 5 para todo i = 1, 2, . . . ,k e supondo a hipótese de

aderência (H0 verdadeira), a estatística χ2

segue aproximadamente uma distribuição qui-quadrado

com mk −−= 1ν graus de liberdade onde, m é o número de parâmetros estimados para se obter as frequências esperadas, quando necessário.

Page 3: Notas de aula - 9

Prof.Paulo Alessio – Definições, exercícios e algumas figuras foram extraídos do referencial bibliográfico. Notas de aulas não comercializáveis. Utilizadas para apoio às aulas. 2012/1

3 30.2.1 Condições de aplicabilidade do teste: 1. 30≥n ; 2. Todas as classes possuam 1>ie ;

3. Pelo menos 80% das classes possuam 5>ie .

Exemplos. 1) Uma prova consiste em lançar 120 vezes um dado. Suponhamos que as frequências observadas na prova foram respectivamente: face1 (18), face2 = (21), face3 = (22), face4 = (19), face5 = (17) e face6 = (23). Com um nível de significância de 10% verificar se o dado é honesto. Solução: H0 : as frequências nas seis faces são iguais. H1 : pelo menos uma das frequências é diferente.

Em um evento 6

1...

621=== ppp . Em 120 lances as frequências esperadas são:

206

1.120...

621===== eee . Portanto, temos:

Face 1 2 3 4 5 6 Total

oi 18 21 22 19 17 23 120

ei 20 20 20 20 20 20

Cálculo do χ2

. Com a expressão ( )

∑−

=

=k

i ieeo ii

1

2

2

χ

4,12

=χcalculado

Temos seis eventos, portanto 1−= kν = 6 – 1 = 5

).(24,92

5;10,0

2

tabeladocrítico

== χχ Valor calculado está na Região de Aceitação (RA), portanto

aceitamos a hipótese de honestidade do dado no nível de significância de 10%. Solução com o programa R. 1) Lançamento das frequências observadas.

2) Determinação das frequências esperadas. Comando: chisq.test(nome) $ expected

3) Teste do Qui-quadrado. Comando: chisq.test(nome)

Interpretação. Para qui-quadrado calculado = 1,4 implica que a cauda à direita é de 0,9243. Essa área, 92,43%, cai na Região de Aceitação. A Região de Rejeição, para esse exemplo, é de 10%. Portanto, aceitamos a hipótese de honestidade do dado no nível de significância de 10%.

Page 4: Notas de aula - 9

Prof.Paulo Alessio – Definições, exercícios e algumas figuras foram extraídos do referencial bibliográfico. Notas de aulas não comercializáveis. Utilizadas para apoio às aulas. 2012/1

4

2) Determinado veículo utilitário está sofrendo pesadas críticas de seus proprietários, com relação à grande frequência de defeitos no pneu traseiro esquerdo. Preocupado com sua imagem, e procurando defender-se de eventuais pedidos de indenização, o fabricante do veículo resolveu coletar informações sobre 152 ocorrências de defeitos, classificando-as por posição do pneu. Os resultados estão no quadro a seguir. Usando nível de significância de 5%, há razão para acreditar que a probabilidade de defeito é diferente para alguma posição? Posição do Pneu Diant. Esq. Diant. Dir. Tras. Esq. Tras. Dir. Total Frequência (oi) 35 32 57 28 152 Solução. H0 : as frequências de defeitos nos quatro pneus são iguais. H1 : pelo menos uma das frequências de defeitos nos pneus é diferente.

Se H0 for verdadeira, as 152 ocorrências devem distribuir-se igualmente pelas quatro

categorias, resultando na frequência esperada de cada categoria igual a socorrência384

1.152 =

Posição do Pneu Diant. Esq. Diant. Dir. Tras. Esq. Tras. Dir. Total Frequência (oi) 35 32 57 28 152 Frequência (ei) 38 38 38 38 38

Cálculo do χ2

. Com a expressão ( )

∑−

=

=k

i ieeo ii

1

2

2

χ

32,132

=χcalculado

Temos quatro eventos, portanto 1−= kν = 4 – 1 = 3

).(81,72

3;05,0

2

tabeladocrítico

== χχ Rejeitamos H0 , portanto há evidência de que as frequências de

ocorrência dos defeitos dependem da posição do pneu. 3) A administração de um aeroporto deseja conferir a alegação de um controlador de vôo de que o número de mensagens de rádio recebidas por minuto é uma variável aleatória de distribuição de Poisson com média 5,1=λ . Se a alegação for correta, isso pode implicar a contratação de mais funcionários. Aparelhagem adequada forneceu os seguintes dados sobre o número de mensagens de rádio recebidas numa amostra aleatória de 200 intervalos de um minuto: Nº de mensagens de rádio 0 1 2 3 4 5 Frequências observadas 70 57 46 20 5 2 Verificar ao nível de significância de 0,01 a alegação do controlador de vôo. Solução. H0 : a população amostrada tem distribuição de Poisson com média de 5,1=λ .

H1 : a população amostrada não tem distribuição de Poisson com 5,1=λ .

Graus de liberdade. 1−= kν = 6 - 1 = 5 e 1,152

5;01,0

2

== χχcrítico

As frequências esperadas determinadas por Poisson. !

.)(

xxXP e

x λ

λ−

== , para x = 0, 1, ..., 5

Nº de mensagens de rádio 0 1 2 3 4 5 Frequências observadas oi 70 57 46 20 5 2 Frequências esperadas ei 44,6 66,9 50,2 25,1 9,4 2,8

Page 5: Notas de aula - 9

Prof.Paulo Alessio – Definições, exercícios e algumas figuras foram extraídos do referencial bibliográfico. Notas de aulas não comercializáveis. Utilizadas para apoio às aulas. 2012/1

5

Cálculo do qui-quadrado. ( )

∑−

=

=k

i ieeo ii

1

2

2

χ 62,192

=χcalculado

Rejeitamos H0.Concluímos que ou

a população não tem uma distribuição de Poisson ou tem uma distribuição de Poisson com média diferente de 1,5. 25.3 Teste Qui-quadrado de Independência – Tabelas de Contingência.

Quando existem duas ou mais variáveis qualitativas de interesse, a representação tabular das frequências observadas pode ser feita através de uma tabela de contingência.

O teste qui-quadrado de independência é usado para verificar se existe associação entre variáveis qualitativas com base em uma amostra de observações disposta numa tabela de contingência com L linhas e C colunas (L, C ≥ 2).

Uma indagação que pode ser objeto de um teste é se as variáveis qualitativas envolvidas são ou não independentes. Ou seja, podemos desejar testar as hipóteses: H0 : as variáveis são independentes. H1 : as variáveis não são independentes, ou seja, elas apresentam algum grau de associação entre si. Exemplos. 1) Da classificação dos alunos de uma universidade, com relação ao sexo e à opção por ciências humanas e ciências exatas, temos as seguintes frequências: Ciências Humanas Ciências Exatas Totais

Masculino 48 52 100 Feminino 45 25 70

Totais 93 77 170 Verificar se o sexo influi na escolha da área de estudo. Usar nível de significância de 5%. Solução.

Podemos estabelecer as duas hipóteses: H0 : o sexo não tem influência na área de estudo. (são independentes) H1 : há associação entre sexo e área de estudo.

Apurando os totais das linhas e das colunas, verificamos que a amostra é constituída de 100 universitários e 70 universitárias. Desse total de 170 alunos, 93 optaram por ciências humanas e 77, por ciências exatas. Como a questão é testar a hipótese de que o sexo não tem influência sobre a área de estudo, é de se esperar que a mesma proporção de alunos que optaram por determinada área de estudo verifica-se também para cada sexo. Assim, se 93 em 170 alunos são de ciências humanas, espera-se que essa mesma proporção (54,7%) se verifique para rapazes e moças nesta área. Igualmente, a proporção de 77 para 170 (45,3%) deve verificar-se para ambos os sexos em ciências exatas.

Dessa forma, as frequências esperadas são: Ciências Humanas. Ciências Exatas.

Masculino: 54,7%de 100 = 54,7 ( 100.170

93) Masculino: 45,3%de 100 = 45,3 ( 100.

170

77)

Feminino: 54,7% de 70 = 38,3 ( 70.170

93) Feminino: 45,3% de 70 = 31,7 ( 70.

170

77)

Podemos observar que qualquer frequência esperada pode ser obtida diretamente pela expressão:

geraltotal

jcolunadatotalxilinhadatotale ji

)()(= (i= 1, 2, ..., L; j = 1, 2, ...., C)

As frequências observadas e esperadas são representadas abaixo. Ciências Humanas Ciências Exatas Totais

Masculino 48 (54,7) 52 (45,3) 100 Feminino 45 (38,3) 25 (31,7) 70

Totais 93 77 170 O número de graus de liberdade nesta tabela é 1, pois conhecendo-se os totais das linhas e

das colunas, ao fixarmos o valor da primeira célula, os demais serão prontamente determinados por subtração.

Page 6: Notas de aula - 9

Prof.Paulo Alessio – Definições, exercícios e algumas figuras foram extraídos do referencial bibliográfico. Notas de aulas não comercializáveis. Utilizadas para apoio às aulas. 2012/1

6 O número de graus de liberdade de uma tabela de contingência é dado por: )1).(1( −−= CLν

Se, para o problema, fixarmos o nível de significância 0,05, o valor do 84,32

=χcrítico

e o

( ) ( ) ( ) ( )4,4

7,313,383,457,54

7,31253,38453,45527,54482222

2

=+++=−−−−

χcalculado

Observe que a expressão do ( )

∑∑−

= =

=L

i

C

j ij

calculado e

eo ijij

1 1

2

2

χ

Como cai na região de rejeição, devemos rejeitar a hipótese nula. O sexo dos estudantes tem

influência na escolha da área de estudos. Teste qui-quadrado de independência com o Excel.

A análise da resposta é feita através da probabilidade – ângulo à direita, neste caso, 3,59%. Como nível de significância é de 5% , 3,59% está na RR. Para obter o qui-quadrado calculado, caso necessário, através do Excel, utilizar a função inversa. Em probabilidade lançar 0,0035944029 e, em graus de liberdade lançar 1, resulta qui-quadrado calculado = 4,399758368, ou seja 4,4. GL = (L – 1).(C – 1).

Page 7: Notas de aula - 9

Prof.Paulo Alessio – Definições, exercícios e algumas figuras foram extraídos do referencial bibliográfico. Notas de aulas não comercializáveis. Utilizadas para apoio às aulas. 2012/1

7 2) O quadro abaixo indica o resultado de uma amostra de opiniões de donas de casa, da capital e de uma cidade do interior, relativas à qualidade de uma nova marca de detergente que experimentaram. Testar, no nível de 0,05, a hipótese de que não há divergência de opinião entre as donas de casa da capital e do interior com relação ao produto.

Ótimo Regular Insatisfatório Capital 20 16 9 Interior 30 17 8

Solução. Vamos calcular os totais nas linhas e colunas e as frequências esperadas. Ótimo Regular Insatisfatório Total

Capital 20 (22,5) 16 (14,85) 9 (7,65) 45 Interior 30 (27,5) 17 (18,15) 8 (9,35) 55 Total 50 33 17 100

H0 : não há divergência de opinião das donas de casa em relação ao detergente. (são independentes) H1 : há divergências de opinião em relação ao produto. Determinação das frequências esperadas.

geraltotal

jcolunadatotalxilinhadatotale ji

)()(=

5,22100

50.4511

==e 85,14100

33.4512

==e 65,7100

17.4513

==e

5,27100

50.5521

==e 15,18100

33.5522

==e 35,9100

17.5523

==e

Determinação do 99,52;05,0

2

== χχcrítico

10,12

.=χ

calc

Aceitamos H0. Não há divergência significativa, no nível de 0,05, de opinião entre donas de casa da capital e do interior com relação ao produto. Com o uiso do Excel.

Interpretação. Ângulo – probabilidade - à direita calculado 57,69%. Cai na RA. 25.3.1 Limitação do Teste do Qui-quadrado.

A aplicação do χ2

para teste de aderência ou independência de variáveis apresenta

resultados satisfatórios quando as frequências esperadas, em todas as k células, forem, no mínimo, igual a 5. A experiência tem mostrado que, para frequências esperadas menores, a curva contínua não

dá bom ajustamento à variável do χ2

.

Page 8: Notas de aula - 9

Prof.Paulo Alessio – Definições, exercícios e algumas figuras foram extraídos do referencial bibliográfico. Notas de aulas não comercializáveis. Utilizadas para apoio às aulas. 2012/1

8 Um artifício que pode ser utilizado, quando ocorrer frequência esperada menor que 5, é

agrupar duas ou mais em uma só, somando-se as frequências observadas e esperadas para essas casas. Exemplo. Lançando-se 18 vezes um dado, os resultados obtidos foram:

Ponto 1 2 3 4 5 6 Frequência 1 4 2 3 5 3 Testar, no nível 0,10, a compatibilidade entre as frequências observadas e esperadas. Neste exemplo, a frequência esperada para cada ponto é 3, portanto, menor que 5. Podemos, então, agrupar os pontos dois a dois, da seguinte forma:

Pontos 1 ou 2 3 ou 4 5 ou 6 oi 5 5 8 ei 6 6 6

12

.=χ

calc e o 61,4

2;10,0

2

== χχcrítico

. Aceitamos H0. Aceita-se a compatibilidade entre as frequências

observadas e esperadas, no nível de 0,10. Exercícios. 1) Os dados de 10 anos revelam que numa certa cidade não houve assaltos a bancos em 57 meses, houve um assalto a banco em 36 meses, dois assaltos a banco em 15 meses e três ou mais assaltos a banco em 12 meses. Ao nível de 0,05 de significância, esses dados apóiam a alegação de que as probabilidades de 0, 1, 2, ou 3 ou mais assaltos a bancos num mês qualquer sejam 0,40; 0,30; 0,20 e 0,10?

Resposta. 06,52

=χcalculado

, 81,72

3;05,0

2

== χχcrítico

. A população amostrada tem probabilidades de

0,40; 0,30; 0,20 e 0,10 para respectivamente 0, 1, 2 ou 3 ou mais assaltos num mês qualquer. 2) Deseja-se verificar ao nível de significância de 5% se o número de acidentes em uma estrada muda conforme o dia da semana. O número de acidentes observado para cada dia de uma semana escolhida aleatoriamente foram: segunda-feira = 20, terça-feira = 10, quarta-feira = 10, quinta-feira =15, sexta-feira = 30, sábado = 20 e domingo =35. Hipóteses a serem testadas: H0: o número de acidentes não muda conforme o dia da semana; H1: Pelo menos um dos dias tem número diferente dos demais.

Resposta. 5,272

=χcalculado

6,122

6;05,0

2

== χχcrítico

.Concluímos que o número de acidentes não é o

mesmo em todos os dias da semana. 3) O número de defeitos por unidade observados em uma amostra de cem aparelhos de televisão produzidos em uma linha de montagem apresentou a seguinte distribuição de frequências: Número de Defeitos 0 1 2 3 4 5 6 7 Número de aparelhos 25 35 18 13 4 2 2 1 Verificar, ao nível de 5% de significância, se o número de defeitos por unidade segue razoavelmente uma distribuição de Poisson.

Resposta. 41,32

=χcalculado

81,72

3;05,0

2

== χχcrítico

. Aceitamos H0. Concluímos que a variável adere

bem ao modelo de Poisson. 4) Os resultados finais, relativos à disciplina Matemática, dos alunos dos cursos de Administração e Economia de uma faculdade, estão representados no quadro abaixo. Verificar se não há discrepância significativa, no nível de 5%, do aproveitamento dos alunos dos dois cursos em relação à disciplina.

Aprovados Reprovados Administração 72 34

Economia 36 22

Page 9: Notas de aula - 9

Prof.Paulo Alessio – Definições, exercícios e algumas figuras foram extraídos do referencial bibliográfico. Notas de aulas não comercializáveis. Utilizadas para apoio às aulas. 2012/1

9

Resposta. χ2

calculado = 0,574. χ2

crítico = 3,84. Valor calculado está na RA, portanto não há

discrepância significativa no nível de 0,05. 5) A tabela abaixo apresenta a preferência dos alunos de uma faculdade, classificados segundo o sexo, pelas disciplinas A, B, C, e D. Testar no nível de 0,05, a hipótese de que a preferência pelas disciplinas não depende do sexo.

A B C D Rapazes 23 42 35 17 Moças 36 28 20 34

Resposta. χ2

calculado = 15,96. χ2

crítico = 7,81. Como cai na região crítica, então rejeita-se a

hipótese de que as preferências pelas disciplinas não dependem do sexo. 6) Uma prova consiste em lançar 120 vezes um dado. Suponhamos que as frequências observadas na prova foram respectivamente: face1 (18), face2 (21), face3 (22), face4 (19), face5 (17) e face6 (23). Com um nível de significância de 10% verificar se o dado é honesto.

Resposta. χ2

calculado = 1,4. χ2

crítico = 9,24. Valor calculado está na RA, portanto aceitamos a

hipótese de honestidade do dado no nível de 10%. 7) Uma empresa possui três laboratórios de pesquisas (A, B e C), cujos computadores estão conectados a um servidor, para onde enviam pacotes de dados para serem analisados em um programa (disponível apenas no servidor). Os usuários do laboratório A pediram prioridade ao gerente de rede, pois costumam enviar mais pacotes ao servidor. O gerente observou 500 pacotes de dados enviados e classificou-os de acordo com a origem, conforme quadro seguinte: Laboratório A B C Número de pacotes 165 179 156 Os dados constituem evidência suficiente para corroborar o pedido do laboratório A? Utilize nível de significância de 1%.

Resposta. χ2

calculado = 1,61. χ2

crítico = 9,21. Aceita H0. O pedido do laboratório A não é

corroborado pelos dados. 8) Determinado posto de qualidade de um laticínio retira uma amostra dos pesos dos litros de leite produzidos em um dia, classificando-os de acordo com seu tipo (B, C, UHT), e condições de peso (dentro ou fora das especificações. O quadro mostra a distribuição de frequências conjunta de 6850 unidades de leite. B C UHT Dentro das especificações 500 4500 1500 Fora das especificações 30 270 50 Testar se há associação entre o tipo de leite (B, C, UHT) e condições de peso, dentro ou fora das especificações, ao nível de significância de 5%. H0 : as condições de peso independem do tipo de leite. H1 : há associação entre condições de peso e tipos de leite.

Resposta. χ2

calculado = 14,66. χ2

crítico = 5,99. Rejeita-se H0. evidenciando associação entre a

condição de peso e o tipo de leite. 9) Um teste de inteligência foi aplicado a crianças de 9 a 12 anos, de famílias de várias classes de renda. De conformidade com os resultados obtidos, apresentados na tabela abaixo, testar a hipótese de que o grau de Inteligência é independente do nível de renda das famílias, adotando o nível 0,10.

Classe de Renda Q.I. Médio

Alta 105 Média Alta 100

Média Baixa 104 Baixa 87

Page 10: Notas de aula - 9

Prof.Paulo Alessio – Definições, exercícios e algumas figuras foram extraídos do referencial bibliográfico. Notas de aulas não comercializáveis. Utilizadas para apoio às aulas. 2012/1

10

Resposta. χ2

calculado = 2,081. χ2

crítico = 6,25. Aceita H0. Aceita-se a hipótese de que o Q.I.e o

nível de renda são variáveis independentes no nível de 0,10. 10) Há dúvidas sobre os desempenhos dos alunos, na disciplina de Estatística, de alguns cursos de Engenharia. Alguns argumentam que, dependendo do curso, o percentual de aprovação pode ser diferente, mesmo que a disciplina tenha o mesmo programa. Um estudo foi realizado, selecionando aleatoriamente alunos de três cursos, registrando os aprovados e reprovados na disciplina. Os resultados estão no quadro abaixo:

Eng, Civil Eng. Química Eng. Mecânica Aprovados 44 26 35 Reprovados 11 26 15

Considerando nível de significância de 5%, os percentuais de aprovação podem ser considerados iguais? Resposta. Rejeita H0. Os percentuais não podem ser considerados iguais. 11) Um departamento de estatística de uma grande universidade mantém um serviço de acompanhamento para estudantes em seus cursos iniciais. O serviço foi organizado com a expectativa de que 40% de seus clientes seria do curso de estatística de negócios, 30% de estatística de engenharia, 20% do curso de estatística para estudantes de ciências sociais e outros 10% para o curso de estudantes de agricultura. Uma amostra aleatória de n = 120 clientes revelou 52, 38, 21 e 9 dos quatro cursos. Estes dados sugerem que as porcentagens nas quais o curso foi baseado não estão corretas? Defina e teste a hipótese relevante utilizando nível de confiança de 5%. (DEVORE, 2006, p 556). Resposta. H0.não pode ser rejeitada. As porcentagens estão corretas.

χ2

calculado = 1,57. χ2

crítico = 7,81

12) Um sistema de recuperação de informações tem dez localizações de armazenagem. A informação é armazenada com a expectativa de que, no longo prazo, a proporção de solicitações por localização i

seja dada por 30/)5,55,5( −−= ipi

. Uma amostra de 200 solicitações de recuperação de

informações forneceu as seguintes frequências para as localizações de 1 – 10, respectivamente: 4, 15, 23, 25, 38, 31, 32, 14, 10 e 8.Utiliza um teste qui-quadrado ao nível de significância 0,10 para decidir se os dados são consistentes com as proposições iniciais. (DEVORE, 2006, p 556).

Resposta. Não rejeitar H0. χ2

calculado = 6,61. χ2

crítico = 14,7

13) Do Livro Noções de Probabilidade e Estatística – Marcos Magalhães. Seção 8.5 pág. 278. Exercícios: 2, 3, 4, 5, 6 e 7. Seção 8.6 – página 286 – exercícios: 26, 27, 29, 30 e 31.

Page 11: Notas de aula - 9

Prof.Paulo Alessio – Definições, exercícios e algumas figuras foram extraídos do referencial bibliográfico. Notas de aulas não comercializáveis. Utilizadas para apoio às aulas. 2012/1

11 25.3.2 Tabela da Distribuição Qui-quadrado.

α

χ2

α ν

0,995

0,990

0,975

0,950

0,900

0,750

0,500

0,250

0,100

0,050

0,025

0,010

0,005

1 0,0000 0,0002 0,0010 0,0039 0,0158 0,102 0,455 1,32 2,71 3,84 5,02 6,63 7,88

2 0,0100 0,0001 0,0506 0,103 0,211 0,575 1,39 2,77 4,61 5,99 7,38 9,21 10,6

3 0,0717 0,115 0,216 0,352 0,584 1,021 2,37 4,11 6,25 7,81 9,25 11,3 12,8

4 0,207 0,297 0,484 0,711 1,06 1,92 3,36 5,39 7,78 9,49 11,1 13,3 14,9

5 0,412 0,554 0,831 1,15 1,61 2,67 4,35 6,53 9,24 11,1 12,8 15,1 16,7

6 0,676 0,872 1.24 1,64 2,20 3,45 5,35 7,84 10,6 12,6 14,4 16,8 18,5

7 0,989 1,24 1,69 2,17 2,83 4,25 6,35 9,04 12,0 14,1 16,0 18,5 20,3

8 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,2 13,4 15,5 17,5 20,1 22,0

9 1,73 2,09 2,70 3,33 4,17 5,90 8,34 11,4 14,7 16,9 19,0 21,7 23,6

10 2,16 2,56 3,25 3,94 4,87 6,74 9,34 12,5 16,0 18,3 20,5 23,2 25,2

11 2,60 3,05 3,82 4,57 5,58 7,58 10,3 13,7 17,3 19,7 21,9 24,7 26,8

12 3,07 3,57 4,40 5,23 6,30 8,44 11,3 14,8 18,5 21,0 23,3 26,2 28,3

13 3,57 4,11 5,01 5,89 7,04 9,30 12,3 16,0 19,8 22,4 24,7 27,7 29,8

14 4,07 4,66 5,63 6,57 7,79 10,2 13,2 17,1 21,1 23,7 26,1 29,1 31,3

15 4,60 5,23 6,23 7,26 8,55 11,0 14,3 18,2 22,3 25,0 27,5 30,6 32,8

16 5,14 5,80 6,91 7,96 9,31 11,9 15,3 19,4 23,5 26,3 28,4 32,0 34,3

17 5,70 6,41 7,56 8,67 10,1 12,8 16,3 20,5 24,8 27,6 30,2 33,4 35,7

18 6,26 7,01 8,23 9,39 10,9 13,7 17,3 21,6 26,0 28,9 31,5 34,8 37,2

19 6,48 7,63 8,91 10,1 11,7 14,6 18,3 22,7 27,2 30,1 32,9 36,2 38,6

20 7,43 8,26 9,59 10,9 12,4 15,5 19,3 23,8 28,4 31,4 34,2 37,6 40,0

21 8,03 8,90 10,3 11,6 13,2 16,3 20,3 24,9 29,6 32,7 35,5 38,9 41,4

22 8,64 9,54 11,0 12,3 14,0 17,2 21,3 26,0 30,8 33,9 36,8 40,5 42,8

23 9,26 10,2 11,7 13,1 14,8 18,1 22,3 27,1 32,0 35,2 38,1 41,6 44,2

24 9,89 10,9 12,4 13,8 15,7 19,0 23,3 28,2 33,1 36,4 39,4 43,0 45,6

25 10,5 11,5 13,1 14,6 16,5 19,9 24,3 29,3 34,4 37,7 40,6 44,3 46,9

26 11,2 12,2 13,8 15,4 17,3 20,8 25,3 30,4 35,6 38,9 41,9 45,6 48,3

27 11,8 12,9 14,6 16,2 18,1 21,7 26,3 31,5 36,7 40,1 43,2 47,0 49,6

28 12,5 13,6 15,3 16,9 18,9 22,7 27,3 32,6 37,9 41,3 44,5 48,3 51,0

29 13,1 14,3 16,0 17,7 19,8 23,6 28,3 33,7 39,1 42,6 45,7 49,6 52,5

30 13,8 15,0 16,8 18,5 20,6 24,5 29,3 34,8 40,3 43,8 47,0 50,9 53,7