Upload
rgalate
View
223
Download
4
Embed Size (px)
DESCRIPTION
Capítulo sobre teste de hipótese utilizado na matéria de estatística ministrada.
Citation preview
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
1
3. TESTES DE HIPTESES
3.1 INTRODUO Os testes de hiptese so uma metodologia de inferncia estatstica diferente da
que foi abordada na estimao de parmetros (estimao pontual e por
intervalos). Trata-se de um processo estatstico que, a partir de dados amostrais,
permite obter uma de duas respostas (afirmativa ou negativa), sobre uma
determinada conjectura previamente realizada sobre a populao (nos testes de
hipteses paramtricos essa conjectura sobre os parmetros da populao).1
Ao realizar um teste de hipteses o objectivo validar ou no determinadas
hipteses sobre a populao, com base na informao amostral. No caso
particular dos testes de hipteses paramtricos, a validao diz respeito aos
parmetros da populao.
Em diversas reas da cincia, colocam-se questes inerentes s quais esto
opes alternativas. A deciso, qualquer que ela seja, comporta um risco, o risco
de errar. A metodologia de realizao dum teste de hipteses permite controlar
e at minimizar o risco de errar. Vejamos o seguinte exemplo:
Exemplo 3.1: O director de uma loja dos CTT dimensionou o nmero de balces
de atendimento de modo a garantir que o tempo mdio de espera por cliente
no ultrapassa-se cinco minutos. No entanto, a zona urbana em que a loja est
inserida tem crescido e o director tem dvidas se na realidade os clientes
continuam em mdia a esperar no mximo cinco minutos. Caso verifique que
esperam mais tempo, o director ir proceder abertura de um novo balco.
1 Existem os testes de hiptese no paramtricos que se utilizam quando os pressupostos de utilizao dos testes paramtricos no se verificam. Por exemplo, no caso de populaes no normais e amostras de pequena dimenso os testes no paramtricos so uma opo possvel. Tambm no caso dos dados estarem na escala de intervalos ou rcios e no terem distribuio especificada, ou sendo esta conhecida a menos de um nmero infinito de parmetros desconhecidos e tambm quando os dados esto na escala nominal ou ordinal.
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
2
Assim, pretende avaliar a necessidade de investir num novo balco, recorrendo
a uma amostra que permita estimar a verdadeira mdia do tempo de espera por
cliente.
A hiptese que se pretende testar designada por hiptese nula (a designao
de nula, indica que se trata de uma hiptese que no difere da situao real).
Neste exemplo, a hiptese nula, 0H , revela a informao detida pelo director at
ao momento (o tempo mdio de espera inferior ou no mximo igual a 5
minutos). A hiptese alternativa, aH , coloca-se em contraposio hiptese
nula: caso o tempo mdio de espera no verifique a condio definida em 0H ,
ento a alternativa que este seja superior a 5 minutos. A observao de uma
amostra vai fornecer informao que torna possvel a deciso por uma das duas
hipteses. Se a amostra for favorvel hiptese nula, decide-se no rejeitar 0H ,
o que, neste caso, corresponde a decidir no abrir um novo balco de
atendimento. Caso a amostra contenha evidncia factual no favorvel a 0H ,
rejeitamos esta hiptese, o que quer dizer que estamos a optar pela hiptese
alternativa - vamos decidir abrir um novo balco para fazer face ao aumento
indesejado do tempo mdio de espera por cliente. Mas no esqueamos que a
inferncia probabilstica, o que nos obriga a considerar o risco de tomar
decises erradas. De facto, dependendo da situao realmente verdadeira,
assim a deciso de abrir/no abrir um novo balco pode estar errada.
3.2 HIPTESES E DECISES
Uma hiptese estatstica uma conjectura que caracteriza a distribuio duma
ou mais populaes. Num teste estatstico temos duas hipteses em alternativa,
relativas a um parmetro desconhecido da populao:
0H : Hiptese nula
aH : Hiptese alternativa
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
3
A hiptese nula geralmente aquela que revela a informao que detemos no
momento em que se decide realizar o teste estatstico. O teste servir para se
concluir se a conjectura dada pela hiptese nula ou no correcta. A hiptese
nula considerada verdadeira ao longo do procedimento do teste, at ao
momento em que haja evidncia estatstica clara apontando em sentido
contrrio.
A hiptese nula:
reflecte a situao em que no h mudana (pode ser resultado de uma experincia passada);
o que se aceita por defeito;
contm sempre uma igualdade e deve ser formulada por forma a ser possvel conhecer a distribuio da estatstica amostral a utilizar
(designada por estatstica de teste), no pressuposto de que 0H
verdadeira.
Voltando ao exemplo dos CTT, s ser aberto um novo balco se a amostra
evidenciar essa necessidade, at l damos crdito hiptese nula.
A hiptese alternativa a hiptese que contm a informao relativa dvida
que suscitou a realizao do teste. Vai reflectir o conjunto de valores que o
parmetro poder assumir, caso a hiptese nula seja rejeitada. Contm sempre
uma desigualdade (>, ; unilateral esquerdo quando aH tiver a desigualdade
A Deciso
Num teste de hipteses o objectivo o de tomar uma deciso, em consequncia
da existncia de razes para rejeitar ou no a hiptese nula. Esta deciso
baseada na informao disponvel, obtida a partir da amostra recolhida da
populao. No caso de se rejeitar 0H , aceita-se como vlida a hiptese
alternativa.
3.3 ERROS NOS TESTES DE HIPTESES
A uma deciso (rejeitar ou no 0H ) est sempre associado um risco, o risco de
tomar uma deciso errada. No caso dos testes de hipteses a tomada de deciso,
para a populao, baseada na informao amostral, pelo que se podem
cometer erros. Uma caracterstica favorvel dos testes de hipteses a
possibilidade de controlar ou minimizar o risco associado s decises erradas.
Vamos supor que o parmetro populacional a testar . Para nos referirmos ao domnio do parmetro proposto pela hiptese nula utilizamos 0 e pela hiptese alternativa a . Na figura 3.1 apresentam-se, de modo resumido, as situaes possveis relativas tomada de deciso, quando se realiza um teste de
hipteses.
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
5
Tipos de erros associados deciso tomada
Situao Real Deciso
0H verdadeira 0H falsa
Rejeitar 0H Deciso incorrecta
P (rejeitar 0H | 0H verdadeira) Erro Tipo I
Deciso correcta P (Rejeitar 0H | 0H falsa) = 1-
No rejeitar 0H
Deciso correcta P (No rejeitar 0H | 0H verdadeira)>
1
Deciso incorrecta P (No rejeitar 0H | 0H falsa) =
Erro Tipo II
Erro do Tipo I ou erro de 1 espcie
O erro de Tipo I ocorre quando se decide rejeitar 0H , sendo 0H verdadeira, ou
seja, rejeita-se indevidamente a hiptese nula. A probabilidade de ocorrncia do
erro de Tipo I chama-se nvel de significncia do teste e representa-se por . [ ] [ ]Errode ipo I rejeitar | verdadeirao oP T P H H =
Ao fixarmos o valor mximo de , estamos a limitar os custos incorridos ao poder tomar a deciso errada associada a este tipo de erro.
Erro do Tipo II ou erro de 2 espcie
O erro de Tipo II ocorre quando se decide no rejeitar 0H , sendo 0H falsa. A
probabilidade de ocorrncia do erro de Tipo II representa-se por . Se 0H falsa, o verdadeiro valor do parmetro ser compatvel com a hiptese alternativa e
como tal o valor de calculado em funo dos valores ( a ) que o parmetro toma, segundo a hiptese alternativa.
[ ] [ ] [ ]( ) Errode tipoII no rejeitar | falsa no rejeitar |a o o o aP P H H P H = = = = O valor desta probabilidade diminui medida que o verdadeiro valor do
parmetro , neste caso a se afasta de 0 . Voltando ao exemplo, vamos ver o significado dos erros possveis. Recordemos
as hipteses a testar:
0 : 5H : 5aH >
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
6
Erro de Tipo I: Decide-se abrir um novo balco, no entanto a realidade no o
justifica.
Erro de Tipo II: No se abre um novo balco, mantm-se tudo como est e no
entanto as pessoas esperam em mdia mais do que cinco minutos. Deveria ter-
se decidido abrir um novo balco.
importante notar que, em geral, se atribui mais importncia ao erro de Tipo I,
uma vez que em 0H que acreditamos, at que exista evidncia estatstica em
contrrio. Rejeitar a hiptese nula como abandonar um hbito, e
consequentemente a possibilidade de cometer um erro do Tipo I (rejeitar 0H
incorrectamente) encarada com preocupao. Consideramos mais grave abrir
um novo balco de forma injustificada (fazer um investimento desnecessrio),
do que no realizar o investimento quando o deveramos ter feito.
Potncia do Teste A potncia do teste, 1 = , com 0 1< < , a probabilidade ou risco de rejeitar a hiptese nula 0H , quando esta falsa, decidindo de forma acertada.
[ ] [ ]( ) 1 ( ) rejeitar | falsa rejeitar |a a o o o aP H H P H = = = = . Quanto mais prximo a estiver de 0 , menos potente o teste, pois esta proximidade dificulta a distino entre os verdadeiros e os falsos valores.
3.4 ESTATSTICA DE TESTE E REGIES CRTICAS A Estatstica de Teste uma funo das observaes amostrais cujo valor vai
determinar a deciso a tomar, rejeitar ou no 0H . A estatstica de teste tem que
ter distribuio conhecida, quando a hiptese nula verdadeira, e o seu valor
calculado nesse pressuposto.
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
7
Regra de Deciso Estatstica uma regra que nos indica a deciso a tomar (rejeitar ou no 0H ), a partir da
comparao do valor da estatstica de teste com um ou mais valores crticos
(ser um valor critico para os testes unilaterais e dois para os testes bilaterais).
Regio crtica ou de rejeio (R.C. ou R.R.)
constituda por um conjunto de valores tomados pela estatstica de teste, que
conduzem rejeio da hiptese nula.
Regio de aceitao (R.A.)
constituda por um conjunto de valores tomados pela estatstica de teste, que
conduzem no rejeio da hiptese nula.
Valor de prova - p ou p-value
O valor de prova, p, define-se como o menor nvel de significncia, , a partir do qual se rejeita a hiptese nula. Calcular o valor de prova p, calcular a
probabilidade do erro de 1 espcie, correspondente a rejeitar a hiptese nula
para a amostra observada, ou seja, para o valor da estatstica de teste que foi
observado. Fixado o nvel de significncia , a deciso de rejeitar a hiptese nula verifica-se se e s se p .
3.5 METODOLOGIA A metodologia a utilizar na realizao de um teste de hipteses, envolve as
seguintes etapas:
1) Formulao das hipteses 0H e aH ;
Consoante as hipteses formuladas, identificar o teste como:
Unilateral direito, quando aH contiver a desigualdade>;
Unilateral esquerdo quando aH contiver a desigualdade
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
9
Para que seja mais acessvel entender como se realiza um teste de hipteses,
vamos comear por dar um exemplo que retrata o caso mais simples A
populao tem distribuio normal de parmetros e . A partir da populao que se caracteriza por ( , )X N , obteve-se uma amostra aleatria de dimenso n, composta por variveis i.i.d. 1,..., nX X , da qual se obtm uma
realizao concreta, 1( ,..., )nx x .
Exemplo 3.2: Uma empresa apresentou uma nova mquina para
empacotamento automtico de bolachas e divulgou que garantia o
empacotamento de uma mdia de 60 pacotes por minuto, com um desvio
padro de 3 pacotes. O nmero de pacotes embalados por minuto segue uma
distribuio aproximadamente normal.
Uma fbrica de bolachas ps a mquina experincia nas suas instalaes e,
registando o nmero de pacotes embalados em 25 perodos de um minuto,
constatou uma mdia de 58 pacotes embalados.
O comprador potencial diz que a mquina no garante atingir a mdia de 60
pacotes por minuto. Por seu lado, o vendedor garante que a diferena
encontrada se deve apenas ao acaso e que de modo nenhum pe em causa a
mdia publicitada.
1) Formulao das hipteses;
: 60oH = vs : 60aH <
Pretende-se verificar se a diferena encontrada mesmo devido ao acaso, isto ,
se no h evidncia estatstica para rejeitar a hiptese de que a mdia seja igual
a 60. A hiptese nula reflecte a posio do vendedor. At prova em contrrio, o
comprador deposita confiana na informao dada pelo vendedor. A
metodologia do teste procurar validar oH . Se a evidncia da amostra fornecer
informao (mdia amostral) significativamente inferior a 60, ento rejeita-se
oH .
A hiptese alternativa consistir naquilo que se considera razovel aceitar, no
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
10
caso de rejeitar oH . A hiptese alternativa reflecte a posio do comprador.
2) Fixar o nvel de significncia do teste;
Nvel de significncia do teste: 0,05 = (valor fixado partida) Na ausncia de informao sobre o valor de , os valores geralmente utilizados so 5%, 2,5% e 1%.
3) Escolha da estatstica de teste e identificao da respectiva distribuio
amostral;
Neste caso estamos a realizar inferncia sobre a mdia populacional , numa populao com distribuio normal, com desvio padro conhecido. Recordando
as distribuies amostrais abordadas, sabemos que a estatstica amostral a
utilizar para inferir sobre o parmetro populacional a mdia amostral, X . Na condio da hiptese nula ser verdadeira, sabemos tambm que a
distribuio amostral da estatstica :
0,X N n o que, procedendo estandardizao equivalente a
( )0 0,1XZ Nn
= .
Atendendo aos dados fornecidos neste exemplo, e considerando verdadeira a
hiptese nula, temos 360,5
X N . Por outro lado, o valor observado de X , para a amostra dada 58x = . O que se pretende averiguar se de facto o valor mdio da amostra de 58
pacotes por minuto compatvel com a veracidade da hiptese nula.
Como a hiptese alternativa, : 60aH < , aponta para valores que se encontram esquerda do valor dado pela hiptese nula, tendo fixado a probabilidade de
rejeitar indevidamente 0H em 0,05 (nvel de significncia de 5%), a regio crtica
vai situar-se na aba esquerda.
4) Determinar a regio de rejeio de acordo com o valor fixado para , e definir a regra de deciso;
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
11
A regra de deciso consiste em definir a aco a tomar (rejeio ou no da
hiptese nula) face ao resultado da amostra. Vamos determinar duas regies
complementares: regio crtica ou de rejeio e regio de no rejeio ou de
aceitao.
Com ( )0 0,1XZ Nn
= , por consulta da tabela da funo de distribuio da
Normal reduzida, obtemos o valor de z para o qual a probabilidade acumulada
igual a 0,05, ou seja, por inverso:
1 1 1(0,05) (1 0,05) (0,95) 1,645 = = = , logo 0,05 1,645.z =
Na figura 3.1 identificamos a tracejado a regio crtica deste teste unilateral
esquerdo.
Temos assim . . :] , 1,645] e . . :] 1,645, [RR R A + .
Figura 3.1
A deciso tem origem na comparao do valor da estatstica de teste (o valor da
abcissa dado por 0x
n
) com o quantil da funo de distribuio da normal
reduzida. Vamos rejeitar a hiptese nula se o valor observado da estatstica de
teste pertencer regio crtica. O facto de utilizarmos o valor da abcissa
estandardizada facilita, dado assim ser possvel consultar os valores crticos da
tabela da distribuio normal.
Regra de deciso em funo da varivel Z:
Se z -1.645, rejeitar 0H
densidade da (0,1)N
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
12
Se z > -1.645, no rejeitar 0H
Com os dados deste exemplo obtemos o valor observado da estatstica de teste: = = < 58 60 3,333 1,645
3 / 5obsZ , pelo que se decide rejeitar 0H , dado que o
valor observado pertence regio critica. Na tomada de deciso, em alternativa ao processo anterior, podemos definir a
regra de deciso em funo de X , determinando o valor crtico cx , que por
comparao com o valor observado de X , permite tomar a deciso de rejeitar
ou no a hiptese nula.
Regra de deciso em funo da mdia amostral X : Na figura 3.2 apresenta-se esquerda a regio crtica (a tracejado) e direita a
regio de aceitao, agora em funo do valor crtico cx .
Figura 3.2
Vamos ver como proceder para calcular cx : Fixar o nvel de significncia em 5% ( 0,05 = ), quer dizer que a probabilidade de rejeitar a hiptese nula quando ela verdadeira de 0,05.
[ ]0 0 0
10
rejeitar | verdadeira 0,05 | 60 0,05
60 60 600,05 0,05 (0,05)0,6 0,6 0,6
60 1,645 59,01.0,6
c
c c c
cc
P H H P X x
X x x xP P Z
nx x
= = = = = = = = =
Com x o valor observado de X , temos as seguintes possibilidades: - se x 59.01, deve rejeitar-se 0H ;
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
13
- se x > 59.01, no se deve rejeitar 0H . O valor fornecido pela amostra, x = 58 = = = > = = =
Com 0,05 = , a potncia do teste, para este valor da hiptese alternativa ser dada por:
0 0[rejeitar | falsa] 1 0,493 0,507.P H H = = Se 58a = temos:
0( 58) [norejeitar | 58] [ 59,01| 58]
59,01 58 1 ( 1,683) 1 (1,683) 1 0,953 0,046.0,6
a a a
a
P H P X
XP P Z
n
= = = = > = = = > = = = =
Com 0,05 = , a potncia do teste, para este valor da hiptese alternativa ser o completar desta probabilidade, ou seja:
0 0[rejeitar | falsa] 1 0,0462 0,9538.P H H = = Se 57a = temos:
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
15
0( 57) [norejeitar | 57] [ 59,01| 57]
59,01 57 1 ( 3,35) 1 (3,35) 0,0004.0,6
a a a
a
P H P X
XP P Z
n
= = = = > = = = > = = =
A potncia do teste vai por consequncia aumentar. Para este valor da hiptese
alternativa temos:
0 0[rejeitar | falsa] 1 0,0004 0,9996.P H H = =
Concluses para o teste unilateral esquerdo:
Verifica-se que o valor de diminuiu medida que o verdadeiro valor de se afasta de 0 . Realmente torna-se mais difcil errar medida que o valor verdadeiro do parmetro se afasta do valor proposto pela hiptese nula.
Ao contrrio do que foi observado para , quanto mais prximo do valor de 0 estiver o valor de a , menos potente o teste, o que quer dizer que tem
menos capacidade para decidir de modo acertado.
Nota: Se realizarmos este tipo de estudo para um teste unilateral direito ou para um
teste bilateral constatamos que o tipo de hiptese alternativa condiciona a forma
da funo potncia.
3.7 TESTES DE HIPTESE PARA UMA POPULAO
Vamos agora apresentar e caracterizar os testes de hiptese para um parmetro
de uma populao. A estatstica de teste que vamos utilizar e a sua distribuio amostral depende da distribuio da populao, do conhecimento
ou no do parmetro de escala e da dimenso da amostra.
3.7.1 Teste de Hiptese para a mdia
Vamos supor uma populao a partir da qual se obteve uma amostra aleatria
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
16
de dimenso n, composta por variveis i.i.d. 1,..., nX X , da qual resultou uma
realizao concreta 1( ,..., )nx x . Pretende-se realizar um teste de hipteses para a
mdia da populao .
Se a varincia for conhecida (caso do exemplo tratado), e a distribuio da
populao normal, a estatstica de teste a utilizar :
( )0 0,1XZ Nn
=
(Note-se que neste caso a estatstica de teste e a sua distribuio independente da dimenso
amostral.)
Se a distribuio da populao no for conhecida, com a varincia conhecida e
a amostra grande, 30n > , a estatstica de teste a utilizar :
( )0 0,1XZ Nn
= (esta distribuio amostral um resultado do Teorema do
Limite Central)
Apresentam-se esquematicamente na figura 3.3 as regies crticas, definidas em
termos da varivel Z, para o teste de hipteses para a mdia, 0 0:H = , considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.
Tipo de Teste aH : 0 Bilateral
aH : 0 > Unilateral direito
aH : 0 < Unilateral esquerdo
Teste Z Quando a estatstica de teste tem distribuio exacta ou aproximadamente normal reduzida.
Figura 3.3
Se a varincia for desconhecida, que o caso que mais prximo est da
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
17
realidade, teremos de estimar o desvio padro da populao pois necessitamos
dele para calcular o valor do desvio padro do estimador X . Um processo
bastante intuitivo ser utilizar como estimador de 2 , no caso de amostras pequenas, a varincia amostral corrigida
2 2 2
2 2'1 1
( )
1 1
n n
i ii i
X X X nXS S
n n= =
= =
e respectivo desvio padro amostral corrigido ' 2'S S= . No caso de amostras grandes utilizamos a varincia amostral
2 2 2
2 21 1
( )n n
i ii i
X X X nXS S
n n= =
= =
e respectivo desvio padro amostral 2S S= .
Neste caso a estatstica de teste que se utiliza, j no tem a mesma distribuio
amostral, sob a veracidade da hiptese nula, ver Pestana, D. (2006). Temos
agora uma outra varivel aleatria cuja distribuio amostral a T-Student,
(Student 1908).
Assim, para pequenas amostras ( 30n ), utiliza-se a estatstica de teste 0
1,nXT tS
n
=
e para amostras grandes, 30n > , utiliza-se a distribuio amostral limite da T-Student que aproximadamente normal,
0 (0,1)XT NSn
= .
A figura 3.4 apresenta esquematicamente as regies crticas definidas em
termos da varivel T, para o teste de hipteses mdia 0 0:H = , considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
18
Tipo de Teste aH : 0
Bilateral
aH : 0 > Unilateral direito
aH : 0 < Unilateral esquerdo
Teste T Quando a estatstica de teste tem distribuio T-Student.
Figura 3.4
Exemplo 3.3: Teste de Hipteses para a mdia de uma populao normal com
varincia desconhecida ( 30n ) Foram medidos em quilogramas os aumentos de peso (da nascena aos seis
meses) de 7 crianas do sexo feminino escolhidas ao acaso entre um grupo de
crianas com seis meses de idade.
3,6 2,8 3,6 4,1 4,1 4,5 3,2
(a) Ao nvel de significncia de 5%, poder dizer-se que o aumento mdio
de peso superior a 3,1Kg?
(b) A partir de que nvel de significncia a hiptese testada na alnea
anterior rejeitada?
(c) Calcula a potncia do teste para 3,4a = .
Resoluo:
Seja a varivel X : aumento de peso, em Kg, numa criana do sexo feminino
com seis meses de idade.
( , ) 0,05X N = Sobre a amostra: 27 3,7 0,34 0,34 0,5831n x s s = = = = = (a) Vamos testar 0 : 3,1 : 3,1aH vs H > Trata-se de um teste unilateral direito
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
19
Estatstica de teste: 0 1nXT tS
n
=
Regio de aceitao (R.A.): 6;0,95] , [ ] ,1,943[t = Regio de rejeio ou crtica (R.R.): 6;0,95[ , [ [1,943, [t + = + Valor observado para a estatstica de teste no pressuposto da veracidade da
hiptese nula: 3,7 3,1 2,7225 R.R.0,5831/ 7obs
T = =
Deve rejeitar-se a hiptese nula, ao nvel de significncia de 5%, o que quer
dizer que a amostra contm evidncia estatstica de que o aumento mdio de
peso nas crianas do sexo feminino com seis meses de idade de facto superior
a 3,1Kg.
(b) O que se pede o valor de prova p.
( ) ( 2,7225) 1 ( 2,7225) 1 0,9827 0,0173.obsP T T P T P T> = > = = =
Para valores do nvel de significncia superiores a 1,73% a hiptese nula
rejeitada, o que quer dizer que valor-p 0,0173.
(c) 0 0(3,4) 1 (3,4) (rejeitar | ser falsa)P H H = = . Como o teste unilateral direito, rejeita-se a hiptese nula quando
01;1
0,58311,9432 1,9432 3,1 3,528/ 7obs n
xT t x xs n
> > > + > , logo
3,528cx = , vindo para a potncia correspondente a 3,4a = , 3,528 3,4(3,4) ( 3,528 | 3,4) 1 ( ) 1 ( 0,580786) 1 0,2910,5831/ 7
0,7087.
aP X P T P T = > = = = = ==
A potncia do teste de aproximadamente 71%, ou seja, de 71% a
probabilidade de tomar uma deciso acertada, rejeitar a hiptese nula quando
esta falsa.
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
20
3.7.2 Teste de Hiptese para a varincia Considerando uma populao normal podemos estar interessados em realizar
um teste de hipteses varincia da populao. Sendo 2S um estimador no enviesado de 2 , e conhecida a distribuio amostral da estatstica
22
120
( 1).n
n SQ = , esta a estatstica a utilizar.
A figura 3.5 apresenta esquematicamente as regies crticas definidas em
termos da varivel Q, para o teste de hipteses varincia 2 20 0:H = , considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.
Tipo de Teste aH : 2 2
0 Bilateral
aH : 2 2
0 > Unilateral direito
aH : 2 2
0 < Unilateral esquerdo
Teste 2 Quando a estatstica de teste tem distribuio do Qui-quadrado.
Figura 3.5
Exemplo 3.4: Teste de Hipteses para a varincia
Para verificar se um determinado aparelho de medio de alta preciso ainda
funciona com as caractersticas exigidas foram observadas 20 medies e
calculado o desvio padro amostral corrigido, = 0,013s mm . Admitindo que as referidas medies se podem considerar gaussianas, ao nvel de significncia de
5%, poder-se- concluir que o verdadeiro desvio padro populacional de
0,01mm?
Resoluo:
Seja a varivel X : medies efectuadas pelo aparelho em mm.
( , ) 0,05X N =
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
21
Sobre a amostra: 20 0,013n s= = (a) Vamos testar 0 : 0,01 : 0,01aH vs H = Trata-se de um teste bilateral
Estatstica de teste: 2
212
0
( 1).n
n SQ =
Regio de aceitao (R.A.): ]8,907,32,85[
Regio crtica (R.R.): [0,8.907] [32.85, [ + , onde 2 219;0,025 19;0,9758,907 32,85e = = .
Valor observado para a estatstica de teste no pressuposto da veracidade da
hiptese nula: 2 2
2 20
( 1). 0,01319 32,110,01obs
n SQ = = =
Como 32,11 se encontra na regio de aceitao, conclui-se ao nvel de
significncia de 5%, que o verdadeiro desvio padro de 0,01 mm.
Para calcular o valor de prova p, como temos um teste bilateral, procede-se da
seguinte forma:
{ }0 0 0(rejeitar | verdadeira) ( . . | )
2 min ( 32,11), ( 32,11) 2 min{0,9696;0,0304} 0,0607.obsp value P H H P Q RC
P Q P Q = = = =
= < > = =
Para este teste a hiptese nula rejeitada para nveis de significncia superiores
a 6,07%.
3.7.3 Teste de Hiptese para a proporo Considerando agora uma populao de Bernoulli, a partir da qual se obteve
uma amostra aleatria de dimenso grande (n> 30), composta por variveis
i.i.d. 1,..., nX X , da qual resultou uma realizao concreta 1( ,..., )nx x . Pretende-se
realizar um teste de hipteses para a mdia da populao, que neste caso a
proporo populacional p, o parmetro da distribuio de Bernoulli que
representa a probabilidade de sucesso numa prova de Bernoulli.
Assim, para amostras grandes, a distribuio amostral do estimador de p,
= X p ,
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
22
( ) ( )0
00 0
0;1 .
1p pZ Np p
n
=
Como a estatstica de teste tem distribuio aproximadamente normal, temos
um teste Z tal como se verificou no teste de hipteses para a mdia com
varincia conhecida.
A figura 3.6 apresenta esquematicamente as regies crticas definidas em
termos da varivel Z, para o teste de hipteses proporo populacional,
0 0:H p p= , considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.
Tipo de Teste aH : 0p p Bilateral
aH : 0p p> Unilateral direito
aH : 0p p< Unilateral esquerdo
Teste Z Quando a estatstica de teste tem distribuio exacta ou aproximadamente normal reduzida.
Figura 3.6
3.8 TESTES DE HIPTESE PARA DUAS POPULAES
Vamos, no que se segue, apresentar o teste de hipteses a utilizar quando o
objectivo comparar duas populaes.
3.8.1 Teste de Hiptese para a diferena de duas mdias
Vamos considerar duas populaes 1 2eX X , cujas mdias so respectivamente
1 2e . Destas populaes so retiradas de forma aleatria duas amostras independentes de dimenso 1 2en n , cujas mdias amostrais so 1 2X e X
respectivamente.
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
23
Pretende-se realizar um teste de hipteses para comparar as duas mdias
populacionais, portanto vamos realizar um teste relativo diferena 1 2 . As nossas hipteses, tendo em conta os trs tipos de teste so:
0 1 2 0
1 2 0
1 2 0
1 2 0
:
: teste bilateral
teste unilateral direito
teste unilateral esquerdo
a
H vs
H
= > 30 e n > 30 ),
usam-se as varincias amostrais, e a estatstica
( ) ( ) ( )1 2 1 2 00 2 21 2
1 2
0;1X X
Z NS Sn n
=+
).
Deve ter-se conscincia que frequentemente, as varincias 2 21 2e no so conhecidas. Nesse caso, temos de ter um teste que nos permita testar a
igualdade das mdias populacionais sem conhecer os verdadeiros valores 2 21 2e . bastante mais simples desenvolver este teste, quando, embora
desconhecidas, as varincias se podem admitir iguais (caso em que se diz existir
homocedasticidade 2 2 21 2 = = ). No caso em que as varincias so desconhecidas, parece mais lgico
primeiramente testar a igualdade das varincias e num segundo passo optar
com racionalidade pela estatstica de teste mais favorvel para testar a hiptese
nula de igualdade das mdias.
3.8.2 Teste de Hiptese para a igualdade de duas varincias em Populaes
Normais
Vamos considerar duas populaes normais 1 2eX X , cujas mdias so
respectivamente 1 2e . Destas populaes so retiradas de forma aleatria duas amostras independentes de dimenso 1 2en n , respectivamente. Vamos
realizar um teste que permita comparar as duas varincias.
Dado que conhecemos os estimadores amostrais das varincias populacionais 2 21 2e :
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
25
1 1
2 2
2 2 21 1 1 1
2 21 11 1
1 1
2 2 22 2 2 2
2 21 12 2
2 2
( )
1 1
( )
1 1
n n
i ii i
n n
i ii i
X X X nXS S
n n
X X X nXS S
n n
= =
= =
= =
= =
bem como a distribuio amostral da estatstica 2
12
2
SS , que sob a veracidade da
hiptese nula vem:
( ) =
2 21 2
1 22 22 1 0
1; 1SF F n nS
.
A figura 3.7 apresenta esquematicamente as regies crticas definidas em
termos da varivel F, para o teste igualdade das varincias, 2 20 1 2:H = considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.
Tipo de Teste aH :
2 21 2 Bilateral aH :
2 21 2 >
Unilateral direito aH :
2 21 2 <
Unilateral esquerdo
Teste F Quando a estatstica de teste tem distribuio F-Snedcor.
Figura 3.7
Exemplo 3.5: Teste de Hipteses para o quociente de duas varincias
No primeiro ano de vida dois grupos aleatrios de crianas foram sujeitos a
diferentes suplementos vitamnicos designados por suplemento A e suplemento
B. Os dados que se seguem representam duas amostras dos ganhos de peso, em
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
26
Kg, dessas crianas.
Sup. A 2,7 3,2 3,6 4,1 2,7 3,2 4,5 3,6 2,7
Sup. B 4,1 4,5 3,6 2,7 3,6 3,2 4,1
Supondo que as referidas crianas tinham nascena pesos idnticos e que os
seus pesos se podem considerar normais, pretende-se:
(a) Ao nvel de significncia de 5%, concluir se a variabilidade populacional
dos dois grupos igual;
(b) Determinar o valor de prova - p e a sua interpretao;
Resoluo:
(a) Considerem-se as variveis:
1X : ganho em peso medido em Kg das crianas sujeitas ao suplemento A
2X : ganho em peso medido em Kg das crianas sujeitas ao suplemento B
1 1 1 2 2 2( , ) e ( , )X N X N Sobre as amostras temos:
21 1 1
22 2 2
9 3,3667 0,4150
7 3,6857 0,3714
n x s
n x s
= = == = =
Vamos testar as hipteses:
= = 2 2
2 2 2 2 1 10 1 1 1 2 0 2 2
2 2
: : : 1 : 1a aH vs H H vs H (temos um teste bilateral)
Estatstica de teste:
( ) = = =
2 2
1 21 2 1 22 2
2 1 0
1; 1 , com 1 15 e 1 20SF F n n n nS
Regio de aceitao (R.A.): ] [8;6;0,025 8;6;0,975] ; [ 0,215;5,6F F = Regio de rejeio (R.R.): 8;6;0,025 8;6;0,975[0; ] [ , [ [0;0,215] [5,6; [F F + = + Valor observado para a estatstica de teste no pressuposto da veracidade da
hiptese nula: 00,4150 1 1,1173 R.A.0,3714bs
F = =
INFERNCIA ESTATSTICA
___________________________________________________________________ ISEL DEETC
27
Como 1,1173 se encontra na regio de aceitao, conclui-se ao nvel de
significncia de 5%, que a verdadeira variabilidade nos pesos no diferente
quando se utiliza o suplemento A ou B.
(b) valor de prova p:
{ }
21
0 0 22
(rejeitar | verdadeira) ( . . | 1)
2 min ( 1,1173);1 ( 1,1173) 2 min{0,5409;0,4591} 0,9181.
obsp value P H H P F RC
P F P F
= = = =
= < < = =
A hiptese nula s rejeitada para nveis de significncia superiores a 91,81%.
3.8.3 Teste de Hiptese para a igualdade de mdias em Populaes normais
com varincias desconhecidas
3.8.3.1 Varincias desconhecidas mas iguais 2 2 21 2 = = Vamos considerar duas populaes normais 1 2eX X , cujas mdias so
respectivamente 1 2e . Destas populaes so retiradas de forma aleatria duas amostras independentes cujas mdias so 1 2X e X e as dimenses
1 230 e 30n n , respectivamente. Pretende-se realizar um teste de hipteses para comparar as duas mdias
populacionais, portanto vamos realizar um teste relativo diferena 1 2 . As nossas hipteses, tendo em conta os trs tipos de teste so:
0 1 2 0
1 2 0
1 2 0
1 2 0
:
: teste bilateral
teste unilateral direito
teste unilateral esquerdo
a
H vs
H
= >