Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
1
PODER DO TESTE
Poder do Teste e Tamanho de Amostra para Testes de Hipóteses
2
3
Tipos de erro num teste estatístico
Realidade
(desconhecida)
Decisão do teste
aceita H0 rejeita H0
H0 verdadeira decisão correta
(probab = 1 – )
erro tipo I
(probab = )
H0 falsa erro tipo II
(probab = )
decisão correta
(probab = 1 – )
P(erro tipo I) = P(rejeitar H0 | H0 é verdadeira) =
P(erro tipo II) = P(aceitar H0 | H0 é falsa) =
4
Poder do teste
Definimos poder de um teste estatístico como a probabilidade do teste rejeitar H0 quando H0 é realmente falsa, ou seja, o poder de um teste é igual a 1 – .
O poder do teste dependerá de alguns fatores:
Do nível de significância adotado;
Da distância entre o valor “real” do parâmetro e o considerado verdadeiro em H0.
Da variabilidade da população.
Do tamanho da amostra retirada.
5
Exercício 18 – Capítulo 8
Num certo banco de dados, o tempo para a realização das buscas é aproximadamente normal com média 53 s e desvio padrão 14 s. Modificou-se o sistema para reduzir o tempo. Foram contados os tempos para 30 buscas. Admita que as 30 observações possam ser consideradas uma amostra aleatória e que não houve alteração na variância. Use = 1%. Calcule o poder do teste se a verdadeira média de tempo fosse de:
40s, 41s, 42s, 43s, 44s, 45s, 46s, 47s, 48s, 49s, 50s, 51s, 52s.
6
Resolução – 1ª parte
H0: = 53 s
H1: < 53 s
= 0,01, n = 30, = 14 s
326,2Zc
05,4730
14326,2530
nZX cc
7
Resolução 2ª parte
Média “real” = 45 s 80,0
30/14
4505,47Z
Poder = 0,7892
= 0,2108
Curvas Características de Operação
8
00,10,20,30,40,50,60,70,80,9
1
40 41 42 43 44 45 46 47 48 49 50 51 52 53 54
Po
de
r
Média real
Curvas Características de Operação
30
60
Poder do teste de 1 média – σ2 desconhecida
Variável de teste: t de Student com n – 1 graus de liberdade.
Calcular a probabilidade de aceitar H0 quando H0 é falsa (probabilidade de erro tipo II - ), ou o complementar, o poder do teste.
Quando o verdadeiro valor da média é μ = μ0 + d (H0 falsa) a distribuição passa a ser a t não central, com n-1 graus de liberdade e parâmetro de não centralidade
Se = 0, a distribuição t não central passa a ser a distribuição t usual.
9
nsdsnd )/(/)(
Distribuição t não central
Dois parâmetros: graus de liberdade (>0), e não centralidade (∈ ).
10
Procedimentos: teste 1 média – σ2 desconhecida
Supondo que a média real seja μ, a média testada em H0 seja μ0, e s uma estimativa confiável de σ.
Cálculo de PODER DO TESTE para uma amostra n.
Definir efeito em número de desvios padrões.
Teste unilateral à direita: d = ( - 0)/s (d +)
Teste unilateral à esquerda: d = ( - 0)/s (d -)
Teste bilateral: d = ( - 0)/s (d + ou d-)
Definir significância, n.
Usar aplicativo computacional (R, GPower, Minitab).
11
Procedimentos: teste 1 média – σ2 desconhecida
Supondo que a média real seja μ, a média testada em H0 seja μ0, e s uma estimativa confiável de σ.
Cálculo de TAMANHO DE AMOSTRA para certo poder.
Definir efeito em número de desvios padrões.
Teste unilateral à direita: d = ( - 0)/s (d +)
Teste unilateral à esquerda: d = ( - 0)/s (d -)
Teste bilateral: d = ( - 0)/s (d + ou d-)
Definir significância, poder requerido para o teste.
Usar aplicativo computacional (R, GPower, Minitab).
12
13
Exercício 19 – Capítulo 8
Um certo tipo de pneu dura, em média, 50.000 km. O fabricante investiu em uma nova composição de borracha para pneus, objetivando aumentar sua durabilidade. Vinte pneus, fabricados com esta nova composição, apresentaram desvio padrão de 4.000 km. Use = 1%. Calcule o poder do teste se a verdadeira média de durabilidade dos pneus fosse de:
55000 km, 54000 km, 53000 km, 52000 km, 51000 km.
Desvios padrões (d/s): 1,25; 1,00; 0,75; 0,50; 0,25
t tests - Means: Difference from constant (one sample case)
Analysis: Post hoc: Compute achieved power
Input: Tail(s) = One
Effect size d = 0.75
α err prob = 0.01
Total sample size = 20
Output: Noncentrality parameter δ = 3.3541020
Critical t = 2.5394832
Df = 19
Power (1-β err prob) = 0.7838418
14
CCO no GPower
15
t tests - Means: Difference from constant (one sample case)
Analysis: A priori: Compute required sample size
Input: Tail(s) = One
Effect size d = 0.75
α err prob = 0.01
Power (1-β err prob) = 0.95
Output: Noncentrality parameter δ = 4.1758233
Critical t = 2.4572615
Df = 30
Total sample size = 31
Actual power = 0.9512543
16
CCO no GPower
17
Poder do teste de 1 proporção
Aproximações:
Distribuição normal:
Variável z, semelhante à média com 2 conhecida.
Definir hipóteses, , ’ e 0.
Encontrar Zc (de acordo com H1 e ).
18
nZp cc
)1( 000
n
pZ c
)'1('
'
Poder do teste de 1 proporção
Aproximações:
Arco seno (R, Action):
Definir hipóteses, n, , ’ e 0.
Encontrar Zc (de acordo com H1 e ).
Encontrar Z’0
19
nAsenAsenZ 0' 2'20
0' ZZZ c
Poder do teste de 1 proporção
Método exato: usando distribuição binomial (GPower):
Definir hipóteses, n, , ’ e 0.
Cálculo do poder usando a distribuição binomial.
Obter o número de “sucessos” na amostra associado a , considerando uma binomial com n sucessos e 0.
Usar o número de “sucessos” acima em uma binomial com n sucessos e ’, calcular o poder associado.
20
Exemplo de proporção
Imagine teste de hipóteses de proporção:
H0: = 0,3
H1: > 0,3
= 0,05; n = 200
a) Obter o poder do teste para ‘ = 0,35.
b) Obter o tamanho mínimo de amostra para detectar com 95% de probabilidade que ‘ é igual 0,35.
21
Exact - Proportion: Difference from constant (binomial test, one sample case)
Analysis: Post hoc: Compute achieved power
Input: Tail(s) = One
Effect size g = 0.05
α err prob = 0.05
Total sample size = 200
Constant proportion = 0.3
Output: Lower critical N = 72.0000000
Upper critical N = 72.0000000
Power (1-β err prob) = 0.4093024
Actual α = 0.0396283
22
Exact - Proportion: Difference from constant (binomial test, one sample case)
Analysis: A priori: Compute required sample size
Input: Tail(s) = One
Effect size g = 0.05
α err prob = 0.05
Power (1-β err prob) = 0.95
Constant proportion = 0.3
Output: Lower critical N = 312
Upper critical N = 312
Total sample size = 960
Actual power = 0.9519557
Actual α = 0.0497407 23
Procedimentos: teste 2 médias
Obter sd:
Das diferenças – teste de 2 médias – grupos pareados.
Agrupado – teste de 2 médias – grupos independentes.
Cálculo de PODER DO TESTE para uma amostra n.
Definir efeito em número de desvios padrões.
Teste unilateral à direita: d/sd (d +)
Teste unilateral à esquerda: d/sd (d -)
Teste bilateral: d/sd (d + ou d-)
Definir significância, n (ou n1 e n2).
Usar aplicativo computacional (R, GPower, Minitab).
24
Exemplo de 2 médias (grupos independentes)
Exemplo 2 da Aula10.
H0: μ1 - µ2 = 0
H1: μ1 - µ2 > 0
Nível de significância: = 0,05; 1- = 0,95, n1 = 8, n2 = 10.
Grupos independentes, 21 e 2
2 desconhecidas: teste F de diferença entre variâncias indicou igualdade.
sd = 0,6023
Calcule o poder do teste se a diferença entre as médias fosse de 0,5 minutos.
d = 0,5/0,6023 = 0,83 desvios padrões
25
t tests - Means: Difference between two independent means (two groups)
Analysis: Post hoc: Compute achieved power
Input: Tail(s) = One
Effect size d = 0.83
α err prob = 0.05
Sample size group 1 = 8
Sample size group 2 = 10
Output: Noncentrality parameter δ = 1.7497936
Critical t = 1.7458837
Df = 16
Power (1-β err prob) = 0.5121147
26
27