PODER DO TESTE - UFSCmarcelo.menezes.reis/Aula10CPGCC2019.pdf · O poder do teste dependerá de alguns fatores: Do nível de significância adotado; Da distância entre o valor “real”

1

PODER DO TESTE

Poder do Teste e Tamanho de Amostra para Testes de Hipóteses

2

3

Tipos de erro num teste estatístico

Realidade

(desconhecida)

Decisão do teste

aceita H0 rejeita H0

H0 verdadeira decisão correta

(probab = 1 – )

erro tipo I

(probab = )

H0 falsa erro tipo II

(probab = )

decisão correta

(probab = 1 – )

P(erro tipo I) = P(rejeitar H0 | H0 é verdadeira) =

P(erro tipo II) = P(aceitar H0 | H0 é falsa) =

4

Poder do teste

Definimos poder de um teste estatístico como a probabilidade do teste rejeitar H0 quando H0 é realmente falsa, ou seja, o poder de um teste é igual a 1 – .

O poder do teste dependerá de alguns fatores:

Do nível de significância adotado;

Da distância entre o valor “real” do parâmetro e o considerado verdadeiro em H0.

Da variabilidade da população.

Do tamanho da amostra retirada.

5

Exercício 18 – Capítulo 8

Num certo banco de dados, o tempo para a realização das buscas é aproximadamente normal com média 53 s e desvio padrão 14 s. Modificou-se o sistema para reduzir o tempo. Foram contados os tempos para 30 buscas. Admita que as 30 observações possam ser consideradas uma amostra aleatória e que não houve alteração na variância. Use = 1%. Calcule o poder do teste se a verdadeira média de tempo fosse de:

40s, 41s, 42s, 43s, 44s, 45s, 46s, 47s, 48s, 49s, 50s, 51s, 52s.

6

Resolução – 1ª parte

H0: = 53 s

H1: < 53 s

= 0,01, n = 30, = 14 s

326,2Zc

05,4730

14326,2530

nZX cc

7

Resolução 2ª parte

Média “real” = 45 s 80,0

30/14

4505,47Z

Poder = 0,7892

= 0,2108

Curvas Características de Operação

8

00,10,20,30,40,50,60,70,80,9

1

40 41 42 43 44 45 46 47 48 49 50 51 52 53 54

Po

de

r

Média real

Curvas Características de Operação

30

60

Poder do teste de 1 média – σ2 desconhecida

Variável de teste: t de Student com n – 1 graus de liberdade.

Calcular a probabilidade de aceitar H0 quando H0 é falsa (probabilidade de erro tipo II - ), ou o complementar, o poder do teste.

Quando o verdadeiro valor da média é μ = μ0 + d (H0 falsa) a distribuição passa a ser a t não central, com n-1 graus de liberdade e parâmetro de não centralidade

Se = 0, a distribuição t não central passa a ser a distribuição t usual.

9

nsdsnd )/(/)(

Distribuição t não central

Dois parâmetros: graus de liberdade (>0), e não centralidade (∈ ).

10

Procedimentos: teste 1 média – σ2 desconhecida

Supondo que a média real seja μ, a média testada em H0 seja μ0, e s uma estimativa confiável de σ.

Cálculo de PODER DO TESTE para uma amostra n.

Definir efeito em número de desvios padrões.

Teste unilateral à direita: d = ( - 0)/s (d +)

Teste unilateral à esquerda: d = ( - 0)/s (d -)

Teste bilateral: d = ( - 0)/s (d + ou d-)

Definir significância, n.

Usar aplicativo computacional (R, GPower, Minitab).

11

Procedimentos: teste 1 média – σ2 desconhecida

Supondo que a média real seja μ, a média testada em H0 seja μ0, e s uma estimativa confiável de σ.

Cálculo de TAMANHO DE AMOSTRA para certo poder.


Teste unilateral à direita: d = ( - 0)/s (d +)

Teste unilateral à esquerda: d = ( - 0)/s (d -)

Teste bilateral: d = ( - 0)/s (d + ou d-)

Definir significância, poder requerido para o teste.


12

13

Exercício 19 – Capítulo 8

Um certo tipo de pneu dura, em média, 50.000 km. O fabricante investiu em uma nova composição de borracha para pneus, objetivando aumentar sua durabilidade. Vinte pneus, fabricados com esta nova composição, apresentaram desvio padrão de 4.000 km. Use = 1%. Calcule o poder do teste se a verdadeira média de durabilidade dos pneus fosse de:

55000 km, 54000 km, 53000 km, 52000 km, 51000 km.

Desvios padrões (d/s): 1,25; 1,00; 0,75; 0,50; 0,25

t tests - Means: Difference from constant (one sample case)

Analysis: Post hoc: Compute achieved power

Input: Tail(s) = One

Effect size d = 0.75

α err prob = 0.01

Total sample size = 20

Output: Noncentrality parameter δ = 3.3541020

Critical t = 2.5394832

Df = 19

Power (1-β err prob) = 0.7838418

14

CCO no GPower

15

t tests - Means: Difference from constant (one sample case)

Analysis: A priori: Compute required sample size



α err prob = 0.01




Df = 30


Actual power = 0.9512543

16

CCO no GPower

17

Poder do teste de 1 proporção

Aproximações:

Distribuição normal:

Variável z, semelhante à média com 2 conhecida.

Definir hipóteses, , ’ e 0.

Encontrar Zc (de acordo com H1 e ).

18

nZp cc

)1( 000

n

pZ c

)'1('

'


Aproximações:

Arco seno (R, Action):

Definir hipóteses, n, , ’ e 0.

Encontrar Zc (de acordo com H1 e ).

Encontrar Z’0

19

nAsenAsenZ 0' 2'20

0' ZZZ c


Método exato: usando distribuição binomial (GPower):

Definir hipóteses, n, , ’ e 0.

Cálculo do poder usando a distribuição binomial.

Obter o número de “sucessos” na amostra associado a , considerando uma binomial com n sucessos e 0.

Usar o número de “sucessos” acima em uma binomial com n sucessos e ’, calcular o poder associado.

20

Exemplo de proporção

Imagine teste de hipóteses de proporção:

H0: = 0,3

H1: > 0,3

= 0,05; n = 200

a) Obter o poder do teste para ‘ = 0,35.

b) Obter o tamanho mínimo de amostra para detectar com 95% de probabilidade que ‘ é igual 0,35.

21

Exact - Proportion: Difference from constant (binomial test, one sample case)



Effect size g = 0.05

α err prob = 0.05


Constant proportion = 0.3

Output: Lower critical N = 72.0000000

Upper critical N = 72.0000000


Actual α = 0.0396283

22

Exact - Proportion: Difference from constant (binomial test, one sample case)

Analysis: A priori: Compute required sample size


Effect size g = 0.05

α err prob = 0.05


Constant proportion = 0.3

Output: Lower critical N = 312

Upper critical N = 312


Actual power = 0.9519557

Actual α = 0.0497407 23

Procedimentos: teste 2 médias

Obter sd:

Das diferenças – teste de 2 médias – grupos pareados.

Agrupado – teste de 2 médias – grupos independentes.

Cálculo de PODER DO TESTE para uma amostra n.


Teste unilateral à direita: d/sd (d +)

Teste unilateral à esquerda: d/sd (d -)

Teste bilateral: d/sd (d + ou d-)

Definir significância, n (ou n1 e n2).


24

Exemplo de 2 médias (grupos independentes)

Exemplo 2 da Aula10.

H0: μ1 - µ2 = 0

H1: μ1 - µ2 > 0

Nível de significância: = 0,05; 1- = 0,95, n1 = 8, n2 = 10.

Grupos independentes, 21 e 2

2 desconhecidas: teste F de diferença entre variâncias indicou igualdade.

sd = 0,6023

Calcule o poder do teste se a diferença entre as médias fosse de 0,5 minutos.

d = 0,5/0,6023 = 0,83 desvios padrões

25

t tests - Means: Difference between two independent means (two groups)




α err prob = 0.05

Sample size group 1 = 8

Sample size group 2 = 10



Df = 16


26

27

Documents

PODER DO TESTE - UFSCmarcelo.menezes.reis/Aula10CPGCC2019.pdf · O poder do teste dependerá de alguns fatores: Do nível de significância adotado; Da distância entre o valor “real”