22
AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo de uma pequena parte de seus componentes. Universo ou população = Conjunto de todos possíveis elementos (todo o grupo) que podem fazer parte do estudo. ia dos médicos do HC. População = Todos os médicos de peças com problemas numa fabrica. Todas as peças fabricadas. uma técnica nova de aprendizado para crianças com em. População = Todas crianças com problemas de apr O pesquisador é que define a sua população, baseado no grau de abrangência que pretende tirar do seu estudo. Pode ter restrições geográficas, temporais ou de outras ordens.

AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Embed Size (px)

Citation preview

Page 1: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

AMOSTRAGEM

Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo de uma pequena parte de seus componentes.

Universo ou população = Conjunto de todos possíveis elementos(todo o grupo) que podem fazer parte do estudo.

Exemplos: Altura média dos médicos do HC. População = Todos os médicos do HC; Percentual de peças com problemas numa fabrica. População= Todas as peças fabricadas.Efeitos de uma técnica nova de aprendizado para crianças com problemasaprendizagem. População = Todas crianças com problemas de aprendizado.

O pesquisador é que define a sua população, baseado no grau de abrangência que pretende tirar do seu estudo. Pode ter restrições geográficas, temporais ou de outras ordens.

Page 2: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

AMOSTRA : Pequena parte da população que se deseja estudar, fra-ção da população alvo.

Populaçãode idosos em Rib. Preto

Amostra1

Amostra2

Logicamente quanto mais semelhante, mais parecida, mais próxima fora amostra da população mais consistente serão seus resultados, mais pode-rosas suas inferências, melhor o seu trabalho.

Vantagens: Custo menor, resultado em menor tempo, dados mais fidedignos (??), ordem ética (novas drogas, vacinas).

Page 3: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Linhas gerais de PLANEJAMENTO AMOSTRAL idealizado:1 - Definição dos objetivos da pesquisa (não só no plano amostral), incluindo a população a ser amostrada, o universo dos possíveis participantes

2 - Escolha das variáveis a serem observadas em cada unidade amostral,conforme o tipo de variável há um tipo de cálculo de tamanho amostral. 3- Especificação do grau de precisão desejado (adiante mais detalhes),quanto maior a amostra (até um certo ponto) maior o grau de certeza a respeito dos resultados obtidos.

4 - Escolha dos instrumentos de medida (ex:questionário) e da forma de abordagem (ex: clássico)

5 - Realização de uma prova experimental, piloto, pré-teste; é conveniente pois testem-se os instrumentos de medida, o tempo, o custo, possíveis interferências não previstas, fornece estimativas, orienta ajustes necessários.

6 - Cálculo do tamanho da amostra, conhecido seus componentes.

Page 4: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Estratégias ou Tipos de AmostragemAmostragem aleatória(probabilística) simples: Cada componente da população tem a mesma chance de ser escolhido para compor a amostra, através de uma seleção aleatória (ex: sorteio). Pode ser com ou sem reposição.

Amostragem aleatória estratificada: A população é dividida em estratossubpopulações, havendo maior homogeneidade dentro dos elementos decada estrato do que entre estratos diferentes. Os estratos devem respeitara proporcionalidade com a população. Por exemplo, se sabemos que 70%dos elementos de uma escola são mulheres, 70% da nossa amostra deve ser de mulheres. A amostra foi estratificada por sexo. Dentro de cada estrato realiza-se uma amostragem simples.

Amostragem por conglomerados: Conglomerado é um conjunto de unidades amostrais, p.ex. se crianças são a unidade amostral, as escolas são conglomerados. Cada conglomerado é uma miniatura da população, os conglomerados mais numerosos fornecerão mais unidades amostrais.

Page 5: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Amostragem por estágios múltiplos: É uma combinação de dois ou maisplanos amostrais. Por exemplo, pode-se fazer uma amostra aleatória simples na qual as unidades amostrais são os conglomerados e dentro dosconglomerados realizar-se uma amostra aleatória estratificada.

Ausência de resposta Falha na obtenção dados de uma unidade amostral.

Motivos: Unidade não encontrada; o entrevistado não sabe, não pode, recusa-se a responder; perda, extravio do dado; apresenta viés...

Soluções: Reposição, substituição, da unidade amostral. Seleciona-se aleatoriamente uma nova unidade amostral. Se não for possível, em alguns casos pode-se estimar o valor que seria fornecido pela unidade perdida.

Existem técnicas estatísticas que permitem estimar o valor perdido, substituir pela média, pelo valor semelhante ao que outra unidade com características parecidas forneceu,...

Page 6: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Tamanho da amostra

É conveniente, e cada vez mais cobrado por bancas e referers, planejara priori o tamanho da amostra, para que se possa ter uma amostra suficiente para detectar uma diferença importante. Por outro lado, se não há planejamento, uma amostra excessivamentegrande pode tornar diferenças irrelevantes em estatisticamente significativas, fora o tempo e o dinheiro jogados fora.

Lembre sempre da diferença estatística e da diferença prática

O que ou quem determina o tamanho da amostra ??

A pergunta da pesquisa, a hipótese a ser testada pelo pesquisador, conforme o desenho do estudo, o tipo das variáveis e, secundariamente, a precisão que o pesquisador deseja obter nos seus resultados.

Page 7: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Cálculo do tamanho da amostra para a realização dos testes mais comuns

1 - Situação onde desejamos calcular um tamanho de amostra (n), com o objetivo de compararmos a média obtida nos nossos dados com uma média conhecida (da literatura, oficial, pesquisas anteriores),sendo s estimado a partir de algo,ou de um pré-levantamento.(s verdadeiro é desconhecido)-Tipo de variável envolvida: Quantitativa contínua ou discreta, ou até mesmo categórica ordinal .Teoricamente com distribuição Normal.

Conhecimentos a priori: Diferença a ser detectada: É o valor da diferença entre a média conhecida e a média que será estimada dos nossos dados, que é considerada relevante pelo pesquisador. O valor que diferente da média conhecida produzirá uma mudança de comportamento, de padrão, de conhecimento.

Ex: Sabe-se que pacientes com a doença X tem sobrevida de 40 meses, uma nova terapia esta sendo testada e será considerada superior se aumentar para 48 meses a sobrevida. Diferença a ser detectada é de 8 meses.

Page 8: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Desvio padrão (s): Estimado a partir dos nossos dados ou de outra fonte.

Nível de significância (): Probabilidade de cometer o erro do tipo I, a chance de dizer que as médias são diferentes quando são iguais.H0: Média conhecida = média estim. X H1:Média conhecida média est.Normalmente utiliza-se 0.05 (5%), se pretendemos diminuir a chance desse erro para menos (0.01) paga-se o preço coletando uma amostra maior.

Poder do teste (1-): Probabilidade de detectar uma real diferença, se elarealmente existir. Normalmente utiliza-se 0.80 (80%), se pretendemos aumentar esta chance para mais (90%) paga-se o preço coletando uma amostra maior.

Tipo do teste: Bicaudal, se há diferença (para cima ou para baixo) entreas médias ou Monocaudal, se interessa a diferença só para um lado.Na maioria esmagadora das vezes utiliza-se o Bicaudal.

Portanto conhecimentos a priori: Diferença a ser detectada, Nível de

significância (), Desvio padrão (s), Poder do teste (1-) e Tipo do teste

Page 9: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Vamos em ‘Stats’, depois em ‘Power and Sample Size’ e finalmente em ‘1 Sample t’

Surgirá a tela onde colocaremos8 (48-40) no campo Difference,0.80 em ‘Power values’ e 10 em‘Sigma’ que é o desvio padrão.

Se clicarmos em ‘Options’obteremos a seguinte tela.

Page 10: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Repare que o tipo do teste de hipótese já esta especificado como “Notequal” que é o mesmo que bicaudalbem como o nível de significância de 0.05 . Para alterar alguns deles basta alterar.Clicando em OK voltamos na tela anterior e novamente em OK temoso resultado.

Power and Sample Size

1-Sample t Test

Testing mean = null (versus not = null)Calculating power for mean = null + differenceAlpha = 0,05 Sigma = 10

Sample Target ActualDifference Size Power Power 8 15 0,8000 0,8213

Então para um = 0.05, 1- = 0.80,um dp = 10, num teste bicaudal é necessária uma amostra de tamanho 15 para se detectar um diferença de 8 em relação a 40. Se nesta amostra de 15 nossa média for 48 (ou 32) a diferença entre a nossa média e a conhecida será significativa (p 0.05)

Page 11: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

2 - Situação onde desejamos calcular um tamanho de amostra (n), com o objetivo de compararmos duas médias obtidas de uma amostra.Exemplo:Desejamos saber se o uso de anticoncepcional aumenta a pressãosistólica nas mulheres de 30 a 35 anos. Os médicos estabeleceram que qual quer diferença na ordem de 10 mmHg é importante. O desvio padrão é de20 mmHg.

Tipos de variáveis envolvidas:Quantitativa contínua ou discreta, ou até mesmo categórica ordinal que é a que será medida e a variável referente aos grupos, que pode ser categórica ordinal, nominal ou uma var. quantitativaque foi categorizada.Teoricamente a 1a. var.com distribuição Normal.

Conhecimentos a priori:

Diferença a ser detectada: Já especificada anteriormenteDesvio padrão: Já fornecido (na verdade teria de ser estudado).Nível de significância, poder do teste e tipo do teste de hipótese: Adotaremos o padrão, 0.05; 0.80, Bicaudal.

Page 12: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Voltamos à tela em ‘Power andSample Size’ e vamos em ‘2 -Sample t’.

Surge uma nova tela onde colocamos os valores já definidos e damos OK

2-Sample t TestTesting mean 1 = mean 2 (versus not =)Calculating power for mean 1 = mean 2 + differenceAlpha = 0,05 Sigma = 20 Sample Target ActualDifference Size Power Power 10 64 0,8000 0,8015

Temos então para as condições estabelecidas que coletar uma amostra

Atenção, o n = 64é o tamanho de cada grupo

Page 13: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Exemplo:Desejamos saber se o uso de determinadas técnicas fisioterapêuticas diminui o tempo de recuperação para determinada lesão. Sabe-se que a técnica padrão leva 60 dias para a recuperação e serão testadas 2 novas técnicas e uma terceira que é combinação das 2. Como são técnicas custosas estamos interessados em diferenças a partir de 15 dias. O desvio padrão é de 7 dias (estudos prévios).Tipos de variáveis envolvidas:Quantitativa contínua ou discreta, ou até mesmo categórica ordinal que é a que será medida e a variável referente aos grupos, que pode ser categórica ordinal, nominal ou uma var. quantitativaque foi categorizada.Teoricamente a 1a. var.com distribuição Normal.

Conhecimentos a prioriNúmero de níveis, fatores, grupos, tratamentos,.. = 4 Diferença a ser detectada: Já especificada anteriormenteDesvio padrão: Já fornecido.Nível de significância, poder do teste e tipo do teste de hipótese: Adotaremos o padrão, 0.05; 0.80, Bicaudal.

3 - Situação onde desejamos calcular um tamanho de amostra (n), com o objetivo de compararmos mais de duas médias obtidas de uma amostra.

Page 14: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Voltamos à tela em ‘Power and Sample Size’ e vamos em ‘Oneway ANOVA’.

Na nova tela especificamos o no.de tratamentos, a dif. mínima a ser detectada, o poder e o dp e damos Ok.

One-way ANOVASigma = 7 Alpha = 0,05 Number of Levels = 4 Sample Target Actual MaximumSS Means Size Power Power Difference 112,5 6 0,8000 0,8158 15

Portanto necessitaríamos de umaamostra de 6 elementos em cadagrupo.

Page 15: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Exemplo: Sabe-se que o percentual de crianças nascidas a pré-termo comproblemas de aprendizagem é 40%. Um novo método de ensino para estascrianças foi desenvolvido, e será adotado se este percentual cair para 30%. Tipos de variáveis envolvidas:Qualitativa nominal, ou outros tipos que foram categorizadas.

Conhecimentos a priori:

Nível de significância, poder do teste e tipo do teste de hipótese: São os mesmos Adotaremos o padrão, 0.05; 0.80, Bicaudal.

4 - Situação onde desejamos calcular um tamanho de amostra (n), com o objetivo de compararmos uma proporção (percentual) em um experimentocom uma proporção conhecida da população.

Proporção na população: É o valor da proporção conhecido na população,de estudos anteriores, da literatura, ou outras fontes. Se não tiver a menor idéia use 0.50 que fornecerá o maior tamanho de amostra. Segurança.

Proporção sugerida (a ser detectada): É a proporção que se pretende observar, que se deseja obter.

Page 16: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Voltamos à tela em ‘Power and Sample Size’ e vamos em ‘1 Proportion’

Na nova tela inserimos a proporçãosugerida em ‘Alternative values of p’o poder do teste e em ‘Hypothesizedp ‘ colocamos o valor da proporção conhecido na população. E OK

Test for One ProportionTesting proportion = 0,4 (versus not = 0,4)Alpha = 0,05 Alternative Sample Target Actual Proportion Size Power Power 0,300000 182 0,8000 0,8020

Portanto se amostramos 182 criançase o percentual delas com problemas for igual ou inferior a 30% (55) a diferença entre 30% e 40% será significativa ( p 0.05). O novo método será eficaz.

Page 17: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

5 - Situação onde desejamos calcular um tamanho de amostra (n), com o objetivo de compararmos duas proporções obtidas em uma amostra

Tipos de variáveis envolvidas:Duas vars. qualitativa nominis, ou outros tipos que foram categorizadas. Uma para os tratamentos e a outra referenteao índice de melhora.

Conhecimentos a priori:

As duas proporções estimadas: Proporções estimadas de estudos anteriores, literatura, de experimentos prévios, da experiência. Nível de significância, poder do teste e tipo do teste de hipótese: São os mesmos Adotaremos o padrão, 0.05; 0.80, Bicaudal.

Exemplo: Pacientes tratados com a droga A apresentam índice de melhorade 70%; os pacientes tratados com a droga B apresentam melhora de 85%. Qual o tamanho da amostra para que a diferença entre estas proporções sejá significante?

Page 18: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Voltamos pela enésima tela em ‘Power and Sample Size’ e vamos em`2 Proportions

Na nova tela inserimos os valores das nossas proporções (70% e 85%) e o poder do teste. E OK

Test for Two ProportionsTesting proportion 1 = proportion 2 (versus not =)Calculating power for proportion 2 = 0,85Alpha = 0,05 Sample Target ActualProportion 1 Size Power Power 0,700000 121 0,8000 0,8017

Portanto são necessário 121 pacientesem cada tratamento para que 85% seja significativamente superior a 70%.

Page 19: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

Nos estudos prospectivos, pode-se calcular um tamanho de amostra apropriado, com poder de teste controlado. Trabalhos consistentes do ponto de vista metodológico (estatístico).

Nos estudos retrospectivos, quando em muitas situações não é possível secalcular um tamanho de amostra (não há mais dados disponíveis) pode-seestimar o poder do teste ( probabilidade de se detectar uma real diferençase ela realmente existir), de modo a termos real noção do nosso resultado.

Exemplo: Depois de uma revisão de pastas, verificou-se que pac. portadores de um determinado gene Y tem glicemia média de 80 e os não portadores de média de 100. Haviam 7 pacientes em cada grupo e dp foi 15.

Após irmos e ‘2- Sample t’ temos a telaonde colocaremos o tamanho dos grupos(7), a diferença detectada (100-80=20) eo dp = 15 e OK

Page 20: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo

2-Sample t TestTesting mean 1 = mean 2 (versus not =)Calculating power for mean 1 = mean 2 + differenceAlpha = 0,05 Sigma = 15 SampleDifference Size Power 20 7 0,6301 20 14 0,9243

Então para uma amostra de 7 em cada grupo a chance de detectarmos uma diferença se ela realmente existir(com os parâmetros estipulados) é de63%.

Repare que se dobrarmos o tamanho da amostra o poder do nosso teste vai para92.4%

Para delineamentos mais complexos que exijam testes mais sofisticados existem fórmulas de cálculo de tamanho de amostra específicos. Quando não houver a menor idéia das diferenças a serem detectadas, ou das estimativas necessárias para o cálculo de um tamanho amostral a priori, siga a seguinte regra para responder à pergunta qual o tamanho da amostra ?

Dentro da sua possibilidade de TEMPO(de conclusão, de obter amostras, de paciência,...) e de CUSTO (de obter amostras ou de qquer origem) COLETE A MAIOR QUANTIDADE POSSÍVEL DE DADOS.

Page 21: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo
Page 22: AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo