Upload
bioestatistica
View
3.813
Download
0
Embed Size (px)
Citation preview
Curso de Pós Graduação em Gestão de Saúde Pública com ênfase em PSF
BIOESTATÍSTICABIOESTATÍSTICA
Eduardo Arrudas OrnelasBiólogo
á Mestre em Medicina Veterinária UFMG
Métodos estatísticosestatísticos
Estatística Descritiva
Estatística InferencialDescritiva Inferencial
Estatística descritiva:R ú j t d té i i d dReúne um conjunto de técnicas para sumarizar os dados(tabelas, quadros e gráficos) e medidas descritivas quepermitem tirar muitas informações contidas nos dadospermitem tirar muitas informações contidas nos dados.
Inferência estatística :Produzir afirmações sobre uma dada característica daProduzir afirmações sobre uma dada característica dapopulação, na qual estamos interessados, a partir deinformações colhidas de uma parte dessa população.ç p p p ç
Estatística Descritiva
• EnvolveC l d d–Coletar dados
–Apresentar dados–Caracterizar dados–Caracterizar dados
• Finalidade–Descrever dados
Estatística Inferencial
Envolve• Envolve–Estimativas–Teste de hipóteseTeste de hipótese
• Finalidade–Tomar decisões sobre característicasda população de uma coleta.
População e AmostraPopulação e Amostra
• População (ou universo): todos os NPopulação (ou universo): todos os Nmembros de uma classe ou grupo.
– Ex.: todos os alunos de pós graduação daDOCTUMDOCTUM
• Amostra é uma parte da populaçãoAmostra é uma parte da população,denotada por n.
– Ex.: todos os alunos de pós graduação emsaúde pública com ênfase em PSFsaúde pública com ênfase em PSF.
Características importantes dos dadosCaracterísticas importantes dos dados
1. Localização: Um valor representativo ou médiopindica onde se situa o centro dos dados.
2 V i ã : Um m did d t l d2. Variação: Uma medida do quanto os valores daamostra variam entre si.
3. Distribuição: A natureza ou a forma dedistribuição dos dados (tal como em forma de sino,uniforme ou assimétrica)
4 Tempo: Algumas características podem se alterar4. Tempo: Algumas características podem se alterarao longo do tempo.
Imp t t !!!Importante!!!
POPULAÇÃOPOPULAÇÃO AMOSTRAGEM
nNN
Distribuição de FreqüênciaDistribuição de Freqüência
lista dos valores dos dadoslista dos valores dos dados(ou individuais ou por grupos dei t l ) j t tintervalos), juntamente com ascorrespondentes freqüências oucontagens.
O d d t bé d idOs dados também podem ser resumidosconstruindo uma tabela de distribuição def üê ifreqüências.
Di t ib i ã d f üê i d iá l éDistribuição de freqüências de uma variável éuma lista dos valores que a variável pode
i ti f üê i dassumir, com as respectivas freqüências deocorrência.
Tabelas de contingência
Tabela de contingênciaTabela de contingência
Em estatística as tabelas de contingência são usadas pararegistar e analisar o relacionamento entre duas ou mais variáveisregistar e analisar o relacionamento entre duas ou mais variáveis,normalmente de escala nominal.
Suponhamos que temos duas variáveis sexo (masculino ouSuponhamos que temos duas variáveis, sexo (masculino oufeminino) e mão com que escreve (destro ou canhoto).Observamos os valores de ambas as variáveis de uma amostra
l d 100 U t b l d ti ê i d dcasual de 100 pessoas. Uma tabela de contingência pode ser usadapara expressar o relacionamento entre estas duas variáveis, comose segue:
MASCULINO FEMININO TOTALDESTROS 43 9 52DESTROS 43 9 52
CANHOTOS 44 4 48TOTAL 87 13 100
T b l d ti ê iTabela de contingência
VARIÁVEIS A B TOTALVARIÁVEIS A B TOTALC AC BC AC + BCD AD BD AD + BD
TOTAL AC + AD BC + BD A + B + C + D= N
FreqüênciaFreqüência
Freqüência absoluta (fa): o resultado do número de vezesFreqüênc a absoluta (fa) o resultado do número de vezesque o valor é observado na população.
ê l (f ) l d d d dFreqüência relativa (fr): o resultado obtido da divisãoentre a freqüência que o valor é observado na populaçãoe a quantidade de elementos da populaçãoe a quantidade de elementos da população.Geralmente é apresentada na forma de porcentagem.
fa (Skol)=9( )
fr(Skol)=9/25 = 0,36 ou 36%
A interpretação da freqüência e distribuição da amostra
• Quando se faz inferências estatísticas do ponto devista da freqüência, nós assumimos que nossos dados sãovista da freqüência, nós assumimos que nossos dados sãoamostras de uma população inteira.
é é â• A população é descrita pela média e variância dapopulação que são desconhecidas.
• A amostra é descrita pela média e variância da amostra.– A média e variância da amostra provêm estimativasm a ar ânc a a amostra pro m st mat assobre a média e variância da população inteira.– As estimativas são conhecidas com um grau deincerteza.
Variáveis Quantitativas:
Medidas de Posição:•MáximoMí i•Mínimo•Moda•Média•Média•Mediana•Quartil,Percentil, DecilQ , ,
M did d Di ãMedidas de Dispersão•Amplitude•Intervalo InterquartilIntervalo Interquartil•Variância•Desvio Padrão•Coeficiente de Variação
MEDIDAS DE MEDIDAS DE ÃPOSIÇÃOÇ
Medidas de tendência centralMedidas de tendência central
did d dê i l ãAs medidas da tendência central sãoparâmetros que permitem que se tenhap q p quma primeira idéia, um resumo, de comose distribuem os dados de umse distribuem os dados de umexperimento.
Medidas de posiçãoMedidas de posição
Máximo (Max): a maior observação
Mínimo (Min): a menor observação
Moda (Mo): é o valor (ou atributo, caractrerística) queocorre com maior frequenciaocorre com maior frequencia.
Dados: 5,3,4,3,9,4,5,6,6,5,6,6,8,8
Max 9Max = 9Min = 3Mo = 6Mo 6
Média
É a soma das medidas (resultados)di idid l ú ddividida pelo número de casos .
É a medida mais utilizada no entantoÉ a medida mais utilizada, no entantosofre bastante influência de valores
t È did i lextremos. È uma medida irreal.
Mediana
É o valor da variável a partir da posição central de umconjunto de dados n (dados ordenados) na qual a metade dos
s s s t i d l t d s t b icasos se encontra acima dele e a metade se encontra abaixo.
Obs: se o número de observações for ímpar, a mediana será oç p ,valor central da distribuição;Se o número for par a mediana será a média dos valorescentraiscentrais.
Pouco afetada por valores discrepantes existentes nop pconjunto (que costuma distorcer substancialmente o valor damédia)
Posição da mediana = n+1 / 2
cvcv
cv
cv cvcv
cv
cvcv cv cvcv
cvcv cvcvcv
Medidas separatrizesMedidas separatrizes
Permitem identificar a posição de um valor(caso)Permitem identificar a posição de um valor(caso)em relação ao conjunto de observações, além depossibilitar comparações entre diferentespossibilitar comparações entre diferentesséries de dados.
•Quartil•Decil•Decil•Percentil
Quartil (Q)Quartil (Q)
São representados pelo 1° (Q1) 2 °(Q2) 3°(Q3)São representados pelo 1 (Q1), 2 (Q2),3 (Q3).
O 2°(Q2) quartil indica que abaixo existem 50%O 2 (Q2) quartil indica que abaixo existem 50%da distribuição, logo, acima estão os outros 50%dos dados os quartis dividem a base em 4dos dados os quartis dividem a base em 4partes.
Decil (D)( )
São representados por por um conjunto de dadosd d D1 D2 D3 D9 d ilordenados D1,D2,D3........e D9 decil.
O 1° decil (D1) de um conjunto de dados informa queabaixo estão localizados 10% dos dados do conjunto deabaixo estão localizados 10% dos dados do conjunto deobservações e , assim sendo, acima estão os 90%restantes. Os outros decis são representados depforma semelhante.
5° decil (D5)= valor Mediano (Md).
Percentil (P)Sã t d j t d d d d dSão representados por um conjunto de dados ordenadosP1,D2,D3........e P99 percentil.O 1° percentil (P1) informa que 1% dos dados estãop ( ) f m qulocalizados abaixo desse valor, e, por seguinte os 99%restantes estão acima. A interpretação dos demais é feitade forma análogade forma análoga.
Percentil (P50)= mediana ou segundo quartil (Md)
Percentil (P25)= primeiro quartil (Q1)Percentil (P25)= primeiro quartil (Q1)
Percentil (P25)= primeiro quartil (Q1)
Percentil (P75)= terceiro quartil (Q3)
Percentil (P10)= primeiro decil (D1)
POPULAÇÃOÇ
AMOSTRAμ AMOSTRAμ
δX
S
p´P
p
Média Mediana Moda
DefiniçãoSoma das medidas divida pelo número
de casosValor do meio.
Valor mais freqüente.
de casos.
Existência Sempre existe. Sempre existe.Pode existir, pode haver mais de uma.
Leva em conta todos os dados
Sim NãoNão
Afetado por Não Não
pvalores
discrepadosSim
Não Não
Usado em muitos Menos sensível a Vantagens
Usado em muitos métodos
estatísticos.
Menos sensível a valores
discrepados.
Apropriada a dados qualitativos.
MEDIDAS DE MEDIDAS DE ÃDISPERSÃO
Medidas de variabilidade (dispersão)Medidas de variabilidade (dispersão)
Tem como finalidade encontrar um valor queTem como finalidade encontrar um valor queresuma a variabilidade de um conjunto de dados.
•Amplitude de variação (A)Amplitude de variação (A)•Amplitude interquatil•Desvio Padrão (s ou DP)Desvio Padrão (s ou DP)•Variância (s2)•Coeficiente de variação (CV)Coeficiente de variação (CV)•Erro padrão (se ou e)
Amplitude
É a diferença entre o maior (Máximo) e o menor (Mínimo)valor que foi observado para a variável servindo paravalor que foi observado para a variável, servindo paracaracterizar a abrangência do estudo.
Amplitude de Variação(A)Diferença entre o mínimo e o máximo do conjunto ded ddados.
Amplitude interquartilAmplitude interquartilÉ a diferença entre os valores correspondentes ao 1°(Q1) e3°(Q3) quartil (percentil (P25) e (P75). Esta medida nãoq pconsidera os valore extremos do conjunto de dados.
Desvio Padrão (s)Desvio Padrão (s)
É uma estimativa da variabilidade dos escores deÉ uma estimativa da variabilidade dos escores deum grupo (amostra) em torno da média.
O desvio padrão (s ou DP) é a raiz quadrada daO desvio padrão (s ou DP) é a raiz quadrada davariância.
A unidade do desvio padrão é igual a unidade de medida das observações.
Variância (s2)Variância (s )
É a soma dos quadrados dos desvios de cadaÉ a soma dos quadrados dos desvios de cadaponto em torno da média aritmética.Caracteriza a dispersão dos pontos de umaCaracteriza a dispersão dos pontos de umaamostra potencializando as diferenças.
Expressa a média aritmética dos quadrados. É odesvio padrão elevado ao quadrado.desvio padrão elevado ao quadrado.
Coeficiente de variação (CV)
É uma medida de dispersão relativa que indica avariabilidade da amostra em relação a médiavariabilidade da amostra em relação a média.Resultado do desvio padrão dividido pela médiatransformando em percentual.transformando em percentual.
Permite comparar a dispersão de diferentesdistribuições (com diferentes médias e desvios padrões.Elimina o efeito da magnitude dos dados.
cvcv
cv
cv cvcv
cv cv
cvcv cv cvcv
cvcv cvcvcv
Erro padrão (se ou e)Erro padrão (se ou e)
Quociente entre o desvio padrão e a raiz quadradaQuociente entre o desvio padrão e a raiz quadradado tamanho da amostra. É uma mediada devariabilidade entre a média aritmética dos dados evariabilidade entre a média aritmética dos dados ea média que poderia ser encontrada em outrasamostras do mesmo tamanho, na mesma população.amostras do mesmo tamanho, na mesma população.
O erro amostral:
i f b d b õinforma sobre o quanto de erro nossas observaçõesapresentam sobre a realidade pesquisada. A estatísticabaseia-se na medição do erro que existe entre a estimativabaseia-se na medição do erro que existe entre a estimativade quanto uma amostra representa adequadamente apopulação da qual foi extraída. Assim o conhecimento dep p ç qteoria de conjuntos, análise combinatória e cálculo sãoindispensáveis para compreender como o erro se comporta
it d d É ( t l)e a magnitude do mesmo. É o erro (erro amostral) quedefine a qualidade da observação e do delineamentoexperimentalexperimental.
Ob i d !!!Obrigado!!!
Eduardo Arrudas [email protected]