Bioestatística
UNESP
Prof. Dr. Carlos Roberto Padovani
Prof. Titular de Bioestatística
IB-UNESP/Botucatu-SP
Perguntas iniciais para reflexão
I - O que é Estatística?
II - Com que tipo de informação (dados) a Estatística trabalha?
III - De que forma a Estatística interage com a pesquisa experimental ou
observacional (analítica ou descritiva)?
IV - Quais são as formas de obtenção de dados?
V - Que conceitos são fundamentais para se entender o conjunto de
dados gerados por uma pesquisa: por amostragem ou simples
levantamento de dados ?
VI - Que conceitos são fundamentais para se analisar estatisticamente
dados gerados por levantamentos amostrais?
Conteúdo Canônico
Prática
Filosofia do Pescador(Estatística)
O artista vê a verdade no belo e o pesquisador vê o belo na verdade
Interação Teoria e Prática
Estatística = Ciência + Tecnologia + Arte
DEFINIÇÃO DE ESTATÍSTICA
Estatística instrumento metodológico • Decidir qual é o melhor plano para a realização de um
estudo experimental ou observacional
• Organizar e sumarizar dados obtidos por classificação,
contagem ou mensuração
• Fazer inferências sobre populações de unidades
(indivíduos, objetos, animais) quando apenas uma parte
(amostra) é estudada
Áreas da Estatística (1) Planejamento de Experimentos e Técnicas de
Amostragem
(2) Estatística Descritiva
(3) Estatística Inferencial
Planejamento Estatístico e Amostragem
Cálculo do tamanho da amostra e definição da forma de coleta de dados
Obter amostras com poder adequado e sem distorções (vieses)
Análise Estatística Descritiva Identificar a natureza dos dados e o tipo de distribuição; resumir os
resultados
Ter uma idéia geral dos resultados obtidos; escolher o tipo de testes estatísticos que serão utilizados
Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de
confiança
Concluir sobre populações a partir de amostras
Planejamento e Análise Estatística
Conhecimento e seus níveis
• O que é conhecer? É uma relação que se estabelece entre o sujeito que conhece e o objeto conhecido
• No processo de conhecimento o sujeito procura se apropriar, de certo modo, do objeto conhecido
Conhecimento
SUJEITO (Empírico, Científico, OBJETO
Filosófico, Teológico)
SUJEITO CONHECIMENTO OBJETO
(MANIFESTAÇÃO) (ESTADO DE
ESPIRITO)
IGNORÂNCIA
DÚVIDA
OPINIÃO
CERTEZA
NADA
UM POUCO
SEM CLAREZA
EVIDÊNCIA
VERDADE
VERDADE – EVIDÊNCIA - CERTEZA
O Conhecimento e seus níveis
Dado Informação Conhecimento
Glicemia = 150mg/dl Hiperglicemia Paciente diabético
Estatística e o método científico
Análise Estatística
Descritiva
Análise Inferencial
Conclusões
Formulação de novos
objetivos
Objetivos da pesquisa
Planejamento de uma pesquisa
que será realizada por
levantamentos populacionais,
levantamentos amostrais ou
experimentos controlados
Observações
Dados
Dados relevantes
ao objeto de estudo
Analisar
Descrever Concluir
Entender Discutir
Planejar Predizer
Transformação dos
dados em informação Análise
Exploratória
Estatística
Descritiva
Análise
Confirmatória
Inferência
Estatística
A bioestatística é a metodologia estatística aplicada às ciências biológicas e da saúde, envolvendo o planejamento, a análise de dados e a interpretação dos resultados (divide-se em : estatística descritiva e inferência estatística)
A estatística descritiva consiste na organização dos dados obtidos por meio de classificação, contagem ou mensuração, apresentados de forma resumida em tabelas e gráficos,incluindo medidas de posição e variabilidade
Estatística descritiva e inferencial
A inferência estatística permite inferir a respeito de populações a partir de amostras, além de verificar se amostras provém da mesma população, por meio de teste de hipóteses ou da construção de intervalos de confiança
A partir de estatísticas(valores obtidos nos dados amostrais) busca-se inferir sobre os dados reais da população (denominados parâmetros) sujeito a uma margem controlada de erro
Estatística descritiva e inferencial
Categórica (qualitativa): dados obtidos por classificação em categorias, não existindo intervalo fixo entre as classes
Nominal: não existe ordem definida
Ordinal: grupos ou classes ordenadas
Numérica (quantitativa) ou intervalar: existe um intervalo fixo entre as classes
Discreta: dados obtidos por contagem, correspondendo a números inteiros (existe um hiato entre as classes)
Contínua: dados obtidos por mensuração; números reais (não existe hiato entre as classes)
Escala de Variáveis
TIPOS DE VARIÁVEIS
Categóricas Numéricas
Nominal
(classificação)
Ordinal
(classificação)
Discreta
(contagem)
Contínua
(mensuração)
gênero, raça,
região, grupo
sangüíneo
pressão
sangüínea
(baixa,
normal, alta)
Número de
acidentes,
número de
filhos
Peso, altura,
pressão
sangüínea
• Média: Soma dos valores dividida pelo número de observações
• Moda: Valor mais frequentemente observado
• Mediana: Valor que divide as observações, ordenadas de forma crescente, em igual número acima e abaixo
• Média e Mediana são aplicáveis apenas para variáveis numéricas (discretas ou contínuas). A moda pode ser calculada para variáveis numéricas ou categóricas.
• A média é uma medida muito afetada por valores discrepantes (outliers). A mediana é mais resistente.
Medidas de tendência central
Quartis dividem a amostra em quatro partes
Primeiro quartil limita 25% dos menores valores observados
Segundo quartil (mediana) limita 50% dos menores(maiores) valores observados
Terceiro quartil :limita 75% dos menores valores observados
Percentis dividem a amostra em 100 partes
O percentil 95, por exemplo, é o valor abaixo do qual encontram-se 95% das observações
Separatrizes
• Amplitude Total medida de variabilidade mais simples( resulta da diferença entre o maior e o menor valor)
• Variância e Desvio-Padrão medidas de variabilidade individual, ou seja, indicam como os valores variam de um indivíduo para outro, por meio do afastamento dos valores em relação à média
• Coeficiente de Variação medida de variabilidade relativa calculada dividindo-se o desvio-padrão pela média.
Medidas de Variabilidade ou Dispersão
• Os resultados apresentados sob a forma de tabelas e gráficos, devem resumir as informações e ser auto-explicativos. Todos os itens de uma tabela ou gráfico, se possível, devem constar na mesma página
• As tabelas são compostas de linha e colunas, incluindo sempre um título e a descrição dos resultados
• As bordas das tabelas devem conter apenas traços horizontais acima e abaixo da primeira linha e da última, quando esta contiver total ou média
• Quando a última linha não contiver total ou média, deverá ter apenas uma linha horizontal ao final
• Não incluir traços verticais
• Tabelas de contingência são compostas de linhas e colunas e apresentam as freqüências de ocorrência de uma associação que se deseje pesquisar
Tabelas
• Os gráficos devem facilitar muito a compreensão dos resultados. Os principais gráficos utilizados para variáveis numéricas são os histogramas e os diagramas de caixas(também chamados de boxplots)
• Para variáveis categóricas podemos construir gráficos de setores circulares indicando a participação percentual de cada categoria
• Os gráficos de barras podem ser utilizados tanto para representar variáveis categóricas (indicando a contagem ou percentual de cada categoria) como para comparar médias de grupos
Gráficos
• Outlier significa "aquele que está fora", podendo ser traduzido como "valor discrepante". A prática estatística para detectar os outlier consiste em
calcular a amplitude interquartis (Q3 – Q1)
calcular o limite inferior LI= Q1-1,5*Ampl.interquartis
Calcular o limite superior LS= Q3+1,5*Ampl.interquartis
• Valores abaixo do limite inferior ou acima do limite superior são considerados outliers
• O que fazer com outliers?
Primeiro, verificar se não houve erro de digitação. Em seguida, analisar se não ocorreu erro na mensuração da variável. Se o valor extremo está correto, deve-se avaliar se indivíduo correspondente apresenta alguma condição que o caracterize como os diferentes dos demais. Se isto ocorrer deve ser desprezado. Caso contrário, não desprezar.
Outlier
• Erro Padrão medida de variabilidade da média amostral ( a média varia de uma amostra para outra). A média populacional estimada a partir de uma amostra apresenta sempre uma margem de erro, que é estimada pelo erro padrão. Não se trata de uma medida de variabilidade individual (como o desvio-padrão), mas sim de uma estimativa da variabilidade da média obtida, em função do tamanho amostral
• Erro Amostral medida de afastamento da média amostral em relação à média da população, associada sempre a um nível de confiança
Erro padrão e erro amostral
• Simétrica em relação à média
• Unimodal (apresenta uma única moda)
• Média = mediana = moda (as três medidas do centro são iguais, portanto, considera-se apenas a média)
• Completamente caracterizada pela média e pelo desvio-padrão
• Coeficiente de assimetria (skewness) varia de -2 a +2.Mede a assimetria da distribuição em torno da média, sendo positivo quando existe desvio para a direita e negativo quando há desvio para a esquerda
• Coeficiente de curtose (kurtosis) varia de 1 a 5.Mede a relação entre a altura e a largura da curva
• Normal Padrão (z) é uma distribuição normal com média = 0 e desvio padrão = 1. Representada pela notação N (0, 1)
Distribuição normal