Upload
ronaldo-santos-da-silva
View
223
Download
3
Embed Size (px)
DESCRIPTION
Tema - Indicadores de Saúde
Citation preview
Epidemiologia
Indicadores de Sade
Profa. Dra. Ivana Maria Saes Busato
Epidemiologia | Indicadores de Sade 2
Ol! O vdeo a seguir mostra os contedos que sero estudados nesta
aula. Venha conferir!
Introduo
A estatstica uma ferramenta imprescindvel a qualquer pesquisador ou
pessoa que necessite tomar decises. Como disciplina cientfica, inicialmente
foi utilizada como estratgia mercantil e poltica, destinada a dimensionar as
doenas e seus efeitos para a Epidemiologia.
Com isso, iniciaremos esta aula com os conceitos bsicos da Estatstica
aplicada Epidemiologia, o que dar a base para a compreenso das anlises
exploratrias de dados (univariada, bivariada e multivariada).
Conceitos Bsicos em Estatstica
Ao emitir uma hiptese, o cientista tenta explicar os fatos j conhecidos.
Para testar a significncia estatstica, a hiptese de pesquisa deve ser
formulada de modo que categorize a diferena esperada entre grupos de
estudo.
Hiptese uma suposio que se faz a respeito de alguma coisa, deve estar
fundamentada em uma boa questo de pesquisa, a priori, e deve ser
simples e especfica.
Epidemiologia | Indicadores de Sade 3
Variveis independentes so aquelas manipuladas, enquanto as variveis
dependentes so apenas medidas ou registradas.
A hiptese pode ser, ainda:
Varivel
Para analisar uma hiptese, necessrio coletar uma varivel uma
caracterstica de interesse que pode ser medida; as variveis poder ser
independentes e dependentes.
As variveis que assumem valores numricos so denominadas
quantitativas, e as no numricas, qualitativas. Uma varivel qualitativa
quando seus valores so atributos ou qualidades (sexo, raa, classe social). Se
tais variveis possuem uma ordenao natural, indicando intensidades
crescentes de realizao, so classificadas de qualitativas ordinais (classe
social baixa, mdia ou alta). Se no for possvel estabelecer uma ordem natural
entre seus valores, so classificadas como qualitativas nominais (sexo
masculino ou feminino).
Epidemiologia | Indicadores de Sade 4
Ao estudar uma parte da populao (amostra), podemos encontrar o acaso, ou
seja, um resultado que difere da realidade. Devemos estimar, portanto, a preciso
estatstica do resultado.
J as variveis quantitativas podem ser classificadas em discretas ou
contnuas. As variveis discretas so resultantes de contagens e assumem, em
geral, valores inteiros (nmero de filhos), enquanto as variveis contnuas
podem assumir qualquer valor dentro de um intervalo especificado e so,
geralmente, resultado de uma mensurao (peso, em kg; altura, em metros).
A validade de um estudo depende da capacidade que as variveis tm
de representar os fenmenos de interesse. Para isso, devemos considerar:
Preciso est na capacidade de reproduo, quando maior for a preciso,
maior o poder estatstico que um determinado tamanho da amostra tem para
estimar os valores mdios e para testar a hiptese, ou seja, a questo de
pesquisa. Enfim, uma varivel tem valores semelhantes quando medida
vrias vezes. A preciso afetada pelo erro aleatrio (acaso) e pode ser
causada pelo observador, sujeito ou instrumento;
Acurcia a capacidade de representar realmente o que deveria
representar, tem influncia na validade interna e externa do estudo. Melhor
forma de avaliar a acurcia est na comparao com um padro de
referncia ameaada pelo erro sistemtico (vis) causado pelo observador,
sujeito ou instrumento.
Os estudos de diferentes variveis com muita frequncia fazem uso de
intervalo de confiana, como em estudos descritivos de prevalncia ou
incidncia. Se nossos estudos avaliassem toda a populao-alvo do estudo,
teramos plena confiana nos resultados. Contudo, j vimos que isso no
realizado e, portanto, utilizamos amostras em vez da populao.
Epidemiologia | Indicadores de Sade 5
Podemos realizar 100 estudos da mesma populao, o que traria
diversos resultados. a variabilidade entre esses resultados que chamamos de
intervalo de confiana. O intervalo de confiana no nvel 95% (95% IC)
significa que o resultado est dentro de um intervalo e faz-se a leitura correta
do intervalo de confiana afirmando que, em 95 de 100 amostras hipotticas, o
resultado est dentro desse intervalo.
Quanto mais estreito o intervalo de confiana, mais precisa a
estimativa e exatamente essa a definio estatstica para preciso a
capacidade de um resultado se repetir em diferentes medidas da mesma
realidade. Se a medida em questo possuir um valor que representa a hiptese
nula, podemos usar o intervalo de confiana para obter a significncia
estatstica.
No necessrio fazer 100 estudos para calcular o intervalo de
confiana, podemos obt-lo com apenas um estudo realizado e o fazemos
estudando apenas uma amostra e utilizando frmulas estatsticas que levam
em considerao o tamanho amostral, a variabilidade de uma varivel
contnua ou a frequncia do desfecho quando a varivel categrica. Essas
frmulas nos fornecem o erro-padro a medida de incerteza do estudo.
Plano amostral
A inferncia estatstica um processo de raciocnio indutivo em que se
procura tirar concluses partindo do particular para o geral, estudando apenas
alguns elementos dessa populao, ou seja, uma amostra, que, a partir das
propriedades verificadas, infere propriedades para a populao, utilizando a
probabilidade como instrumento.
Um experimento aleatrio tem que satisfazer algumas condies:
1. Poder ser repetido indefinidamente;
2. Ser capaz de descrever todos os possveis resultados do experimento,
mas no predizer com certeza qual ocorrer;
3. Obedecer regularidade estatstica.
Epidemiologia | Indicadores de Sade 6
A distribuio normal acontece quando uma varivel aleatria contnua
normalmente distribuda e seu aspecto grfico tem a forma de um sino. A curva
representativa dessa distribuio denominada curva normal ou curva de
Gauss.
Mtodos aleatrios ou probabilsticos acontecem quando cada elemento
da populao tem uma probabilidade conhecida de fazer parte da amostra.
Esses mtodos possibilitam a determinao da distribuio de probabilidade e
permitem quantificar o erro de amostragem decorrente da utilizao de apenas
uma parte da populao.
A probabilidade um nmero entre 0 e 1 e mostra o grau de certeza da
ocorrncia de um evento associado a um experimento aleatrio. A distribuio
de probabilidades associa uma probabilidade a cada resultado numrico de um
experimento.
As distribuies de probabilidade podem ser: discreta ou contnua.
Contudo, vamos abordar somente a distribuio de probabilidade contnua
normal, por ser a mais importante para a Epidemiologia, pois representa as
distribuies de frequncia observadas nos fenmenos naturais e fsicos.
Por exemplo: no lanamento de um dado, cada face tem a mesma
probabilidade de ocorrncia, que 1/6. Como os valores das distribuies
de probabilidades so apenas probabilidades e como as variveis aleatrias
devem tomar um de seus valores, temos duas regras, que se aplicam a
qualquer distribuio de probabilidades:
- a somatria das ocorrncias possveis igual a 1.
(1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1)
- a probabilidade da ocorrncia de um evento est entre 0 a 1.
Epidemiologia | Indicadores de Sade 7
Os dados se concentram em torno de uma mdia e se dispersam
simetricamente a partir desse ponto central. importante saber que tipo de
distribuio ocorre com os dados, pois isso poder determinar os testes
estatsticos.
Curva de Gauss
Fonte:
Como obter uma amostra?
Chamamos o processo de seleo de uma amostra de amostragem.
Os mtodos de amostragem so:
No aleatrios so realizados com a construo da amostra a partir da
informao sobre a populao estudada, tentando fazer com que a amostra
seja um espelho fiel dessa populao. Esses mtodos no permitem calcular
a preciso das estimativas obtidas a partir da amostra; os mais conhecidos
Amostra um subconjunto de elementos pertencentes a uma populao.
Para que os resultados retirados da amostra possibilitem inferncias vlidas,
ela deve ser representativa da populao.
Epidemiologia | Indicadores de Sade 8
so a amostragem orientada, a amostragem por convenincia e a
amostragem por quotas;
Aleatrios podem ser realizados de diversas formas, como colocar, um a
um, todos os nmeros que sero submetidos ao sorteio, retirando alguns s
cegas; ou ainda, usar os nmeros de loteria sorteados nos ltimos anos ou
uma tabela de nmeros aleatrios, ou programas de computador para
selecionar aleatoriamente todos os componentes da amostra. Podem ser
realizados de algumas formas de amostragem: aleatria simples, aleatria-
-estratificada, sistemtica e por conglomerados.
Assista ao vdeo a seguir, em que vamos complementar os conceitos
sobre amostragem para a Epidemiologia.
Erro amostral
No h dvida de que uma amostra no representa perfeitamente uma
populao. O importante que todas as decises que tomamos questo de
pesquisa, plano de estudo, populao a ser pesquisada tm inerente um
determinado erro, que pode ser quantificado em termos probabilsticos. Ou
seja, quando utilizamos uma amostra, devemos aceitar uma margem de erro
que denominamos erro amostral. Esse erro a diferena entre um resultado
amostral e o verdadeiro resultado populacional. Quando isso ocorre, os
resultados da amostra no refletem a realidade da populao, levando a
inferncias errneas.
Acompanhe os tipos de erros:
I. Erro tipo I (falso positivo) ocorre quando rejeita uma hiptese nula
que verdadeira na populao;
Epidemiologia | Indicadores de Sade 9
O tamanho da amostra pode evitar erros tipo I e II. Os resultados falso negativo
e falso positivo tambm podem ocorrer em funo do vis. Esses erros so mais
difceis de detectar e exigem conhecimentos avanados de estatstica.
II. Erro tipo II (falso negativo) ocorre quando se deixa rejeitar (aceita-
-se) uma hiptese nula que no verdadeira na populao.
Antes de realizar o estudo, o pesquisador determina a probabilidade
mxima tolerada para os erros tipo I e II. A probabilidade de um erro tipo I
(rejeitar a hiptese nula quando ela verdadeira) denominado (alfa),
tambm chamada de nvel de significncia estatstica.
A probabilidade de um erro tipo II (no rejeitar uma hiptese nula quando
ela for falsa) denominado (beta). O valor 1 - beta chamado de poder do
teste e representa a probabilidade de se rejeitar a hiptese nula na amostra
quando o efeito real na populao se iguala magnitude estimada de efeito.
Muitos estudos estabelecem como 0,05 e como 0,20 o poder de 0,80
representa esperar que 80% de probabilidade de encontrar uma associao
dessa magnitude quando encontrar associao.
varia de 0,01 a 0,10. Usar alfa baixo quando a questo de pesquisa torna
importante evitar falso positivo (erro tipo I); ex: eficcia de um medicamento ou
tratamento.
varia de 0,05 a 0,20. Usar beta baixo quando quer evitar o falso negativo (erro
tipo II); ex: opinio pblica quanto a realizar ou no um tratamento novo muito
invasivo.
Os erros amostrais resultam de flutuaes amostrais aleatrias. No
temos a capacidade de evitar a ocorrncia do erro amostral, contudo podemos
limitar seu valor por meio da escolha de uma amostra de tamanho adequado.
Epidemiologia | Indicadores de Sade 10
Por exemplo: 10% da populao geral com diabetes mellitus; ento, para
calcularmos amostra na populao da equipe de sade da famlia composta
por 4000hab, usamos os mesmos 10% (quando no conhecemos essa
proporcionalidade, usamos 50% como proporo).
Assim, podemos deduzir que o erro amostral e o tamanho da amostra seguem
sentidos contrrios: quanto maior o tamanho da amostra, menor o erro
cometido e vice-versa.
Podemos calcular a amostra usando a mdia populacional, a partir de
uma frmula matemtica, visando determinar a amostra com base em
informaes sobre o grau de confiana desejado (valor crtico = Z/2), o
desvio-padro populacional da varivel estudada, a margem de erro (ou erro
mximo de estimativa), que identifica a diferena mxima entre a mdia
amostral e a verdadeira mdia populacional.
Conhea os valores crticos mais utilizados na amostra, associados ao
grau de confiana:
Grau de Confiana Valor Crtico Z /2
90% 0,10 1,645
95% 0,05 1,96
99% 0,01 2,575
Podemos determinar o tamanho de uma amostra com base na
estimativa da proporo populacional, a qual utilizada quando h
necessidade de determinar a proporo de pessoas de uma populao e que
tambm faz uso de uma frmula matemtica para seu clculo, aplicada
proporo j conhecida e populao-alvo para estimar a amostra.
Em populaes finitas, h a necessidade de outros clculos. As frmulas
anteriores partem do princpio que a populao de onde se retirava a amostra
Epidemiologia | Indicadores de Sade 11
to grande que podemos consider-la infinita. Na maioria dos estudos, as
populaes no so to grande em comparao com as amostras e, caso a
amostra tenha um tamanho maior ou igual a 5% do tamanho da populao,
considera-se que a populao seja finita. Assim, para calcular a amostra para
populaes finitas, h a necessidade de se aplicar um fator de correo aos
clculos que vimos anteriormente.
Anlise Exploratria de Dados
A coleta e a organizao dos dados faz parte do planejamento do
estudo, o qual inclui, por sua vez, a elaborao do instrumento de coleta dos
dados, com a devida organizao das questes de anlise em variveis que
possam ser quantificadas e que sero passveis de anlise exploratria dos
dados.
Quando terminada a etapa da coleta dos dados, estes devem ser
arranjados em forma de tabela, para a maior eficincia na anlise. Essa
disposio deve permitir sua anlise na maioria dos programas estatsticos
disponveis. Usando uma planilha do Excel, podemos empregar cada coluna
representando uma varivel (ex: sexo, idade, tamanho, salrios mnimos, taxa
de mortalidade) e cada linha representa cada unidade de observada (ex:
indivduos, dentes, casas).
A anlise exploratria dos dados tem incio com uma primeira
abordagem do conjunto de dados e com a anlise do perfil de cada varivel
separadamente chamada de anlise univariada. Para explicar algumas
hipteses (quando incluem duas variveis), h a necessidade de realizar a
anlise bivariada e, quando as anlises ficam ainda mais complexas
(introduo de mais variveis), usa-se a anlise multivariada.
Epidemiologia | Indicadores de Sade 12
A anlise univariada muito utilizada na Epidemiologia porque descreve uma
doena ou um agravo de sade para compor um perfil epidemiolgico.
Fonte: Corrar et al., 2007
Anlise univariada
A anlise univariada inclui todos os mtodos de estatstica que permitem
a anlise de cada varivel separadamente, com mtodos de estatstica para
cada uma.
Aps a coleta e a digitao de dados em um banco de dados apropriado,
o prximo passo a anlise exploratria univariada, etapa fundamental, pois
uma anlise detalhada permite ao pesquisador familiarizar-se com os dados,
organiz-los e sintetiz-los de forma a obter as informaes necessrias do
conjunto de dados para responder as questes que esto sendo investigadas.
Nessa etapa, produzem-se tabelas, grficos, mapas ou ainda resumos em
medidas numricas ou estatsticas.
importante conhecer e saber construir os principais tipos de tabelas e
grficos e calcular as medidas de resumo para realizar uma boa anlise
descritiva dos dados.
Quantas variveis so
analisadas
simultaneamente?
Uma Duas Mais de
duas
Anlise
univariada
Anlise
bivariada
Anlise
multivariada
Epidemiologia | Indicadores de Sade 13
No caso de variveis quantitativas contnuas, que podem assumir infinitos, temos
que dividir em classes, calculadas por intervalos de classe.
Vamos tentar entender como os dados se distribuem, onde esto
centrados, quais observaes so mais frequentes, como a variabilidade etc.,
tendo em vista responder as principais questes do estudo. Cada ferramenta
fornece um tipo de informao e o seu uso depende, em geral, do tipo de
varivel que est sendo investigada.
As tabelas de frequncia so elaboradas com os valores da varivel e
suas respectivas contagens, as quais so denominadas frequncias
absolutas ou simplesmente frequncias. No caso de variveis qualitativas ou
quantitativas discretas, a tabela de frequncia consiste em listar os valores
possveis da varivel e fazer a contagem na tabela de dados brutos do nmero
de suas ocorrncias. Temos a frequncia do valor, a frequncia total, a
frequncia relativa e, para variveis qualitativas ordinais e quantitativas em
geral, temos ainda as frequncias acumuladas obtidas pela soma das
frequncias de todos os valores da varivel, menores ou iguais ao valor
considerado.
Medidas de resumo
As medidas estatsticas de resumo so formas complementares da
anlise univariada, que podem ser medidas e que informam o centro dos
dados e a variabilidade dos mesmos em relao ao centro.
Apresentaremos os dois tipos fundamentais: medidas de posio, ou
tendncia central, e as medidas de disperso, ou de variabilidade.
Epidemiologia | Indicadores de Sade 14
Medidas de posio
Visam localizar o centro de um conjunto de dados, ou seja, identificar um
valor em torno do qual os dados tendem a se agrupar. As mais utilizadas so:
mdia aritmtica, mediana e moda. possvel calcular direto usando as
funes de estatstica do Excel.
A mdia aritmtica a soma de todas as observaes dividida pelo
nmero de observaes. Sua frmula considera cada observao (x 1, x 2, x 3,
...... xn) e o total de observaes (n).
A moda o valor mais frequente no conjunto de dados. Continuando
com o mesmo exemplo anterior, nesse caso, a moda 3 o valor que mais se
repete; ou seja, o nmero de residncias por casa que aparece com maior
frequncia 3.
Mediana o valor que ocupa a posio central dos dados ordenados,
deixando metade dos dados abaixo e metade acima dele. Se o nmero de
observaes for mpar, a mediana igual mdia aritmtica; se for par, ser a
mdia aritmtica dos dois valores centrais. Sua frmula considera as
observaes (x 1, x 2, x 3, ...... xn), sendo que n = total de observaes.
Mdia aritmtica = . x / n
Mediana = mdia aritmtica para n impar e para n
par = n + que indica a posio da mediana.
Suponha o nmero de moradores por residncia da quadra A da Rua das
Flores (4, 5, 3, 2, 7, 3, 4, 1, 5, 2, 3, 3); calculemos a mdia aritmtica para
descobrir o nmero de moradores por residncia:
4+5+3+2+7+3+4+1+5+2+3+4 /12 = 42/12 = 3,5
Epidemiologia | Indicadores de Sade 15
Alm das medidas de posio que estudamos, h outras que no so
medidas de tendncia central, mas esto ligadas sua caracterstica de
separar a srie em duas partes que apresentam o mesmo nmero de valores.
Vamos estudar os quantis, o quartis, o decis e os percentis medidas que
so, juntamente com a mediana, conhecidas pelo nome genrico de
separatrizes.
Quartis
Denominamos quartis os valores de uma srie dividida em quatro partes
iguais. Precisamos, portanto, de 3 quartis (Q1, Q2 e Q3) para dividir a srie em
quatro partes iguais. O primeiro quartil o valor que deixa um quarto (25%) dos
valores abaixo e trs quartos (75%) acima dele. O terceiro quartil o valor que
deixa trs quartos (75%) dos dados abaixo e um quarto (25%) acima dele. O
segundo quartil (Q2) a mediana (50%).
O primeiro e o terceiro quartis fazem o mesmo que a mediana
para as duas metades demarcadas pela mediana.
Decis
A definio dos decis obedece ao mesmo princpio dos quartis, com a
modificao da porcentagem de valores que ficam aqum e alm do decil que
se pretende calcular. Indicamos os decis (D1, D2, ..., D9), desse modo,
precisamos de 9 decis para dividirmos uma srie em 10 partes iguais.
No mesmo exemplo anterior, calculando a mediana, devemos colocar em
ordem crescente 1, 2, 2, 3, 3, 3, 3, 4, 4, 5, 5, 7. Como par, usamos:
12+1/2 = 6,5
As posies seis e sete:
3+3/2 = 3
A mediana de 3 mostra que 50% das residncias tm mais do que 3
moradores e 50% tm menos do que 3 moradores.
Epidemiologia | Indicadores de Sade 16
As medidas de posio fornecem informaes valiosas, mas, em geral, no so
suficientes para descrever os diferentes conjuntos de dados. As medidas de
disperso ou variabilidade permitem visualizar a maneira como os dados se
espalham (ou se concentram) em torno do valor central.
Percentis
Denominamos percentis ou centis os 99 valores que separam uma srie
em 100 partes iguais. Indicamos (P1, P2, ..., P99). evidente que:
O clculo de um centil segue a mesma tcnica do clculo da mediana,
do quartil e do decil:
Para mensurarmos essa variabilidade, podemos utilizar as seguintes
estatsticas: amplitude total, varincia e desvio padro; estas podem ser
calculadas direto do Excel. Existem outras medidas de disperso que no nos
interessam agora; essas so suficientes para a compreenso e a utilizao na
Epidemiologia.
Amplitude total
a diferena entre o maior e o menor valor do conjunto de dados.
Pegando o mesmo exemplo dos moradores por residncia da quadra A da Rua
P50 = Mediana P25 = Q1 P75 = Q3
Mediana = Q2 = D5 = P50
O mais interessante o quinto decil, que divide o conjunto em duas partes
iguais. Assim sendo, o quinto decil igual ao segundo quartil, que, por sua
vez, igual mediana.
Epidemiologia | Indicadores de Sade 17
Convm organizar o conjunto de dados de maneira prtica e racional, e uma das
formas de representao desse conjunto se faz por meio da apresentao grfica.
das Flores (4, 5, 3, 2, 7, 3, 4, 1, 5, 2, 3, 3), em que o maior valor 7 e o menor
1, a amplitude total ser: 7-1 = 6.
Varincia
uma medida que expressa um desvio quadrtico mdio do conjunto de
dados e sua unidade o quadrado da unidade dos dados representada por
S2.
Desvio-padro
raiz quadrada da varincia e sua unidade de medida a mesma que a
do conjunto de dados. Sua frmula : S= raiz quadrada de S2. No mesmo
exemplo anterior, S2 = 2,6; ento S = raiz quadrada de 2,6 = 1,6.
Existem vrias representaes grficas: grfico de barras, diagrama
circular ou grfico de pizza, histograma, grfico de linha ou sequncia e o
boxplot. Para facilitar o conhecimento e a utilizao dos grficos e das tabelas,
S2 = (x1 x)2 /n-1 X = mdia
Pegando o mesmo exemplo dos moradores por residncia da quadra A da
Rua das Flores (4, 5, 3, 2, 7, 3, 4, 1, 5, 2, 3, 3), ento:
X = 3,7
S2 = (4-3,7) 2 + (5-3,7) 2 + (3-3,7) 2 + (2-3,7) 2 + (7-3,7) 2 + (3-3,7) 2 + (4-3,7) 2
+ (1-3,7) 2 + (5-3,7) 2 + (2-3,7) 2 + (3-3,7) 2 + (3-3,7) 2 / 12 - 1 = 2,6
Epidemiologia | Indicadores de Sade 18
separamos por tipo de varivel as principais possibilidades de anlise
univariada:
Varivel qualitativa* Varivel quantitativa
Tabela de frequncias
Grfico de barras
Diagrama circular (pizza)
Tabela de frequncias
Histograma, boxplot
Grfico de linha ou sequncia
Polgono de frequncias
Medidas de resumo
*Essa abordagem tambm pode ser interessante para as variveis quantitativas discretas.
A anlise univariada como ponto inicial na explorao de dados
importante para a Epidemiologia. Por isso, aprofunde seu conhecimento,
assistindo ao vdeo a seguir. Confira!
Anlise bivariada
A estatstica bivariada inclui mtodos de anlise de duas variveis,
podendo ser ou no estabelecida uma relao de causa/efeito entre elas.
Lembrando que o principal objetivo da pesquisa em sade o estabelecimento
de uma relao de causa e efeito entre duas variveis, procuramos identificar
uma associao estatisticamente significativa.
Os testes estatsticos visam descartar o acaso nessa associao. Por
isso, devem ser realizados visando avaliar a validade de qualquer associao
estatstica (acaso, vis, confundimento) e julgar se a associao encontrada
representa uma relao de causa/efeito.
Epidemiologia | Indicadores de Sade 19
Todo teste estatstico tem como resultado um nmero representando a
probabilidade desse acaso, chamado de p-valor (ou valor-p). H a
necessidade de uma hiptese nula bem-definida para a interpretao da
probabilidade fornecida pelo p-valor. Quando o valor-p pequeno, indica a
pouca probabilidade da associao ter ocorrido por acaso; assim, podemos
rejeitar a hiptese nula. A associao observada pode ser devida ao acaso ou
no, e essa a nica resposta que obtemos ao se estudar a associao entre
variveis por meio de um teste estatstico adequado, gerando um p-valor.
Muitos testes estatsticos so elaborados com a premissa de que os
valores seguem uma distribuio normal e so chamados de testes
paramtricos, pois se baseiam nos parmetros da distribuio normal, a
mdia e o desvio-padro. Contudo, quando no podemos perceber ou garantir
que os valores tenham uma distribuio normal, devemos usar os testes no
paramtricos. Mesmo se, na ocorrncia de distribuio normal, aplicarmos o
teste no paramtrico, isso no causar erro, somente pode-se perder o poder
do teste em relao ao teste paramtrico.
Assim, torna-se imprescindvel, antes da escolha do teste estatstico
para dados contnuos, examinar a distribuio dos dados. Se dados contnuos
apresentam uma distribuio anormal, necessrio escolher um teste no
paramtrico ou transform-los em uma distribuio normal, aplicando, como
exemplo, uma transformao logartmica. Existem diversos mtodos para a
verificao da condio de normalidade nos dados sob anlise:
Grfico de probabilidade normal;
Mtodo dos momentos;
Aplicao do teste W Shapiro-Wilk;
Aplicao do teste Kolmogorov-Smirnov ou teste de aderncia X.
As amostras podem ser classificadas como pareadas ou no pareadas.
Um desenho de estudo comum, usando amostras pareadas, pode ser
Epidemiologia | Indicadores de Sade 20
Quando queremos fazer controle entre os grupos, podemos usar o pareamento,
considerando que dado pareado constitudo por pareamento, garantindo, assim,
uma composio rigorosamente equivalente entre os grupos em termos de
algumas variveis selecionadas.
constatado quando um grupo de indivduos examinado antes e depois de um
determinado tratamento. Amostras independentes so constitudas por
diferentes indivduos compondo cada grupo.
Vamos diferenciar dados pareados e no pareados, o que bastante
importante para a aplicao dos testes estatsticos:
Caracterstica Pareado No pareado
Distribuio Normal Qualquer uma
Varincia assumida Homognea Qualquer uma
Relao entre dados Interdependentes Qualquer uma
Medidas de localizao
central normalmente
usada
Mdia Mediana
Os procedimentos estatsticos clssicos no estudo da associao
bivariada (duas variveis) seguem o tipo de amostra das variveis e da
dependncia das observaes. No quadro a seguir, mostramos os
procedimentos estatsticos apropriados:
Escala de
mensurao das
duas variveis
Procedimento Estatstico
Para dados no Para dados pareados
Epidemiologia | Indicadores de Sade 21
envolvidas na
associao
pareados
Duas dicotmicas Teste X2 (qui-quadrado)
Teste Exato de Fisher
Coeficiente
RR risco relativo
(+IC95%)
OR razo de chance
(+IC95%)
Teste X2 de McNemar
Coeficiente Kappa
(+IC95%)
OR pareado razo de
chance (+IC95%)
Duas nominais (2x3,
3x3, 4x2 etc.)
Teste X2 (qui-quadrado) Apenas em matrizes
quadrticas (3x3, 4x4 etc.)
Coeficiente Kappa
(+IC95%)
Teste X2 de Start-Maxweel
Uma ordinal e outra
dicotmica
Teste de Mann-Whitney Teste de Wilcoxon
Uma ordinal e outra
nominal
Teste de Krusskall-Wallis
Anlise Ridit
Teste de Fridman
Duas ordinais Coeficiente de Correlao
de Spearman
Apenas em matrizes
quadrticas (3x3, 4x4 etc.)
Kappa ponderado
Uma numrica e outra
dicotmica
Teste t de Students
Teste X2 para tendncia
Teste t pareado
Epidemiologia | Indicadores de Sade 22
Para aprofundar o conhecimento sobre os testes estatsticos e suas frmulas,
consulte o captulo 15 do livro Epidemiologia e Bioestatstica na pesquisa
odontolgica, presente nas referncias.
Uma numrica e outra
nominal
ANOVA ANOVA para dados
repetidos
Uma numrica e outra
ordinal
Nenhum procedimento
simples
Nenhum procedimento
simples
Duas numricas Coeficiente de Correlao
de Pearson
Regresso Linear Simples
Correlao Interclasse
Fonte: LUIZ et al., 2005
Confira, no vdeo a seguir, a anlise bivariada e a definio de alguns
testes estatsticos mais usados em Epidemiologia. No deixe de assistir!
Regresso linear simples
um dos modelos causais mais conhecidos e utilizados e consiste em
uma varivel dependente relacionada a uma varivel independente por uma
equao linear. Busca-se a correlao entre as variveis quando uma est
relacionada a outra; enfim, quando a variao de valor da varivel
independente provoca uma mudana no valor da varivel dependente.
Epidemiologia | Indicadores de Sade 23
Apenas os mtodos de anlise multivariada permitem que se explore o
desempenho conjunto das variveis e que se determine a influncia ou a
importncia de cada uma, estando as restantes presentes.
Essa correlao apresentada graficamente pelo diagrama de
disperso, o qual mostra a relao entre duas variveis quantitativas. Os
valores de uma varivel esto no eixo x (horizontal) para a varivel
independente, enquanto da outra esto no eixo y (vertical), para a varivel
dependente; cada ponto representa uma unidade medida. Assim, devemos
analisar o diagrama observando a direo (crescente ou decrescente), a forma
(linear, no linear e aglomerados) e os pontos discrepantes.
Quanto maior for a correlao, mais prximo de 45 (crescente)
ou 135 (decrescente) ser a distribuio.
Anlise multivariada
A anlise multivariada se refere a um conjunto de mtodos estatsticos
que permite a anlise simultnea de mltiplas variveis para cada unidade
estudada. Inclui, ainda, as diversas abordagens analticas que consideram o
comportamento de muitas variveis analisadas em um mesmo momento.
Temos diversas opes de tcnicas na anlise multivariada.
Destacamos as mais discutidas e usadas na literatura cientfica: regresso
linear mltipla, regresso logstica, anlise fatorial e anlise de conglomerados.
Contudo, nesta aula, vamos abordar apenas a regresso linear mltipla e a
regresso logstica.
Regresso linear mltipla
Tcnica estatstica que analisa a dependncia de uma varivel
quantitativa em relao a duas ou mais variveis independentes (quantitativas
ou qualitativas) ou explicativas. Descreve, por meio de um modelo matemtico,
Epidemiologia | Indicadores de Sade 24
Para aprofundar o conhecimento da anlise multivariada, consulte o livro Anlise
multivariada, de Corrar et al., presente nas referncias.
a relao entre uma varivel dependente quantitativa e duas ou mais variveis
independentes qualitativas e quantitativas.
Seu ponto principal a dependncia estatstica de uma varivel em
relao a duas ou mais variveis. Tem como objetivos encontrar a relao
causal entre as variveis e estimar os valores da varivel dependente a partir
dos valores conhecidos ou fixados das variveis independentes.
Regresso logstica
Tcnica de anlise multivariada, que permite estimar a probabilidade
associada ocorrncia de determinado evento em face de um conjunto de
variveis.
No modelo logstico, usamos os valores de uma srie de variveis
independentes para predizer a ocorrncia da doena (varivel dependente). Na
regresso logstica, a varivel dependente tem uma varivel qualitativa
binominal, sendo 0 (ausncia) ou 1 (presena). Assim, todas as variveis
consideradas no modelo esto controladas entre si.
Essa tcnica deve ser usada quando a varivel dependente
dicotmica (qualitativa) e as variveis independentes forem
quantitativas ou qualitativas.
Epidemiologia | Indicadores de Sade 25
O pacote estatstico SPSS uma ferramenta para anlise de dados que
utiliza tcnicas estatsticas bsicas e avanadas.
Assista ao vdeo a seguir para saber mais sobre os tpicos avanados
em Estatstica. Confira!
SPSS Statistical Package for Social Sciences
Existem vrios pacotes estatsticos gratuitos e pagos que possibilitam a
realizao dos procedimentos estatsticos. O SPSS (Statistical Package for
Social Sciences) uma dessas opes.
O SPSS um software de estatstica de fcil manuseio,
internacionalmente utilizado h muitas dcadas. Para iniciar a anlise de
dados, necessrio a construo da base de dados, que um conjunto de
dados registrados em uma planilha, em forma de matriz, com n linhas,
correspondentes aos casos em estudo, e p colunas, correspondentes s
variveis em estudo ou itens de um questionrio. O nmero de casos (nmero
de linhas da matriz) , em geral, maior do que o nmero de variveis em
estudo (nmero de colunas).
O SPSS aceita a colagem da planilha do Excel j elaborada, com a
coluna representando as variveis estudadas e cada linha representando cada
unidade observada; depois cabe ao pesquisador nominar as colunas,
classificando o tipo de varivel, o que facilita a anlise dos dados.
Epidemiologia | Indicadores de Sade 26
Para aprofundar o conhecimento sobre o SPSS, consulte o site com o tutorial do
pacote estatstico, na apostila elaborada pela Universidade Federal do Rio Grande
do Sul, de autoria de Mundstock et al., presente nas referncias.
Sntese
Assista ao vdeo a seguir, no qual apresentaremos uma sntese dos
assuntos que foram estudados nesta aula. Confira!
Epidemiologia | Indicadores de Sade 27
1. Sobre a classificao das variveis, podemos afirmar que:
a. Varivel quantitativa contnua presso arterial de idosos do
ambulatrio de geriatria do hospital Y.
b. Varivel quantitativa ordinal nmero de bactrias por litro de leite.
c. Varivel qualitativa discreta taxa de mortalidade infantil.
d. Varivel qualitativa nominal diviso dos estgios da doena
tuberculose em inicial, controle e final.
2. Calcule a mdia (MEDA), a moda (MO), a mediana (MED), o desvio-padro
(DP), a amplitude (AM) e a varincia (VAR) do conjunto de dados e assinale
a alternativa correta:
a. MEDA= 14,5; MO= 17,1; MED= 12,5; DP= 3,4; AM= 2,5 e VAR= 11,2
b. MEDA= 15,4; MO= 11,7; MED= 14,6; DP= 4,3; AM= 11,2 e VAR= 18,1
c. MEDA= 15,4; MO= 17,1; MED= 11,7, DP= 4,3; AM= 12,1 e VAR= 12,5
d. MEDA= 14,1; MO= 11,7; MED= 14,6, DP= 3,4; AM= 11,2 e VAR= 11,2
Dados: taxa de mortalidade infantil do distrito YY (13,4 - 11,7 - 17,1 -
15,8 - 22,9 - 11,7).
Epidemiologia | Indicadores de Sade 28
Referncias
ALMEIDA FILHO N; ROUQUAYROL M. Z. Introduo Epidemiologia. 4.
ed., rev. e ampliada. Rio de Janeiro: Guanabara Koogan, 2013.
ALMEIDA FILHO, N; BARRETO, M. L.. Epidemiologia & Sade: fundamentos,
mtodos, aplicaes. [Reimpr.]. Rio de Janeiro: Guanabara Koogan, 2012.
BONITA, R. Epidemiologia bsica. 2.ed. So Paulo: Santos, 2010.
CORRAR, L. J.; PAULO, E.; DIAS FILHO, J. M. (coord). Anlise multivarada:
para os cursos de Administrao, Cincias Contbeis e Economia. So Paulo:
Atlas, 2007.
CZERESNIA, D.; ALBUQUERQUE, M. de F. M. de. Modelos de inferncia
causal: anlise crtica da utilizao da estatstica na Epidemiologia. Revista
Sade Pblica, So Paulo, v. 29, n. 5, out. 1995. Disponvel em:
. Acesso em: 30 jun.2013.
HULLEY, S. B. et al.. Delineando a pesquisa clnica: uma abordagem
epidemiolgica. 2. ed. Porto Alegre: Artmed, 2003
LUIZ, R. R., COSTA, A. J. L., NADANOVSKY, P. Epidemiologia e
Bioestatstica na pesquisa odontolgica. So Paulo: Atheneu, 2005.
LUIZ, R. R., STRUCHINER, C. J. Inferncia causal em epidemiologia: o
modelo de respostas potenciais. Rio de Janeiro: Fiocruz, 2002. 112 p.
Disponvel em SciELO Books . Acesso em: 29 jun.
2013.
MEDRONHO, R. A. et al.. Epidemiologia. So Paulo: Atheneu, 2009.
MUNDSTOCK, E. et al.. Introduo anlise estatstica: utilizando o SPSS
13.0. Instituto de Matemtica. Universidade Federal do Rio Grande do Sul,
Porto Alegre. Cadernos de Matemtica e Estatstica, srie B, n. XX, trabalho de
apoio didtico, maio 2006. Disponvel em:
Epidemiologia | Indicadores de Sade 29
SPSS/Introdu%E7%E3o%20%E0%20An%E1lise%20Estat%EDstica%20utiliza
ndo%20o%20SPSS%2013_0.pdf>. Acesso em: 29 jun. 2013.