Upload
internet
View
105
Download
0
Embed Size (px)
Citation preview
1
ME203 – Estatística
ElementarIntrodução
Prof. LauraSegundo Semestre 2008
2
Objetivos da Estatística
Através dos métodos estatísticos, obter um melhor
conhecimento sobre o mundo físico, biológico e
social. Os principais passos são:
coleta dos dados
interpretação das informações obtidas
tomada de decisões, formulação de previsões
e/ou diagnósticos
3
Planejamento de experimentos
Definir formas de coleta de dados (amostragem)
válidas e eficientes que:
minimizem a possibilidade de que os dados
apresentem uma visão distorcida da realidade,
minimizem tempo e recursos utilizados
Realização de amostragens:escolha dos indivíduos, shopping center, eleições
4
Estatística descritiva
Interpretação dos dados coletados, mediante
apresentação dos dados: gráficos, tabelas
resumo dos dados: medidas-resumo de posição,
de dispersão
Uma apresentação e um resumo bem feitos podem
entregar muita informação sobre as variáveis em
estudo.tipo de dadostipos de gráficosrelações entre as variáveis
5
Inferência estatística
Tem como objetivo definir ferramentas formais que
permitam testar teorias/hipóteses com ajuda dos
dados coletados para fins de
previsões
tomada de decisões
diagnósticosinferência clássica ou freqüentistainferência bayesiana
6
Probabilidade
Construção de modelos matemáticos que
permitam incorporar a aleatoriedade existente,
ou proveniente de nossa falta de informação, no
mundo real:
fumantes – doenças respiratórias – progressão
mecânica de Newton – micropartículas em meio
líquido – movimento Browniano
7
Questões que a estatística estuda: Como planejar um experimento para medir o
efeito de um novo medicamento.
Como são medidas as taxas de inflação e desemprego, e como elas estão relacionadas entre si?
Prever se haverá segundo turno nas eleições para governador de SP.
Determinar a chance de um time específico ser rebaixado para a 3ª divisão.
8
Experimento realizado para a testar a efetividade da vacina Salk, Estados Unidos, 1953Tamanho dos grupos e taxas de casos de pólio por 100 000 em cada
grupo (números arredondados).
O experimento controlado com aleatorização duplamente cego
A proposta NFIP
Tamanho Taxa Tamanho Taxa
Tratamento 200 000 28 Tratamento 225 000 25
Controle 200 000 71 Controle 725 000 54
Não autorizados
350 000 46 Não autorizados 125 000 44
experimento controlado, homogeneização da amostra, caso-controle
9
Estudo observacional sobre a relação entre pílula anticoncepcional e doenças trombo-embólicasCasos: mulheres entre 16 e 40 anos com quadro
de trombose arterial, embolia pulmonar,
trombose cerebral ou trombose arterial,
p1=proporção de usuárias (n=84, p2 =50%)
Controle: duas por caso, p2=proporção de
usuárias (n=168, p2 =14%)
É p1 significativamente diferente de p2?
10
Método Científico
ColetarDados
FormularTeorias
Resumir Resultados
Interpretare
Tomar Decisões
11
Conceitos básicos População é o grupo completo de indivíduos
em estudo, dos quais se pretende obter uma informação.
Unidade é um objeto individual da população.
Amostra é uma parte da população utilizada para obter a informação.
O tamanho da população será denotado por N, e o tamanho da amostra por n.
12
Primeiros passos
Como coletar uma boa amostra?
De que tamanho deve ser amostra?
13
Exemplo
Suponha que você é dono(a) de um sacolão.
Um carregamento de batatas acaba de
chegar e você deve verificar a qualidade da
mercadoria. O dono do carregamento pega
algumas batatas do topo e diz que as batatas
estão ótimas.
Você acha que esta é uma boa amostra?
14
Exemplo
Um programa de televisão promove uma discussão sobre o tema: “o corintins voltará para a primeira divisão?” e convida os espectadores a participarem com suas respostas por telefone (0300-xxxx sim; 0300-yyyy não).
A conclusão ao fim do programa é válida para estimar a proporção de torcedores a favor desse time?
15
Definição
Um método de amostragem que produz
resultados que sistematicamente diferem da
verdade sobre a população são chamados
viesados ou viciados. O erro é chamado viés
ou vício.
16
Definição
Uma amostra conveniente é uma amostra
que consiste de unidades da população que
são facilmente acessíveis.
Uma amostra voluntária é uma amostra que
consiste de unidades da população que
decidem responder.
Estes dois tipos de amostras são viciadas.
17
Definição Viés por seleção é a tendência sistemática no
procedimento de amostragem de excluir ou incluir um certo tipo de unidade.
Viés por não resposta é a distorção que aparece no estudo quando um grande número de unidades se recusa a responder.
Viés na resposta é a distorção que aparece devido à formulação da pergunta e/ou ao comportamento do entrevistador.
18
Exemplo
Você quer conhecer o perfil do estudante da UNICAMP e você decidiu que 50 estudantes seria um número suficiente para entrevistar. Você escolhe um lugar no campus e entrevista alguns dos estudantes que passam.
Quais são as possíveis conseqüências desta amostragem?
19
Exemplo
Separação vs. atração
Estudos psicológicos mostram que a relação
do casal se enfraquece com a distância
prolongada. Como diz o velho ditado: “longe
dos olhos, longe do coração”.
Você acha esta conclusão razoável?
20
Exemplo
Separação vs. atração
Estudos psicológicos mostram que a relação
do casal se fortalece com a distância
prolongada. Como diz o velho ditado: “a
saudade aumenta o amor”.
Você acha esta conclusão razoável?
21
Observação
Quando um processo de amostragem é
viciado, tomar amostras grandes não ajuda.
Isto apenas repete o erro em grande escala.
22
Definição
Uma forma de superar a parcialidade no
momento de selecionar a amostra é usar o
“acaso”. A idéia básica é que toda unidade
da população deve ter a mesma chance de
ser selecionada para a amostra.
Tais métodos de amostragem são ditos
probabilísticos.
23
Tipos de amostragens probabilísticas
amostragem aleatória simples
amostragem aleatória estratificada
amostragem sistemática
amostragem por grupos
24
Definição
Uma amostra aleatória simples de tamanho n
é uma amostra de n unidades selecionada de
modo que todas as amostras de tamanho n
têm a mesma chance de ser escolhidas.
25
ExemploComo parte de um estudo sobre o efeito da
fragmentação florestal na diminuição da população de aves canoras, uma equipe de pesquisadores precisa recolher informação sobre depredação nos ninhos.
A grande área florestal é dividida em N=80 partes de mesmo tamanho aproximadamente. Devido à limitação de recursos, eles selecionam n=5 das 80 partes aleatoriamente para serem observadas.
26
Exemplo
A fim de conhecer o perfil da turma de
Estatística Elementar, deseja-se selecionar
de forma aleatória uma amostra de 10
alunos.
Como fazê-lo?
Essa seria uma boa amostra para conhecer o
perfil dos alunos da Unicamp?
27
Definição
Uma amostra aleatória estratificada é
selecionada dividindo a população em
subgrupos mutuamente exclusivos e
tomando uma amostra aleatória simples de
cada estrato. A amostra completa é a
combinação de todas as sub-amostras.
28
Exemplo
No estudo das aves, a floresta poderia ser
dividida por particularidades do terreno
(altura, recursos hídricos).
No estudo do perfil dos alunos da faculdade,
poderíamos realizar amostras aleatórias
simples das diversas turmas, classificadas
por semestre, por sexo, por altura.
29
Definição
Para uma amostragem sistemática 1-em-k,
deve-se ordenar as unidades da população
de alguma forma e escolher aleatoriamente
uma das primeiras k unidades, na lista
ordenada. Esta unidade é a primeira da
amostra. Continuamos selecionando toda k-
ésima unidade daí em diante.
30
Exemplo
No exemplo da floresta, selecionando 1-em-
16, obtemos uma amostra de tamanho 5.
No exemplo do perfil da turma de estatística,
podemos selecionar 1-em-8 de acordo com a
lista de presença.
31
Definição
Em uma amostragem por grupos, as unidades
da população são subdivididas em grupos.
Um ou mais grupos são selecionados
aleatoriamente. Se um grupo for selecionado,
todas as unidades que formam o grupo
passam a fazer parte da amostra.
32
Exemplo
No estudo do perfil dos alunos da Unicamp,
se a turma de Estatística Elementar for
selecionada, todos os seus integrantes serão
incluídos na amostra.
33
Conceitos básicos
Variável é uma característica de interesse a
ser medida em cada unidade amostral.
34
Tipos de variável
Variável
qualitativa ou atributo quantitativa
nominal ordinal discreta contínua
35
Exemplos de variáveis qualitativa nominal: sexo, carreira, região onde
mora, portador de diabetes
qualitativa ordinal: grau de instrução, nível de renda, grau de evolução de uma doença
quantitativa discreta: número de filhos, número de acidentes em um mês
quantitativa contínua: peso, altura, pressão sangüínea sistólica, tempo de vida útil
36
Tipos de gráficos
Dados unidimensionais: Gráfico de pizza Histograma Gráfico de barras Boxplot
Dados bivariados Diagrama de dispersão
37
Gráfico de pizza
tipo Atipo Btipo Ctipo D
38
Histograma
Distribuição de notas finais na disciplina de Noções de Estatística
39
Gráfico de Barras
4242,5
4343,5
4444,5
4545,5
4646,5
47
1° Trim 2° Trim 3° Trim 4° Trim
rendimento
40
Gráfico de dispersão
xx
xx
x
x
xx
x
xx
Correlação entre variáveis quantitativas
X
Y
41
Associação entre variáveis qualitativas
Masculino Feminino Total
Economia
Administração
42
28
18
12
60
40
Total 70 30 100
Distribuição conjunta das proporções de alunos segundo o sexo e o curso escolhido
Variáveis não associadas
42
Masculino Feminino Total
Física
Ciências sociais
50
20
10
20
60
40
Total 70 30 100
Distribuição conjunta das proporções de alunos segundo o sexo e o curso escolhido
Variáveis associadas
Associação entre variáveis qualitativas
43
Taxas de morte por 1000 de acordo com estado civil, Estados Unidos, 1949-1951.
solteiro casado viúvo divorciado
estado civil
0,0
100,0
200,0
300,0ta
xa d
e m
ort
e p
or
1000
44
Associação entre variáveis quantitativas e qualitativas
Feminino Masculino
gênero
0,0
100,0
200,0
300,0
taxa
de
mo
rte
po
r 10
00