Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
�1
BIOESTATÍSTICAAna Paula Fernandes
�2
APRESENTAÇÃO➤ Ana Paula Fernandes
➤ 1J 107 - Santa Mônica
➤ Ana.mat.br
➤ CV Lattes
➤ Bioestatística
➤ Cronograma
➤ Ficha da disciplina
➤ Calendário acadêmico
�3
�4
�5
SEXTA-FEIRA19:50 - 22:30
5R-A 204
�6
PROPOSTA DE CRONOGRAMA
�7
LIVRO TEXTO
�8
�9
�10
�11
CAPÍTULO 1➤ Visão geral da estatística
➤ Classificação dos dados
➤ Coleta de dados e planejamento de experimentos
�12
�13
www.ibge.gov.br�14
DEFINIÇÕES➤ Dados: consistem em informações provenientes de
observações, contagem, medições ou respostas.
➤ Estatística: é a ciência que trata da coleta, organização, análise e interpretação dos dados para tomada de decisões.
➤ Status = estado
�16
CONJUNTOS DE DADOS
População x Amostra
�17
EXEMPLO
Em uma pesquisa recente, foi perguntado a 641 proprietários de pequenas empresas nos Estados Unidos se eles achavam que a presença de sua empresa no Facebook tinha valor. Duzentos e cinquenta e oito dos 641 responderam que sim.
(a) Identifique a população e a amostra.
(b) Descreva o conjunto de dados da amostra.
�18
DEFINIÇÕES
➤ Parâmetro: é a descrição numérica de uma característica populacional.
➤ Estatística: é a descrição numérica de uma característica amostral.
�19
EXEMPLODetermine se o valor numérico descreve um parâmetro populacional ou amostral.
➤ Uma pesquisa recente com aproximadamente 400.000 empregadores reportou que o salário médio inicial para um especialista em marketing é de U$ 53.400 por ano.
➤ A nota média de matemática obtida no vestibular pelos calouros de uma universidade é de 514.
➤ Em uma checagem aleatória de 400 lojas varejistas, o FDA (Food and Drug Administration) descobriu que 34% das lojas não estavam estocando peixes na temperatura apropriada.
�20
RAMOS DA ESTATÍSTICA
➤ Estatística descritiva: é o ramo da estatística que envolve a organização, o resumo e a representação dos dados.
➤ Estatística inferencial: envolver uso de uma amostra para chegar a conclusões sobre uma população.
➤ Uma ferramenta básica para a inferência estatística é a probabilidade.
�21
https://g1.globo.com/bemestar/noticia/pesquisa-preliminar-aponta-que-546-dos-brasileiros-de-16-a-25-anos-tem-hpv.ghtml
�22
LISTA DE EXERCÍCIOS (PAG. 7)➤ 1; 2; 3; 4; 25; 41 e 48
➤ Escolham outros exercícios! ;o)
�23
CLASSIFICAÇÃO DOS DADOS
➤ A natureza dos dados com os quais estamos trabalhando determinará qual procedimento estatístico pode ser usado.
➤ Dados qualitativos consistem em atributos, rótulos ou entradas não numéricas.
➤ Dados quantitativos consistem em medidas numéricas ou contagens.
�24
EXEMPLO https://pt.wikipedia.org/wiki/2018_no_cinema
Qualitativo Quantitativo�25
DADOS (Variáveis)
Qualitativos Quantitativos
�26
Não tem significado quantitativo, embora se possa usar números para
rotular ou identificar casos. Os resultados possíveis da observação
do fenômeno (ou característica) são expressos por atributos.
Exemplos: sexo, cor dos olhos, religião, estado civil, profissão,
classe social, cursos, etc.
Quando os resultados da observação da variável são expressos em números, normalmente acompanhados por uma unidade de medida. Exemplos: peso, altura, salário, idade, vendas, custo, etc.
Variáveis Qualitativas possuem dois tipos: Nominal (ou Categórica) e Ordinal (ou Por Postos).
Variável Qualitativa NOMINAL Não possui ordenamento nem hierarquia. Os valores assumidos constituem meros rótulos (nomes) identificativos das categorias e NÃO permitem comparações entre si. Exemplos: sexo, religião, estado civil, regiões, modelos, cursos, etc.
Variável Qualitativa ORDINAL As observações podem ser ranqueadas ou ordenadas em função da quantidade possuída do atributo ou por preferência. Permite comparações do tipo (maior que)/(menor que). Exemplos: classe social, cargo, desempenho, escolaridade, etc.
Variáveis Quantitativas também possuem dois tipos: Discreta e Contínua.
Variável Quantitativa DISCRETA Assume valores pertencentes ao conjunto de números inteiros positivos. Normalmente é proveniente da contagem do número de itens/ocorrências. Exemplos: nº de alunos, nº de mulheres, nº de peças produzidas, nº de defeitos, nº de acidentes, etc.
Variável Quantitativa CONTÍNUA Pode assumir qualquer valor num intervalo contínuo. Sempre que entre dois valores assumidos por uma variável, possa existir (teoricamente) um terceiro valor entre eles, trata-se de uma variável contínua. Normalmente, é proveniente de medições (geralmente com algum instrumento físico) e exige a menção à unidade de medida. Exemplos: peso, altura, volume, tempo, salário, receita de vendas, etc..
Variável
Qualitativa Quantitativa
Nominal Ordinal Discreta Contínua
Escala NOMINAL Dados nesse nível são categorizados usando-se nomes, rótulos ou qualidades. Não é possível realizar cálculos matemáticos nesse nível (dados qualitativos). Os números servem apenas como rótulos para as classes e não mantêm qualquer relação de grandeza entre si. Exemplos: 1-Masculino / 2-Feminino; 1-Solteiro / 2-Casado / 3-Separado
Escala ORDINAL Dados nesse nível podem ser postos em ordem ou classificados, mas as diferenças entre as entradas de dados não têm sentido matemático. Exemplos: 1- 1ºGrau / 2-2ºGrau / 3-3ºGrau1-Péssimo / 2-Ruim / 3-Regular / 4-Bom / 5-Ótimo
NÍVEL DE MENSURAÇÃO nominal < ordinal < intervalar < de razão
Escala INTERVALAR Os dados podem ser ordenados e é possível calcular diferenças que tenham sentido matemático entre as entradas de dados. No nível intervalar, um registro zero simplesmente representa uma posição em uma escala; a entrada não é um zero natural (zero com significado: "nenhum").
Exemplo: Temperatura em graus Celsius - a escala tem uma unidade de medida, a distância entre 20º, 25º e 30º tem um significado preciso de 5º, ou seja, 25º-20º=5º, 25º+5º =30º. A temperatura de 0ºC não representa uma condição na qual não há calor (0ºC é uma posição na escala Celsius, não é um zero natural). (TEIXEIRA, Mariane Mendes. "Temperatura e calor"; Brasil Escola. Disponível em <https://brasilescola.uol.com.br/fisica/temperatura-calor.htm>. Acesso em 15 de marco de 2019.)
Escala PROPORCIONAL ou de RAZÃO Os dados são similares aos dados no nível intervalar, com a propriedade adicional de que, nesse nível, um registro zero é um zero natural. Uma razão de dois valores pode ser formada de modo que um dado possa ser expresso significativamente como um múltiplo de outro. Exemplos: Peso kg - zero é peso nulo, 80 kg é o dobro de 40 kg. Contagem de peças defeituosas - 30 peças defeituosas é o triplo de 10 peças, e 0 peças significa nenhuma peça defeituosa.
Quantitativo
Nível de mensuração:
Ordinal
Quantitativo
Nível de mensuração:
de Razão�32
EXEMPLOS (PÁG. 13)
EXEMPLOS (PÁG. 13)
LISTA DE EXERCÍCIOS (PÁG. 14)➤ 7 a 14;
➤ 15 a 20;
➤ 21 a 24;
➤ 27 a 32
�35
DADOS ABSOLUTOS X RELATIVOSA apresentação de dados estatísticos, principalmente quando se planeja proceder a uma análise exploratória ou descritiva para uma variável, será mostrado que em muitos casos pode ser mais conveniente a apresentação de resultados na forma relativa ao invés de na forma absoluta.
Dados ABSOLUTOS Dados resultantes da coleta direta da fonte, sem qualquer outra manipulação que a contagem ou medição da característica ou fenômeno em estudo. Normalmente requerem a especificação da unidade de medida da variável ou dos objetos pesquisados.
Dados RELATIVOS São os resultados de comparações por quociente (ou razão) que se estabelecem entre dados absolutos. Objetiva realçar ou facilitar as comparações entre quantidades, e são normalmente expressos por Porcentagens, Índices, Coeficientes e Taxas.
PORCENTAGENS➤ Úteis quando queremos destacar a participação da parte no todo.
➤ Exemplo: A pop. de Uberlândia no censo de 2010 foi de 604.013. O número de católicos foi de 330.564. Como representar a porcentagem de católicos em Uberlândia?
➤ 330.564 / 604.013 = 0,5474 —- 54,74% católicos
ÍNDICES➤ São razões entre duas grandezas tais que uma não inclui a outra.
➤ Exemplos: ➤ Densidade Demográfica (População/Superfície) ➤ Renda per Capita (Renda/População)
COEFICIENTES➤ São razões entre o número de ocorrências e o número total de casos
(ocorrências+não ocorrências).
➤ Exemplos: ➤ Coeficiente de Natalidade (Nascimentos/População) ➤ Coeficiente de Aproveitamento (Alunos Aprovados/Total de Alunos) ➤ Coeficiente de Aprovação do Governo (Nro. de aprovação/Total da
População).
TAXAS➤ São coeficientes multiplicados por uma potência de 10.
➤ Observe que a Porcentagem é uma Taxa Centesimal (102 = 100).
➤ Exemplos: ➤ Taxa de Mortalidade é o Coeficiente de Mortalidade multiplicado
por 1.000. ➤ A dosagem de Fósforo nas análises químicas de solo, normalmente é
apresentada em ppm (partes por milhão), a exemplo de muitos outros casos quando o valor absoluto da ocorrência é muito pequeno.
ESTUDO ESTATÍSTICO
O objetivo de todo estudo estatístico é
coletar dados e então usá-los para
tomar uma decisão.
�41
PLANEJAMENTO DE UM ESTUDO ESTATÍSTICO
1. Identifique a(s) variável(is) de interesse (o foco) e a população do estudo.
2. Desenvolva um plano detalhado para a coleta dos dados. Se usar uma amostra, certifique-se de que a amostra é representativa da população.
3. Colete os dados.
4. Descreva os dados usando técnicas de estatística descritiva.
5. Interprete os dados e tome a decisões sobre a população usando estatística inferencial.
6. Identifique quaisquer erros possíveis.
�42
CATEGORIAS DE UMA PESQUISA ESTATÍSTICA➤ Estudo observacional: um pesquisador observa e mede as características
de interesse de parte de uma população, mas não muda as condições existentes.
➤ Exemplo: pesquisadores observaram e registraram o comportamento oral de crianças acima de 3 anos de idade com objetos não alimentícios.
➤ Experimento, um tratamento é aplicado em uma parte da população, chamada de grupo de tratamento, e as respostas são observadas. Outra parte da população pode ser usada como um grupo controle, no qual nenhum tratamento é aplicado. ➤ Os indivíduos nos grupos de tratamento e controle são chamados de
unidades experimentais.
�43
EXEMPLO: ESTUDO OBSERVACIONAL VERSUS EXPERIMENTO➤ Pesquisadores estudam o efeito da complementação da
vitamina D3 em pacientes com deficiência de anticorpos ou com infecções frequentes no trato respiratório. Para realizar o estudo, 70 pacientes receberam 4000 UI de vitamina D3 diariamente por um ano. Outro grupo de 70 pacientes recebe um placebo diariamente por um ano.
➤ Pesquisadores conduzem um estudo para determinar o índice de aprovação pública nacional do presidente dos EUA. Para realizar o estudo, os pesquisadores ligaram para 1.500 residentes no país e perguntaram se eles aprovavam ou não o trabalho realizado pelo presidente.
�44
COLETA DE DADOS➤ Simulação é o uso de um modelo matemático ou físico para reproduzir as
condições de uma situação ou processo. ➤ A coleta de dados frequentemente envolve o uso de computadores. ➤ As simulações permitem que você estude situações que são impraticáveis ou
mesmo perigosas para serem criadas na vida real, e frequentemente economizam tempo e dinheiro.
➤ Exemplo: fabricantes usam bonecos para estudar efeitos de colisões em humanos.
➤ Pesquisa é uma investigação de uma ou mais características de uma população. ➤ As pesquisas são conduzidas com pessoas, por meio de perguntas. ➤ Os tipos mais comuns de pesquisas são realizados por meio de entrevistas,
internet, telefone ou correio. ➤ Ao planejar uma pesquisa, é importante escolher bem as perguntas para não
obter resultados tendenciosos, que não são representativos de uma população.
�45
PLANEJAMENTO EXPERIMENTAL➤ Para produzir resultados significativos e não tendenciosos, os
experimentos devem ser cuidadosamente planejados e executados.
➤ Três elementos-chave de um experimento bem planejado são controle, aleatorização e replicação.
➤ Em razão de os resultados poderem ser arruinados por uma variedade de fatores, a capacidade de controlá-los é importante. Um desses fatores é uma variável de confusão.
➤ Uma variável de confusão ocorre quando um pesquisador não pode distinguir um ou mais fatores que causaram os efeitos provocados sobre a variável em estudo, gerando confusão.
�46
EXEMPLO
➤ Para atrair mais consumidores, o dono de uma cafeteria realiza um experimento ao pintar sua loja usando cores vibrantes. Ao mesmo tempo, um shopping center da região realiza sua grande inauguração. Se os negócios aumentarem na cafeteria, não podemos determinar se isso ocorreu por causa das novas cores ou do novo shopping. ➤ Os efeitos das cores e do shopping center se confundem.
�47
EFEITO PLACEBO➤ Outro fator que pode afetar os resultados experimentais é o efeito
placebo.
➤ O efeito placebo ocorre quando um indivíduo reage favoravelmente a um tratamento quando, na verdade, ele(a) recebeu um placebo.
➤ Para ajudar a controlar ou minimizar o efeito placebo, uma técnica chamada cegamento pode ser usada.
➤ O experimento cego (ou cegamento) é uma técnica na qual o indivíduo não sabe se está recebendo um tratamento ou um placebo.
➤ Em um experimento duplo-cego, nem o pesquisador nem os indivíduos sabem quem está recebendo um tratamento ou um placebo.
➤ O pesquisador é informado depois que todos os dados forem coletados
�48
ALEATORIZAÇÃO➤ Outro elemento de um experimento bem planejado é a aleatorização.
➤ Aleatorização é o processo de se designar indivíduos aleatoriamente para diferentes grupos de tratamento.
➤ Em um planejamento completamente aleatorizado, os indivíduos são designados para diferentes grupos de tratamento por meio de seleção aleatória.
➤ Em alguns experimentos, pode ser necessário usar blocos, que são grupos de indivíduos com características similares.
�49
EXEMPLO➤ Um pesquisador que está testando os efeitos de uma nova bebida para
perda de peso.
➤ Dividir os indivíduos por faixa etária.
➤ Dentro de cada faixa, designar aleatoriamente os indivíduos ou para o grupo de tratamento ou para o grupo controle.
�50
PLANEJAMENTO DE PARES COMBINADOS➤ Os indivíduos são colocados em pares de acordo com a similaridade.
➤ Um indivíduo em cada par é selecionado aleatoriamente para receber um tratamento enquanto o outro indivíduo recebe um tratamento diferente.
➤ Por exemplo, dois indivíduos podem ser colocados em pares por causa da idade, de uma localização geográfica ou de uma característica física em particular.
�51
TAMANHO DA AMOSTRA➤ O tamanho da amostra, que é o número de indivíduos em um estudo, é
outra parte importante do planejamento experimental.
➤ Para melhorar a validade dos resultados experimentais, a replicação é necessária.
➤ Replicação é a repetição de um experimento sob condições iguais ou semelhantes.
➤ Exemplo: suponha que um experimento seja planejado para testar uma vacina contra gripe. No experimento, 10.000 pessoas recebem a vacina e outras 10.000 recebem um placebo. Por conta do tamanho da amostra, a eficácia da vacina seria provavelmente observada. Mas, se os indivíduos no experimento não forem selecionados de modo que ambos os grupos sejam similares (de acordo com gênero e idade), os resultados serão de menor valor.
�52
TÉCNICAS DE AMOSTRAGEM➤ Um censo é uma contagem ou medição de toda a população. A realização
de um censo fornece informações completas, mas é frequentemente caro e difícil de realizar.
➤ Uma amostragem é uma contagem ou medição de parte de uma população e é mais comumente usada nos estudos estatísticos.
➤ Para coletar dados não viesados, um pesquisador deve assegurar que a amostra é representativa da população.
➤ Amostra tendenciosa: não é representativa da população da qual é extraída.
➤ Exemplo: uma amostra de estudantes universitários entre 18 a 22 anos não é representativa de toda a população entre 18 a 22 anos do país.
�53
TÉCNICAS DE AMOSTRAGEM➤ Técnicas de amostragem apropriadas devem ser utilizadas para
garantir que as inferências sobre a população sejam válidas.
➤ Lembre-se de que, quando um estudo é realizado com dados falhos, os resultados são questionáveis.
➤ Mesmo com os melhores métodos de amostragem, um erro de amostragem pode acontecer.
�54
TÉCNICAS DE AMOSTRAGEM➤ Amostragem aleatória simples (casual, sorteio)
➤ Amostragem estratificada (estratos, camadas)
➤ Amostragem por conglomerado (grupos)
➤ Amostragem sistemática (sistema)
➤ Amostragem por conveniência (facilidade, disponibilidade)
�55
AMOSTRAGEM ALEATÓRIA SIMPLES➤ Exemplo: Há 61 estudantes matriculados nesse curso de
Cálculo 3. Quero uma amostra de 5 estudantes para responder uma pesquisa.
�56
=ALEATÓRIOENTRE(1;60)
5. Andressa,
14. Débora,
17. Gabriel Pires,
51. Nicolas,
54. Pedro �57
AMOSTRA ESTRATIFICADA ➤ Quando é importante que uma amostra tenha elementos de
cada segmento da população!
➤ Os elementos de uma pop. são divididos em subconjuntos (estratos) que compartilham uma característica similar como idade, sexo, grupo étnico ou até mesmo preferência política.
➤ Uma amostra então é selecionada aleatoriamente de cada um dos estratos.
�58
https://cidades.ibge.gov.br/brasil/mg/uberlandia/panorama
�59
Espírita: 44.817
Católica: 330.564
Evangélica: 152. 411
330.564 / 604.013 = 0,5474 —- 54,74% católicos
152.411 / 604.013 = 0,2523 —- 25,23% evangélicos
44.817 / 604.013 = 0,0742 —- 7,42 % espíritas
Soma —- 87,39% da pop. de Uberlândia
Amostra deve ser
PROPORCIONAL
as porcentagem da
população
�60
AMOSTRAGEM POR CONGLOMERADO➤ Apropriada quando a população recai em subgrupos que
correm naturalmente, cada um tendo características similares
Devemos ter cuidado para assegurar que todos tenham características similares.
Exemplo: Se um dos bairros tem uma proporção maior de pessoas espíritas, os dados podem não ser representativos da população.
�61
AMOSTRAGEM ESTRATIFICADA X POR CONGLOMERADOS➤ Para uma amostragem estratificada, cada um dos estratos
contém elementos com certas características (faixa etária, religião, renda…)
➤ Os conglomerados devem conter elementos com todas essas características (TODAS as faixas etárias, TODAS religiões, TODAS as rendas…)
�62
AMOSTRAGEM SISTEMÁTICA➤ É criado um sistema para selecionar uma amostra.
➤ Sorteio-se um número
➤ Exemplo: 5
➤ Os demais alunos serão amostrados de 7 em 7:
➤ 12, 19, 26, 33…
*caso ocorra qualquer padrão de regularidade nos dados, esse tipo de amostragem deve ser evitado.
�63
AMOSTRAGEM POR CONVENIÊNCIA ➤ Frequentemente leva a estudos tendenciosos (portanto, não é
recomendado).
➤ Uma amostra por conveniência consiste somente em membros da população que são fáceis de contatar.
➤ Piada: ir para porta do Maracanã em dia de um jogo Flamengo x LDU e perguntar para qual time a pessoa torce.
➤ Claro que a resposta será Corinthians! kkkkk!
�64
LISTA DE EXERCÍCIOS (PÁG. 24)➤ 11 a 14;
➤ 15, 16;
➤ 23 a 30;
➤ 33 a 36;
➤ Veja o teste do cap. 1 na página 31! (É como se fosse uma prova…)
�65
HISTÓRIA DA ESTATÍSTICA (PÁG. 33)➤ Curiosidade…
➤ William Gosset (1876-1937), no início do séc. XX estudo o processo de produção de cerveja e desenvolveu o teste-t para corrigir problemas de pequenas amostras!
➤ Químico
➤ Cervejaria de Arthur Guinness & Son
➤ Aplicou a estatística para selecionar a melhor cevada
➤ Usou o pseudonimo Student (t-Student)
�66
FIMAcompanhe as próximas aulas com o livro texto!
�67