Upload
internet
View
105
Download
2
Embed Size (px)
Citation preview
MBA Prof. Ms. Cristiane A. Castela 1
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Estatística AplicadaEstatística Aplicada
Aula 02Aula 02
MBA Prof. Ms. Cristiane A. Castela 2
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
“A amostragem é o processo de recolhimento dos dados estatísticos
para a construção da imagem da população em estudo”.
Técnicas de AmostragemTécnicas de Amostragem
1. Amostragem Aleatória Simples
2. Amostragem Estratificada
3. Amostragem Sistemática
MBA Prof. Ms. Cristiane A. Castela 3
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Amostragem Aleatória Simples (AAS)
Processo de amostragem onde todos os elementos de uma população têm a mesma probabilidade de serem selecionados.
Pode ocorrer: com reposição ou sem reposição.
MBA Prof. Ms. Cristiane A. Castela 4
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Prof. Cristiane A. Castela 4
MBA Prof. Ms. Cristiane A. Castela 5
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
A revista Fortune publica dados sobre vendas, lucros, ativos, lucro líquido dos acionistas, valor de mercado e rendimentos por ação das 500 maiores corporações industriais norte-americanas (Fortune 500,2003). Suponha que você queira selecionar uma amostra aleatória simples de dez corporações da lista da Fortune 500. Use os três últimos dígitos da coluna 9 da Tabela do slide anterior, iniciando com 554. Leia a coluna de cima para baixo e identifique os números das dez empresas que seriam selecionadas.
Resposta: 459, 147, 385, 113, 340, 401, 215, 2, 33, 348
Exercício 03
MBA Prof. Ms. Cristiane A. Castela 6
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Suponha que queiramos identificar uma amostra aleatória simples de 12 dos 372 médicos de determinada cidade. Os nomes dos médicos estão disponíveis em uma organização médica local. Use a oitava coluna de números aleatórios de cinco dígitos da Tabela para identificar os 12 médicos da amostra. Ignore os dois primeiros dígitos aleatórios de cada agrupamento de cinco dígitos dos números aleatórios. Esse processo inicia-se com o número aleatório 108 e prossegue coluna abaixo na lista de números aleatórios.
Resposta: 108, 290, 201, 292, 322, 9, 244, 249, 226, 125, (continuando na parte superior da 9ª coluna) 147 e 113.
Exercício 04
MBA Prof. Ms. Cristiane A. Castela 7
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Indique se as populações a seguir devem ser consideradas finitas ou infinitas:
a) Todos os eleitores inscritos do estado da Califórnia.
b) Todos os aparelhos de televisão que poderiam ser produzidos pelo parque industrial da TV-M Company, em Allentown, Pensilvânia.
c) Todos os pedidos que poderiam ser processados por uma empresa de encomenda postal.
d) Todas as chamadas telefônicas de emergência que poderiam ser feitas a uma delegacia de polícia local.
e) Todos os componentes que a Fibercon, Inc., produziu no segundo turno de trabalho no dia 17 de maio.
Finita
Infinita
Infinita
Infinita
Finita
Prof. Ms. Cristiane Attili Castela 7Estatística I
Exercício 05
MBA Prof. Ms. Cristiane A. Castela 8
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Além da Amostragem Aleatória Simples, existem outros tipos de Amostragem Probabilística.
Entre elas:
• Amostragem Estratificada
• Amostragem Sistemática
MBA Prof. Ms. Cristiane A. Castela 9
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Amostragem Estratificada(ou por estratificação)
A população é dividida em partes (estratos).
Exemplo: Uma população possui 800 mulheres e 300 homens. Escolhem-se 16 mulheres e 6 homens como amostra. Respeita-se a proporção 8:3 entre homens e mulheres da população.
MBA Prof. Ms. Cristiane A. Castela 10
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Amostragem Sistemática
Define-se um fator de sistematização.
Exemplo: No sorteio entre 500 notas fiscais, pegam-se todas com final 3.
MBA Prof. Ms. Cristiane A. Castela 11
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Amostragem Não-ProbabilísticaAmostragem Não-Probabilística
• Não se conhece a probabilidade de todas as combinações amostrais possíveis;
• Subjetiva ou por julgamento;
• Não se pode estabelecer a variabilidade amostral com precisão;
• Não é possível estimar o erro amostral.
Devemos usar a Amostragem Aleatória sempre que possível.
MBA Prof. Ms. Cristiane A. Castela 12
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Amostragem por JulgamentoAmostras de tamanho pequeno (de 1 a 5 itens) a amostragem aleatória
pode dar resultados totalmente não-representativos.
É melhor que alguém que conheça a população especifique os itens mais representativos.
Exemplos:
• Experimentação de bandejas com aquecimento em uma rede de restaurantes (custo alto para implantação em todas as unidades) escolha de 2 locais levando em consideração o tamanho, localização, clientela e lucratividade.
• Pesquisa médica com pacientes em estado terminal terão que trabalhar com voluntários.
Pode ser mais rápida e menos custosa, pois não é preciso construir uma listagem dos itens da população.
MBA Prof. Ms. Cristiane A. Castela 13
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Importante!!!Importante!!!
Para fazer Inferência Estatística é essencial
usar somente Amostras Aleatórias.
Com o uso do método apropriado de amostragem,os resultados obtidos podem fornecer boas estimativas
sobre as característicasda população.
MBA Prof. Ms. Cristiane A. Castela 14
UMC - Universidade de Mogi das CruzesEscola Paulista de NegóciosExercício 06
O estudo de uma pesquisa médica de sete anos relatou que as mulheres cujas mães tomaram a droga DES (dietilestilbestrol) durante a gravidez tinha o dobro de probabilidade de desenvolver anormalidades celulares que poderiam resultar em câncer do que as mulheres cujas mães não haviam tomado.a)Esse estudo envolveu a comparação de duas populações. Quais eram elas?
b) Você supõe que os dados foram obtidos em uma pesquisa ou em um experimento?c) Quanto à população de mulheres cujas mães tomaram a droga DES durante a gravidez, uma amostra de 3.980 mulheres apresentaram 63 anormalidades celulares que poderiam resultar em câncer. Forneça uma estatística descritiva que poderia ser usada para estimar o número de mulheres em cada grupo de mil dessa população que apresenta anormalidades celulares.
d) Quanto à população de mulheres cujas mães não tomaram a droga DES durante a gravidez, qual é a estimativa do número de mulheres em cada grupo de mil que se poderia esperar que apresentem anormalidades celulares?e) Os estudos médicos frequentemente usam uma amostra relativamente grande (nesse caso, 3.980). Por quê?
Mulheres cujas mães tomaram a droga DES durante a gravidez e mulheres cujas mães não tomaram a droga DES durante a gravidez.
Pesquisa
15,8 mulheres em cada grupo de mil apresentam anormalidades celulares.
7,9 em mil
Anormalidades são raras e afetam uma pequena porção da população. Uma amostra com muitos elementos é necessária para coletar dados de um número razoável de casos de anormalidades existentes.
MBA Prof. Ms. Cristiane A. Castela 15
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Exercício 07A Nielsen Media Research realiza pesquisas semanais dos telespectadores em todo o território norte-americano e depois publica os dados de audiência e de fatia de mercado. A audiência relatada pela Nielsen é a porcentagem dos lares que possuem televisores e que estão assistindo a um programa, ao passo que a fatia de mercado é a porcentagem dos lares que assistem a um programa entre os lares que estão com o televisor ligado. Por exemplo, os resultados da Nielsen Media Research referentes ao Baseball World Series de 2003 entre o New York Yankees e o Florida Marlins mostraram uma audiência de 12,8% e uma fatia de mercado de 22%. Desse modo, 12,8% dos lares que possuem televisores estavam assistindo ao World Series e 22% dos lares que estavam com os televisores ligados assistiam ao World Series. Baseando-se nos dados de audiência e de fatia de mercado dos principais programas de televisão, a Nielsen publica uma classificação semanal desses programas, bem como uma classificação semanal das quatro principais redes: ABC, CBS, NBC e Fox.a)O que a Nielsen Media Research tenta medir?b)Qual é a população da pesquisa?c)Por que uma amostra seria usada nessa situação?d)Quais tipos de decisão ou ações se baseiam nas classificações da Nielsen?
MBA Prof. Ms. Cristiane A. Castela 16
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
a) A Nielsen tenta medir a audiência de cada programa de televisão escolhendo uma porcentagem dos lares que possuem televisores e que estão assistindo a um programa.
b) Todos os lares que possuem televisores nos Estados Unidos.
c) Um censo com a população seria impossível. Uma amostra nos dá uma informação pontual pois os dados podem ser obtidos semanalmente. Por outro lado, o custo da coleta de dados de uma amostra é menor do que o custo de um censo.
d) O cancelamento ou a renovação de programas de televisão, as taxas cobradas pela publicidade, etc.
Resposta do exercício 07
MBA Prof. Ms. Cristiane A. Castela 17
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Exercício 08Uma amostra de notas de cinco estudantes apresentou os seguintes resultados: 72, 65, 82, 90 e 76. Quais das seguintes afirmações estão corretas e quais seriam contestadas como demasiadamente genéricas?
a)A nota média da amostra dos cinco estudantes é 77.
b)A nota média de todos os estudantes que fizeram o exame é 77.
c)Uma estimativa da nota média de todos os estudantes que fizeram o exame é 77.
d)Mais da metade dos estudantes que fizeram esse exame obterá pontos entre 70 e 85.
e)Se mais cinco estudantes forem incluídos na amostra, suas notas se situarão entre 65 e 90.
A descrição está estatisticamente correta para a amostra.
É uma generalização incorreta se a amostra não foi escolhida de forma satisfatória.
É uma inferência estatística aceitável, pois é usado o termo “estimativa”.
Esta afirmação é verdadeira para a amostra, mas isso não justifica dizer que se aplica para a população.
Esta afirmação não é estatisticamente suportável. É verdadeira para a amostra observada, mas é inteiramente possível e muito provável que alguns alunos tirem menos que 65 e mais que 90.
MBA Prof. Ms. Cristiane A. Castela 18
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
ANÁLISE DE GRANDES CONJUNTOS ANÁLISE DE GRANDES CONJUNTOS DE DADOSDE DADOS
DadosSubconjuntos
Grupos
Gráficosou Tabelas
organizar
A designação para dados dispostos em grupos (classes) ou categorias é Distribuição de Freqüência
Uma distribuição de frequência é um grupamento de dados em classes, exibindo o número de observações em cada classe. Uma distribuição de freqüência pode ser apresentada sob a forma de um gráfico ou de uma tabela.
MBA Prof. Ms. Cristiane A. Castela 19
UMC - Universidade de Mogi das CruzesEscola Paulista de NegóciosSintetizando dados Sintetizando dados
QUALITATIVOSQUALITATIVOS
Um questionário sobre a qualidade das acomodações de um hotel permitia as respostas excelente, acima da média, média, abaixo da média ou ruim. As respostas fornecidas por 20 entrevistados foram:
Abaixo da média Média Acima da média Acima da média Acima da média Acima da média Acima da média Abaixo da média Abaixo da média
Média Ruim RuimAcima da média Excelente Acima da média Média Acima da média MédiaAcima da média Média
MBA Prof. Ms. Cristiane A. Castela 20
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Distribuição de FrequênciaDistribuição de Frequência
Qualidade da acomodação
RuimAbaixo da
média MédiaAcima da
média Excelente
Total
Frequência Absoluta
2 3 5 9 1
20
Frequência Percentual
10% 15% 25% 45% 5%
100%
Frequência Relativa
0,10 0,15 0,25 0,45 0,05
1,00
MBA Prof. Ms. Cristiane A. Castela 21
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Qualidade das acomodações de um Qualidade das acomodações de um HotelHotel
11
22
33
44
55
66
77
88
99
RuimRuim Abaixo da médiaAbaixo
da médiaMédiaMédia Acima
da médiaAcima
da médiaExcelenteExcelente
Fre
qu
ên
cia
Fre
qu
ên
cia
ClassesClasses
MBA Prof. Ms. Cristiane A. Castela 22
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Qualidade das acomodações de um hotel
MBA Prof. Ms. Cristiane A. Castela 23
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
ExercícioEm ordem alfabética, os seis nomes mais comuns nos Estados Unidos são Brown, Davis, Johnson, Jones, Smith e Williams. Suponha que uma amostra de 50 indivíduos com um desses sobrenomes forneça os seguintes dados:
BrownSmithDavisJohnsonWilliamsWilliamsJohnsonJonesDavisJones
WilliamsJonesSmithSmithDavisJohnsonSmithJonesJonesJohnson
WilliamsSmithBrownSmithJohnsonJonesSmithSmithWilliamsBrown
WilliamsJohnsonWilliamsJohnsonWilliamsSmithBrownSmithDavisJohnson
BrownSmithJohnsonBrownJohnsonBrownJonesDavisSmithDavis
Sintetize os dados construindo o seguinte:
a)As distribuições de frequência relativa e percentual.b)Um gráfico em barras.c)Um gráfico em setores.d)Com base nesses dados, quais são os três sobrenomes mais comuns?
MBA Prof. Ms. Cristiane A. Castela 24
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
Sobrenomes Frequência Frequência Frequência absoluta relativa percentualBrown 7 0,14 14%Davis 6 0,12 12%
Johnson 10 0,20 20%Jones 7 0,14 14%Smith 12 0,24 24%
Williams 8 0,16 16%Total 50 1,00 100%
MBA Prof. Ms. Cristiane A. Castela 25
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios
MBA Prof. Ms. Cristiane A. Castela 26
UMC - Universidade de Mogi das CruzesEscola Paulista de Negócios