Upload
msmarcelosilva
View
580
Download
0
Embed Size (px)
Citation preview
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 1/24
1
Alguns Conceitos Necessários ao Estudo da Estatística
Razão, Proporção e Porcentagem
a) Razão e proporção
Ex. Vamos supor que foram entrevistados 150 pessoas de uma região e foram obtidos osseguintes resultados, sobre a preferência por três programas de jornal:
Programa de Jornal No. de pessoas que assistemA 90B 40C 20
Total 150
A razão 150
90
indica que a cada 150 entrevistados, 90 preferem o jornal A, ouseja, por uma simplificação da fração, a cada 5 entrevistados, 3 preferem o jornal A.Esta fração expressa assim, uma comparação entre o número de pessoas que preferem o
jornal A e o número total de entrevistados.
Proporção é a igualdade entre duas razões.
150
90=
5
3
15
9
Mantida esta proporção, em 300 entrevistados, quantos dirão que preferem o jornal A?
Obs: Não esquecer de verificar se as grandezas são diretamente proporcionais ouinversamente proporcionais.
b) Porcentagem: quando uma razão é expressa por uma fração centesimal(denominador igual a 100)
Ex.: Um cartaz diz: “Liquidação! Descontos de 40%”, isso significa que em cada R$100,00 do preço houve redução de R$ 40,00. A razão estabelecida é 40/100.
Índice, Coeficiente e TaxaPara a comparação entre duas grandezas, podemos estabelecer uma razão entre
elas. Algumas dessas razões têm uso bastante significativo na Estatística.
Índice: usado para medir quantitativamente variações ocorridas ao longo dotempo. É usada por vários profissionais para comparar grupos de variáveisrelacionadas entre si e obter um quadro simples e resumido das mudançassignificativas em áreas relacionadas, como preços de matérias-primas, preços deprodutos acabados, volume físico de produto etc. Mediante o emprego deíndices, é possível estabelecer comparações entre lugares; diferenças entre
categorias semelhantes, tais como produtos, pessoas, organizações etc.Ex.: QI = idade mental / idade cronológica
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 2/24
2
Densidade Demográfica = população total / superfície total
Coeficiente: medida obtida pela comparação entre duas quantidades queexpressam uma mesma grandeza (relação parte/todo). Por exemplo, umcoeficiente determinado pela razão entre o número de observações de um
determinado fato estatístico e o número total considerado para as possibilidadesde ocorrências desse fato.
Ex.: Coeficiente de mortalidade = números de óbitos / população totalCoeficiente de aproveitamento escolar = número de aprovados / total de alunos
Taxa: um tipo de razão que é expressa em frações cujo denominador é umapotência de 10, como, por exemplo, uma porcentagem.
Ex. número de óbitos = 80.080População total = 520.000
Taxa de mortalidade =
ExercíciosTabela 1 Dados relativos às cidades de Sorocaba, São Paulo e Porto Feliz
Cidade População ÁreaSorocaba 578068 hab. 456 km2 São Paulo 10434252 hab. 1525 km2 Porto Feliz 45515 hab. 558 km2
Considere os dados da tabela acima e responda:a) O que é densidade demográfica?b) Qual é a densidade demográfica dessas cidades? Comente.c) Esses números representam uma taxa, um índice ou um coeficiente?d) Qual é a taxa de desempenho turístico de Sorocaba, sabendo-se que a cidade tem
2500 leitos?
2. Considerando que em uma região: População = 1 784 327 habitantes; Superfície =137 420 km2; Nascimento em 1 ano = 42 327 nascidos vivos; Mortes em 1 ano = 16 230óbitos.Calcular:
a) Coeficiente de natalidade e taxa de natalidade (por mil habitantes)b) Coeficiente de mortalidade e taxa de mortalidade (por dez mil habitantes)c) Índice da densidade demográfica.
Critérios de Arredondamento
Se o primeiro algarismo a ser abandonado for menor ou igual a 4, o último apermanecer fica inalterado.
Se o primeiro algarismo a ser abandonado for maior ou igual a 5, o último apermanecer é acrescido de uma unidade.
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 3/24
3
Somatório
Para indicar a soma de todos os valores atribuídos a uma variável em estudo, écomum utilizar a letra grega sigma maiúscula , que significa soma. Por exemplo, sequisermos representar a soma do quadrado de três termos de uma seqüência, podemos
escrever:
3
1
2
3
2
2
2
1
2
i
i x x x x
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 4/24
4
COMO AS IDÉIAS ESTATÍSTICAS PODEM SER ABORDADAS
Ao longo da história da civilização, por interesse político, militar, econômico ou
social, encontramos muitos exemplos da utilização de idéias de caráter estatístico,
como, por exemplo, os recenseamentos ordenados na antiguidade romana.
Atualmente, são muitas as empresas que estão investindo em capacitação como
meio de se manter competitivas no mercado. Uma saída para elas é criar um
departamento de projetos. Nesse departamento, além dos conhecimentos específicos da
atividade-fim e da criatividade, têm grande importância informações capturadas em
pesquisas de mercado, nas quais a Estatística é o ponto de partida de muitas ações.
Com o desenvolvimento de ferramentas mais adequadas de análise de dados, nos
dias de hoje, torna-se cada vez mais relevante o papel da Estatística em praticamente
todas as áreas do conhecimento. Ela é ferramenta fundamental na interpretação e análise
de dados, fornece elementos de controle, gestão e melhoria constante de processos e
serviços.
Iniciamos por um breve levantamento sobre a definição de Estatística encontrada
em alguns livros.
Começamos por Magalhães e Lima (2004, p. 1), que traduzem a Estatística
como “um conjunto de técnicas que permite, de forma sistemática, organizar,
descrever, analisar e interpretar dados oriundos de estudos ou experimentos,
realizados em qualquer área do conhecimento” .
De forma simples, Martins e Donaire (1990, p. 17) sugerem a definição de Dugé
de Bernonville: “Estatística é um conjunto de métodos e processos quantitativos que
serve para estudar e medir os fenômenos coletivos” .
Porém Novaes e Coutinho (2009) apresentam uma definição que se aproxima da
forma como a Estatística deve ser empregada pelos diversos profissionais, que é adefinição dada por Barnett: “Estatística é o estudo de como a infor mação deveria ser
empregada para reflexão e ação em uma situação prática envolvendo incerteza” , isto
é, as autoras consideram a Estatística como sendo a ciência que abarca o número em
contexto, que é de fundamental importância para analisar o resultado de um problema.
Para muitas pessoas, a Estatística traz à lembrança a idéia de números e censo. A
Estatística trata, indubitavelmente, de contagem e de medições, mas Estatística não é
apenas um “monte” de números; é sim um conjunto de técnicas e métodos de pesquisaque entre outros tópicos envolve o planejamento do experimento a ser realizado, a
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 5/24
5
coleta qualificada dos dados, a descrição, o processamento e análise das informações e
serve de base de apoio para decisões nas mais variadas áreas.
A IMPORTÂNCIA DA ESTATÍSTICA PARA AS DIVERSAS ÁREAS
O número de defeitos ou porcentagem de peças defeituosas.
O custo médio de produção.
A freqüência média de acidentes de trabalho;
A expectativa de duração dos equipamentos;
Conhecer o perfil e hábitos dos clientes;
Possíveis sazonalidades no consumo do produto;
Pesquisa de demanda;
Identificar carências e potencialidades de uma região;
Média de venda.
A Estatística se divide em Descritiva e Inferencial, passando pela Teoria de
Probabilidades como elemento de ligação entre as duas.
Descritiva: é aquela na qual se faz, desde o planejamento da pesquisa, a
execução da coleta dos dados, a organização dos mesmos em representações diversas,
tais como: tabelas, gráficos, medidas-resumo.
Inferencial : quando se quer inferir fatos acerca da população, a partir do estudo
de uma parte significativa dessa população (amostra).
Etapas da Pesquisa:
Definição do Objetivo e Questão de pesquisa;
Definição da variável;
Um conceito importante é o de variável estatística, que é a característica que se
quer observar dos elementos de um conjunto (população / amostra), ou melhor, é uma
função que associa a cada resultado do meu fenômeno um valor, portanto essa função
que é variável.
Uma variável pode representar características de diversos tipos, depende do que
queremos observar. Coutinho (2009) exemplifica: “num grupo de turistas que
escolheram o dito pacote aéreo, podemos querer observar não apenas o estado civil, mas
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 6/24
6
também o grau de escolaridade, a idade, o número de pessoas que moram na mesma
residência etc”. Perceber essas diferenças existentes entre essas categorias de variáveis
são importantes, pois auxiliarão na definição das formas com as quais os dados
estatísticos relativos a essas variáveis serão tratados.
A variável Qualitativa revela certo tipo de característica relacionada ao grupo
pesquisado, que não pode ser mensurada numericamente, como, por exemplo, gênero
(masculino ou feminino), alimentos arrecadados na campanha solidária, grau de
satisfação, etc. Estas variáveis podem ainda ser identificadas em subcategorias: nominal
ou ordinal .
Segue a definição dada por Coutinho (2009, p. 24):
Uma variável qualitativa se diz nominal quando não se pode
estabelecer uma relação de ordem ou de hierarquia entre os possíveis valoresa serem assumidos pela variável. Exemplo: cor dos olhos. O mesmo nãoocorre com a variável qualitativa ordinal, que permite que se estabeleça umahierarquia coerente ou uma relação de ordem entre os valores assumidos.Exemplos: os níveis de escolaridade, o grau de satisfação dos clientes de umrestaurante, o grau de aceitação expresso em uma escala (concordoplenamente, concordo, discordo, discordo plenamente, etc).
Já as variáveis quantitativas podem ser mensuradas numericamente, tal como a
idade, o número de pessoas que moram em uma mesma residência etc. Ela pode ser
discreta ou contínua. Segue as definições dada por Coutinho (2009):
As variáveis quantitativas discretas são aquelas que o conjunto devalores que ela assume admite unidade mínima, indivisível (notas dealunos (0,01 ou 0,1)) ou é oriundo de uma contagem, ou seja, entre doisvalores consecutivos da variável não podemos inserir nenhum outrovalor. Exemplo: número de alunos da classe X, número de pessoas nasfamílias de uma determinada cidade, quantidade de livros da bibliotecada escola, salários (contagem em números de salários mínimos oumesmo contagem de R$ 0,01 em R$ 0,01 – o centavo é a unidademínima do Real, pois entre R$ 0,01 e R$ 0,02 não podemos inserirnenhum outro valor, oficialmente).
As variáveis quantitativas contínuas assumem valores em intervalos dosnúmeros reais e, geralmente, não é possível enumerar todos os valores.
Em outras palavras, entre dois valores consecutivos, sempre podemosinserir um novo valor. Exemplo: o peso e a altura dos alunos da classe,lucro das empresas e a idade (medida de tempo que não tem unidademínima).
Existem algumas dificuldades para se distinguir entre uma grandeza discreta e
uma contínua, por exemplo, o tempo é considerado uma variável quantitativa contínua,
porém podemos dar a esta um tratamento de discreta de acordo com a mensuração.
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 7/24
7
Exercício
Classifique, justificando, as variáveis envolvidas em cada uma das questões propostasna pesquisa abaixo, que contém parte do questionário sobre a análise da atuação doprofissional de turismo, realizada com profissionais que trabalhavam em agências
ligadas ao ecoturismo de São Paulo.
1. Gênero:( ) Feminino( ) MasculinoResp.:
2. Qual a sua faixa etária?( ) [18;24[( ) [24;30[
( ) [30;36[( ) [36;42[( ) 42 ou maisResp.:
3. Responda com base na seguinte escala:I - muito importanteII – importanteIII – pouco importanteIV – Não é importante( ) grau de importância do turismo no Brasil( ) a importância do bacharel em turismo no BrasilResp.:
4. O turismo é uma atividade: (assinale apenas uma alternativa)( ) Social( ) Cultural( ) De lazer( ) EconômicaResp.:
5. Assinale a alternativa que corresponde ao número aproximado de horas que vocêtrabalha por dia:( ) até 4 horas( ) 6 horas( ) 8 horas( ) Mais de 8 horasResp.:
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 8/24
8
Definição da amostra ou população;
Analisaremos a diferença entre população e amostra.
Para Magalhães e Lima (2004), população é um conjunto de dados que contém a
característica que temos interesse. População refere-se não somente a uma coleção de
indivíduos, mas também ao alvo sobre o qual reside nosso interesse. Por exemplo, uma
empresa deseja controlar sua produção, e para isso faz um levantamento do total
de peças produzidas durante o período de 12 meses consecutivos, quanto ao total
produzido por cada um dos seus setores. Nesse caso, a população é formada pelo
conjunto a ser observado, ou seja, o conjunto de setores da empresa. Caso o
objetivo fosse observar a presença ou não de defeitos nas peças, a população seria o
conjunto formado por todas as peças produzidas nessa empresa.
Tendo-se em vista as dificuldades de várias naturezas (custo, tempo etc) para se
observar todos os elementos da população, toma-se alguns deles para formar um grupo
a ser estudado. Este subconjunto da população, com dimensão sensivelmente menor e
finita, é denominado amostra.
Exemplo: Nos ensaios destrutivos, como no caso da indústria automobilística,
que deseja medir a capacidade de impacto que o para-choque pode suportar, não irá
testar todos os carros ali produzidos. Faz-se necessário limitar as observações a uma
parte da população, ou seja, uma amostra.
Amostragem
Amostragem é o processo de fixar critérios para a composição de uma amostra
que tenha representatividade necessária no estudo em questão. O critério escolhido deve
garantir que todos os elementos da população tenham a mesma probabilidade de serem
sorteados.Tipos de amostragem:
Aleatória simples;
Estratificada.
Aleatória simples: quando todos os elementos da população têm a mesma
probabilidade igual a 1/N de ser escolhidos.
Exemplo: Suponha que o litoral norte de São Paulo possua 120 hotéis cinco estrelas.
Selecione uma amostra de 10% desses hotéis para conhecer os preços das diáriaspraticadas nos mesmos.
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 9/24
9
* No excel digitar =aleatório()*120 (trará 12 possibilidades de visitas)
Amostra Estratificada: dividimos a população de N indivíduos em K subpopulações
ou estratos, atendendo a critérios que podem ser importantes para o estudo, por
exemplo, homens e mulheres, classe social, anos de escolaridade, renda mensal etc.
Dentro de cada estrato, fazemos amostras aleatórias simples.
Exemplo 2: Supondo agora que desses 120 hotéis, 16 estão em Caraguatatuba, 34 em
São Sebastião e 70 em Ubatuba.
Fazer...
Começa-se por determinar a proporção necessária.
São muitas as situações em que separar a população em estratos aumenta a
representatividade da amostra, pois a variável em estudo pode apresentar um
comportamento diferente de um estrato para o outro.
Amostra sistemática: quando os elementos da população estão ordenados em uma
lista. Saltando elementos de k em k, a partir de m, considerando que ela é circular.
Amostra por conglomerado: quando fazemos um estudo sobre os habitantes de uma
cidade, a amostra aleatória pode ter um custo muito alto, já que estudar uma amostra de
tamanho n implica enviar os entrevistadores a n pontos da cidade, de forma que em cada
ponto só se realiza uma entrevista. Neste caso é mais econômico fazer a denominada
“amostra por conglomerado”, que consiste em eleger aleatoriamente certos bairros da
cidade, para depois eleger aleatoriamente, ruas e edifícios. Uma vez escolhido umedifício, faz-se entrevista com todos os vizinhos.
O tamanho da amostra (número de pessoas que devem ser consultadas) e a
técnica de amostragem utilizada dependem muito mais de dois parâmetros estatísticos
do que do tamanho da população: a margem de erro e o nível de confiança.
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 10/24
10
Cálculo do tamanho da amostra:
Existem numerosos procedimentos estatísticos, algoritmos e softwares (Sample
Size Calculator) para o cálculo do tamanho da amostra. Quando o problema a ser
estudado na pesquisa se refere a uma proporção (maioria das situações de pesquisa de
opinião), existe uma fórmula que permite calcular o tamanho n da amostra em função da
margem de erro e com um nível de confiança de 95%:
(I)
2
96,1
1
e
p pn
O valor 1,96 é obtido na tabela da curva normal, para um nível de confiança de
95%.
p é a proporção de indivíduos da população que apresentam a característica que
está sendo medida.
Quando não se conhece p, damos a ele o valor estimado 0,5, e a fórmula se reduz a:
(II) 2
96,1
25,0
en
Valores obtidos na tabela da curva normal de acordo com o nível de confiança:
NÍVEL DE CONFIANÇA VALORES NA TABELA DA CURVA
NORMAL
90 1,64
95 1,96
99 2,58
Exemplo: Em uma pesquisa eleitoral para presidente, a disputa entre os candidatosestá acirrada e difícil. Queremos trabalhar com um erro máximo de 1 ponto (1%) a um
nível de confiança de 95%. Quantas pessoas devem ser entrevistadas?
Não conhecemos p. Usando (II), temos:
2
96,1
01,0
25,0n
200051,0
25,0n =
00002601,0
25,0n 9.611 pessoas
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 11/24
11
Exercícios:
1) Repitam os cálculos dos tamanhos das amostras na situação do exemplo anterior
com margens de erro de 0,5%, 2% e de 3%.
2) Determine a margem de erro de uma pesquisa com uma amostra de tamanho
150.
3) Em uma pesquisa eleitoral, queremos trabalhar com um erro máximo de 1 ponto
(1%). Quantas pessoas devem ser entrevistadas se considerarmos o nível de
confiança igual a:
a. 90%
b. 99%
4) Em uma localidade no Marrocos, aproximadamente 30% das crianças sofriam de
má nutrição crônica. Esse percentual é resultado das estatísticas nacionais sobrea desnutrição no meio rural do Marrocos. Para realizar uma pesquisa com a
população de crianças mal nutridas, qual deve ser o tamanho da amostra para um
nível de confiança de 95% e margem de erro de 5%?
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 12/24
12
Formas de coleta de dados:
Observação direta
Entrevista
Auto-entrevista
Organização dos dados
O conjunto de valores assumidos por uma variável estatística pode ser
representado por uma listagem simples, que respeite apenas a ordem de coleta. É o que
chamamos de “conjunto de Dados Brutos”. Se alguma ordenação é feita (variáveis
ordinais ou quantitativas), o conjunto aí representado chama-se Rol ou série de Rol.
Outra forma possível de organização dos dados se faz por uma “Distribuição de
freqüências”.
Uma distribuição de freqüências é uma função empírica que associa, a cada
valor assumido pela variável, o número de vezes que esse valor é observado, ou seja, a
freqüência absoluta desses valores. Ela é usualmente representada por uma tabela ou por
um gráfico, sendo que cada tipo de variável e o objetivo da análise dos dados podem
determinar a melhor representação. As freqüências também podem ser expressas em
porcentagens, ao que chamamos “freqüência relativa”, que indica as porcentagens
observadas no conjunto de dados estudado.
Para representar uma distribuição de freqüência por meio de uma tabela, existem
normas pelas quais deve constar o título (que descreva o que a tabela representa), o
cabeçalho, o corpo, rodapé e fonte, conforme o exemplo a seguir:
Questionário Questão aberta Questão fechada
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 13/24
13
Tabela X: Distribuição dos 120 alunos da Escola Z segundo as matériaspreferidas, 2009.
Matérias preferidasNúmero de alunos
(fi) (%)
Português 15 12,50
Matemática 12 10,00
Ciências 13 10,83
Inglês 10 8,33
Educação Física 29 24,17Artes 13 10,83
História 11 9,17
Geografia 17 14,17
TOTAL 120 100
Fonte: Dados fictícios
Esquema 1: Ilustração dos elementos de uma Tabela de Distribuição de
Freqüências
Ainda segundo as normas vigentes da ABNT, uma tabela deve possuir traços
horizontais separando o cabeçalho, sem linhas de separação de dados e podem possuir
traços verticais separando as colunas de dados, sem fechamento lateral.
Além da organização dos dados em forma de tabelas, como foi investigado
anteriormente, podemos apresentar informações por meio de gráficos.
Título da tabela: numerado seqüencialmente. Deve indicar aoleitor o que a tabela representa: o quê, onde e quando.
Cabeçalho: descreve o conteúdo do corpo da tabela. Geralmente, naprimeira coluna encontramos a variável observada e nas colunasseguintes as freqüências associadas a cada valor da variável (fi indicao número de vezes que tal valor foi observado e % indica esse númerore resentado em orcenta em .
Corpo da Tabela: descreve cada valor assumido pela variável, assimcomo as respectivas freqüências (absolutas e ou relativas oupercentuais).
Rodapé: devemos colocar legenda e fonte.
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 14/24
14
DISTRIBUIÇÃO DE FREQUENCIAS
É uma série estatística específica, onde os dados encontram-se dispostos emclasses ou categorias juntamente com as freqüências correspondentes.
- Variável Discreta: pode-se enumerar todos os possíveis valores.
Exemplo: X= número de erros por página observados em um livro de matemática – 2009
No. de erros (Xi) No. de páginas (Fi)0 351 202 133 64 4
5 280
Xi = identifica as categorias em que o fato se subdivide.Fi = Corresponde a freqüência absoluta, isto é, o número de vezes que cada uma dascategorias ocorre.N = soma dos Fi = total de elementos observados na população.n = soma dos Fi = total de elementos observados na amostra.
- Variável Contínua: a variável assume valores em intervalos da reta real, não é possívelenumerar todos os valores.
Exercício: As notas de 32 estudantes de uma classe estão descritos abaixo:
6,0 0,0 2,0 6,5 5,0 3,5 4,0 7,08,0 7,0 8,5 6,0 4,5 0,0 6,5 6,02,0 5,0 5,5 5,0 7,0 1,5 5,0 5,04,0 4,5 4,0 1,0 5,5 3,5 2,5 4,5
Então a distribuição de freqüência será expressa pela tabela:
Notas Fi[0;2[[2;4[[4;6[[6;8[[8;10[
32
Para explicar a colocação das notas dos alunos necessitaremos de algumasdefinições:
Dados Brutos: Aqueles que não foram numericamente organizados.
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 15/24
15
Rol: é o arranjo dos dados brutos em ordem de grandeza crescente ou decrescente.Portanto, teríamos:
Limites de classe: São os números extremos de cada classe; sendo assim, temos umlimite inferior e um superior.Ex.:
Intervalo de classe:
Amplitude Total: É a diferença entre o maior valor e o menor dado. Em nosso caso, anota maior é e a menor é ; logo, nossa amplitude total é
Ponto Médio das Classes (Xi): média aritmética entre os limites inferior e superior daclasse i.
Número de classes (K): quantas classes serão necessárias para representar ofato? Existem vários critérios que podem ser utilizados a fim de possuirmos umaidéia do melhor número de classes, porém tais critérios servirão apenas como
indicação e nunca como regra fixa, pois caberá sempre ao pesquisadorestabelecer o melhor número, levando-se em conta o intervalo de classe e afacilidade para os posteriores cálculos numéricos.
Assim, podemos citar o critério que leva em consideração:
No. de elementosobservados
Número de classes (k)Mínimo máximo
Até 50 5 1051 a 100 8 16101 a 200 10 20
201 a 300 12 24301 a 500 15 30Mais de 500 20 40
Fórmula de Sturges: K = no. de classes = 1 + 3,3.logN, onde N é o número deelementos observados.
Voltando ao exemplo acima, teríamos:
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 16/24
16
Para verificar o Intervalo de classe devemos calcular:classesno
amplitudeh
.
Freqüência absoluta (Fi): quantidade de elementos que pertencem à classe i.
Freqüência Relativa da Classe (fi):n
Fi fi
Observe: 100.fi = %Freqüência Acumulada: corresponde à soma de freqüências de determinada classe comas anteriores
Exercício: As notas de 32 estudantes de uma classe estão descritos abaixo:
6,0 0,0 2,0 6,5 5,0 3,5 4,0 7,08,0 7,0 8,5 6,0 4,5 0,0 6,5 6,0
2,0 5,0 5,5 5,0 7,0 1,5 5,0 5,04,0 4,5 4,0 1,0 5,5 3,5 2,5 4,5Com referência a esses dados, determinar:
a) O rol.b) A distribuição de freqüência (calcular o intervalo de classes)c) A maior e a menor nota.d) A amplitude total.e) Qual a porcentagem dos alunos que tiraram nota menor do que 4.f) Qual o limite superior da 2ª. classe.g) Qual o ponto médio da 3ª. classe.h) Colocar a freqüência acumulada.
i) Construir um histograma de freqüências simples. j) Construir a curva de freqüência acumulada crescente.
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 17/24
17
Tabela 1.1 Valor das diárias, idade, intenção de retorno e grau desatisfação de 40 turistas que visitaram uma determinada região
identificaçãovalor da Diária
(R$)Idade(anos) Retorno
Grau desatisfação
1 80 53 sim 42 80 23 sim 43 96 30 sim 34 80 48 sim 45 210 42 sim 46 96 40 não 37 96 14 sim 28 80 32 sim 39 80 52 sim 410 80 17 sim 311 210 51 não 312 145 48 sim 413 210 45 não 414 96 49 sim 215 96 38 sim 216 210 62 sim 317 145 41 sim 418 80 47 não 419 80 50 não 420 96 52 não 421 210 55 não 3
22 80 63 não 323 145 66 sim 324 96 54 sim 425 80 62 sim 326 80 60 sim 427 96 27 sim 428 80 42 sim 229 145 51 não 330 80 37 não 431 80 43 não 432 80 15 sim 4
33 96 42 sim 334 145 28 sim 335 80 48 não 336 96 49 sim 237 80 40 sim 338 210 39 sim 439 210 48 sim 440 80 62 sim 4
Identifique uma distribuição de freqüência para cada uma das variáveis que podem ser
observadas na Tabela acima. Para cada uma delas, classifique-as e calcule as respectivas
freqüências relativas.
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 18/24
18
Representação gráfica (arquivo anexo)
Atividade sobre distribuição de freqüências e sua representação gráfica.
1) Uma pesquisa com usuários de transporte coletivo na cidade de São Pauloindagou sobre os diferentes tipos usados nas suas locomoções diárias. Dentreônibus, metro e trem, o número de diferentes meios de transporte utilizados foi oseguinte: 2, 3, 2, 1, 2, 1, 2,1,2, 3, 1,1,1,2,2,3,1,1,1,1,2,1,1,2,2,1,2,1,2,3.
a. Organize uma tabela de freqüência.b. Faça uma representação gráfica.c. Admitindo que essa amostra represente bem o comportamento do usuário
paulistano, você acha que a porcentagem dos usuários que utilizam maisde um tipo de transporte é grande.
2) Um questionário foi aplicado aos dez funcionários do setor de contabilidade deuma empresa fornecendo os dados apresentados no quadro.
Funcionário Curso (completo) Idade Salário (R$) Anos de Empresa1 Superior 34 1100,00 52 Superior 43 1450,00 83 médio 31 960,00 64 médio 37 960,00 85 Médio 24 600,00 36 Médio 25 600,00 27 médio 27 600,00 58 médio 22 450,00 29 Fundamental 21 450,00 3
10 Fundamental 26 450,00 3a) Classifique cada uma das variáveis.b) Faça uma representação gráfica para a variável Curso.c) Discuta a melhor forma de construir a tabela de freqüência para a variável
Idade. Construa uma representação gráfica.d) Repita o item (c) para a variável Salário.e) Considerando apenas os funcionários os funcionários com mais de três anos
de casa, descreva o comportamento da variável salário.
3) Dados do IBGE mostram que, em 1940, havia 4% da população brasileira com
mais de 60 anos. As estatísticas apontam para um aumento na expectativa devida da população. Complete a tabela abaixo e construa um histograma.Idade (em anos) No. de pessoas Freq. acumulada Freq. relativa
[0,10[ 03[10,20[ 15[20,30[ 32[30,40[ 15[40,50[ 42[50,60[ 58[60,70[ 29[70,80[ 08
[80,90[ 03Total 205
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 19/24
19
A observação do gráfico que representa a distribuição da riqueza em nosso país mostra,por exemplo, que os 10% mais pobres detêm apenas 1% da renda nacional. Supondo apopulação brasileira igual a 200 milhões de habitantes, e o PIB brasileiro igual a 2,4trilhões de reais, responda, com base no gráfico:
a) Qual é o percentual de renda destinada aos 40% mais pobres da populaçãobrasileira?
b) Qual é, em reais, a parte da riqueza destinada aos 20% mais pobres dapopulação?
c) Construa a tabela com o total da população brasileira por faixa de concentraçãode riqueza e com a renda per capita em cada faixa
1,0%2,5% 3,0% 3,4% 4,5% 5,7%
7,3%10,0%
15,7%
46,9%
0,0%
5,0%
10,0%
15,0%
20,0%
25,0%
30,0%
35,0%
40,0%
45,0%
50,0%
10% 20% 30% 40% 50% 60% 70% 80% 90%
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 20/24
20
Medidas-ResumoIntrodução
Quando trabalhamos com pesquisas que envolvem a coleta e análise de dados,como as pesquisas de opinião, as eleitorais, o estudo de uma ou mais características deuma população (não necessariamente de pessoas), temos uma tarefa logo após a coleta
dos dados: elaborar uma análise descritiva dos mesmos, para conhecer melhor apopulação em estudo.Por exemplo, se estamos estudando a estatura de pessoas adultas segundo o
gênero (homem, mulher) e segundo a faixa etária, queremos conhecer o número depessoas em cada categoria em relação ao total da população, e isso se obtém com asporcentagens, expressas em uma tabela de freqüências.
Diante dos dados, pergunto: Os dados se agrupam ao redor de que valor? Supondo que se agrupam em torno de um número, como se comportam?
Muito concentrados em torno desse número? Muito dispersos?
Vamos pensar nos dados de uma amostra e estudar dois tipos de medidasassociadas a eles.
Medidas de tendência central Medidas de dispersão
Com essas medidas, é possível, por exemplo, comprar uma roupa para alguém,com pouca margem de erro. Podemos assim dizer que a análise das medidas detendência central permite a construção de um “retrato” dos dados tratados,complementando as representações tabulares e gráficas.
Medidas de tendência centralElas respondem à primeira das questões propostas no parágrafo anterior: Os
dados se agrupam ao redor de que valor? A medida mais evidente que podemos calcularpara descrever um conjunto de dados observados é o seu valor médio.
Existem vários tipos de média, como: a média aritmética, média geométrica oumédia harmônica. Abordaremos somente o procedimento de cálculo da médiaaritmética, por ser o mais utilizado nesse nível de estudo.
A média nada mais é do que a soma de todos os valores observados divididapelo número total de observações.
Em linguagem matemática: usamos a letra grega (pronuncia-se mi) para
representar dados da população e no caso da média amostral usa-se a notação X .
N
xi N
i
1
, onde xi representa cada um dos valores observados e N é o número
de elementos da população. No caso de dados amostrais, teremos X=n
xi
n
i
1
Exemplo: Considere as idades, em anos, de uma amostra de 10 pessoas: 21, 32,15, 59, 60, 61, 64, 60, 71, 80.
A idade média dessas pessoas é
__
X
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 21/24
21
Para dados agrupados o algoritmo fica da seguinte forma: N
x f N
i
ii 1
.
.
Exemplo: A produção diária de um componente para televisor de uma indústriafoi submetida ao controle de qualidade que recolheu uma amostra de cada lote. Oresponsável pelo controle de qualidade da indústria verificou o seguinte número decomponentes com defeito em cada lote:
No. de defeitos No. de lotes0 152 103 45 97 2
Total 40
a. Calcule a média, a amplitude total, a mediana e a moda do número decomponentes com defeito por dia nessa indústria.
b. Determine e interprete o intervalo compreendido entre o primeiro e oterceiro quartil.
c. Represente os dados por um diagrama de pontos (Box-plot), localizandoo valor de cada uma das medidas calculadas no item (a).
d. Com base nos resultados obtidos e no gráfico, responda: qual ou quaismedidas representam melhor a distribuição do número de defeitos?Justifique.
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 22/24
22
Média aritmética para dados agrupados em intervalos
O algoritmo para esse cálculo é o mesmo do item anterior. No entanto, para osvalores tomaremos os pontos médios de cada uma das classes que compõem adistribuição de frequências estudada.
Tabela 1: Idade de 58 pessoas pesquisadasClasses Fi Colunas auxiliares
Pontomédio(
(
[35, 45[ 5[45, 55[ 12[55, 65[ 18[65, 75[ 14[75, 85[ 6[85, 95[ 3
58
SEPARATRIZESEssas medidas fornecem uma rápida visualização da forma em que os dados
estão distribuídos, onde existe uma maior concentração ou dispersão.É possível dividir uma distribuição, ao interesse da pesquisa, em quantas partes
desejar. Mediana: divide a distribuição em duas partes com o mesmo número de
elementos. Quartis: dividem a distribuição em quatro partes com o mesmo número
de elementos. Decis: dividem a distribuição em dez partes com o mesmo número de
elementos. Percentis: dividem a distribuição em 100 partes com o mesmo número de
elementos.
QUARTISExistem três quartis em um conjunto de dados:O primeiro quartil (Q1) é o valor tal que 25% dos valores observados sejam
menores ou iguais a ele. O segundo quartil (Q2) é o valor tal que 50% dos valores
observados sejam menores ou iguais a ele (também recebe o nome de mediana Md). Oterceiro Quartil (Q3) é o valor tal que 75% dos valores observados sejam menores ouiguais a ele.
Assim:
Exemplo1: Considere a seguinte distribuição das notas de 15 alunos em
Estatística: 2; 2; 7; 7; 7; 8; 3; 4; 4; 6; 9; 9; 4; 4; 7.* Precisamos lembrar da Aplitude Total e dos valores máximo e mínimo.
25% 25% 25% 25%
Mín Q1 Q2=Md MáxQ2
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 23/24
23
At = Xmáximo – Xmínimo
Qual é a nota que divide o conjunto dos 15 valores apresentados em duas partescom exatamente o mesmo número de elementos em cada uma delas? Qual a posiçãodessa nota na série de Rol?
Inicialmente, colocamos a distribuição das notas em ordem crescente, com asrespectivas posições ocupadas na série de Rol.
2 2 3 4 4 4 4 6 7 7 7 7 8 9 91ª. 2ª. 3ª. 4ª. 5ª. 6ª. 7ª. 8ª. 9ª. 10ª. 11ª. 12ª. 13ª. 14ª. 15ª.
Observe que quando a distribuição está ordenada, a nota 6, que ocupa a oitavaposição no Rol, divide a distribuição em duas partes, tais que sete notas são menores esete notas são maiores. A nota 6 recebe o nome de Mediana (Md) ou segundo quartil(Q2).
Agora dividiremos cada conjunto obtido no processo descrito acima novamenteem duas partes de mesmo número de elementos. Ou seja, a distribuição ficará divididaem quatro partes com o mesmo número de elementos:
2 2 3 4 4 4 4 6 7 7 7 7 8 9 91ª. 2ª. 3ª. 4ª. 5ª. 6ª. 7ª. 8ª. 9ª. 10ª. 11ª. 12ª. 13ª. 14ª. 15ª.
As notas 4; 6 e 7 ocupam as posições procuradas, ou seja, as posições quedividem a distribuição
Outra medida de tendência central, usada habitualmente, é a mediana: trata-seda observação que fica eqüidistante dos extremos, a observação que deixa metade dasobservações a sua esquerda e a outra metade a sua direita. Para determinar a mediana deum conjunto de dados, devemos ordená-los. No exemplo anterior, da idade de 10pessoas, as observações ordenadas são: 15, 21, 32, 59, 60, 60, 61, 64, 71, 80.
Como o número de observações é par (10), os valores que se encontram no meiodos dados são 60 e 60. Calculamos a média aritmética entre eles, que é 60, e esse valor éa mediana do conjunto.
Calcule a média e a mediana da amostra abaixo e posteriormente construa o
histograma:3, 15, 48, 61, 64, 65, 65, 68, 70, 71.
Vamos determinar a mediana para o caso de variável contínua.
1º. Passo: Calcula-se a ordem2
n
2º. Pela Fac identifica-se a classe que contém a mediana (classe Md)
3º. Utiliza-se a fórmula: MD
MDF
h f n
l x
.2
Onde: lmd = limite inferior da classe Md
5/14/2018 apostila de estatística 2012 - slidepdf.com
http://slidepdf.com/reader/full/apostila-de-estatistica-2012 24/24
24
n = tamanho da amostra
f =soma das freqüências anteriores à classe Md
h = amplitude da classe MdFMD = freqüência da classe Md
Exemplo:Classes Fi Fac[35, 45[ 5 5[45, 55[ 12 17[55, 65[ 18 35[65, 75[ 14 49[75, 85[ 6 55[85, 95[ 3 58
58
Outra medida de tendência central é a moda que é o valor que mais se repete nadistribuição, tanto para variáveis quantitativas como para variáveis qualitativas.
Então de acordo com o primeiro exemplo a moda das idades é 60 anos, pois é ovalor que mais se repete.
Obs.: Uma distribuição pode ser: Amodal
Ter mais de uma moda.
Fórmula de Czuber para dados agrupados em intervalos (aplicar a fórmula apósidentificação da classe modal)
21
1.
h
lmo
Onde:l =limite inferior da classe modal;h amplitude da classe modal;1 diferença entre freqüência da classe modal e a da classe imediatamente anterior;
2 diferença entre freqüência da classe modal e a da classe imediatamente posterior;
Preciso finalizar este tema e incluir medidas de dispersão