Upload
dangquynh
View
213
Download
0
Embed Size (px)
Citation preview
1. Introdução
Concepções de Estatística:
1. Estatísticas – qualquer coleção consistente de dados
numéricos reunidos a fim de fornecer informações;
2.Estatística – atividade humana especializada/metodologia
desenvolvida para a coleta, a classificação, a representação,
a análise e a interpretação de dados quantitativos para
utilização na tomada de decisões.
1.1. Ramos da Estatística
Estatística Descritiva – é a parte da Estatística que procura descrever e analisar um certo fenômeno, através da característica de um conjunto de dados.
Amostragem - ponto de partida (na prática) para todo um Estudo Estatístico
Probabilidade – ramo da Estatística que envolve uma margem de risco ou incerteza num processo de generalização de fenômenos.
Estatística Inferencial (Indutiva) – é a parte da Estatística que se preocupa em tirar conclusões e fazer interpretações dos resultados obtidos.
2. Noções Básicas
2.1 – Justificativa
Na área econômica coletam-se dados para simulação e
previsão.
no planejamento de novas estratégias de produção, vendas,
etc.
A estatística é aplicada na produção para acompanhar a
estabilidade dos processos,através de cartas de
acompanhamento (cartas de controle estatístico de processo).
Os dados referem-se a variáveis, que são classificadas,
em Estatística, como qualitativas, ordinais e quantitativas
2.2 Método Estatístico
Definir o Problema: formulação;
Planejar a coleta dos dados:
- procedimentos: censo ou amostragem;
Coletar os dados: obtenção, reunião e registro;
Apurar os dados: resumo e tabulação;
Apresentar os dados: tabelas e gráficos;
Analisar e interpretar os resultados: conclusões,
cálculo das medidas, números-resumos
( as estatísticas).
2.4.1 -Tipos de Variáveis
Variável Tipo
• Estado: Perfeita ou defeituosa Qualitativa Nominal
• Qualidade: 1a, 2a ou 3a categoria Qualitativa Ordinal
• No de peças defeituosas Quantitativa Discreta
• Diâmetro das peças Quantitativ Contínua
• Altímetro do Avião Quantitativ Contínua
• Índice Pluviométrico de Jan/12 Quantitativa Discreta
2.5 - Apuração de Dados
Os dados são registrados em ficha, com várias
outras informações. Para obter apenas os dados é
preciso fazer uma apuração. A apuração resume-se
a simples contagem. Por exemplo, obter o número
de aparelhos defeituosos e não defeituosos:
Com defeito = 23
Sem defeito = 17
Se a variável é quantitativa, a apuração consiste em
anotar cada valor.
Tabela única com diferentes tipos
de dados
Tipos de Dados
Populações Contínuo Discreto Nominal Por Posto
Alunos do 2º grau Idades, pesos nº da classe Menina/menino 2º grau
Automóveis Km/h nº de defeitos p/
carro Cores limpeza
Venda de Imóveis Valor $ nº de ofertas Supervalorizado Alto custo
2.6 - População e Amostra
Entende-se por população (ou Universo estatístico)
o conjunto de elementos que têm, pelo menos, uma
característica em comum. Exemplos:???
Todo subconjunto não vazio e com menor número
de elementos do que a população constitui uma
amostra dessa população.
• ESPAÇO AMOSTRAL: Conjunto dos resultados possíveis de um
experimento aleatório. Ex.: um dado não viciado. {1, 2, 3, 4, 5, 6}
As população podem ser finitas ou infinitas. As
populações finitas muito grandes são consideras
infinitas. Exemplos:???
2.6.1 – Censo e Amostragem
Quando são coletadas informações de toda a população, diz-se que foi feito um recenseamento.
- Censo é o conjunto de dados obtidos através de um recenseamento.
Quando são coletadas informações de apenas parte da população, diz-se que foi feita uma amostragem.
- A amostra é tanto a parte retirada da população para estudo como, também, o conjunto de dados obtidos nessa parte da população.
2.6.2 – Quando o Censo é
mais vantajoso
Quando a população é pequena;
Se o tamanho da amostra é grande em relação
ao da população e o esforço adicional para a
realização do censo for pequeno;
Se houver exigência na precisão completa;
Quando as informações completas sobre a
população já estão disponíveis.
2.6.3 – A Amostragem é
mais vantajosa
A população pode ser infinita, com isto o censo seria impossível;
Se há necessidade de obter informação com rapidez o censo pode consumir muito tempo e perder a utilidade;
Quando os itens são destruídos durante a realização do experimento para obtenção dos dados, o censo destruiria toda a população;
Os custos de um censo podem inviabilizar a realização da pesquisa.
2.7 - Técnicas de Amostragem
Definida a população, é preciso estabelecer a
técnica de amostragem, isto é, o procedimento que
será adotado para escolher os elementos que irão
compor a amostra. Conforme a técnica utilizada,
tem-se um tipo de amostra.
2.7.1. Amostra Casual Simples
É composta por elementos retirados ao acaso da
população. Então todo elemento da população tem
igual probabilidade de ser escolhido para a
amostra.
Técnicas de Amostragem
2.7.2. Amostra Sistemática
Os elementos são escolhidos por um sistema.
Quando a população está organizada, é mais fácil
obter uma amostra sistemática, porém há a
preocupação com o sistema de seleção.
2.7.3. Amostra estratificada
É composta por elementos provenientes de todos
os estratos da população de maneira proporcional,
afim de que a amostra mantenha a característica
da população.
Técnicas de Amostragem
2.7.4. Amostra de Conveniência
É formada por elementos que o pesquisador reuniu
simplesmente porque dispunha deles.
Os estatísticos têm muitas restrições ao uso de
amostras de conveniência; o pesquisador precisará
de muito senso crítico, pois os dados podem ser
tendenciosos.
Quando se trabalha com amostras sempre
pretende-se fazer inferências, isto é, estender os
resultados da amostra a população.
3 – Exercícios
1. Cite as fases do método estatístico.
2. Quais os ramos da estatística.
3. Classificar as variáveis como: qualitativa, quantitativa
discreta e quantitativa contínua.
a) Cor dos olhos;
b) Cor do cabelo;
c) Numero de filhos;
d) Numero de computadores;
e) Precipitação pluviométrica;
f) Comprimento de pregos;
g) Produção de algodão;
h) Número de nascimentos;
i) Taxa de crescimento da economia;
j) PIB brasileiro de 2010 ;
3 – Exercícios
4. Em uma escola existem 250 alunos, sendo distribuídos nas salas de aula a seguir:
Calcule através do processo de amostragem proporcional estratificada
quantos alunos de cada sala irão compor a amostra que deve ter
exatamente 40 alunos.
Salas de aula Alunos
1 35
2 32
3 30
4 28
5 35
6 32
7 31
8 27
3 – Exercícios
5. Quando você utilizaria um processo de amostragem
em comparação com um censo?
6. Numa escola existem 280 meninos e 320 meninas.
Escolha uma amostra de 10% do total de alunos
quantos são meninos e quantas são meninas.
6. Lance um dado e uma moeda e construa seu espaço
amostral.
3.2 - Séries de Dados
Causa Freqüência
Acidente 29.601
Abuso 2.604
Suicídio 7.965
Profissional 3.735
Outros 1.959
Ignorada 1.103
Total 46.967
Séries Específicas: varia o
fenômeno, fixos o tempo e a
região.
Tabela 2.3: Casos registrados de
intoxicação humana, segundo a causa
determinante. Brasil, 1993.
Fonte: MS/FIOCRUZ/SINITOX.
Regiões %
Norte 3,9
Nordeste 30,3
Centro-oeste 5,5
Sudeste 42,7
Sul 17,6
Total 100
Séries Geográficas: varia a
região, fixos o tempo e o fenômeno.
Tabela 2.2: Distribuição percentual
da população segundo
regiões,Brasil, 1970.
Fonte: IBGE, Censo Demográfico, Rio
de Janeiro, 1973.
Séries Temporais: varia o tempo, são fixos a região e o fenômeno.
Anos N.º
1970 8.000
1971 7.600
1972 7.200
1973 7.300
1974 7.000
Total 37.100
Fonte: Dados hipotéticos.
Tabela 2.1: Número de casos da
moléstia X, na área Z, 1970/1974.
4. Apresentação de Dados
em Tabelas
Os dados devem ser apresentados em tabelas
construídas de acordo com as normas técnicas
ditadas pela Fundação Instituto Brasileiro de
Geografia e Estatística (IBGE).
4.1. Componentes das Tabelas
As tabelas têm título (explica o que a tabela
contém), o corpo (formado pelas linhas e colunas
dos dados), o cabeçalho (especifica o conteúdo
das colunas) e a coluna indicadora (especifica o
conteúdo das linhas).
Causa Freqüência
Acidente 29.601
Abuso 2.604
Suicídio 7.965
Profissional 3.753
Outras 1.959
Ignorada 1.103
Tabela 4.1: Casos registrados de
intoxicação humana, segundo a
causa determinante. Brasil, 1993.
Fonte: MS/FIOCRUZ/SINITOX.
Co
lu
na
in
dic
ad
ora
Título
Fonte
Cabeçalho
Corpo
•Toda tabela deve ser delimitada por traços
horizontais. Podem ser feitos traços verticais para
separar as colunas, mas não devem ser feitos
traços verticais para delimitar a tabela. O
cabeçalho é separado do corpo por um traço
horizontal.
•As tabelas podem apresentar, além das
freqüências, as freqüências relativas e o total. O
total da coluna é escrito entre dois traços
horizontais.
Causa Freqüência Freqüência Relativa(%)
Acidente 29.601 63,03
Abuso 2.604 5,54
Suicídio 7.965 16,96
Profissional 3.753 7,95
Outras 1.959 4,17
Ignorada 1.103 2,35
Total 46.967 100,00
Tabela 4.2: Casos registrados de intoxicação
humana, segundo a causa determinante. Brasil, 1993.
Fonte: MS/FIOCRUZ/SINITOX.
4.2. Tabelas de Contingência
Os elementos da amostra ou da população são
classificados de acordo com dois fatores, e os
dados devem então ser apresentados em tabelas
de contingência, isto é, tabelas de dupla entrada,
cada entrada relativa a um dos fatores.
As tabelas de contingência podem apresentar
freqüências relativas, além das freqüências.
Veja exemplo:
Ano de
registro
Sexo
Total Masculino Feminino
1984 1 307 758 1 251 280 2 559 038
1985 1 339 059 1 280 545 2 619 604
1986 1 418 050 1 361 203 2 779 259
Tabela 4.3: Nascidos vivos registrados segundo
o ano de registro e o sexo.
Fonte: IBGE (1988).
Nota: Nascimentos ocorridos no ano de registro.
Época do ataque
Condição
Total
Freqüência
relativa de
defeituosos Normal Defeituoso
Até o 3º mês... 36 14 50 28,0%
Depois do 3º mês 51 3 54 5,6%
Tabela 4.4: Recém-nascidos segundo a época do ataque
de rubéola na gestante e a condição de normal ou
defeituoso.
Fonte: HILL et alii (1958).
4.3 - Notação Sigma
• Muitos processos estatísticos exigem o cálculo da
soma de um conjunto de números.
• Σ (sigma) para denotar soma.
• Somar as variáveis x e y com valores 1, 5, 6, 9 e
$ 8,82, $12,01 e $2,10, respectivamente
• Σx = 21 e Σy = $22,93
• Exercícios: Se os valores de x são: 2, 4, 5 e 9,
calcule Σx, Σx² e (Σx²)².
Notação Sigma • Para somar partes dos valores, usam-se índices
• Exemplo: Utilizando os dados
apresentados, calcule
5
1 2 3 4 5
1 1
n
i i
i i
x x x x x x x
2 4 11
1 2 7
; ; ... ...i i i i
i i i
x x x e x
Dados
i xi
1 8
2 2
3 3
4 6
5 7
6 8
7 9
8 4
9 5
10 4
11 1
4.4. Tabelas de Distribuição de Freqüências
• Dados Brutos
• Rol de dados
• Amplitude
• Permite ao leitor, uma visão rápida e global do fenômeno.
•As tabelas de distribuição de freqüências mostram a distribuição da variável, mas perdem em exatidão. Isto porque todos os dados passam a ser representados pelo ponto médio da classe a que pertencem.
•O número de classes deve ser escolhido pelo pesquisador, em função do que ele quer mostrar. Em geral, convém se estabelecer de 5 a 20 classes. Mas não existe um número “ideal” de classes, embora existam fórmulas para se estabelecer:
k = 1 + 3,3 log N (Sturges).
2,522 3,200 1,900 4,100 4,600 3,400 3,300 2,800
2,720 3,720 3,600 2,400 1,720 3,400 3,250 2,900
3,125 2,800 3,200 2,700 2,750 1,570 2,900 3,200
2,250 2,900 3,300 2,450 4,200 3,800 3,200 2,800
3,220 2,950 2,900 3,400 2,100 2,700 2,480 2,700
3,000 2,480 2,500 2,400 4,450 2,900 2,450 3,150
3,725 3,800 3,600 3,120 2,900 3,700 2,150 3,150
2,890 2,500 2,500 3,400 2,920 2,120 2,500 3,200
3,110 3,550 2,300 3,200 2,720 3,150 2,500 2,700
3,520 3,000 2,950 2,700 2,900 2,400 3,155
3,100 4,100 3,000 3,150 2,000 3,450 3,200
3,200 3,200 3,750 2,800 2,720 3,120 3,900
2,780 3,450 2,480 2,120 2,450 3,300 3,100
Tabela 4.5: Peso de pacotes de adubo, em
quilogramas
Observando os dados da tabela, notamos que o menor
valor é 1,570kg e o maior valor é 4,600kg. Podemos
então definir as classes de 1,5kg a 2,0kg, de 2,0kg a 2,5
kg, ... Com o intervalo de classe de 0,5kg, de acordo
com o esquema:
1,5 Ⱶ 2,0
2,0 Ⱶ 2,5
2,5 Ⱶ 3,0
3,0 Ⱶ 3,5
3,5 Ⱶ 4,0
4,0 Ⱶ 4,5
4,5 Ⱶ 5,0
Numa tabela de distribuição de
freqüências também podem
ser apresentados os pontos
médios de classe, que são
obtidos pela soma dos
extremos da classe, dividida
por 2.
1,5 Ⱶ 2,0 (conta do 1,5 até o 2,0, exceto o 2,0).
Classe Freqüência Ponto Médio
1,5 Ⱶ 2,0 3 1,75
2,0 Ⱶ 2,5 16 2,25
2,5 Ⱶ 3,0 31 2,75
3,0 Ⱶ 3,5 34 3,25
3,5 Ⱶ 4,0 11 3,75
4,0 Ⱶ 4,5 4 4,25
4,5 Ⱶ 5,0 1 4,75
Tabela 4.6: Peso de pacotes , em quilogramas.
•Note, que pelo critério de Sturges, (k = 7,6),
deveriam ter sido construídas 7 ou 8 classes.
•É importante deixar claro que o resultado obtido
por essa fórmula poder ser usado como referência,
mas cabe ao pesquisador determinar o número de
classes que pretende organizar.
•Dica: quando se constrói uma tabela de
distribuição de freqüências, é melhor usar, como
extremos de classes, números fácies de trabalhar.
*
4.5 -Tipos de Frequências
• Frequência Absoluta:
• Frequência Absoluta Acumulada
• Frequência Relativa
• Frequência Relativa Acumulada
i iF f
1
n
i i
i
F f
ii
fFr
n
1
n
i i
i
Fr fr
4.6 - Dados Absolutos e Relativos
• Porcentagem
• Os índices são razões entre duas grandezas tais que
uma não inclui a outra. Ex: demográfico
• Os coeficientes são razões entre o número de
ocorrências e o número total (ocorrências e não
ocorrências). Ex: coeficiente de natalidade
• As taxas são os coeficientes multiplicados por uma
potência de 10 (10, 100, 1000, ...) para tornar o
resultado mais legível. Ex: taxa de mortalidade.
5. Apresentação de Dados em
Gráficos
•Existem normas nacionais para a construção de
gráficos, ditadas pela Fundação IBGE. Assim,
todo gráfico deve apresentar título e escala.
•O título pode ser colocado tanto acima como
abaixo do gráfico.
•As escalas devem crescer da esquerda para a
direita, e de baixo para cima.
•As legendas explicativas devem ser colocadas,
de preferência, à direita do gráfico.
5.1. Gráfico de Barras
•O gráfico de barras é usado para apresentar variáveis qualitativas ou ordinais.
•Para fazer um gráfico de barras, primeiro se traça o sistema de eixos cartesianos.
•Depois colocam-se, no eixo das abscissas (ou das ordenadas) as categorias da variável em estudo.
• Em seguida, constroem-se barras retangulares com base no eixo das abscissas (ou das ordenadas) e altura (ou comprimento) igual à freqüência.
Veja exemplo:
Espécie de clínica Freqüência Freqüência relativa (%)
Médica 6 457 923 32,51
Ginecologia e Obstetrícia 3 918 308 19,73
Cirurgia 3 031 075 15,26
Pediatria 2 943 939 14,82
Outras 3 513 186 17,69
Tabela 5.1: Internações em estabelecimentos de
saúde, por espécie de clínica – 1992.
Fonte: IBGE, Diretoria de Pesquisas, Pesquisa de Assistência Médico-Sanitária.
0 5 10 15 20 25 30 35
Outras
Pediatria
Cirurgia
Ginecologia e Obstetrícia
Clínica Médica
Freqüência Relativa
Gráfico 5.1: Internações em estabelecimentos de
saúde, por espécie de clínica. IBGE 1992.
5.2. Gráfico de Setores
•O gráfico de setores também é usado para apresentar variáveis qualitativas ou ordinais.
•Para fazer um gráfico de setores, primeiro se traça uma circunferência. Essa circunferência representa o total, ou seja, 100%.
•Dentro dessa circunferência devem ser representadas as categorias da variável em estudo.
• Para isso, toma-se a freqüência relativa de cada categoria e calcula-se o ângulo central (x):
onde f representa a freqüência relativa (%).
Clínica Médica
Ginecologia eObstetrícia
Cirurgia
Pediatria
Outras
Gráfico 5.2: Internações em estabelecimentos de
saúde, por espécie de clínica. IBGE 1992.
5.3. Histograma
•Os dados apresentados em tabelas de
distribuição de freqüências são apresentados
graficamente em histogramas.
•Para construir um histograma, primeiro se
traça o sistema de eixos cartesianos.
•Depois, se os intervalos são iguais, traçam-se
barras retangulares justapostas com bases
iguais, correspondendo aos intervalos de
classe, e com alturas determinadas pelas
respectivas freqüências.
•Quando os intervalos de classe são diferentes, para
construir um histograma é preciso calcular as
densidades de freqüência relativa.
•Entende-se por densidade de freqüência relativa o
quociente entre a freqüência relativa do intervalo de
classe, isto é:
•Para construir o histograma, desenham-se barras
retangulares. As bases são iguais aos intervalos de
classe, e as alturas são determinadas pelas
respectivas densidades.
Classes Freqüência Freqüência
Relativa
Densidade
90 Ⱶ 100 6 6 0,6
100 Ⱶ 105 11 11 2,2
105 Ⱶ 110 12 12 2,4
110 Ⱶ 115 17 17 3,4
115 Ⱶ 120 18 18 3,6
120 Ⱶ 125 11 11 2,2
125 Ⱶ 130 9 9 1,8
130 Ⱶ 135 6 6 1,2
135 Ⱶ 140 4 4 0,8
140 Ⱶ 150 4 4 0,4
150 Ⱶ 160 1 1 0,1
160 e mais 1 1 0,1
Tabela 5.2: Mulheres com 30 anos de idade
segundo a pressão sangüínea sistólica em
milímetros de mercúrio.
Gráfico 5.4: Mulheres com 30 anos de idade segundo a
pressão sangüínea sistólica, em milímetros de mercúrio.
Pressão sangüínea sistólica
Densid
ade
5.4. Polígono de Freqüências
•Os dados apresentados em tabela de distribuição de
freqüências também podem ser apresentados em
polígonos de freqüências.
•Para fazer esse tipo de gráfico, primeiro se traça o
sistema de eixos cartesianos.
•Depois, se os intervalos de classe são iguais, marcam-se
pontos com abscissas iguais aos pontos médios de
classes e ordenadas iguais às respectivas freqüências.
•Se os intervalos forem diferentes, marcam-se pontos com
abscissas iguais aos pontos médios de classes e
ordenadas iguais às respectivas densidades de freqüência
relativa.
0
5
10
15
20
25
30
35
40
1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25
Fre
qü
ên
cia
Peso ao nascer
Gráfico 5.5: Peso dos pacotes, em quilogramas.
Elaboração de Tabela de
Frequência