Upload
vergilio-borba-casqueira
View
217
Download
1
Embed Size (px)
Citation preview
Estatística Descritiva
Profa Denise Duarte
Medidas de PosiçãoMedidas de Posição
2
•Máximo (max):Máximo (max): a maior observação•Mínimo (min):Mínimo (min): a menor observação•Moda (mo):Moda (mo): é o valor (ou atributo) que ocorre com maior freqüência.
DadosDados: : 4, 5, 4, 6, 5, 8, 4
mo = 4max = 8 min = 4
3
n
x
nxxxxx
n
ii
n
1321 ...
•MédiaMédia::
DadosDados:: 2, 5, 3, 7, 8
55
87352 x
4
• MMediana:ediana:A mediana é o valor da variável que ocupa a posição central de um conjunto de n dados ordenados.
2
Posição da mediana: n+1
5
Exemplos:Exemplos:Dados: Dados: 2, 6, 3, 7, 8
Dados ordenados: 2 3 6 7 8 n n == 55 (ímpar)(ímpar)
Posição da Mediana 5+1 = 3
2
Md = (4 + 6) / 2 = 5
Dados: Dados: 4, 8, 2, 1, 9, 6 nn == 66 (par) (par)Dados ordenados: 1 2 4 6 8 9
Md
6+1 = 3,52
Md=6
O percentil de ordem p 100 (0 < p < 1), em um conjunto de dados de tamanho n, é o valor da variável que ocupa a posição
p (n + 1) do conjunto de dados ordenados.
6
PercentisPercentis::
percentil 50 = mediana ou segundo quartil (Md)percentil 25 = primeiro quartil (Q1)percentil 75 = terceiro quartil (Q3)percentil 10 = primeiro decil
Casos Casos pparticularesarticulares::
7
Md = 3,05
Q1 = 2,05
Q3 = 4,9
Md = 5,3 Q1 = 1,7 Q3 = 12,9
Dados:Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
nn=10=10
Posição de Md: 0,5(n+1)= 0,511= 5,5
Dados:Dados: 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6
nn=11=11
Posição de Q1: 0,25 (11) = 2,75Posição de Q3: 0,75 (11) = 8,25
Md = (3 + 3,1)/2 = 3,05 Q1=( 2+2,1)/2=2,05 Q3=(3,7+6,1)/2=4,9
Medidas de Dispersão
Medidas de dispersão, ou medidas devariabilidade, são uma indicação de como os dados estão espalhados em torno do centro.As principais medidas de dispersão são:1. A amplitude2. Interquartis3. Desvio médio4. Variância5. Desvio-padrão6. Coeficiente de variação
9
Grupo 1: Grupo 1: 3,4,5,6,73,4,5,6,7
Grupo 2: 1, 3, 5, Grupo 2: 1, 3, 5, 7, 97, 9
Grupo 3: Grupo 3: 5,5,5,5,55,5,5,5,5
Exemplo Exemplo 22:: Considere as notas de um teste de 3 grupos de alunos
GG 11
* * * * *
GG 22
* * * * *
GG 33
*****
0 105
e md1= md2= md3 = 5Temos: x1 = x2 = x3 = 5
_ _ _ _ _ _
10
Medidas de DispersãoMedidas de DispersãoFinalidade:Finalidade: encontrar um valor que resuma a variabilidade de um conjunto de dados
•Amplitude (Amplitude (AA):):
Para os grupos anteriores, temos:Grupo 1, A = 4Grupo 2, A = 8Grupo 3, A = 0
A = máx - min
1. Amplitude É a diferença entre a maior e a menor medidadentro de um conjunto de dados. É uma medida rude da dispersão, pois leva em conta apenas o menor e o maior dos dados: geralmente a estatística amplitude subestima o parâmetro amplitude. Portanto, a estatística amplitude é uma estimativa pobre do parâmetro amplitude.
3. Desvio médio:Pega-se a diferença entre todos os dados emrelação a média e soma-os em módulo, dividindo em seguida pelo número de dados.
–
X i X
M édio Desvion
2. Interquartis A distância “interquartil” é a diferença entre oprimeiro e o terceiro quartil. Também é muito utilizado a “amplitude oudesvio semi-quartil”, que seria o interquartil
dividido por 2. Lembre-se que num intervalo igual aointerquartil em torno da mediana estão 50% dos dados.
14
DadosDados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
Q1 = 2,05 e Q3= 4,9
Q3 - Q1 = 4,9 - 2,05 = 2,85
•Intervalo-InterquartilIntervalo-Interquartil:: É a diferença entre o terceiro quartil e o primeiro quartil, ou seja, QQ3 - 3 - QQ11..
5. Desvio-padrão:– É a raiz quadrada da variância.
– Para dados considerados normais, podemos dizer que70%– 95%– 99%
dosdosdos
dadosdadosdados
então dentro do intervalo .X sX 2
sestão no intervaloestão no intervalo X 3
s
16
n
i
inn
xxn
xxxxxxsVariância1
2222
212
11)()(...)()(
VariânciaPadrãoDesvio s
•Variância:Variância:
•Desvio padrão:Desvio padrão:
17
G3: s2 = 0 s = 0
Cálculo para os grupos:
4GG11: s2 =(3-5)2+(4-5)2+ (5-5)2+ (6-5)2+ (7-5)2
GG22: s2 = 10 s = 3,16
s = 1,58 s2 = 10/4= 2,5
18
Fórmula alternativa:Fórmula alternativa:
Em G1: Xi2 = 9 + 16 + 25 + 36 +49
= 135
1)(
n
1i
n
XnXS
i22
2
4 S2 = 135 - 5(5)2 = 2,5
19
- é uma medida de dispersão relativa- elimina o efeito da magnitude dos dados- exprime a variabilidade em relação à média %100
xsCV
• Coeficiente de Variação Coeficiente de Variação ((CVCV))
20
Altura 1,143m 0,063m 5,5%Peso 50 kg 6kg 12%
Média DesvioPadrão
Coef. de Variação
ConclusãoConclusão: Os alunos são, aproximadamente, duas vezes mais dispersos quanto ao peso do que quanto à altura.
Altura e peso de alunosExemplo Exemplo 3:3:
21
ConclusãoConclusão: Em relação às médias, as alturas dos adolescentes e dos recém-nascidos apresentam variabilidade quase iguais.
Desviopadrão
Coef. devariaçãoMédia
Recém-nascidos 50 6 12%Adolescentes 160 16 10%
Altura (em cm) de uma amostra de recém-nascidos e de uma amostra de adolescentes
Exemplo Exemplo 4:4:
Estatística Descritiva –Diferentes tipos de gráficos
Para a estatística descritiva, podemos citaros seguintes gráficos para a apresentaçãodos dados de maneira resumida e elegante:– Dados contínuos: Histograma, Boxplot, Gráficos de dispersão, Gráficos delinha
– Dados discretos: Gráfico de barras, gráfico de pizzas
Estatística Descritiva –Diferentes tipos de gráficos
Histograma– Para dados contínuos.– Sugestão do no. de caixas: n
Freq
uênc
ia
Histograma (100 dados)40
30
20
10
0-4 -2 0 2 4
Dados
Estatística Descritiva –Diferentes tipos de gráficos
Boxplot:– Para dados contínuos.– Apresenta os pontos “outliers”
Dad
os
Boxplot5,0
2,5
0,560,0 0,00
-0,70
-2,5
-5,0
Box plotBox plot
Limite inferior: .Limite superior: .
Variações: menor valor, maior valor
Estatística Descritiva –Diferentes tipos de gráficos
Gráfico deDispersão– Estudar o comportamento de uma variável em função de outra (portanto, temos que ter 2 variáveis).
500,0
400,0
300,0
200,0
100,0
0,0 20,0 40,0
Idade
60,0 80,0
Tem
po d
e ca
min
hada
Estatística Descritiva –Diferentes tipos de gráficos
Gráfico deLinha
7,50
7,00
6,50
6,00
EVA T1 EVA T2 EVA T3
Méd
ia
Gráficode linha com barra de erro8,0
7,5
7,0
6,5
6,0
5,5
5,0
EVA T1 EVA T2 EVA T3
95%
CI
Estatística Descritiva –Diferentes tipos de gráficos
Gráfico de barras– Para apresentar a freqüência de dados qualitativos
Prop
orçã
o (%
)
Distribuição por Sexo70
60
50
40
30
20
10
0Masculino Feminino
SexoMasculino = 92 indiv.; Feminino = 43 indiv.
Gráfico de Pizza:– Também para apresentação de freqüências de dados qualitativos.
Distribuição por Sexo (%)
C ategoriaMasculino
31,8 F eminino
68, 2