View
8
Download
0
Category
Preview:
Citation preview
Medidas de tendência central
ACH0021 – Tratamento e Análise de Dados/InformaçõesProf. Regis Rossi A. Faria1º sem. 2020
Créditos: parte do conteúdo baseado em slides dos profs. Ana Amélia Benedito Silva e Marcelo Lauretto
Etapas da análise estatística
ANÁLISE DESCRITIVA
• tabelas• gráficos• medidas
– média, mediana, moda– desvio-padrão, coeficiente de variação– percentis, quartis, decis
Medidas de Tendência Central
• média• mediana• moda
Entrevistamos 15 pessoas com curso superior que informaram seus salários (milhares de R$/mês):
Quanto ganha quem tem curso superior?
0,4 2,5 3,0 3,0 3,0 3,2 3,2 3,5 5,0 5,0 5,0 5,5 6,0 7,4 11
11 2,5 5,0 5,0 5,5 3,0 3,5 3,0 0,4 3,2 5,0 3,0 3,2 7,4 6,0
colocando em ordem
8 9 10 11
Gráfico de pontos dos salários das 15 pessoas com curso superior (milhares de R$/mês):
0,4 2,5 3,0 3,0 3,0 3,2 3,2 3,5 5,0 5,0 5,0 5,5 6,0 7,4 11
0 1 2 3 4 5 6 7
Como resumir esta informação?
MÉDIA= [(11+2,5+5+5+5,5+3+3,5+3+0,4+3,2+5+3+3,2+7,4+6)/15] MÉDIA = 66,7/15
MÉDIA= R$ 4.450,00
Média• Média aritmética: é a medida mais utilizada
onde !" é o valor de cada observação, n é o tamanho da amostra, e #$ é a média calculada.
#$ = ∑"'() !"*
No nosso exemplo teremos:
0 1 2 3 4 5 6 7 8 9 10 11
A média representa o quanto cada um receberia se o total de salários fosse distribuído igualmente.
média = R$4.450,00
0 1 2 3 4 5 6 7 8 9 10 11
O que aconteceria com a média se removêssemos o salário discrepante (outlier) da amostra de salários?
outlier
média = R$4.450,00
0 1 2 3 4 5 6 7 8 9 10 11
outlier
R$4.450,00R$3980,00
2000 10010
Salário de 14 sujeitos
Salário de 1 sujeito
ATENÇÃO! A média é uma medida sensível a valores extremos!
R$4.450,00
R$17.050,00
MÉDIA=(200+2,5+5+5+5,5+3+3,5+3+0,4+3,2+5+3+3,2+7,4+6)/15=255,7/15=17,05
E o que aconteceria com a média se o salário mais alto da amostra fosse de 200 mil reais ao invés de 11 mil reais?
MEDIANA
• divide uma distribuição ordenadade dados em 2 metades iguais
• é um índice de posição
alternativa para a média
MEDIANA
Quando o n0 de elementos n é ímpar, obtém-se a mediana “pegando-se” o elemento central.
Exemplo: 2 5 9 14 21
Logo: MEDIANA = 9
MEDIANA
• Quando o n0 de elementos n é par, obtém-se a mediana “pegando-se” os elementos centrais
Exemplo: 2 5 9 14 21 28
Logo: MEDIANA = (9+14)/2 = 11,5
0,4 2,5 3 3 3 3,2 3,2 3,5 5 5 5 5,5 6 7,4 11
0,4 2,5 3 3 3 3,2 3,2 3,5 5 5 5 5,5 6 7,4 200
A troca de 11 por 200 mudou a média de 4,45 para 17,05
A troca de 11 por 200 não mudou a mediana que se manteve em 3,5!!!
voltando aos salários
porém....
salários com 11mil
salários com 200mil
salários sem 11mil
0.40 0.40 0.402.50 2.50 2.503.00 3.00 3.003.00 3.00 3.003.00 3.00 3.003.20 3.20 3.203.20 3.20 3.203.50 3.50 3.505.00 5.00 5.005.00 5.00 5.005.00 5.00 5.005.50 5.50 5.506.00 6.00 6.007.40 7.40 7.4011.00 200.00
média 4.45 17.05 3.98
mediana 3.50 3.50 3.35
a média mudou
a mediana não mudou
0 10 20 30 40 50 60 70
Md = 22,5 média = 24,7
50% dos valores 50% dos valores
MÉDIA E MEDIANA
50%50%
média = mediana
(a) Distribuiçãosimétrica
50%
50%
mediana média
(b) Distribuiçãoassimétrica
MÉDIA E MEDIANA
moda
• valor que ocorre com maior freqüência• obtida por inspeção da tabela de
distribuição de freqüências• útil para medidas qualitativas
Exemplo: candidatos numa eleiçãotimes de futebol
Moda
Moda• Ex: no conjunto de escores 58, 82, 82, 90, 98, a
moda é 82 porque ocorre duas vezes, enquanto os demais escores ocorrem apenas uma vez.
• Útil para sumarizar variáveis qualitativas.– Ex: preferências de religiões (dados fictícios)
Moda da distribuição: Protestante
ModaCandidatos a Prefeitura de SP: Marta (M), Doria (D), Haddad (H), Russomano (R)
D D D D D H H H H H H H M D D D D M M R R R D D D
candidato N %Doria 12 48
Haddad 6 24Marta 4 16
Russomano 3 12TOTAL 25 100
MODA
ModaTIME FAVORITO Corinthians (C), Palmeiras (P), São Paulo (SP), Santos (S)
C C C C C C P P P P SP SP P S S SP SP S C C
candidato N %Corinthians 8 40Palmeiras 5 25São Paulo 4 20
Santos 3 15TOTAL 20 100
MODA
Limitações da moda• Algumas distribuições não possuem moda– Ex:
Limitações da moda
• Algumas distribuições possuem tantas modas que a estatística deixa de ter significado. – Ex: distribuição de
escores de testes. • Modas
identificadas: 55,66,78,82,90,97. • Qual dessas
representa um valor "típico"?
Limitações da moda• Em variáveis quantitativas
ou qualitativas ordinais, a moda pode não ser central na distribuição como um todo.– Ex: distribuição de escores
de testes. • Moda: 93• Esse valor é um bom
representante da distribuição?
Exercícios
Veremos agora exercícios para calcular a média, a mediana e a moda para 2 situações diferentes: (a) quando temos acesso às observaçõesda amostra; (b) quando temos acesso a tabelas de dados sobre a amostra
Exercício 1
O número de dias que sete pacientes submetidos a um transplante renal sobreviveram, após cirurgia em determinado hospital, foi:
17, 5, 48, 120, 651, 64, 150. • Apresente os dados em um gráfico de pontos.• Calcule a média, a mediana e a moda.
Cálculo da média: com acesso àsobservações
• Este é o caso de uso da média aritmética simples• É dada pela divisão entre a soma dos escores observados (x1, x2,
... , xn) e o número total de observações (n):
!" = ∑%&'( )%*
• Este tipo de média é calculado quando os valores não estão tabulados, ou seja, quando os escores são conhecidos individualmente.
• Ex: Suponha uma mostra de 10 crianças de 5 anos de idade, com dados referentes a seus pesos (em Kg): – 23.0, 20.0, 22.0, 19.0, 25.0, 28.2, 24.0, 21.0, 27.0, 21.0
– !" = ∑+,-. /+( =
012032002'4205206.020820'20920''3 ≅ 23.0
Cálculo da mediana: com acessoàs observações
1. Ordene os escores em ordem crescente (ou decrescente)2. Se o número de elementos (n) for ímpar:
– A mediana será o elemento localizado exatamente no centro.– O índice do elemento central é dado por (n+1) / 2.
3. Se o número de elementos (n) for par:– A mediana será exatamente o valor central dos dois casos do
meio da distribuição.– Os índices do primeiro e do segundo casos centrais são
dados por n/2 e n/2 + 1.
4. Por exemplo, se n=14, a mediana é o escore situado no centro dos escores do sétimo e oitavo casos.
Cálculo da mediana: com acessoàs observações
• Neste caso abaixo temos acesso àsobservaçõesCálculo da mediana com sete casos (n ímpar)
Cálculo da mediana com oito casos (n par)
Acompanhe solução do Exercício 1 em planilha
Exercício 2• Distribuição de
freqüências do número de pessoas residentes no domicílio, numa amostra de 40 residências (Ref. Conjunto Residencial Monte Verde, Florianópolis – SC, 1988)
• Calcule a média, a mediana e a moda do número de pessoas por domicílio.
Número de pessoas por domicílio Frequência
1 12 33 64 135 116 47 08 2
Total 40
Cálculo da média: com acesso a tabelas de frequências dos dados
• Quando temos acesso às frequências dos valores das observações, istoé, quando os dados estão agrupados em distribuições de frequência,usamos a media aritmética ponderada
• Os valores x1, x2, ... , xn são ponderados pelas respectivas frequências absolutas f1, f2, ... , fn
Pessoas/domicílioxi
Frequênciafi
1 12 33 64 135 116 47 08 2
Total 40
A média será:!" = ∑%&'
( )% *%+
onde n é a soma das frequências: + = ∑,&'( ),
No exemplo, fica:
!" = ∑%&'( )% *%+
= 1×1 + 3×2 + 6×3 +⋯ + 0×7 + 2×840 =17240
= 4,3
Cálculo da mediana: com acesso a tabelas de frequências dos dados
• Quando temos acesso às frequências dos valores das observaçõesa) Calcula-se inicialmente a posição do elemento original dos dados
correspondente à mediana, isto é, qual observação é a medianab) Determinada a posição da mediana, localiza-se na tabela de
frequências a linha que contém essa posição.
Pessoas/domicílio Frequência Freq. acumulada1 1 12 3 43 6 104 13 235 11 346 4 387 0 388 2 40
Total 40 40
• Como n=40 é par, a mediana é a média dos elementos de ordem (40/2)= 20 e (40/2)+1= 21.
• Analisando as frequências acumuladas na tabela ao lado, conclui-se que a mediana tem valor 4
• Med = 4 pessoas/domicílio
Acompanhe solução do Exercício 2 em planilha
Cálculo da mediana para dados agrupados em classes
• Neste caso temos acesso a faixas de valores das respostas e suas frequências
• Determina-se a linha da tabela que contém a mediana na tabela de forma similar àquela mostrada no slide anterior (cálculo da mediana para dados organizados em tabelas de frequências)
• Uma vez determinada a classe, deve-se calcular o valor da mediana por método de interpolação.
• Ex: distribuição das notas obtidas por candidatos em um vestibular.
Cálculo da mediana para dados agrupados em classes
• Após calcular a posição da mediana, localiza-se, a partir das frequências acumuladas na tabela, a classe na qual a mesma se encontra.
Cálculo da mediana para dados agrupados em classes
• O valor da mediana é obtido aplicando-se a fórmula:
!" = $% +'(%
)2 − ,%-.
onde:– ℎ = linha da tabela que contém a mediana; – $% = limite inferior da classe que contém a mediana;– a = amplitude do intervalo de classe;– (% = frequência da classe que contém a mediana;– ) = quantidade total de elementos;– ,%-. = Frequência acumulada até a classe anterior à classe
que contém a mediana.
Cálculo da mediana para dados agrupados em classes
Acompanhe cálculo da mediana por interpolação(onde se tem acesso aosintervalos de valores das
classes dos dados)
Exercício 3 (trabalho)Os dados abaixo referem-se ao número de dias de permanência de pacientes em um hospital. Pede-se: 1. Calcule a média, a mediana e a moda do tempo de internação destes
pacientes.2. Construa uma tabela de distribuição de frequências usando intervalos de 2
dias.3. Recalcule a média, a mediana e a moda a partir da tabela acima.4. Justifique as diferenças encontradas.
7 8 1 7 13 612 12 3 17 4 24 15 2 14 3 510 8 9 8 5 32 7 14 12 10 81 6 4 7 7 11
Exercício 4 (em classe)• Você está procurando emprego para o próximo ano. As
empresas A e B são totalmente equivalentes a menos de suaspolíticas de remuneração. As características de remuneração de cada uma são resumidas na tabela a seguir:
• Qual das duas empresas você escolheria? Justifique.
Empresa A BMédia 2500 2000Mediana 1700 1900Moda 1500 1900
Exercício 4 (resposta)• Resposta: Depende de sua qualificação.
– A empresa A tem metade dos funcionários ganhando até1700, sendo o valor mais comum 1500. Como a média é2500, há alguns poucos funcionários ganhando muito.
– A empresa B tem as três medidas muito próximas a 1900, indicando uma política salarial mais homogênea.
• Se você é altamente qualificado, as chances são de ganhar maisna empresa A. Se você tem qualificação igual ou inferior à média, a melhor escolha é a empresa B.
Empresa A B
Média 2500 2000
Mediana 1700 1900
Moda 1500 1900
Fim
Recommended