Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
15Aprendendo sobre medidas de dispersão
Paul
o Ro
berto
Rufi
no P
erei
raFr
eder
ico
Tass
i de
Souz
a Si
lva
413
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
412
e-Tec Brasil – Estatística Aplicada
Apresentar as medidas de dispersão.
Após o estudo desta aula, você deverá ser capaz de:
1. calcular a variância de dados não agrupados;
2. calcular a variância de dados agrupados;
3. calcular o desvio padrão;
4. calcular o coeficiente de variação.
Para esta aula, é importante que você tenha em mente o cálculo de potência e raiz quadrada, assuntos tratados nas Aulas 3 e 4, respectivamente. Também é importante rever o conceito de média aritmética apresentado na Aula 13, bem como o conceito de porcentagem, visto na Aula 5. Além disso, tenha à mão uma calculadora, para fazer as atividades propostas.
META
OBJETIVOS
PRÉ-REQUISITOS
413
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
412
e-Tec Brasil – Estatística Aplicada
ENTENDENDO TODO O CONJUNTO
Nas Aulas 13 e 14 você aprendeu sobre as medidas de tendência
central. Aprendeu a calcular a média aritmética simples e ponderada, a
mediana e a moda. Todas essas medidas são valores que representam, de
forma resumida (em um único valor), todo um conjunto de dados.
No entanto, tais medidas oferecem pouca informação a respeito
da forma como os outros valores estão espalhados pelo conjunto. Quer
dizer, os outros valores do conjunto são próximos ou distantes do valor
central?
Por isso, fez-se importante pensar em outras medidas que fossem
capazes de complementar as informações das medidas de tendência
central. Assim, nasceram as medidas de dispersão.
Essas medidas, assim como as de tendência central, são medidas de
posição. Elas determinam o quanto os outros dados do conjunto estão
perto, ou não, da média aritmética.
414
e-Tec Brasil – Estatística Aplicada
415
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Nesta aula, você aprenderá a calcular a variância, o desvio padrão
e o coeficiente de variação, que são medidas de dispersão. Vamos lá?
MEDIDAS DE DISPERSÃO: QUANTO MAIS PERTO MELHOR!
A média aritmética de uma série de dados, embora seja muito
utilizada para representá-la, não pode mostrar a HOMOGENEIDADE ou
HETEROGENEIDADE que há entre os valores que compõem o conjunto.
Isso acontece porque a média é um valor que representa um conjunto
de dados, mas podem existir valores dentro do conjunto que estejam
bastante distantes da maioria dos números que o compõem. Quando
isso acontece, a média acaba sendo um valor bem diferente da maioria
dos dados do conjunto.
Como vimos na Aula 13, esses valores distantes interferem no
resultado, fazendo com que a média se distancie dos valores mais
centrais do conjunto. O mesmo raciocínio vale para as outras medidas
de tendência central.
MEDIDAS DE POSIÇÃO
MEDIDAS DE DISPERSÃO
MEDIANA MODA VARIÂNCIA DESVIO PADRÃO
COEFICIENTE DE
VARIAÇÃO
MÉDIA ARITMÉTICA
MEDIDAS DE TENDÊNCIA
CENTRAL
Figura 15.1: Existem dois grupos de medidas de posição: as medidas de tendência central e as medidas de dispersão. As principais medidas de tendência central são a média aritmética, mediana e moda. As principais medidas de dispersão são a variância, o desvio padrão e o coeficiente de variação.
HOMOGENEIDADE
Característica, qualidade do que é homogêneo. Homogêneo é o que possui igual natureza e/ou apresenta semelhança de estrutura, função, distribuição etc. Um conjunto homogêneo, por exemplo, apresenta grande unidade, adesão, uniformidade entre seus elementos.
Fonte: Dicionário Houaiss de Língua Portuguesa
HETEROGENEIDADE
Característica, qualidade do que é heterogêneo. Heterogêneo é o que possui natureza desigual e/ou apresenta diferença de estrutura, função, distribuição etc. Um conjunto heterogêneo é aquele que não possui unidade ou uniformidade. Heterogêneo é o antônimo (oposto) de homogêneo.
Fonte: Dicionário Houaiss de Língua Portuguesa
414
e-Tec Brasil – Estatística Aplicada
415
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Observe, agora, os conjuntos A, B e C:
A: 69, 70, 70, 70, 71.
B: 58, 66, 72, 76, 78.
C: 6, 14, 49, 121, 160.
Ao calcular a média aritmética simples de cada um desses conjuntos,
encontramos:
Fonte: www.sxc.hu
Figura 15.2: A medidas de dispersão nos informam o quanto os valores de um conjunto de dados estão muito ou pouco espalhados em torno da média aritmética.
ATENÇÃO!
A média aritmética simples é calculada somando-se os valores dos
elementos do conjunto e dividindo o resultado pelo número de ele-
mentos do conjunto.
Você percebeu que os três conjuntos apresentam a mesma média
aritmética? Em todos os conjuntos a média é setenta. Mas, olhando
atentamente para cada um deles, você diria que são parecidos?
416
e-Tec Brasil – Estatística Aplicada
417
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Notamos, com facilidade, que o conjunto A é o mais homogêneo
dos três, pois os valores se distanciam pouco da média aritmética, que
é setenta. Quer dizer, a maioria dos números do conjunto tem valores
próximos ao valor da média. Dizemos, neste caso, que os dados desse
conjunto se dispersam pouco em torno da média.
Já o conjunto C é mais heterogêneo, já que seus valores são distantes
do valor da média encontrada. Os dados desse conjunto se dispersam
muito em torno da média.
Assim, concluímos que o conjunto A apresenta dispersão (ou
variabilidade) menor do que os conjuntos B e C. Também podemos
acreditar que, para o conjunto A, a média é uma boa medida para
representá-lo.
A fim de avaliar os valores de uma variável (valores dentro de um
conjunto de dados), mostrando seu grau de dispersão (ou variabilidade)
em torno de sua média aritmética, a Estatística recorre às medidas de
dispersão. As medidas de dispersão mais comuns são:
• variância;
• desvio padrão;
• coeficiente de variação; e
• amplitude total.
416
e-Tec Brasil – Estatística Aplicada
417
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
VARIÂNCIA
A variância é uma medida de dispersão que tem como objetivo
a avaliação de um conjunto de dados, analisando o quanto eles estão
dispersos. Para isso, tomamos como referência a média aritmética do
conjunto. Ou seja, podemos definir variância como uma medida que
representa o quanto os dados estão dispersos (afastados) em relação à
média aritmética.
Vamos aprender mais sobre essa medida utilizando um exemplo:
Para preencher uma vaga de Técnico em Segurança no Trabalho,
o departamento de pessoal de uma indústria química realizou testes
com vários candidatos. Vera e Paulo foram os candidatos que obtiveram
as melhores notas. A tabela a seguir mostra o desempenho dos dois
candidatos nas provas a que se submeteram:
Tabela 15.1: Notas que Vera e Paulo tiraram em cada uma das cinco provas que fizeram e a média aritmética das notas de cada um deles.
CandidatoAssunto
Vera Paulo
Conhecimentos de Informática 8,5 9,5
Língua Portuguesa 9,5 9,0
Inglês 8,0 8,5
Matemática 7,0 8,0
Conhecimento Específico 7,0 5,0
Média = 8,0 Média = 8,0
Observe que a média
aritmética das notas das provas
dos dois candidatos é igual.
As duas médias são iguais a oito.
418
e-Tec Brasil – Estatística Aplicada
419
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
No caso de Paulo e Vera, a amostra de notas menos dispersa em
relação à média aritmética corresponderá ao melhor desempenho e,
portanto, ao merecedor da vaga. Portanto, vamos calcular a variância
como critério de desempate.
A variância é representada pelo símbolo s². É preciso seguir alguns
passos para encontrá-la. Veja a seguir:
• 1º passo: calcule a diferença entre cada nota e a média
aritmética de todas as notas. Faça isso para cada candidato,
separadamente.
Cálculo da Vera Cálculo do Paulo
8,5 - 8,0 = 0,5 9,5 - 8,0 = 1,5
9,5 - 8,0 = 1,5 9,0 - 8,0 = 1,0
8,0 - 8,0 = 0,0 8,5 - 8,0 = 0,5
7,0 - 8,0 = -1,0 8,0 - 8,0 = 0,0
7,0 - 8,0 = -1,0 5,0 - 8,0 = -3,0
• 2º passo: calcule o quadrado de cada valor encontrado no
passo anterior (você aprendeu a calcular potência na Aula 3,
lembra?).
Cálculo da Vera Cálculo do Paulo
(0,5)2 = 0,25 (1,5)2 = 2,25
(1,5)2 = 2,25 (1,0)2 = 1,0
(0,0)2 = 0,0 (0,5)2 = 0,25
(-1,0)2 = 1,0 (0,0)2 = 0,0
(-1,0)2 = 1,0 (-3,0)2 = 9,0
• 3º passo: calcule a média aritmética dos valores encontrados
no passo anterior.
2
2
0 25 2 25 0 0 1 0 1 05
0 9
2 25 1 0 0 25 0 0
s
s
Vera
Paulo
=+ + + +
=
=+ + +
, , , , ,,
, , , , ++=
9 05
2 5,
,
418
e-Tec Brasil – Estatística Aplicada
419
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Os resultados encontrados no terceiro passo são as variâncias
de cada um dos conjuntos de notas. Veja que a variância das notas de
Vera (0,9) é menor que a de Paulo (2,5), o que significa que as notas
de Vera estão mais próximas da média (menos dispersas) do que as de
Paulo, ou seja, seu desempenho nas provas foi mais regular e, portanto,
Vera deverá ficar com a vaga.
Fonte: www.sxc.hu
Figura 15.3: Para determinar se algo está longe ou perto precisamos de uma referência. No caso das medidas de dispersão essa referência é a média aritmética de um conjunto de dados.
Calculando a variância de um jeito diferente
O que você achou do cálculo da variância? Difícil? Complicado?
Bem. Existe uma outra opção para fazer esse cálculo. A segunda maneira
de encontrar o valor da variância é chamada de Processo Breve. Vamos
aproveitar o exemplo das notas da Vera e do Paulo para calcular a
variância por esse outro caminho.
420
e-Tec Brasil – Estatística Aplicada
421
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
O primeiro passo é montar uma tabela para cada candidato,
colocando na primeira coluna as notas e na segunda coluna o quadrado
do valor dessas notas. No fim da tabela, coloca-se a soma dos valores
de cada coluna. Veja a seguir:
Tabela com as notas da Vera Tabela com as notas do Paulo
Notas Quadrados das notas Notas Quadrados das notas
8,5 72,25 9,5 90,25
9,5 90,25 9,0 81,0
8,0 64,0 8,5 72,25
7,0 49,0 8,0 64,0
7,0 49,0 5,0 25,0
Total: 40 Total: 324,5 Total: 40 Total: 332,5
O próximo passo é diminuir a razão entre o total da segunda coluna
e o número de notas, do quadrado da razão entre o total da primeira
coluna e o número de notas.
Fonte: www.sxc.hu
Figura 15.4: Existe mais de uma maneira de encontrar a variância de um conjunto de dados. Escolha o caminho que achar mais fácil.
Svile
n M
ushk
atov
420
e-Tec Brasil – Estatística Aplicada
421
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Vamos montar a equação devagar, usando as notas da Vera para
entender:
• Razão, na linguagem matemática, significa fração. Ou seja, no
caso do exemplo das notas da Vera, a razão entre o total da
segunda coluna (324,5) e o número de notas (5) é:
324 55
,
• O quadrado (potência de 2) da razão entre o total da primeira
coluna (40) e o número de notas (5) é:
2
405
• Então, diminuir a razão entre o total da segunda coluna e o
número de notas, do quadrado da razão entre o total da primeira
coluna e o número de notas; quer dizer:
324 55
2
405
,−
• A variância das notas de Vera é:
2
2
2324 55
64 9 64 9 64 0 9405
8s = − = − = − =
,, , ,
422
e-Tec Brasil – Estatística Aplicada
423
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
A variância das notas de Vera é 0,9, o mesmo valor encontrado
na seção sobre variância.
Agora é a sua vez. Utilize o espaço a seguir para calcular a variância
das notas do Paulo. Aproveite que a tabela com o quadrado das notas
já está montada. O resultado você já sabe: é o mesmo da seção anterior.
Mas não deixe de tentar encontrá-lo aqui, calculando da maneira que
acabou de aprender.
Fonte: www.sxc.hu
Kris
s Sz
kirla
tow
ski
Até aqui você aprendeu a calcular a variância de duas maneiras
diferentes. Usando qualquer uma delas você chegará ao mesmo resultado.
No entanto, os cálculos foram feitos para um conjunto de dados não
agrupados. Na próxima seção, você verá como é feito o cálculo da
variância quando os dados estão agrupados.
Fonte: www.sxc.hu
Ad
am C
iesi
elsk
i
422
e-Tec Brasil – Estatística Aplicada
423
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Variância de dados agrupados
A esta altura do nosso curso, você já deve ter percebido que quando
os dados se apresentam agrupados (em freqüências ou em classes), a
forma de encontrar qualquer uma das medidas de posição é diferente do
cálculo para dados não agrupados, não é mesmo? Nesta seção, veremos
como encontrar a variância para dados que estão agrupados.
Variância de dados agrupados sem intervalos de classe
Dados agrupados sem intervalos de classe são os dados que en-
contramos agrupados em freqüências, ou seja, eles estão agrupados pelo
número de vezes que se repetem dentro do conjunto. A melhor forma
de aprender a calcular a variância de dados agrupados é a partir de um
exemplo. Então, vamos lá!
Atende ao Objetivo 1
Um grupo de amigos da mesma turma do curso de Segurança no Trabalho estava reunido
estudando para uma prova quando surgiu uma dúvida: qual o número de equipamentos de
segurança que devem ser utilizados por um trabalhador da indústria do setor alimentício?
Ninguém se entendeu e cada um deu uma resposta diferente. As respostas que surgiram foram:
8, 10, 11, 15, 16, 18.
Um dos amigos teve uma idéia e disse: vamos aproveitar esses números e estudar para a prova
de estatística? Que tal se nós calcularmos a variância desses valores?
Todos concordaram e resolveram calcular. Que valor eles encontraram?
Lembre-se de que existem duas maneiras de calcular o valor. Você pode escolher qual delas
usar, mas seria interessante que tentasse fazer dos dois jeitos, assim testaria se aprendeu o
cálculo de ambos.
ATIVIDADE 1
424
e-Tec Brasil – Estatística Aplicada
425
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Observe a Tabela 15.2. Ela foi montada a partir de um levantamento
feito pela secretaria municipal de obras de Engenhópolis. A intenção da
pesquisa era verificar a quantidade de multas que as trinta empresas de
construção civil desse município receberam, no mês de janeiro, devido a
problemas com as condições de trabalho dos empregados.
Tabela 15.2: Distribuição de freqüência relativa à quantidade de multas que 30 empresas do município de Engenhópolis receberam no mês de janeiro. A segunda coluna apresenta a quantidade de empresas que receberam a quantidade de multas relacionadas na primeira coluna.
Empresas multadas no mês de janeiro
Número de multas Quantidade de empresas(freqüência)
0 2
1 6
2 12
3 7
4 3
Total 30
Fonte: www.sxc.hu
Figura 15.5: As empresas, inclusive aquelas do ramo da construção civil, são multadas pelo Ministério do Trabalho quando descumprem a legislação referente à segurança no trabalho.
Keith
Syv
insk
i
424
e-Tec Brasil – Estatística Aplicada
425
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Para calcular a variância dos valores encontrados na Tabela 15.2
é preciso levar em consideração o fato de que eles estão agrupados em
freqüências.
Para facilitar a organização dos cálculos é importante montar uma
tabela auxiliar. Para isso, basta criar mais duas colunas na tabela anterior.
A terceira coluna será o resultado da multiplicação da primeira coluna
pela segunda. A quarta coluna é o resultado da multiplicação do quadrado
da primeira coluna pela segunda coluna. Veja como fica a nova tabela.
A última linha da tabela apresenta a soma de cada coluna.
Tabela 15.3: Auxiliar para cálculo da variância. Foram inseridas mais duas colunas na Tabela 15.2. A terceira coluna é o resultado da primeira multiplicada pela segunda. A quarta coluna é o resultado do quadrado da primeira multiplicado pela segunda.
Empresas multadas no mês de janeiro
Multas FreqüênciaMultas x
Freqüência(Multas)² x Freqüência
0 2 0 0
1 6 6 6
2 12 24 48
3 7 21 63
4 3 12 48
Total 30 63 165
Para encontrar a variância (s²), você tem que calcular a diferença
entre a razão do total da quarta coluna pelo total da segunda coluna e o
quadrado da razão entre o total da terceira coluna pelo total da segunda
coluna. Não é difícil. Veja como fica a equação:
2
2
42
32
scolunacoluna
a
a
coluna
coluna
a
a= −
Substituindo a fórmula pelos valores da tabela, temos:
s
s
s
s
²
².
² , ,
² ,
= −
= −
= −=
16530
6330
16530
3 969900
5 5 4 41
1 09
2
426
e-Tec Brasil – Estatística Aplicada
427
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Esse resultado significa que a variância dos valores (as multas
recebidas pelas trinta empresas) da Tabela 15.2 é 1,09.
Variância de dados agrupados em intervalos de classe
O cálculo da variância com intervalos de classe é parecido com o
anterior (agrupados em freqüências), mas possui algumas particularidades.
Veja o exemplo adiante e compare as diferenças com a seção anterior.
A partir das estaturas (alturas) de quarenta alunos de uma das
turmas de um curso preparatório para concursos, foi montada a seguinte
tabela:
Tabela 15.4: Estatura, em centímetros, dos quarenta alunos do curso. As estaturas estão agrupadas em seis classes. A terceira coluna apresenta a quantidade de alunos com alturas encontradas dentro do referido intervalo de classe (segunda coluna).
Estatura dos alunos da turma
ClassesEstatura em centímetros
(intervalo de classes)Número de alunos
(freqüência)
1 150 154 4
2 154 158 9
3 158 162 11
4 162 166 8
5 166 170 5
6 170 174 3
Total 40
A partir da Tabela 15.4 é possível montar outra tabela para facilitar
o cálculo da variância.
Fonte: www.sxc.hu
Figura 15.6: Quando os dados de um conjunto se encontram agrupados, fica um pouco mais trabalhoso achar a variância.
Sanj
a G
jene
ro
426
e-Tec Brasil – Estatística Aplicada
427
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
A nova tabela deverá possuir mais três colunas. A quarta coluna
deve apresentar o ponto médio de cada intervalo de classe (média
aritmética entre o limite inferior e o limite superior de cada intervalo
de classe). A quinta coluna é o resultado da multiplicação da terceira
coluna (freqüência) pela quarta coluna (ponto médio). Já a sexta coluna
vem com o resultado da multiplicação da terceira coluna pelo quadrado
da quarta. A última linha da tabela apresenta a soma (total) da terceira,
quinta e sexta colunas.
Veja, a seguir, como fica a nova tabela:
Tabela 15.5: Auxiliar para cálculo da variância de dados agrupados em intervalos de classes. A Tabela 15.4 foi acrescida de três colunas. A quarta coluna é o ponto médio dos intervalos de classes. A quinta coluna é o resultado da terceira coluna multiplicada pela quarta. A sexta coluna é o resultado da terceira coluna multiplicada pelo quadrado da quarta.
Estatura dos alunos da turma
ClasseIntervalos de
classesN° alunos
(freqüência)Ponto médio
Freqüência × Ponto médio
Freqüência × (Ponto médio)²
1 150 154 4 152 608 92.416
2 154 158 9 156 1.404 219.024
3 158 162 11 160 1.760 281.600
4 162 166 8 164 1.312 215.168
5 166 170 5 168 840 141.120
6 170 174 3 172 516 88.752
Total 40 6.440 1.038.080
Para calcular a variância, é preciso diminuir a razão entre a soma
da sexta coluna pela soma da terceira coluna do quadrado da razão entre
a soma da quinta coluna pela soma da terceira coluna. Ou seja:
2
2
63
53
scolunacoluna
a
a
coluna
coluna
a
a= −
428
e-Tec Brasil – Estatística Aplicada
429
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Substituindo a fórmula pelos valores da tabela, temos:
s
s
². . .
². . . .
.
= −
= −
1 038 08040
6 44040
1 038 08040
41 473 6001 60
2
00
25 952 25 921
31
s
s
² . .
²
= −=
Quer dizer, então, que a variância das alturas dos alunos daquela
turma é 31.
Você deve ter percebido que no cálculo da variância alguns números
são elevados ao quadrado, não é mesmo? Esse recurso, utilizado para
fazer o cálculo, gera um problema se os dados analisados se apresentarem
em unidades de medidas. Isso acontece porque unidades de medida
podem ser elevadas à potência, e isso modifica o resultado – metro (m)
é diferente de metro quadrado (m2), que por sua vez é diferente de metro
cúbico (m3).
Por exemplo: imagine que você está calculando a variância do
conjunto das estaturas (alturas) dos seus melhores amigos. A unidade
usada para medir estaturas é o centímetro. Assim como é feito para
calcular a variância – elevar os valores ao quadrado –, a unidade de
medida também será elevada ao quadrado. E, como você já deve saber,
centímetro é diferente de centímetro quadrado.
Para resolver esse problema e deixar o cálculo na mesma unidade
dos dados, é só tirar a raiz quadrada da variância (operação inversa da
potência de dois; lembra-se da Aula 4?). Só que o resultado encontrado
não é mais a variância. Ele agora é chamado de desvio padrão. O desvio
padrão é o nosso próximo assunto desta aula.
428
e-Tec Brasil – Estatística Aplicada
429
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
MULTIMÍDIA
Você já imaginou um mundo sem as unidades de medidas? Como
iríamos comprar o sal, o açúcar, o leite e tantos outros alimentos que
fazem parte das refeições “nossas de cada dia”? Como medir com
precisão se as medidas tivessem de ser feitas com polegadas, braçadas
ou pés? Cada pessoa tem um polegar, um braço ou pé diferente, ou seja,
as medidas poderiam ser de qualquer tamanho, não é verdade? Para
resolver esses problemas, foi criado o Sistema Internacional de Medidas,
que regulamentou e unificou as medições. Se você quiser se informar
mais sobre o assunto, vá até o endereço http://www.inmetro.gov.br/
consumidor/unidLegaisMed.asp. É uma página do site do INMETRO
(Instituto Nacional de Metrologia, Normalização e Qualidade Industrial).
Nela você encontrará um link para o Sistema Internacional de Unidades
de Medidas, com o histórico de sua criação e a explicação sobre todas
as unidades e grandezas.
Fonte: www.sxc.hu
Sanj
a G
jene
ro
Atende ao Objetivo 2
Em determinado setor de uma siderúrgica, existem seis equipamentos de grande porte. Nesse
setor trabalham vinte e cinco operários em turnos variados. Para evitar que mais de um
empregado precisasse utilizar uma máquina no mesmo horário, o chefe do setor montou uma
tabela de utilização desses equipamentos. Veja:
ATIVIDADE 2
430
e-Tec Brasil – Estatística Aplicada
431
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
DESVIO PADRÃO
O desvio padrão também é uma medida de dispersão. Assim como
a variância, ele dá a noção de como os valores de determinado conjunto
estão dispersos em relação a sua média aritmética. Quer dizer, o desvio
padrão nos informa a distância média em que os valores de determinado
conjunto de dados estão em relação à média desse conjunto.
Quantidade de trabalhadores que utilizam cada equipamento
EquipamentoNúmero de trabalhadores que
utilizam o equipamento (freqüência)
1 2
2 5
3 8
4 6
5 3
6 1
Total 25
Utilizando a tabela anterior, calcule a variância dos dados. Para ajudar nos cálculos, preencha
a tabela auxiliar a seguir.
Equipamento Freqüência 1ª coluna x 2ª
coluna(1ª coluna)2 x 2ª
coluna
1 2 2 2
2
3
4
5
6
Total 25
430
e-Tec Brasil – Estatística Aplicada
431
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Quanto maior o valor do desvio padrão, maior é a dispersão dos
dados de um conjunto em relação a sua média aritmética. Quando o
valor do desvio padrão é igual a zero, significa dizer que os valores do
conjunto são iguais à média.
O desvio padrão é representado pela letra grega σ (sigma). Ele é
a raiz quadrada da variância. Portanto, você já pode calcular o desvio
padrão sem problemas, tanto para dados agrupados quanto para não
agrupados, porque já sabe calcular a variância.
Lembra-se do Paulo e da Vera, que foram apresentados na seção
sobre variância? Naquele exemplo, foi calculada a variância das notas
das provas de cada um deles. A variância das notas de Vera era 0,9,
enquanto a variância das notas do Paulo foi 2,5.
Se o desvio padrão é a raiz quadrada da variância, temos:
s
s
_ , ,
_ , ,
Vera
Paulo
= ≅
= ≅
0 9 0 949
2 5 1 58
Observe que, pelo cálculo do desvio padrão, Vera continua com
desempenho melhor que o de Paulo, pois seu desvio padrão é menor
que o dele. Esse resultado significa que as notas de Vera têm uma
distância média, em relação à média
aritmética de todas as notas (que era
oito, lembra?), de 0,9. Essa distância é
menor que a encontrada para as notas
de Paulo, ou seja, as notas dela são
mais homogêneas do que as dele.
Figura 15.7: O desvio padrão é a medida da distância média entre os dados de um conjunto e sua média aritmética.
432
e-Tec Brasil – Estatística Aplicada
433
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Agora, vamos a um exemplo com dados agrupados para que você
veja como é fácil!
Imagine que um grupo de jovens futuros administradores de
empresas realizou uma pesquisa com sessenta e quatro funcionários do
setor financeiro de uma grande indústria farmacêutica. Na entrevista,
eles perguntaram o valor atual do salário de cada um dos entrevistados.
O grupo de alunos, que já teve aulas de estatística, organizou os dados
em uma tabela de distribuição de freqüência. Veja como ficou:
Tabela 15.6: Salários dos funcionários do setor financeiro. Os salários, em reais, estão agrupados em classes. A coluna da direita apresenta o número de funcionários com salários encontrados dentro do intervalo de classes correspondente.
Salário dos funcionários do setor financeiro
Classe Salário em reais (intervalo de classes)
Número de funcionários com salário nesse intervalo
(freqüência)
1 450,00 550,00 8
2 550,00 650,00 10
3 650,00 750,00 11
4 750,00 850,00 16
5 850,00 950,00 13
6 950,00 1.050,00 5
7 1.050,00 1.150,00 1
Total 64
Vamos aproveitar a tabela que os alunos montaram e calcular o
desvio padrão desses dados em relação a sua média?
Primeiro, devemos calcular a variância; para isso, como você já
aprendeu, devemos acrescentar, na Tabela 15.6, três colunas:
• uma coluna para os valores do ponto médio de cada intervalo
de classe;
• outra coluna com o resultado da multiplicação da freqüência
pelo ponto médio; e
• a última coluna com a multiplicação da freqüência pelo
quadrado do ponto médio.
432
e-Tec Brasil – Estatística Aplicada
433
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
É importante colocar, na última linha da nova tabela, a soma dos
valores da terceira, da quinta e da sexta colunas. Agora, temos a Tabela
15.7.
Tabela 15.7: Auxiliar com o salário dos funcionários do setor financeiro. Foram acrescentadas à Tabela 15.6 mais três colunas. A quarta coluna é o ponto médio de cada intervalo de classe (média aritmética entre os limites do intervalo). A quinta coluna é o resultado das freqüências vezes os pontos médios. A sexta coluna é o resultado das freqüências vezes os quadrados dos pontos médios.
Salário dos funcionários do setor financeiro
ClasseSalário em reais
(intervalo de classes)Freqüência
Ponto médio
Freqüência × Ponto médio
Freqüência × (Ponto médio)²
1 450,00 550,00 8 500 4.000 2.000.000
2 550,00 650,00 10 600 6.000 3.600.000
3 650,00 750,00 11 700 7.700 5.390.000
4 750,00 850,00 16 800 12.800 10.240.000
5 850,00 950,00 13 900 11.700 10.530.000
6 950,00 1.050,00 5 1.000 5.000 5.000.000
7 1.050,00 1.150,00 1 1.100 1.100 1.210.000
Total 64 48.300 37.970.000
A variância é calculada pela seguinte fórmula:
2
2
63
53
scolunacoluna
a
a
coluna
coluna
a
a= −
434
e-Tec Brasil – Estatística Aplicada
435
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Agora é só substituir os valores da tabela na fórmula. Assim,
temos:
s
s
². . .
². . .
= −
= −
37 970 00064
48 30064
37 970 00064
48 30064
2
= −= −=
2
593 281 25 754 6875
593 281 25 569 553 22
2
s
s
s
² . , ( , )²
² . , . ,
² 33 728 03. ,
A variância dos salários vale, portanto, 23.728,03.
Como foi dito anteriormente, o desvio padrão é a raiz quadrada
da variância. Então:
Fonte: www.sxc.hu
Figura 15.8: O valor do desvio padrão terá sempre a mesma unidade dos dados do conjunto analisado.
Pont
us E
nden
berg
Vin
ce V
arga
Prze
mys
law
Szc
zepa
nski
Jay
Sim
mon
s
σ
σσ
O desvio padrão dos salários vale R$ 154,00.
s
s
s
=
==
s²
. ,23 728 03
154
434
e-Tec Brasil – Estatística Aplicada
435
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Digamos que você queira comparar o desvio padrão encontrado
no exemplo da Vera e do Paulo da seção sobre variância com o desvio
padrão encontrado no exemplo anterior (dos salários). Você acha que
seria possível?
É difícil imaginar que possamos comparar notas de provas com
dinheiro, não é verdade? E como foi explicado, o resultado do desvio
padrão sai com a mesma unidade dos dados analisados. Por isso, houve
a necessidade de se criar uma medida de dispersão que possibilitasse a
comparação de conjuntos de dados diferentes. Essa medida é chamada
de coeficiente de variação e será apresentada na próxima seção.
Atende ao Objetivo 3
Uma turma de trinta e sete alunos realizou prova de Português e Literatura. Cada prova era
composta por 130 questões. A professora da disciplina montou uma tabela de distribuição
de freqüência de dados agrupados em intervalos de classe, com o número de questões corretas
de cada aluno. Veja:
Notas da prova de Português e Literatura
ClasseQuestões corretas
(intervalo de classe)Número de alunos
(freqüência)
1 30 50 2
2 50 70 8
3 70 90 12
4 90 110 10
5 110 130 5
Total 37
ATIVIDADE 3
436
e-Tec Brasil – Estatística Aplicada
437
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
COEFICIENTE DE VARIAÇÃO
Como você pode conferir na seção anterior, o desvio padrão e a
variância são expressos com as mesmas unidades dos dados sobre os
quais foram calculados. Por exemplo, o cálculo do desvio padrão no
exemplo do salário dos funcionários foi dado em reais, pois os dados
estavam em reais.
O problema é que não podemos comparar o valor encontrado no
caso dos salários (σ = R$ 154,00), por exemplo, com o desvio padrão
calculado sobre dados que estão em centímetros. Anteriormente,
calculamos a variância das estaturas dos alunos de uma turma (s2 =
31), lembra? O desvio padrão do valor encontrado é a raiz quadrada
desse valor, ou seja, σ = 5,57 cm. Não é possível dizer que R$ 154,00 é
maior que 5,57 cm, porque os valores estão em unidades diferentes (reais
e centímetros).
Com base na tabela montada pela professora, calcule o desvio padrão do número de questões
que cada aluno acertou. Aproveite a tabela a seguir para ajudar no cálculo.
Classe Questões corretas
(intervalo de classe)
N° de alunos (Freqüência)
Ponto médio
Freqüência × Ponto médio
Freqüência × (Ponto médio)²
1 30 50 2
2 50 70 8
3 70 90 12
4 90 110 10
5 110 130 5
Total 37
436
e-Tec Brasil – Estatística Aplicada
437
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
É para driblar essa limitação que surgiu outro tipo de variável,
chamada de coeficiente de variação. O coeficiente de variação mostra a
dispersão dos dados em relação à média de um conjunto, assim como
a variância e o desvio padrão. A grande diferença é que o valor do
coeficiente de variação é representado em porcentagem e, portanto, pode
ser comparado (lembra-se da Aula 5?).
Então, sempre que quiser comparar conjuntos diferentes, mesmo
representados em unidades diferentes, você deverá utilizar essa medida
de dispersão.
O coeficiente de variação é a razão entre o desvio padrão e a
média aritmética do conjunto. Ao multiplicarmos esse resultado por 100,
encontramos o valor em porcentagem.
Vamos entender, na prática, o que foi explicado? Volte ao exemplo
das alturas dos alunos da turma do curso preparatório para concursos,
apresentado anteriormente. A seguir, você encontrará a tabela auxiliar
que foi montada.
Figura 15.9: Não é possível comparar dados que não estejam representados na mesma unidade.
438
e-Tec Brasil – Estatística Aplicada
439
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
ESTATURA DOS ALUNOS DA TURMA
ClasseIntervalos de
classesN° alunos
(freqüência)Ponto médio
Freqüência × Ponto médio
Freqüência × (Ponto médio)²
1 150 154 4 152 608 92.416
2 154 158 9 156 1.404 219.024
3 158 162 11 160 1.760 281.600
4 162 166 8 164 1.312 215.168
5 166 170 5 168 840 141.120
6 170 174 3 172 516 88.752
Total 40 6.440 1.038.080
O primeiro passo é calcular a média aritmética das estaturas, que
você aprendeu na Aula 13. Como os dados estão agrupados em intervalos
de classe, a média será encontrada ao multiplicarmos cada ponto médio
por sua respectiva freqüência. Somamos esses valores e dividimos pela
soma de todas as freqüências, como na equação:
x = × + × + × + × + × + ×+ + +
( ) ( ) ( ) ( ) ( ) ( )4 152 9 156 11 160 8 164 5 168 3 1724 9 11 8 ++ +
= + + + + +
=
=
5 3
608 1 404 1 760 1 312 840 51640
6 44040
161
x
x
x
. . .
.
O desvio padrão já foi calculado, lembra? Ele é igual a 5,57 cm.
Sabendo os valores da média aritmética e do desvio padrão fica
fácil calcular o coeficiente de variação, que representaremos por CV:
CVX
CV
CV
CV
= ×
= ×
= ×=
s100
5 57161
100
0 03459 100
3 459
,
,
,
438
e-Tec Brasil – Estatística Aplicada
439
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Quer dizer, então, que o coeficiente de variação das estaturas dos
alunos é 3,5% (valor aproximado).
Se você calcular o valor da média aritmética dos salários dos
funcionários do exemplo da seção sobre variância, verá que ela é igual
a 182,8. Já sabemos que o desvio padrão é R$ 154,00. Vamos, agora,
calcular o coeficiente de variação:
CVX
CV
CV
CV
= ×
= ×
= ×
=
s100
154182 8
100
0 8424 100
84 2
,
,
,
Neste caso, o coeficiente de variação dos salários dos funcionários
é 84% (valor aproximado).
Com esses resultados, podemos, então, comparar a dispersão
dos dados em relação à média, nas diferentes situações apresentadas.
A dispersão dos valores dos salários em relação ao salário médio é de 84%,
enquanto a dispersão das estaturas é de 3,5%. Ou seja, podemos afirmar
que os dados do conjunto das estaturas dos alunos são mais homogêneos
(menos dispersos) do que o conjunto com os valores dos salários.
SAIBA MAIS...SAIBA MAIS...
A amplitude da dispersão
Fonte: www.sxc.hu
Luís
Fra
ncis
co C
orde
ro
440
e-Tec Brasil – Estatística Aplicada
441
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Além das medidas de dispersão que você aprendeu nesta aula, existe outra medida chamada
de amplitude total. Você deve se lembrar do conceito de amplitude total que foi apresentado
na Aula 7.
Para encontrar a amplitude total, você deve calcular a diferença entre o maior e o menor valor
de um conjunto de dados. Assim, quanto maior a amplitude total, maior será a dispersão dos
dados do conjunto.
É uma medida bem simples, você não acha? A amplitude total, assim como a variância, o
desvio padrão e o coeficiente de variação, indica, de maneira aproximada, a dispersão ou
variabilidade dos dados em um conjunto.
No entanto, a amplitude total não é uma medida de dispersão muito utilizada. Isto porque
ela só leva em consideração os valores extremos do conjunto (o maior e o menor), e ignora
os valores intermediários. Imagine um conjunto com os seguintes valores: 2, 57, 57, 57, 58,
59, 60, 60, 62, 63, 63, 63, 100. A amplitude total desse conjunto é noventa e oito (100 – 2
= 98). Se você observar, verá que apenas os dois valores extremos do conjunto são distantes
dos outros dados. Na verdade, a maioria dos dados do conjunto (os outros onze valores)
se concentra entre valores que vão de 57 a 63, ou seja, não estão muito dispersos, não
é mesmo?
Atende ao Objetivo 4
Atende ao Objetivo 4
Na disciplina Biossegurança do curso Segurança no Trabalho, a média aritmética das notas de
todas as provas do primeiro semestre foi de 7,8 pontos e o desvio padrão foi igual a 0,80.
Já na disciplina Psicologia do Trabalho do mesmo curso, a média aritmética de todas as notas
foi igual a 7,3, enquanto o desvio padrão foi de 0,76.
Em qual das duas disciplinas houve maior grau de dispersão?
ATIVIDADE 4
440
e-Tec Brasil – Estatística Aplicada
441
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
Atende ao Objetivo 4
Na tabela a seguir, você encontra a média aritmética e o desvio padrão das estaturas dos alunos
de turmas do curso de Engenharia. Analisando os valores apresentados na tabela, diga qual das
duas turmas (Mecânica ou Eletrotécnica) é mais homogênea em relação à altura dos alunos?
TurmasNúmero de
alunosMédia da altura dos
alunos da classeDesvio padrão
Mecânica 85 160,6 cm 5,97 cm
Eletrotécnica 125 161,9 cm 6,01 cm
ATIVIDADE 5
RESUMINDO...
• As medidas de dispersão são utilizadas para determinar a homogeneidade ou hete-rogeneidade dos dados de determinado conjunto. Ou seja, elas demonstram o quanto os valores estão espalhados em torno da média aritmética.
• As medidas de dispersão mais comuns são: a variância, o desvio padrão, o coeficiente de variação e a amplitude total.
• A variância é uma medida que representa o quanto os dados de determinado conjunto estão dispersos (afastados) em relação à média aritmética.
• O desvio padrão nos informa a distância média em que os valores de determinado conjunto de dados estão em relação à média. O desvio padrão é a raiz quadrada da variância.
• O coeficiente de variação mostra a dispersão dos dados em relação ao termo médio de um conjunto: o coeficiente de variação é representado em % e, portanto, pode ser comparado com outros coeficientes de situações distintas.
442
e-Tec Brasil – Estatística Aplicada
443
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
ATIVIDADE 1
Vamos resolver passo a passo:
1º passo – Calcular a média aritmética dos valores:
8 10 11 15 16 186
786
13+ + + + + = =
2º passo – Calcular a dispersão (diferença) dos elementos (valores) em relação à média:
1º elemento: 8-13=-5
2º elemento: 10-13=-3
3º elemento: 11-13=-2
4º elemento: 15-13=2
5º elemento: 16-13=3
6º elemento: 18-13=5
3º passo – Calcular a soma dos quadrados dos valores encontrados anteriormente:
(-5)2+(-3)2+(-2)2+22+32+52 = 25+9+4+4+9+25=76
4º passo – Dividir o valor encontrado no passo anterior pelo número de elementos do
conjunto (que é 6): 76÷6=12,67
Assim, a variância desse conjunto de dados vale 12,67.
Vejamos outra forma de calcular a variância de dados não agrupados com o uso do Pro-
cesso Breve:
Monte a seguinte tabela:
Valores dos elementosQuadrados dos valores
dos elementos
8 64
10 100
11 121
15 225
16 256
18 324
Total: 78 Total: 1.090
RESPOSTAS DAS ATIVIDADES
442
e-Tec Brasil – Estatística Aplicada
443
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
A variância é a diferença entre a razão do total da segunda coluna e o número de elementos
e o quadrado da razão da primeira coluna e o número de elementos. Ou seja:
s
s
s
s
².
². .
². .
²
= −
= −
= −
=
1 0906
786
1 0906
6 08436
6 540 6 08436
45
2
6636
12 67s² ,=
ATIVIDADE 2
Preenchendo a tabela auxiliar, temos:
Equipamento Freqüência 1ª coluna x 2ª
coluna(1ª coluna)2 x 2ª
coluna
1 2 2 2
2 5 10 20
3 8 24 72
4 6 24 96
5 3 15 75
6 1 6 36
Total 25 81 301
Para calcular a variância de dados agrupados sem intervalo de classes, usamos a seguinte
fórmula:
2
2
42
32
scolunacoluna
a
a
coluna
coluna
a
a= −
s
s
s
s
²
².
² , ,
² ,
= −
= −
= −
=
30125
8125
30125
6 561625
12 04 10 50
1 54
2
A variância vale 1,54.
444
e-Tec Brasil – Estatística Aplicada
445
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
s
s
s
=
==
2
479 33
21 89
s,
,
ATIVIDADE 3
Preenchendo a tabela auxiliar, encontramos:
Classe
Questões corretas
(intervalo de classe)
N° de alunos (freqüência)
Ponto médio
Freqüência × Ponto médio
Freqüência × Ponto médio²
1 30 50 2 40 80 3.200
2 50 70 8 60 480 28.800
3 70 90 12 80 960 76.800
4 90 110 10 100 1.000 100.000
5 110 130 5 120 600 72.000
Total 37 400 3.120 280.800
Para encontrar o desvio padrão, primeiro temos que calcular a variância. Para calcular a
variância de dados agrupados em intervalo de classes, usamos a seguinte fórmula:
2
2
63
53
scolunacoluna
a
a
coluna
coluna
a
a= −
s². .
= −
280 80037
3 12037
2
s2= 7.589,19-(84,32) 2
s2= 7.589,19-7.109,86
s2= 479,33
Portanto, o desvio padrão é:
σ
σσ
444
e-Tec Brasil – Estatística Aplicada
445
Au
la 15 • Ap
ren
de
nd
o so
bre
me
did
as de
disp
ersão
ATIVIDADE 4
Como foram dados os valores da média e do desvio padrão, podemos calcular o coeficiente
de variação em cada caso e comparar os valores. Quanto maior o coeficiente de variação,
mais disperso é o conjunto em relação à média.
Coeficiente de variação (CV) da disciplina Biossegurança:
CVdesvio
CV
CV
= ×
= ×
=
_
,,
, %
100
0 807 8
100
10 2
Coeficiente de variação (CV) da disciplina Psicologia do Trabalho:
CVdesvio
CV
CV
= ×
= ×
=
_
,,
, %
100
0 767 3
100
10 4
A disciplina que apresentou a maior dispersão foi aquela com o maior coeficiente de
variação: Psicologia do Trabalho.
ATIVIDADE 5
O grupo mais homogêneo é o que apresenta os dados menos dispersos em relação à média;
portanto, é o que apresenta o menor coeficiente de variação.
Coeficiente de variação (CV) da turma de Mecânica:
CVdesvio
CV
CV
CV
= ×
= ×
=
=
_
,,
,
, %
100
5 97160 6
100
0 0372
3 72
padrãomédia
padrãomédia
padrãomédia
446
e-Tec Brasil – Estatística Aplicada
Coeficiente de variação (CV) da turma de Eletrotécnica:
CVdesvio
CV
CV
CV
= ×
= ×
=
=
_
,,
,
, %
100
6 01161 9
100
0 0371
3 71
A turma mais homogênea, ou seja, que apresentou a menor dispersão, foi aquela com o
menor coeficiente de variação: Eletrotécnica.
padrãomédia
REFERÊNCIAS BIBLIOGRÁFICAS
BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística básica. 5. ed.
São Paulo: Saraiva, 2003.
MAGALHÃES, Marcos N.; LIMA, Antonio C. P. Noções de probabilidade
e estatística. 6. ed. São Paulo: EDUSP, 2005.
MARTINS, Gilberto A. Estatística geral e aplicada. 3. ed. São Paulo:
Atlas, 2005.
MILONE, Giuseppe. Estatística geral e aplicada. São Paulo: Thomson
Learning, 2003.