43
Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio Profs. Alexandre Lima www.pontodosconcursos.com.br 1 Estatística Aula 02 Estatística Descritiva – Medidas de Dispersão 1 Medidas de Dispersão .......................................................................................................... 2 1.1 Variância ............................................................................................................................ 2 1.2 Desvio Padrão .................................................................................................................. 7 1.3 Coeficiente de Variação ................................................................................................ 7 1.4 Desvio Interquartílico.................................................................................................... 8 1.5 Diagrama de Caixa ......................................................................................................... 8 2 Resumo.................................................................................................................................... 12 3 Exercícios de Fixação ......................................................................................................... 13 4 Gabarito .................................................................................................................................. 21 5 Resolução dos Exercícios de Fixação ........................................................................... 22

Alexandre Lima - Medidas de Dispersão

Embed Size (px)

Citation preview

Page 1: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 1

Estatística Aula 02

Estatística Descritiva – Medidas de Dispersão

1 Medidas de Dispersão .......................................................................................................... 21.1 Variância ............................................................................................................................ 21.2 Desvio Padrão .................................................................................................................. 71.3 Coeficiente de Variação ................................................................................................ 71.4 Desvio Interquartílico .................................................................................................... 81.5 Diagrama de Caixa ......................................................................................................... 8

2 Resumo.................................................................................................................................... 123 Exercícios de Fixação ......................................................................................................... 134 Gabarito .................................................................................................................................. 215 Resolução dos Exercícios de Fixação ........................................................................... 22

Page 2: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 2

1 Medidas de Dispersão

Pense na seguinte situação: uma pessoa faz quatro refeições por dia, enquanto que outra não faz nenhuma refeição por dia. Na média, ambas fazem duas refeições por dia. Isto quer dizer que os dois indivíduos estão bem alimentados? A resposta óbvia é não. É para isso que servem as medidas de dispersão, isto é, medidas de como os dados estão agrupados: mais ou menos próximos entre si (mais ou menos dispersos).

As medidas de dispersão indicam o quanto os dados se apresentam dispersos em torno da região central. Desta forma, caracterizam o grau de variabilidade existente nos dados. As seguintes medidas de dispersão nos interessam: a variância, o desvio padrão, o coeficiente de variação e o desvio interquartílico.

1.1 Variância

A variância de um conjunto de observações }x,...,x,x{ n21 pode ser calculada pela fórmula

(1) ∑=

−=n

1i

2i

2x )xx(

n1s

em que 2xs denota a variância e x representa a média aritmética. Se os valores

distintos k21 x,...,x,x ocorrerem com as frequências k21 f,...,f,f (∑=

=k

1iif n ),

respectivamente, a variância será dada por (*)

(2) ∑=

−=k

1i

2ii

2x )xx(f

n1s .

(*) Em (1) e (2), consideramos que os dados se referem a uma população finita. Caso os dados estejam associados a uma amostra, o fator n (= Σfi) que aparece no denominador do lado direito de (1) e (2) deve ser substituído por (n–1):

∑=

−−

=n

1i

2i

2x )xx(

1n1s

A justificativa para o uso do fator (n–1) na fórmula da variância amostraldada acima foge ao escopo deste curso. Para satisfazer a sua curiosidade, posso apenas mencionar que o uso do fator (n–1) resolve um problema de estatística indutiva (e paro por aqui!). É importante saber que a diferença entre as duas definições torna-se desprezível para grandes valores de n.

A variância tem, entre outras, as seguintes propriedades:

Page 3: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 3

a) multiplicando todos os valores de uma variável por uma constante, a variância do conjunto fica multiplicada pelo quadrado dessa constante. Seja x a variável de interesse, c um valor constante e y = cx. Então 2

x22

y scs = .

b) somando ou subtraindo uma constante a todos os valores de uma variável, a variância não se altera. Seja x a variável de interesse, c um valor constante e y = x + c. Então 2

xy2s s= .

Note-se que (1) pode ser reescrita na forma

2

i

2i

2

ii

i

2i

2x xx

n1x

n1x

n1s −⎟

⎞⎜⎝

⎛=⎟

⎞⎜⎝

⎛−⎟

⎞⎜⎝

⎛= ∑∑∑ ,

ou seja, como a diferença entre a média aritmética dos quadrados dos valores e o quadrado da média aritmética dos valores:

⇒ VARIÂNCIA = Média dos Quadrados – Quadrado da Média.

Demonstra-se que a variância amostral também é dada por

2n

1i

2i

2x x

1nnx

1n1s ⎟

⎠⎞

⎜⎝⎛

−−

−= ∑

=

Exemplo. Considere o conjunto de dados {2, 5, 8, 11, 14}. Então a variância desse conjunto é

A) 8

B) 20,25

C) 18

D) 24

E) 22

Resolução

A média do conjunto é

85

1411852x =++++

=

e a variância

.185

)814()811()88()85()82(n

)xx(s

222222i2

x =−+−+−+−+−

=−

= ∑

Page 4: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 4

Também podemos usar a fórmula "maceteada" da variância:

Variância = Média dos Quadrados – Quadrado da Média = 2

ii x2x

n1

−⎞⎟⎠

⎜⎝

⎛ ∑

Sequência de cálculos:

1) Média dos quadrados:

825

4105

1411852xn1 22222

i

2i ==

++++=∑ .

2) Quadrado da média:

648xxn1 22

2

ii ===⎟⎠

⎞⎜⎝

⎛ ∑ .

Então,

3) 186482s2x =−= (mesmo resultado!).

GABARITO: C

Variância Combinada

Considere o conjunto de dados A com NA elementos, média A e variância 2As e

o conjunto B com NB elementos, média B e variância 2Bs . Pode-se demonstrar

que a variância da população conjunta A+B, também denominada variância combinada ou global, é dada por

2

BABA

2

BA

22

BA NNBA

NNB

NNA

s ⎥⎦

⎤⎢⎣

++

−+

++

= ∑ ∑∑∑+ .

Fazendo N = NA + NB, obtemos

2222

BA NBA

NB

NA

s ⎟⎟⎠

⎞⎜⎜⎝

⎛ +−+= ∑∑∑∑

+ .

Já caiu em prova! (Adm. Jr./REFAP/2007/Cesgranrio). O setor de recursos humanos de uma empresa tem o hábito de divulgar separadamente a média e a variância das notas das avaliações dos funcionários do sexo feminino e do masculino. Na última avaliação, os resultados obtidos foram:

Page 5: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 5

Feminino Masculino Número de funcionários 20 30

Média 6 7 Variância 3,4 4

A média e a variância das notas dos funcionários dessa empresa, respectivamente, valem:

A) 6,5 e 3,7

B) 6,6 e 3,4

C) 6,6 e 4,0

D) 7,5 e 3,7

E) 13,0 e 7,5

Resolução

Dados: NA = 20, 6A = e 4,3s2A = (conjunto feminino); NB = 30, 7B = e 0,4s2

B = (conjunto masculino).

A média global ou média das médias é dada pela média ponderada das médias dos conjuntos:

.6,63020

730620NN

BNANXBA

BABA =

+×+×

=++

=+

O resultado acima já nos permite eliminar as opções A, D e E. Restaram as alternativas B e C.

A variância combinada é dada por

2222

BA NBA

NB

NA

s ⎟⎟⎠

⎞⎜⎜⎝

⎛ +−+= ∑∑∑∑

+ .

Calcularemos a variância combinada se soubermos os valores das somatórias A∑ (soma de A), B∑ (soma de B), A2∑ (soma dos quadrados de A) e B2∑

(soma dos quadrados de B).

A média do conjunto A é 6 ⇒ 120A620

A=⇒= ∑∑ (soma de A = 120).

A média do conjunto B é 7 ⇒ 210B730

B=⇒= ∑∑ (soma de B = 210).

A variância de A é 3,4. Então,

Page 6: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 6

4,3920A

4,3620A

4,3A20A

4,3N

AN

As

22

22

22

AA

22A =⇒=−⇒=−⇒⎟ =⎟

⎞⎜⎜⎝

⎛−= ∑∑∑∑∑

7884,3920A2 =×=⇒ ∑ (soma dos quadrados de A = 788).

A variância de B é 4,0. Logo,

0,5330

B0,47

30B

0,4B30

B0,4

NB

NB

s2

22

222

BB

22B =⇒=−⇒=−⇒⎟ =⎟

⎞⎜⎜⎝

⎛−= ∑∑∑∑∑

590.15330B2 =×=⇒ ∑ (soma dos quadrados de B = 1.590).

Finalmente, temos que

222222

2BA 6,656,47

50330

50378.2

50210120

50590.1

50788

NBA

NB

NA

s −=⎟⎠⎞

⎜⎝⎛−=⎟

⎠⎞

⎜⎝⎛ +

−+⎟ =⎟⎠

⎞⎜⎜⎝

⎛ +−+= ∑∑∑∑

+

0,456,4356,47s2BA =−=+ ⇒ variância combinada = 4,0.

GABARITO: C

Nota: se as médias dos conjuntos A e B forem iguais, ou seja, se BA = , a variância combinada pode ser calculada por meio da fórmula simplificada

NsNsN

NNsNsNs

2BB

2AA

BA

2BB

2AA2

BA+

=++

=+ ,

em que N = NA + NB. Repare que trata-se de uma média ponderada das variâncias individuais.

Atenção: a fórmula acima é um caso particular da fórmula anterior da variância combinada. Você só poderá aplicá-la quando as médias dos conjuntos A e B forem iguais!

Exemplo. Sejam os conjuntos de números {2, 5, 8, 11, 14} e {2, 8, 14}, Assinale a opção com a variância dos conjuntos combinados ou reunidos.

A) 8

B) 20,25

C) 18

D) 24

E) 22

Resolução

Page 7: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 7

Temos a série estatística A = {2, 5, 8, 11, 14} com média

8540

51411852A ==

++++=

e a série B = {2, 8, 14} com média

8324

31482B ==

++= .

Como as médias são iguais, podemos aplicar a fórmula simplificada

NsNsNs

2BB

2AA2

BA+

=+ .

Variância do 1º conjunto:

.185

)814()811()88()85()82(N

)AA(s

22222

A

22A =

−+−+−+−+−=

−= ∑

Variância do 2º conjunto: .243

)814()88()82(N

)BB(s

222

B

22B =

−+−+−=

−= ∑

Variância combinada: .25,2035

243185s2BA =

+×+×

=+

GABARITO: B

1.2 Desvio Padrão

O desvio padrão de um conjunto de dados é a raiz quadrada positiva da variância, ou seja,

(3) 2xxs s+= .

O desvio padrão está na mesma unidade da variável, sendo, por isso, de maior interesse na prática.

Exemplo. Determine o desvio padrão do conjunto 2, 5, 8, 11, 14.

Vimos que esse conjunto possui variância igual a 18. Logo, 24,418 ≈=xs .

1.3 Coeficiente de Variação

Page 8: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 8

O coeficiente de variação é definido como a razão entre o desvio padrão e a média, sendo frequentemente expresso em porcentagem:

(4) xs)x(cv x= .

Esta medida caracteriza a dispersão dos dados em termos relativos a seu valor médio.

Exemplo. Determine o coeficiente de variação do conjunto 2, 5, 8, 11, 14.

O conjunto tem média 8 e desvio padrão 4,24. Portanto, %5353,0824,4)x(cv =≈= .

1.4 Desvio Interquartílico

O desvio interquartílico, definido por

(5) isQ QQd −= ,

em que Qd denota o desvio interquartílico, sQ é o quartil superior e iQ o

quartil inferior, pode ser usado como uma medida de dispersão. Em distribuições mais dispersas, os valores dos quartis ficam mais distantes. Em distribuições simétricas, a distância entre o quartil inferior e a mediana é igual à distância entre a mediana e o quartil superior, enquanto que em distribuições assimétricas essas distâncias são diferentes.

Exemplo. O primeiro e o terceiro quartis da distribuição das alturas dos estudantes da Universidade de São Paulo são 165,56 cm e 178,59 cm, respectivamente. Calcule o desvio interquartílico dessa distribuição.

03,1356,16559,178QQd isQ =−=−= cm.

1.5 Diagrama de Caixa

Um diagrama de caixa ou box plot ou “caixa-de-bigodes” é um retângulo que representa o desvio interquartílico (IQR) (é a estatística Qd definida

por (5)). Para construir esse diagrama (veja a próxima figura), consideramos um retângulo onde estão representados a mediana, o primeiro quartil (Q1) e o terceiro quartil (Q3). A partir do retângulo, para cima, segue uma linha até o ponto mais remoto que não pode exceder LS = Q3 + 1,5.IQR, chamado limite superior. De modo análogo, a partir do retângulo, para baixo, segue uma linha até o ponto mais remoto que não seja menor que LS = Q1 –1,5.IQR, chamado limite inferior. Os valores compreendidos entre esses dois limites são chamandos valores adjacentes. As observações que estiverem acima do limite superior ou abaixo do limite inferior serão denominadas pontos

Page 9: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 9

exteriores. Essas observações são destoantes das demais e podem ou não ser o que chamamos de outliers ou valores atípicos (*)1. Um outlier pode ser produto de um erro de observação ou de arredondamento. Contudo, as denominações pontos exteriores e outliers são frequentemente usadas com o mesmo significado por alguns autores2: observações fora de lugar, discrepantes ou atípicas.

(*) A média aritmética é sensível a outliers. Um único valor “ruim” do conjunto de dados pode distorcer a média, ou seja, pode mover a média para longe do centro da distribuição de frequências. As médias geométrica e harmônica, assim como a aritmética, também não são robustas a outliers.

O box plot nos dá uma noção da posição, dispersão, assimetria, caudas e dados discrepantes da distribuição. A posição central é dada pela mediana e a dispersão por IQR. As posições relativas de Q1, Q2 e Q3 nos dão uma idéia da assimetria da distribuição. Os comprimentos das caudas são dados pelas linhas que vão do retângulo aos valores remotos e pelos valores atípicos. Os comprimentos das caudas são dados pelas linhas que vão do retângulo aos valores remotos e pelos valores atípicos.

Exemplo. Considere um conjunto de dados com os seguintes percentis:

0% 25% 50% 75% 100%

1 BUSSAB, Wilton de O.; MORETTIN, Pedro Alberto. Estatística Básica. São Paulo: Ed. Saraiva, 2010. 2 MONTGOMERY, Douglas C.; RUNGER, George C. Estatística Aplicada e Probabilidade para Engenheiros. Rio de Janeiro: LTC, 2008.

Page 10: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 10

1,7524 4,6901 5,7004 6,1768 7,3658

A próxima figura é um box plot do conjunto de dados que gerou a tabela de percentis acima. A cauda inferior é longa e isto indica que a distribuição é assimétrica. Note também a presença de outliers na parte inferior do box plot(são os pontos vermelhos).

1

2

3

4

5

6

7

Val

ores

A figura abaixo mostra o histograma associado ao box plot do exemplo.

1 2 3 4 5 6 7 80

10

20

30

40

50

60

70

80

90

_______________________________________________________

A próxima figura reforça a relação do box plot com o histograma. A distribuição da esquerda é simétrica, enquanto que a da direita é assimétrica.

Page 11: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 11

Os box plots da figura abaixo mostram a comparação dos tamanhos das pétalas em duas amostras das espécies de flor-de-lis versicolor e virginica3.

versicolor virginica

3

3.5

4

4.5

5

5.5

6

6.5

7

Val

ores

A existência de um outlier nos dados da espécie versicolor é indicada pelo ponto vermelho na parte inferior esquerda da figura.

3 Conjunto de dados de Fisher.

Page 12: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 12

2 Resumo

- Variância = Média dos Quadrados – Quadrado da Média = 2

ii x2x

n1

−⎟⎠

⎞⎜⎝

⎛ ∑

- Variância amostral: 2n

1i

2i

n

1i

2i

2x x

1nnx

1n1)xx(

1n1s ⎟

⎠⎞

⎜⎝⎛

−−

−=−

−= ∑∑

==

- Variância combinada dos conjuntos A e B: 222

2BA N

BANB

NA

s ⎟⎟⎠

⎞⎜⎜⎝

⎛ +−+= ∑∑∑∑

+

- Desvio Padrão = Raiz Quadrada positiva da Variância.

- Coeficiente de variação: xs)x(cv x= .

- Desvio interquartílico: isQ QQd −=

- Um diagrama de caixa ou box-plot é um retângulo que representa o desvio interquartílico. Esse retângulo indica, portanto, a faixa dos 50% dos valores mais típicos da distribuição. O retângulo é dividido no valor correspondente à mediana; assim, ele indica o quartil inferior, a mediana e o quartil superior.

Page 13: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 13

3 Exercícios de Fixação

Classificação mínimo 1º quartil mediana média 3º quartil máximo variância

A 20 25 27,5 30 32,5 50 49

B 18 23 32 33 42 52 100

A ou B x y z 31 w u v

(Papiloscopista PF/2004/Cespe-UnB) De acordo com um levantamento estatístico, a média das idades de um grupo de presidiários é igual a 31 anos de idade. Nesse levantamento, os presidiários foram classificados como A ou B, dependendo da sua condição psicossocial. Constatou-se que a média das idades dos presidiários classificados como A é menor que a média das idades dos presidiários classificados como B. A tabela acima apresenta algumas medidas estatísticas obtidas por meio desse levantamento.

A partir das informações acima, julgue os itens que se seguem.

1. O valor de v está entre 65 e 75.

2. valores de x e u são, respectivamente, iguais a 19 e 51 anos de idade.

3. (ICMS-RJ/2009/FGV) Para comparar as rendas de dois grupos de pessoas, A e B, foram preparados diagramas de caixas (box-plots) com os valores observados dos salários, representados na figura a seguir:

A respeito desses diagramas, considere as seguintes afirmativas:

I. O salário médio dos dois grupos é o mesmo.

II. A distribuição dos salários no grupo A é assimétrica à direita.

III. Há mais pessoas no grupo A do que no grupo B.

Assinale:

A) se somente a afirmativa I for verdadeira.

Page 14: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 14

B) se somente a afirmativa II for verdadeira.

C) se somente a afirmativa III for verdadeira.

D) se somente as afirmativas I e II forem verdadeiras.

E) se somente as afirmativas II e III forem verdadeiras.

4. (ICMS-RJ/2008/FGV) Uma companhia utiliza um sistema de avaliação de desempenho de seus funcionários por meio de dois indicadores de performance: Qualidade das tarefas e a Tempestividade com que as tarefas são realizadas.

Os funcionários receberam, na última avaliação, as medidas indicadas na tabela a seguir:

Medidas

Indicador

Qualidade Tempestividade

Média 50 25

Desvio-Padrão 10,0 6,0

Coeficiente de

Variação (%) 20 24

Com base na tabela, é correto afirmar que:

A) a média aritmética não é uma boa medida para representar a performancedos funcionários em face do elevado nível de dispersão das avaliações.

B) as avaliações da Qualidade foram mais dispersas do que as avaliações da Tempestividade.

C) as avaliações da Qualidade foram mais homogêneas do que as da Tempestividade.

D)os funcionários demoram mais para realizar as tarefas, mas a qualidade das tarefas, mas a qualidade das tarefas é melhor.

E) nada se pode afirmar sem o conhecimento do tamanho da amostra.

5. (ICMS-RJ/2007/FGV) Considere as informações contidas no Box Plotabaixo, referente aos salários dos engenheiros de uma empresa, por sexo.

Page 15: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 15

É correto afirmar que:

A) o salário médio dos homens é igual ao das mulheres.

B) a distribuição dos salários das mulheres é assimétrica negativa.

C) o desvio interquartílico dos salários das mulheres é maior do que o dos homens.

D) a distribuição dos salários dos homens é atípica.

E) o salário mediano das mulheres é superior ao dos homens.

6. (AFRF/2001/ESAF) Numa amostra de tamanho 20 de uma população de contas a receber, representadas genericamente por X, foram determinadas a média amostral M = 100 e o desvio-padrão s = 13 da variável transformada (X � 200)/5. Assinale a opção que dá o coeficiente de variação amostral de X:

A) 3,0%

B) 9,3%

C) 17,0%

D) 17,3%

E) 10,0%

(AFRF/2002/ESAF) Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não

Page 16: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 16

existem observações coincidentes com os extremos das classes. As questões de 7 a 10 referem-se a esses ensaios.

Classes P (%)70-90 5 90-110 15 110-130 40 130-150 70 150-170 85 170-190 95 190-210 100

7. Assinale a opção que dá o valor médio amostral de X.

A) 140,10

B) 115,50

C) 120,00

D) 140,00

E) 138,00

8. Assinale a opção que corresponde à estimativa do quinto decil da distribuição de X.

A) 138,00

B) 140,00

C) 136,67

D) 139,01

E) 140,66

9. Assinale a opção que corresponde à estimativa da freqüência relativa de observações de X menores ou iguais a 145.

A) 62,5%

B) 70,0%

C) 50,0%

D) 45,0%

E) 53,4%

10. Considere a transformação Z=(X-140)/10. Para o atributo Z encontrou-se

∑=

=7

1i

2ii 680.1fZ , onde fi é a freqüência simples da classe i e Zi o ponto médio de

classe transformado. Assinale a opção que dá a variância amostral do atributo X.

Page 17: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 17

A) 720,00

B) 840,20

C) 900,10

D) 1200,15

E) 560,30

11. (Analista do BACEN/2006/FCC) A média aritmética dos valores das vendas diárias realizadas pelas 50 empresas do Setor A é de R$ 1.000,00, com desvio padrão de R$ 100,00. Sabe-se ainda que a média aritmética dos valores das vendas diárias realizadas pelas 200 empresas do Setor B é de R$ 2.000,00, com desvio padrão de R$ 200,00. A variância em (R$)2 dos valores das vendas diárias realizadas pelos dois setores reunidos é

A) 34.000,00

B) 50.000,00

C) 194.000,00

D) 207.500,00

E) 288.000,00

12. (ICMS-RJ/2010/FGV) A média, a mediana e a variância das idades de um grupo de vinte pessoas são, hoje, iguais, respectivamente, a 34, 35 e 24. Daqui a dez anos, os valores da média, da mediana e da variância das idades dessas pessoas serão, respectivamente:

A) 44, 35 e 34

B) 44, 45 e 12

C) 44, 45 e 24

D) 34, 35 e 12

E) 44, 45 e 124

(Analista de Estatística/Perito/MPU/2010/CESPE) Considere que um perito tenha efetuado um estudo acerca do tempo gasto — X —, em meses, por empresas notificadas para quitar suas pendências com a Previdência Social. Uma amostra de 35 empresas notificadas com pendências foi selecionada de um banco de dados da Previdência. A partir dessa amostra, o perito fez uma análise exploratória da variável X, cujos resultados são apresentados a seguir.

Estatísticas Descritivas:

tempo mínimo = 2 meses tempo máximo = 128 meses

Page 18: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 18

∑=

=35

1ii ;1027x ∑

=

=35

1i

2i ;66317x 11,30135x

351

235

1ii =⎟⎠

⎞⎜⎝

⎛∑=

Nesse estudo, o perito efetuou avaliações acerca do número de irregularidades – Y – que geraram pendências em função do porte das empresas: com menos de 20 empregados e com 20 ou mais empregados. Os resultados foram os seguintes.

tamanho da empresa y s n < 20 empregados 6,8 1,7 15 ≥ 20 empregados 2,6 1,3 20

Com base nessas informações julgue os itens de 13 a 18.

13. O diagrama de caixas, conhecido como boxplot, indica que a distribuição de X é assimétrica. Portanto, o número de observações acima do segundo quartil (Q2) foi proporcionalmente superior ao número de observações abaixo de Q2.

14. O tempo mediano da variável X foi aproximadamente igual a 29,34 meses.

Page 19: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 19

15. No diagrama de caixas, quatro observações foram identificadas como valores atípicos por estarem fora do intervalo [0; 77,25].

16. O diagrama apresentado a seguir é o resumo dos 5 números para a distribuição de X.

17 6 34,5 2 128

17. Nessa situação, a variabilidade do número de irregularidades nas empresas com menos de 20 empregados corresponde à metade da variabilidade do número de irregularidades nas empresas com 20 ou mais empregados.

18. O desvio padrão amostral de X foi inferior a 31 meses.

(Analista Judiciário/TST/2007/Cespe-UnB/Adaptada) Considere que, em um ambiente de trabalho industrial, as seguintes medições acerca da poluição do ar tenham sido observadas: 1, 6, 4, 3, 2, 3, 1, 5, 1, 4. Nessas situação, julgue os itens que se seguem.

19. A mediana da amostra é igual a 2,5.

20. As médias harmônica e geométrica são ambas inferiores a 3.

21. O terceiro quartil é igual a 3.

22. A variância amostral é superior a 2,8.

Variável X Frequência relativa

0 0,10

1 0,20

2 0,30

3 0,40

(SEAD-CPC/2007/Cespe-UnB/Adaptada) Considerando a tabela acima, que apresenta as freqüências relativas de uma variável X, relativa a uma contagem, julgue os itens a seguir.

23. A média de X é inferior a 1,5.

24. O desvio-padrão de X é inferior a 1,5.

25. A moda e a mediana de X são iguais a 3.

Page 20: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 20

26. O coeficiente de variação de X é superior a 1.

Page 21: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 21

4 Gabarito

1 – C 2 – E 3 – B 4 – C 5 – C 6 – B 7 – E 8 – C 9 – A 10 – B 11 – C 12 – C 13 – E 14 – E 15 – C 16 – C 17 – C 18 – E 19 – E 20 – C 21 – E 22 – C 23 – E 24 – C 25 – E 26 – E

Page 22: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 22

5 Resolução dos Exercícios de Fixação

Classificação mínimo 1º quartil mediana média 3º quartil máximo variância

A 20 25 27,5 30 32,5 50 49

B 18 23 32 33 42 52 100

A ou B x y z 31 w u v

(Papiloscopista PF/2004/Cespe-UnB) De acordo com um levantamento estatístico, a média das idades de um grupo de presidiários é igual a 31 anos de idade. Nesse levantamento, os presidiários foram classificados como A ou B, dependendo da sua condição psicossocial. Constatou-se que a média das idades dos presidiários classificados como A é menor que a média das idades dos presidiários classificados como B. A tabela acima apresenta algumas medidas estatísticas obtidas por meio desse levantamento.

A partir das informações acima, julgue os itens que se seguem.

1. O valor de v está entre 65 e 75.

Resolução

Dados: 30A = , 33B = e 31X = (média das médias)

BA

BA

nnBnAnX

++

= ⇒ BA

BA

nn33n30n31

++

= ⇒ BA n2n =

A variância combinada v é dada por

2

BABA

2

BA

22

BA nnBA

nnB

nnA

Sv ⎥⎦

⎤⎢⎣

++

−+

++

== ∑∑∑∑+

30A = ⇒ 30n

A

A

=∑ ⇒ BA n60n30A ==∑

33B = ⇒ 33n

B

B

=∑ ⇒ Bn33B =∑

49S2A = ⇒ 49A

nA 2

A

2

=−∑ ⇒ 9493049n

A 2

A

2

=+=∑ ⇒ BA2 n1898n949A ==∑

Page 23: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 23

100S2B = ⇒ 100B

nB 2

B

2

=−∑ ⇒ 118933100n

B 2

B

2

=+=∑ ⇒ B2 n1189B =∑

6896110293133,39667,632n3

n33n60n3

n1189n3

n1898Sv 22

B

BB

B

B

B

B2BA =−=−+=⎥

⎤⎢⎣

⎡ +−+== +

Então é correto afirmar que 65 < v = 68 < 75.

GABARITO: C

2. valores de x e u são, respectivamente, iguais a 19 e 51 anos de idade.

Resolução

O levantamento estatístico não deixa dúvida de que o valor mínimo de A ou B é x = 18 e o valor máximo de A ou B é u = 52. Item errado.

GABARITO: E

3. (ICMS-RJ/2009/FGV) Para comparar as rendas de dois grupos de pessoas, A e B, foram preparados diagramas de caixas (box-plots) com os valores observados dos salários, representados na figura a seguir:

A respeito desses diagramas, considere as seguintes afirmativas:

IV. O salário médio dos dois grupos é o mesmo.

V. A distribuição dos salários no grupo A é assimétrica à direita.

VI. Há mais pessoas no grupo A do que no grupo B.

Assinale:

A) se somente a afirmativa I for verdadeira.

B) se somente a afirmativa II for verdadeira.

C) se somente a afirmativa III for verdadeira.

D) se somente as afirmativas I e II forem verdadeiras.

Page 24: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 24

E) se somente as afirmativas II e III forem verdadeiras.

Resolução

ANÁLISE DAS AFIRMATIVAS

I- Os diagramas de caixas indicam que as medianas dois grupos A e B são iguais e não as suas respectivas médias ⇒ FALSA.

II- A distribuição dos salários no grupo A é assimétrica à direita porque a distância entre o terceiro quartil (Q3) e a mediana (md), ou seja, Q3 � md, é maior do que a distância entre a mediana e o primeiro quartil, dada por md � Q1. ⇒ VERDADEIRA.

III- O número de pessoas nos dois grupos é igual, haja vista que as distâncias entre os extremos superior e inferior nas distribuições dois dois grupos é aproximadamente 2.500 (3.100 � 600 = 2.500 para o grupo A e 2.900 � 400). ⇒ FALSA.

GABARITO: B

4. (ICMS-RJ/2008/FGV) Uma companhia utiliza um sistema de avaliação de desempenho de seus funcionários por meio de dois indicadores de performance: Qualidade das tarefas e a Tempestividade com que as tarefas são realizadas.

Os funcionários receberam, na última avaliação, as medidas indicadas na tabela a seguir:

Medidas

Indicador

Qualidade Tempestividade

Média 50 25

Desvio-Padrão 10,0 6,0

Coeficiente de

Variação (%) 20 24

Com base na tabela, é correto afirmar que:

A) a média aritmética não é uma boa medida para representar a performancedos funcionários em face do elevado nível de dispersão das avaliações.

B) as avaliações da Qualidade foram mais dispersas do que as avaliações da Tempestividade.

Page 25: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 25

C) as avaliações da Qualidade foram mais homogêneas do que as da Tempestividade.

D)os funcionários demoram mais para realizar as tarefas, mas a qualidade das tarefas, mas a qualidade das tarefas é melhor.

E) nada se pode afirmar sem o conhecimento do tamanho da amostra.

Resolução

Análise das afirmativas:

A) A média aritmética é uma medida de posição de uma distribuição de frequências. Logo, é uma medida válida (“boa”) para caracterizar o desempenho dos funcionários. Além disso, não se pode afirmar que a média não seja uma medida “boa” devido ao elevado nível de dispersão da distribuição. Posição e dispersão são características distintas de uma distribuição de frequências ⇒ ERRADA.

B) As medidas de coeficiente de variação ( x/s)x(cv x= ) dizem que é o contrário, ou seja, as avaliações da Tempestividade foram mais dispersas do que as avaliações da Qualidade, pois )qualidade(cv2024)dadetempestivi(cv =>= ⇒ ERRADA.

C) As avaliações da Qualidade foram mais homogêneas, ou seja, menos dispersas, do que as da Tempestividade, haja vista que

)dadetempestivi(cv2420)qualidade(cv =<= ⇒ CERTA.

D) Qualidade e Tempestividade são variáveis distintas; logo, essa comparação não faz sentido (não podemos comparar “banana” com “laranja”). A qualidade das tarefas é melhor em relação a quê? Os funcionários demoram mais para realizar as tarefas em relação a qual métrica de comparação? ⇒ ERRADA.

E) Está implícito que a companhia avaliou todos os seus funcionários. Logo, as medidas referem-se à população dos funcionários. As medidas tabeladas não são estimativas de parâmetros da população, mas sim os verdadeiros valores de média, desvio-padrão e coeficiente de variação das variáveis Qualidade e Tempestividade ⇒ ERRADA.

GABARITO: C

5. (ICMS-RJ/2007/FGV) Considere as informações contidas no Box Plotabaixo, referente aos salários dos engenheiros de uma empresa, por sexo.

Page 26: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 26

É correto afirmar que:

A) o salário médio dos homens é igual ao das mulheres.

B) a distribuição dos salários das mulheres é assimétrica negativa.

C) o desvio interquartílico dos salários das mulheres é maior do que o dos homens.

D) a distribuição dos salários dos homens é atípica.

E) o salário mediano das mulheres é superior ao dos homens.

Resolução

Análise das afirmativas:

A) Os diagramas de caixa indicam que as medianas dos salários, e não os salários médios, são iguais, com um valor aproximado de R$ 3.700 ⇒ERRADA.

B) A distribuição dos salários das mulheres é assimétrica positiva, pois é alongada à direita (a distância entre o quartil superior e a mediana é maior do que distância entre o quartil inferior e a mediana) ⇒ ERRADA.

C) O desvio interquartílico dos salários das mulheres é aproximadamente igual a 4.400 � 3.400 = 1.000. O desvio interquartílico dos salários dos homens é aproximadamente igual a 3.900 � 3.300 = 600. Logo a afirmativa está CERTA.

D) O enunciado não fornece dados para se fazer este tipo de conclusão. Qual seria a distribuição dos salários dos homens típica? ⇒ ERRADA.

Page 27: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 27

E) O salário mediano das mulheres é igual ao dos homens ⇒ ERRADA.

GABARITO: C

6. (AFRF/2001/ESAF) Numa amostra de tamanho 20 de uma população de contas a receber, representadas genericamente por X, foram determinadas a média amostral M = 100 e o desvio-padrão s = 13 da variável transformada (X � 200)/5. Assinale a opção que dá o coeficiente de variação amostral de X:

A) 3,0%

B) 9,3%

C) 17,0%

D) 17,3%

E) 10,0%

Resolução

Y = (X – 200)/5 => X = 5Y + 200

M = Y = 100 Logo, X = 5 Y + 200 = 5 x 100 + 200 = 700

s = sy = 13

Logo, sx = 5sy = 5 x 13 = 65

CVx = sx/ X = 65/700 = 0,093 = 9,3%

GABARITO: B

Page 28: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 28

(AFRF/2002/ESAF) Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. As questões de 7 a 10 referem-se a esses ensaios.

Classes P (%)70-90 5 90-110 15 110-130 40 130-150 70 150-170 85 170-190 95 190-210 100

7. Assinale a opção que dá o valor médio amostral de X.

A) 140,10

B) 115,50

C) 120,00

D) 140,00

E) 138,00

Resolução

Se k valores distintos observados k21 x,...,x,x ocorrerem com as freqüências relativas k21 p,...,p,p , respectivamente, a média será

∑=

=k

1jjjpxx

em que pj denota a j-ésima frequência relativa.

Quando os dados são apresentados em uma distribuição de freqüências, todos os valores incluídos num certo intervalo de classe são considerados coincidentes com o ponto médio do intervalo. As fórmula acima será válida para esses dados agrupados quando se interpretar jx como o ponto médio e jp

como a frequência relativa

Page 29: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 29

Classe (limites reais)

Pj pi xi xjpj

70 � 90 0,05 0,05 (90+70)/2=80 4 90 � 110 0,15 0,15�0,05=0,10 (110+90)/2=100 10 110 � 130 0,40 0,40�0,15=0,25 (130+110)/2=120 30 130 � 150 0,70 0,70�0,40=0,30 (150+130)/2=140 42 150 � 170 0,85 0,85�0,70=0,15 (170+150)/2=160 24 170 � 190 0,95 0,95�0,85=0,10 (190+170)/2=180 18 190 � 210 1,00 1,00�0,95=0,05 (210+190)/2=200 10

Soma 1,00 138

Logo, 138pxxk

1jjj == ∑

=

, conforme a tabela acima.

GABARITO: E

8. Assinale a opção que corresponde à estimativa do quinto decil da distribuição de X.

A) 138,00

B) 140,00

C) 136,67

D) 139,01

E) 140,66

Resolução

A mediana é o quinto decil. A mediana (md) de uma distribuição em classes de freqüências é dada pela expressão

mdmd

ai h

fF)2/n(

Lmd ×−

+= ,

em que iL é o limite inferior da classe que contém a mediana, n é o número de elementos do conjunto de dados, aF é a soma das frequências das classes anteriores à que contém a mediana, mdf é a frequência da classe que contém a mediana e mdh é a amplitude da classe que contém a mediana.

Considere a Tabela das freqüências (fj) e freqüências acumuladas (Fj) abaixo:

Page 30: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 30

Classe (limites reais)

pj fj Fj

70 � 90 0,05 200 x 0,05 =10 10 90 � 110 0,10 200 x 0,10 =20 10 + 20 = 30 110 � 130 0,25 200 x 0,25 =50 30 + 50 = 80 130 � 150 0,30 200 x 0,30 =60 80 + 60 = 140 150 � 170 0,15 200 x 0,15 =30 140 + 30 = 170 170 � 190 0,10 200 x 0,10 =20 170 + 20 = 190 190 � 210 0,05 200 x 0,05 =10 190 + 20 = 200

Soma 1,00 200 = n

Temos que: 200n = , 130Li = , 80Fa = , 60fmd = e 20h md =

Então, 67,1362060

80)2/200(130md ≈×−

+= .

GABARITO: C

9. Assinale a opção que corresponde à estimativa da freqüência relativa de observações de X menores ou iguais a 145.

A) 62,5%

B) 70,0%

C) 50,0%

D) 45,0%

E) 53,4%

Resolução

Classes fi 70-90 10 90-110 20 110-130 50 130-150 60 Fazendo a interpolação:

(150 – 130) = 20 = 60 (145 – 130) = 15 = x x = (15 x 60)/20 = 45

Número de elemento abaixo de 145 = 10 + 20 + 50 + 45 = 125 Total de elementos = 200

Page 31: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 31

Freqüência Relativa = 125/200 = 0,625 = 62,5%

GABARITO: A

10. Considere a transformação Z=(X-140)/10. Para o atributo Z encontrou-se

∑=

=7

1i

2ii 680.1fZ , onde fi é a freqüência simples da classe i e Zi o ponto médio de

classe transformado. Assinale a opção que dá a variância amostral do atributo X.

A) 720,00

B) 840,20

C) 900,10

D) 1200,15

E) 560,30

Resolução

10/)140x(z −= ⇒ 140z10x += ⇒ 2z

2z

22x s100s10s == ⇒ o valor da variância

AMOSTRAL de X será determinado a partir do cálculo da variância AMOSTRAL de Z.

Aprendemos que se os valores distintos k21 z,...,z,z ocorrem com as frequências

k21 f,...,f,f (∑=

=k

1i

f i n ), respectivamente, a variância de Z é dada por

2k

1i

2ii

k

1i

2ii

2z zzf

n1)zz(f

n1s −=−= ∑∑

==

ou

variância = média dos quadrados – quadrado da média.

A fórmula acima considera que os dados referem-se a uma população finita.

Contudo, a questão diz que as observações coletadas pertencem a uma amostra da população. Neste caso, o fator n (= Σfi) que aparece no denominador do lado direito da fórmula da variância deve ser substituído por (n–1). A justificativa para o uso do fator (n–1) será apresentada nas aulas sobre inferência estatística (aguarde!). Mas a diferença entre as duas definições torna-se desprezível para grandes valores de n.

CÁLCULO DA VARIÂNCIA AMOSTRAL DE X

.20,010/)140138(10/)140x(z −=−=−=

Page 32: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 32

⎥⎦

⎤⎢⎣

⎡+−

−=+−

−=−

−= ∑ ∑∑∑∑

= ====

k

1i

k

1ii

2k

1iii

2ii

k

1i

2i

2ii

k

1i

2ii

2z fzzfz2zf

1n1)zzz2z(f

1n1)zz(f

1n1s

1nzn

1n

zfznzn2zf

1n1s

2

k

1i

2iik

1i

222ii

2z −

−−

=⎥⎦

⎤⎢⎣

⎡+−

−=

∑∑ =

=

2k

1i

2ii

2z z

1nnzf

1n1s ⎟

⎠⎞

⎜⎝⎛

−−

−= ∑

=

⇒ note que o fator )1n/(1 − multiplica a soma dos quadrados e o fator )1n/(n − multiplica o quadrado da média.

Seja a Tabela abaixo:

Classes if ix 10/)140( −= ii xz ii fz ii fz 2

70-90 10 80 -6 -60 360 90-110 20 100 -4 -80 320 110-130 50 120 -2 -100 200 130-150 60 140 0 0 0 150-170 30 160 2 60 120 170-190 20 180 4 80 320 190-210 10 200 6 60 360

Total 200 -40 1.680

402,8199

)2,0(2001991680

1nznzf

1n1s

22k

1i

2ii

2z =

−×−=

−−

−= ∑

=

,

2,840402,8100s100s 2z

2x =×== (opção B)

Uma pergunta: acertaríamos a questão se tivéssemos utilizado a fórmula 2

k

1i

2ii

2z zzf

n1s −= ∑

=

? Vamos tirar essa dúvida?

36,804,040,8)2,0(200

1680zzfn1s 22

k

1i

2ii

2z =−=−−=−= ∑

=

836360,8100s100s 2z

2x =×== ⇒ opção com o valor mais próximo é a “B” (840,20).

Conclusão: você também acertaria a questão. A princípio, você poderá fazer o cálculo aproximado da variância na prova quando o número de obervações for

Page 33: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 33

muito grande. Neste exercício, 1199/200)1n/(n ≈=− , o que justifica a validade da aproximação adotada.

GABARITO: B

11. (Analista do BACEN/2006/FCC) A média aritmética dos valores das vendas diárias realizadas pelas 50 empresas do Setor A é de R$ 1.000,00, com desvio padrão de R$ 100,00. Sabe-se ainda que a média aritmética dos valores das vendas diárias realizadas pelas 200 empresas do Setor B é de R$ 2.000,00, com desvio padrão de R$ 200,00. A variância em (R$)2 dos valores das vendas diárias realizadas pelos dois setores reunidos é

A) 34.000,00

B) 50.000,00

C) 194.000,00

D) 207.500,00

E) 288.000,00

Resolução

A banca pediu para o candidato calcular a “variância em (R$)2 dos valores das vendas diárias realizadas pelos dois setores reunidos”, ou seja, a variância da população conjunta

}b,...,b,b,a,...,a,a{BABA N21N21=+ .

Variância da população conjunta A+B:

2

BABA

2

BA

22

BA NNBA

NNB

NNA

s ⎥⎦

⎤⎢⎣

++

−+

++

= ∑ ∑∑∑+ .

Fazendo N = NA + NB, obtemos

2222

BA NBA

NB

NA

s ⎟⎟⎠

⎞⎜⎜⎝

⎛ +−+= ∑∑∑∑

+ .

em que N = NA + NB = 50 + 200 = 250. A variância 2BAs + será calculada uma

vez conhecidos os valores dos somatórios ∑ 2A , ∑ 2B , ∑A e ∑ B . Os

somatórios ∑A e ∑B serão calculados em função das médias aritméticas A

e B , respectivamente. Os somatórios ∑ 2A , ∑ 2B serão determinados em

função de ( 2As , A ) e ( 2

Bs , B ), respectivamente.

Page 34: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 34

A fim de facilitar as contas, cortaremos três zeros dos dados fornecidos: 1000.1/000.1A == [mil], 1,0000.1/100sA == [mil], 2000.1/000.2B == [mil] e 2,0000.1/200sB == [mil].

∑= A501A ⇒ 5050150AA =×=×=∑

∑= B2001B ⇒ 400200BB =×=∑

222A AA

501s −= ∑ ⇒ 5,50]101,0[50]11,0[50)As(50A 2222

A2 =+×=+×=+×=∑

222B BB

2001s −= ∑ ⇒ 808]404,0[200]22,0[200)Bs(200B 2222

B2 =+×=+×=+×=∑

⎟ =⎟⎠

⎞⎜⎜⎝

⎛ +−+= ∑∑∑∑+

2

222BA N

BAB

N1A

N1s

1940,024,34340,38,12320,32020,0250

40050250808

2505,50 2

2

=−=−+=⎟⎠⎞

⎜⎝⎛ +

−+=

Para dar a resposta final, devemos multiplicar a variância (= quadrado do desvio-padrão) obtida acima por (1.000)2, haja vista que as médias e desvios padrão foram divididas por 1.000:

000.1941019410100,194)10(100,194000.11940,0s 36323322BA =×=××=××=×= −−

+

GABARITO: C

12. (ICMS-RJ/2010/FGV) A média, a mediana e a variância das idades de um grupo de vinte pessoas são, hoje, iguais, respectivamente, a 34, 35 e 24. Daqui a dez anos, os valores da média, da mediana e da variância das idades dessas pessoas serão, respectivamente:

A) 44, 35 e 34

B) 44, 45 e 12

C) 44, 45 e 24

D) 34, 35 e 12

E) 44, 45 e 124

Resolução

Está implícito que todas as pessoas do grupo estarão vivas daqui a dez anos. A dispersão da distribuição de frequências (das idades) não mudará com o envelhecimento das pessoas do grupo (ou seja, a forma da distribuição se

Page 35: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 35

mantém ao longo do tempo). Logo, a variância daqui a dez anos ainda será igual a 24. A única opção com este valor é a C.

Daqui a dez anos, a média e a mediana serão acrescidas de 10 unidades (anos), haja vista que a distribuição de frequências sofrerá um deslocamento para a direita de 10 unidades. Assim, a média e a mediana serão iguais a 44 e 45, respectivamente.

GABARITO: C

(Analista de Estatística/Perito/MPU/2010/CESPE) Considere que um perito tenha efetuado um estudo acerca do tempo gasto — X —, em meses, por empresas notificadas para quitar suas pendências com a Previdência Social. Uma amostra de 35 empresas notificadas com pendências foi selecionada de um banco de dados da Previdência. A partir dessa amostra, o perito fez uma análise exploratória da variável X, cujos resultados são apresentados a seguir.

Estatísticas Descritivas:

tempo mínimo = 2 meses tempo máximo = 128 meses

∑=

=35

1ii ;1027x ∑

=

=35

1i

2i ;66317x 11,30135x

351

235

1ii =⎟⎠

⎞⎜⎝

⎛∑=

Page 36: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 36

Nesse estudo, o perito efetuou avaliações acerca do número de irregularidades – Y – que geraram pendências em função do porte das empresas: com menos de 20 empregados e com 20 ou mais empregados. Os resultados foram os seguintes.

tamanho da empresa y s n < 20 empregados 6,8 1,7 15 ≥ 20 empregados 2,6 1,3 20

Com base nessas informações julgue os itens de 13 a 18.

13. O diagrama de caixas, conhecido como boxplot, indica que a distribuição de X é assimétrica. Portanto, o número de observações acima do segundo quartil (Q2) foi proporcionalmente superior ao número de observações abaixo de Q2.

Resolução

É correto afirmar que o boxplot indica que a distribuição de X é assimétrica, pois a distribuição tem cauda levemente alongada para a direita (note que a distância entre o quartil superior e a mediana é maior que a distância entre o quartil inferior e a mediana). Mas é incorreto dizer que o número de observações acima do segundo quartil (mediana) foi proporcionalmente superior ao número de observações abaixo da mediana, haja vista que a mediana divide o conjunto ordenado de dados em dois subconjuntos com igual número de elementos. Portanto, o item está errado.

GABARITO: E

14. O tempo mediano da variável X foi aproximadamente igual a 29,34 meses.

Resolução

Page 37: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 37

Rol: {2 3 4 4 6 6 6 6 6 6 7 10 11 12 12 14 15 17 17 20 20 23 25 25 27 34 35 49 57 62 68 88 92 110 128}

O rol acima possui 35 amostras em ordem crescente. A mediana é o valor que ocupa a 18ª posição, a saber, o valor 17. Uma rápida inspeção do box plotconfirma que o valor da mediana é inferior a 20. Item errado.

GABARITO: E

15. No diagrama de caixas, quatro observações foram identificadas como valores atípicos por estarem fora do intervalo [0; 77,25].

Resolução

Uma rápida inspeção do box plot sugere que os valores 88, 92, 110 e 128 (vide diagrama de ramo e folhas) são outliers. Item Certo. Resolvo mais detalhadamente a seguir.

Rol: {2 3 4 4 6 6 6 6 6 6 7 10 11 12 12 14 15 17 17 20 20 23 25 25 27 34 3549 57 62 68 88 92 110 128}

Q1 (primeiro quartil) = 6 (ocupa a 9ª posição do rol)

Q3 (terceiro quartil) = 35 (ocupa a 27ª posição do rol)

Logo, o desvio interquartílico (IQR) é dado por

IQR = Q3 – Q1 = 35 – 6 = 29

E o Limite Superior (LS) do diagrama será

LS = Q3 + (1,5 x IQR) = 35 + 1,5 x 29 = 35 + 43,5 = 78,5

Contudo, a banca trabalhou com LS = 77,25, valor diferente do calculado acima. Qual é a provável causa dessa discrepância?

Vamos supor a banca tenha adotado Q3= (34 + 35)/2 = 34,5.

Neste caso, IQR = Q3 – Q1 = 34,5 - 6 = 28,5 ⇒ 28,5 x 1,5 = 42,75 ⇒ LS = 42,75 + 34,5 = 77,25.

Foi daí que saiu o valor 77,25 citado no item. Mas isso não quer dizer que eu concorde com o raciocínio da banca. A questão não foi anulada.

GABARITO: C

Page 38: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 38

16. O diagrama apresentado a seguir é o resumo dos 5 números para a distribuição de X.

17 6 34,5 2 128

Resolução

O diagrama com o resumo dos 5 números tem a seguinte interpretação:

17 (mediana) 6 (quartil inferior) 34,5 (quartil superior)

2 (mínimo amostral) 128 (máximo amostral)

Os diagramas de caixas e de ramo e folhas confirmam que os dados relacionados acima estão corretos.

GABARITO: C

17. Nessa situação, a variabilidade do número de irregularidades nas empresas com menos de 20 empregados corresponde à metade da variabilidade do número de irregularidades nas empresas com 20 ou mais empregados.

Resolução

Considere que o número de irregularidades nas empresas com menos de 20 empregados seja representado pela variável A e o número de irregularidades nas empresas com 20 ou mais empregados pela variável B. A comparação entre as variabilidades (dispersões) das distribuições de A e B deve ser feita em termos relativos. Para tal, deve-se usar o coeficiente de variação (cv), que é definido como a razão entre o desvio padrão e a média. Esta medida de dispersão caracteriza o espalhamento dos valores da distribuição em termos relativos ao seu valor médio (*).

cv(A) = sA/médiaA = 1,7/6,8 = 1/4 = 0,25

cv(B) = sB/médiaB = 1,3/2,6 = 1/2 = 0,50

⇒ cv(A) = cv(B)/2 (item correto!)

(*) Não faz sentido comparar objetos diferentes (por exemplo, banana com laranja), utilizando uma medida absoluta como o desvio padrão. É por isso que é necessário trabalhar com um adimensional como o coeficiente de variação.

Page 39: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 39

GABARITO: C

18. O desvio padrão amostral de X foi inferior a 31 meses.

Resolução

Variância = Média dos Quadrados – Quadrado da Média

Como o valor de n=35 é “grande”, usarei a fórmula aproximada

∑ ∑ ⎟⎠⎞

⎜⎝⎛−=

222 x

n1x

n1s

QUADRADO DA MÉDIA:

( ) ( ) 11,135.30351x

n1

n1x

n1x

n1 22

2

2

×=⎥⎦⎤

⎢⎣⎡×==⎟

⎠⎞

⎜⎝⎛ ∑∑∑

MÉDIA DOS QUADRADOS:

317.66351x

n1 2 ×=∑

77,033.135

09,181.3635

11,135.3035317.66s2 ==−= ⇒ 15,3277,033.1s ≈=

O desvio padrão é superior a 31 meses.

GABARITO: E

(Analista Judiciário/TST/2007/Cespe-UnB/Adaptada) Considere que, em um ambiente de trabalho industrial, as seguintes medições acerca da poluição do ar tenham sido observadas: 1, 6, 4, 3, 2, 3, 1, 5, 1, 4. Nessas situação, julgue os itens que se seguem.

19. A mediana da amostra é igual a 2,5.

Resolução

Rol: 1, 1, 1, 2, 3, 3, 4, 4, 5, 6 (N = 10 medições)

N = 10 é par. Então

mediana = média aritmética entre as 5a e 6a medições do rol

Page 40: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 40

mediana = (3+3)/2 = 3

GABARITO: E

20. As médias harmônica e geométrica são ambas inferiores a 3.

Resolução

Fórmulas:

Média geométrica: n/1n

1ii

nn21g xx...x.xx ⎟⎟

⎞⎜⎜⎝

⎛== ∏

=

Média harmônica:

∑=

=+++

= n

1i in21

h

x1

n

x1...

x1

x1

nx

Média geométrica:

( ) 1010/110/1nn21g 864086406544332111x...x.xx ==×××××××××==

E agora, como fazer a conta acima? Como você poderia efetuar a raiz décima de 8640 em uma situação real de prova?

Eu faria uma conta aproximada, como números inteiros. Quer ver? Quanto dá 310?

310 = 33 x 33 x 33 x 3 = 27 x 27 x 27 x 3 = 19683 x 3 > 8640

Logo,

38640x 10g <=

Média harmônica:

32151300

30613

10

61

51

41

41

31

31

21

11

11

11

10

x1...

x1

x1

nx

n21

h <≈=+

=+++++++++

=+++

=

GABARITO: C

21. O terceiro quartil é igual a 3.

Resolução

Rol: 1, 1, 1, 2, 3, 3, 4, 4, 5, 6 (N = 10 medições)

Page 41: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 41

O terceiro quartil é a mediana da sub-série 3, 4, 4, 5, 6 ⇒ Q3 = 4

GABARITO: E

22. A variância amostral é superior a 2,8.

Resolução

Variância Amostral = 2

i

2i x

1nnx

1n1

−−⎟

⎞⎛⎜⎝ − ∑

Média dos quadrados corrigida pelo fator n–1:

1183625161699436544332111x 2222222222

i

2i =+++++++=+++++++++=∑

1,139

118x1n

1i

2i ≈=

− ∑

Observe que o cálculo da média dos quadrados usa o fator n-1 no denominador da média, em vez de n, quando se trata da variância de uma amostra.

Quadrado da média corrigido pelo fator n/(n-1):

31030

106544332111x ==

+++++++++= ⇒ 9x2 = ⇒ 109

910x

1nn 2 =×=⎟

⎠⎞

⎜⎝⎛

Variância amostral= 13,1 – 10 = 3,1 > 2,8 ⇒ item certo.

Nota: calculemos a variância da população:

118xi

2i =∑ ⇒ 8,11

10118x

n1

i

2i ==∑

Média dos quadrados = 11,8

Quadrado da média = 9

Variância = média dos quadrados – quadrado da média = 11,8 – 9 = 2,8 ⇒você julgaria que o item é errado pela conta aproximada. Neste caso, o erro de aproximação é (3,1 – 2,8) = 0,3, correspondente a aproximadamente 10% do valor da variância amostral (significativo!). O erro percentual da conta aproximada é grande porque o número de amostras (n=10) é “pequeno”.

GABARITO: C

Page 42: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 42

Variável X Frequência relativa

0 0,10

1 0,20

2 0,30

3 0,40

(SEAD-CPC/2007/Cespe-UnB/Adaptada) Considerando a tabela acima, que apresenta as freqüências relativas de uma variável X, relativa a uma contagem, julgue os itens a seguir.

23. A média de X é inferior a 1,5.

Resolução

∑= iipXX , em que pi denota a frequência relativa de Xi.

0,22,16,02,00)40,03()30,02()20,01()10,00(X =+++=×+×+×+×= ⇒ inferior a 1,5. Item certo.

∑ −

GABARITO: E

24. O desvio-padrão de X é inferior a 1,5.

Resolução

= 22ii

2x XpXS = média dos quadrados – quadrado da média

[ ] 0,146,32,12,002)40,03()30,02()20,01()10,00(S 222222x =−+++=−×+×+×+×=

0,1S2xx ==σ ⇒ item certo.

GABARITO: C

25. A moda e a mediana de X são iguais a 3.

Resolução

Variável X Frequência relativa Frequência relativa acumulada

0 0,10 0,10

1 0,20 0,30

Page 43: Alexandre Lima - Medidas de Dispersão

Pacote de Teoria e Exercícios para Analista Legislativo Técnico em Material e Patrimônio

Profs. Alexandre Lima www.pontodosconcursos.com.br 43

2 0,30 0,60

3 0,40 1,00

O valor de maior frequência é 3,0 ⇒ moda = 3.

A mediana é 2, haja vista que a frequência acumulada até X=1 é 30% e até X=2 é 60%.

Item errado.

GABARITO: E

26. O coeficiente de variação de X é superior a 1.

Resolução

5,021

XSCV x

x === ⇒ inferior a 1. Item errado.

GABARITO: E

Bom estudo e até a próxima aula!

Alexandre Lima.