33
Variˆ ancia e Desvio Padr˜ ao Calculo da Variˆ ancia e Desvio Padr˜ ao Interpreta¸c˜ ao do Desvio Padr˜ ao Medidas de dispers˜ ao relativa Prof. Me. Josivaldo Nascimento dos Passos MEDIDAS DE DISPERS ˜ AO UNIVERSIADE ESTADUAL DO MARANH ˜ AO 17 de outubro de 2016 Estat´ ıtica B´ asica

Aula 08 de estatística

Embed Size (px)

Citation preview

Page 1: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Prof. Me. Josivaldo Nascimento dos Passos

MEDIDAS DE DISPERSAO

UNIVERSIADE ESTADUAL DO MARANHAO

17 de outubro de 2016

Estatıtica Basica

Page 2: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Sumario

Variancia e Desvio Padrao

Introducao;

Calculo da Variancia e Desvio Padrao;

1o Caso - DADOS BRUTOS OU ROL

2o Caso - Variavel Discreta

3o Caso - Variavel Contınua

Interpretacao do Desvio Padrao

Medidas de dispersao relativa

Estatıtica Basica

Page 3: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Introducao

Observamos no item anterior que a dificuldade em se operar com oDMS se deve a presenca do modulo, para que as diferencas xi − xpossam ser interpretadas como distancias.Outra forma de se conseguir que as diferencas xi − x se tornemsempre positivas ou nulas e considerar o quadrado destas diferencas,isto e: (xi − x)2.Se substituirmos, nas formulas do DMS a expressao xi − x por(xi − x)2, obteremos nova medida de dispersao chamada variancia.Portanto, variancia e uma media aritmetica calculada a partir dosquadrados dos desvios obtidos entre os elementos da serie e a suamedia.

Estatıtica Basica

Page 4: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Introducao

O desvio padrao e a raiz quadrada positiva da variancia.Em particular, para estas medidas levaremos em consideracao o fatode a sequencia de dados representar toda uma populacao ou apenasuma amostra de uma populacao.No final desta seccao justificaremos esta necessidade.Notacoes: Quando a sequencia de dados representa uma Populacaoa variancia sera denotada por σ2(x) e o desvio padrao correspon-dente por σ(x).Quando a sequencia de dados representa uma amostra, a varianciasera denotada por s2(x) e o desvio padrao correspondente por s(x).

Estatıtica Basica

Page 5: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

1o Caso - DADOS BRUTOS OU ROL

a) Se a sequencia representa uma Populacao, a variancia e calcu-lada pela formula:

σ2(x) =

∑(xi − x)2

n

Exemplo

Calcule a variancia e o desvio padrao da sequencia: X : 4, 5, 8, 5.

A sequencia contem n = 4 elementos e tem por media:

X =

∑xi

n=

4 + 5 + 8 + 5

4= 5, 5

Estatıtica Basica

Page 6: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

1o Caso - DADOS BRUTOS OU ROL

Os quadrados das diferencas (xi − x)2 valem:

(xi − x)2 = (4− 5, 5)2 = 2, 25(xi − x)2 = (5− 5, 5)2 = 0, 25(xi − x)2 = (8− 5, 5)2 = 6, 25(xi − x)2 = (5− 5, 5)2 = 0, 25

Somando-se estes valores obtem-se∑

(xi − x)2 = 9.Substituindo esses valores na formula da variancia, teremos:

σ2(x) =

∑(xi − x)2

n=

9

4= 2, 25

Como o desvio padrao e a raiz quadrada positiva da variancia,

σ(x) =√σ2(x) =

√2, 25 = 1, 5 unidades.

Estatıtica Basica

Page 7: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

1o Caso - DADOS BRUTOS OU ROL

b) Se a sequencia anterior representasse apenas uma amostra, avariancia seria denotada por s2(x) e o desvio padrao por s(x).Neste caso,

s2(x) =

∑(xi − x)2

n − 1e

s(x) =√

s2(x)

Notemos a diferenca entre a formula do slide 5 de σ2(x) (indi-cado para Populacoes) e s2(x) para amostra.Assim,

s2(x) =

∑(xi − x)2

n − 1=

9

3= 3 e o desvio padrao e s(x) =

√3 = 1, 73.

Estatıtica Basica

Page 8: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

2o Caso - VARIAVEL DISCRETA

Como ha repeticoes de elementos na serie, definimos a varianciacomo sendo uma media aritmetica ponderada dos quadrados dosdesvios dos elementos da serie para a media da serie.

a) Se a variavel discreta e representativa de uma Populacao, entaoa variancia e dada por:

σ2(x) =

∑[(xi − x)2.fi ]∑

fi

e o desvio padrao e:

σ(x) =√σ2(x)

Estatıtica Basica

Page 9: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

2o Caso - VARIAVEL DISCRETA

b) Se a variavel discreta e representativa de uma amostra, entaoa variancia e dada por:

s2(x) =

∑[(xi − x)2.fi ]∑

fi − 1

e o desvio padrao e:

s(x) =√

s2(x)

Estatıtica Basica

Page 10: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

2o Caso - VARIAVEL DISCRETA

Exemplo

Calcule a variancia e o desvio padrao da serie abaixo, representativade uma populacao.

xi fi2 33 54 85 4

O numero de elemento da serie e n =∑

fi = 20.

A media desta serie e X =

∑xi fi∑fi

Estatıtica Basica

Page 11: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

2o Caso - VARIAVEL DISCRETA

xi fi xi fi2 3 63 5 154 8 325 4 20∑

fi = 20∑

xi fi = 73

A media desta serie e X =

∑xi fi∑fi

=73

20= 3, 65

Como estamos trabalhando com uma Populacao a variancia e dadapor:

σ2(x) =

∑[(xi − x)2.fi ]∑

fi

Desenvolvendo nova coluna para estes calculos, obtem-se:

Estatıtica Basica

Page 12: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

2o Caso - VARIAVEL DISCRETA

xi fi xi fi (xi − x)2fi2 3 6 8,16753 5 15 2,11254 8 32 0,98005 4 20 7,2900∑

fi = 20∑

xi fi = 73∑

[(xi − x)2fi ] = 18, 55

A variancia e:

σ2(x) =

∑[(xi − x)2.fi ]∑

fi=

18, 55

20= 0, 9275

e o desvio padrao correspondente e σ(x) =√

0, 9275 = 0, 963

Estatıtica Basica

Page 13: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

2o Caso - VARIAVEL DISCRETA

Exemplo

Se a variavel discreta fosse representativa de uma amostra, avariancia seria indicada por s2(x) e seria calculada por:

s2(x) =

∑[(xi − x)2.fi ]∑

fi − 1=

18, 55

19= 0, 9763

O desvio padrao seria calculado por s(x) =√

0, 9763 = 0, 988.

Estatıtica Basica

Page 14: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

3o Caso - VARIAVEL CONTINUA

Novamente, por desconhecer os particulares valores xi da serie, subs-tituiremos nas formulas anteriores estes valores pelos pontos mediosde classe.A formula da variancia para uma variavel contınua representativa deuma populacao e:

σ2(x) =

∑[(xi − x)2.fi ]∑

fi

onde xi e o ponto medio da classe i .Se a variavel contınua representa uma amostra entao a varianciadenotada por s2(x) e sua formula de calculo e:

s2(x) =

∑[(xi − x)2.fi ]∑

fi − 1

Estatıtica Basica

Page 15: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

3o Caso - VARIAVEL CONTINUA

Exemplo

Calcule a variancia e o desvio padrao para a serie representativa deuma Populacao:

Classe Int. cl. fi1 0 ` 4 12 4 ` 8 33 8 ` 12 54 12 ` 16 1

O numero de elementos da serie e n =∑

fi = 10.

A media da serie e X =

∑xi fi∑fi

onde xi sao os pontos medios de

classe.

Estatıtica Basica

Page 16: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

3o Caso - VARIAVEL CONTINUA

Classe Int. cl. fi xi fi1 0 ` 4 1 22 4 ` 8 3 183 8 ` 12 5 504 12 ` 16 1 14∑

fi = 10∑

xi fi = 84

A media da serie e:

X =

∑xi fi∑fi

=84

10= 8, 4

Como a variavel contınua e representativa de uma populacao,entao a variancia e dada por:

σ2(x) =

∑[(xi − x)2.fi ]∑

fiEstatıtica Basica

Page 17: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

3o Caso - VARIAVEL CONTINUA

Classe Int. cl. fi xi fi (xi − x)2fi1 0 ` 4 1 2 40,962 4 ` 8 3 18 17,283 8 ` 12 5 50 12,804 12 ` 16 1 14 31,36∑

= 10∑

= 84∑

= 102, 4

A variancia e, portanto:

σ2(x) =

∑[(xi − x)2.fi ]∑

fi=

102, 4

10= 10, 24

e o desvio padrao e: σ(x) =√

10, 24 = 3, 2.

Estatıtica Basica

Page 18: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

3o Caso - VARIAVEL CONTINUA

Exemplo

Se a variavel contınua fosse representativa de uma amostra, avariancia seria indicada por s2(x) e sua formula de calculo seria:

s2(x) =

∑[(xi − x)2.fi ]∑

fi − 1

Dessa forma, s2(x) =102, 4

9= 11, 38 e o desvio padrao seria

s(x) =√

11, 38 = 3, 373

Estatıtica Basica

Page 19: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Interpretacao do Desvio Padrao

Comentarios:

1. No calculo da variancia, quando elevamos ao quadrado a di-ferenca (xi − x), a unidade de medida da serie fica tambemelevada ao quadrado.Portanto, a variancia e dada sempre no quadrado da unidadede medida da serie.Se os dados sao expressos em metros, a variancia e expressaem metros quadrados.Em algumas situacoes, a unidade de medida da variancia nemfaz sentido.E o caso, por exemplo, em que os dados sao expressos em litros.A variancia sera expressa em litros quadrados.Portanto, o valor da variancia nao pode ser comparado dire-tamente com os dados da serie, ou seja: variancia nao teminterpretacao.

Estatıtica Basica

Page 20: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Interpretacao do Desvio Padrao

2. Exatamente para suprir esta deficiencia da variancia e que sedefine o desvio padrao.Como o desvio padrao e a raiz quadrada da variancia, o desviopadrao tera sempre a mesma unidade de medida da serie eportanto admite interprctacao.

Estatıtica Basica

Page 21: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Interpretacao do Desvio Padrao

O desvio padrao e, sem duvida, a mais importante das medidas dedispersao.E fundamental que o interessado consiga relacionar o valor obtidodo desvio padrao com os dados da serie.Quando uma curva de frequencia representativa da serie e perfei-tamente simetrica como a curva abaixo, podemos afirmar que ointervalo [x − σ, x + σ] contem aproximadamente 68% dos valoresda serie.

Estatıtica Basica

Page 22: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Interpretacao do Desvio Padrao

O intervalo [x − 2σ, x + 2σ] contem aproximadamente 95% dosvalores da serie.

O intervalo [x − 3σ, x + 3σ] contem aproximadamente 99% dosvalores da serie.

Estatıtica Basica

Page 23: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Interpretacao do Desvio Padrao

Estes percentuais 68%, 95% e 99% que citamos na interpretacaopoderao mais tarde ser comprovados, com maior precisao, no estudoda distribuicao normal de probabilidades.

Estatıtica Basica

Page 24: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Interpretacao do Desvio Padrao

Para uma compreensao inicial do desvio padrao, estas nocoes saosuficientes.Quando a distribuicao nao e perfeitamente simetrica estes percen-tuais apresentam pequenas variacoes para mais ou para menos, se-gundo o caso.De modo que, quando se afirma que uma serie apresenta mediax = 100 e desvio padrao σ(x) = 5, podemos interpretar estes valoresda seguinte forma:

1. Os valores da serie estao concentrados em torno de 100.

Estatıtica Basica

Page 25: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Interpretacao do Desvio Padrao

2. O intervalo [95, 105] contem aproximadamente, 68% dos valo-res da serie.O intervalo [90, 110] contem aproximadamente 95% dos valoresda serie.O intervalo [85, 115] contem aproximadamente 99% dos valoresda serie.E importante que se tenha percebido que, ao aumentar o tama-nho do intervalo, aumenta-se o percentual de elementos contidono intervalo.Adiante verificaremos que e possıvel controlar o tamanho dointervalo de modo que contenha exatamente o percentual quequeremos.

Estatıtica Basica

Page 26: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Interpretacao do Desvio Padrao

3. As medidas de dispersao vistas ate agora sao medidas absolutase portanto avaliam a dispersao absoluta da serie. Todas elassao diretamente proporcionais a dispersao absoluta.Assim, se a serie X apresenta x = 20 e σ(x) = 3 e se a serie Yapresenta y = 22 e σ(y) = 2, podemos afirmar, comparandoos desvios padrao, que a serie X apresenta maior dispersaoabsoluta.

4. Para justificar que o denominador da variancia amostral deveser n − 1 e nao n, usaremos o seguinte argumento:O modelo matematico que calcula a variancia de uma amostranao pode ser

σ2(x) =

∑(xi − x)2

n,

pois caso isto fosse verdadeiro, este modelo deveria determinara variancia para qualquer tamanho de amostra.

Estatıtica Basica

Page 27: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Interpretacao do Desvio Padrao

Suponha uma amostra constituıda de um unico elemento X1.O valor medio da amostra tambem e x1.Calculando a variancia pelo modelo acima, teremos:

σ2(x) =

∑(xi − xi )

2

1= 0.

Serıamos induzidos a afirmar que a dispersao da populacao de ondeprovem a amostra e zero, isto e, a populacao e constituıda em sua to-talidade por elementos identicos. O que e, em geral, uma afirmacaofalsa.Para corrigir o modelo matematico, basta colocar no denominadorn − 1. O modelo e escrito entao:

s2(x) =

∑(xi − x)2

n − 1

Estatıtica Basica

Page 28: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Interpretacao do Desvio Padrao

Observe que agora o modelo e coerente. Mesmo quando a amostrativer apenas um elemento x1, o calculo de s2(x) leva-nos a uma

indeterminacao do tipo0

0. O que significa que a variancia existe,

mas nao esta determinada.Significa tambem que amostras de apenas um elemento nao nosfornece informacoes sobre a variancia da serie.

Estatıtica Basica

Page 29: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Medidas de dispersao relativa

Se uma serie X apresenta x = 10 e σ(x) = 2 e uma serie Y apresentay = 100 e σ(y) = 5, do ponto de vista da dispersao absoluta, aserie Y apresenta maior dispersao que a serie X .No entanto, se levarmos em consideracao as medias das series, odesvio padrao de Y que e 5 em relacao a 100 e um valor menossignificativo que o desvio padrao de X que e 2 em relacao a 10.Isto nos leva a definir as medidas de dispersao relativas: coeficientede variacao e variancia relativa.O coeficiente de variacao de uma serie X e indicado por CV(x) de-finido por:

CV(x) =σ(x)

x

Estatıtica Basica

Page 30: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Medidas de dispersao relativa

A variancia relativa de uma serie X e indicada por V (x) e definidapor:

V (x) =σ2(x)

(x)2

Note que o coeficiente de variacao, como e uma divisao de elementosde mesma unidade, e um numero puro. Portanto, pode ser expressoem percentual.Este fato justifica a utilizacao do denominador (x)2 na definicao deV (x).Deste modo, se calcularmos o coeficiente de variacao da serie Xcitada no inıcio obteremos:

Estatıtica Basica

Page 31: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Medidas de dispersao relativa

CV(x) =2

10= 0, 2 ou 20%

Calculando o coeficiente de variacao da serie Y obteremos:

CV(y) =5

100= 0, 05 ou 5%

Comparando os valores destes dois coeficientes concluımos que aserie X admite maior dispersao relativa.Como a medida de dispersao relativa leva em consideracao a me-dida de dispersao absoluta e a media da serie, e uma medida maiscompleta que a medida de dispersao absoluta.

Estatıtica Basica

Page 32: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

Medidas de dispersao relativa

Portanto, a medida de dispersao relativa prevalece sobre a medidade dispersao absoluta. Podemos afirmar que a serie que tem a maiordisperssao relativa, tem de modo geral a maior dispersao.Concluindo o exemplo anterior:A serie Y apresenta maior dispersao absoluta.A serie X apresenta maior dispersao relativa.Portanto, a serie X apresenta maior dispersao.

Estatıtica Basica

Page 33: Aula 08 de estatística

Variancia e Desvio PadraoCalculo da Variancia e Desvio Padrao

Interpretacao do Desvio PadraoMedidas de dispersao relativa

MARTINS, Gilberto de Andrade Martins, Estatıstica Geral eAplicada, 4 ed. Sao Paulo: Editora Atlas S.A., 2011

SILVA, Ermes Medeiros da; SILVA, Elio Medeiros da;GONCALVES, Valter; MUROLO, Afranio Carlos,ESTATISTICA Para os cursos de: Economia, Administracao eCiencias Contabeis 3 ed. Sao Paulo: Editora Atlas S.A., 1999

Estatıtica Basica