34
MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES Prof. Guilherme Neves www.pontodosconcursos.com.br 1 Aula 8 – Parte 2 CORRELAÇÃO ............................................................................................................................................... 2 REGRESSÃO LINEAR................................................................................................................................ 17 Relação das questões comentadas .................................................................................................... 27 Gabaritos ...................................................................................................................................................... 34

Aula 08 - Parte 02

Embed Size (px)

Citation preview

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 1

Aula 8 – Parte 2 CORRELAÇÃO ............................................................................................................................................... 2

REGRESSÃO LINEAR ................................................................................................................................ 17

Relação das questões comentadas .................................................................................................... 27

Gabaritos ...................................................................................................................................................... 34

MATEMÁTICA FINANCEIRAPROFESSOR:

Prof. Guilherme Neves www.pontodosconcursos.com.br

CORRELAÇÃO

Vamos pensar em duas variáveis que estas variáveis são peso e altura de um grupo de indivíduos adultos. abaixo mostra um conjunto de possíveis valores.

Figura 1 – Diagrama de dispersão peso x altura

Este gráfico acima é chamado de diagrama de dispersão.

Apesar de as variáveis peso e altura, para o grupo pesquisado, não se comportarem exatamente segundo uma reta, a relaçãreta. Ou seja, é quase linear.

Isto pode ser útil para estimarmos valores. Podemos, sabendo apenas a altura da pessoa, tentar identificar seu peso (é mais ou menos isso que faremos quando estudarmos regressão linear).

Neste exemplo ficou extremamente claro que existe uma reta que aproxima bem a relação entre peso e altura. É que os dados não foram obtidos a partir de uma pesquisa. Eu construí os dados de forma que ficasse bem evidente a relação quase linear entre peso e altura.

Em situações reais é comum surgirem casos em que a relação linear não é assim tão evidente. O diagrama de dispersão a seguir ilustra uma situação assim.

FINANCEIRA E ESTATÍSTICA PARA ICMS/PROFESSOR: GUILHERME NEVES

www.pontodosconcursos.com.br

em duas variáveis que possuam alguma relação. Suponha que estas variáveis são peso e altura de um grupo de indivíduos adultos.

conjunto de possíveis valores.

Diagrama de dispersão peso x altura

Este gráfico acima é chamado de diagrama de dispersão.

as variáveis peso e altura, para o grupo pesquisado, não se comportarem exatamente segundo uma reta, a relação existente é quase uma reta. Ou seja, é quase linear.

Isto pode ser útil para estimarmos valores. Podemos, sabendo apenas a altura da pessoa, tentar identificar seu peso (é mais ou menos isso que faremos quando estudarmos regressão linear).

ficou extremamente claro que existe uma reta que aproxima bem a relação entre peso e altura. É que os dados não foram obtidos a partir de uma pesquisa. Eu construí os dados de forma que ficasse bem evidente a relação quase linear entre peso e altura.

ituações reais é comum surgirem casos em que a relação linear não é assim tão evidente. O diagrama de dispersão a seguir ilustra uma situação

E ESTATÍSTICA PARA ICMS/RJ

2

relação. Suponha que estas variáveis são peso e altura de um grupo de indivíduos adultos. O gráfico

Diagrama de dispersão peso x altura

as variáveis peso e altura, para o grupo pesquisado, não se o existente é quase uma

Isto pode ser útil para estimarmos valores. Podemos, sabendo apenas a altura da pessoa, tentar identificar seu peso (é mais ou menos isso que faremos

ficou extremamente claro que existe uma reta que aproxima bem a relação entre peso e altura. É que os dados não foram obtidos a partir de uma pesquisa. Eu construí os dados de forma que ficasse bem evidente a

ituações reais é comum surgirem casos em que a relação linear não é assim tão evidente. O diagrama de dispersão a seguir ilustra uma situação

MATEMÁTICA FINANCEIRAPROFESSOR:

Prof. Guilherme Neves www.pontodosconcursos.com.br

Figura 2 – Diagrama de dispersão peso x altura

A Figura 2 representa uma outra população, em que a relação entre os pesos e as alturas dos indivíduos não segue uma relação linear tão forte quanto na população representada na

De todo modo, no diagrama acima, ainda fica razoável afirmar que há uma relação linear entre peso e altura. Mas a ruma reta quanto era no caso da

Pois bem, aí entra o coeficiente de correlação linear. Ele vai nos dar uma medida do quão forte é a relação linear entre duas variáveis.

A fórmula do coeficiente de correlação linear é:

O coeficiente acima é chamado de coeficiente de correlação linear de Pearson.

É possível demonstrar que o coeficiente de cno intervalo de 1− a 1.

Quanto mais próximo de zero está o coeficiente de correlação, menor é a relação linear entre as duas variáveis. Quanto mais afastado de zero está o coeficiente de correlação, maior é a relação linear entre as duas variáveis.

Alguns comentários importantes

O fato de o coeficiente de correlação ser próximo de zero não significa que não exista relação entre duas variáveis. Significa apenas que as duas não têm relação linear. Pode ser que as variáveis se relacionem de outras maneiras. Pode ser uma relação quadrática, exponencial, etc.

O fato do coeficiente de correlação ser muito próximo de 1 (ou significa que as duas variáveis tenham uma relação de causa e conseqüência.

FINANCEIRA E ESTATÍSTICA PARA ICMS/PROFESSOR: GUILHERME NEVES

www.pontodosconcursos.com.br

Diagrama de dispersão peso x altura – relação linear menos intensa

2 representa uma outra população, em que a relação entre os pesos e as alturas dos indivíduos não segue uma relação linear tão forte quanto na opulação representada na Figura 1.

De todo modo, no diagrama acima, ainda fica razoável afirmar que há uma relação linear entre peso e altura. Mas a relação não é tão próxima assim de uma reta quanto era no caso da Figura 1.

Pois bem, aí entra o coeficiente de correlação linear. Ele vai nos dar uma medida do quão forte é a relação linear entre duas variáveis.

A fórmula do coeficiente de correlação linear é:

( ) ( )[ ]

( ) ( )∑ ∑

= =

=

−×−

−×−

=n

i

n

i

ii

n

i

ii

YYXX

YYXX

r

1 1

22

1

O coeficiente acima é chamado de coeficiente de correlação linear de Pearson.

É possível demonstrar que o coeficiente de correlação assume valores apenas

11 ≤≤− r

Quanto mais próximo de zero está o coeficiente de correlação, menor é a relação linear entre as duas variáveis. Quanto mais afastado de zero está o coeficiente de correlação, maior é a relação linear entre as duas variáveis.

Alguns comentários importantes.

o coeficiente de correlação ser próximo de zero não significa que não exista relação entre duas variáveis. Significa apenas que as duas não têm relação linear. Pode ser que as variáveis se relacionem de outras maneiras.

drática, exponencial, etc.

O fato do coeficiente de correlação ser muito próximo de 1 (ou significa que as duas variáveis tenham uma relação de causa e conseqüência.

E ESTATÍSTICA PARA ICMS/RJ

3

relação linear menos

2 representa uma outra população, em que a relação entre os pesos e as alturas dos indivíduos não segue uma relação linear tão forte quanto na

De todo modo, no diagrama acima, ainda fica razoável afirmar que há uma elação não é tão próxima assim de

Pois bem, aí entra o coeficiente de correlação linear. Ele vai nos dar uma

O coeficiente acima é chamado de coeficiente de correlação linear de Pearson.

orrelação assume valores apenas

Quanto mais próximo de zero está o coeficiente de correlação, menor é a relação linear entre as duas variáveis. Quanto mais afastado de zero está o coeficiente de correlação, maior é a relação linear entre as duas variáveis.

o coeficiente de correlação ser próximo de zero não significa que não exista relação entre duas variáveis. Significa apenas que as duas não têm relação linear. Pode ser que as variáveis se relacionem de outras maneiras.

O fato do coeficiente de correlação ser muito próximo de 1 (ou -1) não significa que as duas variáveis tenham uma relação de causa e conseqüência.

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 4

Não implica que uma delas tenha efeito direto ou indireto sobre a outra. Pode ser que as duas sofram influência de outras variáveis de maneira que isso dê origem a uma forte correlação entre ambas.

Outro comentário: o coeficiente de correlação é geralmente calculado a partir de uma amostra de valores de X e Y. Considere que a amostra tem n pares ordenados (X, Y). Se a amostra for grande (isto é, se n for grande), então o coeficiente de correlação deve dar um bom indício do que ocorre na população. Neste caso, se 0≅r , então é bem possível que não exista relação linear entre X e Y.

Se n for grande e 1≅r ou 1−≅r , novamente temos um forte indício de que há relação linear perfeita entre X e Y.

Contudo, se a amostra for pequena, ela pode fornecer resultados enganosos. Basta pensar numa amostra de tamanho 2. Se temos apenas dois pares ordenados, nosso diagrama de dispersão terá apenas dois pontos. Dois pontos distintos sempre estão ao longo de uma mesma reta. Neste caso, o coeficiente de correlação será igual a 1 (ou -1).

Pergunta: neste caso, podemos afirmar, com certeza, que há relação linear perfeita entre X e Y? Não, não podemos. Nossa amostra é que foi pobre, muito pequena. É bem possível que nossa amostra esteja fornecendo um resultado enganoso.

Para os dados da Figura 1, o coeficiente de correlação é 0,998. Como a quantidade de dados é muito grande, não vou detalhar o cálculo aqui. Apenas observem que o coeficiente de correlação é muito próximo de 1. Ou seja, a relação linear é muito forte. Isto já dava pra ver no próprio gráfico. Os pontos praticamente formavam uma reta.

Vejamos um outro exemplo, com menos números envolvidos.

Um grupo de quatro alunos estudou junto para as provas finais. Feitas as provas, eles obtiveram se seguintes notas:

Aluno Nota de

matemática ( )X Nota de física ( )Y

1 2 6 2 6 7 3 8 7 4 10 8

Média 6,5 7

Calcule o coeficiente de correlação linear entre as notas de física e matemática.

Resolução

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 5

As notas em física e matemática guardam certa relação linear. Vamos calcular o coeficiente de correlação para vermos a intensidade da relação linear existente entre elas.

Aluno X Y XX − YY − ( )×− XX ( )YY − ( )2XX − ( )2YY − 1 2 6 -4,5 -1 4,5 20,25 1 2 6 7 -0,5 0 0 0,25 0 3 8 7 1,5 0 0 2,25 0 4 10 8 3,5 1 3,5 12,25 1

TOTAL 8 35 2

Aplicando a fórmula:

( ) ( )[ ]

( ) ( )∑ ∑

= =

=

−×−

−×−

=n

i

n

i

ii

n

i

ii

YYXX

YYXX

r

1 1

22

1

956,0235

8≅

×=r

Veja que o coeficiente de correlação é bem próximo de 1. Ou seja, existe intensa relação linear entre as notas de física e matemática.

Sinal do coeficiente de correlação

Mais alguns comentários sobre o coeficiente de correlação.

O sinal do coeficiente indica se as grandezas possuem uma relação direta ou inversa. No caso da relação entre peso e altura, vimos que o coeficiente tinha sinal +. Ou seja, a relação entre peso e altura é direta. Quando a altura aumenta, o peso tende a aumentar também.

Se o sinal for negativo, as grandezas têm uma relação inversa. Seria o caso da relação entre o preço de um produto e a sua demanda. Quanto maior o preço, menor sua demanda. E quanto menor o preço, maior a demanda.

O diagrama abaixo poderia representar duas variáveis com correlação negativa:

MATEMÁTICA FINANCEIRAPROFESSOR:

Prof. Guilherme Neves www.pontodosconcursos.com.br

Figura 3 – Diagrama de dispersão demanda x preço

O preço é dado em R$. A demanda é em milhares de unidades. Quando o preço está por volta de R$ 2,00, a demanda é em torno de 40.000 unidades. Quando o preço aumenta, chegando a valores próximos de R$ 5,00, a demanda cai para cerca de 30.000 unidades.

Quando a correlação é próxima de zero, o diagrama de dispersão não nos deixa nenhuma dica se a relação é direta ou inversa. Seria o caso do diagrama abaixo:

Figura 4 – Diagrama de dispersão

No diagrama acima ainda é possívenegativa). Mas bem fraca, quase nula. Novamente, isto não significa que as variáveis X e Y não tenham relação. Significa apenas que não há relação linear.

Lembrete de Coeficiente de correlação

Mede o quão forte é a relação linear entre duas variáveis.

Quando vale zero: não há relação linear.

Quando vale 1 ou -1: relação linear perfeita.

FINANCEIRA E ESTATÍSTICA PARA ICMS/PROFESSOR: GUILHERME NEVES

www.pontodosconcursos.com.br

Diagrama de dispersão demanda x preço

O preço é dado em R$. A demanda é em milhares de unidades. Quando o preço está por volta de R$ 2,00, a demanda é em torno de 40.000 unidades. Quando o preço aumenta, chegando a valores próximos de R$ 5,00, a demanda cai para cerca de 30.000 unidades.

do a correlação é próxima de zero, o diagrama de dispersão não nos deixa nenhuma dica se a relação é direta ou inversa. Seria o caso do diagrama

Diagrama de dispersão Y x X – correlação próxima de zero

No diagrama acima ainda é possível notar uma relação inversa (correlação negativa). Mas bem fraca, quase nula. Novamente, isto não significa que as

não tenham relação. Significa apenas que não há relação linear.

Lembrete de Coeficiente de correlação

relação linear entre duas variáveis.

Quando vale zero: não há relação linear.

1: relação linear perfeita.

E ESTATÍSTICA PARA ICMS/RJ

6

Diagrama de dispersão demanda x preço

O preço é dado em R$. A demanda é em milhares de unidades. Quando o preço está por volta de R$ 2,00, a demanda é em torno de 40.000 unidades. Quando o preço aumenta, chegando a valores próximos de R$ 5,00, a

do a correlação é próxima de zero, o diagrama de dispersão não nos deixa nenhuma dica se a relação é direta ou inversa. Seria o caso do diagrama

correlação próxima de zero

l notar uma relação inversa (correlação negativa). Mas bem fraca, quase nula. Novamente, isto não significa que as

não tenham relação. Significa apenas que não há relação linear.

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 7

Fórmula: ( ) ( )[ ]

( ) ( )∑ ∑

= =

=

−×−

−×−

=n

i

n

i

ii

n

i

ii

YYXX

YYXX

r

1 1

22

1

01. (CAPES 2008 CESGRANRIO) Considere as asserções a seguir.

O Coeficiente de Correlação Linear de Pearson é necessariamente um número no intervalo )1,1(− .

PORQUE

O Coeficiente de Correlação Linear de Pearson só pode ser calculado para variáveis quantitativas.

Analisando-se as asserções, conclui-se que

(A) as duas asserções são verdadeiras, e a segunda é uma justificativa correta da primeira.

(B) as duas asserções são verdadeiras, e a segunda não é uma justificativa correta da primeira.

(C) a primeira asserção é verdadeira, e a segunda é falsa.

(D) a primeira asserção é falsa, e a segunda é verdadeira.

(E) a primeira e a segunda asserções são falsas.

Resolução

A primeira frase está correta. Como vimos, o coeficiente de correlação sempre assume valores entre -1 e 1.

A segunda frase também está correta. O coeficiente de correlação depende de cálculo de somatório, o que só pode ser feito para variáveis quantitativas.

Um frase não justifica a outra. Há diversas grandezas que só podem ser calculadas para variáveis quantitativas, mas que assumem valores fora do intervalo entre -1 e 1. Exemplo: a variância só pode ser calculada para variáveis quantitativas. No entanto, ela pode assumir qualquer valor maior ou igual a zero.

Letra B

02. (INEP 2008 CESGRANRIO) Considere as afirmações a seguir a respeito do Coeficiente de Correlação (r) de Pearson entre duas variáveis.

I - Se r = 1, as observações estão todas sobre uma linha reta no diagrama de dispersão.

II - Se r > 0, a variável independente aumenta quando a variável dependente aumenta.

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 8

III - Se r < 0, a variável independente decresce quando a variável dependente decresce.

IV - Se r = 0, não existe relação entre as duas variáveis.

São corretas APENAS as afirmações

(A) I e II

(B) I e III

(C) II e III

(D) II e IV

(E) III e IV

Resolução

Item I.

Se 1=r , a relação linear é perfeita e, além disso, as duas variáveis têm relação direta (quando uma aumenta, a outra aumenta; quando uma diminui, a outra diminui). Item correto.

Item II.

Se 0>r , a relação entre as variáveis é direta (quando uma aumenta, a outra aumenta; quando uma diminui, a outra diminui). Item correto.

Item III

Se 0<r , a relação é inversa (quando uma aumenta, a outra diminui). Item errado.

Item IV.

Se 0=r , temos um forte sinal de que não haja relação linear, o que não impede que haja outro tipo de relação (exponencial, logarítmica, etc). Item errado.

Letra A

03. (TCU 2008 CESPE-UnB) Uma agência de desenvolvimento urbano divulgou os dados apresentados na tabela

a seguir, acerca dos números de imóveis ofertados (X) e vendidos (Y) em determinado município, nos anos de 2005 a 2007.

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 9

Ano Número de imóveis Ofertados (X) Vendidos (Y)

2005 1.500 100 2006 1.750 400 2007 2.000 700

Considerando as informações do texto, julgue o item subseqüente.

O coeficiente de correlação linear entre X e Y é inferior a 0,8.

Resolução Ano X Y XX − YY − ( )×− XX ( )YY − ( )2XX − ( )2YY − 2005 1.500 100 -250 -300 75.000 62.500 90.000 2006 1.750 400 0 0 0 0 0 2007 2.000 700 250 300 75.000 62.500 90.000

TOTAL 150.000 125.000 180.000

A fórmula do coeficiente de correlação é:

( ) ( )[ ]

( ) ( )∑ ∑

= =

=

−×−

−×−

=n

i

n

i

ii

n

i

ii

YYXX

YYXX

r

1 1

22

1

1150

150

9005

150

180125

150

000.180000.125

000.150===

×=

×=r

As contas foram relativamente tranqüilas.

Só um detalhe. Era possível resolver a questão sem fazer contas. Note como os valores de X e Y estão exatamente ao longo de uma reta. Para cada variação de 250 em X, temos uma variação de 300 em Y. Ou seja, os três pares ordenados fornecidos estão ao longo de uma mesma reta. Para deixar mais claro, segue o gráfico:

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 10

O coeficiente de correlação linear nos dá uma medida de quão forte é a relação linear entre duas variáveis. Acontece que, para os valores fornecidos, temos uma relação linear perfeita (é exatamente uma reta). Por isso já dava para falar que este coeficiente é igual a 1. Portanto, o coeficiente não é inferior a 0,8. Item errado.

04. (AFRF 2005 ESAF) Para uma amostra de dez casais residentes em um mesmo bairro, registraram-se os seguintes salários mensais (em salários mínimos):

Identificação do casal

1 2 3 4 5 6 7 8 9 10

Salário do marido (Y)

30 25 18 15 20 20 21 20 25 27

Salário da esposa (X)

20 25 12 10 10 20 18 15 18 23

Sabe-se que:

22110

1

=∑=i

iY ; 506910

1

2=∑

=i

iY

17110

1

=∑=i

iX ; 317110

1

2=∑

=i

iX

394010

1

=∑=i

iiYX

Assinale a opção cujo valor corresponda à correlação entre os salários dos homens e das mulheres.

a) 0,72

b) 0,75

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 11

c) 0,68

d) 0,81

e) 0,78

Resolução

As médias de X e Y podem ser facilmente calculadas. Basta somar todos os valores e dividir por 10.

1,1710

171

10

10

1 ===∑=i

iX

X (lembre que a soma de todos os valores de X foi fornecida

no enunciado).

Para Y, o cálculo é o mesmo.

1,2210

221

10

10

1 ===∑=i

iY

Y

Vamos agora ao cálculo do coeficiente de correlação.

Há duas formas de fazer. A primeira é aplicar a fórmula.

( ) ( )[ ]

( ) ( )∑ ∑

= =

=

−×−

−×−

=n

i

n

i

ii

n

i

ii

YYXX

YYXX

r

1 1

22

1

Detalhamos os cálculos na tabela abaixo: Casal X Y XX − YY − ( )×− XX ( )YY − ( )2XX − ( )2YY − 1 20 30 2,9 7,9 22,91 8,41 62,41 2 25 25 7,9 2,9 22,91 62,41 8,41 3 12 18 -5,1 -4,1 20,91 26,01 16,81 4 10 15 -7,1 -7,1 50,41 50,41 50,41 5 10 20 -7,1 -2,1 14,91 50,41 4,41 6 20 20 2,9 -2,1 -6,09 8,41 4,41 7 18 21 0,9 -1,1 -0,99 0,81 1,21 8 15 20 -2,1 -2,1 4,41 4,41 4,41 9 18 25 0,9 2,9 2,61 0,81 8,41 10 23 27 5,9 4,9 28,91 34,81 24,01

TOTAL 160,9 246,9 184,9

E o coeficiente de correlação fica:

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 12

( ) ( )[ ]

( ) ( )75,0

9,1849,246

9,160

1 1

22

1 ≅×

=

−×−

−×−

=

∑ ∑

= =

=

n

i

n

i

ii

n

i

ii

YYXX

YYXX

r

Além da infinidade de contas, ainda chegamos ao final com uma raiz quadrada.

O problema desta resolução é que demora um tempão. Especialmente sem

calculadora. Tivemos que calcular cada valor de XX − , de ( )YY − , de ( )2XX − ,

de ( )2YY − , depois ainda fazer algumas multiplicações e somas.

O ideal é tentar utilizar as informações dadas no exercício. O exercício seria bastante interessante se, com as informações utilizadas, as contas fossem diminuídas. Não é exatamente o que ocorre.

Vamos a uma solução alternativa, para utilizar as informações sobre os valores dos somatórios fornecidos.

Para tanto, é necessário conhecer algumas igualdades envolvendo somatório.

Transformações importantes:

( ) ( )[ ] ( ) YXnYXYYXXn

i

ii

n

i

ii −×=−×− ∑∑== 11

( ) ( ) 2

1

2

1

2

XnXXXn

i

i

n

i

i −=− ∑∑==

( ) ( ) 2

1

2

1

2

YnYYYn

i

i

n

i

i −=− ∑∑==

Repare que todas as igualdades são bem parecidas. Se você gravar a primeira, pode facilmente chegar nas outras duas. Basta fazer o caso em que Y = X.

A primeira igualdade é:

( ) ( )[ ] ( ) YXnYXYYXXn

i

ii

n

i

ii −×=−×− ∑∑== 11

Substituindo os valores da média de X e da média de Y:

( ) ( )[ ] ( ) 1,221,1711

××−×=−×− ∑∑==

nYXYYXXn

i

ii

n

i

ii

Substituindo os valores informados no enunciado:

( ) ( )[ ] 9,1601711,221039401

=××−=−×−∑=

n

i

ii YYXX

A segunda igualdade é:

( ) ( ) 2

1

2

1

2

XnXXXn

i

i

n

i

i −=− ∑∑==

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 13

Substituindo os valores do enunciado:

( ) 9,2461,17103171 2

1

2

=×−=−∑=

n

i

i XX

A terceira igualdade é:

( ) ( ) 2

1

2

1

2

YnYYYn

i

i

n

i

i −=− ∑∑==

Portanto:

( ) 9,1841,22105069 2

1

2

=×−=−∑=

n

i

i YY

Até aqui, até que não deu tanta conta.

O problema é que, mesmo a pessoa conhecendo estas igualdades, ainda chega ao final com a seguinte conta:

( ) ( )[ ]

( ) ( )75,0

9,1849,246

9,160

1 1

22

1 ≅×

=

−×−

−×−

=

∑ ∑

= =

=

n

i

n

i

ii

n

i

ii

YYXX

YYXX

r

Está aí novamente a tal da raiz quadrada. Ou seja, as contas nem ficaram tão fáceis assim...

Agora uma dica de contas. Extrair a raiz quadra é meio trabalhoso. Eu, particularmente, procuro evitar.

Então, em vez de calcular o coeficiente de correlação, eu calcularia o quadrado do coeficiente de correlação:

9,1849,246

9,160 22

×=r

Mas esta conta ainda é meio ruim de fazer. Aproximando os valores:

567,0695.45

921.25

185247

161

9,1849,246

9,160 222 ==

×≅

×=r

Feito isto, eu testaria as alternativas.

0,722=0,5184 (deu menor que 0,567)

0,752=0,5625 (deu bem próximo de 0,567)

0,682 é menor que 0,49

0,782=0,6084

0,812 é maior que 0,60.

E marcaria a letra B.

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 14

Outra maneira é usar a aproximação da raiz quadrada (acesse o link http://www.pontodosconcursos.com.br/admin/imagens/upload/4950_D.pdf) . Ficaria assim:

· quadrado perfeito mais próximo: 0,49

· aproximação da raiz:

755,04,1

057,1

49,02

567,049,0567,0 ==

×

+≅

Ao meu ver, o grande problema desta questão é que, mesmo a pessoa tendo conseguido manipular bem os somatórios (o que já é um sinal de que o candidato estava muito bem preparado), as contas ainda são muito trabalhosas. Eu achei a questão um despropósito... Seu eu tivesse feito esse concurso do AFRF, sinceramente, teria pulado esta questão.

Então resumindo: além da fórmula usual do coeficiente de correlação, há exercícios que são muito facilitados se você souber as igualdades do quadro 1. Infelizmente, neste exercício do AFRF 2005, a questão não se limitou a cobrar tais igualdades. Ainda exigiu um esforço “braçal”, envolvendo muitas contas.

05. (Instituto de Gestão Previdenciária do Estado do Pará – 2005 CESPE-UnB) Considere que r(x,y) seja o coeficiente de correlação entre duas variáveis aleatórias x e y. Nesse caso, se ‘a’ e ‘b’ são dois números reais, então o coeficiente de correlação r(ax, by) é igual a:

a) ),( yxrab×

b) ),(22 yxrba ×

c) ),( yxr , se 0>ab

d) ),( yxrba

ab×

+

e) ab

yxr ),(

Resolução

Vou fazer um resuminho de uma propriedade que ainda não falei.

Seja r o coeficiente de correlação entre X e Y.

Se multiplicarmos cada uma destas variáveis por duas constantes a e b, o novo coeficiente 'r é dado por:

rr =' , se 0>ab

rr −=' , se 0<ab

Se somarmos (ou subtrairmos), a cada uma destas variáveis, uma constante, o coeficiente de correlação fica inalterado.

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 15

Letra C

06. (CAPES 2008 CESGRANRIO)

Se as variáveis Y e 1X forem transformadas, respectivamente, para

5,021 +−= YY e 5,0' 11 +−= XX , o coeficiente de correlação entre 1Y e '1X

(A) 0,382

(B) 0,059

(C) - 0,059

(D) - 0,118

(E) - 0,382

Resolução.

O coeficiente de correlação entre Y e 1X é de 059,0− (ver figura). A partir destas variáveis, criamos outras, por meio de uma multiplicação e uma soma.

As somas não interferem no coeficiente de correlação. As multiplicações podem interferir no sinal do coeficiente de correlação. As multiplicações foram feitas por 2− e 1− . As duas constantes têm o mesmo sinal. Com isso, o coeficiente de correlação permanece igual ao da situação inicial.

059,0' −== rr

Letra C

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 16

07. (MP RO 2005 CESGRANRIO) Analise as afirmativas a seguir, a respeito do coeficiente de correlação linear de Pearson entre duas variáveis positivas X e Y:

I - é positivo;

II - não se altera quando adicionamos uma constante positiva aos valores de X;

III - não se altera quando multiplicamos por uma constante positiva os valores de X.

Está(ão) correta(s) a(s) afirmativa(s):

(A) II somente.

(B) I e II somente.

(C) I e III somente.

(D) II e III somente.

(E) I, II e III.

Resolução.

O sinal do coeficiente de correlação depende da relação existente entre as variáveis (direta ou inversa). Se for uma relação direta, o sinal é positivo. Se for uma relação inversa, o sinal é negativo.

O primeiro item está errado.

Somas e subtrações não interferem no coeficiente de correlação. O segundo item está certo.

Se multiplicarmos X por uma constante positiva k, e não alterarmos Y (o que equivale a multiplicar por 1), então as duas constantes envolvidas (k e 1) têm o mesmo sinal. O coeficiente de correlação não se altera. O terceiro item está certo.

Letra D

08. (Petrobrás 2004 CESPE-UnB) Julgue o item que segue:

O coeficiente de correlação de Pearson é usado para medir o grau de linearidade (associação) entre duas variáveis (eventos), podendo assumir qualquer valor entre +1 e –1. Os valores de coeficientes iguais a +1 e -1 indicam, respectivamente, relação linear perfeita e ausência total de relação linear entre as variáveis.

Resolução

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 17

Questão errada. O coeficiente igual a -1 indica também uma relação linear perfeita. Só que a reta que representa a função entre as duas variáveis é decrescente.

Quando o coeficiente de correlação assume o valor zero é que temos um indicativo de ausência total de relação linear.

Gabarito: ERRADO

09. (Prefeitura de Rio Branco CESPE-UnB) A análise de regressão linear simples e a análise de correlação são técnicas freqüentemente usadas na interpretação de pares de dados. Com relação a essas técnicas, julgue o item a seguir.

O coeficiente de correlação mede o grau de associação entre duas variáveis.

Resolução

O coeficiente de correlação mede o grau de relação linear entre duas variáveis. O exercício está chamando essa relação linear de associação. O item está certo. REGRESSÃO LINEAR

Na correlação linear, estávamos interessados em ver se duas variáveis X e Y tinham uma relação linear forte ou não.

Pois bem, considerem que X e Y tenham uma relação linear forte. Ou seja, a relação entre ambas é quase uma reta. Neste caso, que reta seria essa? Qual a reta que melhor descreve a relação linear entre X e Y?

É justamente isso que a regressão linear vai nos dizer.

1. Cálculo da reta de regressão

Sejam X e Y duas variáveis. Um modelo de regressão linear que as relaciona é da seguinte forma:

iii XY εβα ++=

Neste modelo, α e β são constantes e ε é uma variável aleatória de média zero.

Um método para encontrar a melhor reta de regressão é chamado de métodos de mínimos quadrados. A função de primeiro grau que pretendemos encontrar é da forma:

ii bXaY +=ˆ

Onde a é uma estimativa de α , b é uma estimativa de β e Y é uma estimativa de Y .

À diferença entre Y e sua estimativa, chamamos desvio. O desvio é dado por:

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 18

YYe ˆ−=

Pelo método de mínimos quadrados, tentamos obter uma reta de tal modo que a soma dos quadrados dos valores de e (desvio) seja mínima.

É possível demonstrar que os valores de ae b (estimadores de α e β ), obtidos a partir da consideração de que a soma dos quadrados dos desvios seja mínima, são:

( ) ( )[ ]( )2∑

∑−

−×−=

XX

YYXXb

i

ii

XbYa −=

Ou seja, a partir dos valores de X e Y pertencentes à amostra, obtemos os valores de a e b descritos acima. A partir deles, construímos a reta ii bXaY +=ˆ .

O modelo de regressão linear faz algumas considerações. São elas:

· 0)( =iE ε

· 2)( σε =iV

· 0),cov( =ji εε , para ji ≠

Na primeira consideração, temos que o erro (variável aleatória ε ) tem média zero. Esta condição é um pouco mais fácil de entender.

Basta imaginar a situação em que a variável erro não tem média zero. Significa que já se espera que, em média, se cometa um erro diferente de zero. Já se sabe que a regressão tem um viés (que pode ser positivo ou negativo). Ou seja, o modelo não está muito adequado. É melhor reformular o modelo.

A segunda consideração nos diz que a variância do erro é constante. Este fato é denominado homocedasticia.

A terceira condição nos diz que os erros cometidos não são correlacionados.

Não se preocupe muito com estas hipóteses!!

Nosso trabalho é só aplicar as fórmulas para achar ae b . Só as mencionei porque, se a questão falar qualquer coisa a respeito, aí vocês não precisam ficar preocupados, achando que é uma “coisa de outro mundo”. É só calcular normalmente os coeficientes a e b, e pronto.

Para praticar, vamos calcular a reta de regressão para o caso dos quatro alunos que fizeram as provas de física e matemática. Vamos considerar que estes 4 alunos são uma amostra de um conjunto maior de estudantes que se submeteram à tal prova.

As notas desses alunos são:

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 19

Aluno Nota de

matemática ( )X Nota de física ( )Y

1 2 6 2 6 7 3 8 7 4 10 8

Média 6,5 7

Estamos supondo que a população de notas de física da qual foram tiradas as notas acima pode ser descrita segundo o seguinte modelo:

iii XY εβα ++=

Ou seja, estamos supondo que existe uma relação entre as notas de matemática e física. A parcela ε é um erro aleatório. Engloba todas outras variáveis (distintas da nota em matemática) que influenciam na nota de física.

A partir destes valores de notas, construímos o quadro abaixo:

Aluno X Y XX − YY − ( )×− XX ( )YY − ( )2XX − ( )2YY − 1 2 6 -4,5 -1 4,5 20,25 1 2 6 7 -0,5 0 0 0,25 0 3 8 7 1,5 0 0 2,25 0 4 10 8 3,5 1 3,5 12,25 1

TOTAL 8 35 2

Vamos calcular os coeficientes ae b .

( ) ( )[ ]( )2∑

∑−

−×−=

XX

YYXXb

i

ii

23,035

8≅=b

XbYa −=

51,55,635

87 ≅×−=a

E a reta de regressão estimada (“calculada”) fica:

XY 23,051,5ˆ +=

Repare que não sabemos se esta é a real reta de regressão. Mas, a partir dos valores de nossa amostra, esta é a nossa estimativa para a reta de regressão. É uma reta tal que a soma dos quadrados dos desvios é mínima. Lembrando que o desvio corresponde à diferença entre valor observado (Y ) e sua estimativa ( Y ).

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 20

A tabela abaixo mostra os valores estimados da nota de física, dados os valores da nota de matemática.

Aluno Nota de matemática ( )X

Nota de física

observada ( )Y

Nota de física estimada ( )Y

1 2 6 5,97 2 6 7 6,89 3 8 7 7,34 4 10 8 7,80

Plotando estes valores num gráfico, ficamos com:

Reta de regressão estimada

A reta em vermelho é tal que a soma dos quadrados dos desvios em relação às notas de física realmente obtidas é mínima. É a nossa reta estimada (“calculada”).

O modelo de regressão é:

iii XY εβα ++=

Como não temos acesso à população inteira, não sabemos quais os valores de α e β . Temos condições apenas de estimá-los (obtendo a e b )

Com isso, a reta de regressão estimada é:

ii bXaY +=ˆ

Ou seja, a e b são estimadores para α e β . São estimadores não viciados. Isto porque, obedecidas algumas condições (aquelas que indicamos anteriormente: 0)( =iE ε ; 2)( σε =iV e 0),cov( =ji εε , para ji ≠ ), é possível

demonstrar que:

β=)(bE e

α=)(aE

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 21

Nos cálculos envolvidos com a regressão linear, utilizaremos algumas transformações com uma certa freqüência. São elas:

· ( )( )[ ] YXnYXYYXX iiii −=−− ∑∑

· ( )∑ ∑ −=−222

XnXXX ii

São as mesmas transformações que fizemos no início da aula.

10. (PETROBRAS 2008/2 CESGRANRIO) Na estimativa de uma regressão linear, o problema da heterocedasticidade ocorre quando

(A) os dados são transversais.

(B) há autorrelação dos resíduos.

(C) há correlação positiva entre as variáveis independentes.

(D) a variância dos erros não é constante.

(E) as variáveis independentes são negativas.

Resolução

Vimos que uma das hipóteses do modelo é que a variância dos erros seja constante (homocedasticia). Se a variância dos erros não é constante, temos a heterocedasticidade.

Letra D

11. (BACEN – 2006 FCC) Uma empresa, com finalidade de determinar a relação entre gastos anuais com propaganda (X), em R$ 1.000,00 e o lucro bruto anual (Y), em R$ 1.000,00, optou por utilizar o modelo linear simples

iii XY εβα ++= , em que iY é o valor do lucro bruto auferido no ano i e iε o

erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples (α e β são parâmetros desconhecidos). Considerou, para o estudo, as seguintes informações referentes às observações nos últimos 10 anos da empresa:

10010

1

=∑=i

iY ; 6010

1

=∑=i

iX ; 650=×∑ ii YX ; ( ) 40010

1

2=∑

=i

iX ; ( ) 108010

1

2=∑

=i

iY

Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, será de:

a) 84

b) 102,5

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 22

c) 121

d) 128,4

e) 158

Resolução

As hipóteses que o enunciado disse que foram obedecidas são aquelas que indicamos anteriormente - 0)( =iE ε ; 2)( σε =iV e 0),cov( =ji εε , para ji ≠ .

Para calcular a previsão, precisamos encontrar os valores de a e b do modelo de regressão.

( ) ( )[ ]( )2∑

∑−

−×−=

XX

YYXXb

i

ii

( )

( ) 22XnX

YXnYXb

i

ii

−=

2610400

10610650

×−

××−=b

25,140

50

360400

600650==

−=b

E o valor de a fica:

XbYa −=

5,25,71010

6025,1

10

100=−=×−=a

Portanto, o modelo de regressão é:

ii bXaY +=ˆ

ii XY 25,15,2ˆ +=

Quando 80=iX , a estimativa do lucro bruto fica:

5,1028025,15,2ˆ =×+=iY

Letra B

12. (SEFAZ SP 2006 FCC) Em um determinado país, deseja-se determinar a relação entre a renda disponível (Y), em bilhões de dólares, e o consumo (C), também em bilhões de dólares. Foi utilizado o modelo linear simples

iiiC Y εβα ++= , em que Ci é o consumo no ano i, Yi é o valor da renda

disponível no ano i e iε o erro aleatório com as respectivas hipóteses para a

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 23

regressão linear simples, α e β são parâmetros desconhecidos, cujas estimativas foram obtidas através do método dos mínimos quadrados. Para obtenção desta relação considerou-se ainda as seguintes informações colhidas através da observação nos últimos 10 anos:

∑=

=10

1

90i

iC , ∑=

=10

1

100i

iY , ∑=

=10

1

100.1i

iiCY , ∑=

=10

1

2250.1

i

iY , ∑=

=10

1

2010.1

i

iC

Para o cálculo do coeficiente de correlação de Pearson (r), usou-se a fórmula:

)()(

),cov(

CDPyDP

CYr

×= em que ),cov( CY é a covariância entre Y e C, )(YDP é o desvio

padrão de Y e )(CDP é o desvio padrão de C.

Então:

a) obtendo para um determinado ano uma previsão para o consumo de 10 bilhões de dólares, significa que a renda disponível considerada foi de 12,5 bilhões de dólares.

b) o valor da estimativa encontrado para o parâmetro β é igual a 0,4

c) o valor da estimativa encontrado para o parâmetro α é igual a 10.

d) o coeficiente de explicação r2 correspondente é 64%.

e) utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, em um ano, caso a renda disponível seja igual a 15 bilhões de dólares, o consumo será igual a 13 bilhões de dólares.

Resolução

Vamos encontrar os valores de a e b.

( ) ( )[ ]( )2∑

∑−

−×−=

XX

YYXXb

i

ii

( )

( ) 22XnX

YXnYXb

i

ii

−=

Só que aqui, no lugar de X temos Y. E no lugar de Y temos C.

( )

( ) 22YnY

YCnCYb

i

ii

−=

8,0250

200

1010250.1

10910100.12

==×−

××−=b

Assim, a estimativa para o parâmetro β é igual a 0,8. A letra B está errada.

XbYa −=

Só que aqui, em vez de X temos Y e em vez de Y temos C.

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 24

YbCa −=

1108,09 =×−=a

A estimativa do parâmetro α é igual a 1. A letra C está errada.

Se para um determinado ano a previsão de consumo for de 10 bilhões, então a renda considerada foi:

bYaC +=

Y8,0110 +=

( )25,11

8,0

110=

−=Y

A letra A também está errada.

Caso a renda disponível seja de 15 bilhões, o consumo será:

bYaC +=

13158,01 =×+=C

A letra E está correta.

Letra E

13. (MP RO 2005 CESGRANRIO) Considere os dados amostrais de um estudo da relação entre o número de anos que os candidatos a empregos em um determinado banco comercial estudaram inglês na faculdade e as notas obtidas em um teste de proficiência nessa língua.

Com base nessas informações, a reta de mínimos quadrados que melhor explica a relação entre o número de anos de estudo e a nota do teste de inglês é igual a:

(A) y = 1,33 + 3,56x

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 25

(B) y = 2,25 + 1,32x

(C) y = 6,97 + 3,56x

(D) y = 35,32 + 10,9x

(E) y = 254,56 + 13,3x

Resolução

Nas questões anteriores, o enunciado sempre fornecia diversos somatórios, para facilitar o trabalho braçal. Isto não aconteceu nesta questão. Ou seja, para calcular a reta de regressão, precisaríamos fazer todas as contas na mão, o que toma muito tempo.

Talvez por este motivo a questão apresente alternativas muito diferentes entre si.

Observem que, para qualquer valor de x entre 2 e 5, y não supera 10. Já podemos descartar as alternativas C, D, E, que prevêem valores altos para y (muito superiores a 10), mesmo quando x é baixo.

Para se ter uma idéia, considere a letra E. Se fizermos x igual a 1, y será aproximadamente igual a 270, algo totalmente incompatível com a tabela fornecida.

Ficamos entre as alternativas A e B. Para escolher entre ambas, vamos trabalhar com os valores extremos de x. Quando x é igual a 2, as retas das letras A e B prevêem os seguintes valores para y:

Letra A: 8,45

Letra B: 4,89

Observem que o valor da Letra B é muito mais próximo dos valores que y realmente assume, quando x é igual a 2. Já dá para marcar letra B.

Se você ainda ficar em dúvida, pode fazer o mesmo teste para x igual a 5. Neste caso, as estimativas seriam:

Letra A: 19,13

Letra B: 8,85

Novamente, a estimativa da letra B foi bem melhor.

Letra B

14. (TJ PARÁ 2009 FCC) Em uma determinada empresa é realizado um estudo sobre a relação entre os gastos com publicidade, em R$ 1.000,00, e o acréscimo no faturamento anual, em R$ 1.000,00. Foi escolhido para análise o modelo linear simples Yi = α + βXi + εi, sendo que Yi é o acréscimo no faturamento do ano i, Xi representa os gastos com publicidade no ano i e εi é o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples (α e β são parâmetros desconhecidos ). Para obtenção das

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 26

estimativas de α e β utilizou-se o método dos mínimos quadrados com base nas informações dos últimos 10 anos da empresa, ou seja:

18010

1

=∑=i

iY ; 10010

1

=∑=i

iX ; 912.110

1

=∑=

i

i

iYX ; 080.110

1

2=∑

=i

iX ; 440.310

1

2=∑

=i

iY

Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que se a empresa almejar um acréscimo no faturamento, em um determinado ano, de R$ 25.000,00 deverá apresentar, neste período, um total em gastos com publicidade de

(A) R$ 20.000,00.

(B) R$ 18.000,00.

(C) R$ 17.000,00.

(D) R$ 16.000,00.

(E) R$ 15.000,00.

Resolução:

4,110001080

18001912=

−=b

4104,118 =×−=a

Modelo:

XY 4,14ˆ +=

154,1425 =⇒+= XX

Letra E

15. (MPOG 2006 ESAF) Com o objetivo de estimar-se o modelo Y = α + β X, foi retirada uma amostra com cinco pares de observações (X,Y), obtendo-se os seguintes resultados:

Desse modo,

a) Y = – 2 – 2X

b) Y = 2 – 2X

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 27

c) Y = 2X

d) Y = 2 + 2X

e) Y = – 2 + 2X

Resolução:

( )

( )2

10

20

4555

120140

3555

835140222

==−

−=

⋅−

⋅⋅−=

−=

∑XnX

YXnYX

i

iiβ

2328 =⋅−=−= XbYα

Assim, Y = α + β X=2+2x

Letra D

Relação das questões comentadas

01. (CAPES 2008 CESGRANRIO) Considere as asserções a seguir.

O Coeficiente de Correlação Linear de Pearson é necessariamente um número no intervalo )1,1(− .

PORQUE

O Coeficiente de Correlação Linear de Pearson só pode ser calculado para variáveis quantitativas.

Analisando-se as asserções, conclui-se que

(A) as duas asserções são verdadeiras, e a segunda é uma justificativa correta da primeira.

(B) as duas asserções são verdadeiras, e a segunda não é uma justificativa correta da primeira.

(C) a primeira asserção é verdadeira, e a segunda é falsa.

(D) a primeira asserção é falsa, e a segunda é verdadeira.

(E) a primeira e a segunda asserções são falsas.

02. (INEP 2008 CESGRANRIO) Considere as afirmações a seguir a respeito do Coeficiente de Correlação (r) de Pearson entre duas variáveis.

I - Se r = 1, as observações estão todas sobre uma linha reta no diagrama de dispersão.

II - Se r > 0, a variável independente aumenta quando a variável dependente aumenta.

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 28

III - Se r < 0, a variável independente decresce quando a variável dependente decresce.

IV - Se r = 0, não existe relação entre as duas variáveis.

São corretas APENAS as afirmações

(A) I e II

(B) I e III

(C) II e III

(D) II e IV

(E) III e IV

03. (TCU 2008 CESPE-UnB) Uma agência de desenvolvimento urbano divulgou os dados apresentados na tabela

a seguir, acerca dos números de imóveis ofertados (X) e vendidos (Y) em determinado município, nos anos de 2005 a 2007.

Ano Número de imóveis

Ofertados (X) Vendidos (Y) 2005 1.500 100 2006 1.750 400 2007 2.000 700

Considerando as informações do texto, julgue o item subseqüente.

O coeficiente de correlação linear entre X e Y é inferior a 0,8.

04. (AFRF 2005 ESAF) Para uma amostra de dez casais residentes em um mesmo bairro, registraram-se os seguintes salários mensais (em salários mínimos):

Identificação do casal

1 2 3 4 5 6 7 8 9 10

Salário do marido (Y)

30 25 18 15 20 20 21 20 25 27

Salário da esposa (X)

20 25 12 10 10 20 18 15 18 23

Sabe-se que:

22110

1

=∑=i

iY ; 506910

1

2=∑

=i

iY

17110

1

=∑=i

iX ; 317110

1

2=∑

=i

iX

394010

1

=∑=i

iiYX

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 29

Assinale a opção cujo valor corresponda à correlação entre os salários dos homens e das mulheres.

a) 0,72

b) 0,75

c) 0,68

d) 0,81

e) 0,78

05. (Instituto de Gestão Previdenciária do Estado do Pará – 2005 CESPE-UnB) Considere que r(x,y) seja o coeficiente de correlação entre duas variáveis aleatórias x e y. Nesse caso, se ‘a’ e ‘b’ são dois números reais, então o coeficiente de correlação r(ax, by) é igual a:

a) ),( yxrab×

b) ),(22 yxrba ×

c) ),( yxr , se 0>ab

d) ),( yxrba

ab×

+

e) ab

yxr ),(

06. (CAPES 2008 CESGRANRIO)

Se as variáveis Y e 1X forem transformadas, respectivamente, para

5,021 +−= YY e 5,0' 11 +−= XX , o coeficiente de correlação entre 1Y e '1X

(A) 0,382

(B) 0,059

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 30

(C) - 0,059

(D) - 0,118

(E) - 0,382

07. (MP RO 2005 CESGRANRIO) Analise as afirmativas a seguir, a respeito do coeficiente de correlação linear de Pearson entre duas variáveis positivas X e Y:

I - é positivo;

II - não se altera quando adicionamos uma constante positiva aos valores de X;

III - não se altera quando multiplicamos por uma constante positiva os valores de X.

Está(ão) correta(s) a(s) afirmativa(s):

(A) II somente.

(B) I e II somente.

(C) I e III somente.

(D) II e III somente.

(E) I, II e III.

08. (Petrobrás 2004 CESPE-UnB) Julgue o item que segue:

O coeficiente de correlação de Pearson é usado para medir o grau de linearidade (associação) entre duas variáveis (eventos), podendo assumir qualquer valor entre +1 e –1. Os valores de coeficientes iguais a +1 e -1 indicam, respectivamente, relação linear perfeita e ausência total de relação linear entre as variáveis.

09. (Prefeitura de Rio Branco CESPE-UnB) A análise de regressão linear simples e a análise de correlação são técnicas freqüentemente usadas na interpretação de pares de dados. Com relação a essas técnicas, julgue o item a seguir.

O coeficiente de correlação mede o grau de associação entre duas variáveis.

10. (PETROBRAS 2008/2 CESGRANRIO) Na estimativa de uma regressão linear, o problema da heterocedasticidade ocorre quando

(A) os dados são transversais.

(B) há autorrelação dos resíduos.

(C) há correlação positiva entre as variáveis independentes.

(D) a variância dos erros não é constante.

(E) as variáveis independentes são negativas.

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 31

11. (BACEN – 2006 FCC) Uma empresa, com finalidade de determinar a relação entre gastos anuais com propaganda (X), em R$ 1.000,00 e o lucro bruto anual (Y), em R$ 1.000,00, optou por utilizar o modelo linear simples

iii XY εβα ++= , em que iY é o valor do lucro bruto auferido no ano i e iε o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples (α e β são parâmetros desconhecidos). Considerou, para o estudo, as seguintes informações referentes às observações nos últimos 10 anos da empresa:

10010

1

=∑=i

iY ; 6010

1

=∑=i

iX ; 650=×∑ ii YX ; ( ) 40010

1

2=∑

=i

iX ; ( ) 108010

1

2=∑

=i

iY

Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, será de:

a) 84

b) 102,5

c) 121

d) 128,4

e) 158

12. (SEFAZ SP 2006 FCC) Em um determinado país, deseja-se determinar a relação entre a renda disponível (Y), em bilhões de dólares, e o consumo (C), também em bilhões de dólares. Foi utilizado o modelo linear simples

iiiC Y εβα ++= , em que Ci é o consumo no ano i, Yi é o valor da renda disponível no ano i e iε o erro aleatório com as respectivas hipóteses para a

regressão linear simples, α e β são parâmetros desconhecidos, cujas estimativas foram obtidas através do método dos mínimos quadrados. Para obtenção desta relação considerou-se ainda as seguintes informações colhidas através da observação nos últimos 10 anos:

∑=

=10

1

90i

iC , ∑=

=10

1

100i

iY , ∑=

=10

1

100.1i

iiCY , ∑=

=10

1

2250.1

i

iY , ∑=

=10

1

2010.1

i

iC

Para o cálculo do coeficiente de correlação de Pearson (r), usou-se a fórmula:

)()(

),cov(

CDPyDP

CYr

×= em que ),cov( CY é a covariância entre Y e C, )(YDP é o desvio

padrão de Y e )(CDP é o desvio padrão de C.

Então:

a) obtendo para um determinado ano uma previsão para o consumo de 10 bilhões de dólares, significa que a renda disponível considerada foi de 12,5 bilhões de dólares.

b) o valor da estimativa encontrado para o parâmetro β é igual a 0,4

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 32

c) o valor da estimativa encontrado para o parâmetro α é igual a 10.

d) o coeficiente de explicação r2 correspondente é 64%.

e) utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, em um ano, caso a renda disponível seja igual a 15 bilhões de dólares, o consumo será igual a 13 bilhões de dólares.

13. (MP RO 2005 CESGRANRIO) Considere os dados amostrais de um estudo da relação entre o número de anos que os candidatos a empregos em um determinado banco comercial estudaram inglês na faculdade e as notas obtidas em um teste de proficiência nessa língua.

Com base nessas informações, a reta de mínimos quadrados que melhor explica a relação entre o número de anos de estudo e a nota do teste de inglês é igual a:

(A) y = 1,33 + 3,56x

(B) y = 2,25 + 1,32x

(C) y = 6,97 + 3,56x

(D) y = 35,32 + 10,9x

(E) y = 254,56 + 13,3x

14. (TJ PARÁ 2009 FCC) Em uma determinada empresa é realizado um estudo sobre a relação entre os gastos com publicidade, em R$ 1.000,00, e o acréscimo no faturamento anual, em R$ 1.000,00. Foi escolhido para análise o modelo linear simples Yi = α + βXi + εi, sendo que Yi é o acréscimo no faturamento do ano i, Xi representa os gastos com publicidade no ano i e εi é o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples (α e β são parâmetros desconhecidos ). Para obtenção das estimativas de α e β utilizou-se o método dos mínimos quadrados com base nas informações dos últimos 10 anos da empresa, ou seja:

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 33

18010

1

=∑=i

iY ; 10010

1

=∑=i

iX ; 912.110

1

=∑=

i

i

iYX ; 080.110

1

2=∑

=i

iX ; 440.310

1

2=∑

=i

iY

Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que se a empresa almejar um acréscimo no faturamento, em um determinado ano, de R$ 25.000,00 deverá apresentar, neste período, um total em gastos com publicidade de

(A) R$ 20.000,00.

(B) R$ 18.000,00.

(C) R$ 17.000,00.

(D) R$ 16.000,00.

(E) R$ 15.000,00.

15. (MPOG 2006 ESAF) Com o objetivo de estimar-se o modelo Y = α + β X, foi retirada uma amostra com cinco pares de observações (X,Y), obtendo-se os seguintes resultados:

Desse modo,

a) Y = – 2 – 2X

b) Y = 2 – 2X

c) Y = 2X

d) Y = 2 + 2X

e) Y = – 2 + 2X

MATEMÁTICA FINANCEIRA E ESTATÍSTICA PARA ICMS/RJ PROFESSOR: GUILHERME NEVES

Prof. Guilherme Neves www.pontodosconcursos.com.br 34

Gabaritos 01. B 02. A 03. Errado 04. B 05. C 06. C 07. D 08. Errado 09. Certo 10. D 11. B 12. E 13. B 14. E 15. D