43
Econometria para o BACEN Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 1 de 43 AULA 00: REGRESSÃO SIMPLES SUMÁRIO PÁGINA 1. Introdução ao Método de Regressão 5 2. Estimação com base em amostra e Método dos Mínimos Quadrados Ordinários (MQO) 8 3. Tabela ANOVA 15 4. Teste de hipóteses sobre os coeficientes 25 5. Lista das questões apresentadas com gabarito 36 6. Gabarito 43 Olá pessoal! Estão prontos para embarcarmos juntos nesta difícil jornada que leva à aprovação em um concurso público? Então vamos lá! Bom pessoal, primeiro que gostaria de bater um papinho com vocês. - “Mas, afinal de contas, quem é você professor?” Boa pergunta! Meu nome é Jeronymo Marcondes Pinto e já tenho uma grande bagagem no que se refere a concursos públicos. Sou Economista, Mestre e Doutor em Economia Aplicada pela Universidade de São Paulo (USP) e, atualmente, sou Auditor Fiscal do Trabalho (AFT), atuando na área de planejamento e análise econômica e estatística da Secretaria de Inspeção do Trabalho (SIT – MTE sede). Já fiz muitos concursos, tendo sido aprovado em vários, como Auditor Fiscal do

Economet - Bacen 2013 - Est - Aula 00

Embed Size (px)

Citation preview

Page 1: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 1 de 43

AULA 00: REGRESSÃO SIMPLES

SUMÁRIO PÁGINA

1. Introdução ao Método de Regressão 5

2. Estimação com base em amostra e Método dos Mínimos

Quadrados Ordinários (MQO) 8

3. Tabela ANOVA 15

4. Teste de hipóteses sobre os coeficientes 25

5. Lista das questões apresentadas com gabarito 36

6. Gabarito 43

Olá pessoal! Estão prontos para embarcarmos juntos nesta difícil jornada que leva à

aprovação em um concurso público? Então vamos lá! Bom pessoal, primeiro que

gostaria de bater um papinho com vocês.

- “Mas, afinal de contas, quem é você professor?”

Boa pergunta! Meu nome é Jeronymo Marcondes Pinto e já tenho uma grande

bagagem no que se refere a concursos públicos. Sou Economista, Mestre e Doutor

em Economia Aplicada pela Universidade de São Paulo (USP) e, atualmente, sou

Auditor Fiscal do Trabalho (AFT), atuando na área de planejamento e análise

econômica e estatística da Secretaria de Inspeção do Trabalho (SIT – MTE sede).

Já fiz muitos concursos, tendo sido aprovado em vários, como Auditor Fiscal do

Page 2: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 2 de 43

Tesouro Estadual (SEFAZ\RS), Analista de Planejamento, Orçamento e Finanças

Públicas (SEFAZ SP), Economista do MPU, Economista da Câmara Municipal de

São Paulo, Professor universitário da Academia da Força Aérea (AFA), dentre

muitos outros. Porém, já fui reprovado em concurso também!

- “Professor, por que você está nos contando de reprovações, isso não te diminui?”

Muito pelo contrário! Posso dizer que a maior parte da minha experiência deriva do

não sucesso! Aprendi muita coisa ao não ser aprovado, coisas que fizeram com que

eu me tornasse um verdadeiro concurseiro! Ao longo do curso estarei dando “dicas

de concurseiro” para vocês, o que os ajudará nos seus planejamentos, estratégias,

etc.

Vamos falar um pouquinho do Banco Central (BACEN). Sem dúvida nenhum, uma

das melhores instituições para se trabalhar no Brasil, ótima remuneração, condições

de trabalho e grandes possibilidades para crescimento na carreira! Em

contrapartida, concurso muito concorrido e com candidatos de altíssimo nível!

- “Professor, é verdade que só pessoas com mestrado e doutorado passam no

BACEN? Eu ouço o pessoal falar isso nos fóruns, nas conversas de corredor, etc...”

Vou deixar isso muito claro: NÃO! Isso é boato dos grandes, tire isso da sua cabeça

agora! Tenho vários conhecidos no BACEN que sequer têm intenção de fazer

mestrado. Isso é bobeira!

DICA DE UM CONCURSEIRO Gente, o “perdedor” não é aquele que não vence, mas aquele que não tenta por ter medo de perder! Não tenha medo de não ser aprovado, faça o seu melhor! O medo fará com que você desperdice chances que podem mudar a sua vida, além de fazer com que você se esforce menos... o que é, de longe, o principal para ser aprovado!

Page 3: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 3 de 43

Vamos falar do edital de Econometria, afinal, é para isso que estamos aqui!

- “Que edital pequeno! Vai ser fácil”

Quem está pensando isso, pense de novo! Esta é, provavelmente, a matéria mais

difícil da Área 2. Há conteúdos neste edital que são muito complexos, como o vetor

autoregressivo, por exemplo. Eu tenho duas notícias para vocês, uma boa e uma

ruim.

Primeiro a ruim. Esta matéria é muito complexa, exigindo conhecimentos prévios de

estatística (que vocês devem estar estudando) e muito esforço! Esta matéria

assusta muita gente.

Agora a boa. Vocês vão aprender! Eu não estou sugerindo, estou afirmando. A

única coisa que peço é o seu esforço na leitura das aulas e resolução dos

exercícios, pois econometria só se aprende com exercícios!

Uma estratégia de análise interessante é olhar os dois últimos editais de um

determinado concurso. No caso do BACEN, os editais estão exatamente iguais, o

que sugere que há uma tendência de o BACEN exigir que a banca mantenha o seu

estilo de provas.

ECONOMETRIA: 1. Regressão simples e múltipla. 2. Modelos com variáveis defasadas. 3. Séries temporais. 4. Vetor autoregressivo. 5. Processos estocásticos, estacionaridade. 6. Cointegração e correlação de erros. 7. Métodos de estimação. 8. Números índices.

DICA DE UM CONCURSEIRO Muita gente não presta atenção nos editais. As pessoas dão uma lida por cima e acham que está bom. Elas estão erradas! Leia o edital com MUITA calma (mais de uma vez), pois, se você não o fizer, é muito provável que você acabe estudando matérias inúteis para a prova. O que o seu inimigo (a banca) vai fazer está no edital. Ao longo do curso você vai ver porque estou falando isso, apesar de parecer óbvio, mas, garanto, não é!

Page 4: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 4 de 43

O cronograma do curso será o seguinte:

Pessoal, não se preocupem!!! Caso a prova ocorra antes de 11/06/2013, eu adiantarei as aulas. Nós vamos ver tudo mesmo!

Veja que a área “Regressão Múltipla” leva 4 aulas! Isso porque o edital não diz, mas

as provas cobram “violação das hipóteses básicas” em regressão múltipla, mas não

falam isso no edital. Grande sacanagem! Além disso, será necessário um

conhecimento prévio de álgebra matricial, cobrado, inclusive, no último concurso,

que terei que dar uma base para vocês!

Bom, chega de papo, vamos trabalhar!

AULA MATÉRIA DATA

00 Regressão Simples 18/02/2013

01,02, 03 e 04 Regressão Múltipla e

Métodos de Estimação 05/03/13, 19/03/2013,

02/04/2013 e 16/04/2013

05 e 06

Modelos com Variáveis Dependentes Defasadas,

Séries Temporais e Processos Estocásticos e

Estacionariedade

30/04/2013 e 14/05/2013

07 Cointegração e Correção

de Erro e Vetor Autoregressivo

28/05/2013

08 Números Índices 11/06/2013

Page 5: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 5 de 43

1. Introdução ao método de Regressão

Pessoal, hora de forçar a memória escolar e lembrar o que é uma função, ou

melhor, uma função linear. Função é uma relação entre duas variáveis, como por

exemplo:

a)Vendas de uma empresa e gastos em propaganda;

b)Aumento de peso de uma pessoa e quantidade de comida ingerida;

c)Valor da conta de energia e número de equipamentos elétricos em uma casa.

Se chamarmos a primeira variável de cada item de y e a segunda de x,

matematicamente, pode-se descrever tal relação como:

y = f(x).

O que quer dizer “y é função de x”, ou que as vendas de uma empresa é uma

função da quantidade investida em propaganda. Pode-se afirmar que y depende de

x, portanto, a nomenclatura usual chama y de variável dependente ou explicada e x

de variável independente ou explicativa.

Uma das formas de se expressar tal função é a partir de uma relação linear, tal

como:

y = 2 + 3x.

Ou, genericamente, para qualquer valor que pudesse substituir 2 e 3 na equação

acima:

y = α + βx. (1)

Este é um exemplo de uma função linear, dado que o expoente de x é 1. (lembrem-

se que qualquer variável elevada a 1 é igual à própria variável). Esta função linear

(lembrem-se da escola) é uma reta. Se x estivesse elevado ao quadrado, seria uma

parábola. Para que você tenha certeza que isso é uma reta, substitua alguns valores

na primeira equação e os coloque em um gráfico, você verá que se trata de uma

equação de reta.

Page 6: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 6 de 43

- “Professor, ótimo, mas por que você está falando tudo isso?”

Porque, meus queridos alunos, um dos principais objetivos da econometria é

encontrar uma função linear que descreva o comportamento estatístico entre duas

variáveis. Assim, com base em uma série estatística, a econometria possibilitaria

que você encontrasse os valores de α e β na equação (1).

O processo de encontrar a relação entre y e x é chamado de Regressão e,

se for uma reta, como na equação (1), é chamado de Regressão Linear.

Como a equação (1) só possui uma variável explicativa, o processo de

encontrar tal relação se chama Regressão Linear Simples.

Porém, perceba que é muito raro que uma variável do mundo real, ainda mais

quando ligada à economia ou a fenômenos sociais, consiga ser representada por

uma reta. Vamos supor que estamos tratando do exemplo (a) acima descrito para o

ano de 2012 e que possuímos dados de todas as vendas de todas as empresas de

um determinado setor e de todos os gastos de propaganda efetuados por estas

empresas.1 Colocando tal relação em um gráfico:

A reta é representada pela equação (1) e os pontos são os valores que y assume

para cada x.

1 Gente, só para chamar a atenção, por enquanto estamos trabalhando com dados coletados em um único período de tempo, no caso uma única observação por empresa no ano de 2012 (pode ser a soma de todo o ano, ou de um determinado mês, etc.) Este tipo de disposição de dados é chamado de dados em cortes transversais ou “cross section”. Nós só veremos observações ao longo do tempo na seção de séries temporais.

0

2

4

6

8

10

12

14

0 10 20 30 40 50 60

Page 7: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 7 de 43

E aí pessoal, o que vocês estão vendo? Veja que a reta explica bem o

comportamento da variável, se aproximando dos valores reais, mas ainda assim não

explica tudo. Olhe o 3º ponto, nele o valor das vendas aumentou, na média, muito

mais do que o esperado para um determinado investimento em propaganda. Isso

pode ser decorrência de muitos fatores do mundo real, como o fato de que a

empresa talvez fosse muito desconhecida até então, portanto, um pequeno

investimento em propaganda teve resultados muito grandes quando comparado a

empresas que já são relativamente conhecidas. Este tipo de raciocínio pode ser

aplicado para os pontos abaixo da reta também, que apresentam, na média,

retornos abaixo do esperado para um determinado gasto em propaganda.

Assim, se uma versão linear e simples da equação de reta for a mais bem ajustada

à série de dados, pode-se inferir que a equação que representa a real dinâmica do

fenômeno em estudo, no caso, as vendas da empresa é dada por:

Sendo ε o termo que representa o “erro”, ou seja, os desvios das observações com

relação à reta (pensem comigo, o erro é a distância da reta até cada um daqueles

pontos no gráfico acima). O subscrito “i” se refere à cada uma das empresas

analisadas em 2012, isto é, a empresa representada no primeiro ponto no gráfico

tem subscrito (1), a segunda subscrito (2) e assim por diante.

Vocês concordam comigo que não dá para levar em conta todas as variáveis que

afetam o comportamento das vendas de todas as empresas? Pode ser que um

gerente comercial muito bom de serviço tenha pedido demissão da empresa (4), o

que puxaria suas vendas para baixo, apesar do investimento em propaganda, etc.

Assim, o erro leva em conta estes efeitos impossíveis de se mensurar, mas que

afetam a dinâmica de y.

Bom, apesar do fato de que este erro é algo que nós temos que aprender a viver

com ele, o mesmo possui uma característica interessante que nós temos que levar

em conta:

( )

Isto é, a média dos erros é igual a zero. Ou seja, os desvios “para cima da reta”

igualam o valor dos desvios” para baixo da reta” na média.

Page 8: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 8 de 43

Ou seja, estes erros são supostamente aleatórios, então a teoria econométrica nos

permite inferir que, se o modelo estiver corretamente especificado o erro será, na

média, igual a zero.

E aí rapaziada, que cara de sono é esta? Vamos acordando, pois um futuro analista

do BACEN não pode dormir em serviço! Você será bem remunerado e com status,

mas com muita responsabilidade.

2. Estimação com base em amostra e Método dos Mínimos Quadrados Ordinários (MQO)

Vamos ver se vocês estão realmente atentos: lembram-se quando eu disse que a

regressão tinha a ver com todas as empresas, todas as receitas de vendas e todos os gastos em propaganda? Então, hora de lembrar um pouquinho do curso de

estatística do Estratégia, o conceito de população e amostra.

Atenção, até agora falamos de uma regressão com a população, ou universo, das

variáveis escolhidas. Mas, na maioria dos casos, não possuímos o universo. Por

exemplo, no caso de uma regressão do valor salarial obtido por um trabalhador em

função do nível de escolaridade de cada um destes, é praticamente impossível se

realizar este exercício, pois a base de dados para isto é infinitamente grande.

Assim, na maior parte das vezes, o pesquisador acaba trabalhando com uma

População = conjunto de todos os elementos que possuem determinada característica. No exemplo anterior, todas as empresas, gastos e receitas. Amostra = parte não nula da população, mas menor do que esta última.

( )

1ª hipótese sobre o modelo de regressão:

Page 9: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 9 de 43

amostra! Ao se avaliar uma regressão para uma amostra estaremos a estimar os parâmetros de regressão (α e β na equação (1)), ou como nós falamos no dia a

dia, estimar uma regressão.

- “Tá bom Professor, mas, afinal de contas, como se estima uma regressão?”

Ótimo! Tente imaginar um momento: a estimativa dos parâmetros deve ser feita de

forma a garantir o que?

É isso! De forma a minimizar os erros. Isso é feito pelo método dos Mínimos

Quadrados Ordinários (MQO) que nos dá um valor estimado para α e β, que,

chamaremos, a partir daqui, de e .

Com base no fato de que a média dos erros é igual a zero, não há como se

minimizar a soma dos erros, dado que o valor sempre será zero. Assim, o objetivo

do método é minimizar a soma dos quadrados dos erros, o que é feito pelo

estimador de MQO. Gente, sejamos práticos, nunca caiu e, provavelmente, nunca

vai cair a derivação do estimador de MQO, assim, decorem:

Sendo que o travessão sobre determinada variável representa o valor médio da

mesma, define-se a média de uma variável, bem como o valor de uma variável

centrada na média:

Assim, b pode ser encontrado pelo somatório da multiplicação de cada

com seu respectivo (covariância entre x e y) dividido pela soma de todos os

( )

( )

Page 10: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 10 de 43

elevados ao quadrado (variância de x). Gente, muita atenção mesmo, perceba que

as variáveis devem ser inseridas na fórmula acima de forma a estarem centradas na

média, ou seja, reduzidas do valor da média de sua série.

No caso da segunda equação, que define α (também chamado de intercepto), há

uma forma específica, mas ela é um pouco esquisita e eu acho que esta forma

facilita a memorização, dado que com os valores médios das variáveis e com a

estimativa de b, encontra-se .

Exercício 1.

Só para vocês ficarem contentes em ver uma aplicação prática, vamos fazer um exemplo. Vamos lá! Dada a seguinte série de dados, estime a regressão linear Y = f(X), ou costumeiramente chamada de “Y contra X”.

Variáveis X Y

103 160

123 167

145 207

126 173

189 256

211 290

178 237

155 209

141 193

156 219

166 235

179 234

197 273

204 272

125 181

112 166

107 161

135 195

144 201

188 255

Soma 3084 4284

Média 154,2 214,2

Page 11: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 11 de 43

Resolução

Bom, primeiramente, vamos encontrar alguns dados necessários para a resolução.

Vamos aplicar a fórmula:

Com base no resultado acima, podemos calcular:

Portanto, a reta estimada por meio de MQO é:

Variáveis X Y X

centrado Y

centrado X(centrado)*Y(centrado) (X centrado)² (Y centrado)²

103 160 -51,2 -54,2 2775,04 2621,44 2937,64

123 167 -31,2 -47,2 1472,64 973,44 2227,84

145 207 -9,2 -7,2 66,24 84,64 51,84

126 173 -28,2 -41,2 1161,84 795,24 1697,44

189 256 34,8 41,8 1454,64 1211,04 1747,24

211 290 56,8 75,8 4305,44 3226,24 5745,64

178 237 23,8 22,8 542,64 566,44 519,84

155 209 0,8 -5,2 -4,16 0,64 27,04

141 193 -13,2 -21,2 279,84 174,24 449,44

156 219 1,8 4,8 8,64 3,24 23,04

166 235 11,8 20,8 245,44 139,24 432,64

179 234 24,8 19,8 491,04 615,04 392,04

197 273 42,8 58,8 2516,64 1831,84 3457,44

204 272 49,8 57,8 2878,44 2480,04 3340,84

125 181 -29,2 -33,2 969,44 852,64 1102,24

112 166 -42,2 -48,2 2034,04 1780,84 2323,24

107 161 -47,2 -53,2 2511,04 2227,84 2830,24

135 195 -19,2 -19,2 368,64 368,64 368,64

144 201 -10,2 -13,2 134,64 104,04 174,24

188 255 33,8 40,8 1379,04 1142,44 1664,64

Soma 3084 4284

21199,2 31513,2

Média 154,2 214,2

1059,96 1575,66

Page 12: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 12 de 43

Voltando à aula!

Pessoal, vocês estão entendendo o que representa cada coeficiente? Pense um

pouquinho, se o valor gasto em propaganda aumenta em 1 (uma unidade), espera-

se que o valor das vendas varie, na média, em b.

Cabe destacar a diferença entre erros e resíduos. Os erros são decorrentes dos

aspectos que relatamos acima, já os resíduos são os erros de ajuste após a estimação da reta original (1), ou seja, na regressão feita com base na amostra e

não mais na população. Assim, a versão estimada de (1) é dada por:

(2)

Então, estes parâmetros são a versão estimada dos parâmetros na equação (1).

Portanto, são os resíduos da regressão com base em uma amostra n da

população N.

Meus amigos, vocês conseguem enxergar que este resíduo tem mais um problema

além dos já citados para os erros? Lembra do gerente comercial eficiente que pediu

demissão? Então, este é um desvio natural de se interpretar um comportamento

econômico, derivado de influências de infinitas variáveis, a partir de uma reta.

Agora, há outro fator em cena, há um “erro” decorrente de se inferir uma estimativa

da reta (1) a partir de (2). Ou seja, o fato de nós só termos uma amostra leva a

desvios com relação à estimativa dos parâmetros. Dado que, com base na nossa

regressão estimada, o valor esperado de y é:

Assim, os resíduos são:

( )

Bom pessoal, nós já temos uma estimativa de uma regressão, agora vocês podem

estar se perguntando: “Será que isso está bom? Será que esta reta representa bem

a situação ocorrida no mundo real?”

Então, há diversas formas, que devem ser avaliadas de forma conjunta, para

responder tal pergunta, mas vamos adiantar algumas.

Page 13: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 13 de 43

Entenderam? Vamos ver:

Exercício 2

(FCC - ANALISTA BACEN 2005) Uma empresa com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1000,00, e o lucro bruto anual (Y), em 1000,00, optou por utilizar o modelo linear simples Y(i) = a + bX(i) + e(i), em que Y(i) é o valor do lucro bruto auferido no ano (i), X(i) é o valor do gasto com propaganda no ano (i) e e(i) o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples.

Considerou, para o estudo, as seguintes informações referentes às observações dos últimos 10 anos da empresa:

Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, será de:

a) 158

b) 128,4

c) 121

d) 102,5

e) 84

Page 14: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 14 de 43

Resolução

Bom, primeiramente, não caia na armadilha! Estes valores que o exercício te deu

não estão centrados na média. Portanto, com base em propriedades estatísticas,

pode-se demonstrar que:

( )

Assim, dadas as formas funcionais para cálculo:

Pode-se inferir as estimativas:

( )

Assim, temos a equação de reta. Substituindo X = 80, tem-se que:

Page 15: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 15 de 43

3. Tabela ANOVA

Vamos lá pessoal, de olho na aprovação!

Agora vamos falar sobre o grau de ajustamento de uma regressão. Isso é, quanto

uma reta explica dos dados?

Bom, é fácil pensar que há uma parcela da variação explicada pela regressão, ou

seja, aqueles parâmetros que nós estimamos devem explicar parte da variação real

nas observações da amostra, excluída a parte explicada pelos resíduos.

-“Professor, não entendi nada!”

Ok. Acho que esta parte que fica mais intuitiva com a matemática. E aí, qual a

expressão que vocês acham que representa a parcela explicada por uma

regressão? Claro que é:

Dado que α é constante, ela não compõe a parte da variância explicada. Assim, com

o intuito de se definir uma expressão para a variância explicada pode-se descartá-

la:

Portanto, trata-se da parte estimada da reta que dá o valor previsto de y para cada

x, que é costumeiramente descrita como a variável dependente com um acento

circunflexo em cima.

E a parte não explicada?

É evidente que a soma de ambas as equações geram a equação de reta original,

com a soma do comportamento dos resíduos com a parte explicada. Assim,

precisaríamos somar tais expressões para encontrar o total e, a partir daí, tentar

entender como cada uma destas parcelas compõem a tal parcela.

Page 16: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 16 de 43

Mas, sabendo-se que os resíduos tem soma igual a zero, o estudo será feito com

base na soma dos quadrados dos resíduos e, por conseqüência, com base na

soma dos quadrados explicados e na soma dos quadrados totais.

Vamos, primeiro, pelo mais fácil. A soma dos quadrados totais (SQT) é:

Segue-se a Soma dos Quadrados Explicados (SQE):

E a Soma dos Quadrados dos Resíduos (SQR):

Vocês estão entendendo o que nós estamos fazendo? Em termos bem leigos, nós

estamos decompondo o quanto uma regressão consegue explicar de quanto ela não

consegue! Será que você consegue pensar em um jeito de dizer, em termos percentuais, o quanto uma regressão consegue explicar de uma série de dados, ou

seja, o quanto a regressão estimada se aproxima do real processo gerador de

dados (equação (1))?

Beleza! A resposta é fácil mesmo e é dada por:

( )

( ) ( )

Page 17: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 17 de 43

Este é o famoso R² ou coeficiente de determinação. Ele determina “o quanto a

regressão está conseguindo refazer da série original a partir de valores estimados”.

Assim, a regressão será bem ajustada quanto mais próximo este coeficiente se

aproximar de 1. Ou seja, um valor de 0,97 indica que a regressão estimada 97% da

variância de y é explicada por x.

Vocês se lembram do coeficiente de correlação amostral nas aulas de estatística?

Então, pode-se demonstrar que:

√ | |

Esta é, somente, uma das formas de se encontrar o R². Mas, ela já caiu várias

vezes, então, meus amigos, vou simplificar para vocês: decorem! No exercício (10),

vou ensinar outra forma importante também. Mas, aconselho tentar fazê-lo primeiro!

Agora podemos partir para a análise da tabela ANOVA. A partir da definição de

SRT, SQT e SQE, iremos construir uma tabela que indica como as parcelas

decompostas variam ao redor da média da regressão como um todo e se todos os

coeficientes em conjunto tem capacidade de explicar a regressão, o que será mais

útil a partir da próxima aula, conforme veremos a seguir.

Esta tabela é chamada de ANOVA e tem o seguinte formato:

Soma dos Quadrados Graus de Liberdade Quadrados Médios Teste F

SQE K

SQR N – k – 1

SQT N – 1

Page 18: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 18 de 43

Sendo N o número de observações da amostra e k o número de variáveis

explicativas na regressão, assim, no caso da regressão simples, k = 1.

Novamente pessoal, vamos nos lembrar das aulas de Estatística do Estratégia.

Sendo SQR a soma dos quadrados dos resíduos e sua média igual a zero, se nós

dividirmos tal expressão pelos seus graus de liberdade, o que teríamos?

O que é isso? Não é a variância? Exatamente! Trata-se de uma medida não

tendenciosa da variância dos erros. Portanto, o quadrado médio dos resíduos

iguala a variância dos erros. O mesmo pode ser dito com relação ao coeficiente

SQE/k, haja vista o mesmo medir também uma variância, mas a variância explicada.

Bom, nós já temos a variância dos erros e a variância explicada pela regressão,

dada por

, portanto cabe questionar: será que a esta regressão faz sentido?

Não entendeu? Vamos lá. Nós poderíamos encontrar uma regressão na qual os

quadrados médios dos resíduos (variância dos erros) representam a maior parte da

variabilidade da regressão, invalidando a representatividade da regressão como um

processo que poderia ter gerado aquelas variáveis explicadas. Assim, a parte que

se constitui como uma reta (bx) só explicou alguma parte da variável explicada “por

coincidência”, isto é, sem significância estatística.

Como nós podemos verificar isso? Novamente, lembrem-se das aulas de

Estatística, agora, no caso, do teste F. Só para lembrar, o teste F é um teste

estatístico que visa comparar variâncias e se a diferença entre ambas é

estatisticamente significante. Analiticamente, sob a hipótese nula, o quociente entre

dois quadrados médios, isso é, entre duas variâncias, segue uma distribuição F.

A título de ilustração vamos nos utilizar da tabela ANOVA que nós construímos.

Portanto:

Page 19: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 19 de 43

Sob a hipótese nula de que estas duas variâncias são iguais, a estatística de teste

segue uma distribuição F com k graus de liberdade no numerador e N - k – 1 graus

de liberdade no denominador.

O que você está buscando? Bom, quando você estima uma regressão, você busca

encontrar uma relação estatisticamente significante que explique o fenômeno que

está em estudo. Assim, se você concluir que não há como rejeitar a hipótese nula

de que a variância explicada pela sua regressão é igual à variância dos resíduos, na

verdade, você não encontrou nada! Isso deriva do fato de que, se isso aconteceu, é

muito provável que toda parcela que você conseguiu explicar da variável

dependente foi por acaso, o que deve ter acontecido somente em virtude da

variação dos erros e não de uma especificação correta de uma reta. Ou seja, toda

sua regressão não tem grande validade em termos de explicar a dinâmica da

variável dependente em estudo.

Portanto, o teste F aplicado ao estudo de regressão é equivalente a um teste de

hipóteses conjunto de que todos, ou parte de todos, os coeficientes têm valor igual

a zero.

É pessoal, o buraco é mais embaixo mesmo! Olhe só

isso: o teste F é um teste de comparação de variâncias, porém o mesmo pode

ser utilizado para fazer testes sobre médias.

Isso é possível se você pensar em termos de desvios de uma média. Veja, por

exemplo, o caso em que você queira testar a diferença da produtividade média de

várias empresas. Primeiramente, você vai dividir estas empresas por grupos de

atividade e a sua suposição inicial será de que não há diferenças na média de

produtividade entre os diversos setores. Assim, você pode decompor a variabilidade

das produtividades encontradas com relação à média em duas parcelas:

Desvio da Média total (DM) = DM dentro do Setor + DM entre Grupos

Assim, nós iríamos avaliar se o quanto as observações estão desviando das médias

dos seus respectivos grupos (dentro de cada setor) se iguala aos desvios que as médias dos grupos estão tendo com relação à média do somatório de todos os grupos, ou seja, da média de toda a amostra (média da economia em análise)!

Page 20: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 20 de 43

Então, se você concluir que não há diferença entre estes dois desvios é equivalente

a dizer que as médias de todos os grupos são iguais.

Entenderam o conceito do problema? Mas, como se utilizar do teste F para se

chegar a tal diagnóstico, afinal, o teste F é para comparação de variâncias. Mas,

atenção, qual é a variável em análise aqui? É isso mesmo, o desvio com relação à

média. Por suposição, vamos trabalhar com uma variável x:

Ok. E se nós fizermos a soma dos quadrados de DM ?

( )

Se nós dividirmos tal expressão pelos seus graus de liberdade, isso não é a

variância? Exatamente!

Assim, ao se utilizar da Soma dos Quadrados dos DM entre setores como nosso

SQE e da Soma de Quadrados dos DM dentro dos setores como nosso SQR,

podemos construir a tabela ANOVA. A análise desta tabela e do teste F nos permite

inferir se há diferenças entre os quadrados destes dois desvios, que nada mais é

que a variância. Caso não seja possível rejeitar a hipótese nula de que as variâncias

são iguais, você concluiu que as médias dos setores são iguais à média da amostra

e, portanto, iguais entre si.

Complicadinho né? Vamos fazer um exercício para entender.

Exercício 3.

(CESGANRIO – BACEN/2010)

Fonte de Variação

Soma dos Quadrados

Graus de Liberdade

Média de Quadrados

F

Fator 6752,0 2

Erro 30178,0

Total 36930,0 29

Analisando a tabela ANOVA acima, considere as conclusões a seguir:

Page 21: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 21 de 43

I – A análise de variância (ANOVA) teste se várias populações têm a mesma média; para tanto, são comparadas a dispersão das médias amostrais e a variação existente dentro da amostra

II – ANOVA indica que:

III – A estatística F, calculada com a informação da tabela acima, é acima 2,651 e deve ser comparada com o valor tabelado F(2,29) para um grau de significância escolhido.

É correto APENAS o que se conclui em:

a) I

b) III

c) I e II

d) I e III

e) II e III

Resolução

Com base em toda aquela discussão sobre o teste F e na sua capacidade de ser

utilizado para testar se as médias de uma determinada população são iguais,

vejamos:

a) Verdadeiro. É exatamente isso. Nós vamos comparar a dispersão das médias

amostrais, no nosso exemplo, DM entre os setores, e a variação dentro da amostra,

DM dentro do setor.

b) Verdadeiro. A hipótese nula se refere à igualdade de variâncias dos Quadrados

Médios calculados na ANOVA. Assim, tal hipótese é equivalente a estabelecer que

as médias dos setores sejam iguais, no nosso exemplo. A hipótese alternativa, por

conseqüência, é o seu oposto.

c) Falso. Sejam espertos, você nem precisa calcular nada, o teste F tem seus graus

de liberdade determinados pelo número de graus de liberdade do numerador e do

Page 22: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 22 de 43

denominador do teste, respectivamente. O teste F, no caso, deveria ser calculado

com base em SQT e SQR, que, na questão, é representado pelas expressões fator

e erro, respectivamente. Assim, o teste F deve ser calculado com base nos

seguintes graus de liberdade: (2,27).

Exercício 4

Vamos lá galera, utilizando os dados do exercício (1), construa a tabela ANOVA para aquele caso.

Resolução

Com base na tabela do exercício (1), vamos definir SQT:

. Já para o caso de SQE:

( )

Assim, pode-se obter SQR:

Os graus de liberdade poder ser retirados diretamente do número de variáveis

explicativas (k = 1) e do número de observações na amostra (N = 20). Assim, a

tabela ANOVA fica da seguinte forma:

Soma dos Quadrados Graus de Liberdade Quadrados Médios Teste F

30893,12 1

30893,12

896,75

620,08 18

34,45

31513,2 19

1658,59

Como o valor tabelado de F com 1 grau de liberdade no numerador e 18 no

denominador é igual a 4,41, rejeita-se a hipótese nula de que a Variância Explicada

é igual à Variância dos resíduos (dado que 896,75 > 4,41).

Page 23: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 23 de 43

Voltando à aula!

Antes de encerrarmos o assunto sobre o teste F, temos

de ressaltar uma coisa importante. A teoria estatística por detrás da derivação do

teste exige que a variável y seja normalmente distribuída.

Todo mundo se lembra da distribuição normal da aula de estatística, certo? Trata-se

de uma distribuição de probabilidade, que associa determinado valor a determinada

probabilidade da seguinte forma:

Já que y é composto de uma parte fixa (reta) e de uma parte aleatória (erro), a

variância da variável explicada é igual à variância do erro. Assim, a hipótese de

normalidade de y é equivalente a se afirmar que o erro tem de ser normalmente

distribuído. Portanto, esta será nossa segunda hipótese sobre o modelo de

regressão.

Um exercício para testar o seu conhecimento.

2º Hipótese sobre o modelo de regressão

Os erros são normalmente distribuídos

Page 24: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 24 de 43

Exercício 5.

(FCC - ANALISTA BACEN 2005) Uma empresa com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1000,00, e o lucro bruto anual (Y), em 1000,00, optou por utilizar o modelo linear simples Y(i) = a + bX(i) + e(i), em que Y(i) é o valor do lucro bruto auferido no ano (i), X(i) é o valor do gasto com propaganda no ano (i) e e(i) o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples.

Considerou, para o estudo, as seguintes informações referentes às observações dos últimos 10 anos da empresa:

Montando o quadro de análise de variância (ANOVA), tem-se que:

a) a variação total apresenta um valor de 62,5.

b) a variação explicada, fonte de variação devido à regressão, apresenta um valor igual a 80.

c) Dividindo a variação residual pela variação total, obtemos o coeficiente de determinação (R²).

d) o valor da estatística F necessária para o teste da existência da regressão é igual ao quociente da divisão da variação explicada pela variação residual.

e) a variação residual apresenta um valor igual a 17,5.

Page 25: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 25 de 43

Resolução

Vamos começar definindo SQT, SQE e SQR:

( )

Assim, chega-se ao gabarito (e). Sabe-se que a alternativa (c) está incorreta porque

o R² surge da divisão da variação explicada pela total, enquanto que a alternativa

(d) advém da divisão dos quadrados médios explicados e dos resíduos e não

somente da variação.

4. Teste de hipóteses sobre os coeficientes

E ai pessoal? Ainda estão aí? Bom para acordar uma dica de concurseiro.

Bom, vamos lá!

Na última seção nós vimos como o teste F avalia a hipótese conjunta de que todos

os coeficientes têm valor igual a zero. Agora vamos avaliar a significância estatística

dos coeficientes, um por um. Com efeito, vamos avaliar a significância estatística de

b isoladamente, tal como na equação (2)

Dica de um Concurseiro Lembrem-se, a quantidade de horas estudadas não é tão importante quanto a regularidade de estudo. Você precisa se condicionar, acostumar seu cérebro com as informações. O que eu quero dizer é: não adianta estudar 12 horas em um dia e depois ficar 2 semanas sem estudar. Você vai perder o ritmo. Tente ter alguma regularidade nos seus estudos. Crie uma rotina. Viva, coma e respire concurso público. Não estou dizendo que uma boa rachada não ajuda, só estou pregando a necessidade de uma regularidade no planejamento de seus estudos. Isso é o básico da teoria da Administração: primeiro planejar, depois executar. Isso serve para concursos.

Page 26: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 26 de 43

- “Peraí professor, mas você acabou de ensinar a aplicação do teste F na regressão

simples e disse que ele avalia a hipótese nula de que todos os coeficientes são

iguais a zero, ou seja, b é igual a zero. Então qual a diferença deste teste de

hipóteses para o teste F?”

Se você pensou isso, parabéns! Já está a caminho de ser um grande analista do

BACEN.

Pois é, realmente, no caso da regressão linear simples não há diferença. Mas, a

regressão simples não é a única forma de regressão possível. Nós estudaremos a

partir da próxima aula a regressão múltipla, que, no caso, depende de mais de um x.

Por exemplo:

Assim, por exemplo, as vendas de uma empresa podem ser função não somente

dos gastos em propaganda, mas também do investimento em treinamento de

pessoal, da parcela do mercado dominada por ela, etc. Este é um caso de

Regressão Linear Múltipla.

Neste caso, é fácil perceber que o resultado do teste F não é equivalente ao

encontrado nos testes de hipótese sobre b. O teste de hipóteses sobre os

coeficientes analisa a significância estatística de cada coeficiente isoladamente,

enquanto que o teste F analisa a significância estatística conjunta de todos os coeficientes ao mesmo tempo.

Então meus amigos, agora que vocês entenderam o porquê do teste de hipóteses,

além do teste F, vamos entender como operacionalizá-lo.

Novamente, vamos nos lembrar das aulas de estatística. Mas, vamos dar uma

pincelada de forma genérica primeiro.

A idéia básica do teste de hipóteses é afirmar se a ocorrência de um evento tem

uma probabilidade estatística significante, dado um valor de significância, ou seja,

um valor que seria considerado “muita coincidência”.

Vamos para um exemplo prático de nossa aula. Com base na nossa amostra e na

regressão estimada, será que os gastos em propaganda realmente afetam as

vendas da empresa? Isso seria equivalente a estipular duas hipóteses, uma

hipótese nula ( ) e outra alternativa ( ) de tal forma que:

Page 27: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 27 de 43

A estatística de teste deve ser calculada da seguinte forma:

Sendo s o valor estimado para o desvio padrão do parâmetro, que, por se tratar de

uma amostra, é desconhecida.2

A estimativa para a variância de b é dada por:

Ao calcular a estatística de teste, cabe compará-la com o valor tabelado da

distribuição t de Student, distribuição esta que é utilizada para os casos em que a

variância populacional não é conhecida. Assim, é preciso fazer o cálculo acima e

consultar tabela t com N-k-1 graus de liberdade e com a significância estatística que

você achar conveniente.3 Olhe o gráfico abaixo.

2 Lembrem-se, o desvio padrão é igual à raiz quadrada da variância. 3 A consulta na tabela irá depender dos graus de liberdade dos quadrados médios dos resíduos e da significância estatística que o pesquisador achar relevante, como 5%, por exemplo, o que se escreve como t(N-k-1, 5%).

( )

Page 28: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 28 de 43

Caso o valor calculado seja inferior ao valor tabelado, isto significa que não é

possível rejeitar a hipótese nula de que o coeficiente da reta é igual a zero,

situando-se dentro da área branca do gráfico acima. Olha pessoal, o que se está

dizendo com isso é que, dado um valor considerado improvável (área cinza), a

estatística nos permite dizer se este valor está dentro destes padrões esperados.

Caso o valor calculado supere o valor tabelado (área cinza gráfico), rejeita-se a

hipótese nula de que o coeficiente é igual a zero. Ou seja, como aquele “cantinho” é

improvável no caso de a hipótese nula ser verdadeira e como a estatística de teste

nos diz que o valor encontrado está lá, a hipótese nula deve estar errada.

Entenderam?

A idéia básica deste teste de hipóteses sobre os parâmetros da regressão é avaliar

se estes últimos apresentam significância estatística. Se o teste de hipóteses indicar

que o parâmetro da equação (2) tem valor igual a zero, deve-se pensar em outra

forma funcional, com outra(s) variável(is) explicativa(s), para explicar a variável y.

Em outras palavras, uma conclusão deste tipo indica que os gastos em propaganda

não afetam as vendas, devendo-se excluir tal variável.

Vamos lembrar a aula de estatística de novo? Há uma coisa importante demais para

se saber. Respondam-me: o que é o p-valor? Bom, vocês têm que me responder

o seguinte:

- Professor, eu aprendi tudo no curso de estatística do “Estratégia Concursos”! O p-

valor é o menor nível de significância ao qual a hipótese nula pode ser rejeitada.

O que é isso?

Vejamos, se você obtém um valor de 0,04 para seu p-valor, isso significa que a

hipótese nula pode ser rejeitada a 4% de significância. Mas, se você escolheu 5%

como seu nível de significância, ou seja, você definiu que 5% é muita coincidência,

você deve rejeitar a hipótese nula. Entenderam? Dêem uma pensada, olhe seus

materiais de estatística, matutem! Matutar é parte do estudar!

É isso aí pessoal. Vamos fazer exercícios?

Page 29: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 29 de 43

(ESAF – Agente Fiscal de Tributos Estaduais – SEFAZ PI) Um investigador toma uma amostra de 10 carregamentos levados a efeito em caminhões de uma firma de transporte. Para cada carregamento (i) anota a distância percorrida pelo caminhão em 1.000 Km (X(i)) e o tempo de entrega do carregamento em dias (Y(i)). Neste contexto postula que o modelo de regressão linear

Y(i) = α + βX(i) + ε(i), i = 1, 2...10

se ajusta a suas observações, onde α e β são parâmetros desconhecidos e os ε(i) são componentes estocásticas (resíduos) não diretamente observáveis, não correlacionadas, com média zero e variância σ² > 0.

Foram encontradas as estatísticas seguintes no ajuste do modelo de regressão linear:

X(i) = 8;

X(i)² = 12

X(i)*Y(i) = 26

Y(i) = 29

Y(i)² = 100

Com base nessas informações responda:

Exercício 6

Assinale a opção que corresponde à estimativa do aumento esperado no tempo de entrega decorrente da adição de 1.000km na distância percorrida.

a) 0,5 dias

b) 1,0 dias

c) 3,0 dias

d) 5,0 dias

e) 4,5 dias

Page 30: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 30 de 43

Resolução

Novamente pessoal, vamos se lembrar da fórmula que define o parâmetro b.

Sabendo-se que:

( )

Assim, vamos estimar o parâmetro:

Dado que o X é medido em 1.000 km, o aumento previsto é de uma unidade, o que

gera um aumento no tempo de entrega de 0,5 dias.

Exercício 7

Assinale a opção que corresponde à estimativa de mínimos quadrados do parâmetro σ².

a) 1,77

b) 1,81

c) 0,40

d) 1,22

e) 1,13

Resolução

Mesma coisa que fizemos anteriormente, que é determinar o quadrado médio do

resíduo. Isso será feito da seguinte forma:

Page 31: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 31 de 43

( )

( ) (

)

Portanto, SQR = SQT – SQE = 14,5.

Assim:

Exercício 8

(IBGE 2002 – Analista Socioeconômico) Numa regressão linear simples, o coeficiente de determinação representa:

a) a média da soma dos quadrados dos desvios

b) a soma dos quadrados dos resíduos

c) a raiz quadrada do coeficiente de correlação amostral

d) a variância dos dados

e) a porcentagem da variação total dos dados que é explicada pela regressão

Resolução

Bom pessoal, basta ler a definição do R² que nós chegaremos facilmente à

alternativa (e). Com o que nós já sabemos, dá para responder tranquilamente.

Entretanto, quero destacar a alternativa (c). Vocês já sabem que:

Coeficiente de determinação = (coeficiente de correlação amostral)²

Page 32: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 32 de 43

Exercício 9

(SUSEP 2010 – Atuária) A partir de uma amostra aleatória [x(1), y(1)], [x(2), y(2)]...[x(20), y(20)] foram obtidas as estatísticas:

Média de X = 12,5

Média de Y = 19

Variância de X = 30

Variância de Y = 54

Covariância entre X e Y = 36

Calcule a reta de regressão estimada de Y contra X.

a) Y = 19 + 0,667*X

b) Y = 12,5 + 1,2*X

c) Y = 4 + 1,2 X

d) Y = 19 + 1,2 X

e) Y = 80 + 22,8X

Resolução

Vamos lá!

( )

( )

Com base neste resultado:

( ) ( )

Assim:

Page 33: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 33 de 43

Exercício 10

(SUSEP 2010 – Atuária) Com os dados da questão anterior, determine o valor da estatística F para testar a hipótese nula de que o coeficiente angular da reta do modelo de regressão linear simples de Y contra X é igual a zero.

a) 144

b) 18

c) 36

d) 72

e) 48

Resolução

Bom, essa é complicada. Agora vamos ter que para pensar um pouquinho. Vamos

nos relembrar de como é calculada a estatística F:

Se nós dividirmos o numerador e o denominador pelo mesmo número, o total da

fração permanece a mesma. Assim, vamos dividir os dois membros por SQT:

(

)

(

)

(

)

( )

( )

Viram? Esta é uma forma muito importante de se definir o cálculo do R². Decorem!

Agora fica fácil.

O SQT da regressão é a própria variância de y, enquanto que ( ).

Assim:

Page 34: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 34 de 43

( ) (

)

Calculando a estatística F, chega-se a:

Exercício 11

(ESAF – AFRFB 2009) Na análise de regressão linear simples, as estimativas

e dos parâmetros e da reta de regressão podem ser obtidas pelo método de Mínimos Quadrados. Nesse caso, os valores dessas estimativas

são obtidos através de uma amostra de n pares de valores com (i = 1,

2,....,n), obtendo-se: , onde é a estimativa de .

Para cada par de valores com (i = 1, 2,...,n) pode-se estabelecer o desvio

ou resíduo - aqui denotado por - entre a reta de regressão e sua

estimativa . Sabe-se que o Método de Mínimos Quadrados consiste em

adotar como estimativas dos parâmetros e os valores que minimizam a soma dos quadrados dos desvios . Desse modo, o Método de Mínimos Quadrados consiste em minimizar a expressão dada por:

a)

b)

c)

d)

e)

Page 35: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 35 de 43

Resolução Pessoal, o que faz o método do MQO?

Isso mesmo! Ele minimiza a soma dos quadrados dos resíduos. Portanto, é fácil

perceber que a expressão que mostra isso, dada a notação usada na questão, é:

[ ( )] ( )

O gabarito é (a), mas está incorreto, pois deveria haver um sinal de “+” antes de .

Portanto, foi anulada.

Page 36: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 36 de 43

Lista das questões Apresentadas com Gabarito

Exercício 2

(FCC - ANALISTA BACEN 2005) Uma empresa com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1000,00, e o lucro bruto anual (Y), em 1000,00, optou por utilizar o modelo linear simples Y(i) = a + bX(i) + e(i), em que Y(i) é o valor do lucro bruto auferido no ano (i), X(i) é o valor do gasto com propaganda no ano (i) e e(i) o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples.

Considerou, para o estudo, as seguintes informações referentes às observações dos últimos 10 anos da empresa:

Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, será de:

a) 158

b) 128,4

c) 121

d) 102,5

e) 84

Page 37: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 37 de 43

Exercício 3.

(CESGANRIO – BACEN/2010)

Fonte de Variação

Soma dos Quadrados

Graus de Liberdade

Média de Quadrados

F

Fator 6752,0 2

Erro 30178,0

Total 36930,0 29

Analisando a tabela ANOVA acima, considere as conclusões a seguir:

I – A análise de variância (ANOVA) teste se várias populações têm a mesma média; para tanto, são comparadas a dispersão das médias amostrais e a variação existente dentro da amostra

II – ANOVA indica que:

III – A estatística F, calculada com a informação da tabela acima, é acima 2,651 e deve ser comparada com o valor tabelado F(2,29) para um grau de significância escolhido.

É correto APENAS o que se conclui em:

a) I

b) III

c) I e II

d) I e III

e) II e III

Page 38: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 38 de 43

Exercício 5.

(FCC - ANALISTA BACEN 2005) Uma empresa com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1000,00, e o lucro bruto anual (Y), em 1000,00, optou por utilizar o modelo linear simples Y(i) = a + bX(i) + e(i), em que Y(i) é o valor do lucro bruto auferido no ano (i), X(i) é o valor do gasto com propaganda no ano (i) e e(i) o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples.

Considerou, para o estudo, as seguintes informações referentes às observações dos últimos 10 anos da empresa:

Montando o quadro de análise de variância (ANOVA), tem-se que:

a) a variação total apresenta um valor de 62,5.

b) a variação explicada, fonte de variação devido à regressão, apresenta um valor igual a 80.

c) Dividindo a variação residual pela variação total, obtemos o coeficiente de determinação (R²).

d) o valor da estatística F necessária para o teste da existência da regressão é igual ao quociente da divisão da variação explicada pela variação residual.

e) a variação residual apresenta um valor igual a 17,5.

Page 39: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 39 de 43

(ESAF – Agente Fiscal de Tributos Estaduais – SEFAZ PI) Um investigador toma uma amostra de 10 carregamentos levados a efeito em caminhões de uma firma de transporte. Para cada carregamento (i) anota a distância percorrida pelo caminhão em 1.000 Km (X(i)) e o tempo de entrega do carregamento em dias (Y(i)). Neste contexto postula que o modelo de regressão linear

Y(i) = α + βX(i) + ε(i), i = 1, 2...10

se ajusta a suas observações, onde α e β são parâmetros desconhecidos e os ε(i) são componentes estocásticas (resíduos) não diretamente observáveis, não correlacionadas, com média zero e variância σ² > 0.

Foram encontradas as estatísticas seguintes no ajuste do modelo de regressão linear:

X(i) = 8;

X(i)² = 12

X(i)*Y(i) = 26

Y(i) = 29

Y(i)² = 100

Com base nessas informações responda:

Exercício 6

Assinale a opção que corresponde à estimativa do aumento esperado no tempo de entrega decorrente da adição de 1.000km na distância percorrida.

a) 0,5 dias

b) 1,0 dias

c) 3,0 dias

d) 5,0 dias

e) 4,5 dias

Page 40: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 40 de 43

Exercício 7

Assinale a opção que corresponde à estimativa de mínimos quadrados do parâmetro σ².

a) 1,77

b) 1,81

c) 0,40

d) 1,22

e) 1,13

Exercício 8

(IBGE 2002 – Analista Socioeconômico) Numa regressão linear simples, o coeficiente de determinação representa:

a) a média da soma dos quadrados dos desvios

b) a soma dos quadrados dos resíduos

c) a raiz quadrada do coeficiente de correlação amostral

d) a variância dos dados

e) a porcentagem da variação total dos dados que é explicada pela regressão

Exercício 9

(SUSEP 2010 – Atuária) A partir de uma amostra aleatória [x(1), y(1)], [x(2), y(2)]...[x(20), y(20)] foram obtidas as estatísticas:

Média de X = 12,5

Média de Y = 19

Variância de X = 30

Variância de Y = 54

Covariância entre X e Y = 36

Page 41: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 41 de 43

Calcule a reta de regressão estimada de Y contra X.

a) Y = 19 + 0,667*X

b) Y = 12,5 + 1,2*X

c) Y = 4 + 1,2 X

d) Y = 19 + 1,2 X

e) Y = 80 + 22,8X

Exercício 10

(SUSEP 2010 – Atuária) Com os dados da questão anterior, determine o valor da estatística F para testar a hipótese nula de que o coeficiente angular da reta do modelo de regressão linear simples de Y contra X é igual a zero.

a) 144

b) 18

c) 36

d) 72

e) 48

Exercício 11

(ESAF – AFRFB 2009) Na análise de regressão linear simples, as estimativas

e dos parâmetros e da reta de regressão podem ser obtidas pelo método de Mínimos Quadrados. Nesse caso, os valores dessas estimativas

são obtidos através de uma amostra de n pares de valores com (i = 1,

2,....,n), obtendo-se: , onde é a estimativa de .

Para cada par de valores com (i = 1, 2,...,n) pode-se estabelecer o desvio

ou resíduo - aqui denotado por - entre a reta de regressão e sua

estimativa . Sabe-se que o Método de Mínimos Quadrados consiste em

Page 42: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 42 de 43

adotar como estimativas dos parâmetros e os valores que minimizam a soma dos quadrados dos desvios . Desse modo, o Método de Mínimos Quadrados consiste em minimizar a expressão dada por:

a)

b)

c)

d)

e)

Page 43: Economet - Bacen 2013 - Est - Aula 00

Econometria para o BACEN

Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 43 de 43

Gabarito

2 - d

3 - c

5 - e

6 - a

7 - b

8 - e

9 - c

10 - d

11 - a

É isso aí pessoal.

Logo estaremos de volta. Pratiquem! Este é o caminho.

Precisando é só chamar. Vou fazer o possível para atender rapidamente às suas

perguntas.

Um forte abraço.

[email protected]