10
Tema 2: problemas 1 PROBLEMAS DEL MODELO LINEAL SIMPLE 1. Dado el modelo lineal simple Y i = β 0 + β 1 X i + i , i N (0) independientes y obtenida la siguiente informaci´ on muestral para las variables Y y X : Y 6 7 5 7 10 X 1 3 5 7 9 se pide: a) estimaci´ on MCO y MV de los par´ ametros de posici´ on del modelo (es decir, de β 0 y β 1 ) b) estimaci´ on insesgada del par´ ametro de dispersi´ on σ 2 c) estimaci´ on por intervalo, al nivel de confianza 95%, para los tres par´ ametros d) valores ajustados y residuales. Comprueba que n i=1 e i =0 n i=1 X i e i =0 e) variabilidad total, variabilidad explicada y variabilidad no explicada f) contrastar, con un nivel de significaci´ on del 5%, las siguientes hip´ otesis individuales: f.1) H 0 : β 1 =0 f.2) H 0 : β 0 =0 f.3) H 0 : β 1 =1 f.4) H 0 : β 0 =9 f.5) H 0 : σ 2 = 25 g) contrastar, con un nivel de significaci´ on del 1%, las siguientes hip´ otesis individuales: g.1) H 0 : β 1 1 g.2) H 0 : β 0 9 g.3) H 0 : σ 2 = 25 h) coeficientes de correlaci´ on y de determinaci´ on i) tabla ANOVA y el test del an´ alisis de la varianza, al 5% de significaci´ on j) el coeficiente de determinaci´ on cr´ ıtico para un nivel de significaci´ on del 5% k) contrastar β 1 = 0 mediante la variaci´ on en VNE. l) suponiendo que X 0 = 11, proponer la predicci´ on puntual ´ optima de E(Y 0 ) y de Y 0 . Idem con la predicci´ on por intervalo al 95% de confianza. m) efectuar el an´ alisis de permanencia estructural, suponiendo que se conoce Y 0 =4y X 0 = 11.

Ejercicios de Regresion

Embed Size (px)

Citation preview

Page 1: Ejercicios de Regresion

Tema 2: problemas 1

PROBLEMAS DEL MODELO LINEAL SIMPLE

1. Dado el modelo lineal simple

Yi = β0 + β1Xi + εi, εi ∼ N(0, σ) independientes

y obtenida la siguiente informacion muestral para las variables Y y X:

Y 6 7 5 7 10X 1 3 5 7 9

se pide:

a) estimacion MCO y MV de los parametros de posicion del modelo (esdecir, de β0 y β1)

b) estimacion insesgada del parametro de dispersion σ2

c) estimacion por intervalo, al nivel de confianza 95%, para los tres parametros

d) valores ajustados y residuales. Comprueba que

∑n

i=1 ei = 0∑n

i=1 Xiei = 0

e) variabilidad total, variabilidad explicada y variabilidad no explicada

f) contrastar, con un nivel de significacion del 5%, las siguientes hipotesisindividuales:

f.1) H0 : β1 = 0

f.2) H0 : β0 = 0

f.3) H0 : β1 = 1

f.4) H0 : β0 = 9

f.5) H0 : σ2 = 25

g) contrastar, con un nivel de significacion del 1%, las siguientes hipotesisindividuales:

g.1) H0 : β1 ≤ 1

g.2) H0 : β0 ≥ 9

g.3) H0 : σ2 = 25

h) coeficientes de correlacion y de determinacion

i) tabla ANOVA y el test del analisis de la varianza, al 5% de significacion

j) el coeficiente de determinacion crıtico para un nivel de significacion del5%

k) contrastar β1 = 0 mediante la variacion en VNE.

l) suponiendo que X0 = 11, proponer la prediccion puntual optima de E(Y0)y de Y0. Idem con la prediccion por intervalo al 95% de confianza.

m) efectuar el analisis de permanencia estructural, suponiendo que se conoceY0 = 4 y X0 = 11.

Page 2: Ejercicios de Regresion

Tema 2: problemas 2

2. Dado el modelo lineal simple estimado

Yi= 11.93(28.92)

+ 0.2(7.29)

Xi

n = 16σβ0β1

= −0.011

donde los valores entre parentesis son los t-ratios y σβ0β1es la covarianza

estimada de β0 y β1 se pide:

a) el coeficiente de determinacion

b) la estimacion de V ar(β)

c) la estimacion de la varianza de la perturbacion

3. Dado un modelo lineal simple del que se conoce la siguiente informacion

X′X =

(

4 00 5

)

σ2 = 1

X′Y =

(

810

)

se pide:

(i) intervalo de confianza para E(Y0) sabiendo que X0=2

(ii) si Y0=7 y X0=2, efectua el contraste de permanencia estructural.

4. En un modelo lineal simple contrasta al 5% la hipotesis β1 = 0 si se conoceque el coeficiente de correlacion muestral entre X en Y es -0.6 en una muestrade tamano 10.

5. Se dispone de los siguientes resultados en un modelo lineal simple (los numerosentre parentesis son los t-ratios):

Yt= -0.382(-0.56)

+ 0.246(13.224)

Xt

R2 = 0.9564s2

R = 1.1354

Se pide la tabla ANOVA y el test de analisis de la varianza al 5%.

Page 3: Ejercicios de Regresion

Tema 2: cuestiones 3

1. Considera el siguiente metodo de estimacion de la pendiente de una recta parapredecir Y conocido X:

i) Calcula la media muestral x.

ii) Estima la pendiente aparente para cada punto:

bi =Yi − y

Xi − x, i = 1, . . . , n

iii) Toma la media de estos valores:

β1 =1

n

i

bi

como estimador de β1.

¿Es β1 un estimador centrado para β1? Calcula su varianza y comparala conla del estimador MCO de β1.

2. Consideremos el modelo de regresion lineal simple

Yi = β0 + β1Xi + εi, i = 1, . . . , nE(εi) = 0E(ε2

i ) = σ2

E(εiεj) = 0, i 6= j

en el que las medidas Xi se realizaron en euros. Nos gustarıa escribir el modeloen pesetas. Si un euro equivale a c pesetas (c conocido), escribe el modeloanterior como

Yi = β∗

0 + β∗

1Zi + εi, i = 1, . . . , n

(Zi=medida expresada en pesetas).

¿Se pueden obtener los estimadores de β∗

0 y β∗

1 a partir de los de β0 y β1?Estudia la relacion entre los t-ratios de ambos modelos y sus correspondientesR2.

Repite el estudio anterior en los siguientes casos:

(a) cambio de origen en la variable explicativa

(b) cambio de escala en la variable respuesta

(c) cambio de origen en la variable respuesta

3. Considera el siguiente modelo de regresion

Yi = β1Xi + εi

donde la perturbacion aleatoria cumple las hipotesis habituales.

Obten el estimador MCO del parametro β1. Calcula su distribucion, media yvarianza. ¿Que estimador centrado de σ2 propones? ¿Cual es la expresion deR2?

Supon ahora que en el modelo no se cumple β0 = 0 pero nosotros seguimosutilizando los estimadores anteriores. Calcula ahora la media y varianza delos mismos y comparalas con las obtenidas a partir de los estimadores MCOhabituales.

Page 4: Ejercicios de Regresion

Tema 2: cuestiones 4

4. Un investigador dispone de una coleccion de valores {Xi}ni=1 de una variable

independiente continua, controlada por el y, para cada valor Xi, dispone a suvez de una coleccion de k valores distintos de la variable respuesta, tomadosen condiciones homogeneas y de forma independiente. El modelo de regresiona considerar para estos datos es

Yij = β0 + β1Xi + εij, j = 1, . . . , k, i = 1, . . . , n

donde εij verifica las condiciones habituales.

Tanto el valor de n como el de k son bastante grandes, por lo que el volumende datos es poco manejable. El investigador decide reducir este volumen dedatos y sustituye cada conjunto de k observaciones de un mismo valor Xi porla media muestral de dichas observaciones:

Yi =1

k

k∑

j=1

Yij

y utilizar la nueva muestra de datos {(Xi, Yi)}ni=1 para estimar los parametros

β0 y β1 del modelo. Antes de realizar los calculos consulta a un estadıstico,quien le asegura que los estimadores puntuales de β0 y β1 son los mismos peroque el coeficiente de determinacion R2 del segundo modelo sera mayor que eldel primero.

i) Formula el segundo modelo que propone el investigador y da la dis-tribucion que sigue el termino de error de forma consecuente con el modeloinicialmente planteado.

ii) ¿Son ciertas las afirmaciones del estadıstico?

5. Disponemos de los datos de una muestra tipificados {(ZXi, ZYi

)}ni=1.

i) Demuestra que la igualdad fundamental del analisis de la varianza parala regresion lineal simple se reduce en este caso a:

n = n(1 − r2) + nr2

donde r es el coeficiente de correlacion lineal muestral entre X e Y .

ii) Escribe la tabla ADEVA y el estadıstico F del analisis de la varianza.

6. Estamos disenando una prueba y nos falta tomar el ultimo dato. Podemoselegir el valor de Xn que mas nos interese. ¿Que valor de Xn tomarıas siquieres que la prediccion en el punto X0 = 2.5 sea lo mas precisa posibledesde el punto de vista poblacional? ¿Que inconvenientes practicos se puedenpresentar?

Page 5: Ejercicios de Regresion

Tema 2: problemas 5

PROBLEMAS DEL MODELO GENERAL DE REGRESION LINEAL

1. Dado el modelo Yi = β0 + β1X1i + β2X2i + εi para el que se dispone de lasiguiente informacion muestral

Y X0 X1 X2

Y 196270 1268 1006 8364X0 1268 9 0 60X1 1006 0 60 0X2 8364 60 0 708

se pide:

(i) estimacion MCO del vector β y de σ2

(ii) analizar la significatividad individual del termino independiente, de X1 yde X2 y la significatividad conjunta del modelo

(iii) contrastar β1 = β2

(iv) efectuar la prediccion puntual y por intervalo para Y10 suponiendo queX1,10 = 2 y X2,10 = 3.

2. Dado el modelo Yi = β0 + β1X1i + β2X2i + εi para el que se dispone de lasiguiente informacion muestral:

X′X =

20 5 25 30 02 0 40

VT=400 β =

0.513

se pide:

(i) estimacion de σ2

(ii) estimacion de V ar(β)

(iii) analisis de la significatividad individual del termino independiente y delas variables explicativas

(iv) tabla ADEVA y test del analisis de la varianza

(v) estimacion por intervalo de β0 y β1 al 95%

(vi) contrastar la hipotesis nula 2β1 + β2 = 1

(vii) coeficiente de determinacion corregido y crıtico

(viii) analisis de permanencia estructural al 5% en la observacion numero 21si el vector de observaciones de las variables explicativas es (1, 4, 5) y elvalor de la variable explicada es 18

(ix) prediccion puntual y por intervalo de Y0 y E(Y0) para el que X1,0 = 4 yX2,0 = 5. Contrasta, respectivamente, si Y0 = 10 o E(Y0) = 2.

3. De la estimacion MCO del modelo Yi = β0 + β1X1i + β2X2i + εi se conoce:

Page 6: Ejercicios de Regresion

Tema 2: problemas 6

Yi = 3.02 + 0.815(12.64)

X1i + 0.33(5.12)

X2i

n = 20 s2R = 0.83

X1i =∑

X2i =∑

X1iX2i = 0

(donde los numeros entre parentesis representan los t-ratios), contrasta al 5%la hipotesis nula β1 + β2 = 1 de dos formas distintas, teniendo en cuenta que,si se impone la restriccion, la estimacion del modelo origina s2

R = 0.9.

4. En un modelo lineal de regresion se conocen los siguientes resultados parcialesde una estimacion:

Yi = 0.5 − X1i + X2i

n = 10∑

Yi = 3s2

R = 0.07F ∗ = 25.7142

donde F ∗ representa la evaluacion del estadıstico F en el test del analisis dela varianza. Se pide:

(i) coeficiente de determinacion corregido

(ii) contrastar al 5% β0 = β1 = β2 = 0

5. Se ha estimado un modelo lineal de regresion obteniendose los siguientes re-sultados (los numeros entre parentesis representan los t-ratios):

Yi = 1 + 0.3(4.2426)

X1i + 1(10)

X2i

n = 10 s2R = 0.5

X1i =∑

X2i =∑

X1iX2i = 0

Se pide:

(i) contraste de significatividad individual para el termino independiente ylas dos variables explicativas

(ii) contrastar la hipotesis conjunta

H0 :

{

β1 + β2 = 1β0 = 1

(iii) para un periodo posterior se observa X1,0 = 10, X2,0 = 1 e Y0 = 4.5.Realiza el contraste de permanencia estructural.

6. Consideremos la siguiente funcion de regresion de demanda de un producto:

Yi = eβ0Pβ1

i eβ2( 1

Ri)eεi

donde u cumple las hipotesis basicas (incluida la normalidad), P es el preciodel producto, R es la renta e Y la cantidad demandada.

Se dispone de la siguiente informacion muestral:

Page 7: Ejercicios de Regresion

Tema 2: problemas 7

ln(Y ) 35 37 40 42 42 44 46 46R 0.1 0.125 0.125 0.2 0.25 0.4 0.5 1

ln(P ) -8 -8 -9 -10 -7 -8 -9 -7

Se pide:

(i) estimacion de los parametros del modelo

(ii) coeficiente de determinacion y coeficiente de determinacion corregido

(iii) tabla ADEVA, test del analisis de la varianza y coeficiente de determi-nacion crıtico

(iv) usando el modelo estimado calcular el lımite maximo de ventas que puedealcanzarse con el precio de la ultima observacion de la muestra al crecerindefinidamente la renta.

7. Usando una muestra de 18 observaciones se han obtenido los siguientes resul-tados:

Yi = 2.2(3.4)

+ 0.104(0.005)

X1i + 3.48(2.2)

X2i + 0.34(0.15)

X3i

Y = 0∑

εi2 = 18.18

Y 2i = 109.6

donde los numeros entre parentesis son las desviaciones estimadas de los esti-madores. Contrasta al 5% de significacion si todas las variables explicativasson conjuntamente significativas.

8. Sobre un modelo lineal con k = 3 se conocen los siguientes resultados parcialesde una estimacion:

(X′X)−1 =

0.125 0 0.1250 0.5 0

0.125 0 0.625

β =

0.5−11

ˆV ar(β1) = 0.04375

se pide:

(i) intervalo de confianza al 95% para cada uno de los cuatro parametros delmodelo y contraste de significatividad individual

(ii) coeficiente de determinacion y coeficiente de determinacion corregido

(iii) tabla ADEVA, test del analisis de la varianza y coeficiente de determi-nacion crıtico al 5% de significacion

(iv) contraste de permanencia estructural al 5% dado que X1,0 = 0.5, X2,0 = 1e Y0 = 3.

9. Dado el modelo Yi = β0 + β1X1i + β2X2i + εi y siendo

X =

1 3 21 2 31 -3 21 0 -101 -2 3

calcula la covarianza entre β2 y u3.

Page 8: Ejercicios de Regresion

Tema 2: problemas 8

10. Dado el siguiente modelo estimado:

Yi = 1.37 + 0.632(0.257)

X1i + 0.452(0.219)

X2i

n = 30 R2 = 0.98ˆCov(β1, β2) = 0.055

donde los numeros entre parentesis representan las desviaciones tıpicas esti-madas de β1 y β2, se pide contrastar al 5% la hipotesis H0 : β1 = β2.

11. Dado el modelo Yi = β0 + β1X1i + β2X2i + εi se conoce a priori la restriccionlineal β1 = β2. Calcula el estimador ELIO de β0, β1 y β2 de dos formasdistintas, dada la informacion muestral siguiente:

Y 6 8 12 10 15 20X1 1 2 3 5 7 8X2 3 4 3 5 5 7

12. Una empresa produce las 24 horas del dıa utilizando tres relevos de traba-jadores (manana, tarde y noche). Los directivos argumentan que los salariosde esta empresa se determinan exclusivamente por la categorıa profesional delos trabajadores: tecnico, obrero o aprendiz.

(a) ¿Como contrastarıas la hipotesis de los directivos de que los salarios sonindependientes de los relevos? Especifica el modelo apropiado y planteaclaramente la hipotesis nula y el estadıstico de contraste.

(b) En funcion del modelo especificado anteriormente, ¿cual serıa el salariomedio de un obrero del turno de noche?

13. Se dispone de una muestra de observaciones correspondientes a ventas y gastosde promocion de diez empresas, perteneciendo las cinco primeras al sectortextil y las cinco restantes al de juguetes, segun el siguiente cuadro:

Empresa 1 2 3 4 5 6 7 8 9 10Sector industrial T T T T T J J J J JVentas 10 5 11 4 3 8 7 9 10 14Gastos de promocion 3 1 2 1 1 4 3 2 5 6

Suponiendo una especificacion lineal de las ventas sobre el resto, se pide:

(a) siendo el termino constante (denominado ventas autonomas) comun paralos dos sectores industriales, contrasta si el coeficiente de los gastos depromocion varıa significativamente para cada uno de ellos

(b) contrasta si las ventas autonomas difieren significativamente en cada unode los dos sectores considerados, suponiendo que el coeficiente de losgastos de promocion es comun para ambos

(c) contrasta si el comportamiento de las ventas difiere significativamente encada una de las industrias

Page 9: Ejercicios de Regresion

Tema 2: problemas 9

14. Un fenomeno se ajusta al modelo Yi = β1X1i + β2X2i + β3X3i + εi con u

cumpliendo las hipotesis basicas, excepto la homocedasticidad que es de laforma

E(ε2i ) = σ2X2

2i

Ademas β1 +β2 = 0 y aparece otra dificultad: no son observables las variablesdel modelo. Sin embargo, sı lo son las siguientes:

Zi = Yi

X1i

W1i = X2i

X1i

W3i = X3i

X1i

Calcula la estimacion ELIO de los parametros utilizando la siguiente infor-macion muestral:

Zi 2 2.5 3 3.5 4W1i 0.1 0.2 0.25 0.4 0.05W2i 0.4 0.45 0.5 0.55 0.6

15. Dado el modelo Yt = β1 + β2X2t + β3X3t + ut con β2 = β3 y V ar(ut) = σ2t2,calcula las estimaciones ELIO de los parametros con la siguiente informacionmuestral:

Yt 10 2 4 8 6 9 7 12X2t 1 2 3 5 7 8 9 11X3t 3 4 3 5 5 7 8 2

16. Se han recogido datos en dos localidades mediante sendas encuestas sobre elconsumo (Y ) de productos de hogar y de la renta (X) de los consumidoresconsultados, obteniendose los siguientes resultados:

Ciudad 1 Ciudad 2X Y X Y

4.8 64.0 7.1 54.65.3 68.0 3.4 44.76.5 79.0 5.5 51.03.2 56.0 4.3 49.76.0 69.4 3.7 47.23.8 60.9 6.0 55.04.2 62.8 3.3 42.97.0 75.6 6.7 55.62.6 61.7 5.1 47.63.5 57.8 4.5 49.55.6 72.3 2.7 44.65.8 70.5 5.9 57.2

Se ha observado una relacion lineal entre el consumo (en miles de pesetas) y larenta (en millones de pesetas) y se desea contrastar si esta relacion es identicaen las dos ciudades donde se ha realizado el trabajo de campo.

17. Con objeto de analizar las diferencias salariales entre los empleados de unafamosa empresa auditora segun su titulacion, se ha tomado una muestra de

Page 10: Ejercicios de Regresion

Tema 2: problemas 10

los salarios de 500 empleados, de los cuales 300 tienen estudios universitarios.Se postula el siguiente modelo de determinacion del salario:

Si = β0 + β1Di + εi, i = 1, 2, . . . , 500

donde Si es el salario del empleado i-esimo y de Di es una variable ficticiaque toma el valor 1 si el empleado tiene estudios universitarios. Si el salariomedio muestral (en miles de pesetas) de los universitarios es de 250 al mes yel salario medio muestral de los no universitarios es 150:

(a) estima los parametros β0 y β1, por MCO.

(b) si la desviacion tıpica salarial de la submuestra de universitarios es de50 y la de los no universitarios es 30, obten las desviaciones tıpica de losestimadores MCO de β0 y β1.

(c) calcula el coeficiente de determinacion de la regresion

(d) ¿Como contrastarıas la hipotesis de que existe diferencia salarial entre loslicenciados y los administrativos?

(e) Si en la muestra anteriormente mencionada se dispusiera tambien de in-formacion sobre el sexo del empleado i-esimo, ¿como contrastarıas lassiguientes hipotesis sobre esta empresa?:

(e.1) no hay discriminacion salarial por razones de sexo.

(e.2) no hay discriminacion salarial entre los licenciados por razones desexo.