Upload
julia-elizabeth-marin-perez
View
213
Download
1
Embed Size (px)
Citation preview
Profesor: Juan Daz Valencia. Instituto Tecnolgico Metropolitano ITM
1
Fue un bilogo y estadstico ingls, SIR FRANCIS GALTON*,
quien introdujo en 1889 el trmino regresin en Estadstica.
Emple este concepto para indicar la relacin que exista entre la
estatura de los nios de una muestra y la estatura de su padre.
Observ, que si los padres son altos, los hijos generalmente
tambin lo son, y si los padres son bajos los hijos son tambin de
menor estatura. Pero ocurra un hecho curioso: cuando el padre es
muy alto o muy bajo, aparece una perceptible "regresin" hacia la
estatura media de la poblacin, de modo que sus hijos retroceden
hacia la media de la que sus padres, por cierto, estn muy
alejados. Hoy da, el trmino no se utiliza en ese sentido.
2
Par hacer un anlisis de regresin se puede emplear un diagrama de
dispersin, donde se grafica la variable independiente sobre el ele eje X y
la variable independiente sobre el eje Y.
La naturaleza de la relacin puede tomar muchas formas de tipo lineal o
curvilnea; la mas elemental es la lnea recta.
3
MODELO DE REGRESIN LINEAL
En este modelo, la pendiente de la recta es b, que representa el
cambio esperado en Y por unidad de cambio en X, el valor de a es el punto de corte con la ordenada, e constituye el error aleatorio en Y
para cada observacin. 4
Para estimar los coeficientes de regresin por medio del mtodo de mnimos
cuadrados, utilizamos las siguientes frmulas:
=
2 2
=
= 1, 2, 3, . . . ,
La regresin se centra en el uso de la relacin para determinar la
prediccin, la prediccin es sencilla de establecer cuando la relacin
es perfecta, cuando ocurre esto todos los puntos estn sobre una
lnea recta y lo nico que se hace es obtener la ecuacin de la recta
y utilizarla para sealar la prediccin, la situacin se torna compleja
si la relacin es imperfecta.
5
6
Correlacin. Nos indica la direccin y el grado de relacin entre la
variable Independiente y Dependiente, la direccin se refiere a si es
positiva o negativa y el grado de relacin a su magnitud o fuerza. En
sntesis el coeficiente de correlacin expresa de manera cuantitativa
la magnitud y la direccin de una relacin.
Un coeficiente de correlacin de Pearson puede variar de 1 a +1, mientras mayor sea el numero mayor ser la correlacin.
7
Interpretacin aproximada del coeficiente de correlacin de
Pearson
r Interpretacin
r = -1 Correlacin negativa Perfecta
-1 < r -0,9 Correlacin negativa muy fuerte
-0,9 < r -0,75 Correlacin negativa considerable
-0,75 < r -0,5 Correlacin negativa media
-0,5 < r -0,1 Correlacin negativa dbil
r = 0 No existe correlacin
0,1 r < 0,5 Correlacin positiva dbil
0,5 r < 0,75 Correlacin positiva media
0,75 r < 0,9 Correlacin positiva considerable
0,9 r < 1 Correlacin positiva muy fuerte
r = 1 Correlacin positiva perfecta
-1 r 1
8
El coeficiente de correlacin de Pearson (r) es ndice que mide la magnitud
de la relacin lineal entre dos variables cuantitativas, al nos muestra el
sentido positivo o negativo. Para calcular el valor de r utilizamos la
siguiente formula.
=
Hay que tener en cuenta que el coeficiente de correlacin de Pearson mide
nicamente correlacin lineal por lo que no es til para evaluar otro tipo de
correlacin.
Coeficiente de Determinacin.
Indica el porcentaje de ajuste que se ha conseguido con el modelo lineal,
es decir el porcentaje de variacin de la variable Y, a travs de
comportamiento de la variable X.
Tambin se puede entender el coeficiente de determinacin como el
porcentaje de varianza explicada por la recta de regresin, el valor est
entre 0 y 1, para calcularlo se eleva el coeficiente el coeficiente de
correlacin al cuadrado.
R2 = r2
9
Ejemplo.
Halla el coeficiente de correlacin de Pearson y halle y explique el coeficiente
de determinacin, para los datos de la siguiente tabla.
Elabore la grfica y construya el modelo de regresin lineal.
N X Y XY X2 Y2
1 2 7 14 4 49
2 3 10 30 9 100
3 7 8 56 49 64
4 5 6 30 25 36
17 31 130 87 249
= 4,25
= 7,75
b= -0,118644068
a= 8,254237288
r= -0,154041597
r^2= 0,023728814
10
carro Kilometros Costo
1 3147 213,9
2 3160 212,6
3 3197 215,3
4 3173 215,3
5 3561 228,2
6 3292 215,4
7 4013 245,6
8 4244 259,9
9 4159 250,9
10 3776 234,5
11 3232 205,9
12 3141 202,7
13 2928 198,5
14 3063 195,6
15 3096 200,4
16 3096 200,1
17 3158 201,5
18 3338 213,2
19 3492 219,5
20 4019 243,7
21 4394 262,3
22 4251 252,3
23 3844 224,4
24 3276 215,3
25 3184 202,5
26 3037 200,7
27 3142 201,8
28 3159 202,1
29 3139 200,4
30 3203 209,3
31 3307 213,9
32 3585 227
33 4073 246,4
Ejercicio.
Una empresa de transporte de pasajeros desea
estimar la relacin que existe entre los costos
totales de operacin en miles de pesos
mensualmente y los kilmetros recorridos por
cada vehculo que pertenece a la compaa.
La informacin aparece en la tabla de la
izquierda.
X: Kilmetros recorridos por el vehculo
(variable Independiente)
Y: Costos (gastos de operacin mensual) en
miles de pesos (variable dependiente)
1 Estimar el modelo lineal o recta de regresin
2 Interprete el coeficiente de correlacin de
Pearson.
3 Interprete el coeficiente de determinacin.
4 Elabore la grafica y presente el informe, con
sus respectiva tabla de clculos.