Upload
jessica-osorio
View
1.358
Download
20
Embed Size (px)
Citation preview
ANALISIS DE REGRESION LINEAL SIMPLE
ESTADISTICAS II
PRONOSTICOS
PRODUCCION
PROGRAMACIONINVENTARIOS
COMPRAS PERSONAL
GERENTEGERENTE
Contabilidad y Finanzas
PRESTAMOSINVERSIONES
FINANZIAMIENTO
FLUJO DE CAJA
EJEMPLOS DE SITUACIONES
La firma debe pronosticar cuántas
unidades de un artículo se
demandarán la próxima semana
La administración debe pronosticar la rapidez de los efectos de un descubrimiento científico
reciente en la industria en que la firma compite
Los pronósticos pueden diferir en cuanto a su importancia, al marco de referencia y al nivel administrativo.
Regresión lineal
Su objetivo es identificar una relación funcional entre una o más variables independientes (predictoras) y la variable dependiente (pronóstico).
Podemos realizar la
Inversión, en comprar las franquicias PARMALAT
Uyyy!Y
AHORA!!
ANALISIS DE
REGRESIONCUAL VARIABLE
VARIABLE INDEPENDIENTE
PREDICTORA
VARIABLE DEPENDIENTEPRONOSTICO
El patrón general de los puntos dibujados sugiere la relación general entre las dos variables.
Diagrama de Dispersion
Representación gráfica del grado de relación entre dos variables cuantitativas.
Se determina la variable independiente y la variable dependiente
En el eje de las abscisas se colocan los valores de las variables independiente (X) y en el eje …
Se coloca un punto en el plano por cada par de valores
Diagrama de dispersión
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
ProcesoEjemplo
Marcamos los pares de datos
Tipos de Diagrama
Relación lineal negativa fuerte
Relación lineal positiva perfecta
Relación lineal negativa
Relación parabólica perfecta
Relación curvilínea negativaNinguna relación entreLas variables.
Una vez que sabemos que dos variables están relacionadas…
¿Cómo averiguar qué tipo de relación tienen?
Para esto utilizamos los modelos de regresión
MODELOS DE REGRESIÓN
¿QUÉ ES?La regresión como técnica estadística analiza la relación de dos o más variables contínuas
¿PARA QUÉ SIRVE?
La regresión se utiliza para inferir datos a partir de otros y hallar una respuesta a lo que pueda suceder
CONCEPTO DE REGRESIÓN
VARIABLES DE LA REGRESIÓN
Las variables del modelo de regresión deben ser cuantitativas
Dada la robustez de la regresión es frecuente encontrar incluidas como variable independiente variables nominales transformadas
La variable dependiente debe ser siempre cuantitativa
Robustez: un estadístico se dice que es robusto cuando es válido aunque no se cumpla alguno de sus supuestos
TIPOS DE REGRESIÓN
Se pueden encontrar distintos tipos de regresión
Regresión Lineal1
Regresión Múltiple2
Regresión Logística3
REGRESIÓN LINEAL
Consideremos una variable dependiente respuesta Y, relacionada con otra variable independiente X
Supongamos una muestra de n individuos para los que se conocen los valores de ambas variables
Hacemos una representación gráfica:
en el eje X la variable independiente en el Y la dependiente
Y Variable dependiente
XVariable independiente
n Muestra
REGRESIÓN LINEAL
OBJETIVO Encontrar una recta que se ajuste a la nube de puntos
A partir de esa recta podemos usar los valores de X para predecir los de Y
Normalmente se utiliza el “método de los mínimos “método de los mínimos cuadrados”cuadrados” que minimiza la distancia de las observaciones a la recta
XiXY 10/
0
Y
XX1 X2 X3 X4
μy|x = β0 + β1x es el valor medio de la variable dependiente y cuando el valor de la variable independiente es x.
–β0 = ordenada al origen (valor medio de y cuando x = 0)
–β1 = pendiente ( valor medio de y cuando x una unidad)
y = μy|x + = β0 + β1x +
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
10 cm.
10 kg.
SUPOSICIONES DE LA REGRESIÓN LINEAL
• Los valores de la variable independiente X son fijos, medidos sin error.
• La variable Y es aleatoria • Para cada valor de X, existe una distribución
normal de valores de Y (subpoblaciones Y) • Las variancias de las subpoblaciones Y son
todas iguales. • Todas las medias de las subpoblaciones de
Y están sobre la recta. • Los valores de Y están normalmente
distribuidos y son estadísticamente independientes
P4
XX1 X2 X3 X4
P3P2
P1
R1
R2
R3 R4
(residuo)
e1
e2
e3
e4
ii XY 10ˆ Y (ajustado)
Y (valor real)
eYY ˆ
Y
0
Modelo de la Regresión Lineal Simple Muestral
La recta de regresión muestral sería
ii XY 10ˆˆˆ
SI pero ¿Cuál es el modelo?
iii
iii
eXY
eYY
10ˆˆ
ˆ
0
0 0
0
0
01
1
11
00 METODO DE LOS MINIMOS
CUADRADOS
221
ii
iiii
XXn
YXYXn
21
XX
YYXX
i
ii
n
X
n
Yn
ii
n
ii
11
10
ˆˆ
XY 10ˆˆ
MEDIDAS DE LA BONDAD DE AJUSTE
Obtener medidas que nos indiquen la confiabilidad de la recta de regresión
Medidas de la Bondad de Ajuste
Mide la bondad
Con la cual La línea
de regresión Se ajusta
Esquema de las Medidas de la Bondad del Ajuste
eSMedidas de laBondadDel Ajuste
AjusteAbsoluto
AjusteRelativo
Error Estándar de la Estimación
Coeficiente de determinación
2r
(X1,Y1)
(X2,Y2)
(X3,Y3)
Y2 Y
Y2 ˆ Y
Y
DESVIACION TOTAL
DESVIACION NO
EXPLICADA
DESVIACION EXPLICADA
Para obtener las formulas de las medida de la Bondad de Ajuste
2, rSeMedidas
de Variabilidad
ANALISIS DEREGRESION
Obtener medidas que nos indiquen la confiabilidad de la recta de regresión
QUIEN MIDE
LAS VARIACIONES?
Variación total = Variación no explicada + Variación Explicada
22 ˆˆ2 YYYYYY iiii
Suma De
CuadradosTotalSCT
Suma De
CuadradosDel Error
SCE
Suma De
CuadradosDe La Regresión
SCR
SCRSCTYYSCE
XnXYYSCR
YnYYYSCT
ii
ii
ii
2
2221
2
222
ˆ
ˆˆ
El error estándar de la estimación se basa en el valor de SCE
Coeficiente de determinación se basa en la magnitud relativa de SCR
eS
2r
Error Estándar de Estimación eS
CME
n
SCE
n
YYS iie
22
ˆ 2
Mide la variabilidad o dispersión de los valores observadosAlrededor de la línea de regresión
eS Mayor es la dispersión
Coeficiente de Determinación 2r
SCT
SCRr 2
Obtiene la cantidad relativa de la variación de la variable dependiente Y explicada por la variableindependiente X
SCT
SCE
SCT
SCR1
Características
• El coeficiente de determinación es un cociente de dos sumas de cuadrados entonces no puede ser negativa
• SCR es menor o igual a SCT, el cociente de determinación esta dado entre los intervalos 0 y 1
10 2 r
• Si el coeficiente es cero indica que no existe relación lineal entre las variables X y Y, lo cual significa que ninguna parte de la variación de Y, esta explicada por X, el valor de r2 va a ser =0 cuando SCR =0 y SCE=SCT
• Un r2=1 indica una relación lineal perfecta entre las variables X y Y, y todo los puntos observados están sobre la recta de regresión muestral, SCE=0 y SCR=SCT, el ajuste perfecto.
INFERENCIA ESTADISTICA CON RESPECTO A LOS PARAMETROS 10 y
Calculada la recta de regresión muestral es importante conocer si esta recta se puede utilizar para fines predictivos
Nos interesa determinar si el conocimiento de la variable independiente X resulta útil para predecir los valores de la variable dependiente Y.
PRUEBA DE HIPOTESIS PARA
101 X y Y no están
relacionadas linealmente
Una línea horizontal
YYi Los valores de X no sirven Para predecir Y
La hipótesis nula H0: 01
La hipótesis alternativa debemos tener conocimiento previo de 1
Si tenemos conocimiento a priori de 101 Unilateral Derecha
0: 11 H Unilateral Izq.
Pasos para la prueba de Hipotesis
1
Planteamos la Hipótesis, reflejada en los valores a priori de
11ˆ
1
ˆ
1ˆ0ˆ
SS
t
1S
El estadístico a utilizar es la distribución t
2221
XnX
S
XX
SS
i
e
i
e
INTERVALO DE CONFIANZA PARA 1
12/;21 Stn
Si el intervalo de confianza incluye el cero, es equivalente a la aceptación de la hipótesis nula, LAS VARIABLES X e Y NO ESTAN RELACIONADAS LINEALMENTE
Si el intervalo de confianza NO incluye el cero, es equivalente al rechazo de la hipótesis nula, LAS VARIABLES X e Y ESTAN RELACIONADAS LINEALMENTE
ANALISIS DE VARIANZA EN LA
REGRESIÓN LINEAL SIMPLE
Fuente de
Variación
Suma de
Cuadrados
Grados de
Libertad
Cuadrados medios
Regresion SCR 1 SCR/1
Error SCE n-2 SCE/(n-2)
TOTAL SCT n-1
CMR es alto en relacion al CME, indica que parte de la variabilidad de en YEsta siendo explicada por la RECTA DE REGRESION, rechazo de H0
CMR es bajo en relacion al CME, indica que parte de la variabilidad de en YNO esta siendo explicada por la RECTA DE REGRESION, acep de H0
CME
CMRF
PREDICCION
0100ˆˆˆ XY
PREDICCION PARA LA MEDIA POR INTERVALO DE CONFIANZA
0/ XY
02/;20 Yn StY
22
2
010 XnX
XX
nSS
i
eY
1
122
2
00
XnX
XX
nSS
i
eY
PREDICCION INDIVIDUAL POR INTERVALO DE CONFIANZA