View
28
Download
0
Category
Preview:
Citation preview
UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRION
ESCUELA DE POSTGRADO
MAESTRA EN PLANIFICACIN Y PROYECTOS DE DESARROLLO
INTEGRANTES:
Luis Tibhy ACOSTA TRINIDAD
La regresin y la correlacin aunque son dos conceptos
diferentes guardan una ntima relacin ya que la regresin
es una expresin cuantitativa de la naturaleza de la
relacin entre las variables que se expresa mediante una
ecuacin matemtica, que se puede utilizar para estimar o
predecir los valores futuros que puede tener una variable
cuando se conocen o suponen los valores de la otra
variable; mientras que la correlacin determina la fuerza de
la relacin entre las variables, resulta muy til para un
trabajo de exploracin cuando un investigador y/o analista
trata de determinar que variables son potencialmente
importantes.
En la industria tiene aplicacin para investigar la relacin entre elrendimiento de la produccin y uno o ms factores del (o de los) quedepende, como la temperatura, la humedad ambiental, la presin, lacantidad de insumos, etc.; con base en este anlisis se puedepronosticar el comportamiento de una variable que se desea estimar(Triola 2009).
La planeacin de presupuesto, con el fin de investigar sobre elcomportamiento de los diferentes mercados, los cuales tienenincidencia directa sobre el producto (Triola 2009).
La regresin lineal se utiliza en la creacin de lneas de tendencialas que se utilizan en el negocio para mostrar el movimiento deatributos financieros o de producto a travs del tiempo; los preciosde acciones, del petrleo o las especificaciones del producto puedenanalizarse utilizando lneas de tendencia (Triola 2009).
El anlisis de regresin es una herramienta estadsticapoderosa y verstil, que permite cuantificar, a travs de unafuncin matemtica, la relacin entre dos o ms variables; en larelacin de variables se considera la presencia de una variabledependiente en funcin de una (regresin simple) o msvariables independientes (regresin mltiple) (Bula 2014). Deacuerdo a Mendiburu (2007), los valores de los parmetros nose pueden determinar sin errores por que los valoresobservados de la variable dependiente no concuerdan con losvalores esperados, entonces la ecuacin general, sera:
Y= f(X1,..Xn; 1,. m) +
Segn Mendiburu (2007), cuando la relacin funcional entre las
variables, dependiente (Y) e independiente (X) es una lnea recta:
Y = o + 1X +
Donde:
o: El valor de la ordenada donde la lnea de regresin se intersecta aleje Y.
1: El coef. de regresin poblacional (pendiente de la lnea recta).
: El error.
Las frmulas para estimar los coeficientes o= y 1= son:
De acuerdo a Mendiburu (2007), el anlisis de varianza es una tcnicaque permite localizar las fuentes de variabilidad que ayuden a explicar elcomportamiento de la variable dependiente.
Segn Mendiburu (2007), plantea lo siguiente:Cuando 1 = 0; es decir, si la variable Y no estrelacionada linealmente con la variable X. Estoequivale a plantear la hiptesis Hp: 1=0, y vauna prueba F comparar el valor de F calculado(Fc) con el valor F tabular (Fo), dondeFc=CMR/CME y Fo=F(1,n-2)gl; Si Fc>Fo, serechaza la hiptesis planteada, esto supone unvalor 1 distinto de cero y se concluye que Y sepuede expresar en trminos de X linealmente.
CORRELACIN (R): Es un nmero que indica el grado o intensidad deasociacin entre las variables X e Y; su valor vara entre -1 y +1; estoes: -1 r 1
DETERMINACIN (R2): Principal propsito es predecir futuros resultados,mide el porcentaje de variacin en la variable respuesta; su valor varaentre: 0 R 1.
R = SC regresin / SC total
Modelo de regresin estimado: Total de Madera aserrada (miles de m3) = 467,42 + 24,42 X
X = El periodo
R2 = (49223 / 105526)*100% = 46%
Intercepto = 467,42
Tasa = 24,42
Significa que el crecimiento anual es de 24 mil metros cbicos.
Segn Montgomery et al. (2006), un modelo de regresin donde intervienems de una variable regresora; supone que el rendimiento de laconversin en libras, en un proceso qumico, depende de latemperatura y de la concentracin del catalizador; Donde y representael rendimiento, x1 la temperatura y x2 la concentracin de catalizador,
de los parmetros desconocidos 0, 1 y 2.
y = 0 + 1x1 + 2x2 +
En general, se puede relacionar la respuesta y con k regresores ovariables predictorias:
y = 0 + 1x1 + 2x2 ++ kxk +
De acuerdo a Acua (2004), la forma general:
yi = 0 + 1x1i + 2x2i ++ pxpi +
Para i=1,2, .n. Escribiendo el modelo para cada una de lasobservaciones.
y = x +
Donde y es un vector columna (n, 1), X es una matriz (n, p+1), esel vector de coeficientes de regresin a ser estimados (p+1, 1) y esun vector columna aleatorio de dimensin (n, 1); es necesario que loserrores reciban los valores ms pequeos que sean posibles paraello se requiere minimizar la suma de los cuadrados de los errores alos que se llaman residuos (Acua 2004)
Es necesario que los errores reciban los valores ms pequeos que seanposibles para ello se requiere minimizar la suma de los cuadrados de loserrores a los que se llaman residuos (Acua 2004):
Min[12 + 2
2 ++ n2]=Min{[ 1 2.. n]
12
.
.n
}=Min T
Min T=[y-x]T[y-x]
De donde se tiene:
:= b = (xTx)-1xTy
= e = y-xb
La varianza de los errores:
2 =
1
Suma de cuadrados de los residuales: (SCE)
SCE = (y-x )T(y-x )
La suma de cuadrados de la regresin: (SCR)
SCR = TxTy -( =1
)2
La suma total de cuadrados: (SCT)
SCT = yTy -( =1
)2
En este caso la hiptesis nula es Ho: 1=2= =p=0, o sea que elmodelo no sirve, versus la hiptesis alterna Ha: Al menos uno de loscoeficientes es distinto de cero, o sea al menos una de las variables delmodelo puede ser usada para explicar la variacin de Y (Acua 2004).
Ho: 1 == k = 0
H1: algn i 0
Se rechazar Ho, a nivel , si:
F Fk,n-k-1;
Segn Acua (2004), El coeficiente de Determinacin R2 tiene lamisma interpretacin que en regresin lineal simple y se calculapor:
R2 = SCR/SCT
R2 Ajustado = R2 (k/n-k-1)*(1-R2)
De un experimento para determinar la duracin de vida de ciertos circuitoselectrnicos (Y), en funcin de 2 variables de fabricacin (X1) y (X2).
Modelo de regresin estimado:
Duracin total de los componentes elctricos = 31.5 + 1.775X1 + 4.05X2
X1 = Fabricante N 01
X2 = Fabricante N 02
R2 ajustado = 93.5%
Intercepto = 31.5
Duracin
(Y)
Fabricante N 01
(X1)
Fabricante N 02
(X2)
11 -10 0
8 0 -5
73 10 5
21 -10 0
46 0 5
30 10 -5
INTERPRETACIN: Significa que la duracin de los
componentes del circuito del fabricante N 01 es de 1.775 por
unidad de resistencia, cuando el valor de resistencia del
fabricante N 02 se mantiene constante y la duracin de los
componentes del circuito del fabricante N 02 es de 4.05 por
unidad de resistencia, cuando el valor de resistencia del
fabricante N 01 se mantiene constante.
Para utilizar los modelos de regresin lineal simple es necesario estudiar dosvariables correlacionadas.
Para un grupo de datos se genera un diagrama de dispersin, datosencontrados en el estudio (nube de puntos).
A partir de dos variables, una dependiente y otra independiente su puedeajustar a una lnea de mejor ajuste.
El anlisis de varianza permite contrastar hiptesis propuestas en el estudio.
La regresin lineal mltiple ayuda al estudio de la influencia de variosregresores en la variable respuesta.
El coeficiente de determinacin (R2) nos permitir predecir datos a futuro conun porcentaje de seguridad que sucedan.
GRACIAS
Recommended