Upload
hugo-luis
View
213
Download
1
Embed Size (px)
DESCRIPTION
regresion
Citation preview
Universidad Católica Los Ángeles de ChimboteESTADÍSTICA INFERENCIAL – ESTADÍSTICA APLICADA-------------------------------------------------------------------------------------------------------------------------------------------------------------------------
FACULTAD DE INGENIERÍA
1Elaborado porFechaVersión
: Mg. Carmen Barreto R.: Febrero 2010: 2
2 2
LECTURA 11: REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE (PARTE II)
TEMA 21: CORRELACIÓN LINEAL SIMPLE
1. INTRODUCCIÓN:
El analisis de correlación estudia la intensidad o asociación entre dos o más
variables cuantitativas , sin que necesariamente exista un relación funcional entre
ellas. Cuando se trata de dos variables solamente, se habla de correlación simple y
cuando se trata de más de dos variables se habla de correlación múltiple.
Existen variables que están correlacionadas linealmente como ejemplo : la captura
de pescado en toneladas métricas y el número de embarcaciones, la satisfacción y
la participación del personal, aprendizaje y técnicas de estudio, los beneficios y los
dividendos en el valor de las acciones, etc., que es el tema que trataremos en esta
sesión de aprendizaje.
2. DEFINICIÓN:
La correlación estudia la asociación o relación entre dos variables, es decir mide el
grado de relación entre ellas, mediante un coeficiente o índice. La medida del grado
de asociación entre dos variables se llama coeficiente de correlación lineal simple.
Es importante indicar que correlación no indica causalidad . El hecho que dos
variables estén altamente correlacionadas no implica que X causa a Y ni Y causa a
X.
Cuando se extrae una muestra de n pares de observaciones (x i, yi), i=1,2,…,n de la
población (x,y) no necesariamente independientes. El estimador puntual del
coeficiente de correlación poblacional p es el coeficiente de correlación muestral r de
Pearson, que se define por:
n xy ( x)( y)r
[n x2( x) ] [n y2 ( y) ]
3. CARACTERÍSTICAS:
r puede ser positivo o negativo
-1 r 1
Si r =0; no existe correlación lineal entre las variables x e y.
Si r<0 ; la correlación lineal es negativa entre las variables x e y.
Si r>0 ; la correlación lineal es positiva entre las variables x e y.
Si r = 1; existe una correlación lineal perfecta entre las variables x e y
Si r se acerca a + 1 ó a -1, la correlación lineal entre las variables x e y es
bien estrecha.
Tambíen podemos decir que cuando:
- 0 r 0.5
- 0.5 r 0.8
x e y.
- 0.8 r 1
x e y.
existe una correlación lineal débil entre las variables x e y.
existe una correlación lineal moderada entre las variables
existe una correlación lineal alta o fuerte entre las variables
4. TIPOS DE CORRELACIÓN
Tipos Gráfico
Correlación lineal positiva:
A medida que aumenta x , ytambíen aumenta.
y
x
Correlación lineal negativa:
A medida que x aumenta, y disminuye.
y
x
Sin correlación:
x e y no se agrupan linealmente.
y
x
t
5. PRUEBA DE HIPÓTESIS PARA EL COEFICIENTE DE CORRELACIÓN
POBLACIONAL ( ).
Puede ser que el coeficiente de correlación poblacional sea cero y que una muestra
engañosa hizo que se asumiera equivocadamente una relación, por consiguiente se
debe probar la hipótesis sobre el coeficiente de correlación poblacional. Se siguen
los siguientes pasos:
1. Formulación de hipótesis:H0 : = 0H1 : 0
2. Nivel de significancia:
3. Estadística de prueba:r
t tn 2sr
NOTA: La estadística de prueba nos sirve para hallar el vaor experimental
tk y el valor tabular t 0 t
1 / 2 ; n 2
4. Establecimiento de los criterios de decisión:
1-
/2
-to
0o
R.R.
R.A.: Si t [-t
R.A.
, t ], se acepta H .
R.R.
k
R.R.: Si to
< -to o
o t > t , se rechaza H .k o k o o
st
5. Cálculos:
rk ; Donde:
r
1 r 2sr n 2
6. Decisión:Se acepta o se rechaza la hipótesis
Ejemplo 1:
Deniz Yesiltepe tiene una comercializadora de computadoras y quiere saber si
existe alguna relación lineal entre el número de llamadas hechas en un mes y el
número de computadoras vendidas. Para ello, toma una muestra aleatoria de 10
representantes de ventas y determina el número de llamadas hechas por cada uno
el mes pasado, así como el número de computadoras que vendió., los resultados se
muestran en la siguiente tabla:
X 10 15 20 25 28 30 35 40 45 50Y 30 35 40 45 47 50 55 60 70 72
a) Graficar el diagrama de dispersión e indicar si existe correlación lineal entre las
variables.
b) Determine el coeficiente de correlación lineal e interprete.
a) Pruebe si el coeficiente de correlación poblacional es diferente de cero ( 0 )
para un nivel de significancia α =0.05 .
YSolución:
a)
Diagrama de dispersión
80
70
60
50
40
30
20
10
0
5 10 15 20 25 30 35 40 45 50 55
X
Observando el gráfico vemos que dichas variables tienen una correlación lineal
positiva entre el número de llamadas realizadas en el mes y el número de
computadoras vendidas.
b) Utilizando el coeficiente de correlación lineal de Pearson:
rn xy ( x)( y)
n x2 ( x)2 n y 2 ( y)2
Entonces:
x = 298 x2 = 10384 y = 504
y2 = 27168 xy = 16641 n = 10
Reemplazando las sumatorias en la fórmula obtenemos:
Universidad Católica Los Ángeles de ChimboteESTADÍSTICA INFERENCIAL – ESTADÍSTICA APLICADA-------------------------------------------------------------------------------------------------------------------------------------------------------------------------
FACULTAD DE INGENIERÍA
n
r = 0.9951
Dicho valor nos indica que existe una alta correlación lineal positiva.
c) Para probar la relación lineal entre las variables, llevamos a cabo la
contrastación de coeficiente de correlación lineal poblacional ρ ( ρ≠0).
1. Formulación de Hipótesis
H0 : 0
H1 : 0
2. Nivel de significación: = 0.05
3. Estadística de prueba:
tr
t sr
t t8
4. Establecimiento de los criterios de decisión:
:
1- =0.95
-2.306
/2
0 2.306
R.R. R.A R.R.
R.A.: Si tk [-2.306., 2306], se acepta H .
o
R.R.: Si tk< - 2.306 o t
k> 2.306, se rechaza
H .o
to t1 / 2,n 2
Universidad Católica Los Ángeles de ChimboteESTADÍSTICA INFERENCIAL – ESTADÍSTICA APLICADA-------------------------------------------------------------------------------------------------------------------------------------------------------------------------
FACULTAD DE INGENIERÍA
t 0.975,8 2.306
s
5. Cálculos:
r 1 (0.9951)2
t k ; Donde : s rr
0.031310
t 0.9951 0
k 0.0313
31.79
6. Decisión:
Como tK = 31.79 R.R., rechazamos H0,, lo que quiere decir que
existe correlación lineal entre las variables.0 ; por lo tanto
Ejemplo 2:
En base a una muestra aleatoria de 12 se desea saber si existe relación lineal entre
el precio en euros (X) por el que se adquirió una impresora laser y el número de
años de antigüedad (Y)
N° de años de antigüedad (X)
7 10 9 6 5 8 5 5 0 4 3 1
Precio en € (Y) 466 418 434 487 516 462 475 501 594 553 551 589
a) Graficar el diagrama de dispersión e indicar si existe correlación lineal entre las
variables.
b) Determine el coeficiente de correlación lineal e interprete.
c) Pruebe si el coeficiente de correlación poblacional es diferente de cero ( 0 )
para un nivel de significancia α =0.05
Y
Solución:
a)
Diagrama de Dispersión
700
600
500
400
300
200
100
0
0 2 4 6 8 10 12
X
b) Utilizando el coeficiente de correlación lineal de Pearson:
Entonces:
x = 63 x2 = 431 y = 6046
y2 = 3082898 xy = 29880 n = 12
Reemplazando las sumatorias en la fórmula obtenemos:
r = -0.9702
Dicho valor nos indica que existe una alta correlación entre el numero de años de
antiguedad y el precio en euros por el que se adquirió una impresora lasser.
c) Para probar la relación lineal entre las variables, llevamos a cabo la
contrastación de coeficiente de correlación lineal poblacional ρ ( ρ≠0).
n
1. Formulación de Hipótesis
H0 : 0
H1 : 0
2. Nivel de significación: = 0.05
rn xy ( x)( y)
n x2 ( x)2 n y 2 ( y)2
3. Estadística de prueba:
t r
t sr
t t10
4. Establecimiento de los criterios de decisión:
:
1- =0.95
-2.228
R.R.
0
R.A.
/2
2.228
R.R.
R.A.: Si tkє [-2.228, 2.228], se acepta H .
o
R.R.: Si tk< - 2.228 ó t
k> 2.228, se rechaza H .
o
s
Donde: t o t1 / 2,n 2 t0.975,10 2.228
5. Cálculos:
r 1 (0.9701)2
t k ; Donde : s rr
0.0712
t 0.9701 0
k 0.07
13.86
6. Decisión:
Como tK = 13.86 R.R., rechazamos H0, lo que quiere decir que
existe correlación lineal entre las variables.0 ; por lo tanto