18
Universidad Católica Los Ángeles de Chimbote ESTADÍSTICA INFERENCIAL – ESTADÍSTICA APLICADA --------------------------------------------------------------------------------------------- FACULTAD DE INGENIERÍA 1 Elaborad o por Fecha : Mg. Carmen Barreto R. : Febrero 2010 LECTURA 11: REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE (PARTE II) TEMA 21: CORRELACIÓN LINEAL SIMPLE 1. INTRODUCCIÓN: El analisis de correlación estudia la intensidad o asociación entre dos o más variables cuantitativas , sin que necesariamente exista un relación funcional entre ellas. Cuando se trata de dos variables solamente, se habla de correlación simple y cuando se trata de más de dos variables se habla de correlación múltiple. Existen variables que están correlacionadas linealmente como ejemplo : la captura de pescado en toneladas métricas y el número de embarcaciones, la satisfacción y la participación del personal, aprendizaje y técnicas de estudio, los beneficios y los dividendos en el valor de las acciones, etc., que es el tema que trataremos en esta sesión de aprendizaje. 2. DEFINICIÓN: La correlación estudia la asociación o relación entre dos variables, es decir mide el grado de relación entre ellas, mediante un coeficiente o índice. La medida del grado de asociación entre dos variables se llama coeficiente de correlación lineal simple. Es importante indicar que correlación no indica causalidad . El hecho que dos variables estén altamente correlacionadas no implica que X causa a Y ni Y causa a X. Cuando se extrae una muestra de n pares de observaciones (x i , y i ), i=1,2,…,n de la población (x,y) no necesariamente

Lectura 11_Regresion Correalcion Lineal Simple_02_S14EIV2

Embed Size (px)

DESCRIPTION

regresion

Citation preview

Page 1: Lectura 11_Regresion Correalcion Lineal Simple_02_S14EIV2

Universidad Católica Los Ángeles de ChimboteESTADÍSTICA INFERENCIAL – ESTADÍSTICA APLICADA-------------------------------------------------------------------------------------------------------------------------------------------------------------------------

FACULTAD DE INGENIERÍA

1Elaborado porFechaVersión

: Mg. Carmen Barreto R.: Febrero 2010: 2

2 2

LECTURA 11: REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE (PARTE II)

TEMA 21: CORRELACIÓN LINEAL SIMPLE

1. INTRODUCCIÓN:

El analisis de correlación estudia la intensidad o asociación entre dos o más

variables cuantitativas , sin que necesariamente exista un relación funcional entre

ellas. Cuando se trata de dos variables solamente, se habla de correlación simple y

cuando se trata de más de dos variables se habla de correlación múltiple.

Existen variables que están correlacionadas linealmente como ejemplo : la captura

de pescado en toneladas métricas y el número de embarcaciones, la satisfacción y

la participación del personal, aprendizaje y técnicas de estudio, los beneficios y los

dividendos en el valor de las acciones, etc., que es el tema que trataremos en esta

sesión de aprendizaje.

2. DEFINICIÓN:

La correlación estudia la asociación o relación entre dos variables, es decir mide el

grado de relación entre ellas, mediante un coeficiente o índice. La medida del grado

de asociación entre dos variables se llama coeficiente de correlación lineal simple.

Es importante indicar que correlación no indica causalidad . El hecho que dos

variables estén altamente correlacionadas no implica que X causa a Y ni Y causa a

X.

Cuando se extrae una muestra de n pares de observaciones (x i, yi), i=1,2,…,n de la

población (x,y) no necesariamente independientes. El estimador puntual del

coeficiente de correlación poblacional p es el coeficiente de correlación muestral r de

Pearson, que se define por:

n xy ( x)( y)r

[n x2( x) ] [n y2 ( y) ]

Page 2: Lectura 11_Regresion Correalcion Lineal Simple_02_S14EIV2

3. CARACTERÍSTICAS:

r puede ser positivo o negativo

-1 r 1

Si r =0; no existe correlación lineal entre las variables x e y.

Si r<0 ; la correlación lineal es negativa entre las variables x e y.

Si r>0 ; la correlación lineal es positiva entre las variables x e y.

Si r = 1; existe una correlación lineal perfecta entre las variables x e y

Si r se acerca a + 1 ó a -1, la correlación lineal entre las variables x e y es

bien estrecha.

Tambíen podemos decir que cuando:

- 0 r 0.5

- 0.5 r 0.8

x e y.

- 0.8 r 1

x e y.

existe una correlación lineal débil entre las variables x e y.

existe una correlación lineal moderada entre las variables

existe una correlación lineal alta o fuerte entre las variables

4. TIPOS DE CORRELACIÓN

Tipos Gráfico

Correlación lineal positiva:

A medida que aumenta x , ytambíen aumenta.

y

x

Correlación lineal negativa:

A medida que x aumenta, y disminuye.

y

x

Sin correlación:

x e y no se agrupan linealmente.

y

x

Page 3: Lectura 11_Regresion Correalcion Lineal Simple_02_S14EIV2

t

5. PRUEBA DE HIPÓTESIS PARA EL COEFICIENTE DE CORRELACIÓN

POBLACIONAL ( ).

Puede ser que el coeficiente de correlación poblacional sea cero y que una muestra

engañosa hizo que se asumiera equivocadamente una relación, por consiguiente se

debe probar la hipótesis sobre el coeficiente de correlación poblacional. Se siguen

los siguientes pasos:

1. Formulación de hipótesis:H0 : = 0H1 : 0

2. Nivel de significancia:

3. Estadística de prueba:r

t tn 2sr

NOTA: La estadística de prueba nos sirve para hallar el vaor experimental

tk y el valor tabular t 0 t

1 / 2 ; n 2

4. Establecimiento de los criterios de decisión:

1-

/2

-to

0o

R.R.

R.A.: Si t [-t

R.A.

, t ], se acepta H .

R.R.

k

R.R.: Si to

< -to o

o t > t , se rechaza H .k o k o o

Page 4: Lectura 11_Regresion Correalcion Lineal Simple_02_S14EIV2

st

5. Cálculos:

rk ; Donde:

r

1 r 2sr n 2

6. Decisión:Se acepta o se rechaza la hipótesis

Ejemplo 1:

Deniz Yesiltepe tiene una comercializadora de computadoras y quiere saber si

existe alguna relación lineal entre el número de llamadas hechas en un mes y el

número de computadoras vendidas. Para ello, toma una muestra aleatoria de 10

representantes de ventas y determina el número de llamadas hechas por cada uno

el mes pasado, así como el número de computadoras que vendió., los resultados se

muestran en la siguiente tabla:

X 10 15 20 25 28 30 35 40 45 50Y 30 35 40 45 47 50 55 60 70 72

a) Graficar el diagrama de dispersión e indicar si existe correlación lineal entre las

variables.

b) Determine el coeficiente de correlación lineal e interprete.

a) Pruebe si el coeficiente de correlación poblacional es diferente de cero ( 0 )

para un nivel de significancia α =0.05 .

Page 5: Lectura 11_Regresion Correalcion Lineal Simple_02_S14EIV2

YSolución:

a)

Diagrama de dispersión

80

70

60

50

40

30

20

10

0

5 10 15 20 25 30 35 40 45 50 55

X

Observando el gráfico vemos que dichas variables tienen una correlación lineal

positiva entre el número de llamadas realizadas en el mes y el número de

computadoras vendidas.

b) Utilizando el coeficiente de correlación lineal de Pearson:

rn xy ( x)( y)

n x2 ( x)2 n y 2 ( y)2

Entonces:

x = 298 x2 = 10384 y = 504

y2 = 27168 xy = 16641 n = 10

Reemplazando las sumatorias en la fórmula obtenemos:

Page 6: Lectura 11_Regresion Correalcion Lineal Simple_02_S14EIV2

Universidad Católica Los Ángeles de ChimboteESTADÍSTICA INFERENCIAL – ESTADÍSTICA APLICADA-------------------------------------------------------------------------------------------------------------------------------------------------------------------------

FACULTAD DE INGENIERÍA

n

r = 0.9951

Dicho valor nos indica que existe una alta correlación lineal positiva.

c) Para probar la relación lineal entre las variables, llevamos a cabo la

contrastación de coeficiente de correlación lineal poblacional ρ ( ρ≠0).

1. Formulación de Hipótesis

H0 : 0

H1 : 0

2. Nivel de significación: = 0.05

3. Estadística de prueba:

tr

t sr

t t8

4. Establecimiento de los criterios de decisión:

:

1- =0.95

-2.306

/2

0 2.306

R.R. R.A R.R.

R.A.: Si tk [-2.306., 2306], se acepta H .

o

R.R.: Si tk< - 2.306 o t

k> 2.306, se rechaza

H .o

to t1 / 2,n 2

Page 7: Lectura 11_Regresion Correalcion Lineal Simple_02_S14EIV2

Universidad Católica Los Ángeles de ChimboteESTADÍSTICA INFERENCIAL – ESTADÍSTICA APLICADA-------------------------------------------------------------------------------------------------------------------------------------------------------------------------

FACULTAD DE INGENIERÍA

t 0.975,8 2.306

Page 8: Lectura 11_Regresion Correalcion Lineal Simple_02_S14EIV2

s

5. Cálculos:

r 1 (0.9951)2

t k ; Donde : s rr

0.031310

t 0.9951 0

k 0.0313

31.79

6. Decisión:

Como tK = 31.79 R.R., rechazamos H0,, lo que quiere decir que

existe correlación lineal entre las variables.0 ; por lo tanto

Ejemplo 2:

En base a una muestra aleatoria de 12 se desea saber si existe relación lineal entre

el precio en euros (X) por el que se adquirió una impresora laser y el número de

años de antigüedad (Y)

N° de años de antigüedad (X)

7 10 9 6 5 8 5 5 0 4 3 1

Precio en € (Y) 466 418 434 487 516 462 475 501 594 553 551 589

a) Graficar el diagrama de dispersión e indicar si existe correlación lineal entre las

variables.

b) Determine el coeficiente de correlación lineal e interprete.

c) Pruebe si el coeficiente de correlación poblacional es diferente de cero ( 0 )

para un nivel de significancia α =0.05

Page 9: Lectura 11_Regresion Correalcion Lineal Simple_02_S14EIV2

Y

Solución:

a)

Diagrama de Dispersión

700

600

500

400

300

200

100

0

0 2 4 6 8 10 12

X

b) Utilizando el coeficiente de correlación lineal de Pearson:

Entonces:

x = 63 x2 = 431 y = 6046

y2 = 3082898 xy = 29880 n = 12

Reemplazando las sumatorias en la fórmula obtenemos:

r = -0.9702

Dicho valor nos indica que existe una alta correlación entre el numero de años de

antiguedad y el precio en euros por el que se adquirió una impresora lasser.

c) Para probar la relación lineal entre las variables, llevamos a cabo la

contrastación de coeficiente de correlación lineal poblacional ρ ( ρ≠0).

Page 10: Lectura 11_Regresion Correalcion Lineal Simple_02_S14EIV2

n

1. Formulación de Hipótesis

H0 : 0

H1 : 0

2. Nivel de significación: = 0.05

rn xy ( x)( y)

n x2 ( x)2 n y 2 ( y)2

3. Estadística de prueba:

t r

t sr

t t10

4. Establecimiento de los criterios de decisión:

:

1- =0.95

-2.228

R.R.

0

R.A.

/2

2.228

R.R.

R.A.: Si tkє [-2.228, 2.228], se acepta H .

o

R.R.: Si tk< - 2.228 ó t

k> 2.228, se rechaza H .

o

Page 11: Lectura 11_Regresion Correalcion Lineal Simple_02_S14EIV2

s

Donde: t o t1 / 2,n 2 t0.975,10 2.228

5. Cálculos:

r 1 (0.9701)2

t k ; Donde : s rr

0.0712

t 0.9701 0

k 0.07

13.86

6. Decisión:

Como tK = 13.86 R.R., rechazamos H0, lo que quiere decir que

existe correlación lineal entre las variables.0 ; por lo tanto