Definición de Correlación Lineal

Embed Size (px)

Citation preview

Correlacin LinealLa correlacin entre dos variables busca determinar el grado de relacin que existe entre ellas. Para determinar esta relacin se calcula por medio de los coeficientes de correlacin (r).

El coeficiente de correlacin es un nmero que vara entre +1 y -1. Su magnitud indica el grado de asociacin entre las variables, si es 0 indica que no existe relacin alguna y los valores extremos +1 y -1 indican una correlacin perfecta. As, cuando el coeficiente de correlacin r es cercano a 1, se dice que el modelo de regresin lineal tiene un alto grado de confiabilidad, si al contrario este se acerca a 0 su grado de confiabilidad es muy bajo y se recomienda no utilizar el modelo de regresin.

Una Correlacin lineal es positiva cuando al aumentar o disminuir los valores de la variable independiente aumentan o disminuyen los valores de la variable dependiente. En el grfico de dispersin, los puntos tienen forma ascendente y por lo tanto la recta de ajuste tendr una pendiente positiva. Una Correlacin lineal es negativa cuando al aumentar los valores de la variable independiente disminuyen los valores de la variable dependiente, o viceversa, En este caso lo puntos descendern y la pendiente de la recta de ajuste ser negativa

Con base en el ejemplo anterior, vamos a calcular el apndice de correlacin.

Para su clculo aplicamos la frmula

EJERCICIOS DE APLICACIN1. En un largo curso de introduccin a la sociologa, un profesor hace dos exmenes. El profesor quiere determinar si las calificaciones de los estudiantes en el segundo examen correlacionadas con las calificaciones del primero. Para facilitar la los, se elige una muestra de ocho estudiar calificaciones aparecen en la siguiente tabla.

a. Construya una grfica de dispersin para datos, utilizando la calificacin del primer examen como la variable X. Parece lineal la relacin? b. Suponga que existe una relacin lineal en calificaciones de los dos exmenes, calcule la r de Pearson.c. Qu tan bien explican la relacin, las calificaciones del segundo examen?

0,629531757 Se puede decir que es una relacin Baja y positiva que los dos exmenes tienen entre si

2. Un investigador realiza un estudio de la relacin entre el consumo de cigarros y las enfermedades determinan la cantidad de cigarros fumados diariamente y de das de ausencia en el trabajo dura ltimo ao debido a una enfermedad para 13 individuos en la compaa donde trabaja este investigador. Los datos aparecen en la tabla anexa.

SUJETOCIGARROS CONSUMIDOS DAS DE AUSENCIA

123456789101112000101320273535445360138104145612161016

a. Construya una grfica de dispersin para estos datos: Se ve una relacin lineal?b. Calcule el valor de la r de Pearson.c. Elimine los datos de los sujetos 1, 2, 3, 10, 11 y 12. Esto disminuye el rango de ambas variables. Vuelva a calcular r para los sujetos restantes. Qu afecto tiene la disminucin del rango sobre r?d. A utilizar todo el conjunto de datos, qu porcentaje de la variabilidad en el nmero de das de ausencia es explicado por la cantidad de cigarros fumados diariamente? De qu sirve ese valor?

0,6753

0,0318