Upload
enrique-beltran
View
35
Download
2
Embed Size (px)
Citation preview
Republica Bolivariana de VenezuelaMinisterio de Poder Popular para la Educación
Instituto Universitario Politécnico Santiago MariñoExtensión Barcelona
Escuela: Ingeniería en Mantenimiento MecánicoCátedra: Estadística 1
Coeficiente de Correlación de Pearson y Spearman
Profesor: Bachiller: Ramón Aray Enrique Beltran C.I: 25.687.801 Barcelona, Julio de 2016
Es una medida de la relación lineal entre dos variables aleatorias
cuantitativas. A diferencia de la covarianza, la correlación de Pearson es
independiente de la escala de medida de las variables. De manera menos
formal, podemos definir el coeficiente de correlación de Pearson como un
índice que puede utilizarse para medir el grado de relación de dos variables
siempre y cuando ambas sean cuantitativas. En el caso de que se esté
estudiando dos variables aleatorias x e y sobre una población; el coeficiente
de correlación de Pearson se simboliza con la letra , siendo la expresión
que nos permite calcularlo:
Coeficiente de Correlación de Pearson:
Coeficiente de Correlación de Pearson:
Donde; es la covarianza de (X,Y)
es la desviación típica de la variable X
es la desviación típica de la variable Y
De manera análoga podemos calcular este coeficiente sobre un estadístico muestral, denotado como a
Ventajas del Coeficiente de Correlación de Pearson:
Ventajas:
El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir variables.
Mientras mas grande sea la muestra mas exacta será la estimación.
Desventajas del Coeficiente de Correlación de Pearson:
Desventajas:
Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas.
Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la distribución de ambas sea semejante a la de la curva normal.
Aplicaciones o Usos del Coeficiente de Correlación de Pearson:
Permite predecir el valor de una variable dado un valor determinado de
la otra variable.
Se trata de valorar la asociación entre dos variables cuantitativas
estudiando el método conocido como correlación.
Dicho cálculo es el primer paso para determinar la relación entre las
variables.
Consiste en la posibilidad de calcular su distribución muestral y así
poder determinar su error típico de estimación.
Aplicaciones o Usos del Coeficiente de Correlación de Pearson:
Reporta un valor de correlación cercano a 0 como un indicador de
que no hay relación lineal entre 2 variables.
Reporta un valor de correlación cercano a 1 como un indicador de
que existe una relación lineal positiva entre las 2 variables. Un valor
mayor a cero que se acerque a 1 da como resultado una mayor
correlación positiva entre la información. Usos del Coeficiente de
Correlación de Pearson.
Enfoque del Coeficiente de Correlación de Pearson:
En la perspectiva de Pearson, para establecer el nivel de significación
estadística habría que atender al impacto de cada tipo de error en el
objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es
preferible minimizar. Pearson llamaron alfa al error tipo I y beta al error tipo
II; a partir de este último tipo de error, introdujeron el concepto de “poder de
una prueba estadística”, el cual se refiere a su capacidad para evitar el
error tipo II, y está definido por 1-beta, y en estrecha relación con éste se
ha desarrollado el concepto de “tamaño del efecto” que algunos han
propuesto como sustituto de los valores p en los informes de investigación
científica. Las pruebas paramétricas más conocidas y usadas son la
prueba T de Student, la prueba F, llamada así en honor a Fisher, y el
coeficiente de correlación de Pearson, simbolizado por “r”.
El Coeficiente de Correlación de Spearman:
Es una medida de la correlación (la asociación o
interdependencia) entre dos variables aleatorias continuas.
Para calcular ρ, los datos son ordenados y reemplazados por
su respectivo orden. El estadístico ρ viene dado por la
expresión: Coeficiente de Correlación de Spearman
El Coeficiente de Correlación de Spearman:
Donde D es la diferencia entre los correspondientes
estadísticos de orden de x - y. N es el número de parejas. Se
tiene que considerar la existencia de datos idénticos a la hora
de ordenarlos, aunque si éstos son pocos, se puede ignorar
tal circunstancia. Para muestras mayores de 20
observaciones, podemos utilizar la siguiente aproximación a
la distribución t de Student
El Coeficiente de Correlación de Spearman:
La interpretación de coeficiente de Spearman es
igual que la del coeficiente de correlación de Pearson.
Oscila entre -1 y +1, indicándonos asociaciones
negativas o positivas respectivamente, 0 cero,
significa no correlación pero no independencia. La
correlación estimada entre X e Y se halla calculando el
coeficiente de correlación de Pearson para el conjunto
de rangos apareados. La correlación de Spearman
puede ser calculada con la fórmula de Pearson, si
antes hemos transformado las puntuaciones en
rangos.
El Coeficiente de Correlación de Spearman:
A partir de un conjunto de n puntuaciones, la formula que permite el calculo de la correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la siguiente:
P=0 No hay correlación
p≠ 0 Hay correlación
Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para Y.
Ventajas del Coeficiente de Correlación de Spearman:
No esta afectada por los cambios en las unidades de
medida.
Al ser una técnica no parámetra, es libre de distribución
probabilística.
Desventajas del Coeficiente de Correlación de Spearman:
Es recomendable usarlo cuando los datos presentan valores
extremos, ya que dichos valores afectan mucho el coeficiente
de correlación de Pearson, o ante distribuciones no normales.
r no debe ser utilizado para decir algo sobre la relación entre
causa y efecto.
Aplicación del Coeficiente de Correlación de Spearman:
Para aplicar el coeficiente de correlación de Spearman se
requiere que las variables estén medidas al menos en escala
ordinal, es decir; de forma que las puntuaciones que la
representan puedan ser colocadas en dos series ordenadas, a
veces, este coeficiente es denominado por la letra griega ρs
(rho), aunque cuando nos situamos en el contexto de la
Estadística Descriptiva se emplea la notación rs
Bibliografía
Correlación en Wikipedia (español):
http://es.wikipedia.org/wiki/Correlaci%C3%B3n Relación entre
variables cuantitativas.
http://www.fisterra.com/mbe/investiga/var_cuantitativas/
var_cuantitativas2.pdf Correlation en Wikipedia (inglés).
http://personal.us.es/vararey/adatos2/correlacion.pdf.
https://es.wikipedia.org/wiki/Coeficiente_de_correlaci
%C3%B3n_de_Pearson.