Upload
jose-david-coello
View
319
Download
0
Embed Size (px)
Citation preview
Republica Bolivariana De VenezuelaMinisterio del Poder Popular para la Educación
Instituto Politécnico Santiago MariñoBarcelona – Edo Anzoátegui
Profesor:Ramón Aray
Métodos de Correlación
Bachiller:José David CoelloC.I: 26124492
Barcelona , Febrero de 2016
COEFICIENTE DE PEARSON
La covariación es el grado de concordancia de las posiciones relativas de los datos de dos variables. En consecuencia el coeficiente de correlación de Pearson opera con puntuaciones tipificadas (que miden posiciones relativas) y se define como
El fundamento del coeficiente de Pearson es el siguiente ; Cuanto más intensa sea la concordancia (en sentido directo o inverso) de las posiciones relativas de los datos en las dos variables, el producto del numerador toma mayor valor (en sentido absoluto). Si la concordancia es exacta, el numerador es igual a N (o a -N), y el índice toma un valor igual a 1 (o -1).
Ejemplo 1 (Máxima covariación positiva)
Observa que los datos tipificados (expresados como puntuaciones z) en las dos columnas de la derecha tienen los mismos valores en ambas variables, dado que las posiciones relativas son las mismas en las variables X e Y.Si obtenemos los productos de los valores tipificados para cada caso, el resultado es:
El cociente de dividir la suma de productos (5) por N (hay que tener en cuenta que N es el número de casos, NO el número de datos) es igual a 1:
Ejemplo 2 (Covariación positiva de alta intensidad)
Y por tanto.
Ejemplo 3 (Ausencia de covariación) Características del Coeficiente de PEARSON
a) El coeficiente de correlación de Pearson puede tomar valores entre -1 y 1.b) La correlación de una variable con ella misma siempre es igual a 1.c) El valor 0 indica ausencia de covariación lineal, pero NO si la covariación es de tipo no lineal.
VENTAJAS Y DESVENTAJAS Ventajas El valor del coeficiente de correlación es independiente de cualquier
unidad usada para medir variables. Mientras mas grande sea la muestra mas exacta será la estimación
• Desventajas• Requiere supuestos acerca de la naturaleza o formas de las
poblaciones afectadas.• Requiere que las dos variables hayan ido medidas hasta un nivel
cuantitativo continuo y que la distribución de ambas sea semejante a la de la curva normal.
COEFICIENTE DE CORRELACIÓN POR RANGOS DE SPEARMAN
Este coeficiente se emplea cuando una o ambas escalas de medidas de las variables son ordinales, es decir, cuando una o ambas escalas de medida son posiciones. Ejemplo: Orden de llegada en una carrera y peso de los atletas.Se calcula aplicando la siguiente ecuación:
Nota: Los datos hay que traducirlos u ordenarlos en rangos. A los puntajes más elevados le asignamos el rango 1 al siguiente el rango 2 y así sucesivamente. Si se repiten dos puntajes o más se calculan las medias aritméticas.
Ejemplo ilustrativo N° 1: La siguiente tabla muestra el rango u orden obtenido en la primera evaluación (X) y el rango o puesto obtenido en la segunda evaluación (Y) de 8 estudiantes universitarios en la asignatura de Estadística. Calcular el coeficiente de correlación por rangos de Spearman.
Estudiante X YDyana 1 3Elizabeth 2 4Mario 3 1Orlando 4 5Mathias 5 6Josue 6 2Anita 7 8Lucia 8 7
Solución:Para calcular el coeficiente de correlación por rangos de Spearman de se llena la siguiente tabla:
Se aplica la siguiente formula:
VENTAJAS Y DESVENTAJAS Ventajas No esta afectada por los cambios en las unidades de medida Al ser una técnica no parámetra, es libre de distribución probabilística.
Desventajas Es recomendable usarlo cuando los datos presentan valores
extremos, ya que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones no normales.
r no debe ser utilizado para decir algo sobre la relación entre causa y efecto.
BIBLIOGRAFÍA
http://www.uv.es/webgid/Descriptiva/31_coeficiente_de_pearson.html
http://www.monografias.com/trabajos85/coeficiente-correlacion-rangos-spearman/coeficiente-correlacion-rangos-spearman.shtml