12
REPUBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER PUPULAR PARA LA EDUCACION SUPERIOR INSTITUTO UNIVERSITARIO POLITÉCNICO ´´SANTIAGO MARIÑO´´ INGENIERIA INDUSTRIAL 45 Estadística I Daniela Betancourt CI: 21344468

Estadistica 1 presentacion 2

Embed Size (px)

Citation preview

Page 1: Estadistica 1 presentacion 2

REPUBLICA BOLIVARIANA DE VENEZUELAMINISTERIO DEL PODER PUPULAR PARA LA

EDUCACION SUPERIOR INSTITUTO UNIVERSITARIO POLITÉCNICO

´´SANTIAGO MARIÑO´´INGENIERIA INDUSTRIAL 45

Estadística I

Daniela BetancourtCI: 21344468

Page 2: Estadistica 1 presentacion 2

En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.

Coeficiente de correlación de Pearson

El coeficiente de correlación lineal de Pearson se define matemáticamente con la ecuación siguiente:

Page 3: Estadistica 1 presentacion 2

Donde:r = coeficiente de correlación de Pearson.Sxy = sumatoria de los productos de ambas variables.Sx = sumatoria de los valores de la variable independiente.Sy = sumatoria de los valores de la variable dependiente.Sx2 = sumatoria de los valores al cuadrado de la variable independiente.Sy2 = sumatoria de los valores al cuadrado de la variable dependiente.N = tamaño de la muestra en función de parejas.Este procedimiento estadístico es aplicable cuando las observaciones se miden según una escala de intervalo, por otra parte, el fenómeno debe ser lineal.Al igual que las otras pruebas paramétricas, la varianza de las variables X y Y deben guardar homogeneidad.

Pasos:1.Ordenar los valores de la variable dependiente (Y) con respecto a los valores de la variable independiente (X).2.Elevar al cuadrado cada valor X y de Y.3.Obtener los productos de X y Y, para lo cual se deben multiplicar independientemente ambos valores.4.Efectuar las sumatorias Sx, Sy, Sx2, Sy2, y Sxy. 5.Calcular el tamaño de la muestra en función de parejas de X y Y. 6.Aplicar la ecuación.7.Calcular los grados de libertad (gl): gl = N parejas -1. 8.Comparar el valor de r calculado en la tabla de valores críticos de t de Kendall en función de la probabilidad. 9.Decidir si se acepta o rechaza la hipótesis.

Page 4: Estadistica 1 presentacion 2

Si r < 0 Hay correlación negativa : las dos variables se correlacionan en sentido inverso.A valores altos de una de ellas le suelen corresponder valor bajos de la otra y viceversa. Cuánto más próximo a -1 esté el coeficiente de correlación más patente será esta covariación extrema. Si r= -1 hablaremos de correlación negativa perfecta lo que supone una determinación absoluta entre las dos variables ( en sentido inverso): Existe una relación funcional perfecta entre ambas(una relación lineal de pendiente negativa).

Si r > 0 Hay correlación positiva: las dos variables se correlacionan en sentido directo. A valores altos de una le corresponden valores altos de la otra e igualmente con los valores bajos. Cuánto más próximo a +1 esté el coeficiente de correlación más patente será esta covariación Si r = 1 hablaremos de correlación positiva perfecta lo que supone una determinación absoluta entre las dos variables (en sentido directo):Existe una relación lineal perfecta ( con pendiente positiva).

Si r = 0 se dice que las variables están incorrelacionadas: no puede establecerse ningún sentido de covariación.

Propiedad importante: Si dos variables son independientes estarán incorrelacionadas aunque el resultado recíproco no es necesariamente cierto. Matriz de correlacionesir a análsis multidimensional

Propiedades de coeficiente de correlación de Pearson

Page 5: Estadistica 1 presentacion 2

Diagrama de dispersión

Ejemplo: Una empresa comercial tiene establecimientos en varias ciudades de Chile. El gerente comercial planea lanzar al aire un anuncio comercial por radio en las estaciones locales, al menos dos veces antes de una promoción (liquidación) que empezará el Sábado y terminará el Domingo. Planea tener las cifras de las ventas de grabadoras de vídeos (Blu-Ray) del Sábado y Domingo en sus diferentes locales y compararlas con el número de veces que apareció el comercial en la radio. El objetivo fundamental de la investigación es determinar si existe relación entre el número de veces que se transmitió el anuncio y las ventas de sus productos. Los datos son:

Page 6: Estadistica 1 presentacion 2

Con la información de la tabla anterior se desea responder las siguientes interrogantes:1. ¿Cuál es la variable dependiente?. La variable dependiente son las Ventas.2. Trace el diagrama o gráfico de dispersión.

3. ¿Parece haber alguna relación entre X e Y?. Si existe una fuerte correlación positiva

4. Realizar los cálculos el coeficiente de correlación de Pearson o r es de 0,93 (aproximado) y en consecuencia el coeficiente de determinación r² es de r²=(0,929516)²=0,864.

Page 7: Estadistica 1 presentacion 2

En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.

El estadístico ρ viene dado por la expresión:

Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstanciaPara muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student

La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.

Coeficiente de correlación de Spearman

Donde:rs = coeficiente de correlación de Spearman.d2 = diferencias existentes entre los rangos de las dos variables, elevadas al cuadrado.N = tamaño de la muestra expresada en parejas de rangos de las variables.S = sumatoria.

Page 8: Estadistica 1 presentacion 2

Pasos.1.Clasificar en rangos cada medición de las observaciones. 2.Obtener las diferencias de las parejas de rangos de las variables estudiadas y elevadas al cuadrado. 3.Efectuar la sumatoria de todas las diferencias al cuadrado. 4.Aplicar la ecuación. 5.Calcular los grados de libertad (gl). gl = número de parejas - 1. Solo se utilizará cuando la muestra sea mayor a 10. 6.Comparar el valor r calculado con respecto a los valores críticos de la tabla de valores críticos de t de Kendall en función de probabilidad. 7.Decidir si se acepta o rechaza la hipótesis.  

Ejemplo: Un investigador está interesado en conocer si el desarrollo mental de un niño esta asociado a la educación formal de su madre. De esta manera, obtiene la calificación de desarrollo mental en la escala de Gesell de ocho niños elegidos aleatoriamente y se informa del grado de escolaridad de las madres.Elección de la prueba estadística.Se desea medir asociación o correlación. Las calificaciones de la educación formal de las madres están dadas en una medición cualitativa, pero tienen una escala ordinal, por lo cual es posible ordenarlas en rangos.

Planteamiento de la hipótesis.

•Hipótesis alterna (Ha). El desarrollo mental de los hijos es una variable dependiente de la educación formal de la madre; por lo tanto, existe una correlación significativa. •Hipótesis nula (Ho). La asociación entre las variables de educación formal de la madre y el desarrollo mental de los hijos no es significativa, ni hay correlación. 

Page 9: Estadistica 1 presentacion 2

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.Zona de rechazo.Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.Desarrollo mental de algunos niños y escolaridad de las madres.

Aplicación de la prueba estadística.Las observaciones de cada variable se deben ordenar en rangos, así como obtener las diferencias entre los rangos, efectuar la sumatoria y elevar ésta al cuadrado.Educación de algunas madres y calificación de desarrollo mental de los hijos.

Calculo de los grados de libertad (gl).

gl = numero de parejas - 1 = 8 - 1 = 7El valor rs calculado se compara con los valores críticos de rs del coeficiente de correlación por rangos de Spearman.El valor crítico de rs con 7 grados de libertad, para una probabilidad de 0.05 del nivel de significancia es 0.714, o sea, mayor que el calculado. Por lo tanto, éste tiene una probabilidad mayor que 0.05.Decisión.Como el valor de probabilidad de rs de 0.69 es mayor que 0.05, se acepta Ho y se rechaza Ha.9

Calculo de rs de Spearman.

Page 10: Estadistica 1 presentacion 2

Ventajas y desventajas del coeficiente de correlación de Pearson

• Cuando en el fenómeno estudiado las dos variables son cuantitativas se usa el coeficiente de correlaciones de Pearson.

• Es llamado así en homenaje a Karl Pearson. Las dos variables son designadas por X e Y.

• El valor 0 representa falta de correlación.

• Cuando las variables X e Y son independientes, el numerador se anula y el coeficiente de correlación poblacional tiene el valor cero.

• En cambio una correlación nula no implica la independencia de variables.

Ventajas

Desventajas

Page 11: Estadistica 1 presentacion 2

Ventajas y desventajas del coeficiente de correlación de Spearman

• Al ser Spearman una técnica no paramétrica es libre de distribución probabilística (2, 5, 9).

• Los supuestos son menos estrictos. Es robusto a la presencia de outliers (es decir permite ciertos desvíos del patrón normal).

• La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la relación natural que existe entre las variable y no debe manifestarse sólo por la existencia de una fuerte correlación (1, 5).

Ventajas

Desventajas

• Indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia.

• La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.

Page 12: Estadistica 1 presentacion 2

https://www.uv.es/ceaces/base/descriptiva/coefcorre.htm

https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson

http://www.ray-design.com.mx/psicoparaest/index.php?option=com_content&view=article&id=256:coeficiente-pearson&catid=54:coeficiente-correla&Itemid=75

http://www.gestiondeoperaciones.net/estadistica/como-se-relaciona-el-coeficiente-de-correlacion-de-pearson-r-y-el-coeficiente-de-determinacion-r-cuadrado-r%C2%B2/

https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Spearman

http://www.ray-design.com.mx/psicoparaest/index.php?option=com_content&view=article&id=253:coeficiente-spearman&catid=54:coeficiente-correla&Itemid=75

Bibliografía