59

Estudio de la correlación entre variables | Seminario 9

Embed Size (px)

Citation preview

Page 1: Estudio de la correlación entre variables | Seminario 9
Page 2: Estudio de la correlación entre variables | Seminario 9

La actividad propuesta consiste en usar la base de datos

obesidad.sav, para de este modo, explorar la correlación entre

las variables:

1.- Peso y glucemia

2.- Presión arterial sistólica y colesterol.

Page 3: Estudio de la correlación entre variables | Seminario 9

Estudio peso/ glucemia (Diapositivas 4 – 33) Diapositivas

Normalidad peso 13 – 19

Normalidad glucemia 20 – 27

Correlación peso/ glucemia 28 – 33

Estudio colesterol/ presión arterial (Diapositivas 34 - 59) Diapositivas

Normalidad colesterol 40 – 47

Normalidad presión arterial 48 – 54

Correlación colesterol/ presión arterial 55 – 59

Page 4: Estudio de la correlación entre variables | Seminario 9

EXPLORACIÓN DE LA

CORRELACIÓN ENTRE

PESO Y GLUCEMIA

Page 5: Estudio de la correlación entre variables | Seminario 9

1. Introduce las

variables en el

programa SPSS.

VISTA DE

VARIABLES

Page 6: Estudio de la correlación entre variables | Seminario 9

2. Introduce los

datos de cada

variable

VISTA DE

DATOS

Page 7: Estudio de la correlación entre variables | Seminario 9

DISPERSIÓN DATOS

Ahora vamos a ver en una tabla de

dispersión, para de este modo

hacernos una idea de como se

distribuyen los datos.

Sigue los pasos indicados para realizar

la actividad en SPSS.

Page 8: Estudio de la correlación entre variables | Seminario 9
Page 9: Estudio de la correlación entre variables | Seminario 9
Page 10: Estudio de la correlación entre variables | Seminario 9

ARRASTRA ICONO

Page 11: Estudio de la correlación entre variables | Seminario 9

ARRASTRA ICONO

ARRASTRA ICONO

Page 12: Estudio de la correlación entre variables | Seminario 9

Por como se distribuyen los datos, se observa que

existe una débil correlación lineal (directa: cuando crece

X también crece Y).

Page 13: Estudio de la correlación entre variables | Seminario 9

NORMALIDAD PESO

Vamos a analizar como es la normalidad de

los datos de la variable cuantitativa peso.

Page 14: Estudio de la correlación entre variables | Seminario 9
Page 15: Estudio de la correlación entre variables | Seminario 9
Page 16: Estudio de la correlación entre variables | Seminario 9

Te aparecerá una ventana

como ésta, donde podrás

visualizar distintos datos,

referidos al peso, que podrás

utilizar para evaluar si siguen

una distribución normal o no.

Page 17: Estudio de la correlación entre variables | Seminario 9

Pruebas de normalidad

Kolmogorov-Smirnova Shapiro-Wilk

Estadístic

o gl Sig.

Estadístic

o gl Sig.

Peso medido en

consulta,074 240 ,003 ,979 240 ,001

a. Corrección de significación de Lilliefors

La muestra tiene un número total de datos (N)= 240, por lo que tendremos que

observar la prueba de normalidad según Kolmogorov-Smirnov.

La hipótesis planteada es la siguiente:

Hipótesis nula (H0)= la igualdad= se distribuyen con normalidad

Hipótesis alternativa (H1)= no se distribuyen con normalidad

0.003<0.05= se rechaza la h0, esto es, no sigue una distribución normal, por lo

que acepto la hipótesis alternativa.

Si p-valor ≥ α ⇒ Aceptar H0

Si p-valor < α ⇒ Rechazar H0

Page 18: Estudio de la correlación entre variables | Seminario 9

En el histograma también puedes visualizar como se

distribuyen los datos.

Page 19: Estudio de la correlación entre variables | Seminario 9

En el box-plot también puedes visualizar como se distribuyen

los datos.

En el box-plot también puedes visualizar como se distribuyen

los datos.

Page 20: Estudio de la correlación entre variables | Seminario 9

NORMALIDAD GLUCEMIA.

El mismo procedimiento que hemos realizado para analizar si

los datos se distribuyen con normalidad en la variable peso,

vamos a seguir para decidir si existe normalidad en los datos

de la variable glucemia.

Page 21: Estudio de la correlación entre variables | Seminario 9
Page 22: Estudio de la correlación entre variables | Seminario 9
Page 23: Estudio de la correlación entre variables | Seminario 9
Page 24: Estudio de la correlación entre variables | Seminario 9
Page 25: Estudio de la correlación entre variables | Seminario 9

Pruebas de normalidad

Kolmogorov-Smirnova Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

Glucemia en

ayunas ,242 110 ,000 ,595 110 ,000

a. Corrección de significación de Lilliefors

0.000<.05=se rechaza la h0= no siguen una

La muestra tiene un número total de datos (N)= 240, por lo que tendremos que

observar la prueba de normalidad según Kolmogorov-Smirnov.

La hipótesis planteada es la siguiente:

Hipótesis nula (H0)= la igualdad= se distribuyen con normalidad

Hipótesis alternativa (H1)= no se distribuyen con normalidad

0.000<0.05= se rechaza la h0, esto es, no sigue una distribución normal, por lo

que acepto la hipótesis alternativa.

Si p-valor ≥ α ⇒ Aceptar H0

Si p-valor < α ⇒ Rechazar H0

Page 26: Estudio de la correlación entre variables | Seminario 9

En el histograma también puedes visualizar que los datos no

se distribuyen con normalidad, ya que no sigue la misma

distribución que seguirían los datos que estuvieran

englobados en una Campana de Gauss.

Page 27: Estudio de la correlación entre variables | Seminario 9

En el box-plot también puedes visualizar como se distribuyen

los datos.

Page 28: Estudio de la correlación entre variables | Seminario 9

COMO NO SIGUEN UNA DISTRIBUCIÓN

NORMAL= PRUEBA NO PARAMÉTRICAS= RHO

DE SPERMAN

A continuación, vamos a realizar la prueba de correlación

propiamente dicha. Las dos variables que hemos estudiado,

peso y glucemia, ambas cuantitativas, no siguen una

distribución normal, por lo que tenemos que usar la prueba

para analizar la correlación, para variables no paramétricas

de Rho de Sperman.

Page 29: Estudio de la correlación entre variables | Seminario 9
Page 30: Estudio de la correlación entre variables | Seminario 9
Page 31: Estudio de la correlación entre variables | Seminario 9
Page 32: Estudio de la correlación entre variables | Seminario 9

Correlaciones

Glucemia en

ayunas

Peso medido

en consulta

Rho de Spearman

Glucemia en ayunas

Coeficiente de correlación

1,000 ,485**

Sig. (bilateral) . ,000N 110 110

Peso medido en consulta

Coeficiente de correlación

,485** 1,000

Sig. (bilateral) ,000 .N 110 240

**. La correlación es significativa en el nivel 0,01 (bilateral).

Page 33: Estudio de la correlación entre variables | Seminario 9

La hipótesis planteada es la siguiente:

Hipótesis nula (H0)= la igualdad= 0 = no existe correlación entre glucemia y peso.

Hipótesis alternativa (H1) ‡ 0 = existe correlación entre glucemia y peso.

Vemos en dicho cuadro como la correlación de cada variable consigo misma es

“perfecta” (Coef. de Correlación lineal = 1)

Mientras que la correlación con la otra variable vale 0,485, por lo que aceptamos

la hipótesis alternativa; el resultado es un valor positivo, lo que significa que la

“glucemia” aumenta conforme aumenta el “peso”, considerándose la correlación

obtenida como una correlación moderada, ya que se encuentra en un rango entre

0.4 – 0.6.

El valor de la p asociado al contraste de hipótesis evalúa la probabilidad de que en

la población ambas variables no estén correlacionadas linealmente y que el

Coeficiente de Correlación sea cero.

Ese valor p es 0,000 y es menor que 0,05 e incluso que 0,01.

Lo que permite rechazar la hipótesis nula (contraste significativo) con una alta

confianza (100%).

Page 34: Estudio de la correlación entre variables | Seminario 9

EXPLORACIÓN DE LA

CORRELACIÓN ENTRE

PRESIÓN ARTERIAL Y

COLESTEROL

Page 35: Estudio de la correlación entre variables | Seminario 9

P.ARTERIAL/COLESTEROL

Tienes que realizar el mismo procedimiento en SPSS que en

el ejercicio anterior.

Page 36: Estudio de la correlación entre variables | Seminario 9
Page 37: Estudio de la correlación entre variables | Seminario 9
Page 38: Estudio de la correlación entre variables | Seminario 9
Page 39: Estudio de la correlación entre variables | Seminario 9
Page 40: Estudio de la correlación entre variables | Seminario 9

Como puedes observar, estas dos variables muestran

una débil correlación lineal (directa: cuando crece X

también crece Y).

Page 41: Estudio de la correlación entre variables | Seminario 9

NORMALIDAD COLESTEROL

Page 42: Estudio de la correlación entre variables | Seminario 9
Page 43: Estudio de la correlación entre variables | Seminario 9
Page 44: Estudio de la correlación entre variables | Seminario 9
Page 45: Estudio de la correlación entre variables | Seminario 9

Pruebas de normalidad

Kolmogorov-Smirnova Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

Colesterol total,049 106 ,200* ,989 106 ,573

*. Esto es un límite inferior de la significación verdadera.

a. Corrección de significación de Lilliefors

La muestra tiene un número total de datos (N)= 140, por lo que tendremos que

observar la prueba de normalidad según Kolmogorov-Smirnov.

La hipótesis planteada es la siguiente:

Hipótesis nula (H0)= la igualdad= se distribuyen con normalidad

Hipótesis alternativa (H1)= no se distribuyen con normalidad

0.200<0.05= se acepta la h0, es decir, los datos siguen una distribución normal.

Si p-valor ≥ α ⇒ Aceptar H0

Si p-valor < α ⇒ Rechazar H0

Page 46: Estudio de la correlación entre variables | Seminario 9

En el histograma también puedes observar como se

distribuyen los datos.

Page 47: Estudio de la correlación entre variables | Seminario 9

En el box-plot también puedes visualizar como se distribuyen

los datos.

Page 48: Estudio de la correlación entre variables | Seminario 9

NORMALIDAD PRESIÓN ARTERIAL

Page 49: Estudio de la correlación entre variables | Seminario 9
Page 50: Estudio de la correlación entre variables | Seminario 9
Page 51: Estudio de la correlación entre variables | Seminario 9
Page 52: Estudio de la correlación entre variables | Seminario 9

Pruebas de normalidad

Kolmogorov-Smirnova Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

Tension arterial sistólica ,163 238 ,000 ,947 238 ,000

a. Corrección de significación de Lilliefors

rechazo h0, acepto la h1=no

La muestra tiene un número total de datos (N)= 240, por lo que tendremos que

observar la prueba de normalidad según Kolmogorov-Smirnov.

La hipótesis planteada es la siguiente:

Hipótesis nula (H0)= la igualdad= se distribuyen con normalidad

Hipótesis alternativa (H1)= no se distribuyen con normalidad

0.200<0.05= se rechaza la h0, es decir, los datos no siguen una distribución

normal.

Si p-valor ≥ α ⇒ Aceptar H0

Si p-valor < α ⇒ Rechazar H0

Page 53: Estudio de la correlación entre variables | Seminario 9

En el histograma también puedes observar como los datos

se no se distribuyen como los que siguen una distribución

normal.

Page 54: Estudio de la correlación entre variables | Seminario 9

En el box-plot también puedes visualizar como se distribuyen

los datos.

Page 55: Estudio de la correlación entre variables | Seminario 9

CORRELACIÓN ENTRE PRESIÓN ARTERIAL Y

COLESTEROL

Page 56: Estudio de la correlación entre variables | Seminario 9
Page 57: Estudio de la correlación entre variables | Seminario 9
Page 58: Estudio de la correlación entre variables | Seminario 9

Correlaciones

Colesterol

total

Tension

arterial

sistólica

Rho de Spearman Colesterol total Coeficiente de

correlación1,000 ,263**

Sig. (bilateral) . ,007

N 106 105

Tension arterial sistólica Coeficiente de

correlación,263** 1,000

Sig. (bilateral) ,007 .

N 105 238

**. La correlación es significativa en el nivel 0,01 (bilateral).

Page 59: Estudio de la correlación entre variables | Seminario 9

La hipótesis planteada es la siguiente:

Hipótesis nula (H0)= la igualdad= 0 = no existe correlación entre el colesterol y la

presión arterial.

Hipótesis alternativa (H1) ‡ 0 = existe correlación entre el colesterol y la presión arterial.

Vemos en dicho cuadro como la correlación de cada variable consigo misma es

“perfecta” (Coef. de Correlación lineal = 1)

Mientras que la correlación con la otra variable vale 0,263, por lo que aceptamos

la hipótesis alternativa; el resultado es un valor positivo, lo que significa que la

“presión arterial” aumenta conforme aumenta el “colesterol”, considerándose la

correlación obtenida como una correlación baja, ya que se encuentra en un rango

entre 0.2 – 0.4.

El valor de la p asociado al contraste de hipótesis evalúa la probabilidad de que en

la población ambas variables no estén correlacionadas linealmente y que el

Coeficiente de Correlación sea cero.

Ese valor p es 0,007 y es menor que 0,05 e incluso que 0,01.

Lo que permite rechazar la hipótesis nula (contraste significativo) con

una alta confianza (99%).