Capt 12 2009

Preview:

Citation preview

En esta presentación se exponen capturas de pantalla relacionadas con la clase de estadística del día 21 de Diciembre, acompañadas por comentarios.

En esa clase vimos cómo se realiza el análisis descriptivo de las variables desde el programa estadístico SPSS

Nota: Esta presentación no pretende suplantar los apuntes tomados en clase por cada alumno. Sólo se publica con la intención de que pueda servir de apoyo al estudio de la asignatura.

Desde �consigna.us.es� nos hemos bajado el archivo �diabetes.sav�.Abrimos el programa SPSS y, desde archivo/abrir/datos llamamos al archivo �diabetes.sav�El análisis descriptivo de una variable lo hacemos mediante el Análisis de Frecuencias

Empezaremos por las variables cualitativas. Seleccionamos las variables medidas en el nivel ordinal y las medidas en el nominal y las pasamos al cuadro de variables a analizar.Las variables cualitativas se resumen mediante tablas de frecuencias y gráficos. Marcamos la casilla �mostrar tablas de frecuencias� y picamos sobre �gráficos�.

Seleccionamos �gráficos de sectores�.Continuar. Aceptar

El panel de resultados arroja una tabla de frecuencias para cada variable cualitativa, y un resumen de los casos válidos/perdidos para cada una de ellas. Además nos muestra un gráfico de cada variable

Pulsando dos veces sobre el gráfico se activa el editor, donde podemos modificar el gráfico.

Poniendo el cursor sobre el gráfico y pulsando sobre el botón derecho se abre la ventana de propiedades. Si el cursor está situado sobre al centro del gráfico las propiedades afectan a todos los sectores.

Podemos realizar muchos cambios, orientados a hacer más claros y atractivos los resultados

Para hacer el análisis a las variables cuantitativas picamos sobre �recuperar los cuadros de diálogo recientes�, pasamos las cuantitativas al cuadro de variables a analizar (menos el identificador)...

... y, posteriormente, sacamos del mismo a las variables cualitativas. Hacerlo así nos facilita el proceso.

Las variables cuantitativas se resumen con medidas de tendencia central y medidas de variabilidad (o dispersión). Debemos desactivar �tablas de frecuencias� del análisis y picar sobre �estadísticos�. Selecciono cuartiles, media, asimetría, desviación típica, rango y valores mínimo y máximo. Continuar.

Picamos sobre gráficos y seleccionamos histogramas. Si marcamos también �curva normal� nos aparecerásobre impresionada la curva normal teórica para esa distribución, con el fin de que podamos comparar. Continuar. Aceptar

Obtenemos un gráfico -histograma- para cada variable...

... y la tabla con las funciones. Es importante distinguir si la distribución de las frecuencias es simétrica. Si lo es, optaremos por la media y la desviación típica. Si la curva es asimétrica haremos el análisis con la mediana y los percentiles 25 y 75. Por eso en el análisis pedimos también que nos calcule la asimetría. Si el valor absoluto de "Asimetría" de la variable supera el doble de su "Error típico" entonces la variable

cuantitativa tiene una distribución asimétrica y se resume mediante la mediana y los percentiles P25 y P75 (además de los valores mínimo y máximo como referencia). En caso contrario con la media y desviación típica. Esto se realiza con cada una de las variables.

Si analizamos el número de embarazos observamos que el valor absoluto de asimetría (1,107) es > que el doble del Error típico de asimetría (0,172), por lo tanto la distribución de esta variable es asimétrica, asíque tenemos que resumirla con mediana y percentiles 25 y 75, además de los valores mínimo y máximo.

Todo lo que estamos viendo es el análisis descriptivo de una muestra completa.

La muestra completa siempre se resume, pero en muchas ocasiones -en casi todos los estudios-

también nos interesa obtener el resumen de esa muestra dividida en subgrupos independientes,

por ejemplo porque queramos comparar los resultados entre esos subgrupos. Cualquier

variable cualitativa es divisora de la muestra en subgrupos independientes, porque sus categorías

de respuesta son excluyentes entre sí.

En nuestro ejemplo vamos a comparar la presión diastólica, insulina, peso, talla, etc. entre diabéticas y no diabéticas.El comando que se usa es �segmentar�

Vamos a comparar los grupos en base a �diabetes�. Pasamos al cuadro de análisis la variable �Diagnóstico de diabetes�. Marcamos �Comparar los grupos� y �Ordenar archivo según variables de agrupación�

Si ahora abrimos la �Vista de variables� y picamos sobre �etiquetas de valor� vemos que los datos se han ordenado según diabetes sí/no. Y el SPSS entiende que todas las órdenes dadas a partir de ahora vendrán partidas según estos dos subgrupos.

Repitamos el análisis hecho sobre la muestra completa pero atendiendo a la nueva situación de los subgrupos. Para evitar tener que repetir todos los pasos picamos sobre sobre �Recuperar los cuadros de diálogo recientes� y sobre �Frecuencias�

Tenemos preseleccionadas en el cuadro de análisis las variables cuantitativas (menos el identificador)

Comprobamos que en �Estadísticos� están marcados los parámetros requeridos...

Y que en �Gráficos� tenemos seleccionada la opción �Histograma�. Comprobad que no estáseleccionada la opción �Mostrar tablas de frecuencias�. Continuar y Aceptar

Vemos que en los resultados distingue las datos obtenidos en un subgrupo (diabéticos) y en el otro (no diabéticos). Y ¿Cómo decido ahora cuando comparar con media y ó, o con mediana y cuartiles?. Si en alguno de los subgrupos la curva es asimétrica, ambos grupos serán tratados como tales, aun cuando el otro grupo presentara una distribución simétrica.

Si analizamos �concentración de glucosa� vemos que en los no diabéticos el valor de asimetría (0,63) es > al doble del error típico de asimetría (0,211), por lo que la distribución de frecuencias respecto a esta variable es asimétrica. Y aunque para los diabéticos esa variable se distribuya de forma simétrica (asimetría de 0,019 y error típico de asimetría de 0.291) la comparación entre ambos habrá de hacerse desde la mediana y los cuartiles.

Si tomamos la variable �presión sanguínea� vemos que en ninguno de los subgrupos el valor de la asimetría supera el doble de su error típico, por lo que usaremos la media y la desviación típica.

Ahora analizaremos las variables cualitativas en cada subgrupo. Como antes, picamos en �Recuperar los cuadros de diálogo recientes� y sobre �Frecuencias�

Introducimos las variables cualitativas (menos la que es la base de la segmentación) en el cuadro de variables a analizar, y retiramos las cuantitativas

Tendremos que despicar todo lo que habíamos seleccionado dentro del apartado �estadísticos� y picar sobre �gráfico de sectores� y �tabla de frecuencias�. Continuar y Aceptar

Observamos como todos los datos de estas variables también vienen en función de los subgrupos diabetes sí / diabetes no

Una vez que he terminado con el análisis de los subgrupos debo acordarme de retirar la orden de �segmentar�. Pico sobre �restablecer� y la muestra vuelve a estar indivisa

Así que hemos visto que un análisis descriptivo lo podemos hacer sobre la muestra completa (siempre hay que hacerlo) y sobre todos los subgrupos en que divide a la muestra una

variable cualitativa (o varias). Pero aún hay una tercera forma: Hacer el análisis descriptivo en un determinado subgrupo de esa muestra. Para ello

acudimos a la herramienta �seleccionar�.

Pico sobre la herramienta �seleccionar casos�

Se abre una ventana que me ofrece varias opciones. Vamos a escoger hacer el análisis a mujeres con una presión sanguínea diastólica en bipedestación inferior a 81 mmHg. Continuar y Aceptar

Si ejecutamos, en la base de datos se tachan los individuos no seleccionados

Y ahora procedemos a realizar un nuevo análisis descriptivo, en este caso restringido al grupo de individuos que cumplen con la condición impuesta. Para ello picamos sobre �Recuperar los cuadros de diálogo recientes� y sobre �Frecuencias�

En primer lugar analizaremos las variables cualitativas. Nos cercioramos de que está marcada la casilla �Mostrar tablas de frecuencias�, que en �Estadísticos� todo está deseleccionado, y que en �Gráficos�está indicado el de sectores. Aceptar

Podemos observar en los resultados cómo ahora la muestra analizada ha disminuido a 162 (antes eran 200).

Igual haremos con las variables cuantitativas. Una vez finalizado el análisis tenemos que acordarnos de anular la �selección�...

... con lo que desaparecen las tachaduras en la base de datos

Ahora vamos a exportar los resultados a un archivo Word/RTF

Lo recogemos del escritorio, o donde lo hayamos enviado, y lo abrimos para poder eliminar todos aquellos elementos inútiles o para cambiar la estética del documento.