19
R Commander: Variables, tablas de frecuencia y gráficas de datos. Realizado por Ismael Rodríguez Godino Subgrupo16 – Virgen del Rocío Seminario 6 – Estadística y TICS

Seminario estadística 6 IRG

Embed Size (px)

Citation preview

Page 1: Seminario estadística 6 IRG

R Commander: Variables, tablas de frecuencia y gráficas de datos.

Realizado por Ismael Rodríguez Godino

Subgrupo16 – Virgen del Rocío

Seminario 6 – Estadística y TICS

Page 2: Seminario estadística 6 IRG

Como ya vimos en el seminario anterior, R Commander es una interfaz estadística de gran uso y con capacidades estadísticas imnumerables.En esta ocasión, vamos a realizar ejercicios más específicos de estadística, con el fichero “activosensalud.RData”. Entre ellos:Seleccionar dos variables cualitativas-factor del fichero, descríbelas en tablas de frecuencias e interpreta al menos 3 aspectos en relación a la distribución de las mismas.Selecciona dos variables numéricas del fichero, y mediante resúmenes numéricos describe e interpreta la distribución de las mismas.Realizar al menos un gráfico de cada tipo con variables adecuadamente seleccionadas del fichero, describe e interpreta la distribución los mismos.

INTRODUCCIÓN.

Page 3: Seminario estadística 6 IRG

Variables cualitativas y tablas de frecuencia

1ª PARTE DEL SEMINARIO 6

Page 4: Seminario estadística 6 IRG

1. Primeramente, vamos a abrir el programa R, que a su vez abrirá R Commander. Tras esto, tenemos que especificar el directorio de trabajo.

En mi caso, he elegido la carpeta “SEMINARIO 6 ESTADÍSTICA”

Pulsamos sobre “Fichero” y posteriormente sobre “Cambiar directorio de trabajo”.

Page 5: Seminario estadística 6 IRG

2. Antes de empezar a realizar las actividades, debemos cargar los datos. En este caso, se trata de un archivo de R, por lo que para cargarlos: pulsamos sobre “datos” y posteriormente sobre “Cargar conjunto de datos”.

Elegimos el archivo de R llamado “activossalud.Rdata” y se cargarán los datos.

Page 6: Seminario estadística 6 IRG

3. Para la actividad, buscamos las distribuciones de frecuencia de los datos cualitativos. Para ello, pulsamos en “Estadísticas”, “resúmenes” y luego a “Distribución de frecuencias”

Nos aparecerá una nueva ventana. En ella elegiremos dos variables, de las que queremos que nos salgan sus tablas de frecuencia. En nuestro caso, hemos elegido “Botellón” y “Dulces” y posteriormente, pulsamos en “ACEPTAR”.

Page 7: Seminario estadística 6 IRG

Nos aparecerán las tablas de frecuencia de las variables elegidas y vamos a interpretar 3 aspectos de cada una.

BOTELLÓN DULCES

Los fines de semana hacen botellón un 31% de los individuos.

31,72% de los individuos toma dulces menos de una vez a la semana (N=92)

51 Individuos del total no hace botellón nunca (17,89%)

20 de los individuos toman dulces diariamente (6,9%)

234 individuos del total han hecho botellón alguna vez (82,1%)

Un 14,48% de los individuos no toma dulces nunca (N=42)

Page 8: Seminario estadística 6 IRG

Variables cuantitativas y tablas de frecuencias

2ª PARTE DEL SEMINARIO 6.

Page 9: Seminario estadística 6 IRG

1. Primero vamos a buscar las tablas de frecuencias de los datos cuantitativos. Para ellos, pulsamos en “Estadísticas” , “Resúmenes” y luego “resúmenes numéricos”.

Nos aparecerá una nueva ventana y en ella aparecerán las variables cuantitativas de la distribución. Elegimos dos de ellas, en mi caso, he elegido “altura” y “comunicación familiar”.

Page 10: Seminario estadística 6 IRG

2. Una vez elegidas las dos variables cuantitativas, nos aparecerá en R Commander, las tablas de frecuencia de “Altura” y “Comunicaciónfamiliar”.

ALTURA COMUNICACIÓN FAMILIAR

• La mediana coincidiría con el 2º cuartil y sería 1,655m. Es una distribución casi asimétrica, la media y la mediana tienen valores similares.

• La muestra presenta 291 individuos y sólo uno no ha contestado. La media es 1,6670m y la DT 0,08078. El rango intercuartílico sería 0,12; el 1er cuartil sería 1,6 y el 3er cuartil sería 1,72.

• La mediana coincidiría con el 2º cuartil y es 7. Es una distribución no asimétrica, pues la mediana y la media no coinciden.

• La muestra presentan 147 individuos y 144 no han contestado. La media es de 7,829932 y la DT es de 2,82448722. El rango intercuartílico sería 3; el 1er cuartil es 6 y el 3er cuartil es 9.

Page 11: Seminario estadística 6 IRG

Tipos de gráficas y variables

3ª PARTE DEL SEMINARIO 6

Page 12: Seminario estadística 6 IRG

Gráfica de sectores.

Para realizar un gráfico de sectores, pulsamos sobre “Gráficas” y luego sobre “gráfica de sectores”.

Nos aparecerá la siguiente ventana:

En ella, elegiremos nuestra variable, en mi caso “dulces” y posteriormente podemos poner título al gráfico. Tras esto, pulsamos “aceptar”.

Page 13: Seminario estadística 6 IRG

Una vez realizado lo anterior, nos aparecerá nuestro gráfico de sectores sobre la variable “Dulces”.

De nuestra distribución podemos sacar una serie de conclusiones o interpretaciones:

Es muy característico el hecho de que una parte importante de la muestra toma dulces menos de una vez a la semana o de 1 a 2 veces por semanas.

También llama la atención el hecho de que una parte poco representativa nunca toma dulces.

Además, muy pocos individuos se dedican a tomar dulces a diario.

Page 14: Seminario estadística 6 IRG

Diagrama de barras.

Para realizar un diagrama de barras, pulsamos sobre “Gráficas” y luego sobre “gráfica de barras”. Luego nos aparecerá una nueva ventana y en ella elegimos la variable a representar en nuestro caso “cerveza”.

Page 15: Seminario estadística 6 IRG

Una vez realizado lo anterior, nos aparecerá nuestro gráfico sobre la variable “cerveza”.

De nuestra distribución podemos sacar una serie de conclusiones o interpretaciones:

Es muy característico el hecho de que una parte muy representativa de la población nunca bebe cerveza.

Otro hecho importante es que sólo una mínima parte de todos los individuos bebe cerveza a diario.

Page 16: Seminario estadística 6 IRG

Histograma.

Para realizar un histograma, primero pulsamos en “gráficas” y luego en “histograma”.

Nos aparecerá una nieva ventana, donde deberemos elegir una variable para el histograma, en nuestro caso, “medicalización”.

Page 17: Seminario estadística 6 IRG

Una vez realizado lo anterior, nos aparecerá nuestro gráfico sobre la variable “medicalización”.

De nuestra distribución podemos sacar una serie de conclusiones o interpretaciones:

Presenta una distribución asimétrica, un poco sesgada a la izquierda.

El porcentaje más alto de individuos se halla con una altura entre 1,6 y 1,7m (modas de la distribución).

Muy pocos individuos miden menos de 1,5 m y también pocos individuos miden más de 1,9m.

Page 18: Seminario estadística 6 IRG

Diagrama de cajas y bigotes.

Para realizar un diagrama de cajas y bigotes, pulsamos en “gráficas” y luego en “diagrama de caja”.

Nos aparecerá una nueva ventana y en ella deberemos elegir una variable de la distribución, en nuestro caso, hemos elegido el “peso”.

Page 19: Seminario estadística 6 IRG

Una vez realizado lo anterior, nos aparecerá nuestro gráfico sobre la variable “peso”.

De nuestra distribución podemos sacar una serie de conclusiones o interpretaciones:

La mediana de la variable es 60; los cuartiles 1 y 3, serían respectivamente 55 y 70 aproximadamente. EL Rango intercuartílico sería 70-55=15 (Q3-Q1).

Existen datos raros O ATÍPICOS que se hallan fuera de la caja y de los bigotes, existe una gran dispersión.

El puntaje más bajo es 39 o 40 aproximadamente y el más alto 90.