Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
Materia: Estadística I
Maestro: Dr. Francisco Javier Tapia Moreno
Semestre: 2016-1
Universidad de SonoraDepartamento de Matemáticas
Área Económico Administrativa
Hermosillo, Sonora, a 09 de febrero de 2016.
En esta presentación, mostramos cómo elaborar una tabla de
distribución de frecuencias para variables cualitativas (no
numéricas) usando Excel y usar esta distribución para
representar en forma gráfica a las variables de estudio.
También se muestra cómo elaborar una tabla de distribución
de frecuencias para variables cuantitativas (numéricas) usando
Excel y usar esta distribución para representar en forma
gráfica a las variables de estudio.
Para hacer esto, usaremos los datos que se recopilaron en la
encuesta de los propósitos de principio de año 2016 y que
puedes tener acceso al documento Excel en mi página Web en
el apartado Prácticas de Laboratorio en la liga “Práctica 2”.
Introducción
Para saber el sexo predominante del grupo que contestó laencuesta, usamos la función de Excel:
=CONTAR.SI (rango, criterio).
Para conocer el número de Mujeres escribimos
=CONTAR.SI(B2:B30, "F") Ver documento Excel
El resultado que nos da Excel = 20.
Para conocer el número de Hombres escribimos
=CONTAR.SI(B2:B30, “H") Ver documento Excel
El resultado que nos da Excel = 9
Elaboración de Tablas de Distribución
Con la información anterior, podemos construir la distribución defrecuencias del sexo. Esto es,
Elaboración de Tablas de Distribución
SexoFrecuencia
absoluta
Frecuencia
relativa
Frecuencia
porcentual
Femenino 20 0.689655172 68.97%
Masculino 9 0.310344828 31.03%
Total 29 1 100%
Una vez construida la tabla de distribución de frecuencias ya
podemos representar gráficamente la variable cualitativa Sexo
del grupo encuestado.
TABLA 1. DISTRIBUCIÓN DE FRECUENCIAS DEL SEXO DE LOS ENCUESTADOS.
Para hacer la representación gráfica de una variable cualitativa,
en Excel se tienen varias opciones: (diagrama de barras,
diagrama de columnas, diagrama circular o de anillos)
Por ejemplo, si seleccionamos en Excel las celdas Femenino,
Masculino y las respectivas frecuencias absolutas e insertamos un
gráfico de barras, se tiene el gráfico de la figura 1.
Ejemplo introductorio
Tipo de diagrama
Barras
Columnas
Circular
Elaboración de gráficos en Excel
0 5 10 15 20 25
Femenino
Masculino
Número de encuestados.
Sexo
Femenino
Masculino
Figura 1. Sexo de los encuestados
En la figura 1 se observa que el sexo predominante de los encuestados es
el femenino con un 68.97%.
Elaboración de distribuciones en Excel.
Similarmente podemos procesar los datos de la pregunta 2,
relativa a la carrera que estudian los encuestados.
CarreraFrecuencia
relativa
Frecuencia
relativa
Frecuencia
porcentual
Administración 2 0.068965517 6.90%Contaduría 1 0.034482759 3.45%Finanzas 6 0.206896552 20.69%Mercadotecnia 17 0.586206897 58.62%Negocios y
Comercio Int. 3 0.103448276 10.34%Total 29 1 100.00%
TABLA 2. DISTRIBUCIÓN DE FRECUENCIAS DE LA CARRERA DE LOS ENCUESTADOS.
En esta ocasión se eligió insertar un diagrama de sectores.
Elaboración de gráficos en Excel.
LA7% CP
3%
FIN21%
MER59%
NCI10%
FIGURA 2. CARRERA DE LOS ENCUESTADOS
En la figura 2 se observa que el 59% de los encuestados pertenece a la
carrera de Mercadotecnia, 21% a la carrera de Finanzas, un 10% a la
carrera de Negocios y Comercio Internacionales, un 7% a la carrera de
administración y un 3% a la carrera de contaduría.
Para las variables numéricas discretas, el procedimiento para
construir la tabla de distribución de frecuencias es similar al de
las variables no numéricas. Por ejemplo, consideremos la
pregunta 3 de la encuesta relativa a la edad de los encuestados.
Primero ubicamos la edad menor con la función de Excel
=MIN(Rango)
Y después ubicamos la edad mayor con la función
=MAX(Rango)
Para =MIN(D2:D30), Excel calcula 18 años, y
Para =MAX(D2:D30), Excel calcula 22 años.
Ahora usamos la función =CONTAR.SI (rango, criterio). Para
calcular el número de encuestados de cada edad.
Distribuciones de variables no numéricas.
Siguiendo esta indicación, la distribución de las edades
del grupo de encuestados es la siguiente:
Construcción de Distribución de frecuencias
Edad Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
porcentual
18 13 0.448275862 44.83%19 8 0.275862069 27.59%20 3 0.103448276 10.34%21 3 0.103448276 10.34%22 2 0.068965517 6.90%
Total 29 1 100.00%
En esta tabla se puede ver que: el 44.83% de los encuestados tiene 18
años, el 27.59% tiene 19, un 10.34% tiene 20 años, un 10.34% tiene 21
años y un 6.9% tiene 22 años.
TABLA 3. DISTRIBUCIÓN DE FRECUENCIAS DE LAS EDADES DE LOS ENCUESTADOS.
Para construir el histograma de las edades, sólo
seleccionamos las celdas donde se encuentran las
frecuencias absolutas. Una vez seleccionadas dichas
frecuencias, insertamos un gráfico de columnas (ver
diapositiva 6). Al seleccionar este gráfico se abren una
ventana importante que presenta distintas opciones de
color y de forma, seleccionas el color y la forma que mejor
te guste.
Construcción del histograma de variable
discreta.
Otra opción que aparece en la ventana es “el diseño
rápido”
Construcción del histograma de variable
discreta.
Diseño rápido.Opción con
títulos
Eliges una opción con títulos y con columnas separadas ya que se
trata de una variable discreta.
Para colocar las edades en el eje de las “x” se procede de
la manera siguiente: 1) se da un clic sobre las columnas del
gráfico y se presiona el botón derecho del mouse y aparece
una ventana con opciones. 2) se elige la opción
“seleccionar datos” y aparece otra ventana. 3) se elige
“editar” (el del lado derecho) y 4) se seleccionan las celdas
con las edades y se cierran las ventanas.
Construcción del histograma de variable
discreta.
Por último, para variar los colores de las columnas se hace
lo siguiente: 1) se da un clic sobre las columnas del gráfico
y se presiona el botón derecho del mouse y aparece una
ventana con opciones. 2) se elige la opción “Dar formato a
la serie de datos” y aparece otra ventana(al lado derecho
de la pantalla) 3) se da un clic en el “bote con pintura” y
se elige la opción relleno. 4) se palomea la opción “variar
colores” y listo.
Construcción del histograma de variable
discreta.
Gráfico de variables numéricas
0
2
4
6
8
10
12
14
18 19 20 21 22
Núm
ero
de e
ncuest
ados
Edad del encuestado.
Una vez que llevamos a cabo las indicaciones anteriores,
el histograma de las edades queda como se muestra en
la figura 3
Figura 3. Histograma de las edades de los encuestados.
Para las variables numéricas continuas, el procedimiento
para construir la tabla de distribución de frecuencias es
distinto al de las variables numéricas discretas. Por
ejemplo, consideremos la pregunta 6 de la encuesta
relativa al tiempo en que encuestados tienen pensado
llevar a cabo sus metas de 2016. Se tienen 5 categorías:
Distribuciones de variables no numéricas.
Intervalo de claseFrecuencia
absoluta
Frecuencia
relativa
Frecuencia
porcentual
Menos de 10 semanas 0 0 0.00%
de 10 a menos de 20 semanas 3 0.1875 18.75%
de 20 a menos de 30 semanas 2 0.125 12.50%
de 30 a menos de 40 semanas 5 0.3125 31.25%
más de 40 semanas 6 0.375 37.50%
Total 16 1 100.00%
TABLA 4. DISTRIBUCIÓN DE FRECUENCIAS DEL TIEMPO DE REALIZACIÓN DE METAS.
Para construir el histograma del tiempo en que los encuestadosllevarán a cabo sus metas, omitimos las clases o intervalos confrecuencia “cero”. Es decir, sólo graficamos los datos de la tablasiguiente:
Esta distribución muestra que el 37.5% de los encuestados requieremás de 40 semanas para llevar a cabo las metas propuestas del 2016,un 31.25% necesita de 30 a 40 semanas para lograrlas, un 12.5%requiere de 20 a menos de 30 semanas para lograrlas y un 18.75%requiere de 10 a menos de 20 semanas.
Histograma para variables continuas.
Intervalo de claseFrecuencia
absoluta
Frecuencia
relativa
Frecuencia
porcentual
De 10 a menos de 20 semanas 3 0.1875 18.75%
de 20 a menos de 30 semanas 2 0.125 12.50%
de 30 a menos de 40 semanas 5 0.3125 31.25%
más de 40 semanas 6 0.375 37.50%
Total 16 1 100.00%
TABLA 5. DISTRIBUCIÓN DE FRECUENCIAS DEL TIEMPO DE REALIZACIÓN DE METAS.
Una vez que seleccionamos las frecuencias absolutas de
frecuencia distinta de cero, insertamos un gráfico de
columnas y elegimos la opción con títulos y con columnas
pegadas ya que se trata de una variable continua.
Construcción del histograma de variable
discreta.
Diseño rápido.
Opción con
títulos
Ahora se repites el procedimiento de las diapositivas 15 y 16 para
realizar cambios en la escala del eje “x” y para varias los colores
de las columnas.
Figura 4. Histograma del tiempo del logro de metas.
Construcción de un histograma de
variable continua
0
1
2
3
4
5
6
´10-20 20-30 30-40 Más de 40
Núm
ero
de e
ncuest
ados
Número de semanas
Histograma de tiempo para el logro las metas
Para las preguntas abiertas de variables numéricas continuas, elprocedimiento para construir la tabla de distribución defrecuencias se construye de manera diferente. Se tiene quedeterminar primero los intervalos de clase. Por ejemplo,consideremos la pregunta 7 de la encuesta relativa a la cantidadde dinero requerida por los encuestados para lograr sus metas:
Primero ubicamos la cantidad de dinero menor con la función deExcel =MIN(Rango)
Y después ubicamos la edad mayor con la función =MAX(Rango)
Para =MIN(H2:H30), Excel calcula 395 pesos, y
Para =MAX(H2:H30), Excel calcula 80,000 pesos.
Ahora calculamos el RANGO = 80,000 − 395 = $79,605
Luego calculamos la AMPLITUD DEL INTERVALO =79,605
5=15,921
Distribuciones de variables continuas.
Elegimos la AMPLITUD DEL INTERVALO un poco más grande
que el valor dado en la división. Por ejemplo: 15921.5 y
construimos una tabla con los intervalos de clase y
aplicamos la función de Excel =CONTAR:SI:CONJUNTO para
calcular las frecuencias absolutas de cada clase de la
manera siguiente:
Distribuciones de variables no numéricas.
Intervalo de clase Función de Excel para calcular la frecuencia absoluta
394.5 a menos de 16316 =CONTAR.SI.CONJUNTO($H$2:$H$30,">=394.5",$H$2:$H$30,"<16316")
16316 a menos de 32237.5 =CONTAR.SI.CONJUNTO($H$2:$H$30,">=16316",$H$2:$H$30,"<32237.5")
32237.5 a menos de 48159 =CONTAR.SI.CONJUNTO($H$2:$H$30,">=32237.5",$H$2:$H$30,"<48159")
48159 a menos de 64080.5 =CONTAR.SI.CONJUNTO($H$2:$H$30,">=48159",$H$2:$H$30,"<64080.5")
64080.5 a menos de 80002 =CONTAR.SI.CONJUNTO($H$2:$H$30,">=64080.5",$H$2:$H$30,"<80002")
Aplicando las funciones dadas en la diapositiva anterior
obtenemos la distribución siguiente:
Distribuciones de variables no numéricas.
Intervalo de claseFrecuencia
absoluta
Frecuencia
relativa
Frecuencia
porcentual
394.5 a menos de 16316 11 0.78571429 78.57%
16316 a menos de 32237.5 1 0.07142857 7.14%
32237.5 a menos de 48159 0 0 0.00%
48159 a menos de 64080.5 1 0.07142857 7.14%
64080.5 a menos de 80002 1 0.07142857 7.14%
Para poder graficar el histograma necesitamos eliminar las clases con
frecuencia cero.
Eliminando las clases de frecuencia cero, se tiene la
distribución de frecuencias de la tabla 6.
TABLA 6. DISTRIBUCIÓN DE FRECUENCIAS DE LA CANTIDAD REQUERIDA POR
LOS ENCUESTADOS PARA CUBRIR SUS METAS DEL 2016.
Distribuciones de variables no numéricas.
Intervalo de claseFrecuencia
absoluta
Frecuencia
relativa
Frecuencia
porcentual
394.5 a menos de 16316 11 0.78571429 78.57%
16316 a menos de 32237.5 1 0.07142857 7.14%
48159 a menos de 64080.5 1 0.07142857 7.14%
64080.5 a menos de 80002 1 0.07142857 7.14%
Una vez eliminadas las clases con frecuencia cero, el histograma
queda de la manera siguiente:
Elaboración del histograma de variable
continua
0
2
4
6
8
10
12
[394.5, 16316) [16316, 32237.5) [48159, 64080.5) [64080.5, 80002)
Núm
ero
de e
ncuest
ados.
Miles de pesos
Figura 5. Histograma de la cantidad de dinero requerida por los encuestados para lograr sus metas.
En la figura 5 se observa que un 78.57% de los encuestados requiere
menos de 16,316 pesos para cubrir sus metas del año 2016. El resto
está distribuido equitativamente con un 7.14% en cada clase.
Para realizar comparaciones entre dos o más variables, usamos lafunción de Excel:
=CONTAR.SI.CONJUNTO (rango1, criterio1; rango2, criterio2; …).
Por ejemplo, para conocer el número de Mujeres (pregunta 1) que necesitan más de 40 semanas para llevar a cabo sus metas, en una celda de Excel escribimos:
=CONTAR.SI.CONJUNTO(B2:B30,"F",G2:G30,"E") Ver documento Excel
El resultado que nos da Excel = 5.
Para conocer el número de Hombres con la misma característica escribimos:
=CONTAR.SI.CONJUNTO(B2:B30,“M",G2:G30,"E") Ver documento Excel
El resultado que nos da Excel = 1
Elaboración de Tablas de Distribución
Tabla comparativa de distribución.
Sexo/Tiempo Menos
de 10
10-20 20-30 30-40 Más de 40 Total
Femenino 0 0 2 4 5 11
masculino 0 3 0 1 1 5
Total 0 3 2 5 6 16
Llevando a cabo todas las operaciones, obtenemos la tabla siguiente:
TABLA 7. DISTRIBUCIÓN DE FRECUENCIAS COMPARATIVA DEL SEXO Y
EL TIEMPO (EN SEMANAS) DE REALIZACIÓN DE METAS.
En la tabla 7 se puede ver que los hombres que se propusieron metas para
este 2016, son un 31.25% de los encuestados. Un 31.25% de las mujeres
necesita más de 40 semanas para lograr sus metas mientras que un 25%
requiere de 30 a 40 semanas.
Figura 6. Diagrama comparativo del sexo y el número de semanas
para llevar a cabo las metas de 2016.
Diagrama comparativo
En la figura 6 se puede ver que son pocos los hombres que se propusieron
metas para este 2016, sólo un 15.35% de los encuestados lo hizo. De las
mujeres, un 45.45% necesita más de 40 semanas para lograr sus metas,
mientras que un 36.36% requiere de 30 a 40 semanas.
0
1
2
3
4
5
0-10 ´10-20 20-30 30-40 Más de 40
Núm
ero
de e
ncuest
ados
Número de semanas
Diagrama comparativo del sexo con el tiempo para el logro de metas.
Femenino
Masculino