ESTADÍSTICA Y PROBABILIDADES: Estadística Descriptiva

Preview:

Citation preview

ESTADÍSTICA Y PROBABILIDADESTEMA 2: ESTADÍSTICA DESCRIPTIVA

Presentaciones tabulares y gráficas

Prof. Alberto Grados Mitteenn

INTRODUCCIÓN

Los datos se clasifican en cualitativos y cuantitativos.

Para resumir un conjunto de datos se usan tablas y gráficos.

Para la elaboración de tablas y gráficos se debe emplear el software adecuado: Excel y Minitab.

RESUMEN DE DATOS CUALITATIVOS• Distribución de frecuencia• Distribuciones de frecuencia relativa y

porcentual• Gráficas de barras y circulares

EJEMPLO:

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS (ABSOLUTAS):

DISTRIBUCIONES DE FRECUENCIA RELATIVA Y FRECUENCIA PORCENTUAL

La frecuencia relativa de una clase es la fracción o proporción de elementos que pertenecen a cada clase.

Donde n es el número total de elementos

EJEMPLO:

Para calcular la frecuencia relativa de la Coke Classic se divide 19 entre 50: 19/50=0,38. Lo que implica que el 38% de los elementos corresponden a esta clase.

GRÁFICAS DE BARRAS Y CIRCULARES

Del ejemplo anterior, la gráfica de barras:

La gráfica circular o de pastel (cake):

NOTAS:

Los expertos estadísticos recomiendan que las clases con frecuencias menores se agrupen en una clase agregada llamada: otros (frecuencias menores a 5%)

La suma de frecuencias relativas es siempre igual a 1.

EJERCICIO DE AUTOEVALUACIÓN:

FORMALIZACIÓN:

RESUMEN DE DATOS CUANTITATIVOS• Distribución de frecuencia• Distribución de frecuencia relativa y frecuencia porcentual• Diagrama de puntos• Histograma• Distribuciones acumuladas• Ojiva

DISTRIBUCIÓN DE FRECUENCIA

Los 3 pasos para definir las clases de una distribución de frecuencia con los datos cuantitativos son:1. Determinar el número de clases que no se

superponen.2. Definir el ancho de cada clase.3. Determinar los límites de clase.

PASO 1: NÚMERO DE CLASES

Se recomienda usar entre 5 y 20 clases. El número de clases (k) debe ser el menor

número entero tal que 2k > n, donde n es el número de elementos (existen otros métodos).

Por ejemplo, si el número de elementos es 50; entonces buscamos la potencia de 2 menor y más cercana a ese valor: 26 > 50. En consecuencia k=6; es decir, se emplearán 6 clases.

PASO 2: DEFINIR EL ANCHO DE CADA CLASE

Es recomendable que sea el mismo para todas.

El ancho de clase o tic (tamaño del intervalo de clase) se calcula:

Donde H: máximo valor y L: mínimo valor

El valor del tic se redondea por exceso; es decir, si los datos tienen una cifra decimal y el tic=3,345 entonces se usa tic=3,4

PASO 3: DETERMINAR LOS LÍMITES DE CADA CLASE Deben elegirse de modo que cada elemento

pertenezca a una y solo una clase. Para la primera clase, el límite inferior es el dato

menor de los elementos. Para cada clase el límite superior se calcula:

LSn = LIn + tic Cuando los datos son discretos se emplean

representaciones simples como: 12 – 18; 19 – 25; etc. Cuando los datos son continuos se suelen emplear

intervalos como: [2,3;4,5[; [4,5;6,7[; etc. Aunque, a veces dichos intervalos se representan como: 2,3 – 4,5; 4,5 – 6,7; etc.; los cuales deben interpretarse de la misma forma (cerrado el límite inferior y abierto el límite superior).

NOTAS:

El punto medio de clase o marca de clase, es el valor medio entre los límites superior e inferior de cada clase; es decir, se obtiene de la semisuma de dichos valores.

Por ejemplo, si un intervalo de clase es 15 – 21; la marca de clase sería igual a (15+21)/2 = 18

La distribución de frecuencia relativa y frecuencia porcentual para datos cuantitativos se elabora de la misma forma que en la tabla de frecuencias para datos cualitativos.

EJEMPLO:

Elabora la tabla de distribución de frecuencias para los siguientes datos:Se tomaron los tiempos que demoran los trabajadores de una empresa en realizar el empaquetado de un producto en una línea de producción (en segundos).

10.8 12.5 15 15.8 15.8 14.6 14 15 18 20

15.4 16.4 15.9 16.4 16.8 19 20.4 22 24 25.4

18 16.8 18.4 18.4 21.5 20.3 25.8 30.2 30.4 32.5

25.4 26.2 28.4 29.2 35.4 36.4 38.4 39.2 38.8 40

RESPUESTA:

N° fi hi hi% xi1 10.8 15.7 7 0.175 17.5 13.252 15.7 20.6 15 0.375 37.5 18.153 20.6 25.5 5 0.125 12.5 23.054 25.5 30.4 5 0.125 12.5 27.955 30.4 35.3 2 0.05 5.0 32.856 35.3 40.2 6 0.15 15.0 37.75

40 1 100.0

TIEMPO

DIAGRAMA DE PUNTOSEjemplo: De una muestra de 20 clientes de la auditora Pricewaterhousecoopers (pwc), se obtuvo:

El diagrama de puntos correspondiente sería:

HISTOGRAMA

Gráfico que se elabora para datos previamente resumidos.

La variable de interés se coloca en el eje horizontal y la frecuencia (absoluta o relativa) en el eje vertical.

Del ejemplo anterior:

NIVELES DE SESGO EN LOS HISTOGRAMAS:

DISTRIBUCIONES ACUMULADAS

En lugar de indicar la frecuencia de cada clase, muestran el número de elementos con valores menores o iguales que el límite superior de cada clase.

EJEMPLO:

OJIVA Es la gráfica de una distribución acumulada. Muestra los valores de los datos en el eje

horizontal, y las frecuencias absolutas acumuladas o relativas acumuladas, sobre el eje vertical.

EJERCICIO DE AUTOEVALUACIÓN:

FORMALIZACIÓN:

BIBLIOGRAFÍA

Anderson, Sweeney, Williams (2012). Estadística para Negocios y Economía (11° Ed.). Estadística Descriptiva: Presentaciones tabulares y gráficas (pp. 31-48) México. CENGAGE Learning.

Estadística para los Negocios: Organización de datos (2013). Universidad San Ignacio de Loyola.

Recommended