17
República Bolivariana de Venezuela Ministerio del Poder Popular para la Educación Superior Instituto Universitario Politécnico “Santiago Mariño” Barcelona Edo. Anzoátegui Escuela de Ingeniería Civil. Cátedra: Estadística Tabla de Distribución de Frecuencia Profesor: Bachiller: Pedro Beltrán Gustavo Lemus C.l: 25.812.663 Sección: CV Barcelona, Junio 2016

Presentacion n2 estadistica

Embed Size (px)

Citation preview

Page 1: Presentacion n2 estadistica

República Bolivariana de VenezuelaMinisterio del Poder Popular para la Educación Superior

Instituto Universitario Politécnico “Santiago Mariño”Barcelona Edo. AnzoáteguiEscuela de Ingeniería Civil.

Cátedra: Estadística

Tabla de Distribución de Frecuencia

Profesor: Bachiller:Pedro Beltrán Gustavo Lemus C.l: 25.812.663 Sección: CV

Barcelona, Junio 2016

Page 2: Presentacion n2 estadistica

se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.

Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que contienen los datos.

Tabla de distribución de frecuencia

Page 3: Presentacion n2 estadistica

Los intervalos son los límites a los extremos a los que llega una función. Son utilizados a modo de resumen cuando la cantidad de datos es muy grande. Los límites extremos de cada clase se les llaman Límite Inferior y Superior de clase respectivamente. Los intervalos de clase se emplean si las variables toman un número grande de valores o la variable es continua, es el Rango utilizado para dividir el conjunto de posibles valores numéricos al trabajar con grandes cantidades de datos. Por ejemplo, si los valores están entre 1 y 100,se podrían definir grupos por medio de los intervalos 1-25, 26-50, 51-75, 76-100 cuando el intervalo de la clase es 25

Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente

Ejemplo:

Intervalos de clases

Page 4: Presentacion n2 estadistica

No. De clases (Regla de Sturges): 1 + 3.332 log N Para obtener un valor aproximado, podemos emplear la regla de

¨STURGES¨. k = 1 + 3,3logN donde N es el número de elementos de la muestra.

Numero de clases

Page 5: Presentacion n2 estadistica

La distribución de frecuencias simple es una tabla que se construye con base en los siguientes datos: clase o variable (valores numéricos) en orden descendente o ascendente, tabulaciones o marcas de recuento y frecuencia.Frecuencia simple absoluta: es el número de veces que se observa en un mismo ítem o la cantidad de datos que caen en un mismo intervalo. 

Frecuencia simple relativa: es la razón geométrica entre la frecuencia absoluta y el total de datos, es decir el cociente de dividir el número de veces que aparece un dato de un intervalo entre la totalidad de datos que conforma la muestra de que se trate. Su máximo será la unidad y su mínimo será el cero.

La distribución de frecuencias agrupadas o acumulada es una tabla que contiene las columnas siguientes: intervalo de clase, puntos medios, tabulación frecuencias y frecuencias agrupadas. Frecuencia acumulada, es la suma de la frecuencia de un intervalo de clases con todas las frecuencias de los intervalos que la preceden. Frecuencia acumulada absoluta: es la evaluación o suma de todas las frecuencias absolutas hasta el intervalo de la clase considerado inclusive. 

Frecuencia acumulada relativa: viene a ser la acumulación de todas las frecuencias relativas hasta el mismo intervalo considerado inclusive.

Frecuencias Simples y Acumuladas

Page 6: Presentacion n2 estadistica

Ejemplo:

Page 7: Presentacion n2 estadistica

La medidas de Tendencia Central son:

Media aritmética: La media es el valor promedio de la distribución.

Mediana: La mediana es la puntuación de la escala que separa la mitad superior de la distribución y la inferior, es decir divide la serie de datos en dos partes iguales.

Moda: La moda es el valor que más se repite en una distribución.

Medidas de tendencia central

Page 8: Presentacion n2 estadistica

Ejemplo: MODA (PARA DATOS NO AGRUPADOS)

La moda es el valor que tiene mayor frecuencia absoluta.Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.Hallar la moda de la serie de datos:Xi: 2, 3, 3, 4, 4, 4, 5, 5        Mo= 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal, si son tres las que mas se repiten será trimodal y cuando se mayo a cuatro el número de Mo, generalizaremos diciendo que es  multimodal o polimodal, es decir, que tiene varias modas.

Yi: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9      Mo= 1, 5, 9 (trimodal)

Nota: Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.

Zi: 2, 2, 3, 3, 6, 6, 9, 9

Page 9: Presentacion n2 estadistica

Cálculo de la moda para datos agrupados

Debemos considerar que todos los intervalos tienen la misma amplitud. Por tal motivo y para efectos de nuestro curso, consideraremos que la Mo es el punto medio (xi) del intervalo que presente la mayor frecuencia. considerando también el caso en que la mayor frecuencia puede presentarse en mas de un intervalo (como ocurría para los datos no agrupados) en cuyo caso una distribución pudiera presentar mas de una mida.Clases  fi

72 – 73 869 – 71 2766 – 68 4263 – 65 1860 – 62 5

100

El intervalo en el que se encuentra la mayor frecuencia es en  66 - 68,  donde fi es 42, para determinar la moda de esta distribución será necesario calcular el punto medio de ese intervalo: Xi = (66 + 68) / 2 = 67Xi =67por tanto, la moda de esta distribución es Mo = 67

Page 10: Presentacion n2 estadistica

MEDIANAEs el valor que ocupa el lugar central de todos los datos cuando éstos

están ordenados de menor a mayor. Es decir divide a la serie en dos partes iguales en la que el 50% de los datos están por debajo de la Md y el otro 50% está por encima de ella.La mediana se representa por Md.

La mediana se puede hallar sólo para variables cuantitativas.

Cálculo de la mediana1. Ordenamos los datos de menor a mayor.

2. Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6    Md= 5

3. Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.

7, 8, 9, 10, 11, 12   Md= 9.5

Page 11: Presentacion n2 estadistica

Cálculo de la mediana para datos agrupadosLa mediana se encuentra en el intervalo donde la frecuencia

acumulada llega hasta la mitad de la suma de las frecuencias absolutas.Es decir tenemos que buscar el intervalo en el que se encuentre el 50% de

los datos.Ejemplo

Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:Clases fi Fac72 – 74 8 10069 – 71 27 9266 – 68 42 6563 – 65 18   2360 – 62 5 5 100

El procedimiento es igual al utilizado para calcular el Percentil cincuenta (Pc 50). para ello debemos determinar el 50% de los datos.

el 50% de los  100 datos es 50, entonces debemos hallar la puntuación que deja por debajo de ella al 50 % de los datos (el otro 50% está por encima)

Page 12: Presentacion n2 estadistica
Page 13: Presentacion n2 estadistica

Definición de media aritméticaLa media aritmética es el valor obtenido al sumar todos

los datos y dividir el resultado entre el número total de datos.

µx es el símbolo de la media aritmética para población.

 es el símbolo de la media aritmética para población.

Su fórmula estará dada por la siguiente ecuación:

NOTA. Mientras no digamos lo  contrario supondremos que estamos trabajando con una muestra.

Page 14: Presentacion n2 estadistica

Calculo de media aritmética para datos NO agrupados:EjemploLos tiempos de diez vehículos en hacer un determinado recorrido son: 39, 29, 43, 52, 39, 44, 40, 31, 44, 35 minutos. Hallar el tiempo medio.

Media aritmética para datos agrupadosSi los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:= ( ∑xi . fi ) / N 

= (x1f1 + x2f2 + x3f3 +....+xnfn) / N

Page 15: Presentacion n2 estadistica

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.

LA DISPERSIÓN.Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad.

La dispersión es importante porque:• Proporciona información adicional que permite juzgar la confiabilidad de la medida de

tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.

• Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.

Procedimientos estadísticos referidos al uso y cálculo de las medidas de centralización

Page 16: Presentacion n2 estadistica

Medidas de tendencia central• MEDIA: Media Aritmética, es la que se

obtiene sumando los datos y dividiéndolos por el número de ellos. Se aplica por ejemplo para resumir el número de pacientes promedio que se atiende en un turno. Otro ejemplo, es el número promedio de controles prenatales que tiene una gestante.

• MEDIANA: Corresponde al percentil 50%. Es decir, la mediana divide a la población exactamente en dos. Por ejemplo el número mediana de hijos en el centro de salud “X” es dos hijos. Otro ejemplo es el número mediana de atenciones por paciente en un consultorio.

• MODA: Valor o (valores) que aparece(n) con mayor frecuencia. Una distribución unimodal tiene una sola moda y una distribución bimodal tiene dos. Útil como medida resumen para las variables nominales. Por ejemplo, el color del uniforme quirúrgico en sala de operaciones es el verde; por lo tanto es la moda en colores del uniforme quirúrgico.

Medidas de dispersiónDESVIACIÓN ESTÁNDAR:

Llamada también desviación típica; es una medida que informa sobre la media de distancias que tienen los datos respecto de su media Aritmética, expresada en las mismas unidades que la variable.

LA VARIANZA: Es el valor de la desviación estándar al cuadrado; su utilidad radica en que su valor es requerido para todos los procedimientos estadístico.

ERROR TÍPICO: Llamado también error estándar de la media. Se refiere a una medida d variabilidad de la media; sirve para calcular cuan dispersa estaría la media de realizar un nuevo calculo.