49
ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA Estadística Descriptiva 1 CONCEPTOS BÁSICOS DE ESTADÍSTICA DESCRIPTIVA DISTRIBUCIONES UNIDIMENSIONALES. Introducción. Una de las ramas de la Estadística más accesible a la mayoría de la población es la Descriptiva. Esta parte se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos parámetros útiles para la explicación de la información (Larios, 1998). Además, puede ser usado para comparar dos (2) características medibles sobre algunas personas en un grupo, para comparar grupos usando la misma característica y comparar un grupo con el universo (Otto, 1987). La Estadística Descriptiva, por lo general, no pasa a ser un análisis más profundo de la información. Es un primer acercamiento a la información y, por esa misma razón, es la manera de presentar la información ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodología o algo similar, sino que, al contrario, por ser un medio accesible a la mayoría de la población humana, resulta de suma importancia considerar para así evitar malentendidos, tergiversaciones o errores. La información de toda clase y en particular procedente de los resultados de la inspección y de las pruebas, debe ser ordenada en grupos o arreglos, de tal manera que sea posible obtener la mejor representación por medio de una distribución de frecuencias, mediante esta distribución es posible comprender la magnitud de la exactitud y precisión de un proceso o de una característica de calidad con respecto a una especificación determinada. NÚMEROS RELATIVOS. Utilizando los números absolutos como base de análisis se puede distorsionar la realidad, esto normalmente ocurre cuando se usa la frecuencia o cantidad de casos de una categoría de interés con motivo de comparación sin hacer referencia del total. Este apartado Métodos de Análisis Recolectar, organizar, resumir grandes conjuntos de datos. GRAFICOS: -Histogramas de Frecuencias. -Diagrama Tallos y Hojas. -Diagrama de Caja. Permite NUMERICOS: - Medidas de tendencia central. - Medida de Dispersión. - Medidas de Forma. Mediante Estadística Descriptiva

Geoestadistica I 2dra. Parte. Ok. 10

Embed Size (px)

DESCRIPTION

minas

Citation preview

Page 1: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

1

CONCEPTOS BÁSICOS DE ESTADÍSTICA DESCRIPTIVA

DISTRIBUCIONES UNIDIMENSIONALES.

Introducción.

Una de las ramas de la Estadística más accesible a la mayoría de la población es la Descriptiva. Esta parte se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos parámetros útiles para la explicación de la información (Larios, 1998). Además, puede ser usado para comparar dos (2) características medibles sobre algunas personas en un grupo, para comparar grupos usando la misma característica y comparar un grupo con el universo (Otto, 1987). La Estadística Descriptiva, por lo general, no pasa a ser un análisis más profundo de la información. Es un primer acercamiento a la información y, por esa misma razón, es la manera de presentar la información ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodología o algo similar, sino que, al contrario, por ser un medio accesible a la mayoría de la población humana, resulta de suma importancia considerar para así evitar malentendidos, tergiversaciones o errores.

La información de toda clase y en particular procedente de los resultados de la inspección y de las pruebas, debe ser ordenada en grupos o arreglos, de tal manera que sea posible obtener la mejor representación por medio de una distribución de frecuencias, mediante esta distribución es posible comprender la magnitud de la exactitud y precisión de un proceso o de una característica de calidad con respecto a una especificación determinada.

NÚMEROS RELATIVOS.

Utilizando los números absolutos como base de análisis se puede distorsionar la realidad, esto normalmente ocurre cuando se usa la frecuencia o cantidad de casos de una categoría de interés con motivo de comparación sin hacer referencia del total. Este apartado

Métodos de Análisis

Recolectar, organizar, resumir

grandes conjuntos de datos.

GRAFICOS:

-Histogramas de Frecuencias.

-Diagrama Tallos y Hojas.

-Diagrama de Caja.

Permite

NUMERICOS:

- Medidas de tendencia

central.

- Medida de Dispersión.

- Medidas de Forma.

Mediante

Estadística Descriptiva

Page 2: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

2

pretende mediante técnicas de números relativos, facilitar las herramientas necesarias para poder minimizar o eliminar los análisis distorsionados cuando se utilizan los números absolutos sin tener en consideración el tamaño. Las técnicas de los números relativos a discutir serán: proporción, por ciento, razón, tasa de cambio o por ciento de cambio y tasas.

Proporción.

Compara el número de casos en una categoría de interés de una variable específica con el tamaño total de la distribución de los casos de todas las categorías, incluyendo la categoría de interés. Hay que resaltar que los casos de dicha categoría de interés formarán parte del número total de casos en la distribución total. Además, cuando todas las categorías de una variable se expresan como proporción (P), la suma de todas las (P) debe dar uno (1).

Podemos entonces convertir cualquier categoría en una proporción (P), dividiendo el número de casos o frecuencia (ƒa) de cualquier categoría de interés por el número total de casos en la distribución de la variable específica. La notación expresada sería:

donde:

P = Proporción

ƒ = Frecuencia, cantidad o número de casos.

ƒa = Frecuencia, cantidad o número de casos de una categoría de interés de una variable específica.

ƒi = Frecuencia(s), cantidad(es) o número(s) de caso(s) de otra(as) categoría(as) de la misma variable específica.

ƒa + ƒi = La suma de la frecuencia, cantidad o número de casos de la categoría de interés con la(as) frecuencia(as) o número de casos de otra(as) categoría(as) de la variable específica. O sea, es el número total de casos en la distribución de una variable específica.

Por Ciento.

La expresión "por ciento" viene de la frase latina "per centum", y de ella se deriva la palabra "porcentaje". Un sinónimo para expresar el por ciento es distribución porcentual. El propósito de este método es reflejar la frecuencia (ƒa) de ocurrencia de una categoría de interés por cada cien (100) casos. Cuando todas las categorías de una variable se expresan como porcentaje del total, la suma de todos los porcentajes debe dar cien (100) o aproximado a cien (100). Para calcular un porcentaje multiplicamos cualquier proporción por 100. La notación expresada sería:

donde: % = Por ciento; porcentaje; distribución porcentual

Razón (R).

Compara directamente el número de casos que caen dentro de una categoría de interés (por ej., hombres) con el número de casos que caen dentro de otra categoría de interés (por ej. mujeres). Es un cociente que simboliza el resultado de comparar dos

Page 3: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

3

cantidades. Así, se puede obtener una razón (R) de la siguiente manera, donde ƒa es igual a la frecuencia de una categoría de interés y ƒb es igual a la frecuencia de otra categoría de interés. Como principio básico hay que establecer que el numerador no es una parte componente del denominador (Daniel, 1985) como hemos notado en el método de proporción y por ciento. La notación expresada sería:

ƒb = Frecuencia, cantidad o número de casos de otra categoría de interés que se localiza en el denominador.

Una pregunta básica es qué categoría va en el numerador y que categoría va en el denominador. Veamos, si usted como investigador desea buscar en un lugar y tiempo específico cuántas mujeres existen por tantos hombres, estaría usted planteando cuál sería la razón mujer vs. hombre. La primera categoría que se menciona en dicho problema es mujer y la segunda categoría mencionada es el hombre. Por consiguiente, la manera correcta sería tomar la primera categoría que se menciona como numerador y la segunda categoría como denominador (Sánchez, 1992).

El resultado final se lee en términos de tantos de la categoría que representa la ƒa por cada 1 o 100 de la categoría que representa la ƒb. Además, cancelando los factores comunes en el numerador y el denominador, es posible reducir la razón a su forma más simple, siempre y cuando aplique. Sintetizando podemos señalar que podemos resolver la razón por tres formas distintas:

a. razón utilizando la constante de uno, b. razón utilizando la constante de cien, c. cancelando los factores comunes de la razón.

Cambio Porcentual.

El cambio que puede ocurrir en un período dado puede reflejar un aumento o una disminución. El interés de este método es establecer cuánto representa porcentualmente ese aumento o disminución. Permite determinar en cuánto por ciento ha mermado (o aumentado) un fenómeno entre dos puntos de referencia (Sánchez, 1992). Al computar la tasa de cambio o por ciento de cambio comparamos el cambio real entre el evento más reciente en un tiempo ƒa contra el evento menos reciente en otro tiempo ƒb, sirviendo como base el evento menos reciente tiempo ƒb. La notación expresada sería:

[

]

donde: Δ% = Cambio porcentual o tasa de cambio.

tiempo ƒa = es el valor, frecuencia o cantidad que esta ubicado en el tiempo más reciente. tiempo ƒb = es el valor, frecuencia o cantidad que esta ubicado en el tiempo menos reciente.

Tasas.

Para medir el riesgo de que ocurra un evento dado (es decir; divorcio; matrimonios; homicidios; suicidios; autos hurtados; criminalidad; desempleo; natalidad; entre otros) en

Page 4: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

4

una población y poder hacer comparaciones válidas, se debe relacionar ese evento con la población en la cual aconteció o puede acontecer (Sánchez, 1992; Guerrero, et. al., 1981). Esa relación se conoce con el nombre de tasas. La misma se refiere a aquellos cálculos que implican la probabilidad de la ocurrencia de algún evento (Daniel, 1985), mediante las comparaciones entre el número de casos reales y el número de casos potenciales (Levin, 1979). Es preciso señalar que tanto el numerador (casos reales) como el denominador (casos potenciales) deben referirse al mismo lugar, al mismo lapso o tiempo de ocurrencia y al mismo grupo de población. Las tasas pueden ser crudas (brutas, globales), cuando los eventos se refieren a la población total, incluyendo elementos que no son afectados por el evento; y específicas, cuando se refiere a una parte de la misma. Una tasa puede hacerse tan específica siempre que sus elementos se identifiquen con toda claridad. La notación expresada sería:

Donde: T = Tasas

ƒ casos reales = La frecuencia con la cual ha ocurrido un evento durante algún período y lugar específico.

ƒ casos potenciales = El número de personas expuestas al riesgo del evento durante el mismo período y lugar específico.

k = El propósito del multiplicador k, llamado base, es evitar resultados que comprendan números muy pequeños, que puedan surgir en el cálculo de tasas, y facilitar la compresión de esta última. El valor elegido para k dependerá de las magnitudes del numerador y el denominador. Algunas k para la tasa están preestablecidas como variables de salud (1,000); variables de economía (10,000); variables de criminalidad (100,000).

Los casos reales es la cantidad o frecuencia con que ha ocurrido un evento normalmente son fáciles de encontrar si están registradas. Ejemplo del mismo son las actas de defunciones, los nacimientos, matrimonios, divorcios, registro electoral, autos hurtados, delito tipo I, suicidios, homicidios, empleos, desempleos, entre otros. Estos eventos son registrados sistemáticamente, y por ende, podemos tener acceso a dichos totales.

Los casos potenciales, como el número de personas expuestas al riesgo del evento de interés es en ocasiones más difícil de encontrar. Por ejemplo, analizar la tasa de nacimientos para el año 2002 se debe tener los siguientes elementos; por un lado los casos reales (nacimientos ocurridos en el 2002) y los casos potenciales (la población expuesta a ese evento). Para buscar los casos potenciales se debe establecer que población está expuesta al evento de interés (nacimientos). No toda la población estuvo expuesta al evento de nacimientos. Son las mujeres y no los hombres las que están expuestas al evento de los nacimientos. Es decir, son ellas las que tienen niños(as) y por lo tanto, la población femenina es la más expuesta a los nacimientos. Como nota aclaratoria, si se insiste en calcular una tasa y en los casos potenciales se incluyen elementos (poblaciones) que no están expuestos al evento, los resultados se denominan tasas brutas. Es decir, si calculamos una tasa de natalidad y los casos potenciales incluimos mujeres (expuestas al evento) y hombres (no expuestos al evento), entonces se tiene una tasa bruta de natalidad. Hay que distinguir entre las mujeres que están en la edad reproductiva vs. las que no están en la edad reproductiva. También se puede estudiar la población con mayor exposición al evento de nacimientos es el sector femenino en edad reproductiva, o sea,

Page 5: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

5

entre 15 a 49 años sin ningún problema. No olvidemos que mientras más depurada tengamos los casos potenciales mejor será la impresión ofrecida por el valor calculado.

TABLAS ESTADÍSTICAS.

A partir de este momento nos vamos a ocupar de las estadísticas de una sola variable, "Estadísticas Unidimensionales". Las tablas estadísticas según el número de observaciones y según el recorrido de la variable estadística, se tienen los siguientes tipos de tablas estadísticas:

1.- Tablas tipo I.

Cuando el tamaño de la muestra y el recorrido de la variable son pequeños, por ejemplo si tenemos una muestra de las edades de 5 personas, por lo que no hay que hacer nada especial simplemente anotarlas de manera ordenada en filas o columnas:

EDAD DE LOS 5 MIEMBROS DE UNA FAMILIA

años 5 8 16 38 45

2.- Tablas tipo II.

Cuando el tamaño de la muestra es grande y el recorrido de la variable es pequeño, por lo que se tienen valores de la variable que se repiten. Por ejemplo, si preguntamos el número de incidentes que ocurrieron en 50 semanas obtenemos la siguiente tabla:

2 1 2 2 1 2 4 2 1 1 2 3 2 1 1 1 3 4 2 2 2 2 1 2 1

1 1 3 2 2 3 2 3 1 2 4 2 1 4 1 1 3 4 3 2 2 2 1 3 3

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que se requiere de una tabla, en la que se tiene que resumir estos datos, quedando de la siguiente manera la tabla:

No. de Incidentes Número de semanas 1 16 2 20 3 9 4 5

Total 50

3.- Tablas tipo III.

Cuando el tamaño de la muestra y el recorrido de la variable son grandes, por lo que será necesario agrupar en intervalos los valores de la variable. Por ejemplo si a un grupo de 30 alumnos les preguntamos el dinero que en ese momento llevan encima, nos encontramos con los siguientes datos:

450 1152 250 300 175 80 25 2680 605 785 1595 2300 5000 1200 100

5 180 200 675 500 375 1500 205 985 185 125 315 425 560 1100

Page 6: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

6

[ Li-1 - Li ) Frecuencia

[ 5 - 505) 17

[ 505 - 1005) 5

[ 1005 - 1505) 4

[ 1505 - 2005) 1

[ 2005 - 2505) 1

[ 2505 - 3005) 1

[ 3005 - 3505) 0

[ 3505 - 4005) 0

[ 4005 - 4505) 0

[ 4505 - 5005) 1

30

Evidentemente, la variable estadística tiene un recorrido muy grande, 5000 soles, que es el más alto, por lo que sí queremos hacer una tabla con estos datos tendremos que tomar intervalos. Para decidir la amplitud de los intervalos, necesitaremos decidir ¿cuántos intervalos queremos?. Normalmente se suele trabajar con no más de 10 o 12 intervalos, por lo que la amplitud será a: Amplitud = 5000/10 = 500, de esta manera tomaremos intervalos de amplitud 500

Debemos tener en cuenta las siguientes consideraciones:

Tomar pocos intervalos implica que la "pérdida de información" sea mayor.

Los intervalos serán siempre Cerrados por la izquierda y Abiertos por la Derecha [ Li-1 , Li )

Procuraremos que en la decisión de intervalos los valores observados no coincidan con los valores de los extremos del intervalo y si esto ocurre que no sea en más de un 5% del total de observaciones, así tendremos la siguiente tabla:

Técnicas de recuento.

Aunque hoy en día, si se realiza un estudio estadístico importante esta tarea la realiza el ordenador, ya sea por medio de programas de estadística específicos BMDP, SPSS, o bien utilizando herramientas informáticas de propósito general como Bases de Datos u Hojas de Cálculo. A lo largo del curso, veremos como mediante hojas de cálculo o bases de datos podemos realizar este recuento.

Veamos como realizaríamos este proceso manualmente, para ello veremos diversas técnicas de ir anotando las puntuaciones; aunque el método más utilizado o conocido sea el primero, quizás el más cómodo de utilizar es el 2º en la mayoría de los casos.

Page 7: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

7

Tipos de Frecuencia.

Una de los primeros pasos es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una tabla, en la que a cada valor de la variable se le asocian determinados números que representan el número de veces que se ha encontrado, su proporción con respecto a otros valores de la variable, estos números se denominan frecuencias: Así tenemos los siguientes tipos de frecuencia:

a) Frecuencia absoluta.

La frecuencia absoluta de una variable estadística es el número de veces que aparece en la muestra, dicho valor de la variable la representaremos por ni

b) Frecuencia relativa.

La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fi

Donde N = Tamaño de la muestra

c) Frecuencia Absoluta Acumulada.

Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable; y lo representaremos por Nk.

d) Frecuencia Relativa Acumulada.

Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamaño de la muestra, denotaremos por Fi

e) Porcentaje.

La frecuencia relativa es un tanto por uno, sin embargo, hoy día es bastante frecuente hablar siempre en términos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi.

f) Porcentaje Acumulado.

Análogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como la frecuencia relativa acumulada por 100.

k

i

ik nN

1

N

nf ii

k

i

iki

i fFN

NF

1

%100 ii fp

%100 ii FP

Page 8: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

8

TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS.

La distribución de frecuencia es la representación estructurada, en forma de tabla (ver tabla 1.1), de toda la información que se ha recogido sobre la variable que se estudia en la muestra o población original (datos de campo), y la forma secuencial como se construye la tabla es la siguiente:

PROCESO DE CONSTRUCCIÓN DE DEL CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS

Obtención de datos de la muestra

Obtener el número de clases utilizando la regla de Sturges.

No. de clases = 1+3.33 * Log n

Determinar el valor mínimo y máximo de la muestra, utilizando los valores

Determinar el rango = (max - min)

Determinar el Ancho de clase o Amplitud:

C = Rango / # clases

Determinar los intervalos de clases y proceso de conteo

Construir Histograma de Frecuencia

Construir tabla de frecuencia, incluyendo frecuencias como:

ni, fi, Ni, Fi, Yi, pi, Pi

Tabla 1.1.- Componentes de la tabla de frecuencias.

Intervalo de

Clases (xi) Conteo

Frecuencias Frecuencias

Absoluta (ni) Acumulada (Ni ) Relativa (fi) Acumulada (Fi)

[X1 – X2) ||| n1 n1 f1 = n1 / n f1

[X2 – X3) |||| n2 n1 + n2 f2 = n2 / n f1 + f2

... … ... ... ... ...

[Xn-1 – Xn) || nn-1 n1 + n2 +..+ nn-1 f n-1 = nn-1 / n f1 + f2 +..+ f n-1

nn n fn = ni / n f

Siendo X los distintos valores que puede tomar los intervalos de clases.

Siendo n el número de veces que se repite en cada valor.

Siendo f el porcentaje que la repetición de cada valor supone sobre el total

CONSTRUCCIÓN DE TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS.

1er. Caso para datos cualitativos o de atributos.

En estos casos se evalúan los atributos o características particulares que define a la variable, esta característica tendrá una variabilidad según como se observe en el campo.

Ejemplo: Se identificó una muestra de personas que poseían automóviles producidos por la General Motors y se registró la marca de cada automóvil. A continuación se presenta la muestra que se obtuvo (Ch=Chevrolet, P=Pontiac, O=Oldsmobile, B=Buick, Ca=Cadillac):

Ch B Ch P Ch O B Ch Ca Ch O Ch Ch O Ch Ch B B Ca P O P P Ch P O O Ch Ch B P Ch Ch B Ch B Ch B Ch P O Ca P Ch O B Ca O Ch B

Page 9: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

9

El cuadro de distribución de frecuencia es la siguiente:

Marca de Automóvil Xi No. de semanas ni fi pi Ni Fi Pi

CH 19 19/50=0.38 38% 19 19/50=0.38 38%

P 8 8/50=0.16 16% 27 27/50=0.54 54%

O 9 9/50=0.18 18% 36 36/50=0.72 72%

B 10 10/50=0.20 20% 46 46/50=0.92 92%

CA 4 4/50=0.08 8% 50 50/50=1.00 100%

50 1.00 100%

2do. Caso para datos cuantitativos discretos.

Para estos casos se debe tomar en cuenta que la variabilidad de los datos es muy pequeña, por lo que se toma como base (frecuencia) esta misma variación tal como lo indica la tabla de tipo II. Tomando como ejemplo la tabla tipo II, se puede ver fácilmente como se calculan las frecuencias, como es:

No. de Incidentes Xi No. de semanas ni fi pi Ni Fi Pi

1 16 16/50=0.32 32% 16 16/50=0.32 32%

2 20 20/50=0.40 40% 36 36/50=0.72 72%

3 9 9/50=0.18 18% 45 45/50=0.90 90%

4 5 5/50=0.10 10% 50 50/50=1.00 100%

50 1.00 100%

3er. Caso para datos cuantitativos continuos.

Se trabajan con muestras que debe ser el subconjunto de un universo, del cual se recopilarán los datos. Es necesario que esa muestra sea debidamente representativa y que tenga una amplia variación como lo indica la tabla tipo III.

Ejemplo: Se analizaran medidas de resistencia a la ruptura de 58 muestras de monofilamento, utilizado para la fabricación de redes. Para dicho análisis se hará uso de tecnología computacional, utilizando las herramientas estadísticas; por tanto, para los resultados se analizaron los datos originales, con el fin de observar el patrón del comportamiento de dicha variable mediante su histograma y tabla de frecuencia. Los datos de resistencia se muestran en la siguiente tabla:

66.4 74.2 72.1 71.2 70.3 70.3

69.2 67.7 74.5 72.2 71.3 71.3

70.0 69.3 68.0 75.3 72.3 72.4

71.0 70.1 69.3 68.0 68.3 68.4

71.9 71.1 70.2 69.5 69.5 69.6

70.8 70.6 70.6 70.5 70.4 70.9

71.8 71.7 71.6 71.6 71.5 71.8

73.3 73.1 72.9 72.7 72.6 73.5

69.1 69.0 68.9 68.8 68.6 69.7

70.0 69.9 69.8 69.8

Page 10: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

10

Para poder lograr la construcción de las gráficas respectivas, se deben determinar los parámetros estadísticos como: dato mínimo, dato máximo, rango, número de clases y ancho clases, respectivamente, y para ello se deben seguir los siguientes pasos:

1.- Para el número de clases se utiliza la regla de Sturges:

# de clases = 1+3.33 * Log n = 6.8 = 7

NOTA: la regla de Sturges no se recomienda aplicar en observaciones muy grandes o muy pequeñas, por cuanto una distribución de frecuencias generalmente se encuentra en un rango de 4 a 20 clases.

2.- Para determinar el rango se tomó el dato mayor y el dato menor de las muestras, esto es:

Rango = 75.3 – 66.4 = 8.9

3.- El ancho de clases o amplitud se determina con el rango entre el número de clases, esto es:

Ancho de clases C = Rango / # clases = 1.2714

Del valor obtenido en el ancho de clases se redondea hacia arriba al mismo nivel de precisión de los datos brutos, y esto lo denominamos como Ancho real; esto se realiza con la finalidad de poder contener los datos en su totalidad en el cuadro de frecuencias.

Ancho de clases = Rango / # clases = 1.2714 = 1.3

4.- Los intervalos de clases se determinan para identificar el patrón de comportamiento de las variables, donde:

Límite Inferior (L.i.) = mínimo [

Límite Superior (L.s.) = L.I. + Ancho real )

5.- Se determinan las marcas de clase (Yi) de cada una de las categorías, está definida como la semisuma de los extremos de cada categoría, también se le denomina como punto medio de cada clase.

6.- Se construye el cuadro de frecuencias, y puesto que todas las resistencias están comprendidas entre 66.4 y 75.3 Lb., los datos se agruparon por intervalos de 1.3, con lo que la información queda mucho más resumida y manejable como se muestra en la siguiente tabla de distribución de frecuencia.

L.i. - L.s. Conteo ni Yi fi Ni Fi pi Pi

66.3 - 67.6 I 1 66.95 0.017 1 0.017 1.7% 1.7%

67.6 - 68.9 IIIIIIII 8 68.25 0.138 9 0.155 13.8% 15.5%

68.9 - 70.2 IIIIIIIIIIIIIIII 16 69.55 0.276 25 0.431 27.6% 43.1%

70.2 - 71.5 IIIIIIIIIIIIII 14 70.85 0.241 39 0.672 24.1% 67.2%

71.5 - 72.8 IIIIIIIIIIII 12 72.15 0.207 51 0.879 20.7% 87.9%

....2

1SupLimInfLimYi

Page 11: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

11

72.8 - 74.1 IIII 4 73.45 0.069 55 0.948 6.9% 94.8%

74.1 - 75.4 III 3 74.75 0.052 58 1.000 5.2% 100.0%

58 1.000 100%

Para responder el porcentaje de algunas preguntas, se hizo uso de algunas funciones estadísticas como se muestra a continuación:

a.- Determinar, a partir de la tabla de frecuencias, el % de monofilamentos cuyas resistencias no exceden de las 70.0 libras. Para determinar el número de elementos o

hilos cuyo valor es 70.0 libras, esto es:

N(X<=70.0) = Contar.Si (Rango, criterio)

N(X<=70.0) = Contar.Si (desde 66.4 a 70.0, “<= 70.0”) = 23 hilos

P(X<=70.0) = 23 / 58 = 39.7 %

Esto nos dice, que el 39.7% es inferior o igual 70.0 libras. Para este caso, el rango son todos los valores de la muestra a analizar.

b.- Determinar el % de monofilamentos cuya resistencia excede de las 72.2 libras.

N(X>72.2) = Contar.Si (desde 72.3 a 75.3, “> 72.2”) = 11 hilos

P(X>72.2) = 11 / 58 = 18.97 %

Esto nos dice, que el 18.97 % es superior 72.2 libras.

Presentación Grafica de Cuadros de Distribución de Frecuencias.-

La construcción del histograma y las otras graficas representativas se determinan utilizando las herramientas de análisis de datos de Excel.

1.- Histogramas. El diagrama de barra o grafico de barra, son rectángulos verticales en donde sus lados son el límite inferior y superior de cada clase y cuya altura de cada uno de ellos es igual a la frecuencia de clase (ni / fi).

2.- Polígono de Frecuencias.- Es una grafica lineal que muestra la variación de los datos según la distribución de clases en variables continuas, las marcas de clase se ubican en el eje de las abscisas y las frecuencias en las ordenadas; cuando la variación tiene causales fundamentales que van permaneciendo constantes recibe en nombre de variación

H is t o g r a m a d e F r e c u e n c ia

0

2

4

6

8

1 0

1 2

1 4

1 6

1 8

66.3 - 6

7.6

67.6 - 6

8.9

68.9 - 7

0.2

70.2 - 7

1.5

71.5 - 7

2.8

72.8 - 7

4.1

74.1 - 7

5.4

N u m e r o d e c l a s e s

Fre

cu

en

ci

F r e c u e n c ia

Page 12: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

12

inherente; para formar una figura cerrada se genera los puntos extremos: (Y i – C, 0 ) y (Yk + C, 0 ).

3.- Grafica de Frecuencias Acumuladas.- Es una gráfica lineal, donde se muestra la sumatoria de las frecuencias de cada clase, a esta representación gráfica también se le conoce con el nombre de ojiva.

MEDIDAS ESTADÍSTICAS.

Introducción.

En el resto del tema nos ocuparemos exclusivamente de las variables cuantitativas, puesto que con los atributos no se pueden realizar operaciones aritméticas. Como se ha estudiado, las variables estadísticas cuantitativas se dividen o clasifican en discretas y continuas, por lo que se debe precisar cómo se calculan dichas medidas en cada caso.

En las variables cuantitativas continuas, dado que la tabulación de los datos se hace mediante intervalos, necesitaremos tomar un valor del intervalo para poder operar. Este valor se denomina marca de clase y es el punto medio del intervalo.

0

0.05

0.1

0.15

0.2

0.25

0.3

66.95 68.25 69.55 70.85 72.15 73.45 74.75

Fre

cu

en

cia

Marcas de Clase

Poligono de Frecuencias

Series1

Page 13: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

13

Las medidas estadísticas pretenden "resumir" la información de la "muestra" para poder tener así un mejor conocimiento de la población, para un estudio ordenado y claro, se tienen los siguientes tipos:

TIPOS DE MEDIDA.

A.- MEDIDAS DE CENTRALIZACIÓN.

Al describir grupos de observaciones, con frecuencia se desea describir el grupo con un solo número. Para tal fin, desde luego, no se usará el valor más elevado ni el valor más pequeño como único representante, ya que solo representan los extremos. Entonces sería más adecuado buscar un valor central.

Las medidas que describen un valor típico en un grupo de observaciones que suelen llamarse medidas de tendencia central. Es importante tener en cuenta que estas medidas se aplican a grupos más bien que a individuos, un promedio es una característica de grupo y no individual.

En la investigación, ese valor se conoce como una medida de tendencia central, ya que está generalmente localizada hacia el medio o centro de una distribución en la que la mayoría de los puntajes tienden a concentrarse. La tendencia central es un índice de localización central empleado en la descripción de las distribuciones de frecuencias. La capacidad de localizar un punto de tendencia central puede ser muy útil para el investigador. Por ejemplo, podrá reducir una masa de datos a un simple valor cuantitativo que llegará a ser comprendido y comunicado a otros especialistas.

Puesto que el centro de una distribución puede ser definido de diferentes maneras, habrá también diferentes medidas de tendencia central. Usualmente se conocen tres técnicas: la moda, la mediana y la media aritmética.

Las medidas de tendencia central son de dos tipos:

a) Medidas de posición central.- informan sobre los valores medios de la serie de datos. b) Medidas de posición no centrales.- informan de cómo se distribuye el resto de los

valores de la serie.

Las principales medidas de posición central son las siguientes:

MEDIA.- Vamos a estudiar en este apartado los distintos tipos de media que son:

Media aritmética.- Para calcular la media aritmética se tienen dos modelos:

MEDIDAS DESCRIPTIVAS

Medidas de Posición

Medidas de Tendencia Central

Cuarteles y Percentiles

Medidas de Dispersión

Varianza Desviación Estándar

Desv. Absoluta Media Coef. de Variación

Rango Intercuartílico

Medidas de Forma

- Sesgos

- Curtosis

Page 14: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

14

Propiedades.- La media presenta el problema de que su valor (tanto en el caso de la media aritmética como geométrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores anómalos podrían condicionar en gran medida el valor de la media, perdiendo ésta representatividad. En todo caso, la media aritmética es la medida de posición central más utilizada.

Método abreviado.- Se determina mediante los siguientes procesos:

a. Hallando el origen de trabajo Ow, éste es igual a la marca de clase con mayor frecuencia Ow = Yi con > nj

b. Calcular los desvíos por medio de la fórmula:

c. Calcular el promedio por medio de la fórmula de:

[∑

]

Media geométrica.- Según el tipo de datos que se analice será más apropiado utilizar la media aritmética o la media geométrica. La media geométrica se suele utilizar en series de datos como tipos de interés anuales, inflación, etc., donde el valor de cada año tiene un efecto multiplicativo sobre el de los años anteriores.

La media geométrica de N observaciones es la raíz de índice N del producto de todas las observaciones. La representaremos por G.

Solo se puede calcular si no hay observaciones negativas. Es una medida estadística poco o nada usual.

Media armónica.- La media armónica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H; al igual que en el caso de la media geométrica su utilización es bastante poco frecuente.

MEDIANA.- La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente o decreciente, el valor que divide en dos partes la muestra (es decir el valor tal que el 50% de los datos está por arriba de dicho valor y el 50% que está por debajo). Para calcular la mediana debemos tener en cuenta si la variable es discreta o continua.

Para datos no agrupados: Para datos agrupados se define como la

suma ponderada:

N

X

X

n

i

i 1

N

nY

fYX

n

i

ii

i

n

i

i

1

1

Page 15: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

15

Cálculo de la mediana en el caso discreto: Tendremos en cuenta el tamaño de la muestra.

Si N es Impar, hay un término central, el término que será el valor de la mediana.

Si N es Par, hay dos términos centrales, la mediana será la media de esos dos valores, Veamos un ejemplo.

N – Par

N – Impar

1,4,6,7,8,9,12,16,20, 24,25,27 N=12 1,4,6,7,8,9,12,16,20, 24,25,27,30 N=13

Términos Centrales el 6º y 7º 9 y 12 Término Central el 7º , 12

Me = Me = 12

Cálculo de la mediana en el caso contínuo: Si la variable es continua, la tabla vendrá en intervalos, por lo que se calcula de la siguiente forma: Nos vamos a apoyar en un gráfico de un histograma de frecuencias acumuladas.

De donde la mediana es:

Veamos por medio de un ejemplo: supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente forma:

Li - Ls ni Ni Como el tamaño de la muestra es N=50, buscamos el intervalo en el que la Frecuencia acumulada es mayor que 50/2=25, que en este caso es el 3º y aplicamos la fórmula anterior. Luego la Mediana será

45 - 55 6 6

55 - 65 10 16

65 - 75 19 35

75 - 85 11 46

85 - 95 4 50

j

j

jrealn

Nn

CLMe1

.inf2

74.6919

162

50

1065

Me

Page 16: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

16

MODA. La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite. Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima.

a).- Calculo de Mo en el caso discreto.- es la única medida de centralización que no tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de cálculo matemático; por lo tanto, la moda se considera la mayor concentración de datos. En cuyo caso tendremos unimodal, bimodal o polimodal según sea el caso.

b).- Calculo de Mo en el caso continuo.- Para este caso debemos detenernos un poco en el cálculo de la moda para distribuciones cuantitativas continuas.

Apoyándonos en el gráfico podemos llegar a la determinación de la expresión para la Moda

que es:

)()( 11

1

.inf

jjjj

jj

irealnnnn

nnCLMo

Veamos su cálculo mediante un ejemplo, para ello usaremos los datos del apartado anterior:

Li - Ls ni Ni

29.70)1119()1019(

10191065

Mo

Utilizando la fórmula aproximada:

24.701110

111065

Mo

45 - 55 6 6

55 - 65 10 16

65 - 75 19 35

75 - 85 11 46

85 - 95 4 50

Page 17: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

17

B). MEDIDAS DE DISPERSIÓN.

Breve Introducción.

Una de las funciones de la estadística se relaciona con el cálculo de la variabilidad, conocer las medidas de dispersión (variación) es de suma importancia, ya que la no consideración de diferencias puede conducir a errores de juicio en la toma de decisiones (Sánchez, 1992). Una medida particular de tendencia central da lugar a una puntuación que, en cierto sentido, "representa" a todas las puntuaciones de un grupo (Glass & Stanley, 1974). Sin embargo, cuando se usa cualquier medida de tendencia central, ésta nos da sólo un cuadro incompleto de un conjunto de datos y, por consiguiente, podría conducir a conclusiones erróneas o distorsionadas, porque este proceso pasa por alto las diferencias entre las puntuaciones en sí. Sería incorrecto concluir que dos conjuntos de datos son iguales sólo porque tienen la mismas medidas de tendencia central, es decir, que el valor de la media aritmética sea el mismo para ambos conjuntos, cuando la distancia de los datos de ambos conjuntos se distribuyen de una forma diferente.

Para describir una distribución en forma más completa o para interpretar con más detalle una calificación, necesitamos información adicional acerca de la dispersión de las calificaciones con respecto a nuestra medida de tendencia central. Es necesario un índice de cómo están diseminados los puntajes alrededor del centro de la distribución. A tales distancias se les suele denominar medidas de dispersión o variación. Las medidas de dispersión, también conocidas como medidas de variación o variabilidad, indican el grado en que los sujetos se dispersan respecto al centro de la distribución. A través de las mismas, el investigador verifica cuán homogéneos, parecidos o estables son los elementos bajo estudio, en contraste con otros grupos de interés. Si todos los valores son los mismos, no existe dispersión; si todos no son los mismos, hay dispersión en los datos. La magnitud de la dispersión puede ser pequeña, cuando los valores, aunque diferentes, están próximos entre sí. Si los valores están ampliamente separados, la dispersión es mayor.

Este capítulo trata sólo de la medidas de dispersión o variabilidad más conocidas: el recorrido (rango) la varianza y la desviación estándar. Estas técnicas estarán enmarcadas según la composición de los datos, es decir, arreglo de datos, datos no agrupados y datos agrupados. Además, se evaluará la técnica de coeficiente de variación para variables cuantitativas y cualitativas, tales como: coeficiente de variación e índice de dispersión cuantitativo. Cuando nuestro interés se centra en las medidas de dispersión, debemos buscar un índice de variabilidad que indique la distancia a lo largo de la escala de calificaciones. El recorrido y la desviación estándar realizan dicha labor.

RANGO:

Se define como la diferencia existente entre el valor mayor y el menor de la distribución; Lo notaremos como R Realmente no es una medida muy significativa en la mayoría de los casos, pero indudablemente es muy fácil de calcular.

R = V max - V min

Hemos estudiado varias medidas de centralización, por lo que podemos hablar de desviación con respecto a cualquiera de ellas, sin embargo, la mas utilizada es con respecto a la media.

Concepto de Desviación: Es la diferencia que se observa entre el valor de la variable y el origen de trabajo. La denotaremos por di.

Page 18: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

18

No es una medida, pues cada valor de la variable lleva asociada su correspondiente desviación, por lo que precisaremos una medida que resuma dicha información.

VARIANZA:

Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra, y la denotaremos por:

o también por .

s² = varianza del universo, σ² = varianza de la población.

Para datos no agrupados Para datos agrupados

Aunque también es posible calcularlo por medio de la fórmula de la recurrencia:

Para datos no agrupados Para datos agrupados

(

)

(

)

Método abreviado:

[∑

(

)

]

DESVIACIÓN TÍPICA O ESTANDAR:

La desviación estándar (DE) es la medida de dispersión más adecuada para la estadística descriptiva. Tanto en la escalas de intervalo como en las de razones, la varianza y la desviación estándar son las mejores medidas de dispersión. Toman en consideración todos los puntajes y controlan por el efecto de valores extremos. La DE permite una interpretación precisa de las calificaciones dentro de una distribución, si todos los sujetos son iguales en una característica (por ejemplo, índice académico), entonces el resultado será igual a cero; por el contrario, si aumentan las diferencias, aumentará el índice, alejándose más y más del punto cero.

Es la raíz cuadrada de la varianza, se denota por Sx o σ x.

√ ó √

Este estadístico se mide en la misma unidad que la variable por lo que se puede interpretar mejor.

Otros dos estadísticos importantes son la cuasivarianza y la cuasidesviación típica, que son los estimadores de la varianza y desviación típica poblacionales respectivamente.

Page 19: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

19

COEFICIENTE DE VARIACIÓN:

Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos por C.V.

Ejemplo: Veamos por último un ejemplo de cómo se calculan todas estas medidas.

Li-Ls ni Ni yi niyi di nidi nid2i niy

2i

45 - 55 6 6 50 300 -2 -12 24 15000

55 - 65 10 16 60 600 -1 -10 10 36000

65 - 75 19 35 70 1330 0 0 0 93100

75 - 85 11 46 80 880 1 11 11 70400

85 - 95 4 50 90 360 2 8 16 32400

50 3470 -3 51 246900

=

Ŷ=

70+10*(-3/50) = 69.4

102*[(51/50)-(-3/50)2] = 121.64

C.V.=

Índice de Dispersión Cualitativa

Normalmente en el campo de las ciencias sociales y la ingeniería se utilizan o manejan muchas variables cualitativas. Se puede observar previamente que dichas variables pueden variar de clase o cantidad. La premisa sería cuán diferentes son esas observaciones. Utilizando el coeficiente de variación cualitativa o un índice de dispersión podemos encontrar dichas diferencias en las observaciones. El índice de dispersión fluctúa entre cero (0) y uno (1), donde cero (0) implica homogeneidad perfecta y uno (1) representa heterogeneidad perfecta. Si los casos o sujetos están

Page 20: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

20

distribuidos entre las categorías de una forma equitativa, es decir, que para cada categoría de la variable existe la misma cantidad de casos, podemos indicar que existe una distribución heterogénea (equitativa) en las categorías de la variable de interés. Por el contrario, si todos los casos están ubicados en una sola categoría podemos indicar que existe una distribución homogénea (desproporcional). El índice de dispersión cualitativo se expresa de la siguiente manera:

donde: D = índice de dispersión cualitativo K = número de categorías n = total de casos Ʃf²= suma de frecuencias cuadradas (f²) de cada categoría.

MEDIDAS DE LOCALIZACIÓN:

Útiles para encontrar determinados valores importantes, para una "clasificación" de los elementos de la muestra o población.

Cuartiles, deciles y percentiles.

Las medidas de localización dividen la distribución en partes iguales, sirven para clasificar a un individuo o elemento dentro de una determinada población o muestra. Así en psicología los resultados de los test o pruebas que realizan a un determinado individuo, sirve para clasificar a dicho sujeto en una determinada categoría en función de la 53-1-u-puntuacióMn obtenida.

Cuartiles.

Deciles.

Percentiles.

Ejemplos de cálculo.

Algunas medidas de dispersión asociadas

Cuartiles: Medida de localización que divide la población o muestra en cuatro partes iguales.

Q1= Valor de la variable que deja a la izquierda el 25% de la distribución.

Q2= Valor de la variable que deja a la izquierda el 50% de la distribución = Me

Q3= Valor de la variable que deja a la izquierda el 75% de la distribución.

Interpretación de los cuartiles.

Page 21: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

21

Al igual que ocurre con el cálculo de la mediana, el cálculo de estos estadísticos, depende del tipo de variable.

Caso I: Variable cuantitativa discreta:

En este caso se observa el tamaño de la muestra: N y para calcular Q1 o Q3 procederemos como si tuviésemos que calcular la mediana de la correspondiente mitad de la muestra.

Caso II: Variable cuantitativa contínua: En este caso el cálculo es más simple:, sea la distribución que sigue:

Siendo el intervalo coloreado donde se encuentra el Cuartil correspondiente:

y

Deciles: Medida de localización que divide la población o muestra en 10 partes iguales. No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver sólo para las variables continuas. dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k·10 % de la distribución.

Intervalo donde se encuentra el Decil correspondiente:

k = 1 .. 9

[Li-2 - Li-1) ni-1 Ni-1

[Li-1 - Li) ni Ni

[Li-2 - Li-1) ni-1 Ni-1

[Li-1 - Li) ni Ni

Page 22: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

22

Percentiles: Medida de localización que divide la población o muestra en 100 partes iguales. No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver sólo para las variables continuas. pk = Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribución.

Intervalo donde se encuentra el percentil corespondiente:

k=1 .. 99

EJEMPLO: Como se puede observar la forma de calcular estas medidas es muy similar a la del cálculo de la mediana. Veamos el cálculo de algunas de estas medidas en el ejemplo que estamos estudiando. Vamos a calcular Q1,Q3, d3, y p45

Li - Ls ni Ni

45 - 55 6 6

55 - 65 10 16

65 - 75 19 35

75 - 85 11 46

85 - 95 4 50

Cálculo de Q1: Buscamos en la columna de las frecuencias Acumuladas el valor que supere al 25% de N=50, corresponde al 2º intervalo.(50/4=12.5)

Análogamente calculemos Q3, Buscamos ahora en la misma columna el correspondiente al 75 %de N que en este caso es el 4º intervalo (3.50/4=37.5)

Veamos ahora el decil 3º. (corresponde al 30 % 3 · 50 / 10 = 15) sería el 2º intervalo.

Por último veamos el percentil 45 (45·50/100 = 22.5) Corresponde al intervalo 3º.

[Li-2 - Li-1) ni-1 Ni-1

[Li-1 - Li) ni Ni

Page 23: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

23

Algunas medidas de Dispersión asociadas

Una vez estudiadas las medidas de localización surgen dos nuevas medidas de dispersión, que son:

Recorrido intercuartílico:

Semirecorrido intercuartílico:

Recorrido interdecílico:

Recorrido intercentilico:

MEDIDAS DE LA SIMETRÍA:

Sirven para ver si la distribución tiene el mismo comportamiento por encima y por debajo de los valores centrales. La medias de asimetría, al igual que la curtosis, van a ser medidas de la forma de la distribución, es frecuente que los valores de una distribución tiendan a ser similares a ambos lados de las medidas de centralización. La simetría es importante para saber si los valores de la variable se concentran en una determinada zona del recorrido de la variable.

Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de barras de la distribución, con la distribución normal, dentro de ellos se tiene los Sesgos y la Curtosis.

SESGOS.

a) Una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden.

b) Una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas) descienden más lentamente por la derecha que por la izquierda.

c) Una distribución es asimétrica a la izquierda, si las frecuencias descienden más lentamente por la izquierda que por la derecha.

As<0 As=0 As>0

Asimetría Negativa a la Izquierda

Simétrica

Asimetría Positiva a la Derecha.

Page 24: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

24

Para medir la asimetría se puede realizar atendiendo básicamente a dos criterios:

a) Comparando la Media y la Moda.

Si la diferencia es positiva, diremos que hay asimetría positiva o a la derecha, en el caso de que sea negativa diremos que hay asimetría negativa o a la izquierda. No obstante, esta medida es poco operativa al ser una medida relativa, ya que esta influida por la unidad en que se mida la variable, por lo que se define el coeficiente de Asimetría como:

Esta medida es muy fácil de calcular, pero menos precisa que el coeficiente de asimetría de Pearson.

b) Comparando los valores de la variable con la media.

El coeficiente de asimetría de Pearson, se basa en la comparación con la media de todos los valores de la variable, así que es una medida que se basará en las diferencias, como vimos en el caso de la dispersión si medimos la media de esas desviaciones sería nulas, si las elevamos al cuadrado, serían siempre positivas por lo que tampoco servirían, por lo tanto precisamos elevar esas diferencias al cubo.

Para evitar el problema de la unidad, y hacer que sea una medida escalar y por lo tanto relativa, dividimos por el cubo de su desviación típica. Con lo que resulta la siguiente expresión:

Algunas consideraciones:

El Estadístico Yule ha definido algunas propiedades deseables para una medida estadística:

1. Debe definirse de manera objetiva: dos observadores distintos deben llegar al mismo resultado numérico.

Page 25: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

25

2. Usar todas las observaciones y no algunas de ellas solamente, de manera que si varia alguna observación la medida considerada debe reflejar esta variación.

3. Tener un significado concreto: la interpretación debe ser inmediata y sencilla. 4. Ser sencilla de calcular. 5. Prestarse fácilmente al cálculo algebraico: Lo que permitirá demostraciones mas

elegantes. 6. Ser poco sensible a las fluctuaciones muestrales. Esta condición es imprescindible en la

Estadística Matemática y en la Teoría de Sondeos.

MEDIDA DE APUNTAMIENTO.

CURTOSIS:

La curtosis es una medida del apuntamiento, que nos indicará si la distribución es muy apuntada o poco apuntada de una distribución con respecto a la distribución normal o gaussiana, también nos indica si miden la mayor o menor cantidad de datos que se agrupan en torno a la media

Como podemos observar, el coeficiente de curtosis nos mide el grado de apuntamiento de la distribución. Este coeficiente lo vamos a denotar por K y se calcula según la siguiente expresión:

Se definen 3 tipos de distribuciones según su grado de curtosis:

1) Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).

2) Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable.

3) Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

La medida de la curtosis es adimensional: a) Platicúrtica: curtosis < 0 b) Mesocúrtica: curtosis = 0 c) Leptocúrtica: curtosis > 0

Curtosis Positiva Curtosis nula Curtosis Negativa

Leptocúrtica Mesocúrtica Platicúrtica

Page 26: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

26

Veamos por último el cálculo de estos dos últimos coeficientes en el ejemplo que estamos estudiando.

Li - Ls ni Ni Xi niXi di nid3i nid

4i

45 - 55 6 6 50 300 -19,4 -43808,304 849881,098

55 - 65 10 16 60 600 -9,4 -8305,84 78074,896

65 - 75 19 35 70 1330 0,6 4,104 2,4624

75 - 85 11 46 80 880 10,6 13101,176 138872,466

85 - 95 4 50 90 360 20,6 34967,264 720325,638

50 3470 -4041,6 1787156,56

=

Mo= 70.24

Page 27: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

27

CA=

Coeficiente de Asimetría de Pearson As=

CAp=

Luego es una distribución asimétrica negativa o a la izquierda y Platicúrtica.

EJERCICIOS PROPUESTOS

Problema Nº 01: El Área de Control de Calidad de la empresa FUNDIDOS S. A. está llevando a cabo un seguimiento a un lote de piezas mecanizadas en su taller de metalmecánica, para esto ha tomado una muestra aleatoria y se necesita obtener el siguiente análisis estadístico descriptivo:

– Tabla de Frecuencias. – Histogramas. – Polígonos de Frecuencia. – Ojivas. – Medidas de Tendencia Central. – Medidas de Dispersión. – Medidas de Distribución

1279,5 1285,0 1280,0 1273,0 1284,0 1280,5 1275,5 1278,0 1279,5 1275,0 1267,0

1278,0 1273,0 1280,0 1277,5 1286,0 1280,0 1281,0 1275,0 1278,5 1279,5 1273,5

1283,0 1282,5 1272,5 1275,5 1275,0 1282,0 1271,0 1280,5 1266,0 1282,5 1284,5

1273,0 1271,5 1275,5 1277,0 1278,0 1283,5 1274,5 1279,0 1287,5 1276,0 1279,5

1280,5 1269,0 1284,0 1287,0 1275,5 1280,0 1280,5 1278,0 1275,5 1280,0 1274,5

1285,0 1282,0 1276,5 1268,5 1275,5 1269,0 1271,5 1280,5 1287,0 1276,5 1272,0

1268,0 1269,0 1285,5 1268,0 1272,5 1266,5 1278,0 1267,0 1271,0 1275,5 1277,0

1276,0 1279,0 1281,0 1276,0 1287,5 1273,5 1272,5 1279,5 1279,0 1276,0 1281,5

1275,0 1276,5 1271,5 1284,5 1276,0 1268,5 1272,5 1284,5 1286,0 1271,0 1265,5

1272,0 1282,0 1276,0 1269,5 1266,0 1273,5 1285,5 1275,5 1283,5 1285,0 1273,0

Problema Nº 02: En un estudio de dos semanas sobre la productividad de los trabajadores de una fundición, se obtuvieron los siguientes datos sobre el número total de piezas aceptables que produjeron los trabajadores:

• Elaborar la Tabla de Distribución de Frecuencias.

• Dibujar el Histograma y Polígono de Frecuencia.

• Aplicar los estadísticos de posición.

Page 28: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

28

• Aplicar los estadísticos de variación.

• Aplicar los estadísticos de simetría.

• Aplicar los estadísticos de apuntamiento.

• ¿Que concluye Ud. después de todo eso?.

65 36 49 84 79 56 28 43 67 36

43 78 37 40 68 72 55 62 22 82

88 50 60 56 57 46 39 57 73 65

59 48 76 74 70 80 75 56 45

75 62 72 63 32 80 64 53 74 34

76 60 48 55 51 54 45 44 35 51

21 35 61 45 33 61 60 85 68

45 53 77 42 69 52 68 52 47

62 65 75 61 73 50 53 59 41 54

41 74 82 78 26 35 47 70 38 70

Problema Nº 03: Elaborar la Tabla de Distribución de Frecuencias. Dibujar el Histograma y Polígono de Frecuencia. Aplicar los estadísticos de: posición, variación, simetría. Aplicar los estadísticos de apuntamiento. ¿Que concluye Ud. después de todo eso?.

1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,92 1,75

1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,77 1,73 1,75

1,78 1,77 1,67 1,83 1,83 1,72 1,71 1,85 1,84 1,93

1,82 1,69 1,70 1,81 1,66 1,76 1,75 1,80 1,79 1,84

1,86 1,80 1,77 1,80 1,76 1,88 1,75 1,79 1,87 1,79

1,77 1,67 1,74 1,75 1,78 1,77 1,74 1,73 1,83 1,76

1,83 1,77 1,75 1,77 1,77 1,84 1,83 1,79 1,82 1,76

1,76 1,76 1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77

Problema Nº 04: Elaborar la Tabla de Distribución de Frecuencias. Dibujar el Histograma y Polígono de Frecuencia. Aplicar los estadísticos de: posición, variación, simetría. Aplicar los estadísticos de apuntamiento. ¿Que concluye Ud. después de todo eso?.

1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,92 1,75 1,84

1,86 1,73 1,84 1,87 1,83 1,81 1,77 1,73 1,75 1,78

1,77 1,67 1,83 1,83 1,72 1,71 1,85 1,93 1,82 1,69

1,7 1,81 1,66 1,76 1,75 1,80 1,79 1,84 1,86 1,80

1,77 1,80 1,67 1,78 1,77 1,74 1,73 1,83 1,76 1,83

1,76 1,88 1,75 1,79 1,87 1,79 1,77 1,67 1,74 1,75

Page 29: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

29

1,77 1,75 1,77 1,77 1,84 1,83 1,79 1,82 1,76 1,76

1,76 1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77 1,84

Problema Nº 05: Tenemos los datos de la edad de los alumnos del 5to año de una I.E. Elaborar la Tabla de Distribución de Frecuencias. Dibujar el Histograma y Polígono de Frecuencia. Aplicar los estadísticos de: posición, variación, simetría. Aplicar los estadísticos de apuntamiento. ¿Que concluye Ud. después de todo eso?.

16 17 14 15 19 17 18 16 15 18 16 20

15 17 17 18 16 14 17 14 19 17 18 16

16 18 18 19 17 13 17 13 20 16 14 18

16 19 17 20 16 14 18 14 17 17 15 15

14 25 16 18 17 15 19 16 17 17 14 18

13 16 15 17 15 16 15 18 16 16 15 13

16 15 14 15 17 16 15 20 17 16 17 19

17 13 15 14 18 17 14 14 16 16 15 13

18 14 17 15 19 17 13 15 18 17 17 16

19 16 16 13 18 18 18 16 17 14 15 18

17 13 17 14 15 15 19 17 17 13 16 15

16 19 17 17 15 19 15 18 16 16 19 17

Problema Nº 06: Tenemos las resistencias de la tensión de 80 muestras de aleación Aluminio-Litio. Elaborar la Tabla de Distribución de Frecuencias. Dibujar el Histograma y Polígono de Frecuencia. Aplicar los estadísticos de: posición, variación, simetría. Aplicar los estadísticos de apuntamiento. ¿Que concluye Ud. después de todo eso?.

Problema Nº 07: Se quiere saber el número de hijos por matrimonio de una ciudad. Para este propósito, se elige una muestra representativa de 80 matrimonios de ella. Se requiere analizar todos los estadígrafos:

2 , 2 , 4 , 1 , 3 , 5 , 3 , 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 , 1 , 7 , 4 , 2, , 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4 , 0 , 3 , 3 , 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1 , 4 , 4 , 1 , 3 , 5 , 3 , 2 , 4 , 1 , 6 , 2 , 3 , 4 , 5 , 5 , 6 , 2 , 3 , 3 , 2 , 2 , 1 , 8 , 3 , 5 , 3 , 4 , 7 , 2 , 3 .

Problema Nº 08: Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el número de empleados que hay en cada una de ellas para un estudio posterior. Las observaciones obtenidas han sido:

12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13, 14, 15, 11, 11, 12, 16, 17, 17, 16, 16, 15, 14, 12, 11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 19, 18, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11, 12.

105 221 183 186 121 181 180 143 97 154 153 174 120 168 167 141

245 228 174 199 181 158 176 110 163 131 154 115 160 208 158 133

207 180 190 193 194 133 156 123 134 178 76 167 184 135 229 146

218 157 101 171 165 172 158 169 199 151 142 163 145 171 148 158

160 175 149 87 160 237 150 135 196 201 200 176 150 170 118 149

Page 30: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

30

a) Calcule la distribución de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas.

b) ¿Qué proporción de sucursales tiene más de 15 empleados?

c) Dibuje el diagrama de barras y el diagrama acumulativo de frecuencias correspondientes.

d) Agrupe en intervalos de amplitud 3 los valores de la variable, calcule su distribución de frecuencias y represente su histograma y su polígono de frecuencias acumuladas.

e) Agrupe la variable en los intervalos que considere conveniente de amplitud variable, calcule las densidades de frecuencia de cada intervalo y represente el histograma correspondiente.

Problema Nº 09: En El País, el 23/09/2009, se publicaba un histograma con los sueldos de los españoles de 2007.

Resolver:

a) ¿Qué variable es la que se está presentando en el gráfico?

b) ¿Qué tipo de variable es?

c) Construya la tabla de frecuencias, teniendo en cuenta que en 2007 había 18,7 millones de personas trabajando.

d) Calcule las marcas de clase.

e) Represente el gráfico en forma de Histograma correctamente.

f) Represente el polígono de frecuencias acumuladas.

g) ¿Qué número de trabajadores tienen una remuneración superior a 47.930 euros?.

Nota: Suponga que el sueldo más elevado es de 500.000 euros.

Problema Nº 10: A la hora de crear una empresa, hay que valorar la posibilidad de crearla como autónomo, como una Sociedad Limitada (SL) o como una Sociedad Anónima (SA). Cinco Días publicaba el 1/10/2009 una tabla con un estudio del número de empleados que tiene cada tipo de empresa.

Page 31: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

31

b) Represente gráficamente las tres distribuciones.

c) ¿En cuál de las distribuciones existe mayor dispersión? Compruébelo por varios métodos.

d) ¿Cuál de las distribuciones tiene una mayor asimetría? Compruébelo por varios métodos.

e) ¿En qué tipo de empresa es más homogénea la distribución de empleados?.

e) ¿Qué es más atípico, un autónomo con 30 asalariados, o una S.A. con 450?.

Nota: Para facilitar los cálculos, utilice la variable miles de asalariados.

Problema Nº 11: A continuación se dan los resultados obtenidos con una muestra de 50 universitarios. La característica es el tiempo de reacción ante un estímulo auditivo:

0,110 0,110 0,126 0,112 0,117 0,113 0,135 0,107 0,122 0,111

Page 32: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

32

0,113 0,098 0,122 0,105 0,103 0,119 0,100 0,117 0,113 0,094

0,124 0,118 0,132 0,108 0,115 0,120 0,107 0,123 0,109 0,128

0,117 0,111 0,112 0,101 0,112 0,111 0,119 0,103 0,100 0,106

0,108 0,120 0,099 0,102 0,129 0,115 0,121 0,130 0,134 0,118

0,115 0,115 0,113 0,126 0,116 0,112 0,112 0,129 0,119 0,119

0,125 0,111 0,111 0,114 0,111 0,114 0,118 0,116 0,114 0,121

0,115 0,106 0,122 0,110 0,128 0,108 0,103 0,100 0,102 0,100

0,105 0,102 0,105 0,121 0,104 0,112 0,112 0,111 0,111 0,146

0,108 0,129 0,110 0,110 0,106 0,121 0,128 0,101 0,106 0,105

a. ¿Cuál es la amplitud total de la distribución de los datos?

b. Obtenga la distribución de frecuencias.

c. Calcular los estadígrafos correspondientes.

d. Dibuje los gráficos de frecuencias relativas.

f. Dibuje su simetría.

Problema Nº 12: Los sueldos mensuales (en dólares) de 60 empleados de la empresa Pirámide S.A. en el año 2010 son los siguientes:

440 560 335 587 613 400 424 466 565 393 453 650 407 376 470 560 321 500 528 526 570 430 618 537 409 600 550 432 591 428 440 340 558 460 560 607 382 667 512 492 450 530 501 471 660 470 364 634 580 450 574 500 462 380 518 480 625 507 645 382

Problema Nº 13: La tienda CABRERA’S Y ASOCIADOS estaba interesada en efectuar un análisis de sus cuentas por comprar. Uno de los factores que más interesaba a la administración de la tienda era el de los saldos de las cuentas de crédito. Se escogió al azar una muestra aleatoria de 60 cuentas y se anotó el saldo de cada cuenta (en unidades monetarias) como sigue:

77.97 13.02 17.97 89.19 12.18 8.15 34.40 43.13 79.61 90.99 21.10 17.64 81.59 60.94 43.97 43.66 29.75 7.42 93.91 20.64 21.10 17.64 81.59 60.94 43.97 77.97 13.02 17.97 89.19 12.18 32.67 43.66 51.69 53.40 68.13 11.10 12.98 38.74 70.15 25.68 32.67 43.66 51.69 53.40 68.13 8.15 34.40 43.13 79.61 90.99 43.66 29.75 7.42 93.91 20.64 11.10 12.98 38.74 70.15 25.68; Se requiere analizar todos los estadígrafos.

Problema Nº 14: Se presentan a continuación los ingresos semanales que obtiene una empresa dedicada al negocio de la venta de repuestos para equipo pesado: Ingresos por venta (miles de USD)

3145 15879 6914 4572 11374 12764 9061 8245 10563 8164 6395 8758 17270 10755 10465 7415 9637 9361 11606 7836 13517 7645 9757 9537 23957 8020 8346 12848 8438 6347 21333 9280 7538 7414 11707 9144 7424 25639 10274 4683 5089 6904 9182 12193 12472 8494 6032 16012 9282 3331

Construya la tabla de frecuencia.

Identifique la población, muestra y la variable.

Page 33: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

33

a) Construye una tabla para la distribución de frecuencias y sus gráficos.

b) Calcule sus estadígrafos, la simetría y la curtosis.

Problema Nº 15: Dada la siguiente información sobre las temperaturas (oF), obtenida en una determinada ciudad durante el mes de abril:

47 49 51 49 60 46 50 58 46 55 45 47 42 42 68 53 56 56 35 43 54 76 55 50 68 49 46 56 37 38 69 62 60 50 70 72 62 66 49 46 62 52 43 61 53 51 49 30 52 57 69 50 55 52 54 48 60 65 37 53 48 80 63 51 69 68 63 18 59 38 43 66 52 39 75 58 45 66 49 47 46 55 45 60 46 49

a) Construye un diagrama de tallo y hojas.

b) Construye una tabla para la distribución de frecuencias.

c) Representa el polígono de frecuencias, el histograma y la ojiva de la distribución.

Problema Nº 16: Se presentan a continuación los siguientes datos de la longitud de taladros perforados en un frente de perforación (metros):

1.56 1.59 1.63 1.62 1.65 1.61 1.59 1.51 1.62 1.62 1.53 1.49 1.57 1.54 1.53 1.59 1.58 1.57 1.47 1.64 1.55 1.59 1.53 1.56 1.53 1.47 1.57 1.60 1.54 1.56 1.50 1.62 1.59 1.62 1.54 1.68 1.52 1.62 1.62 1.49 1.65 1.53 1.59 1.56 1.54 1.58 1.52 1.63 1.56 1.62

a) Construye una tabla para la distribución de frecuencias.

b) Representa sus gráficos, simetría y medidas estadígrafas.

Problema Nº 17: Se ha observado la hora de estimar cuánto tiempo se tardará en producir un determinado producto, el fabricante desea estudiar la relación entre el tiempo de producción unitario y el número de unidades que han sido producidas. Se realiza un estudio sobre 25 empleados, los cuales han llevado a cabo la misma tarea En la presente tabla se presentan los tiempos empleados en la realización de la actividad:

15 19 16 11 10 8 21 20 10 10 5 10 30 22 12 13 7 8 17 20 9 12 9 7 18 19 7 8 8 8 22 18 11 20 11 6 33 17 8 7 12 8 41 16 9 6 9 6 10 20 5 9 7 4 14 22 15 10 6 15 18 19 10 10 8 7 25 24 11 11 14 20 23 9 9

a) Construye sus gráficos para el conjunto de datos anteriores.

b) calcule sus estadígrafos y su simetría.

Problema Nº 18: Cuando dos empresas anuncian sus deseos de fusionarse, suele pasar que en unas pocas semanas una de las empresas, disgustada por las consecuencias de dicho anuncio de fusión, cancela el pacto contraído con la otra empresa. Dodd (1980) registró 151 anuncios de fusión de los cuales 80 fueron cancelados. Por tanto, en el momento que una fusión es anunciada, existe una gran incertidumbre sobre si efectivamente se llevará a la práctica o no. Esta incertidumbre puede perdurar durante un considerable período de tiempo, incluso varios meses tras el anuncio de la fusión. En el estudio de Eger (1982) se recogieron el número de días (días de apertura del New York Stock Exchange) entre el anuncio de la fusión y la fecha en la que ´esta fue realizada. Esta información es la siguiente:

74 45 55 74 64 97 65 82 92 116 140 62 92 78 45 93 94 57 123 128 92 73 173 116 35 124 64 84 255 277 123 80 143 112 76 214 64 86 96 171 202 178 147 102 153 197 127 82 157 185 90 116 172 111 148 213 130 165 141 149 206 175 123 128 144 168 109 167 92 116 140 62 92 78 45 93 94 57 123 128 92 73 173

Page 34: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

34

a) Con la ayuda del ordenador, construye un diagrama de tallos y hojas para este conjunto de datos.

b) Resume la información que refleja el diagrama que acabas de construir.

Problema Nº 19: Los datos que se muestran a continuación representan el costo de la energía eléctrica durante el mes de julio del 2006 para una muestra aleatoria de 50 departamentos con dos recamaras en una ciudad grande. Costo de energía eléctrica en dólares.

96 171 202 178 147 102 153 197 127 82

157 185 90 116 172 111 148 213 130 165

141 149 206 175 123 128 144 168 109 167

95 163 206 175 130 143 187 166 139 149

108 119 150 154 114 135 191 137 129 158

a) Determine una tabla de frecuencias.

b) Elabore un histograma y polígono de frecuencias, ojiva con los datos.

c) Alrededor de que cantidad parece concentrarse el costo mensual de energía eléctrica, cual es el nivel de dispersión.

Problema Nº 20: La concentración de sólidos suspendidos en agua de un río es una característica ambiental importante. Un artículo científico reportó sobre la concentración (en partes por millón, o ppm) para varios ríos diferentes. Supongamos que se obtuvieron las siguientes 50 observaciones para un rio en particular:

a) Calcule la media.

b) Calcule la media recortada al 25% y la media recortada al 10%.

c) Calcule la varianza y la desviación estándar.

d) Cuáles son sus gráficos y su simetría.

Problema Nº 21: Los siguientes datos corresponden al número de días de trabajo perdidos por enfermedad durante el cuarto trimestre del año por los empleados de una empresa minera:

2 1 0 1 1 3 0 0 2 7 5 0 1 3 0 0 4 1 2 4 0 5 3 0 6 0 4 0 2 6 2 3 0 1 1 1 2 4 0 5 3 0 6 0 4 0 2 6 2 3 0 1 1 4 1 3 5 3 2 1 6 3 4 1 2 0 2 3 1

a) Estudiar la forma y concentración (asimetría y curtosis) de la variable que mide el número de días de trabajo perdidos por enfermedad por esos empleados.

b) Explique en un resumen el comportamiento de los enfermos.

55.8 60.9 37.0 91.3 65.8 47.3 94.6 56.3 30.0 68.2

42.3 33.8 60.6 76.0 69.0 75.3 71.4 65.2 52.6 58.2

45.9 39.1 35.5 56.0 44.6 48.0 61.8 78.8 39.8 65.0

71.7 61.2 61.5 47.2 74.5 60.7 77.1 59.1 49.5 69.3

83.2 40.0 31.7 36.7 62.3 69.8 64.9 27.1 87.1 66.3

Page 35: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

35

Problema Nº 22: Un ambientalista está haciendo una investigación sobre la cantidad de basura que se genera en diferentes comunidades. Para ello registró cuántos kilos de basura recolectó el camión durante veinte días consecutivos en diferentes calles de cada comunidad. Los resultados fueron:

Elabora las tablas de frecuencias correspondientes para obtener las medidas de tendencia central y dispersión.

Sus gráficos correspondientes. Su simetría y sus percentiles respectivos.

Comunidad 1

14 17 16 14 15 16 15 22 19 16 19 20 22 18 17 22 23 16 23

20 20 18 19 14 14 22 16 20 14 18 21 20 21 23 17 20 15 17

18 14 21 14 15 23 19 15 14 19 21 17 14 16 18 21 14 16 19

22 21 22 19 18 14 14 21 15 19 15 23 21 21 22 18 14 21 21

23 23 17 23 19 15 15 21 17 16 17 18 22 19 15 18 14 15 21

Comunidad 2

21 24 19 22 19 22 20 20 16 19 18 19 19 20 18 17 22 21 16

24 19 18 23 17 21 17 18 18 19 21 24 15 21 19 23 16 15 19

15 20 16 21 24 17 18 22 17 23 16 17 24 17 17 22 18 16 15

15 18 24 17 16 22 20 23 19 22 21 16 15 16 22 19 17 20 21

15 20 15 23 23 21 20 19 24 23 16 22 19 24 24 22 20 17 18

Comunidad 3

13 22 19 18 19 17 17 21 15 15 14 17 15 20 17 21 14 14 18

17 13 13 15 17 17 18 13 21 16 16 21 13 18 22 16 15 21 20

18 20 13 14 18 13 22 17 22 20 22 21 16 14 14 18 17 19 22

15 18 21 18 17 16 19 14 14 21 22 20 13 20 13 22 16 18 17

19 21 17 15 13 18 15 15 13 22 21 18 20 21 16 15 17 20 21

Comunidad 4

25 17 20 18 17 25 17 25 24 18 25 17 24 16 21 17 23 19 22

16 19 22 24 25 22 18 18 20 20 24 22 25 20 16 19 17 24 16

18 23 25 16 25 17 23 21 19 23 17 24 16 17 23 17 19 23 17

18 17 24 20 19 18 23 23 24 17 23 16 17 21 24 21 22 16 22

17 23 17 23 18 20 22 21 24 25 20 21 19 16 19 19 23 17 23

Comunidad 5

21 23 23 24 22 21 23 24 22 24 29 21 30 30 26 23 21 29 29

30 24 28 30 28 25 29 27 22 24 27 25 23 30 26 29 28 24 26

23 24 22 28 26 22 25 27 24 28 26 28 24 29 29 24 26 22 26

23 26 29 25 22 26 26 29 26 30 21 22 27 26 23 29 27 21 30

30 23 29 29 30 26 29 26 22 25 22 30 22 23 24 26 27 23 26

Comunidad 6

14 16 18 15 18 12 14 15 21 20 13 17 21 20 21 13 21 16 13

15 14 17 14 20 15 13 18 12 18 13 18 15 14 16 19 18 17 14

16 13 13 18 15 19 15 17 13 21 14 14 15 19 20 18 19 20 19

13 19 21 13 18 17 21 21 13 16 18 21 21 16 20 21 17 16 13

15 15 18 12 20 21 15 18 16 18 21 18 16 12 19 17 21 14 18

Comunidad 7

18 20 13 20 15 20 12 17 14 12 20 15 16 12 12 12 13 14 16

Page 36: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

36

18 16 20 18 14 14 13 21 18 17 19 20 14 13 18 12 13 15 13

17 12 16 19 18 14 17 12 19 14 13 15 20 13 18 19 19 14 12

14 19 20 20 17 15 20 20 12 12 17 18 15 13 19 18 21 12 17

13 21 19 17 14 14 18 14 12 12 19 14 21 19 15 13 16 15 21

Comunidad 8

19 22 20 23 19 21 28 26 28 23 28 21 26 21 25 24 19 26 25

22 19 24 26 19 20 23 26 23 27 22 23 23 24 26 28 19 21 27

25 28 23 26 22 22 23 19 20 25 23 25 27 25 21 24 24 23 19

19 21 24 25 25 21 27 24 20 22 19 26 28 19 19 27 19 21 28

21 21 24 20 20 26 23 25 21 20 20 27 19 23 25 26 26 20 20

Comunidad 9

28 28 27 25 24 23 24 27 24 24 27 26 24 21 21 28 26 21 24

22 24 25 26 29 26 21 22 22 29 20 21 22 22 28 29 27 27 22

20 29 21 20 20 26 26 24 23 25 27 29 27 25 23 21 28 29 26

28 23 20 25 28 23 25 21 22 22 28 24 26 24 23 23 28 22 26

21 25 21 25 22 22 29 23 23 27 27 24 26 27 27 24 20 26 23

Comunidad 10

20 25 26 21 21 26 23 18 26 20 25 23 26 24 22 20 27 26 23

27 27 26 25 21 27 21 26 26 20 20 20 18 21 23 22 23 26 25

25 18 20 25 22 18 23 19 27 25 22 23 18 21 23 21 21 21 26

22 20 26 18 23 19 21 20 22 26 27 20 27 25 24 23 22 24 21

25 20 22 21 20 22 25 25 22 23 21 18 23 24 25 18 19 27 19

Comunidad 11

23 21 27 25 27 24 28 27 27 26 27 26 26 21 26 27 23 23 24

22 27 23 19 26 25 26 25 24 23 19 26 22 23 20 23 23 21 20

25 23 20 20 27 23 22 19 27 28 26 26 26 19 22 24 20 26 19

25 21 21 28 20 26 20 19 27 19 24 22 27 23 20 21 22 20 23

25 24 26 23 26 23 24 26 21 28 28 23 25 19 20 24 25 23 25

Comunidad 12

24 23 21 19 22 22 24 24 20 20 23 20 19 23 19 23 22 18 19

21 18 22 21 23 24 19 23 25 19 21 19 19 18 23 21 18 27 22

26 23 18 23 23 22 19 20 19 24 27 27 26 20 21 26 20 24 23

18 19 18 20 21 22 19 24 23 24 26 18 26 18 25 20 23 22 22

22 19 19 19 21 25 19 25 18 19 19 23 25 20 21 25 24 21 27

Comunidad 13

22 20 22 23 26 21 25 24 23 27 23 19 28 26 20 24 21 24 25

25 21 28 25 23 26 23 20 24 24 23 27 28 27 22 23 28 19 28

21 19 24 26 25 23 25 24 28 26 27 25 19 21 21 20 19 20 20

19 22 22 22 24 24 28 27 24 21 22 26 20 21 24 20 20 28 19

23 27 22 24 26 20 28 28 26 26 25 21 22 25 19 19 25 27 27

Comunidad 14

21 16 20 21 21 17 20 13 17 15 18 17 21 20 22 21 18 13 22

18 19 17 22 17 20 17 14 19 21 17 22 19 13 14 21 16 19 14

13 18 21 22 15 21 15 20 17 16 18 22 17 14 13 18 14 13 19

17 14 21 16 19 22 15 18 14 17 19 20 21 15 13 19 19 18 16

18 13 18 13 21 17 15 20 17 13 17 16 14 22 13 15 15 18 17

Comunidad 15

Page 37: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

37

27 27 19 19 22 25 27 20 28 19 25 19 26 21 22 27 23 20 22

19 20 23 21 21 22 28 28 22 27 25 21 21 27 26 28 24 21 23

21 27 19 25 20 28 19 23 28 19 22 25 25 19 20 20 20 27 22

28 25 19 20 22 23 27 23 26 19 20 23 25 27 20 27 27 20 24

20 26 26 28 26 22 28 19 28 24 25 24 27 27 26 25 20 23 24

Comunidad 16

20 24 23 25 20 22 24 21 20 24 26 18 19 19 17 26 20 22 22

24 19 23 19 17 25 26 18 21 21 17 23 20 17 26 24 17 21 23

24 26 18 24 23 24 21 26 19 17 22 18 20 24 17 20 20 19 23

21 24 17 21 26 20 17 18 22 23 17 25 21 21 23 19 21 23 23

18 24 21 20 26 22 26 25 26 25 19 23 22 20 25 24 26 21 21

Problema Nº 23: Se recogen aquí los precios en euros de unas abrazaderas de ese día de unos cotizadores de cierta empresa productora, recogidos en diferentes tiendas de abastecimiento, obteniéndose los siguientes resultados:

4.21 1.8 3 2.4 3 4.21 2.4 4.5 4.81 3 3 4.5 1.8 4.21 6 9 3 4.5 7.21 4.81 2.4 3 1.8 3 6 1.8 2.4 3 4.21 3 1.8 2.4 4.21 2.4 4.21 3 2.4 4.21 6 4.5 4.21 4.81 4.5 4.21 4.5 4.81 4.21 4.21 7.21 4.81; Llamaremos a esta variable PRECIO y es de tipo numérico con dos decimales, genera la distribución de frecuencias de los precios:

a) Represente gráficamente la distribución.

b) ¿Cuál es la dispersión? Compruébelo por varios métodos.

b) ¿Cuál es la centralización y la asimetría? Compruébelo por varios métodos.

Problema Nº 24: Los valores del ph.sanguíneo en 60 individuos son los siguientes:

7,32 7,34 7,40 7,28 7,29 7,35 7,33 7,34 7,28 7,31 7,35 7,32 7,33 7,36 7,32 7,36 7,26 7,39 7,29 7,32 7,34 7,30 7,34 7,32 7,30 7,33 7,33 7,35 7,34 7,33 7,36 7,33 7,35 7,31 7,26 7,34 7,31 7,35 7,36 7,26 7,39 7,29 7,32 7,34 7,30 7,34 7,32 7,30 7,33 7,33 7,35 7,34 7,33 7,36 7,33 7,35 7,31 7,26 7,39 7,35 Se pide:

Preparar una tabla de frecuencias agrupando en intervalos de igual amplitud. Construir todos los gráficos necesarios para el caso. Estudia el rango, rango Intercuartílico, la media y la desviación típica. ¿Qué valor de ph. tiene exactamente un 33% de observaciones menores que dicho

valor?

Problema Nº 25: Las calificaciones finales obtenidas por los 80 alumnos de un primer curso de Estadística tomando como base 100 puntos figuran en la tabla adjunta:

68 84 75 82 68 90 62 88 76 93 73 79 88 73 60 93 71 59 85 75 61 65 75 87 74 62 95 78 63 72 66 78 82 75 94 77 69 74 68 60 96 78 89 61 75 95 60 79 83 71 79 62 67 97 78 85 76 65 71 75 65 80 73 57 88, 78 62 76 53 74 86 67 73 81 72 63 76 75 85 77 Se pide:

Preparar una tabla de frecuencias. Representar gráficamente los datos. El número de estudiantes con calificaciones de 75 ó más.

Problema Nº 26: Edad promedio de las personas que presentaron dolor toráxico (N =1184) en urgencias durante un año son:

Edad 0 – 20 20 – 30 30 – 40 40 – 45 45 – 50 50 – 55 55 – 65 65 – 80

Page 38: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

38

n 8 94 220 236 260 154 198 14

Se pide:

Construir la tabla de distribución de frecuencias. Dibujar el histograma, polígono de frecuencias y la ojiva. Calcular la media, la mediana y la moda. Calcular la varianza, la desviación típica y el coeficiente de asimetría. ¿Qué porcentaje de personas tenían una edad inferior a 50 años? ¿E inferior a 28

años? ¿Y entre 37 y 54? Calcular el coeficiente de variación.

Problema Nº 27: El primer día de clases del semestre pasado se les preguntó a 50 estudiantes, acerca del tiempo (en minutos) que tardan para ir de su casa a la universidad.

Datos: 20 35 25 15 5 20 25 30 20 20 30 15 15 20 20 25 25 20 20 10 20 25 45 20 5 25 40 25 25 20 30 25 35 20 30 15 30 25 20 10 10 5 10 15 25 40 25 10 20 15 Se pide:

Ordenar los datos en una tabla de frecuencias agrupándolos en clases de igual amplitud.

Construya un histograma de frecuencias relativas Construya un polígono de frecuencias relativas Construya un histograma de frecuencia relativa acumulada Construya un ojiva Diagrama de frecuencia relativa acumulada Calcula la media, la mediana y la moda. Hallar el sesgo (Asimetría) y la curtosis. Hallar las medidas de dispersión.

Problema Nº 28: Los pesos de diferentes muestras tomadas en un frente de extracción de mineral fueron los siguientes (N= 52), en quilos:

1,56 1,59 1,63 1,62 1,65 1,61 1,59 1,51 1,62 1,62 1,53 1,49 1,57 1,54 1,53 1,59 1,58 1,57 1,47 1,64 1,54 1,53 1,59 1,58 1,57 1,47 1,57 1,60 1,54 1,56 1,50 1,62 1,59 1,62 1,54 1,68 1,52 1,62 1,62 1,49 1,65 1,53 1,59 1,56 1,54 1,52 1,63 1,56 1,62 1,35 1,66 1,54 Se pide:

Preparar una tabla de frecuencias agrupando en intervalos de igual amplitud. Construir todos los gráficos necesarios para el caso. Calcular los estadígrafos necesarios.

Problema Nº 29: En una gran empresa metalúrgica se computa al azar el número de inasistencia a las labores de sus trabajadores eligiendo al azar una tarjeta de asistencia diaria por cada una de las 51 semanas del año, y así se obtiene la siguiente serie de inasistencias: 120 110 119 121 107 94 118 116 108 114 103 104 119 113 114 116 110 116 115 116 109 118 116 102 116 118 113 109 113 105 117 112 110 120 101 116 122 98 118 104 116 114 115 106 116 108; Represente estos datos mediante:

Sus gráficos respectivos tanto para frecuencias absolutas como relativas. Calcule sus medidas de tendencia central y de dispersión. Su sesgo y curtosis, sus gráficos respectivos.

Problema Nº 30: La siguiente tabla muestra los diámetros en pulgadas de una muestra de 60 cojinetes de bolas fabricadas por una empresa metalúrgica.

0,738 0,729 0,743 0,740 0,736 0,741 0,728 0,737 0,736 0,735 0,724 0,733

0,745 0,736 0,742 0,740 0,728 0,738 0,733 0,730 0,732 0,730 0,739 0,734

Page 39: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

39

0,735 0,732 0,735 0,727 0,734 0,732 0,732 0,737 0,731 0,746 0,735 0,735

0,735 0,735 0,733 0,726 0,736 0,732 0,742 0,729 0,739 0,739 0,730 0,735

0,725 0,731 0,741 0,734 0,737 0,744 0,738 0,736 0,734 0,727 0,735 0,740

Construir una distribución de frecuencia de los diámetros utilizando intervalos de clases adecuadas.

Calcule sus medidas de tendencia central y de dispersión. Su sesgo y curtosis, sus gráficos respectivos. ¿Qué porcentaje está comprendido entre 0,728 y 0,733? El porcentaje de cojinetes de bolas que tienen diámetros superiores a 0,732 pulgadas El porcentaje de cojinetes de bolas que tienen diámetros no superiores a 0,736

pulgadas El porcentaje de cojinetes de bolas que tienen diámetros entre 0,730 y 0,738

pulgadas.

Problema Nº 31: A continuación se dan los resultados obtenidos con una muestra de 50 universitarios. La característica es el tiempo de reacción ante un estímulo auditivo:

0,110 0,110 0,126 0,112 0,117 0,113 0,135 0,107 0,122 0,113 0,098 0,122 0,105 0,103

0,119 0,100 0,117 0,113 0,124 0,118 0,132 0,108 0,115 0,120 0,107 0,123 0,109 0,117

0,111 0,112 0,101 0,112 0,111 0,119 0,103 0,100 0,108 0,120 0,099 0,102 0,129 0,115

0,121 0,130 0,134 0,118 0,106 0,128 0,094 0,1114

¿Cuál es la amplitud total de la distribución de los datos? Obtenga la distribución de frecuencias completa. Calcular la media, mediana, moda y el C.V. Dibuje sus graficos de frecuencias relativas. Cual es sesgo y el grado de concentración de datos.

Problema Nº 32: En un sistema de extracción de mineral, se han medido los tiempos en minutos de las unidades de transporte de mineral, el estudio se ha realizado a medida se van profundizando los frentes de extracción de mineral; los tiempos medidos son:

Nivel 05-NW:

Profundidad 1 Profundidad 2 Profundidad 3 Profundidad 4

Límites Límites Límites Límites

a= 10 b= 13 a= 10 b= 13 a= 10 b= 18 a= 10 b= 18

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

12 13 13 11 12 12 13 12 12 13 12 16 17 11 15 14 15 14 12 11

11 10 10 10 10 11 10 13 12 11 14 15 16 10 16 17 11 13 16 17

11 11 13 12 11 11 10 10 11 10 13 12 12 18 16 12 13 18 14 17

10 13 10 12 10 13 11 10 12 10 12 10 11 10 17 18 11 18 18 17

12 13 10 11 12 13 11 12 10 10 12 17 10 13 12 15 12 11 14 12

10 11 13 10 11 10 11 11 12 12 12 14 16 15 13 13 15 17 18 18

13 12 11 12 12 10 12 11 11 11 17 18 18 10 10 11 14 13 18 17

11 13 12 11 11 10 13 11 10 11 17 11 11 13 13 15 16 11 14 10

11 10 12 10 13 12 11 11 12 12 10 15 10 18 17 13 11 11 11 18

11 11 11 11 10 12 12 10 11 11 13 10 14 15 13 16 10 11 17 11

Page 40: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

40

13 13 11 13 12 10 13 11 13 13 10 16 15 16 13 13 11 17 14 12

12 13 10 12 10 13 13 10 12 12 16 18 14 17 10 13 18 10 14 14

11 11 11 11 11 10 11 10 13 12 16 11 17 13 15 14 14 14 14 10

13 10 11 11 10 13 12 11 11 11 14 10 15 15 17 14 15 13 16 11

11 11 10 11 11 10 12 10 12 13 15 13 13 10 11 16 17 14 12 13

10 12 11 10 12 13 10 12 10 12 12 10 14 12 12 17 14 14 10 16

10 11 10 13 13 11 10 11 12 13 14 17 15 11 15 17 16 10 12 10

10 12 13 10 11 10 13 11 11 13 18 12 18 17 18 18 11 18 13 18

13 12 12 13 12 11 13 13 11 10 18 17 12 11 11 12 15 13 10 13

11 12 11 12 13 11 12 10 10 12 13 17 13 18 12 12 17 11 15 10

12 11 10 12 12 12 10 11 13 13 12 10 13 13 16 14 10 13 11 14

10 12 11 12 11 10 12 10 12 11 17 13 12 17 10 13 10 16 12 13

13 13 10 10 13 12 12 12 11 13 15 16 14 16 12 13 10 18 10 16

10 11 11 12 10 13 12 11 11 10 14 12 10 17 16 13 13 13 14 10

13 11 11 13 10 11 11 11 13 11 13 13 18 10 17 11 16 13 10 13

12 13 11 10 11 10 12 10 10 11 14 11 11 18 17 18 10 18 13 14

11 10 10 11 10 12 12 10 10 12 18 17 13 12 10 12 10 14 17 16

10 12 11 11 12 13 13 11 11 10 15 11 10 13 14 16 15 14 17 14

13 13 11 10 12 13 12 10 12 12 13 10 10 12 18 16 16 18 18 18

10 10 12 10 12 12 13 10 11 12 13 10 17 12 18 13 10 14 13 10

12 11 10 13 10 13 10 10 10 11 17 12 10 12 10 11 12 11 13 15

10 13 10 13 13 13 12 10 13 12 11 11 12 17 18 11 16 15 12 15

11 11 12 10 11 12 12 12 13 12 10 12 16 16 13 11 12 13 12 17

11 12 10 10 12 13 12 10 10 10 18 17 17 12 11 18 12 18 16 13

12 13 10 13 12 13 12 12 13 10 15 18 15 15 15 11 18 13 16 17

13 11 11 10 11 12 12 12 13 13 15 10 15 16 11 15 14 14 15 16

11 11 11 12 10 13 13 12 10 13 15 15 16 18 16 10 15 10 18 11

11 12 11 10 11 13 11 10 11 12 17 14 10 14 12 10 10 16 16 14

10 13 13 10 11 11 13 12 12 10 16 18 11 15 14 11 11 14 11 17

12 10 12 11 11 11 10 13 12 13 13 12 13 12 12 11 10 13 10 12

Nivel 06-NE:

Profundidad 5 Profundidad 6 Profundidad 7 Profundidad 8

Límites Límites Límites Límites

a= 10 b= 20 a= 10 b= 20 a= 10 b= 24 a= 10 b= 24

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

12 15 15 13 18 12 19 12 11 15 12 20 13 17 14 21 18 12 18 13

12 10 15 14 19 16 12 16 19 12 15 23 14 15 19 22 23 23 18 13

11 11 17 14 13 18 14 19 18 15 18 21 15 15 12 13 22 11 16 23

10 17 18 12 17 20 17 17 15 20 10 10 11 24 24 14 22 10 16 19

18 16 12 15 11 14 14 20 15 20 18 14 10 16 21 21 19 14 20 17

10 13 11 12 19 18 20 17 10 17 11 12 16 22 12 15 11 10 15 13

20 11 20 10 10 18 12 18 19 20 22 19 17 14 10 14 24 24 23 15

11 10 15 15 20 16 15 17 19 19 23 11 19 18 13 17 21 14 11 11

10 19 14 16 14 15 16 12 12 14 10 10 22 14 15 14 16 10 18 17

Page 41: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

41

18 10 17 16 16 20 15 15 12 16 21 24 13 14 24 22 22 22 19 12

12 14 10 15 18 10 11 16 15 10 12 22 16 10 22 17 17 19 20 20

10 13 17 11 17 15 17 16 12 15 15 18 11 13 13 17 12 19 19 17

15 14 15 18 10 19 15 18 13 12 11 21 23 20 16 17 12 13 19 17

19 10 14 17 13 13 16 11 18 15 22 20 12 15 24 24 20 18 13 16

16 14 12 12 17 11 18 18 10 15 14 10 15 18 10 19 11 21 13 24

17 11 15 14 12 20 20 12 15 11 23 12 17 20 13 16 22 18 19 14

17 19 15 14 10 12 12 15 12 11 12 20 14 21 18 14 18 12 24 12

11 10 18 20 16 15 11 10 20 10 19 23 13 18 24 21 18 13 19 22

15 15 18 20 13 15 12 13 20 14 20 18 15 13 24 23 17 14 13 20

14 12 10 18 10 16 13 14 17 11 22 18 14 23 19 19 11 18 17 24

13 12 13 12 17 11 17 13 17 12 13 18 14 18 15 10 20 15 24 13

16 20 17 19 19 14 16 17 16 13 16 21 22 16 15 20 24 23 10 14

11 12 14 13 15 10 11 10 15 13 19 23 17 17 13 20 24 10 10 13

13 15 16 13 13 17 14 20 13 12 20 17 15 12 10 23 22 23 14 21

20 16 20 11 16 17 15 14 15 20 14 14 18 12 21 15 14 23 18 15

12 12 17 20 20 12 11 13 20 18 19 13 14 18 20 23 24 24 21 10

14 17 18 11 14 20 13 14 15 14 13 14 19 19 23 11 19 11 15 23

13 12 18 19 14 14 20 13 15 20 18 16 11 14 10 13 10 23 12 14

15 12 18 20 12 13 16 14 20 15 20 14 15 14 23 17 23 22 19 10

14 11 11 13 12 18 14 17 16 15 24 12 15 12 24 21 11 10 20 16

12 14 14 17 17 19 17 14 17 11 22 19 13 21 21 11 15 22 24 17

17 18 17 15 19 20 12 12 14 15 15 13 21 18 23 14 20 15 11 17

19 15 15 15 19 19 12 14 10 16 24 21 13 11 21 23 16 10 18 10

20 20 10 16 15 13 18 15 10 19 22 21 15 11 22 16 12 15 22 11

19 10 15 17 13 18 11 18 12 15 21 12 18 14 18 19 18 20 13 20

19 17 11 17 17 10 12 13 11 20 20 18 16 24 12 21 20 12 13 23

14 16 20 13 20 16 17 16 13 17 15 14 19 23 14 23 13 24 17 24

10 11 19 14 12 15 12 15 12 12 16 18 16 22 17 23 15 10 22 17

20 14 19 13 19 19 11 12 12 17 15 15 13 24 21 22 15 10 16 11

13 18 15 11 10 18 18 20 16 16 14 10 13 10 21 13 24 14 13 16

Problema Nº 33: En un centro de computación, el número de veces que el sistema se detiene, por saturación de éste, diariamente, fue recolectado para un período de 70 días. Los datos obtenidos fueron los siguientes:

0 0 2 0 0 0 3 3 0 0 1 0 0 0 1 8 5 0 0 4 3 0 6 2 0 2 3 0 0 3 1 1 0 1 0 1 1 0 2 2 1 0 2 2 0 0 0 1 2 1 2 0 0 5 2 1 0 1 6 4 3 3 1 2 4 0 2 0 0 4

a. Construya la distribución de frecuencia del nº de paradas por día. Construya los gráficos apropiados.

b. Calcule todas las medidas de tendencia central y compare. Comente.

c. Calcule medidas de variabilidad y forma. Comente.

d. ¿Cuál es la proporción de días en que ocurren más de 3 paradas?. Comente sus resultados.

Page 42: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

42

Problema Nº 34: Los siguientes datos corresponden a salarios de algunos empleados en una industria (en miles de soles (MS/.)).

13,0 12,5 15,7 13,8 17,0 13,7 16,0 16,9 12,9 12,8 11,2 15,4 14,8 13,6 17,3 15,253 13,6 17,5 15,8 15,3 14,5 12,7 11,9 14,3 16,018 11,9 10,125 12,0 14,8 11,8 16,3 14,1 15,1 14,111 13,7 11,9 14,3 16,018 11,9 10,125 12,0 14,8 16,9 12,9 12,827 11,2 15,4 14,8 13,6 17,3 15,2 13,6 17,5

a. Realice e interprete el diagrama de Boxplot. ¿Qué muestra el diagrama de tallo y hoja?

b. Calcule medidas de tendencia central y dispersión. Interprete.

c. ¿Qué porcentaje de empleados aproximadamente reciben un salario circunscrito entre 12.9 MS/. Y 16.8 MS/.?.

d. ¿Cuántos empleados aproximadamente tienen sueldo superior a 14.8 MS/.?.

Problema Nº 35: Un estudio que se realizó en el Hospital de Valparaíso, se encuestó cual es el motivo de visita al hospital en el año de 2006. Para el motivo de investigación sólo se preguntó por motivo de fallecimiento (F), por motivo de natalidad (N) y enfermedad grave (E). Los datos fueron:

F N E F N E N E F F N N E E F N E F N F E F F E E N N F N E N N F N E N N F N E F N N E E F N E F N F E N E F N F E F F E E N N F N E N E F F N N E E F N E F N F E F F E E N N F N E N N F N E N N F N

a. Represente gráficamente los datos Obtenidos.

b. Determine las medidas de tendencia central. Interprete.

c. Determine las medidas de dispersión.

Problema Nº 36: En la oficina de un diario, el tiempo que se tardan en imprimir la primera plana fue registrado durante 50 días. A continuación se transcriben los datos, aproximados a décimas de minuto:

20,8 22,8 21,9 22,0 20,7 20,9 25,0 22,2 22,8 20,1 25,3 20,7 22,5 21,2 23,8 23.3 20,9 22,9 23,5 19,5 23,7 20,3 23,6 19,0 25,1 25,0 19,5 24,1 24,2 21,8 21,3 21,5 23,1 19,9 24,2 24,1 19,8 23,9 22,8 23,9 19,7 24,2 23,8 20,7 23,8 24,3 21,1 20,9 21,6 22,7

a. Construya con los datos una tabla de distribución de frecuencia, usando intervalos de en minutos.

b. Calcule sus estadígrafos. c. Construya un histograma, un polígono de frecuencias, una ojiva. d. Por medio de la ojiva estime que porcentaje de las veces la primera plana del

periódico puede imprimirse en menos de 24 minutos.

Problema Nº 37: Mr. Bissey, es el vicepresidente del Bank One de Indianápolis, lleva también un registro de las cuentas de ahorro personal. Los saldos de las 80 nuevas cuentas que se abrieron el último mes fueron:

179,80 890,00 712,10 415,00 112,17 1200,00 293,00 602,02 1150,00 1482,00 579,00 312,52 100,00 695,15 287,00 1175,00 1009,10 952,51 1112,52 783,00 1212,43 510,52 1394,05 1390,00 470,53 783,00 1101,00 666,66 780,00 793,10 501,01 1555,10 352,00 937,01 711,11 1422,03 1595,10 217,00 1202,00 1273,01 1150,00 1482,00 579,00 312,52 100,00 695,15 287,00 1175,00 470,53 783,00 1101,00 666,66 780,00 793,10 501,01 1555,10 179,80 890,00

Page 43: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

43

712,10 415,00 112,17 1200,00 293,00 602,02 352,00 937,01 711,11 1422,03 1595,10 217,00 1202,00 1273,01 1009,10 952,51 1112,52 783,00 1212,43 510,52 1394,05 1390,00

Construir una tabla de distribución de frecuencias, sus gráficos, es estadígrafos, su simetría.

Problema Nº 38: Suponga que usted es el estadístico oficial de líneas aéreas KLM y que el presidente del consejo de administración le ha pedido que recoja y organice datos relativos a las operaciones de vuelo. Su interés principal a partir de los valores diarios se centra en la variable de número de pasajeros. Ha obtenido estos datos de los diarios de vuelo de los últimos 60 días y ha reflejado esta información:

68 72 50 70 65 83 77 78 80 93 71 74 60 84 72 84 73 81 84 92 77 57 70 59 85 74 78 79 91 102

83 67 66 75 79 82 93 90 101 80 79 69 76 94 71 97 95 83 86 69 71 74 60 84 72 67 66 75 79 82

a. Construir la tabla de distribución de frecuencias.

b. Construir sus gráficos.

c. Calcular el promedio, la mediana y la moda, el C.V..

d. ¿Cómo es su simetría?

Problema Nº 39: A continuación se indican las pérdidas y ganancias, en millones de dólares, de las 50 mayores empresas (por ventas) de la lista de 500 de Fortune en 1992. El valor más bajo es una pérdida de 4453 millones de dólares y el más alto una ganancia de 5600 millones. Construir una tabla de frecuencias, si los datos son los siguientes:

-4453.00 -1484.00 -732.00 2056.00 2636.00 454.00 184.00 -387.00 17.00 5600.00 20.00 -617.00 97.00 120.00 -404.00 535.00 423.00 63.00 -2258.00 -1021.00 1154.00 939.00 311.00 3006.00 -142.00 1461.00 -2827.00 1080.00 -1086.00 460.00 258.00 842.00 1403.00 308.00 1294.00 454.00 601.00 73.00 1293.00 709.00 -273.00 97.00 -795.00 -578.00 1681.00 505.00 1567.00 1773.00 368.00 755.00; también calcule:

a. El promedio, la mediana y la moda, el C.V..

b. Construir sus respectivos gráficos.

c. ¿Cómo es su simetría?

Problema Nº 40: Usted, en su calidad de consultor económico privado, considera necesario leer detenidamente The Wall Street Journal para estar al corriente en su campo profesional. En un reciente informe del WSJ se facilitaban los siguientes datos como porcentajes de ejecutivos en 42 de las mayores empresas de Estados Unidos que tenían problemas de abuso de medicamentos:

5,9 8,8 14,3 8,3 9,1 5,1 15,3 17,5 17,3 15,0 9,3 9,9 7,0 16,7 10,3 11,5 17,0 8,5 7,2 13,7 16,3 12,7 8,7 6,5 6,8 13,4 5,5 15,2 8,4 9,8 7,3 10,0 11,0 13,2 16,3 9,1 12,3 8,5 16,0 10,2 11,7 14,2

a. Construir la distribución de frecuencias.

b. Construir el gráfico correspondiente.

c. Calcular sus estadígrafos.

d. Construir su simetría correspondiente.

Page 44: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

44

Problema Nº 41: Según Nielsen Media Research, los cinco programas de TV más vistos a las 8 : 00 PM del 14 de Diciembre de 1997 fueron Congo, The X-Files, Holiday in Your Herat, Ellen Foster y por último Unhappily Ever After. La lista siguiente es una encuesta entre 56 espectadores:

Unhappily Ellen Ellen X-Files Holiday Congo Congo Ellen

Ellen X-Files X-Files Holiday X-Files X-Files Holiday Ellen

Congo Congo X-Files X-Files Holiday Unhappily Holiday Congo

X-Files Holiday Holiday X-Files Congo Ellen Ellen Ellen

X-Files Congo Ellen Ellen Holiday X-Files Ellen Holiday

Ellen Ellen Ellen Ellen Congo Holiday Holiday X-Files

Ellen X-Files Holiday X-Files Congo X-Files Holiday X-Files

a. ¿Los datos son cualitativos o cuantitativos?.

b. Determine la tabla de distribución de frecuencias.

c. Trace una gráfica de barras y un diagrama de pastel para estos datos.

d. De acuerdo con la muestra: ¿Qué programa tiene la mayor parte del mercado?, ¿Cuál lo sigue?.

e. ¿Qué porcentaje tiene el programa Congo?.

f. Cuáles son sus estadígrafos.

Problema Nº 42: En Beverage Digest se informa que, con base en las ventas de 1998, las 5 marcas de refrescos que más se vendieron fueron Coke Classic, Diet Coke, Dr.Pepper, Pepsi Cola y Sprite. La lista siguiente proviene de una muestra de 50 compras de esas marcas fue:

Coke Classic Dr.Pepper Sprite Coke Classic Pepsi Cola Diet Coke Diet Coke Coke Classic Diet Coke Coke Classic Pepsi Cola Pepsi Cola Diet Coke Coke Classic Coke Classic Diet Coke Pepsi Cola Coke Classic Diet Coke Coke Classic Coke Classic Coke Classic Coke Classic Coke Classic Pepsi Cola Coke Classic Dr.Pepper Sprite Sprite Coke Classic Sprite Pepsi Cola Pepsi Cola Pepsi Cola Coke Classic Dr.Pepper Coke Classic Dr.Pepper Pepsi Cola Dr.Pepper Pepsi Cola Coke Classic Coke Classic Pepsi Cola Pepsi Cola Diet Coke Coke Classic Diet Coke Pepsi Cola Sprite

a) Construir la tabla de distribución de frecuencias.

b) Construir una gráfica de barras y un diagrama de pastel.

c) ¿Qué porcentaje de las ventas tienen Pepsi Cola y Coke Classic?.

d. Cuáles son sus estadígrafos.

Problema Nº 43: El Union Bank de Suiza realizó una encuesta internacional para obtener datos acerca de los sueldos por hora de los trabajadores y empleados en todo el mundo. Los trabajadores en los Ángeles ocuparon el séptimo lugar en el mundo, en términos de mayores salarios por hora. Suponga que los siguientes 75 valores son de sueldos por hora de trabajadores en los Ángeles:

11,50 9,20 15,35 8,00 9,80 11,90 11,75 12,05 14,70 7,05 9,6 17,1 20,2 17,8 14,7 10,2 15,3 19,7 12,7 8,2 15,7 18,5 9,0 11,6 17,2 11,1 14,8 21,3 13,0 16,5 14,1 14,9 20,6 17,5 12,3 12,8 14,4 16,8 10,9 16,7 13,10 6,85 10,25 5,85 13,10 8,40 9,15 11,10 13,65 9,05 9,90 10,05

Page 45: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

45

8,45 13,15 6,65 9,5 16,3 15,0 15,4 13,0 14,3 18,7 16,6 13,9 14,9 10,8 11,9 18,3 15,1 11,4 13,5 19,1 13,7 12,9 15,8

a. Elabore una tabla de distribución de frecuencias.

b. Trace sus gráficos correspondientes de la frecuencia.

c. Cuáles son sus estadígrafos.

d. Construir su simetría correspondiente.

Problema Nº 44: Suponga que se administra un test de aptitud a todos los aspirantes a puestos oficiales de una región. Se elige al azar una muestra de 50 aspirantes y estos son los resultados:

77 44 49 33 38 33 76 55 68 39 29 41 45 32 83 58 73 47 40 26 34 47 66 53 55 58 49 45 61 41 54 50 51 66 80 73 57 61 56 50 38 45 51 44 41 68 45 93 43 12

a. Construya una tabla de distribución de frecuencias.

b. Construya el histograma, el polígono de frecuencias y la ojiva.

c. Cuáles son sus estadígrafos.

d. Construir su simetría correspondiente.

Problema Nº 45: Los datos que se muestran a continuación, son los cargos (en dólares) por los servicios de electricidad, agua y gas durante el mes de julio del 2000 para una muestra de 50 apartamentos de 3 habitaciones en Caracas:

96 171 202 178 147 102 153 197 127 82 157 185 90 116 172 111 148 213 130 165 141 149 206 175 123 128 144 168 109 167 95 163 150 154 130 143 187 166 139 149 108 119 183 151 114 135 191 137 129 158 Elaborar:

a. Una tabla de distribución de frecuencias.

b. Construya el histograma, el polígono de frecuencias y la ojiva.

c. Un histograma porcentual.

Determinar:

a. El porcentaje de apartamentos cuyo gasto no llega a 139 dólares.

b. El porcentaje de apartamentos cuyo gasto es mayor o igual a 158 dólares.

c. El porcentaje de apartamentos cuyo gasto es al menos de 120 dólares, pero menor de 196 dólares.

d. El porcentaje de apartamentos con gastos menores de 135 dólares.

e. El porcentaje de apartamentos con gastos de 186 dólares o más.

f. El porcentaje de apartamentos con gastos entre 140 y 184 dólares.

g. Cuáles son sus estadígrafos.

h. Construir su simetría correspondiente.

Page 46: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

46

Problema Nº 46: Unos transductores de temperatura de cierto tipo se embarcan en lotes de 50. Se seleccionó una muestra de 60 lotes y se determinó la cantidad de transductores en cada lote que no se apegaban a las especificaciones de diseño; y resultaron los siguientes datos:

2 1 2 4 0 1 3 2 0 5 3 3 1 3 2 4 7 0 2 3 0 4 2 1 3 1 1 3 4 1 2 3 2 2 8 4 5 1 3 1 5 0 2 3 2 1 0 6 4 2 1 6 0 3 3 3 6 1 2 3

a) Calcular la media, mediana, moda y el C.V..

b) Trazar un boxplot indicando sus cinco componentes (Min, Max, Q1, Q2 y Q3).

c) Se puede decir que la distribución es simétrica?, Justificar tu respuesta.

d) Construya el histograma, el polígono de frecuencias y la ojiva.

Problema Nº 47: Se ha realizado un estudio de los niveles de trabajo efectivo por mes (en horas) en una empresa minera, cuyos resultados son:

168 168 148 148 148 150 150 170 172 112 142 144 145 172 176 179 118 119 120 164 164 165 166 120 120 125 126 127 134 135 138 138 138 154 154 155 156 156 138 141 105 110 112 146 163 150 151 151 149 153 153 154 154 158 160 128 130 132 133 160 160

Problema Nº 48: Muchas de las personas que invierten en bolsa lo hacen para conseguir beneficios rápidos, por ello el tiempo en que mantienen las acciones es relativamente breve. Preguntada una muestra de 70 inversores habituales sobre el tiempo en meses que han mantenido sus últimas inversiones se recogieron los siguientes datos

10.5 11.2 9.9 15.0 11.4 12.7 16.5 10.1 12.7 11.4

11.6 6.2 7.9 8.3 10.9 8.1 3.8 10.5 11.7 8.4

12.5 11.2 9.1 10.4 9.1 13.4 12.3 5.9 11.4 8.8

7.4 8.6 13.6 14.7 11.5 11.5 10.9 9.8 12.9 9.9

11.5 9.2 15.4 8.0 9.8 11.9 11.8 12.1 14.7 7.1

9.6 14.7 10.2 15.2 12.7 8.2 15.7 9.0 11.6 11.1

14.8 13.0 14.1 14.9 12.3 13.5 11.2 12.0 11.8 12.2

Construye una tabla de frecuencias que recoja adecuadamente esta información, y haz también alguna representación gráfica, calcule sus estadígrafos y finalmente evalúe su simetría.

Problema Nº 49: Investigados los precios por habitación de 50 hoteles de una ciudad se han obtenido los siguientes resultados:

700 300 500 400 500 700 400 750 800 500

500 750 300 700 1000 1500 500 750 1200 800

400 500 300 500 1000 300 400 500 700 500

300 400 700 400 700 500 400 700 1000 750

700 800 750 700 750 800 700 700 1200 800

Determínese:

a) La distribución de frecuencias de los precios.

b) Porcentaje de hoteles con un precio superior a 750.

c) Cuántos hoteles tienen un precio mayor o igual que 500 pero menor o igual a 1000.

Page 47: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

47

d) Representar gráficamente dichas distribuciones.

e) Calcular la media, mediana, moda y el C.V..

f) Evalúe su simetría.

Problema Nº 50: El gobierno desea saber si el número medio de hijos por familia ha descendido respecto a la década anterior. Para ello ha encuestado a 50 familias respecto al número de hijos y ha obtenido los siguientes datos:

2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4

3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1

a) Construye la tabla de frecuencias a partir de estos datos.

b) ¿Cuántas familias tienen exactamente tres hijos?

c) ¿Qué porcentaje de familias tienen exactamente 3 hijos?

d) ¿Qué porcentaje de las familias de la muestra tienen más de dos hijos? ¿Y menos de 3?

e) Construye el grafico que consideres más adecuado con las frecuencias no acumuladas.

f) Construye el gráfico que consideres más adecuado con las frecuencias acumuladas.

g) Calcule sus medidas de centralización y de dispersión.

Problema Nº 51: En un hospital se desea hacer un estudio sobre los pesos de los recién nacidos. Para ello, se recogen los datos de 70 bebes y se tiene:

3.2 3.7 4.2 4.6 3.7 3.0 2.9 3.1 3.0 4.5

4.1 3.8 3.9 3.6 3.2 3.5 3.0 2.5 2.7 2.8

3.0 4.0 4.5 3.5 3.5 3.6 2.9 3.2 4.2 4.3

4.1 4.6 4.2 4.5 4.3 3.2 3.7 2.9 3.1 3.5

2.7 2.8 29 4.6 4.5 3.9 3.0 3.5 4.1 4.3

3.9 3.7 4.1 2.7 3.7 4.4 3.6 2.9 4.3 2.8

4.0 3.1 3.9 2.4 4.2 2.8 3.4 2.9 3.3 3.9

Se pide:

a) Construir la tabla de frecuencias.

b) Si sabemos que los bebes que pesan menos de 3 kilos nacen prematuramente ¿Qué porcentaje de niños prematuros han nacido entre estos 70?

c) Normalmente los niños que pesan más de 3 kilos y medio no necesitan estar en la incubadora ¿Puedes decirme que porcentaje de niños están en esta situación?

d) Representa gráficamente la información recogida.

e) Calcule sus medidas de centralización y de dispersión.

Problema Nº 52: Los 100 alumnos que se presentaron al último examen de Estadística, obtuvieron las siguientes calificaciones (base decimal):

7 3 2 4 5 1 8 6 1 5 4 3 3 2 2 5 7 7 6 5

3 8 9 4 8 1 0 2 4 1 6 1 0 5 7 8 5 2 3 10

2 5 6 5 4 7 1 3 0 5 9 4 4 1 7 2 6 3 4 5

2 6 7 6 5 10 2 4 7 4 4 7 6 3 5 0 2 8 2 7

Page 48: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

48

0 2 1 5 6 4 3 5 2 3 8 0 3 1 1 4 6 5 5 6

Se pide:

a) Obtener la distribución de frecuencias de las calificaciones.

b) ¿Qué porcentaje de alumnos sacaron un 5 y Cuantos alumnos sacaron notas superiores a 6?

c) ¿Qué porcentaje aprobó sabiendo que la nota mínima aprobatoria es 6?

d) ¿Cuál fue la nota media del examen? ¿Y la nota más frecuente?

e) Representar gráficamente las frecuencias no acumuladas y las frecuencias acumuladas.

f) Si hubiéramos querido aprobar sólo al 20% de la gente que se presentó, ¿A partir de qué nota hubiéramos puesto el aprobado?

g) Calcule sus medidas de centralización y de dispersión.

Problema Nº 53: Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de sus habitaciones, el gerente investiga los precios por habitación de 40 hoteles de la misma categoría de esta ciudad. Los datos obtenidos (en miles de pesetas) fueron:

3.9 4.7 3.7 5.6 4.3 4.9 5.0 6.1 5.1 4.5

5.3 3.9 4.3 5.0 6.0 4.7 5.1 4.2 4.4 5.8

3.3 4.3 4.1 5.8 4.4 3.8 6.1 4.3 5.3 4.5

4.0 5.4 3.9 4.7 3.3 4.5 4.7 4.2 4.5 4.8

Preparar una tabla de frecuencias agrupando en intervalos de igual amplitud. Construir todos los gráficos necesarios para el caso. Estudia la media, mediana, moda y el C.V.. ¿Cómo es su simetría?

Problema Nº 54: En una planta embotelladora se registraron 54 accidentes y de acuerdo con la parte del cuerpo lesionada, dedos (D), ojos (O), brazo (B), y piernas (P); se registraron en los siguientes datos. Se pide organizar los datos con sus respectivos análisis.

B P B O D D D D D B O P D P D D P B P B P D D P D B B D O B O B B O B D D P D O D P D D D P D O D D B P B B

Problema Nº 55: Para evaluar la viabilidad de un proyecto de reforestación de una zona sometida a estrés turístico, para el que se ha solicitado una subvención pública, se analizó la composición en mg/cm3 de desechos orgánicos del territorio. Los datos obtenidos fueron:

11.9 15.1 18.6 20.7 25.8 11.1 15.1 18.4 20.4 23.2 10.8 14.4 18.2 20.3 22.5 10.8 14.3 16.9 20.3 22.2 9.4 14.0 15.9 20.3 21.4 9.2 12.9 15.8 19.7 21.0 18.2 12.9 15.3 18.8 20.8 10.5 11.2 9.9 15.0 11.4 12.7 16.5 10.1 12.7 11.4 11.6 16.2 17.9 18.3 10.9 18.1 13.8 10.5 11.7 18.4 12.5 11.2 19.1 10.4 19.1 13.4 12.3 15.9 11.4 18.8

a). Construir la tabla de frecuencias y representar la información gráficamente.

b). A partir de la tabla de frecuencias interprete: las medidas de centralización y dispersión.

Page 49: Geoestadistica I 2dra. Parte. Ok. 10

ACE- FIEEMM - UNSAAC - 2013 GEOESTADÍSTICA I APLICADA A LA INGENIERIA

Estadística Descriptiva

49

c). Entre qué niveles de composición se encuentra aproximadamente el 51,4% de las observaciones con menores niveles registrados?.

Problema Nº 56:

1.- Las calificaciones finales (base decimal) en un curso de matemáticas de 80 estudiantes son presentadas en la siguiente tabla:

8.3 6.6 7.5 7.9 8.2 7.8 8.5 7.9 7.9 8.5

7.2 6.6 8.8 6.6 8.3 7.7 7.9 7.8 8.4 9.3

6.6 7.6 7.5 8.6 7.9 7.4 7.9 7.8 7.9 9.0

7.4 7.5 7.0 7.1 7.7 7.3 8.5 8.2 6.6 7.5

6.7 7.7 6.7 6.6 8.4 6.8 7.9 8.0 7.8 9.0

8.7 8.7 8.2 6.7 8.3 7.3 7.9 6.7 8.5 9.1

9.0 9.3 8.4 6.6 7.2 6.6 7.2 7.5 7.9 9.8

10 8.7 7.2 9.6 7.4 8.5 7.9 7.8 8.5 8.5

Construye una tabla de frecuencias que recoja adecuadamente esta información, y haz también alguna representación gráfica, calcule sus estadígrafos y finalmente evalúe su simetría.

------ <ACE> ------